Gambar 3.1 Sampel laporan frekuensi data penjualan
Sumber : Database Penjualan Swalayan Omi Ar Rasyid Medan Pada swalayan terdapat banyak sekali nama-nama produk ataupun merk-merk produk
yang tidak bisa disebutkan satu-satu. Mulai dari jenis produk sampai kegunaan produk tersebut. Oleh karena itu penulis akan membuat pengelompokkan produk berdasarkan
kategori produknya. Kategori produk yang dipilih adalah sebagai berikut:. 1. Susu
2. Beras 3. Minyak goreng
Pemilihan kategori tersebut berdasarkan data dari kategori produk produk yang selalu dibeli konsumen setiap bulannya.
3.2. Praproses Data
Dalam mengolah data mining terdapat beberapa tahapan yang harus dilakukan sehingga data dapat digunakan secara maksimal. Tahapan tersebut merupakan bagian
dari Knowledge Discovery in Database KDD, yaitu: 3.2.1. Data Cleaning
Pada tahap ini dilakukan pembersihan data, yaitu menghapus data missing values. Data missing values tersebut merupakan data yang diperlukan untuk proses ini. Pada
penelitian ini pembersihan dilakukan terhadap record yang memiliki jumlah frekuensiinvoice lebih besar dibandingkan jumlah terjual. Sampel data cleaning
seperti pada tabel 3.1 :
Tabel 3.1. Data Cleaning No
Nama Barang Jumlah Terjual
Jumlah Invoice
1 Aqua 1.5 ltr
50 63
2 Bear Brand
30 44
Pada Tabel 3.1, Jumlah barang yang terjual lebih sedikit dibandingkan dengan jumlah invoice, sehingga data tersebut tidak dapat digunakan.
3.2.2. Penentuan Variabel Pada tahap ini akan dilakukan penentuan variabel yang akan menghasilkan analisa
untuk mengolah data. Adapun variabelnyasebagai berikut :
a. Jenis produk yaitu jenis produkyang terjual b. Periode yaitu rentang waktu penjualan produk
c. Jumlah produk yang Terjual yaitu nilai dari jumlah barang yang terjual
adalah komponen terpenting dalam mengolah data penjualan. Dari jumlah barang yang terjual akan diketahui tingkat penjualanan suatu produk.
Penelitian ini menggunakan jumlah barang berdasarkan kategorinya.
d. Jumlah invoice yaitu jumlah nota atau faktur yang mencatat penjualan suatu
produk
3.2.3. Pengelompokan kategori produk Pengelompokan kategori produk adalah mengubah nama produk untuk mempermudah
penelitian, yakni: 1. Kategori produk susu terbagi atas :
a. Bayi 5 tahun berubah menjadi produk A1
b. Balita berubah menjadi produk A2 c. Anak 7-12 tahun berubah menjadi produk A3
d. Manula berubah menjadi produk A4 e. Ibu Hamil berubah menjadi produk A5
2. Kategori produk beras terbagi atas : a. Harga Rp. 10.000 berubah menjadi produk A6
b. Harga Rp. 10.000 berubah menjadi produk A7 3. Kategori produk minyak goreng terbagi atas :
a. Minyak kelapakelapa sawit berubah menjadi produk A8 b. Minyak jagung berubah menjadi produk A9
c. Minyak zaitun berubah menjadi produk A10 Data yang akan digunakan adalah data penjualan dari 8 delapan kategori produk
yang dibeli konsumen selama 3 tahun. Data memiliki 1080 record data penjualan berdasarkan hari seperti tabel 3.2.
Tabel 3.2. Jumlah penjualan perhari No
Periode
Tanggal
Jumlah barang terjual A1
A2 A3
A4 A5
A6 A7
A8 A9
A10
1 01012011
3 2
5 4
1 1
1 1
2 02012011
3 2
3 2
4 3
3 2
3 03012011
4 3
3 3
2 2
5 4
4 04012011
3 2
4 4
4 3
6 5
5 05012011
5 1
7 4
3 2
4 4
6 06012011
2 3
6 5
2 1
5 4
1079 30122013
5 3
6 4
2 2
6 5
1080 31122013
4 3
5 4
4 3
7 6
Data yang digunakan dalam 1 tahun terdiri dari 12 record data yang merupakan data penjualan setiap bulan. Tabel 3.3 merupakan jumlah produk yang terjual selama
tahun 2011.
Tabel 3.3. Jumlah penjualan perbulan Periode
Jumlah barang terjual
Bulan Tahun A1
A2 A3
A4 A5
A6 A7
A8 A9
A10 1
Jan 2011
45 51
32 24
40 10
11 30
10 1
2 Feb
2011 46
55 41
14 48
11 11
35 8
3 Mar
2011 32
48 35
20 47
10 10
38 6
2 4
Apr 2011
28 60
30 9
50 12
10 25
5 1
5 Mei
2011 43
65 32
15 55
8 13
29 6
6 Jun
2011 48
48 28
10 54
9 15
30 6
7 Jul
2011 42
60 30
20 42
11 19
35 7
2 8
Agt 2011
35 75
31 24
45 13
18 43
10 9
Sept 2011
49 48
39 12
48 10
18 45
10 2
10 Okt
2011 44
50 33
14 50
10 14
32 5
11 Nov
2011 37
43 39
19 51
12 14
35 4
12 Des
2011 50
74 42
23 58
13 16
45 8
2
3.3.Pemrosesan Data
Terdapat beberapa tahapan dalam pengolahan data yang harus dilalui agar menghasilkan data yang diinginkan.
3.3.1. Penentuan Paramater Fuzzy C-Means
Untuk melakukan perhitungan dengan metode fuzzy c-means pada penelitian ini ditetapkan nilai parameter awal pada Tabel 3.4 berikut:
Tabel 3.4. Nilai Parameter Awal Parameter
Nilai
Cluster c 3
Pangkat w 2
Maksimum Iterasi MaxIter 100
Kriteria Penghentian 10
-5
Fungsi Objektif AwalP Iterasi Awal t
1
3.3.2. Proses Fuzzy C-Means
Tabel 3.5 merupakan data penjualan produk A1 pada tahun 2011, 2012 dan 2013 yang mewakili keseluruhan produk untuk dilakukan proses clustering.
Tabel 3.5. Data Penjualan Kategori Produk A1 No
Periode Jumlah barang
terjual Bulan
Tahun
1 Januari
2011 45
2 Februari
2011 46
3 Maret
2011 32
4 April
2011 28
5 Mei
2011 43
6 Juni
2011 48
7 Juli
2011 42
8 Agustus
2011 35
9 September
2011 49
10 Oktober
2011 44
11 November
2011 37
12 Desember
2011 50
13 Januari
2012 45
14 Februari
2012 50
15 Maret
2012 47
16 April
2012 58
17 Mei
2012 54
18 Juni
2012 50
19 Juli
2012 55
20 Agustus
2012 48
21 September
2012 50
22 Oktober
2012 55
23 November
2012 48
24 Desember
2012 52
Tabel 3.5. Data Penjualan Kategori Produk A1 lanjutan No
Periode Jumlah barang
terjual Bulan
Tahun
24 Januari
2013 45
26 Februari
2013 46
27 Maret
2013 32
28 April
2013 28
29 Mei
2013 43
30 Juni
2013 48
31 Juli
2013 42
32 Agustus
2013 35
33 September
2013 49
34 Oktober
2013 44
35 November
2013 37
36 Desember
2013 50
Setelah menetapkan nilai parameter awal dan data siap untuk diklaster, akan dilakukan proses clustering pertahun menggunakan langkah langkah dari Algoritma
Fuzzy C-Means FCM.
Langkah 1. Membangkitkan Bilangan Random
Membangkitkan bilangan random ik, i=1,2,...,n ; k=1,2,...c; sebagai elemen elemen matriks partisi awal U.
Berdasarkan Persamaan 2.1, matriks partisi awal u dilakukan secara random
dengan batas 0 hingga 1, random generate yang dihasilkan pada data produk A1 di tahun 2011 sebagai berikut.
Langkah 2. Menentukan Pusat Klaster v
Pada iterasi pertama, untuk menentukan pusat klaster dengan menggunakan persamaan 2.2, sebagai contoh perhitungan sebagai berikut.
Tahap perhitungan untuk mencari nilai pusat klaster ke-1 adalah 1. Nilai derajat keanggotaan klaster ke-1 pada data pertama
-
i1
= 0.21845002136495 -
i1 2
=
i1,1
x
i1,1
= 0.96526143723138x 0.96526143723138 =
0.931729642206 2.
Perhitungan nilai derajat keanggotaan klaster ke-1 dilakukan sampai data terakhir. Kemudian, nilai dari derajat keanggotaan yang telah dikuadratkan
i1 2
dari data pertama hingga data terakhir dikali dengan nilai dari variabel setiap data.
0.96526143723138 0.99596129976973
0.22632857423631 0.23158842863306
0.29812138595146 0.38484755462323
0.36663449996156 0.69947343922317
0.41720469501807
0.63792040354536 0.69136087385343
0.81757056799467
0.5425824414747 0.4643416736178
0.71628860380795 0.96526143723138
0.56457336016279 0.63903445163948
0.56055448102335 0.45954918903236
0.61817283983498 0.073222192137453
0.71840481555564 0.29194892900463
0.34738428300868 0.074715500871326
0.868278451647 0.30625440409682
0.36732353479622 0.28340595149832
0.59623081744602 0.39104127319935
0.52926415995661 0.99212477592368
0.51137230169587 0.5434437006755
U =
-
i1 2
x X
1.1
=
i1 2
x Nilai Jumlah barang terjual pada data pertama =
0.931729642206 x 45 = 41.92783389927
3. Kemudian, perkalian dari derajat keanggotaan yang telah dikuadratkan dengan masing masing nilai variabel dari data pertama hingga data terakhir
dijumlahkan. Hasil penjumlahan dari hasil perkalian tersebut pada variabel jumlah penjualan
produk.
=
i1 2
x X
1.1
+ ...... +
i1 2
x X
1.36
=
41.92783389927 + ...... + 49.21557855008 = 168.9835324312
4. Perhitungan hasil dari pusat klaster V
kj
pada klaster ke-1
168.9835324312 3.913355933957
43.181232489917
Pusat Klaster ke-1 V
kj
= 43.181232489917 Setelah diperoleh nilai pusat klaster ke-1V
kj
, tahap yang sama untuk menghitung nilai pusat klaster ke-2 dan pusat klaster ke-3.
Pusat Klaster ke-2 V
kj
= 39.9037273399 Pusat Klaster ke-3 V
kj
= 41.5870789438
Hasil perhitungan pusat klaster pada iterasi pertama klaster ke-1 pada tabel 3.6, klaster ke-2 pada tabel 3.7 dan klaster ke-3 pada tabel 3.8
Tabel 3.6 Pusat Klaster ke-1 pada Iterasi Pertama
= =
V
kj
=
hasil perkalian jumlah barang terjual Jumlah derajat keanggotaan yang telah dikuadratkan
i1 2
hasil perkalian jumlah barang terjual
No Derajat Keanggotaan
klaster ke-1
i1
X
1.1 i1
2 i1
2
x X
1.1
1 0.96526143723138
45 0.9317296422061
41.92783389927 2
0.23158842863306 46
0.053633200276728 2.4671272127295
3 0.36663449996156
32 0.13442085656207
4.3014674099861 4
0.63792040354536
28 0.40694244125947
11.394388355265 5
0.5425824414747 43
0.29439570579664 12.659015349256
Tabel 3.6 Pusat Klaster ke-1 pada Iterasi Pertama lanjutan No
Derajat Keanggotaan klaster ke-1
i1
X
1.1 i1
2 i1
2
x X
1.1
7 0.56055448102335
42 0.31422132619536
13.197295700205 8
0.073222192137453 35
0.0053614894214 0.18765212974949
9 0.34738428300868
49 0.1206758400814
5.9131161639913 10
0.30625440409682 44
0.093791760028698 4.1268374412627
11 0.59623081744602
37 0.35549118767235
13.153173943877 12
0.99212477592368 50
0.9843115710016 9.21557855008
3.913355933957 168.9835324312
Pusat klaster ke-1 v
kj1
43.181232489917
Tabel 3.7 Pusat Klaster ke-2 pada Iterasi Pertama No
Derajat Keanggotaan klaster ke-2
i2