21
BAB III METODOLOGI PENELITIAN
BAB III METO DO LOG I PENELITIAN
Berdasarkan pada landasan teori yang telah disampaikan pada bab kedua. Pada bab ini akan dibahas mengenai metodologi yang digunakan dalam penelitian
ini. Bab ketiga ini akan dipaparkan tentang sumber data yang diperoleh dan teknik analisis data.
3.1. Sumber data
Data yang digunakan adalah data penjualan tahun 2014 pada perusahaan XYZ. Data yang digunakan merupakan hasil eksport dari database perusahaan
berjenis file csv. Total data transaksi penjualan bejumlah 933 record.
3.2. Teknik Analisis Data
Data yang telah diperoleh selanjutnya mulai dianalisis. Berkaitan dengan tahap-tahap teknik analisis dan jalannya program digambarkan dengan block
diagram sebagai berikut
Data Preprocessing
Perhitungan Jarak
Divisive Output
Jtree Akurasi
Gam bar 3
Gambar 3.1. Block diagram proses program 1.
Data Data yang digunakan dalam penelitian ini adalah data yang diperoleh dari
perusahaan XYZ. Data ini merupakan data transaksi penjualan produk helm. Data penjualan ini bersifat penting karena mengandung informasi penjualan secara
22 detail. Data yag digunakan adalah data penjualan tahun 2014 selama kurun waktu
satu tahun. 2.
Preprocessing Data yang sudah didapat selanjutnya diolah dengan tahap preprocessing.
Pada tahap ini akan dilakukan data cleaning, data integration, data selection, dan data transformation.
3. Perhitungan Jarak
Setalah melalui tahap preprocessing, tahap selanjutnya adalah mengukur jarak setiap data. Perhitungan jarak menggunakan euclidean distance, seperti
yang telah dipaparkan pada bab kedua dalam penelitina ini. Dengan menggunakan perhitungan euclidean distance akan didapatkan jarak antar obyek data dalam
sebuah matriks. Matriks tersebut nantinya akan digunakan untuk tahap selanjutnya, yaitu clustering menggunakan metode divisive. Tabel 3.1 adalah
contoh data yang akan digunakan untuk perhitungan euclidean distance:
Tabel 1
Tabel 3.1. Data contoh perhitungan jarak Data
x y
a 87.0
89.0 b
84.0 76.0
c 83.0
70.0 d
80.0 74.0
e 82.0
83.0 f
81.0 92.0
23 Dengan menggunakan rumus perhitungan euclidean distance, didapatkan
matriks jarak seperti pada Tabel 3.2:
Tabel 2
Tabel 3.2. Hasil euclidean distance a
b c
d e
f a
0.0 13.342
19.417 16.553
7.811 6.709
b 13.342
0.0 6.083
4.473 7.281
16.279 c
19.417 6.083
0.0 5.0
13.039 22.091
d 16.553
4.473 5.0
0.0 9.22
18.028 e
7.811 7.281
13.039 9.22
0.0 9.056
f 6.709
16.279 22.091
18.028 9.056
0.0 4.
Divisive Dalam tahap ini hasil dari matriks jarak akan digunakan untuk
pembentukan cluster. Masing-masing obyek data akan dikelompokan berdsarkan jarak kemiripannya. Proses pengelompokan menggunakan perhitungan divisive.
Langkah-langkah perhitungannya seperti yang dapat dilihat dalam bab kedua dalam penelitian ini. Berikut ini penerapan algoritma divisive:
Tahap 1
Langkah pertama: Dari matriks jarak pada Tabel 3.2 asumsikan setiap data dianggap sebagai klaster.
Langkah kedua : Hitung nilai rata-rata setiap objek dengan objek lainnya. Rata-rata objek a = 10.63866667
Rata-rata objek b = 7.909666667 Rata-rata objek c = 10.93833333
Rata-rata objek d = 8.879 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24 Rata-rata objek e = 7.7345
Rata-rata objek f = 12.02716667 Langkah ketiga: Tentukan objek yang memiliki nilai rata-rata yang terbesar,
objek yang memiliki nilai rata-rata yang terbesar akan terpisah dan berubah menjadi splinter group. Diperoleh objek f memiliki rata-rata terbesar, maka
objek f keluar dan menjadi splinter group.
Tahap 2
Diperoleh matrik jarak yang baru, seperti pada Tabel 3.3:
Tabel 3
Tabel 3.3. Matrik jarak tahap 1 a
b c
d e
a 0.0
13.342 19.417
16.553 7.811
b 13.342
0.0 6.083
4.473 7.281
c 19.417
6.083 0.0
5.0 13.039
d 16.553
4.473 5.0
0.0 9.22
e 7.811
7.281 13.039
9.22 0.0
Ulangi langkah kedua : Dari matriks jarak yang baru, kemudian pilih rata-rata antar antar objek dengan objek lainnya.
Rata-rata objek a = 11.4246 Rata-rata objek b = 6.2358
Rata-rata objek c = 8.7078 Rata-rata objek d = 7.0492
Rata-rata objek e = 7.4702 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25 Kemudian selisihkan setiap nilai rata-rata tersebut dengan elemen matrik
splinter group. Rata-rata objek a = 11.4246 - 6.709 = 4.7156
Rata-rata objek b = 6.2358 - 16.279 = -10.0432 Rata-rata objek c = 8.7078 - 22.091 = -13.3832
Rata-rata objek d = 7.0492 - 18.028 = -10.9788 Rata-rata objek e = 7.4702 - 9.056 = -1.5858
Langkah ketiga : tentukan objek yang memiliki nilai selisih terbesar, objek yang memiliki nilai selisih terbesar akan terpisah dan bergabung dengan
splinter group. Objek a memiliki nilai selisih terbesar, maka objek a bergabung dengan objek f ke dalam splinter group.
Tahap 3
Diperoleh matrik jarak yang baru, , seperti pada Tabel 3.4:
4
Tabel 3.4. Matrik jarak tahap 3 b
c d
e b
0.0 6.083
4.473 7.281
c 6.083
0.0 5.0
13.039 d
4.473 5.0
0.0 9.22
e 7.281
13.039 9.22
0.0 Ulangi langkah kedua : Dari matriks jarak yang baru, kemudian pilih rata-rata
antar antar objek dengan objek lainnya. Rata-rata objek b = 4.45925
Rata-rata objek c = 6.0305 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26 Rata-rata objek d = 4.67325
Rata-rata objek e = 7.385
Kemudian selisihkan setiap nilai rata-rata tersebut dengan elemen matrik splinter group.
Rata-rata objek b = 4.45925 - 14.8105 = -10.35125 Rata-rata objek c = 6.0305 - 20.754 = -14.7235
Rata-rata objek d = 4.67325 - 17.2905 =-12.61725 Rata-rata objek e = 7.385 - 8.4335 = -1.0485
Karena semua nilai selisih bernilai negatif, maka algoritma kembali ke awal. Rata-rata objek terbesar pada matriks tersebut dimiliki oleh objek e,
maka objek e keluar dan membentuk klaster baru.
Tahap 4
Diperoleh matrik jarak yang baru, , seperti pada Tabel 3.5:
5
Tabel 3.5. Matrik jarak tahap 4 b
c d
b 0.0
6.083 4.473
c 6.083
0.0 5.0
d 4.473
5.0 0.0
Ulangi langkah kedua : Dari matriks jarak yang baru, kemudian pilih rata-rata antar antar objek dengan objek lainnya.
Rata-rata objek b = 3.518666667 Rata-rata objek c = 3.694333333
27 Rata-rata objek d = 3.157666667
Kemudian selisihkan setiap nilai rata-rata tersebut dengan elemen matrik splinter group.
Rata-rata objek b = 3.518666667 - 7.281 = -3.762333333 Rata-rata objek c = 3.694333333 - 13.039 = -9.344666667
Rata-rata objek d = 3.157666667 - 9.22 = -6.062333333
Karena semua nilai selisih bernilai negatif, maka algoritma berhenti sampai disini. Maka objek b, c,dan d keluar dan membentuk klaster baru.
Dengan mengimplementasikan algoritma divisive menggunakan java, data sampel yang digunakan pada Tabel 3.1 menghasilhan skruktur tree cluster seperti
pada Gambar 3.2:
Gam bar 4
Gambar 3.2. Jtree pembentukan Cluster PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28 5.
Cluster
Proses Divisive menghasilkan jumlah cluster maksimum sesuai dengan proses iterasi pada algoritma divisive. Hasil pembentukan cluster ditampilkan pula
kedalam struktur tree. Dari hasil Jtree tersubut juga dapat ditentukan cluster yang diinginkan seperti pada Tabel 3.6.
Tabel 6
Tabel 3.6. Contoh pembentukan 3 cluster oleh sistem Cluster 1
Cluster 2 Cluster 3
a e
c f
b d
6. Perhitungan Akurasi
Pada penelitian ini akan dilakukan uji akurasi pada setiap pembentukan cluster dan mengevaluasi pola yang ditemukan dari hasil pengelompokan.
Sebelum sistem menyimpan cluster yang sudah terbentuk, masing-masing cluster akan di hitung menggunakan sum of square error SSE. Setelah semua cluster
terbentuk akan ditotal jumlah SSE-nya. Dengan demikian ada sejumlah percobaan pembentukan cluster yang akan dihitung SSE-nya. SSE dengan nilai terendah
mengindikasikan bahwa cluster yang tebentuk adalah yang paling baik. Pada penelitian ini dilakukan 2 sampai 7 percobaan pembentukan cluster sesuai dengan
jumlah obyek data, namun tidak menutup kemungkinan jika percobaan yang dilakukan bisa lebih atau kurang atau lebih dari 7. Hal ini tergantung jumlah
obyek data dan kebutuhan yang ada. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
BAB IV ANALISIS DAN PERANCANGAN SISTEM