Sumber data Teknik Analisis Data

21

BAB III METODOLOGI PENELITIAN

BAB III METO DO LOG I PENELITIAN

Berdasarkan pada landasan teori yang telah disampaikan pada bab kedua. Pada bab ini akan dibahas mengenai metodologi yang digunakan dalam penelitian ini. Bab ketiga ini akan dipaparkan tentang sumber data yang diperoleh dan teknik analisis data.

3.1. Sumber data

Data yang digunakan adalah data penjualan tahun 2014 pada perusahaan XYZ. Data yang digunakan merupakan hasil eksport dari database perusahaan berjenis file csv. Total data transaksi penjualan bejumlah 933 record.

3.2. Teknik Analisis Data

Data yang telah diperoleh selanjutnya mulai dianalisis. Berkaitan dengan tahap-tahap teknik analisis dan jalannya program digambarkan dengan block diagram sebagai berikut Data Preprocessing Perhitungan Jarak Divisive Output Jtree Akurasi Gam bar 3 Gambar 3.1. Block diagram proses program 1. Data Data yang digunakan dalam penelitian ini adalah data yang diperoleh dari perusahaan XYZ. Data ini merupakan data transaksi penjualan produk helm. Data penjualan ini bersifat penting karena mengandung informasi penjualan secara 22 detail. Data yag digunakan adalah data penjualan tahun 2014 selama kurun waktu satu tahun. 2. Preprocessing Data yang sudah didapat selanjutnya diolah dengan tahap preprocessing. Pada tahap ini akan dilakukan data cleaning, data integration, data selection, dan data transformation. 3. Perhitungan Jarak Setalah melalui tahap preprocessing, tahap selanjutnya adalah mengukur jarak setiap data. Perhitungan jarak menggunakan euclidean distance, seperti yang telah dipaparkan pada bab kedua dalam penelitina ini. Dengan menggunakan perhitungan euclidean distance akan didapatkan jarak antar obyek data dalam sebuah matriks. Matriks tersebut nantinya akan digunakan untuk tahap selanjutnya, yaitu clustering menggunakan metode divisive. Tabel 3.1 adalah contoh data yang akan digunakan untuk perhitungan euclidean distance: Tabel 1 Tabel 3.1. Data contoh perhitungan jarak Data x y a 87.0 89.0 b 84.0 76.0 c 83.0 70.0 d 80.0 74.0 e 82.0 83.0 f 81.0 92.0 23 Dengan menggunakan rumus perhitungan euclidean distance, didapatkan matriks jarak seperti pada Tabel 3.2: Tabel 2 Tabel 3.2. Hasil euclidean distance a b c d e f a 0.0 13.342 19.417 16.553 7.811 6.709 b 13.342 0.0 6.083 4.473 7.281 16.279 c 19.417 6.083 0.0 5.0 13.039 22.091 d 16.553 4.473 5.0 0.0 9.22 18.028 e 7.811 7.281 13.039 9.22 0.0 9.056 f 6.709 16.279 22.091 18.028 9.056 0.0 4. Divisive Dalam tahap ini hasil dari matriks jarak akan digunakan untuk pembentukan cluster. Masing-masing obyek data akan dikelompokan berdsarkan jarak kemiripannya. Proses pengelompokan menggunakan perhitungan divisive. Langkah-langkah perhitungannya seperti yang dapat dilihat dalam bab kedua dalam penelitian ini. Berikut ini penerapan algoritma divisive: Tahap 1  Langkah pertama: Dari matriks jarak pada Tabel 3.2 asumsikan setiap data dianggap sebagai klaster.  Langkah kedua : Hitung nilai rata-rata setiap objek dengan objek lainnya.  Rata-rata objek a = 10.63866667  Rata-rata objek b = 7.909666667  Rata-rata objek c = 10.93833333  Rata-rata objek d = 8.879 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 24  Rata-rata objek e = 7.7345  Rata-rata objek f = 12.02716667  Langkah ketiga: Tentukan objek yang memiliki nilai rata-rata yang terbesar, objek yang memiliki nilai rata-rata yang terbesar akan terpisah dan berubah menjadi splinter group. Diperoleh objek f memiliki rata-rata terbesar, maka objek f keluar dan menjadi splinter group. Tahap 2 Diperoleh matrik jarak yang baru, seperti pada Tabel 3.3: Tabel 3 Tabel 3.3. Matrik jarak tahap 1 a b c d e a 0.0 13.342 19.417 16.553 7.811 b 13.342 0.0 6.083 4.473 7.281 c 19.417 6.083 0.0 5.0 13.039 d 16.553 4.473 5.0 0.0 9.22 e 7.811 7.281 13.039 9.22 0.0  Ulangi langkah kedua : Dari matriks jarak yang baru, kemudian pilih rata-rata antar antar objek dengan objek lainnya.  Rata-rata objek a = 11.4246  Rata-rata objek b = 6.2358  Rata-rata objek c = 8.7078  Rata-rata objek d = 7.0492  Rata-rata objek e = 7.4702 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 25 Kemudian selisihkan setiap nilai rata-rata tersebut dengan elemen matrik splinter group.  Rata-rata objek a = 11.4246 - 6.709 = 4.7156  Rata-rata objek b = 6.2358 - 16.279 = -10.0432  Rata-rata objek c = 8.7078 - 22.091 = -13.3832  Rata-rata objek d = 7.0492 - 18.028 = -10.9788  Rata-rata objek e = 7.4702 - 9.056 = -1.5858  Langkah ketiga : tentukan objek yang memiliki nilai selisih terbesar, objek yang memiliki nilai selisih terbesar akan terpisah dan bergabung dengan splinter group. Objek a memiliki nilai selisih terbesar, maka objek a bergabung dengan objek f ke dalam splinter group. Tahap 3 Diperoleh matrik jarak yang baru, , seperti pada Tabel 3.4: 4 Tabel 3.4. Matrik jarak tahap 3 b c d e b 0.0 6.083 4.473 7.281 c 6.083 0.0 5.0 13.039 d 4.473 5.0 0.0 9.22 e 7.281 13.039 9.22 0.0  Ulangi langkah kedua : Dari matriks jarak yang baru, kemudian pilih rata-rata antar antar objek dengan objek lainnya.  Rata-rata objek b = 4.45925  Rata-rata objek c = 6.0305 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 26  Rata-rata objek d = 4.67325  Rata-rata objek e = 7.385 Kemudian selisihkan setiap nilai rata-rata tersebut dengan elemen matrik splinter group.  Rata-rata objek b = 4.45925 - 14.8105 = -10.35125  Rata-rata objek c = 6.0305 - 20.754 = -14.7235  Rata-rata objek d = 4.67325 - 17.2905 =-12.61725  Rata-rata objek e = 7.385 - 8.4335 = -1.0485 Karena semua nilai selisih bernilai negatif, maka algoritma kembali ke awal. Rata-rata objek terbesar pada matriks tersebut dimiliki oleh objek e, maka objek e keluar dan membentuk klaster baru. Tahap 4 Diperoleh matrik jarak yang baru, , seperti pada Tabel 3.5: 5 Tabel 3.5. Matrik jarak tahap 4 b c d b 0.0 6.083 4.473 c 6.083 0.0 5.0 d 4.473 5.0 0.0  Ulangi langkah kedua : Dari matriks jarak yang baru, kemudian pilih rata-rata antar antar objek dengan objek lainnya.  Rata-rata objek b = 3.518666667  Rata-rata objek c = 3.694333333 27  Rata-rata objek d = 3.157666667 Kemudian selisihkan setiap nilai rata-rata tersebut dengan elemen matrik splinter group.  Rata-rata objek b = 3.518666667 - 7.281 = -3.762333333  Rata-rata objek c = 3.694333333 - 13.039 = -9.344666667  Rata-rata objek d = 3.157666667 - 9.22 = -6.062333333 Karena semua nilai selisih bernilai negatif, maka algoritma berhenti sampai disini. Maka objek b, c,dan d keluar dan membentuk klaster baru. Dengan mengimplementasikan algoritma divisive menggunakan java, data sampel yang digunakan pada Tabel 3.1 menghasilhan skruktur tree cluster seperti pada Gambar 3.2: Gam bar 4 Gambar 3.2. Jtree pembentukan Cluster PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 28 5. Cluster Proses Divisive menghasilkan jumlah cluster maksimum sesuai dengan proses iterasi pada algoritma divisive. Hasil pembentukan cluster ditampilkan pula kedalam struktur tree. Dari hasil Jtree tersubut juga dapat ditentukan cluster yang diinginkan seperti pada Tabel 3.6. Tabel 6 Tabel 3.6. Contoh pembentukan 3 cluster oleh sistem Cluster 1 Cluster 2 Cluster 3 a e c f b d 6. Perhitungan Akurasi Pada penelitian ini akan dilakukan uji akurasi pada setiap pembentukan cluster dan mengevaluasi pola yang ditemukan dari hasil pengelompokan. Sebelum sistem menyimpan cluster yang sudah terbentuk, masing-masing cluster akan di hitung menggunakan sum of square error SSE. Setelah semua cluster terbentuk akan ditotal jumlah SSE-nya. Dengan demikian ada sejumlah percobaan pembentukan cluster yang akan dihitung SSE-nya. SSE dengan nilai terendah mengindikasikan bahwa cluster yang tebentuk adalah yang paling baik. Pada penelitian ini dilakukan 2 sampai 7 percobaan pembentukan cluster sesuai dengan jumlah obyek data, namun tidak menutup kemungkinan jika percobaan yang dilakukan bisa lebih atau kurang atau lebih dari 7. Hal ini tergantung jumlah obyek data dan kebutuhan yang ada. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 29

BAB IV ANALISIS DAN PERANCANGAN SISTEM