3.3 Jenis Data Jenis data yang diambil adalah dari dokumen jumlah pohon dan produksi
buah – buahan Provinsi Daerah Istimewa Yogyakarta tahun 2005 sampai dengan
tahun 2009 yang berupa format pdf kemudian yang kemudian diubah ke dalam bentuk dokumen yang berekstensi .xlsx.
3.4 Analisa Data
Secara umum, system yang akan dibangun dalam penelitian ini adalah sebuah system dengan fungsi utama untuk melakukan pengelompokan produksi buah.
Data yang digunakan untuk penelitian merupakan data yang diperoleh dari arsip Dinas Pertanian Provinsi Daerah Istimewa Yogyakarta. Data yang digunakan
merupakan data jumlah pohon dan produksi. Sehingga nantinya dinas terkait dapat mengambil tindakan untuk memetakan tempat produksi. Berikut ini adalah
contoh data yang akan digunakan untuk perhitungan dengan K-Means clustering :
3.4.1 Transformasi Data
Agar data di atas dapat diolah dengan menggunakan metode K-Means clustering, maka data yang berjenis data nominal seperti nama buah dan
kabupaten harus diinisialisasikan terlebih dahulu dalam bentuk angka.
Tabel 3. 1 Inisialisasi nama buah
Nama Buah Inisalisasi
Alpokat 1
Mangga 2
Rambutan 3
Duku 4
Jeruk 5
Sirsak 6
Sukun 7
Belimbing 8
Durian 9
Jambu Biji 10
Manggis 11
Sawo 12
Pepaya 13
Pisang 14
Nanas 15
Salak 16
Nangka 17
Semangka 18
Tabel 3. 2 Inisialisasi nama Kabupaten
Kabupaten Inisalisasi
Kabupaten Bantul 1
Kabupaten Gunungkidul 2
Kota Yogyakarta 3
Kabupaten Kulonprogo 4
Kabupaten Sleman 5
3.4.2 Pengolahan Data
Setelah semua data nama buah dan kabupaten pada tahun 2005 sampai 2009 ditransformasi ke dalam bentuk angka, maka data-data tersebut telah
dapat dikelompokan
dengan menggunakan
algoritma K-Means
Clustering.Untuk dapat melakukan pengelompokan data-data tersebut menjadi beberapa cluster perlu dilakukan beberapa langkah, yaitu:
a. Tentukan jumlah cluster yang diinginkan. Dalam penelitian ini data
– data yang ada akan dikelompokan menjadi tiga cluster .
b. Tentukan titik pusat awal dari setiap cluster . Dalam penelitian ini titik
pusat awal ditentukan secara random dan didapat titik pusat dari setiap cluster dapat dilihat pada tabel 3.3 dan contoh data sample yang
digunakan dapat dilihat pada tabel 3.4.
Tabel 3. 3 Contoh data Jumlah Pohon dan Produksi Buah – buahan
TITIK PUSAT AWAL JUMLAH POHON
PRODUKSI
Cluster 1 14634913
57476 Cluster 2
123129 213
Cluster 3 2314
66
Tabel 3. 4 Contoh data Jumlah Pohon dan Produksi Buah
– buahan
JUMLAH POHON
PRODUKSI
14634913 57476
9772771 123229
4534595 67329
1680899 1766
1031988 13870
360286 18743
256227 7984
123129 213
81180 4079
80960 296
79262 11704
76956 3477
75434 4157
Setelah diketahui nilai k dan pusat cluster awal selanjutnya mengukur jarak antara pusat cluster menggunakan euclidian distance, kemudian akan
didapatkan matriks jarak yaitu C1, C2 dan C3 sebagai berikut: Rumus euclidian distance:
Perhitungan jarak data pertama dengan pusat cluster pertama adalah : √
Perhitungan jarak data pertama dengan pusat cluster kedua adalah : √
Perhitungan jarak data pertama dengan pusat cluster ketiga adalah : √
Tabel 3. 5 Tabel Hasil Perhitungan Jarak Pusat Cluster
JUMLAH POHON
PRODUKSI C1 C2
C3 Jarak
Terpendek
14634913 57476
0.00 14511896.98 14632711.62 0.00
9772771 123229
4862586.58 9650426.09
9771233.24 4862586.58
4534595 67329 10100322.81
4411976.52 4532780.09
4411976.52 1381584
21811 13253376.99 1258640.32
1379441.40 1258640.32
1031988 13870 13602994.89
908961.60 1029766.53
908961.60 360286
18743 14274679.55 237879.81
358458.90 237879.81
256227 7984 14378771.18
133324.66 254036.43
133324.66 123129
213 14511896.98 0.00
120815.09 0.00
73069 10337
81180 4079 14553830.96
42126.77 78968.03
42126.77 80960
296 14554065.32 42169.08
78646.34 42169.08
79262 11704 14555722.97
45347.07 77823.12
45347.07 76956
3477 14558057.15 46288.22
74719.90 46288.22
75434 4157 14559576.63
47857.79 73234.35
47857.79 73069
10337 14561920.30 51073.47
71496.60 51073.47
2314 66 14632711.62
120815.09 0.00
0.00
Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster, jarak ini menunjukkan bahwa data
tersebut berada dalam satu kelompok dengan pusat cluster terdekat. Dengan cara membandingkah hasil cluster dan diambil yang paling kecil.
Berikut ini akan ditampilkan data matriks pengelompokan group, nilai 1 berarti data tersebut berada dalam group kelompok data.
Tabel 3. 6 Tabel Pengelompokan Group
C1 C2
C3 1
1 1
1 1
1 1
1 1
1 1
1
1 1
1
Setelah diketahui anggota tiap-tiap cluster kemudian pusat cluster baru dihitung berdasarkan data anggota tiap-tiap cluster sesuai dengan rumus
pusat anggota cluster . Dengan perhitungan sebagai berikut :
Cluster baru yang keempat Jumlah Pohon :
Hasil Produksi :
Cluster baru yang kelima Jumlah Pohon :
Hasil Produksi : Cluster baru yang keenam
Jumlah Pohon : Hasil Produksi :
Pusat cluster keempat dengan jumlah pohon sebesar 12203842.00 dan hasil produksi sebesar 90352.50, pusat cluster kelima jumlah pohon sebesar
679555.83
dan hasil produksi sebesar
13666.67
, pusat cluster keenam jumlah pohon sebesar 2314 dan hasil produksi sebesar 66.
Ulang perhitungan jarak data pertama dengan pusat cluster keempat adalah :
√
Perhitungan jarak data pertama dengan pusat cluster kelima adalah : √
Perhitungan jarak data pertama dengan pusat cluster keenam adalah : √
Tabel 3. 7 Tabel Hasil Perhitungan Jarak Pusat Cluster
JUMLAH POHON
PRODUKSI C1 C2
C3 Jarak
terpendek
14634913 57476
2431293.29 13955425.93 14632711.62 2431293.29
9772771 123229
2431293.29 9093875.19
9771233.24 2431293.29
4534595 67329
7669281.56 3855412.64
4532780.09 3855412.64
1381584 21811 10822475.05
702075.41 1379441.40
702075.41 1031988
13870 11172115.80 352432.23
1029766.53 352432.23
360286 18743 11843772.48
319310.19 358458.90
319310.19 256227
7984 11947898.93 423366.97
254036.43 254036.43
123129 213 12081049.28
556589.46 120815.09
120815.09 81180
4079 12122968.99 598452.64
78968.03 78968.03
80960 296 12123216.49
598745.14 78646.34
78646.34 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
79262 11704 12124835.08
600297.04 77823.12
77823.12 76956
3477 12127197.18 602685.98
74719.90 74719.90
75434 4157 12128714.29
604196.68 73234.35
73234.35 73069
10337 12131036.89 606495.97
71496.60 71496.60
2314 66 12201862.04
677378.39 0.00
0.00
Langkah selanjutnya hasil perhitungan akan dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster , jarak ini
menunjukkan bahwa data tersebut berada dalam satu kelompok dengan pusat cluster terdekat.
Tabel 3. 8 Tabel Pengelompokan Group
C1 C2
C3 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
Pada perhitungan ini iterasi berhenti pada iterasi ke-9 karena kelompok data 3 sama dengan kelompok data 2 dari hasil clustering, dan telah
mencapai stabil dan konvergen.
3.5 Desain User Interface