Jenis Data Jenis data yang diambil adalah dari dokumen jumlah pohon dan produksi Analisa Data

3.3 Jenis Data Jenis data yang diambil adalah dari dokumen jumlah pohon dan produksi

buah – buahan Provinsi Daerah Istimewa Yogyakarta tahun 2005 sampai dengan tahun 2009 yang berupa format pdf kemudian yang kemudian diubah ke dalam bentuk dokumen yang berekstensi .xlsx.

3.4 Analisa Data

Secara umum, system yang akan dibangun dalam penelitian ini adalah sebuah system dengan fungsi utama untuk melakukan pengelompokan produksi buah. Data yang digunakan untuk penelitian merupakan data yang diperoleh dari arsip Dinas Pertanian Provinsi Daerah Istimewa Yogyakarta. Data yang digunakan merupakan data jumlah pohon dan produksi. Sehingga nantinya dinas terkait dapat mengambil tindakan untuk memetakan tempat produksi. Berikut ini adalah contoh data yang akan digunakan untuk perhitungan dengan K-Means clustering :

3.4.1 Transformasi Data

Agar data di atas dapat diolah dengan menggunakan metode K-Means clustering, maka data yang berjenis data nominal seperti nama buah dan kabupaten harus diinisialisasikan terlebih dahulu dalam bentuk angka. Tabel 3. 1 Inisialisasi nama buah Nama Buah Inisalisasi Alpokat 1 Mangga 2 Rambutan 3 Duku 4 Jeruk 5 Sirsak 6 Sukun 7 Belimbing 8 Durian 9 Jambu Biji 10 Manggis 11 Sawo 12 Pepaya 13 Pisang 14 Nanas 15 Salak 16 Nangka 17 Semangka 18 Tabel 3. 2 Inisialisasi nama Kabupaten Kabupaten Inisalisasi Kabupaten Bantul 1 Kabupaten Gunungkidul 2 Kota Yogyakarta 3 Kabupaten Kulonprogo 4 Kabupaten Sleman 5

3.4.2 Pengolahan Data

Setelah semua data nama buah dan kabupaten pada tahun 2005 sampai 2009 ditransformasi ke dalam bentuk angka, maka data-data tersebut telah dapat dikelompokan dengan menggunakan algoritma K-Means Clustering.Untuk dapat melakukan pengelompokan data-data tersebut menjadi beberapa cluster perlu dilakukan beberapa langkah, yaitu: a. Tentukan jumlah cluster yang diinginkan. Dalam penelitian ini data – data yang ada akan dikelompokan menjadi tiga cluster . b. Tentukan titik pusat awal dari setiap cluster . Dalam penelitian ini titik pusat awal ditentukan secara random dan didapat titik pusat dari setiap cluster dapat dilihat pada tabel 3.3 dan contoh data sample yang digunakan dapat dilihat pada tabel 3.4. Tabel 3. 3 Contoh data Jumlah Pohon dan Produksi Buah – buahan TITIK PUSAT AWAL JUMLAH POHON PRODUKSI Cluster 1 14634913 57476 Cluster 2 123129 213 Cluster 3 2314 66 Tabel 3. 4 Contoh data Jumlah Pohon dan Produksi Buah – buahan JUMLAH POHON PRODUKSI 14634913 57476 9772771 123229 4534595 67329 1680899 1766 1031988 13870 360286 18743 256227 7984 123129 213 81180 4079 80960 296 79262 11704 76956 3477 75434 4157 Setelah diketahui nilai k dan pusat cluster awal selanjutnya mengukur jarak antara pusat cluster menggunakan euclidian distance, kemudian akan didapatkan matriks jarak yaitu C1, C2 dan C3 sebagai berikut: Rumus euclidian distance: Perhitungan jarak data pertama dengan pusat cluster pertama adalah : √ Perhitungan jarak data pertama dengan pusat cluster kedua adalah : √ Perhitungan jarak data pertama dengan pusat cluster ketiga adalah : √ Tabel 3. 5 Tabel Hasil Perhitungan Jarak Pusat Cluster JUMLAH POHON PRODUKSI C1 C2 C3 Jarak Terpendek 14634913 57476 0.00 14511896.98 14632711.62 0.00 9772771 123229 4862586.58 9650426.09 9771233.24 4862586.58 4534595 67329 10100322.81 4411976.52 4532780.09 4411976.52 1381584 21811 13253376.99 1258640.32 1379441.40 1258640.32 1031988 13870 13602994.89 908961.60 1029766.53 908961.60 360286 18743 14274679.55 237879.81 358458.90 237879.81 256227 7984 14378771.18 133324.66 254036.43 133324.66 123129 213 14511896.98 0.00 120815.09 0.00 73069 10337 81180 4079 14553830.96 42126.77 78968.03 42126.77 80960 296 14554065.32 42169.08 78646.34 42169.08 79262 11704 14555722.97 45347.07 77823.12 45347.07 76956 3477 14558057.15 46288.22 74719.90 46288.22 75434 4157 14559576.63 47857.79 73234.35 47857.79 73069 10337 14561920.30 51073.47 71496.60 51073.47 2314 66 14632711.62 120815.09 0.00 0.00 Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster, jarak ini menunjukkan bahwa data tersebut berada dalam satu kelompok dengan pusat cluster terdekat. Dengan cara membandingkah hasil cluster dan diambil yang paling kecil. Berikut ini akan ditampilkan data matriks pengelompokan group, nilai 1 berarti data tersebut berada dalam group kelompok data. Tabel 3. 6 Tabel Pengelompokan Group C1 C2 C3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Setelah diketahui anggota tiap-tiap cluster kemudian pusat cluster baru dihitung berdasarkan data anggota tiap-tiap cluster sesuai dengan rumus pusat anggota cluster . Dengan perhitungan sebagai berikut : Cluster baru yang keempat Jumlah Pohon : Hasil Produksi : Cluster baru yang kelima Jumlah Pohon : Hasil Produksi : Cluster baru yang keenam Jumlah Pohon : Hasil Produksi : Pusat cluster keempat dengan jumlah pohon sebesar 12203842.00 dan hasil produksi sebesar 90352.50, pusat cluster kelima jumlah pohon sebesar 679555.83 dan hasil produksi sebesar 13666.67 , pusat cluster keenam jumlah pohon sebesar 2314 dan hasil produksi sebesar 66. Ulang perhitungan jarak data pertama dengan pusat cluster keempat adalah : √ Perhitungan jarak data pertama dengan pusat cluster kelima adalah : √ Perhitungan jarak data pertama dengan pusat cluster keenam adalah : √ Tabel 3. 7 Tabel Hasil Perhitungan Jarak Pusat Cluster JUMLAH POHON PRODUKSI C1 C2 C3 Jarak terpendek 14634913 57476 2431293.29 13955425.93 14632711.62 2431293.29 9772771 123229 2431293.29 9093875.19 9771233.24 2431293.29 4534595 67329 7669281.56 3855412.64 4532780.09 3855412.64 1381584 21811 10822475.05 702075.41 1379441.40 702075.41 1031988 13870 11172115.80 352432.23 1029766.53 352432.23 360286 18743 11843772.48 319310.19 358458.90 319310.19 256227 7984 11947898.93 423366.97 254036.43 254036.43 123129 213 12081049.28 556589.46 120815.09 120815.09 81180 4079 12122968.99 598452.64 78968.03 78968.03 80960 296 12123216.49 598745.14 78646.34 78646.34 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 79262 11704 12124835.08 600297.04 77823.12 77823.12 76956 3477 12127197.18 602685.98 74719.90 74719.90 75434 4157 12128714.29 604196.68 73234.35 73234.35 73069 10337 12131036.89 606495.97 71496.60 71496.60 2314 66 12201862.04 677378.39 0.00 0.00 Langkah selanjutnya hasil perhitungan akan dilakukan perbandingan dan dipilih jarak terdekat antara data dengan pusat cluster , jarak ini menunjukkan bahwa data tersebut berada dalam satu kelompok dengan pusat cluster terdekat. Tabel 3. 8 Tabel Pengelompokan Group C1 C2 C3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Pada perhitungan ini iterasi berhenti pada iterasi ke-9 karena kelompok data 3 sama dengan kelompok data 2 dari hasil clustering, dan telah mencapai stabil dan konvergen.

3.5 Desain User Interface