Proses Analisis Hasil Clustering

commit to user 6 selection pada dokumen skripsi fakultas Pertanian UNS menggunakan min threshold 6 dan max threshold 300. Oleh karena itu kata dengan DF dibawah 6 dan kata dengan DF diatas 300 akan dihapus. Dari proses tersebut dihasilkan pengurangan kata dari awalnya 7.902 kata menjadi 1.413 kata. Pengurangan kata ini sangat berpengaruh pada waktu komputasi proses selanjutnya. Langkah ketiga yaitu perhitungan IDF menggunakan rumus : log , dimana N adalah jumlah keseluruhan dokumen dan adalah nilai DF yang sudah dihitung pada proses sebelumnya. Langkah terakhir dalam perhitungan pembobotan adalah perhitungan TF-IDF dengan cara mengalikan hasil TF dengan hasil IDF. Lihat Tabel 3 untuk melihat semua hasil dari proses TF, DF, IDF dan TF-IDF . Tabel 3 Hasil perhitungan TF, DF, IDF, dan TF-IDF Kemudian dilakukan normalisasi data dengan Algoritma Min Max Normalization dan didapatkan hasil seperti pada Tabel 4 Tabel 4 Hasil normalisasi dengan Algoritma Min Max Normalization

4.4 Proses

Clustering Setelah dilakukan pembobotan TF-IDF terhadap term , tahap selanjutnya yaitu melakukan proses clustering . Langkah pertama yaitu menentukan jumlah iterasi, learning rate , radius ketetanggan, width dan height cluster = width x height . Pada penelitian ini ditetapkan jumlah iterasi sebesar 1000, learningrate 0.1, serta width dan heigh 9x9. Pemilihan jumlah cluster , learningrate serta width dan height sudah melalui beberapa kali percobaan. Kemudian sistem secara otomatis akan membuat bobot secara dengan algoritma Midpoint dengan dimensi m x n, dimana m adalah jumlah cluster dan n adalah jumlah term . Setelah itu dilakukan proses clustering SOM dengan cara seperti pada dasar teori.

4.5 Analisis Hasil Clustering

Setelah dilakukan clustering , dokumen yang memiliki banyak kemiripan keyword akan mengelompok menjadi satu. Setelah itu, dilakukan analisis perkiraan tema pada setiap cluster .Gambar 4.11 merupakan contoh tampilan hasil pada cluster C1 yang berisi cluster , id dokumen, judul, prodi, tahun, serta 10 top keyword . Pada cluster C1, kebanyakan dokumen membahas mengenai pupuk yang berfokus pada pengaruh pupuk terhadap ketersediaan maupun serapan suatu unsur. Hasil perkiraan tema dapat dilihat pada Lampiran Tabel 1. Lampiran Tabel 1 merupakan perkiraan tema pada setiap cluster . Sel yang diberi warna hitam merupakan cluster yang tidak diisi oleh dokumen. Berdasarkan Lampiran Tabel 1 terlihat bahwa terdapat beberapa cluster yang memiliki kecenderungan tema umum yang sama. Selain itu, cluster yang memiliki kecenderungan tema umum yang sama adalah cluster yang berada saling berdekatan. Hal ini disebabkan karena pada algoritma SOM, bobot yang diperbaharui adalah neuron pemenang serta neuron yang terletak didekat neuron pemenang. Oleh karena itu, cluster yang saling berdekatan memiliki kecenderungan tema yang mirip. Sebagai contoh pada tema pupuk, berada pada cluster 1, 2, 10, 11, 12, dan 19 yang letaknya saling berdekatan. Selain itu, terlihat bahwa letak cluster C3 berada didekat cluster C2, C11, serta C12 dimana pada cluster tersebut terdapat beberapa dokumen yang juga membahas mengenai pupuk. Disamping itu, ada juga beberapa cluster yang memiliki tema kurang sama antara satu dokumen dengan dokumen lain, seperti pada cluster C14, C23, C34, C42, C43, C44, C51, C53 dan C60. Hal ini dimungkinkan karena bagian dokumen yang diolah hanya bagian abstrak saja, sehingga kurang dapat merepresentasikan isi keseluruhan dokumen. Analisis kedua yaitu analisis mengenai pola yang terbentuk pada pemetaan distribusi frekuensi hasil clustering antar prodi. Tabel 6 merupakan distribusi frekuensi cluster pada tiap prodi. Pada baris pertama A adalah prodi Agribisnis, B adalah prodi Agroteknologi, C adalah prodi Ilmu dan Teknologi Pangan ITP, dan D adalah prodi Peternakan. Tabel 6 Distribusi Frekuensi Cluster per Prodi CLUSTER A B C D Jumlah C1 - 15 - - 15 C2 - 15 - - 15 C3 - 16 - - 16 C4 - 10 - - 10 C5 - 23 - - 23 C7 21 - - - 21 C9 18 - - - 18 C10 - 16 - - 16 C11 - 20 - - 20 C12 - 10 - - 10 C13 - 19 - - 19 C14 - 2 - - 2 C15 - 11 - - 11 C17 18 - - - 18 C18 10 - - - 10 C19 - 16 - - 16 C20 6 10 - - 16 C21 6 21 - - 27 C22 3 7 - - 10 C23 1 18 - - 19 C24 - 8 - - 8 C25 20 - - - 20 C26 10 - - - 10 C27 26 - - 1 27 C29 30 - - - 30 C30 7 - - - 7 C31 3 15 - - 18 C32 - 2 - - 2 C33 3 24 - - 27 C34 10 7 - - 17 C35 26 - - - 26 C36 14 - - - 14 C37 18 - - 2 20 C38 1 - - - 1 C39 23 1 - 1 25 C40 3 - 1 - 4 C41 5 14 6 - 25 C42 1 7 4 - 12 commit to user 7 Tabel 6 Distribusi Frekuensi Cluster per Prodi Lanjutan CLUSTER A B C D Jumlah C43 13 35 9 - 57 C44 30 4 1 - 35 C45 26 - - - 26 C46 3 - - 1 4 C47 - - - 11 11 C48 2 - 2 2 6 C49 2 - 3 12 17 C50 - 7 5 - 12 C51 1 7 11 9 28 C52 5 7 7 2 21 C53 8 16 - 3 27 C54 20 - - - 20 C55 3 - - 18 21 C56 - - - 3 3 C57 - - - 21 21 C58 - - - 7 7 C59 3 1 13 2 19 C60 - - 19 - 19 C61 1 1 10 10 22 C62 10 - - - 10 C63 23 1 - 1 25 C64 - - - 10 10 C65 - - - 13 13 C66 - - - 8 8 C67 - - - 15 15 C68 - 4 6 - 10 C69 2 7 11 - 20 C70 - - 11 - 11 C71 18 - 2 - 20 C72 18 - - - 18 C73 - - - 18 18 C74 - - - 15 15 C75 - - - 18 18 C76 - - - 16 16 C77 - - - 5 5 C78 1 - 25 2 28 C79 3 - 14 1 18 C80 3 - - - 3 C81 29 - - - 29 Jumlah 507 397 160 227 1291 Berdasarkan Tabel 6, dapat dilihat bahwa ada beberapa cluster yang pernah dilakukan penelitian skripsi oleh beberapa maupun semua prodi. Hal ini dimungkinkan tema pada cluster tersebut berpotensi untuk dilakukan kolaborasi oleh beberapa maupun semua prodi. Sebagai contoh pada cluster C20 yang pernah dilakukan penelitian skripsi oleh enam mahasiswa prodi Agribisnis dan 16 mahasiswa prodi Agroteknologi dengan tema umum mengenai pupuk. Pada prodi Agribisnis membahas mengenai analisis faktor produksi luas lahan, benih, pupuk, dan tenaga kerja, sedangkan pada prodi Agroteknologi membahas mengenai pengaruh pemberian pupuk terhadap tanaman. Dimungkinkan tema pada cluster tersebut berpotensi untuk dilakukan kolaborasi antara prodi Agribisnis dan prodi Agroteknologi. Contoh lain yaitu pada cluster C59 dengan tema “pemanfaatan ekstrak jahe maupun agribisnis jahe”, dimana semua prodi pernah melakukan penelitian skripsi dengan mengambil tema pada cluster tersebut. Dimungkinkan tema pada cluster tersebut berpotensi untuk dilakukan kolaborasi dengan semua prodi. Disamping itu, ada juga cluster yang hanya pernah dilakukan penelitian oleh satu prodi tertentu. Sebagai contoh pada cluster C1 sampai C5 yang sebagian besar membahas mengenai pupuk dan hanya pernah dilakukan penelitian skripsi oleh mahasiswa pada jurursan Agribisnis. Dimungkinkan tema pada cluster tersebut tidak bisa dilakukan kolaborasi antar prodi. Atau bisa jadi, prodi lain memang belum mencoba untuk melakukan penelitian pada tema tersebut. Tabel 7 Distribusi Frekuensi Cluster Pertahun Pada Prodi Agribisnis CLUSTER ‘08 ‘09 ‘10 ‘11 ‘12 ‘13 Jumlah C1 C2 C3 C4 C5 C7 3 3 4 8 1 2 21 C9 6 4 8 18 C10 C11 C12 C13 C14 C15 C17 1 6 4 7 18 C18 3 1 3 2 1 10 C19 C20 2 1 2 1 6 C21 1 2 2 1 6 C22 1 2 3 C23 1 1 C24 C25 2 2 4 8 2 2 20 C26 3 1 1 3 1 1 10 C27 4 2 4 9 5 2 26 C29 1 4 2 5 7 11 30 C30 5 1 1 7 C31 2 1 3 C32 C33 2 1 3 C34 2 1 4 2 1 10 C35 6 3 9 7 1 26 C36 2 3 7 2 14 C37 3 1 6 3 5 18 C38 1 1 C39 2 3 7 4 3 4 23 C40 1 1 1 3 C41 1 2 2 5 C42 1 1 C43 1 2 2 5 3 13 C44 4 2 2 7 8 7 30 C45 3 4 8 3 2 6 26 C46 1 1 1 3 C47 C48 1 1 2 C49 1 1 2 C50 C51 1 1 C52 1 1 1 2 5 C53 1 1 3 3 8 C54 2 1 7 4 2 4 20 C55 1 2 3 C56 C57 C58 C59 1 1 1 3 C60 C61 1 1 C62 2 2 2 3 1 10 C63 1 2 10 3 4 3 23 C64 C65 C66 C67 C68 C69 1 1 2 C70 C71 2 4 4 1 5 2 18 C72 1 5 6 3 3 18 C73 C74 C75 C76 C77 C78 1 1 C79 1 1 1 3 C80 1 1 1 3 C81 1 2 6 5 10 5 29 Jumlah 52 62 107 106 85 95 507 Rata-rata 2 2 4 3 3 3 Analisis ketiga yaitu analisis mengenai pola yang terbentuk pada pemetaan distribusi frekuensi hasil clustering setiap prodi pertahunnya. Tabel 7 merupakan pemetaan commit to user 8 distribusi frekuensi cluster pertahun pada prodi Agribisnis. Bagian tabel yang ditandai dengan warna abu, menunjukkan bahwa pada sel tersebut memiliki jumlah dokumen diatas rata- rata. Rata-rata pertahun dapat dilihat pada tabel baris terakhir. Hasil rata-rata berupa bilangan bulat karena menyatakan jumlah dokumen. Pada kasus ini rata-rata dihitung dengan rumus: Pada Tabel 7, terlihat bahwa sel yang memiliki jumlah dokumen diatas rata-rata menyebar di beberapa cluster di tiap tahunnya. Artinya bahwa tema skripsi yang banyak diambil oleh mahasiswa prodi Agribisnis di tiap tahunnya memang tidak hanya berfokus pada suatu tema tertentu. Tema yang lumayan diminati di tiap tahunnya yaitu pada cluster C29, C35, C39, C44, C45, dan C81 dimana pada cluster tersebut diminati oleh mahasiswa selama empat tahun dengan tahun yang berbeda. Apabila Tabel 7 disinkronkan dengan Lampiran Tabel 1 maka akan terlihat bahwa tema yang ada di jurusan Agribisnis memang beragam. Tabel 8 Distribusi Frekuensi Cluster Pertahun Pada Prodi Agroteknologi CLUSTER ‘08 ‘09 ‘10 ‘11 ‘12 ‘13 Jumlah C1 1 1 10 3 15 C2 4 2 4 1 2 2 15 C3 2 2 5 6 1 16 C4 3 2 3 1 1 10 C5 4 1 8 3 6 1 23 C7 C9 C10 3 1 1 8 3 16 C11 1 3 5 8 3 20 C12 2 1 2 1 1 3 10 C13 1 4 5 5 2 2 19 C14 1 1 2 C15 5 2 4 11 C17 C18 C19 2 6 4 4 16 C20 6 1 1 1 1 10 C21 1 2 3 11 4 21 C22 2 1 1 3 7 C23 1 4 2 3 8 18 C24 4 1 2 1 8 C25 C26 C27 C29 C30 C31 1 3 3 8 15 C32 1 1 2 C33 8 4 6 4 1 1 24 C34 2 3 1 1 7 C35 C36 C37 C38 C39 1 1 C40 C41 3 1 1 3 3 3 14 C42 1 2 4 7 C43 2 3 8 13 9 35 C44 1 2 1 4 C45 C46 C47 C48 C49 C50 3 1 3 7 C51 1 2 2 2 7 C52 2 2 3 7 C53 2 1 4 6 3 16 C54 C55 C56 C57 Tabel 8 Distribusi Frekuensi Cluster Pertahun Pada Prodi Agroteknologi Lanjutan CLUSTER 2008 2009 2010 2011 2012 2013 Jumlah C58 C59 1 1 C60 C61 1 1 C62 C63 1 1 C64 C65 C66 C67 C68 2 2 4 C69 3 3 1 7 C70 C71 C72 C73 C74 C75 C76 C77 C78 C79 C80 C81 Jumlah 58 39 72 84 91 53 397 Rata-rata 3 2 3 3 4 3 Tabel 8 merupakan representasi hasil cluster ing pertahun pada prodi Agroteknologi. Bagian tabel yang ditandai dengan warna abu-abu, menunjukkan jumlah dokumen yang berada diatas rata-rata. Nilai rata-rata dihitung seperti pada penjelasan sebelumnya. Berdasarkan Table 8, sel yang memiliki jumlah dokumen diatas rata-rata menyebar di tiap tahunnya. Namun apabila disinkronkan dengan Lampiran Tabel 1 mengenai analisis perkiraan tema, sebagian besar tema yang diambil pada prodi Agroteknologi adalah mengenai pupuk. Hal ini berarti tema yang banyak diambil oleh mahasiswa prodi Agroteknologi di tiap tahunnya adalah kajian mengenai pupuk. Tabel 9 Distribusi Frekuensi Cluster Pertahun Pada Prodi ITP CLUSTER ‘08 ‘09 ‘10 ‘11 ‘12 ‘13 Jumlah C1 C2 C3 C4 C5 C7 C9 C10 C11 C12 C13 C14 C15 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C29 C30 C31 C32 C33 C34 C35 C36 C37 C38 C39 C40 1 1 C41 1 2 1 2 6 commit to user 9 Tabel 9 Distribusi Frekuensi Cluster Pertahun Pada Prodi ITP CLUSTER ‘08 ‘09 ‘10 ‘11 ‘12 ‘13 Jumlah C42 2 1 1 4 C43 3 1 5 9 C44 1 1 C45 C46 C47 C48 1 1 2 C49 2 1 3 C50 1 3 1 5 C51 4 1 1 1 4 11 C52 2 2 2 1 7 C53 C54 C55 C56 C57 C58 C59 1 3 3 2 4 13 C63 C64 C65 C66 C67 C68 4 2 6 C69 1 1 5 4 11 C70 1 3 7 11 C71 1 1 2 C72 C73 C74 C75 C76 C77 C78 2 8 5 1 9 25 C79 1 6 4 2 1 14 C80 C81 Jumlah 18 15 55 27 18 27 160 Rata-rata 1 2 4 2 2 3 2,077922 Tabel 9 merupakan representasi hasil clustering pertahun pada prodi Ilmu dan Teknologi Pangan ITP. Pada tabel tersebut, cluster yang lumayan diminati tiap tahunnya adalah cluster C78 dengan tema mengenai tepung yang berfokus pada kajian karakteristik fiiskokimia tepung maupun pemanfaatan tepung. Pada Tabel 9 sel yang memiliki jumlah diatas rata-rata memang hanya dibeberapa cluster saja. Hal ini dimungkinkan karena dokumen skripsi yang ada diprodi ITP masih lumayan sedikit dibandingkan dengan prodi lainnya. Tabel 10 Distribusi Frekuensi Cluster Pertahun Pada Prodi Peternakan CLUSTER ‘08 ‘09 ‘10 ‘11 ‘12 ‘13 Jumlah C1 C2 C3 C4 C5 C7 C9 C10 C11 C12 C13 C14 C15 C17 C18 C19 C26 C27 1 1 C29 C30 C31 C32 C33 C34 C20 C21 C22 Tabel 4.11 Distribusi Frekuensi Cluster Pertahun Pada Prodi Peternakan Lanjutan CLUSTER ‘08 ‘09 ‘10 ‘11 ‘12 ‘13 Jumlah C23 C24 C25 C35 C36 C37 2 2 C38 C39 1 1 C40 C41 C42 C43 C44 C45 C46 1 1 C47 2 4 3 1 1 11 C48 2 2 C49 6 3 1 2 12 C50 C51 7 2 9 C52 2 2 C53 3 3 C54 C55 1 2 1 10 4 18 C56 2 1 3 C57 3 1 6 3 5 3 21 C58 1 2 4 7 C59 1 1 2 C60 C61 2 6 2 10 C62 C63 1 1 C64 8 1 1 10 C65 3 1 4 2 2 1 13 C66 4 1 2 1 8 C67 3 4 1 2 1 4 15 C68 C69 C70 C71 C72 C73 2 6 9 1 18 C74 7 4 3 1 15 C75 8 5 3 2 18 C76 4 6 6 16 C77 4 1 5 C78 2 2 C79 1 1 C80 C81 Jumlah 51 31 50 25 40 30 227 Rata-rata 4 3 4 2 3 2 Tabel 10 merupakan representasi hasil cluster ing pertahun pada prodi Peternakan. Berdasarkan tabel tersebut, terlihat bahwa cluster yang memiliki sel dengan jumlah dokumen diatas rata- rata di tiap tahunnya terletak dibeberapa cluster . Namun apabila dilihat lagi pada Tabel 4.6 mengenai perkiraan tema, terdapat 13 cluster yang membahas mengenai tema umum ransum dengan berbagai objek maupun perlakuan. Hal ini menunjukkan bahwa tema yang banyak diambil oleh mahasiswa prodi Peternakan di tiap tahunnya adalah mengenai ransum.

4.6 Validasi