commit to user
6
selection
pada dokumen skripsi fakultas Pertanian UNS menggunakan
min threshold
6 dan
max threshold
300. Oleh karena itu kata dengan DF dibawah 6 dan kata dengan DF diatas
300 akan dihapus. Dari proses tersebut dihasilkan pengurangan kata dari awalnya 7.902 kata menjadi 1.413 kata. Pengurangan
kata ini sangat berpengaruh pada waktu komputasi proses selanjutnya.
Langkah ketiga yaitu perhitungan IDF menggunakan rumus : log
, dimana N adalah jumlah keseluruhan dokumen dan
adalah nilai DF yang sudah dihitung pada proses sebelumnya. Langkah terakhir dalam perhitungan
pembobotan adalah
perhitungan TF-IDF
dengan cara
mengalikan hasil TF dengan hasil IDF. Lihat Tabel 3 untuk melihat semua hasil dari proses TF, DF, IDF dan TF-IDF
. Tabel 3 Hasil perhitungan TF, DF, IDF, dan TF-IDF
Kemudian dilakukan normalisasi data dengan Algoritma Min Max Normalization dan didapatkan hasil seperti pada Tabel 4
Tabel 4 Hasil normalisasi dengan Algoritma
Min Max Normalization
4.4 Proses
Clustering
Setelah dilakukan pembobotan TF-IDF terhadap
term
, tahap selanjutnya yaitu melakukan proses
clustering
. Langkah pertama yaitu menentukan jumlah iterasi,
learning rate
, radius ketetanggan,
width
dan
height cluster =
width
x
height
. Pada penelitian ini ditetapkan jumlah iterasi sebesar 1000,
learningrate 0.1, serta width dan heigh 9x9. Pemilihan jumlah
cluster
,
learningrate
serta
width
dan
height
sudah melalui beberapa kali percobaan. Kemudian sistem secara otomatis akan
membuat bobot secara dengan algoritma
Midpoint
dengan dimensi m x n, dimana m adalah jumlah cluster dan n adalah
jumlah
term
. Setelah itu dilakukan proses
clustering
SOM dengan cara seperti pada dasar teori.
4.5 Analisis Hasil Clustering
Setelah dilakukan
clustering
, dokumen yang memiliki banyak kemiripan
keyword
akan mengelompok menjadi satu. Setelah itu, dilakukan analisis perkiraan tema pada setiap
cluster
.Gambar 4.11 merupakan contoh tampilan hasil pada
cluster
C1 yang berisi
cluster
, id dokumen, judul, prodi, tahun, serta 10
top keyword
. Pada
cluster
C1, kebanyakan dokumen membahas mengenai pupuk yang berfokus pada pengaruh
pupuk terhadap ketersediaan maupun serapan suatu unsur. Hasil perkiraan tema dapat dilihat pada Lampiran Tabel 1.
Lampiran Tabel 1 merupakan perkiraan tema pada setiap
cluster
. Sel yang diberi warna hitam merupakan
cluster
yang tidak diisi oleh dokumen. Berdasarkan Lampiran Tabel 1
terlihat bahwa terdapat beberapa
cluster
yang memiliki kecenderungan tema umum yang sama. Selain itu,
cluster
yang memiliki kecenderungan tema umum yang sama adalah
cluster
yang berada saling berdekatan. Hal ini disebabkan karena pada algoritma SOM, bobot yang diperbaharui adalah neuron
pemenang serta neuron yang terletak didekat neuron pemenang. Oleh karena itu,
cluster
yang saling berdekatan memiliki kecenderungan tema yang mirip. Sebagai contoh pada tema
pupuk, berada pada
cluster
1, 2, 10, 11, 12, dan 19 yang letaknya saling berdekatan. Selain itu, terlihat bahwa letak
cluster
C3 berada didekat
cluster
C2, C11, serta C12 dimana pada
cluster
tersebut terdapat beberapa dokumen yang juga membahas mengenai pupuk. Disamping itu, ada juga beberapa
cluster
yang memiliki tema kurang sama antara satu dokumen dengan dokumen lain, seperti pada
cluster
C14, C23, C34, C42, C43, C44, C51, C53 dan C60. Hal ini dimungkinkan karena
bagian dokumen yang diolah hanya bagian abstrak saja, sehingga kurang dapat merepresentasikan isi keseluruhan
dokumen.
Analisis kedua yaitu analisis mengenai pola yang terbentuk pada pemetaan distribusi frekuensi hasil
clustering
antar prodi. Tabel 6 merupakan distribusi frekuensi
cluster
pada tiap prodi. Pada baris pertama A adalah prodi Agribisnis, B
adalah prodi Agroteknologi, C adalah prodi Ilmu dan Teknologi Pangan ITP, dan D adalah prodi Peternakan.
Tabel 6 Distribusi Frekuensi
Cluster
per Prodi
CLUSTER A
B C
D Jumlah
C1 -
15 -
- 15
C2 -
15 -
- 15
C3 -
16 -
- 16
C4 -
10 -
-
10 C5
- 23
- -
23 C7
21 -
- -
21 C9
18 -
- -
18 C10
- 16
- -
16 C11
- 20
- -
20 C12
- 10
- -
10 C13
- 19
- -
19 C14
- 2
- -
2 C15
- 11
- -
11 C17
18 -
- -
18 C18
10 -
- -
10 C19
- 16
- -
16 C20
6 10
- -
16 C21
6 21
- -
27 C22
3 7
- -
10 C23
1 18
- -
19 C24
- 8
- -
8 C25
20 -
- -
20 C26
10 -
- -
10 C27
26 -
- 1
27 C29
30 -
- -
30 C30
7 -
- -
7 C31
3 15
- -
18 C32
- 2
- -
2 C33
3 24
- -
27 C34
10 7
- -
17 C35
26 -
- -
26 C36
14 -
- -
14 C37
18 -
- 2
20 C38
1 -
- -
1 C39
23 1
- 1
25 C40
3 -
1 -
4 C41
5 14
6 -
25 C42
1 7
4 -
12
commit to user
7 Tabel 6 Distribusi Frekuensi
Cluster
per Prodi Lanjutan
CLUSTER A
B C
D Jumlah
C43
13 35
9 -
57 C44
30 4
1 -
35 C45
26 -
- -
26 C46
3 -
- 1
4 C47
- -
- 11
11 C48
2 -
2 2
6 C49
2 -
3 12
17 C50
- 7
5 -
12 C51
1 7
11 9
28 C52
5 7
7 2
21 C53
8 16
- 3
27 C54
20 -
- -
20 C55
3 -
- 18
21 C56
- -
- 3
3 C57
- -
- 21
21 C58
- -
- 7
7 C59
3 1
13 2
19 C60
- -
19 -
19 C61
1 1
10 10
22 C62
10 -
- -
10 C63
23 1
- 1
25 C64
- -
- 10
10 C65
- -
- 13
13 C66
- -
- 8
8 C67
- -
- 15
15 C68
- 4
6 -
10 C69
2 7
11 -
20 C70
- -
11 -
11 C71
18 -
2 -
20 C72
18 -
- -
18 C73
- -
- 18
18 C74
- -
- 15
15 C75
- -
- 18
18 C76
- -
- 16
16 C77
- -
- 5
5 C78
1 -
25 2
28 C79
3 -
14 1
18 C80
3 -
- -
3 C81
29 -
- -
29
Jumlah 507
397 160
227 1291
Berdasarkan Tabel 6, dapat dilihat bahwa ada beberapa
cluster
yang pernah dilakukan penelitian skripsi oleh beberapa maupun semua prodi. Hal ini dimungkinkan tema pada
cluster
tersebut berpotensi untuk dilakukan kolaborasi oleh beberapa maupun semua prodi. Sebagai contoh pada
cluster
C20 yang pernah dilakukan penelitian skripsi oleh enam mahasiswa prodi
Agribisnis dan 16 mahasiswa prodi Agroteknologi dengan tema umum mengenai pupuk. Pada prodi Agribisnis membahas
mengenai analisis faktor produksi luas lahan, benih, pupuk, dan tenaga kerja, sedangkan pada prodi Agroteknologi membahas
mengenai pengaruh pemberian pupuk terhadap tanaman. Dimungkinkan tema pada
cluster
tersebut berpotensi untuk dilakukan kolaborasi antara prodi Agribisnis dan prodi
Agroteknologi. Contoh lain yaitu pada
cluster
C59 dengan tema “pemanfaatan ekstrak jahe maupun agribisnis jahe”, dimana
semua prodi pernah melakukan penelitian skripsi dengan mengambil tema pada
cluster
tersebut. Dimungkinkan tema pada
cluster
tersebut berpotensi untuk dilakukan kolaborasi dengan semua prodi.
Disamping itu, ada juga
cluster
yang hanya pernah dilakukan penelitian oleh satu prodi tertentu. Sebagai contoh
pada
cluster
C1 sampai C5 yang sebagian besar membahas mengenai pupuk dan hanya pernah dilakukan penelitian skripsi
oleh mahasiswa pada jurursan Agribisnis. Dimungkinkan tema pada
cluster
tersebut tidak bisa dilakukan kolaborasi antar prodi. Atau bisa jadi, prodi lain memang belum mencoba untuk
melakukan penelitian pada tema tersebut. Tabel 7 Distribusi Frekuensi
Cluster
Pertahun Pada Prodi Agribisnis
CLUSTER ‘08
‘09 ‘10
‘11 ‘12
‘13 Jumlah
C1 C2
C3 C4
C5 C7
3 3
4 8
1 2
21 C9
6 4
8 18
C10 C11
C12 C13
C14 C15
C17 1
6 4
7 18
C18
3 1
3 2
1
10 C19
C20 2
1 2
1 6
C21 1
2 2
1 6
C22 1
2 3
C23
1
1 C24
C25 2
2 4
8 2
2 20
C26 3
1 1
3 1
1 10
C27 4
2 4
9 5
2 26
C29
1 4
2 5
7 11
30 C30
5 1
1 7
C31 2
1 3
C32 C33
2 1
3 C34
2 1
4 2
1
10 C35
6 3
9 7
1 26
C36 2
3 7
2 14
C37 3
1 6
3 5
18 C38
1 1
C39
2 3
7 4
3 4
23 C40
1 1
1 3
C41 1
2 2
5 C42
1 1
C43 1
2 2
5 3
13 C44
4 2
2 7
8 7
30 C45
3 4
8 3
2 6
26 C46
1 1
1 3
C47 C48
1 1
2 C49
1 1
2 C50
C51 1
1 C52
1 1
1 2
5 C53
1 1
3 3
8 C54
2 1
7 4
2 4
20 C55
1 2
3 C56
C57 C58
C59
1 1
1
3 C60
C61 1
1 C62
2 2
2 3
1 10
C63 1
2 10
3 4
3 23
C64 C65
C66 C67
C68 C69
1 1
2 C70
C71 2
4 4
1 5
2 18
C72 1
5 6
3 3
18 C73
C74 C75
C76 C77
C78 1
1 C79
1 1
1
3 C80
1 1
1 3
C81 1
2 6
5 10
5 29
Jumlah 52
62 107
106 85
95 507
Rata-rata 2
2 4
3 3
3
Analisis ketiga yaitu analisis mengenai pola yang terbentuk pada pemetaan distribusi frekuensi hasil
clustering
setiap prodi pertahunnya. Tabel 7 merupakan pemetaan
commit to user
8 distribusi frekuensi
cluster
pertahun pada prodi Agribisnis. Bagian tabel yang ditandai dengan warna abu, menunjukkan
bahwa pada sel tersebut memiliki jumlah dokumen diatas rata- rata. Rata-rata pertahun dapat dilihat pada tabel baris terakhir.
Hasil rata-rata berupa bilangan bulat karena menyatakan jumlah dokumen. Pada kasus ini rata-rata dihitung dengan rumus:
Pada Tabel 7, terlihat bahwa sel yang memiliki jumlah dokumen diatas rata-rata menyebar di beberapa
cluster
di tiap tahunnya. Artinya bahwa tema skripsi yang banyak diambil oleh
mahasiswa prodi Agribisnis di tiap tahunnya memang tidak hanya berfokus pada suatu tema tertentu. Tema yang lumayan
diminati di tiap tahunnya yaitu pada
cluster
C29, C35, C39, C44, C45, dan C81 dimana pada
cluster
tersebut diminati oleh mahasiswa selama empat tahun dengan tahun yang berbeda.
Apabila Tabel 7 disinkronkan dengan Lampiran Tabel 1 maka akan terlihat bahwa tema yang ada di jurusan Agribisnis
memang beragam.
Tabel 8 Distribusi Frekuensi
Cluster
Pertahun Pada Prodi Agroteknologi
CLUSTER ‘08
‘09 ‘10
‘11 ‘12
‘13 Jumlah
C1 1
1 10
3 15
C2 4
2 4
1 2
2 15
C3
2 2
5 6
1
16 C4
3 2
3 1
1 10
C5 4
1 8
3 6
1 23
C7 C9
C10 3
1 1
8 3
16 C11
1 3
5 8
3 20
C12 2
1 2
1 1
3 10
C13 1
4 5
5 2
2 19
C14 1
1 2
C15 5
2 4
11 C17
C18 C19
2 6
4 4
16 C20
6 1
1 1
1 10
C21 1
2 3
11 4
21 C22
2 1
1 3
7 C23
1 4
2 3
8 18
C24
4 1
2 1
8 C25
C26 C27
C29 C30
C31 1
3 3
8 15
C32 1
1 2
C33 8
4 6
4 1
1 24
C34 2
3 1
1 7
C35 C36
C37 C38
C39 1
1 C40
C41 3
1 1
3 3
3 14
C42
1 2
4
7 C43
2 3
8 13
9 35
C44 1
2 1
4 C45
C46 C47
C48 C49
C50 3
1 3
7 C51
1 2
2 2
7 C52
2 2
3 7
C53 2
1 4
6 3
16 C54
C55 C56
C57
Tabel 8 Distribusi Frekuensi
Cluster
Pertahun Pada Prodi Agroteknologi Lanjutan
CLUSTER 2008
2009 2010
2011 2012
2013 Jumlah
C58 C59
1
1 C60
C61 1
1 C62
C63 1
1 C64
C65 C66
C67 C68
2 2
4 C69
3 3
1
7 C70
C71 C72
C73 C74
C75 C76
C77 C78
C79 C80
C81 Jumlah
58 39
72 84
91 53
397 Rata-rata
3 2
3 3
4 3
Tabel 8 merupakan representasi hasil
cluster
ing pertahun pada prodi Agroteknologi. Bagian tabel yang ditandai
dengan warna abu-abu, menunjukkan jumlah dokumen yang berada diatas rata-rata. Nilai rata-rata dihitung seperti pada
penjelasan sebelumnya. Berdasarkan Table 8, sel yang memiliki jumlah dokumen diatas rata-rata menyebar di tiap tahunnya.
Namun apabila disinkronkan dengan Lampiran Tabel 1 mengenai analisis perkiraan tema, sebagian besar tema yang
diambil pada prodi Agroteknologi adalah mengenai pupuk. Hal ini berarti tema yang banyak diambil oleh mahasiswa prodi
Agroteknologi di tiap tahunnya adalah kajian mengenai pupuk.
Tabel 9 Distribusi Frekuensi
Cluster
Pertahun Pada Prodi ITP
CLUSTER ‘08
‘09 ‘10
‘11 ‘12
‘13 Jumlah
C1 C2
C3 C4
C5 C7
C9 C10
C11 C12
C13 C14
C15 C17
C18 C19
C20 C21
C22 C23
C24 C25
C26 C27
C29 C30
C31 C32
C33 C34
C35 C36
C37 C38
C39 C40
1 1
C41 1
2 1
2 6
commit to user
9 Tabel 9 Distribusi Frekuensi
Cluster
Pertahun Pada Prodi ITP
CLUSTER ‘08
‘09 ‘10
‘11 ‘12
‘13 Jumlah
C42 2
1 1
4 C43
3 1
5
9 C44
1 1
C45 C46
C47 C48
1 1
2 C49
2 1
3 C50
1 3
1 5
C51 4
1 1
1 4
11 C52
2 2
2 1
7 C53
C54 C55
C56 C57
C58 C59
1 3
3 2
4 13
C63 C64
C65 C66
C67 C68
4 2
6 C69
1 1
5 4
11 C70
1 3
7 11
C71
1 1
2 C72
C73 C74
C75 C76
C77 C78
2 8
5 1
9 25
C79 1
6 4
2 1
14 C80
C81 Jumlah
18 15
55 27
18 27
160 Rata-rata
1 2
4 2
2 3
2,077922
Tabel 9 merupakan representasi hasil
clustering
pertahun pada prodi Ilmu dan Teknologi Pangan ITP. Pada tabel tersebut,
cluster
yang lumayan diminati tiap tahunnya adalah
cluster
C78 dengan tema mengenai tepung yang berfokus pada kajian
karakteristik fiiskokimia tepung maupun pemanfaatan tepung. Pada Tabel 9 sel yang memiliki jumlah diatas rata-rata memang
hanya dibeberapa
cluster
saja. Hal ini dimungkinkan karena dokumen skripsi yang ada diprodi ITP masih lumayan sedikit
dibandingkan dengan prodi lainnya. Tabel 10 Distribusi Frekuensi Cluster Pertahun Pada Prodi
Peternakan
CLUSTER ‘08
‘09 ‘10
‘11 ‘12
‘13 Jumlah
C1 C2
C3 C4
C5 C7
C9 C10
C11 C12
C13 C14
C15 C17
C18 C19
C26 C27
1 1
C29 C30
C31 C32
C33 C34
C20 C21
C22
Tabel 4.11 Distribusi Frekuensi
Cluster
Pertahun Pada Prodi Peternakan Lanjutan
CLUSTER ‘08
‘09 ‘10
‘11 ‘12
‘13 Jumlah
C23 C24
C25 C35
C36 C37
2 2
C38 C39
1 1
C40 C41
C42 C43
C44 C45
C46 1
1 C47
2 4
3 1
1 11
C48 2
2 C49
6 3
1 2
12 C50
C51 7
2 9
C52 2
2 C53
3 3
C54 C55
1 2
1 10
4 18
C56 2
1 3
C57 3
1 6
3 5
3 21
C58 1
2 4
7 C59
1 1
2 C60
C61 2
6 2
10 C62
C63 1
1 C64
8 1
1 10
C65
3 1
4 2
2 1
13 C66
4 1
2 1
8 C67
3 4
1 2
1 4
15 C68
C69 C70
C71 C72
C73 2
6 9
1 18
C74 7
4 3
1 15
C75
8 5
3 2
18 C76
4 6
6 16
C77 4
1 5
C78 2
2 C79
1 1
C80 C81
Jumlah 51
31 50
25 40
30 227
Rata-rata 4
3 4
2 3
2
Tabel 10 merupakan representasi hasil
cluster
ing pertahun pada prodi Peternakan. Berdasarkan tabel tersebut, terlihat bahwa
cluster
yang memiliki sel dengan jumlah dokumen diatas rata- rata di tiap tahunnya terletak dibeberapa
cluster
. Namun apabila dilihat lagi pada Tabel 4.6 mengenai perkiraan tema, terdapat
13
cluster
yang membahas mengenai tema umum ransum dengan berbagai objek maupun perlakuan. Hal ini menunjukkan
bahwa tema yang banyak diambil oleh mahasiswa prodi Peternakan di tiap tahunnya adalah mengenai ransum.
4.6 Validasi