Representasi Pengetahuan
Representasi pengetahuan akan dilakukan terhadap
cluster yang sudah divalidasi. Representasi pengetahuan akan memperlihatkan
karakteristik cluster dari SOM berupa rataan dan centroid dari cluster. Persentase masing-
masing cluster berdasarkan daerah asal pelamar, kategori SMA, dan putusan diterima akan
dilihat untuk melihat pola yang mungkin terjadi dari hasil clustering.
Lingkungan Penelitian
Lingkungan penelitian yang digunakan adalah sebagai berikut:
• Perangkat lunak: Microsoft® Windows XP Professional 2002 SP2, Microsoft® Internet
Explorer 6.0, PHP 5.0.3, Apache Webserver. • Perangkat keras: komputer personal dengan
spesifikasi Pentium IV 2.4 GHz, RAM 512 MB.
4. HASIL DAN PEMBAHASAN
Indeks Davies Bouldin DBI Pengamatan terhadap DBI dilakukan untuk
mengukur validitas dari hasil clustering. Parameter penurunan learning rate PLR dari
learning rate LR akan berpengaruh terhadap DBI mulai pada iterasi 2. Hal ini bisa dilihat
dengan PLR yang berbeda pada iterasi 1 akan menghasilkan DBI yang sama. DBI terbaik
untuk masing-masing ukuran output vektor bobot dapat dilihat pada Tabel 1.
Tabel 1 Indeks Davies-Bouldin terbaik untuk tiap ukuran output.
Ukuran Output
LR PLR ITERASI DBI
3 0.9 - 1 209.285 4 0.1
0.5 5 353.452 5 0.5 - 1 202.856
6 0.5 0.1 5 164.302
7 0.5 0.9 10 113.370
8 0.1 - 1 87.917 9 0.9
0.1 5 53.472 10 0.1 0.9 5 79.743
DBI Terbaik
Dari hasil penelitian, Indeks Davies-Bouldin terbaik dihasilkan dengan parameter awal:
ukuran output 9, LR 0.9, PLR 0.1, dan 5 iterasi, yang menghasilkan DBI 53.472 Tabel 1.
Banyaknya data masing-masing cluster dengan ukuran output 9 dapat dilihat pada Tabel 2
penomoran cluster tidak menunjukkan
tingkatan. Rataan dan centroid masing-masing cluster dengan ukuran output 9 dapat dilihat
pada Tabel 3 dan Tabel 4. Tabel 2 Banyak anggota masing-masing cluster
dengan ukuran output 9.
Cluster ke-
Banyak anggota Persentase banyak
anggota 1 188
9.90 2 284
14.96 3 197
10.37 4 212
11.16 5 199
10.48 6 243
12.80 7 272
14.32 8 189
9.95 9 115
6.06
Tabel 3 Centroid masing-masing cluster dengan ukuran output 9.
Cluster ke-
Centroid Biologi Fisika Kimia Matematika
1 6 9. 62 6 9. 76 6 5 . 2 0
66 . 3 4 2
6 8. 49 6 7. 43 6 8 . 8 9 69 . 5 1
3 8 3. 39 8 0. 48 8 1 . 3 4
79 . 5 0 4
7 4. 15 7 6. 03 7 4 . 7 4 71 . 5 2
5 7 4. 77 6 8. 84 7 6 . 2 8
76 . 3 3 6
7 7. 12 7 0. 97 7 0 . 4 3 75 . 5 5
7 7 5. 84 6 7. 27 6 9 . 4 1
66 . 6 5 8
7 3. 38 6 8. 79 7 6 . 8 1 68 . 2 2
9 7 3. 18 7 7. 11 7 9 . 3 5
82 . 1 7
Tabel 4 Rataan nilai mata ajaran masing- masing cluster dengan ukuran output
9.
Cluster ke-
Rataan Biologi Fisika Kimia Matematika Rataan
3 8 3 . 3 1 8 0 . 3 7 81 . 1 3
7 9. 66 8 1 . 1 2
9 7 3 . 3 3 7 6 . 8 6 78 . 6 1
8 1. 20 7 7 . 5 0
5 7 4 . 9 9 6 8 . 8 3 76 . 5 7
7 6. 26 7 4 . 1 6
4 7 4 . 1 1 7 5 . 8 7 74 . 6 1
7 1. 73 7 4 . 0 8
6 7 6 . 2 8 7 0 . 7 4 69 . 9 2
7 5. 41 7 3 . 0 9
8 7 3 . 4 7 6 8 . 8 2 76 . 9 4
6 8. 42 7 1 . 9 1
7 7 6 . 1 2 6 7 . 4 4 69 . 6 8
6 6. 94 7 0 . 0 4
2 6 8 . 6 0 6 7 . 3 9 68 . 8 8
6 9. 50 6 8 . 5 9
1 6 9 . 7 8 6 9 . 8 8 65 . 4 6
6 6. 60 6 7 . 9 3
Rataan 7 4 . 4 4 7 1 . 8 0 73 . 5 3
7 2. 86 7 3 . 1 6
Deskripsi
Clustering Terbaik
Cluster 3 yang memiliki 10.37 dari data Tabel 2, adalah cluster yang memiliki rataan
Biologi, Fisika, Kimia, dan Matematika tertinggi Tabel 4. Namun Cluster 3 bukan
cluster yang memiliki nilai yang terbaik untuk seluruh atribut, peringkat ke dua untuk nilai
Matematika Tabel 5.
Tabel 5 Urutan cluster berdasarkan nilai
Peringkat Cluster ke-
Biologi Fisika Kimia Matematika 1 3 3 3 9
2 6 9 9 3 3 7 4 8 5
4 5 6 5 6 5 4 1 4 4
6 8 5 6 2 7 9 8 7 8
8 1 7 2 7 9 2 2 1 1
Cluster 9 yang memiliki 6.06 dari data Tabel 2, menduduki peringkat ke dua dari
rataan secara keseluruhan Tabel 4. Cluster 9 memiliki nilai Matematika tertinggi, namun
hanya menduduki peringkat ke dua dari nilai Fisika dan Kimia, bahkan ke tujuh untuk nilai
Biologi Tabel 5. Cluster 9 memiliki kemampuan yang cukup kuat untuk nilai
Matematika, Fisika, dan Kimia, namun lemah di Biologi.
Cluster 5 10.48 dari data adalah cluster yang menduduki peringkat ke tiga dari rataan
Tabel 2 dan Tabel 4. Cluster 5 menduduki peringkat ke tiga untuk nilai Matematika,
peringkat ke 4 untuk nilai Biologi dan Kimia, dan peringkat ke 6 untuk nilai Fisika Tabel 5.
Cluster 5 memiliki kelemahan di nilai Fisika. Nilai Fisika Cluster 5 di bawah rata-rata, yaitu
68.83 dari rata-rata 71.80 Tabel 4.
Cluster 4 11.16 dari data adalah Cluster yang menduduki peringkat ke empat dari rataan
keseluruhan Tabel 2 dan Tabel 4. Cluster 4 memiliki kelebihan di nilai Fisika menduduki
peringkat ke 3, sedangkan untuk nilai Biologi, Kimia, dan Matematika, Cluster 4 menduduki
peringkat ke lima Tabel 5.
Cluster 6 menempati peringkat ke 5 untuk rataan keseluruhan Tabel 4, memiliki anggota
terbanyak ke 2 dari data yaitu 12 Tabel 2. Cluster 6 memiliki kemampuan lebih di bidang
Biologi dengan peringkat ke dua untuk nilai Biologi Tabel 5. Nilai Fisika dan Matematika
Cluster 6 menduduki peringkat ke empat,
sedangkan nilai Kimia menduduki peringkat ke enam Tabel 5.
Cluster 8 yang menduduki peringkat ke enam memiliki 9.95 dari data Tabel 2 dan
Tabel 4. Cluster 8 menduduki peringkat ke 3 untuk nilai Kimia Tabel 5. Cluster 8 memiliki
kemampuan yang kurang di bidang Biologi, Fisika, dan Matematika dengan masing-masing
peringkat ke 6, 7, dan 7 Tabel 5. Secara keseluruhan, rata-rata nilai Biologi, Fisika,
Kimia, dan Matematika Cluster 8 berada di bawah rata-rata 71.91 dari rata-rata 73.16,
Tabel 4.
Cluster 7, 2, dan 1 merupakan 3 cluster dengan rata-rata nilai di bawah rataan
keseluruhan. Cluster 7 menduduki peringkat ke tiga untuk nilai Biologi Tabel 5, namun nilai
yang lainnya di bawah rata-rata.
Daerah Asal
Secara keseluruhan dari semua cluster, bisa kita lihat bahwa pelamar dari Sumatera 1
paling banyak di Cluster 3, dan semakin menurun mengikuti turunnya rataan cluster
Tabel 6. Demikian juga dengan pelamar yang berasal dari Nusa Tenggara 5 dan Sulawesi 7
Tabel 6. Tabel 6 Persentase asal pelamar dalam setiap
cluster
Cluster ke-
Asal Pelamar 1 3 5 6 7
8 9
3 45.18 46.19
3.05 0.00
4.57 1.02 0.00
9 28.70 69.57
1.74 0.00
0.00 0.00 0.00
5 21.61 76.88
0.50 1.01
0.00 0.00 0.00
4 17.92 79.72
0.94 0.47
0.47 0.47 0.00
6 18.11 78.19
2.06 0.82
0.82 0.00 0.00
8 14.29 81.48
2.12 1.59
0.00 0.53 0.00
7 10.66 86.03
0.37 1.47
0.74 0.74 0.00
2 13.73 84.51
0.00 1.06
0.35 0.00 0.35
1 11.70 87.23
0.53 0.53
0.00 0.00 0.00
n
19.17 77.67 1.16 0.84 0.79 0.32 0.05
Keterangan: n = data keseluruhan.
Sumatera memiliki persentase yang lebih besar dari persentase dia sendiri secara
keseluruhan di Cluster 3, Cluster 9, dan Cluster 5 Tabel 6. Hal ini menunjukkan bahwa,
pelamar dari Sumatera banyak berada pada cluster yang memiliki rataan lebih tinggi.
Mayoritas anggota dari data berasal dari Jawa 3 sebesar 77.67 Tabel 6, dengan
persentase terkecil di Cluster 9. Secara keseluruhan persentase pelamar dari Jawa
semakin meningkat mengikuti turunnya rataan cluster Tabel 6. Terlihat bahwa pelamar yang
berasal dari Jawa banyak berada di cluster yang memiliki rataan lebih rendah Cluster 4, Cluster
6, Cluster 8, Cluster 7, Cluster 2, dan Cluster 1 Tabel 6. Pelamar dari Luar Negeri 0.05 dari
data berada hanya di Cluster 2 Tabel 6.
Persentase pelamar yang diterima menunjukkan penurunan sebanding dengan
penurunan nilai rataan cluster. Hal ini berlaku untuk daerah asal Sumatera, Jawa, dan Nusa
Tenggara Tabel 7. Untuk pelamar dengan daerah asal Kalimantan, Sulawesi, Irian Jaya,
dan Luar Negeri hanya diterima untuk satu cluster tertentu Tabel 7. Secara keseluruhan,
pelamar yang terbanyak diterima adalah yang berasal dari Jawa yaitu sebesar 80.43, bahkan
seluruh pelamar Cluster 1 berasal dari Jawa Tabel 7.
Tabel 7 Persentase pelamar yang diterima dalam setiap daerah asal
Cluster ke-
Asal Pelamar 1 3 5 6 7
8 9
3 54.12 14.60
66.67 100 100 0
9 17.65 11.68
16.67 0 0 0
5 10.59 15.09 0
4 3.53 16.30 0
6 5.88 16.30 0
8 5.88 9.49
16.67 7 2.35
9.49 0 100.00 0
2 0 4.87 0
100 1 0
2.19 0
n
16.63 80.43 1.17 0.20 1.17
0.20 0.20
Keterangan: n = data keseluruhan. Putusan
Persentase putusan tidak diterimanya pelamar dari tiap cluster berbanding terbalik
dengan rataan nilai keseluruhan Tabel 8, dengan 0=tidak diterima, 1=diterima di IPB,
A=diterima di Fakultas Pertanian, dan lain=diterima di fakultas selain Fakultas
Pertanian. Kendati Cluster 6, Cluster 8, Cluster 7, Cluster 2, dan Cluster 1 memiliki
rataan nilai keseluruhan di bawah rata-rata Tabel 4, cluster-cluster tersebut masih
memiliki persentase diterima Tabel 8. Hal ini menunjukkan bahwa nilai pelamar bukan satu-
satunya acuan dalam seleksi penerimaan mahasiswa baru.
Tabel 8 Detail putusan masing-masing cluster
diurut berdasarkan rataan nilai.
Cluster ke-
1 A lain
3 5.76 23.59
20.19 9 3.67
13.27 9.62
5 9.22 12.04
21.15 4 10.23
13.76 13.46
6 12.32 14.25
13.46 8 10.37
8.60 9.62
7 16.57 8.11
8.65 2 18.95
4.67 1.92
1 12.90 1.72
1.92 n 73.09
21.43 5.78
Keterangan: n = data keseluruhan.
Kategori Sekolah Asal Pelamar
Dari keseluruhan data terlihat persentase dari pelamar dalam setiap kategori SMA
tersebar merata dalam tiap-tiap cluster Tabel 9. Persentase pelamar dalam satu kategori
SMA, semakin meningkat sebanding dengan rataan cluster Tabel 10. Hal ini menunjukkan
bahwa peluang untuk diterima dari masing- masing kategori bergantung kepada nilai.
Tabel 9 Persentase pelamar dari setiap cluster
dalam satu kategori SMA
Cluster ke-
A+ A
A- B+
B B- C+
C C-
D 3 9.1
7.4 9.1
12.1 28.1
14.3 57.1
0.0 12.8
9 8.4 5.1 4.4 5.2 5.5 10.7 0
0.0 0.0 10.3
5 12.1 12.7 7.5 5.2 10.3 21.4 0
0.0 0.0 5.1
4 13.3 10.3 10.6 6.9 10.3 14.3 0
14.3 10.3 5.1 6
10.9 13.5 14.3 20.7 11.6 7.1 0 0.0
17.2 10.3 8
9.1 12.1 10.6 17.2 6.2 0.0 50 0.0 3.4 2.6
7 13.6 14.2 14.1 20.7 15.1 14.3 50 14.3
6.9 20.5 2 14.3
17.0 15.8
6.9 8.9
10.7 14.3 24.1 20.5
1 9.4 7.8 13.5 5.2 4.1 7.1 0
0.0 37.9 12.8
n
31.4 27.0 25.3 3.1 7.7 1.5 0.1 0.4 1.5 2.1
Keterangan: n = data keseluruhan. Tabel 10 Persentase pelamar yang diterima dari
setiap cluster dalam satu kategori SMA
Cluster ke-
A+ A
A- B+
B B- C+ C
C- D
3 18.8315.44 27.4038.4651.22
16.67 0 100 0 41.67
9 13.4511.03 12.3315.3812.20
16.67 0 0 0 8.33
5 15.2514.71 13.70
0 9.76 25 0 0 0 0
4 14.3515.44 17.81
0 7.32 8.33
0 0 0 6 13.0017.65
12.3323.08 9.76 16.67 0
0 0 8.33 8
8.97 11.76 5.48 23.08 4.88 0.00 0 7
9.87 8.09 6.85 0 2.44 0.00 0 0 25.00
2 4.04 4.41
2.74 0 2.44 16.67 0
0 0 8.33 1 2.24
1.47 1.37 0 0 0 0
0 0 8.33
n
43.6426.61 14.29 2.54 8.02 2.35 0 0.20 0 2.35
Keterangan: n = data keseluruhan.
Dalam sebuah cluster, semakin baik kategori sebuah SMA, maka persentase pelamar yang
diterima semakin tinggi Tabel 11. Hal ini menunjukkan bahwa dari data terlihat kategori
SMA berkontribusi terhadap diterimatidaknya pelamar.
Tabel 11 Persentase pelamar yang diterima dari setiap kategori SMA dalam satu
cluster
Cluster ke-
A+ A
A- B+
B B- C+ C
C- D
3 35.9017.9517.09 4.27 17.95 1.71 0 0.85 0 4.27 9 46.8823.4414.06 3.13 7.81 3.13 0 0
0 1.56 5 47.8928.1714.08
0 5.63 4.23 0 0 0 0
4 45.7130.0018.57 00 4.29 1.43 0 0 0 0.00
6 40.2833.3312.50 4.17 5.56 2.78 0 0 0 1.39
8 44.4435.56 8.89 6.67 4.44 0.00 0 0 0 0
7 52.3826.1911.90 0 2.38 0.00 0 0
0 7.14 2 42.8628.57 9.52
0 4.76 9.52 0 0 0 4.76
1 55.5622.2211.11 0 0 0 0 0
0 11.11
n
43.6426.6114.29 2.54 8.02 2.35 0 0.20 0 2.35
Keterangan: n = data keseluruhan.
5. KESIMPULAN DAN SARAN