HASIL DAN PEMBAHASAN Clustering menggunakan self organizing maps studi kassus : data ppmb ipb) Vol 5, No 2, 2007

Representasi Pengetahuan Representasi pengetahuan akan dilakukan terhadap cluster yang sudah divalidasi. Representasi pengetahuan akan memperlihatkan karakteristik cluster dari SOM berupa rataan dan centroid dari cluster. Persentase masing- masing cluster berdasarkan daerah asal pelamar, kategori SMA, dan putusan diterima akan dilihat untuk melihat pola yang mungkin terjadi dari hasil clustering. Lingkungan Penelitian Lingkungan penelitian yang digunakan adalah sebagai berikut: • Perangkat lunak: Microsoft® Windows XP Professional 2002 SP2, Microsoft® Internet Explorer 6.0, PHP 5.0.3, Apache Webserver. • Perangkat keras: komputer personal dengan spesifikasi Pentium IV 2.4 GHz, RAM 512 MB.

4. HASIL DAN PEMBAHASAN

Indeks Davies Bouldin DBI Pengamatan terhadap DBI dilakukan untuk mengukur validitas dari hasil clustering. Parameter penurunan learning rate PLR dari learning rate LR akan berpengaruh terhadap DBI mulai pada iterasi 2. Hal ini bisa dilihat dengan PLR yang berbeda pada iterasi 1 akan menghasilkan DBI yang sama. DBI terbaik untuk masing-masing ukuran output vektor bobot dapat dilihat pada Tabel 1. Tabel 1 Indeks Davies-Bouldin terbaik untuk tiap ukuran output. Ukuran Output LR PLR ITERASI DBI 3 0.9 - 1 209.285 4 0.1 0.5 5 353.452 5 0.5 - 1 202.856 6 0.5 0.1 5 164.302 7 0.5 0.9 10 113.370 8 0.1 - 1 87.917 9 0.9 0.1 5 53.472 10 0.1 0.9 5 79.743 DBI Terbaik Dari hasil penelitian, Indeks Davies-Bouldin terbaik dihasilkan dengan parameter awal: ukuran output 9, LR 0.9, PLR 0.1, dan 5 iterasi, yang menghasilkan DBI 53.472 Tabel 1. Banyaknya data masing-masing cluster dengan ukuran output 9 dapat dilihat pada Tabel 2 penomoran cluster tidak menunjukkan tingkatan. Rataan dan centroid masing-masing cluster dengan ukuran output 9 dapat dilihat pada Tabel 3 dan Tabel 4. Tabel 2 Banyak anggota masing-masing cluster dengan ukuran output 9. Cluster ke- Banyak anggota Persentase banyak anggota 1 188 9.90 2 284 14.96 3 197 10.37 4 212 11.16 5 199 10.48 6 243 12.80 7 272 14.32 8 189 9.95 9 115 6.06 Tabel 3 Centroid masing-masing cluster dengan ukuran output 9. Cluster ke- Centroid Biologi Fisika Kimia Matematika 1 6 9. 62 6 9. 76 6 5 . 2 0 66 . 3 4 2 6 8. 49 6 7. 43 6 8 . 8 9 69 . 5 1 3 8 3. 39 8 0. 48 8 1 . 3 4 79 . 5 0 4 7 4. 15 7 6. 03 7 4 . 7 4 71 . 5 2 5 7 4. 77 6 8. 84 7 6 . 2 8 76 . 3 3 6 7 7. 12 7 0. 97 7 0 . 4 3 75 . 5 5 7 7 5. 84 6 7. 27 6 9 . 4 1 66 . 6 5 8 7 3. 38 6 8. 79 7 6 . 8 1 68 . 2 2 9 7 3. 18 7 7. 11 7 9 . 3 5 82 . 1 7 Tabel 4 Rataan nilai mata ajaran masing- masing cluster dengan ukuran output 9. Cluster ke- Rataan Biologi Fisika Kimia Matematika Rataan 3 8 3 . 3 1 8 0 . 3 7 81 . 1 3 7 9. 66 8 1 . 1 2 9 7 3 . 3 3 7 6 . 8 6 78 . 6 1 8 1. 20 7 7 . 5 0 5 7 4 . 9 9 6 8 . 8 3 76 . 5 7 7 6. 26 7 4 . 1 6 4 7 4 . 1 1 7 5 . 8 7 74 . 6 1 7 1. 73 7 4 . 0 8 6 7 6 . 2 8 7 0 . 7 4 69 . 9 2 7 5. 41 7 3 . 0 9 8 7 3 . 4 7 6 8 . 8 2 76 . 9 4 6 8. 42 7 1 . 9 1 7 7 6 . 1 2 6 7 . 4 4 69 . 6 8 6 6. 94 7 0 . 0 4 2 6 8 . 6 0 6 7 . 3 9 68 . 8 8 6 9. 50 6 8 . 5 9 1 6 9 . 7 8 6 9 . 8 8 65 . 4 6 6 6. 60 6 7 . 9 3 Rataan 7 4 . 4 4 7 1 . 8 0 73 . 5 3 7 2. 86 7 3 . 1 6 Deskripsi Clustering Terbaik Cluster 3 yang memiliki 10.37 dari data Tabel 2, adalah cluster yang memiliki rataan Biologi, Fisika, Kimia, dan Matematika tertinggi Tabel 4. Namun Cluster 3 bukan cluster yang memiliki nilai yang terbaik untuk seluruh atribut, peringkat ke dua untuk nilai Matematika Tabel 5. Tabel 5 Urutan cluster berdasarkan nilai Peringkat Cluster ke- Biologi Fisika Kimia Matematika 1 3 3 3 9 2 6 9 9 3 3 7 4 8 5 4 5 6 5 6 5 4 1 4 4 6 8 5 6 2 7 9 8 7 8 8 1 7 2 7 9 2 2 1 1 Cluster 9 yang memiliki 6.06 dari data Tabel 2, menduduki peringkat ke dua dari rataan secara keseluruhan Tabel 4. Cluster 9 memiliki nilai Matematika tertinggi, namun hanya menduduki peringkat ke dua dari nilai Fisika dan Kimia, bahkan ke tujuh untuk nilai Biologi Tabel 5. Cluster 9 memiliki kemampuan yang cukup kuat untuk nilai Matematika, Fisika, dan Kimia, namun lemah di Biologi. Cluster 5 10.48 dari data adalah cluster yang menduduki peringkat ke tiga dari rataan Tabel 2 dan Tabel 4. Cluster 5 menduduki peringkat ke tiga untuk nilai Matematika, peringkat ke 4 untuk nilai Biologi dan Kimia, dan peringkat ke 6 untuk nilai Fisika Tabel 5. Cluster 5 memiliki kelemahan di nilai Fisika. Nilai Fisika Cluster 5 di bawah rata-rata, yaitu 68.83 dari rata-rata 71.80 Tabel 4. Cluster 4 11.16 dari data adalah Cluster yang menduduki peringkat ke empat dari rataan keseluruhan Tabel 2 dan Tabel 4. Cluster 4 memiliki kelebihan di nilai Fisika menduduki peringkat ke 3, sedangkan untuk nilai Biologi, Kimia, dan Matematika, Cluster 4 menduduki peringkat ke lima Tabel 5. Cluster 6 menempati peringkat ke 5 untuk rataan keseluruhan Tabel 4, memiliki anggota terbanyak ke 2 dari data yaitu 12 Tabel 2. Cluster 6 memiliki kemampuan lebih di bidang Biologi dengan peringkat ke dua untuk nilai Biologi Tabel 5. Nilai Fisika dan Matematika Cluster 6 menduduki peringkat ke empat, sedangkan nilai Kimia menduduki peringkat ke enam Tabel 5. Cluster 8 yang menduduki peringkat ke enam memiliki 9.95 dari data Tabel 2 dan Tabel 4. Cluster 8 menduduki peringkat ke 3 untuk nilai Kimia Tabel 5. Cluster 8 memiliki kemampuan yang kurang di bidang Biologi, Fisika, dan Matematika dengan masing-masing peringkat ke 6, 7, dan 7 Tabel 5. Secara keseluruhan, rata-rata nilai Biologi, Fisika, Kimia, dan Matematika Cluster 8 berada di bawah rata-rata 71.91 dari rata-rata 73.16, Tabel 4. Cluster 7, 2, dan 1 merupakan 3 cluster dengan rata-rata nilai di bawah rataan keseluruhan. Cluster 7 menduduki peringkat ke tiga untuk nilai Biologi Tabel 5, namun nilai yang lainnya di bawah rata-rata. Daerah Asal Secara keseluruhan dari semua cluster, bisa kita lihat bahwa pelamar dari Sumatera 1 paling banyak di Cluster 3, dan semakin menurun mengikuti turunnya rataan cluster Tabel 6. Demikian juga dengan pelamar yang berasal dari Nusa Tenggara 5 dan Sulawesi 7 Tabel 6. Tabel 6 Persentase asal pelamar dalam setiap cluster Cluster ke- Asal Pelamar 1 3 5 6 7 8 9 3 45.18 46.19 3.05 0.00 4.57 1.02 0.00 9 28.70 69.57 1.74 0.00 0.00 0.00 0.00 5 21.61 76.88 0.50 1.01 0.00 0.00 0.00 4 17.92 79.72 0.94 0.47 0.47 0.47 0.00 6 18.11 78.19 2.06 0.82 0.82 0.00 0.00 8 14.29 81.48 2.12 1.59 0.00 0.53 0.00 7 10.66 86.03 0.37 1.47 0.74 0.74 0.00 2 13.73 84.51 0.00 1.06 0.35 0.00 0.35 1 11.70 87.23 0.53 0.53 0.00 0.00 0.00 n 19.17 77.67 1.16 0.84 0.79 0.32 0.05 Keterangan: n = data keseluruhan. Sumatera memiliki persentase yang lebih besar dari persentase dia sendiri secara keseluruhan di Cluster 3, Cluster 9, dan Cluster 5 Tabel 6. Hal ini menunjukkan bahwa, pelamar dari Sumatera banyak berada pada cluster yang memiliki rataan lebih tinggi. Mayoritas anggota dari data berasal dari Jawa 3 sebesar 77.67 Tabel 6, dengan persentase terkecil di Cluster 9. Secara keseluruhan persentase pelamar dari Jawa semakin meningkat mengikuti turunnya rataan cluster Tabel 6. Terlihat bahwa pelamar yang berasal dari Jawa banyak berada di cluster yang memiliki rataan lebih rendah Cluster 4, Cluster 6, Cluster 8, Cluster 7, Cluster 2, dan Cluster 1 Tabel 6. Pelamar dari Luar Negeri 0.05 dari data berada hanya di Cluster 2 Tabel 6. Persentase pelamar yang diterima menunjukkan penurunan sebanding dengan penurunan nilai rataan cluster. Hal ini berlaku untuk daerah asal Sumatera, Jawa, dan Nusa Tenggara Tabel 7. Untuk pelamar dengan daerah asal Kalimantan, Sulawesi, Irian Jaya, dan Luar Negeri hanya diterima untuk satu cluster tertentu Tabel 7. Secara keseluruhan, pelamar yang terbanyak diterima adalah yang berasal dari Jawa yaitu sebesar 80.43, bahkan seluruh pelamar Cluster 1 berasal dari Jawa Tabel 7. Tabel 7 Persentase pelamar yang diterima dalam setiap daerah asal Cluster ke- Asal Pelamar 1 3 5 6 7 8 9 3 54.12 14.60 66.67 100 100 0 9 17.65 11.68 16.67 0 0 0 5 10.59 15.09 0 4 3.53 16.30 0 6 5.88 16.30 0 8 5.88 9.49 16.67 7 2.35 9.49 0 100.00 0 2 0 4.87 0 100 1 0 2.19 0 n 16.63 80.43 1.17 0.20 1.17 0.20 0.20 Keterangan: n = data keseluruhan. Putusan Persentase putusan tidak diterimanya pelamar dari tiap cluster berbanding terbalik dengan rataan nilai keseluruhan Tabel 8, dengan 0=tidak diterima, 1=diterima di IPB, A=diterima di Fakultas Pertanian, dan lain=diterima di fakultas selain Fakultas Pertanian. Kendati Cluster 6, Cluster 8, Cluster 7, Cluster 2, dan Cluster 1 memiliki rataan nilai keseluruhan di bawah rata-rata Tabel 4, cluster-cluster tersebut masih memiliki persentase diterima Tabel 8. Hal ini menunjukkan bahwa nilai pelamar bukan satu- satunya acuan dalam seleksi penerimaan mahasiswa baru. Tabel 8 Detail putusan masing-masing cluster diurut berdasarkan rataan nilai. Cluster ke- 1 A lain 3 5.76 23.59 20.19 9 3.67 13.27 9.62 5 9.22 12.04 21.15 4 10.23 13.76 13.46 6 12.32 14.25 13.46 8 10.37 8.60 9.62 7 16.57 8.11 8.65 2 18.95 4.67 1.92 1 12.90 1.72 1.92 n 73.09 21.43 5.78 Keterangan: n = data keseluruhan. Kategori Sekolah Asal Pelamar Dari keseluruhan data terlihat persentase dari pelamar dalam setiap kategori SMA tersebar merata dalam tiap-tiap cluster Tabel 9. Persentase pelamar dalam satu kategori SMA, semakin meningkat sebanding dengan rataan cluster Tabel 10. Hal ini menunjukkan bahwa peluang untuk diterima dari masing- masing kategori bergantung kepada nilai. Tabel 9 Persentase pelamar dari setiap cluster dalam satu kategori SMA Cluster ke- A+ A A- B+ B B- C+ C C- D 3 9.1 7.4 9.1 12.1 28.1 14.3 57.1 0.0 12.8 9 8.4 5.1 4.4 5.2 5.5 10.7 0 0.0 0.0 10.3 5 12.1 12.7 7.5 5.2 10.3 21.4 0 0.0 0.0 5.1 4 13.3 10.3 10.6 6.9 10.3 14.3 0 14.3 10.3 5.1 6 10.9 13.5 14.3 20.7 11.6 7.1 0 0.0 17.2 10.3 8 9.1 12.1 10.6 17.2 6.2 0.0 50 0.0 3.4 2.6 7 13.6 14.2 14.1 20.7 15.1 14.3 50 14.3 6.9 20.5 2 14.3 17.0 15.8 6.9 8.9 10.7 14.3 24.1 20.5 1 9.4 7.8 13.5 5.2 4.1 7.1 0 0.0 37.9 12.8 n 31.4 27.0 25.3 3.1 7.7 1.5 0.1 0.4 1.5 2.1 Keterangan: n = data keseluruhan. Tabel 10 Persentase pelamar yang diterima dari setiap cluster dalam satu kategori SMA Cluster ke- A+ A A- B+ B B- C+ C C- D 3 18.8315.44 27.4038.4651.22 16.67 0 100 0 41.67 9 13.4511.03 12.3315.3812.20 16.67 0 0 0 8.33 5 15.2514.71 13.70 0 9.76 25 0 0 0 0 4 14.3515.44 17.81 0 7.32 8.33 0 0 0 6 13.0017.65 12.3323.08 9.76 16.67 0 0 0 8.33 8 8.97 11.76 5.48 23.08 4.88 0.00 0 7 9.87 8.09 6.85 0 2.44 0.00 0 0 25.00 2 4.04 4.41 2.74 0 2.44 16.67 0 0 0 8.33 1 2.24 1.47 1.37 0 0 0 0 0 0 8.33 n 43.6426.61 14.29 2.54 8.02 2.35 0 0.20 0 2.35 Keterangan: n = data keseluruhan. Dalam sebuah cluster, semakin baik kategori sebuah SMA, maka persentase pelamar yang diterima semakin tinggi Tabel 11. Hal ini menunjukkan bahwa dari data terlihat kategori SMA berkontribusi terhadap diterimatidaknya pelamar. Tabel 11 Persentase pelamar yang diterima dari setiap kategori SMA dalam satu cluster Cluster ke- A+ A A- B+ B B- C+ C C- D 3 35.9017.9517.09 4.27 17.95 1.71 0 0.85 0 4.27 9 46.8823.4414.06 3.13 7.81 3.13 0 0 0 1.56 5 47.8928.1714.08 0 5.63 4.23 0 0 0 0 4 45.7130.0018.57 00 4.29 1.43 0 0 0 0.00 6 40.2833.3312.50 4.17 5.56 2.78 0 0 0 1.39 8 44.4435.56 8.89 6.67 4.44 0.00 0 0 0 0 7 52.3826.1911.90 0 2.38 0.00 0 0 0 7.14 2 42.8628.57 9.52 0 4.76 9.52 0 0 0 4.76 1 55.5622.2211.11 0 0 0 0 0 0 11.11 n 43.6426.6114.29 2.54 8.02 2.35 0 0.20 0 2.35 Keterangan: n = data keseluruhan.

5. KESIMPULAN DAN SARAN