pelajaran seminaris jurusan IPS di jurusan IPA. Hal ini dilakukan setara dengan penanganan kesalahan data. Pada tahap ini juga dimungkinkan untuk dilakukan
normalisasi. Normalisasi yang digunakan adalah Z-Score. 4.
Data reduction Pada tahap ini, data masuk pada tahap reduksi dimensionalitas
dimensionality reduction. Metode reduksi dimensionalitas data bekerja dengan cara tertentu untuk menangkap karakteristik data dengan memetakan data dari
dimensi awal ke dimensi yang baru yang relatif lebih kecil. Proses ini menghasilkan komponen utama principal compnent yang kemudian dapat dijadikan fitur yang
baru yang mempunyai pengaruh yang besar pada data. fitur yang berpengaruh kecil atau bahkan tidak berpengaruh dapat dibuang. Untuk proses yang demikian dalam
tulisan ini digunakan metode reduksi Principal Component Analysis PCA seperti yang telah diterangkan dan diberi contoh hasil pada bab II Landasan Teori di atas.
4.1.1.2 Clustering dan Akurasi
Pengelompokkan data yang didasarkan hanya pada informasi yang ditemukan dalam data obyek yang menggambarkan data tersebut dan hubungan
di antaranya disebut analisis kelompok clustering analysis
38
. Hal ini dilakukan supaya data yang berhubungan dalam sebuah kelompok merupakan obyek yang
mirip atau memiliki hubungan satu dengan yang lain atau dengan kata lain memiliki similaritas yang tinggi. Ini juga berarti obyek dalam satu kelompok tersebut berbeda
atau tidak berhubungan dengan kelompok yang lain pula. Untuk mengetahui sejauh
38
Eko Prasetyo, “… Konsep Dan Aplikasi …”, op. cit. hal. 173.
mana pengelompokan yang dilakukan adalah baik dapat dilakukan uji akurasi dari setiap proses pembentukan kelompok dengan internal evaluation.
Di dalam tulisan ini, pengelompokan digunakan dengan agglomerative hierarchical clustering AHC. Setelah data melalui tahap preprocessing
selanjutnya data diproses dengan menggunakan AHC. Data para seminaris sejumlah 137 dengan fitur 186 yang digunakan diproses dengan menggunakan
AHC sehingga terbentuk kelompok-kelompok. Setiap proses pembentukan kelompok tersebut diuji dengan menggunakan sum of squares error SSE. Proses
ini dilakukan dengan menggunakan sistem yang telah dibuat. Sistem yang dibentuk dapat melakukan proses AHC dalam tiga metode,
yaitu single linkage, average linkage, dan complete linkage, dengan setiap metodenya menggunakan perhitungan jarak euclidean. Hasil setiap perhitungan
ditampilkan dalam tabel, dendrogram, dan visualisasi pengelompokan supaya secara visual tergambar pengelompokan obyek dan jarak antar kelompoknya.
Sejalan dengan proses AHC tersebut, SSE dihitung. Hasil perhitungan SSE setiap pembentukan kelompok, baik itu dengan metode single linkage, average
linkage, maupun complete linkage ditampilkan dalam bentuk grafik dengan masing-masing nilai SSE-nya. Berdasarkan grafik yang dihasilkan dapat dilihat
nilai SSE dari masing-masing pembentukan kelompok. Pembentukan kelompok yang memiliki nilai SSE rendah dapat dikatakan bahwa pengelompokan tersebut
similaritas yang tinggi. Dengan kata lain, nilai SSE dari grafik yang dapat diambil adalah nilai ekstrim minimum dari kurva parabola pertama. Berikut ini adalah
contoh hasil dari proses tersebut.
1. Single Linkage
Gambar 4.1 Implementasi – Grafik SSE single linkage
Proses pembentukan kelompok dengan menggunakan metode single linkage menunjukkan bahwa SSE terendah bernilai 50. SSE terendah ini didapat
pada percobaan kedua menggunakan normalisasi dengan jumlah clustering 3. Dendrogram single linkage terendah ini adalah seperti tampak pada gambar 4.2.
Gambar 4.2 Implementasi – Dendrogram single linkage nilai SSE terkecil
2. Average Linkage
Gambar 4.3 Implementasi – Grafik SSE average linkage
Dari gambar 4.3 dapat dilihat bahwa percobaan 8 dan 9 dengan menggunakan normalisasi memberikan nilai SSE terendah yang sama, yaitu 125.
Pada percobaan ini kelompok yang terbentuk berjumlah 9 dan 10. Apabila dibutuhkan kelompok yang lebih sedikit dari 9, percobaan ketiga dengan
normalisasi untuk pembentukan 4 kelompok dengan nilai SSE 130 dapat menjadi pilihan. Dendrogram average linkage pembentukan 4 kelompok adalah seperti
tampak pada gambar 4.4 .
Gambar 4.4 Implementasi – Dendrogram average linkage dengan 4 kelompok
3. Complete Linkage
Gambar 4.5 Implementasi – Grafik SSE complete linkage
Pembentuk kelompok dengan menggunakan metode complete linkage memberikan hasil seperti tampak pada gambar 4.5. Dari grafik tersebut dapat dilihat
bahwa nilai SSE terendah di dapat dalam pembentukan kelompok berjumlah 5 dan
6. Masing-masing nilai SSE tersebut sama, yaitu 149. Adapun dendrogram dari nilai SSE terendah dalam metode complete linkage seperti yang tampak pada
gambar di bawah ini.
Gambar 4.6 Implementasi – Dendrogram complete linkage dengan 5 kelompok
Gambar 4.7 Implementasi – Dendrogram complete linkage dengan 6 kelompok
4.1.2 User Interface