Evaluasi Hasil Clustering Pengujian Perangkat Lunak dengan Menggunakan Dataset

nilai SI Global sebesar 0,828. Ketika k=13 nilai SI Global kembali naik sampai k=19 menjadi 0,881 dan ketika k=20 nilai SI Global mengalami penurunan dengan nilai 0,849. 2. Nilai maksimum SI Global ketika k =2 sampai k =20 adalah 0,881 pada k =19 yang menunjukkan bahwa pengelompokan yang dilakukan dengan menggunakan metode single linkage memiliki struktur pengelompokan yang kuat. Pada metode single linkage, untuk semua k selalu ditemukan cluster dengan jumlah anggota 1. Gambar 5. 11 Grafik Perhitungan Nilai Silhouette Coefficient Terhadap Jumlah Cluster SMA Jurusan IPA Pada Metode Complete linkage Dari Gambar 5.11 dapat dilihat bahwa : 1. Ketika k=2 nilai SI Global sebesar 0,543, ketika k=3 nilai SI Global turun menjadi 0,486 dan kemudian naik kembali menjadi 0,611 ketika k=4. Nilai SI Global mengalami penurunan kembali ketika k=5 dengan nilai 0,476 sampai k=10 dengan nilai 0,314 dan naik kembali ketika k=11 dengan nilai 0,382. Ketika k=12 nilai SI Global turun kembali sampai k=13 menjadi 0,342, ketika k=14 SI Global kembali naik dengan nilai 0,343, ketika k=15 nilai SI Global turun menjadi 0,319, dan naik kembali ketika k=16 dengan nilai SI Global 0,328. Nilai SI Global kembali mengalami penurunan ketika 0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 S I G lo b al Jumlah Cluster k Complete Linkage k=17 sampai dengan k=19 dan kemudian naik kembali ketika k=20 dengan nilai SI Global 0,316 2. Nilai maksimum SI Global ketika k =2 sampai k=20 adalah 0,611 pada k=4 yang menunjukkan bahwa pengelompokan yang dilakukan dengan menggunakan metode complete linkage memiliki struktur pengelompokan yang baik. Pada metode complete linkage, untuk semua k 3 selalu ditemukan cluster dengan jumlah anggota 1. Gambar 5. 12 Grafik Perhitungan Nilai Silhouette Coefficient Terhadap Jumlah Cluster SMA Jurusan IPA Pada Metode Average linkage Dari Gambar 5.12 dapat dilihat bahwa : 1. Ketika k=2 nilai SI Global sebesar 0,501, ketika k=3 nilai SI Global naik menjadi 0.638 dan kemudian mengalami penurunan ketika k=5 sampai k=6 menjadi 0,534. Ketika k=7 nilai SI Global kembali naik menjadi 0,601 dan turun kembali ketika k=585 dengan nilai 0,585 sampai k=9 dengan nilai 0,494. Nilai SI Global kembali naik ketika k=10 dengan nilai 0,542, kemudian turun kembali pada k=11 sampai k=12 dan naik kembali ketika k=13 dengan nilai SI Global 0542. Ketika k=14 sampai k=15 nilai SI Global mengalami penurunan kembali menjadi 0,467, ketika k=16 nilai SI Global kembali naik menjadi 0,540, dan ketika 0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 S I G lo b al Jumlah Cluster k Average Linkage k=17 sampai k=18 nilai SI Global kembali turun menjadi 0,509. Nilai SI Global kembali naik menjadi 0,528 ketika k=19 dan ketika k=20 kembali turun menjadi 0,515. 2. Nilai maksimum SI Global ketika k=2 sampai k=20 adalah 0,638 pada k =3 yang menunjukkan bahwa pengelompokan yang dilakukan dengan menggunakan metode average linkage memiliki struktur pengelompokan yang baik. Pada metode average linkage, untuk k2 selalu ditemukan cluster dengan jumlah anggota 1. Untuk semua metode baik single linkage, complete linkage, dan average linkage ketika k=4 cluster yang hanya beranggotakan 1 berisi data yang sama. Tabel 5. 6 Perhitungan Hasil Silhouette Coefficient SC Jurusan IPS Jumlah Cluster k SI Global Single Linkage Complete Linkage Average Linkage 2 0,534 0,501 0,598 3 0,644 0,527 0,554 4 0,695 0,459 0,475 5 0,754 0,415 0,476 6 0,763 0,430 0,543 7 0,790 0,445 0,536 8 0,732 0,415 0,481 9 0,695 0,474 0,454 10 0,791 0,421 0,435 11 0,765 0,386 0,414 12 0,785 0,366 0,451 13 0,794 0,339 0,480 14 0,804 0,317 0,449 15 0,816 0,301 0,420 16 0,826 0,295 0,450 17 0,837 0,287 0,442 18 0,844 0,284 0,424 19 0,851 0,278 0,414 20 0,857 0,265 0,402 21 0,846 0,264 0,387 22 0,853 0,261 0,384 23 0,858 0,254 0,381 24 0,864 0,248 0,404 25 0,869 0,251 0,428 26 0,848 0,245 0,414 27 0,854 0,236 0,409 28 0,856 0,265 0,410 29 0,843 0,264 0,412 30 0,827 0,257 0,429 31 0,832 0,247 0,466 32 0,837 0,248 0,456 33 0,824 0,246 0,448 34 0,823 0,268 0,445 35 0,828 0,269 0,460 36 0,814 0,269 0,496 37 0,814 0,269 0,509 38 0,803 0,293 0,503 39 0,808 0,291 0,499 40 0,812 0,313 0,492 41 0,812 0,317 0,491 42 0,803 0,309 0,491 43 0,804 0,316 0,504 44 0,796 0,332 0,501 45 0,802 0,361 0,511 46 0,806 0,366 0,540 47 0,790 0,367 0,535 48 0,792 0,365 0,544 49 0,779 0,396 0,553 50 0,771 0,391 0,544 51 0,761 0,404 0,554 52 0,765 0,400 0,550 53 0,757 0,412 0,543 54 0,761 0,439 0,541 55 0,749 0,447 0,537 56 0,753 0,445 0,544 57 0,758 0,443 0,548 58 0,761 0,435 0,542 59 0,765 0,445 0,549 60 0,761 0,440 0,544 61 0,765 0,449 0,538 62 0,758 0,472 0,547 63 0,760 0,468 0,553 64 0,756 0,465 0,572 65 0,750 0,471 0,580 66 0,754 0,479 0,587 67 0,755 0,486 0,593 68 0,760 0,488 0,597 69 0,773 0,486 0,596 70 0,777 0,493 0,589 71 0,768 0,491 0,594 72 0,779 0,499 0,611 73 0,777 0,508 0,608 74 0,766 0,517 0,604 75 0,770 0,523 0,599 76 0,782 0,530 0,614 77 0,777 0,536 0,615 78 0,772 0,552 0,611 79 0,769 0,569 0,617 80 0,763 0,569 0,631 81 0,765 0,566 0,635 82 0,768 0,566 0,639 83 0,761 0,580 0,643 84 0,754 0,586 0,642 85 0,750 0,592 0,647 86 0,746 0,599 0,661 87 0,749 0,613 0,667 88 0,742 0,626 0,670 89 0,744 0,619 0,674 90 0,748 0,624 0,668 91 0,759 0,619 0,671 92 0,754 0,624 0,674 93 0,765 0,637 0,679 94 0,767 0,640 0,682 95 0,762 0,644 0,685 96 0,764 0,647 0,697 97 0,774 0,659 0,694 98 0,776 0,650 0,697 99 0,787 0,673 0,700 100 0,797 0,658 0,702 101 0,800 0,662 0,704 102 0,801 0,666 0,714 103 0,811 0,677 0,722 104 0,805 0,679 0,731 105 0,808 0,682 0,733 106 0,811 0,684 0,734 107 0,806 0,694 0,728 108 0,808 0,702 0,732 109 0,817 0,711 0,734 110 0,819 0,720 0,737 111 0,828 0,722 0,747 112 0,837 0,725 0,756 113 0,835 0,730 0,759 114 0,836 0,739 0,768 115 0,844 0,748 0,777 116 0,852 0,759 0,786 117 0,860 0,767 0,795 118 0,861 0,775 0,796 119 0,863 0,784 0,805 120 0,859 0,793 0,814 121 0,866 0,801 0,822 122 0,867 0,810 0,829 123 0,873 0,818 0,837 124 0,876 0,826 0,845 125 0,875 0,833 0,852 126 0,883 0,841 0,853 127 0,883 0,848 0,855 128 0,885 0,856 0,862 129 0,885 0,863 0,863 130 0,892 0,862 0,870 131 0,898 0,864 0,869 132 0,905 0,871 0,875 133 0,903 0,877 0,877 134 0,910 0,883 0,883 135 0,915 0,890 0,890 136 0,921 0,897 0,897 137 0,921 0,902 0,902 138 0,927 0,909 0,909 139 0,928 0,915 0,915 140 0,930 0,916 0,921 141 0,930 0,921 0,926 142 0,936 0,926 0,931 143 0,941 0,931 0,931 144 0,941 0,931 0,937 145 0,947 0,936 0,942 146 0,961 0,942 0,948 147 0,953 0,948 0,953 148 0,958 0,953 0,958 149 0,963 0,958 0,958 150 0,967 0,962 0,962 151 0,972 0,967 0,967 152 0,972 0,972 0,972 153 0,976 0,976 0,976 154 0,981 0,981 0,981 155 0,985 0,985 0,985 156 0,988 0,988 0,988 157 0,992 0,992 0,992 158 0,996 0,996 0,996 SC Silhouette Coefficient 0,996 0,996 0,996 Berdasarkan pengujian dataset rata-rata nilai Ujian Nasional SMA jurusan IPS dengan menggunakan metode single linkage, complete linkage, dan average linkage yang dapat dilihat pada Tabel 5.6 didapatkan nilai maksimum dari pengujian k=2 sampai dengan k=158 yaitu 0,996 yang disebut dengan Silhouette Coefficient SC. Nilai SC sebesar 0,996 berada pada interval 0,71 – 1,00 yang berarti hasil pengelompokan memiliki struktur yang kuat. Pada Tabel 5.6 dapat dilihat SI Global bernilai 0,996 ketika cluster berjumlah 158. Pengelompokan dengan membagi dataset menjadi 158 kelompok tidak perlu dilakukan karena tidak ada manfaatnya jika membagi ke dalam 158 kelompok. Menurut peraturan Mentri Pendidikan dan Kebudayaan no.143 tahun 2014 tentang petunjuk teknis pelaksanaan jabatan fungsional pengawas sekolah dan angka kreditnya, setiap pengawas pendidikan tingkat SMA mengawasi minimal 7 sekolah berarti jumlah cluster yang rasional untuk 140 sekolah berkisar antara 2 sampai 20 cluster. Oleh karena itu dalam analisis selanjutnya difokuskan pada nilai k antara 2 sampai 23. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Gambar 5. 13 Grafik Perhitungan Nilai Silhouette Coefficient Terhadap Jumlah Cluster SMA Jurusan IPS Pada Metode Single linkage Dari Gambar 5.13 dapat dilihat bahwa : 1. Nlai SI Global perlahan naik ketika k=2 dengan nilai 0,534 sampai k=7 dengan nilai 0,790 dan ketika k=8 nilai SI Global kembali turun sampai k=9 menjadi 0,695. Ketika k=10 nilai SI Global naik menjadi 0,791 dan ketika k=11 kembali turun menjadi 0,765. Nilai SI Global ketika k=12 dengan nilai 0,785 perlahan naik sampai k=20 dengan nilai 0,857 kemudian turun kembali ketika k=21 dengan nilai 0,846. Ketika k=23 nilai SI Global kembali naik dengan nilai 0,858. 2. Nilai maksimum SI Global ketika k =2 sampai k =23 adalah 0,858 ketika k =23 yang menunjukkan bahwa pengelompokan yang dilakukan dengan menggunakan metode single linkage memiliki struktur pengelompokan yang kuat. Pada metode single linkage, untuk semua k ditemukan cluster dengan jumlah anggota 1. 0,000 0,200 0,400 0,600 0,800 1,000 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 S I G lo b al Jumlah Cluster k Single Linkage Gambar 5. 14 Grafik Perhitungan Nilai Silhouette Coefficient Terhadap Jumlah Cluster SMA Jurusan IPS Pada Metode Complete linkage Dari Gambar 5.14 dapat dilihat bahwa : 1. Ketika k=2 nilai SI Global = 0,501 dan terus bertambah sampai 0,527 ketika k=3, kemudian turun ketika k=4 sampai k=5 menjadi 0,415. Nilai SI Global menjadi naik ketika k=6 sampai k=7 menjadi 0,445, kemudian turun kembali menjadi 0,415 ketika k=8 dan naik kembali ketika k=9 dengan nilai 0,474. Nilai SI Global perlahan menurun ketika k=10 dengan nilai 0,421 sampai k=23 dengan nilai 0,254. 2. Nilai maksimum SI Global ketika k =2 sampai k=23 adalah 0,527 ketika k=3 yang menunjukkan bahwa pengelompokan yang dilakukan dengan menggunakan metode complete linkage memiliki struktur pengelompokan yang baik. Pada metode complete linkage, untuk semua k 8 selalu ditemukan cluster dengan jumlah anggota 1. 0,000 0,100 0,200 0,300 0,400 0,500 0,600 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 S I G lo b al Jumlah Cluster k Complete Linkage Gambar 5. 15 Grafik Perhitungan Nilai Silhouette Coefficient Terhadap Jumlah Cluster SMA Jurusan IPS Pada Metode Average linkage Dari Gambar 5.15 dapat dilihat bahwa : 1. Nilai SI Global ketika k=2 dengan nilai 0,598 perlahan menurun sampai k=4 dengan nilai 0,475 dan kembali naik ketika k=5 dengan nilai 0,476 sampai k=6 dengan nilai 0,430. Ketika k=7 nilai SI Global kembali menurun sampai k=11 menjadi 0,414 kemudian naik kembali ketika k=12 sampai k=13 menjadi 0,480. Nilai SI Global kembali menurun ketika k=14 sampai k=15 menjadi 0,420, kemudian naik kembali ketika k=16 dengan nilai SI Global 0,450. Nilai SI Global perlahan menurun ketika k=17 dengan nilai 0,442 sampai k=23 dengan nilai 0,381. 2. Nilai maksimum SI Global ketika k =2 sampai k=23 adalah 0,598 ketika k =2 yang menunjukkan bahwa pengelompokan yang dilakukan dengan menggunakan metode average linkage memiliki struktur pengelompokan yang baik. Pada metode average linkage, untuk k5 selalu ditemukan cluster dengan jumlah anggota 1. Untuk semua metode baik single linkage, complete linkage, dan average linkage ketika k=9 cluster yang hanya beranggotakan 1 berisi data yang sama. 0,000 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 S I G lo b al Jumlah Cluster k Average Linkage

5.3 KELEBIHAN DAN KEKURANGAN PERANGKAT LUNAK

5.3.1 Kelebihan Perangkat Lunak

Kelebihan yang dimiliki oleh perangkat lunak pengelompokan menggunakan Agglomerative Hierarchical Clustering AHC ini adalah : 1. Sistem dapat menerima masukan file bertipe .xls. 2. Sistem dapat menerima masukan dengan jumlah kolom yang dinamis. 3. Sistem dapat meyeleksi atribut sehingga pengguna tidak perlu menghapus kolom secara manual. 4. Sistem menyediakan isian jumlah cluster yang ingin diperoleh. 5. Sistem dapat menampilkan hasil pengelompokan yang mudah dipahami oleh pengguna. 6. Sistem dapat menampilkan nilai Silhouette Index pada setiap kelompok hasil pengelompokan. 7. Sistem dapat menampilkan waktu lama proses pengelompokan data. 8. Sistem dapat menyimpan hasil pengelompokan data dengan hasil penyimpanan data berupa file bertipe .xls.

5.3.2 Kekurangan Perangkat Lunak

Kekurangan yang dimiliki oleh perangkat lunak pengelompokan menggunakan Agglomerative Hierarchical Clustering AHC ini adalah : 1. File masukan yang dapat diterima oleh sistem hanya sebatas file bertipe .xls. 2. Ketentuan seleksi atribut diharuskan baris pertama adalah nama sekolah. 3. Sistem hanya dapat melakukan seleksi kolom, tidak dapat melakukan seleksi baris. 4. Sistem hanya dapat menyimpan hasil pengelompokan data berupa file bertipe .xls. 54

BAB VI PENUTUP

6.1 SIMPULAN

Hasil penelitian pengelompokan Sekolah Menengah Atas di Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan Agglomerative Hierarchical Clustering ini menghasilkan kesimpulan sebagai berikut : 1. Agglomerative Hierarchical Clustering AHC dapat diterapkan untuk mengelompokkan Sekolah Menengah Atas di Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional tahun 2015. 2. Berdasarkan peraturan Mentri Pendidikan dan Kebudayaan no.143 tahun 2014 tentang petunjuk teknis pelaksanaan jabatan fungsional pengawas sekolah dan angka kreditnya, maka dengan menggunakan asumsi k yang relevan untuk data set ini berkisar antara 2 sampai 20, maka disimpulkan : a. Pengelompokan dengan menggunakan metode single linkage untuk jurusan IPA memiliki nilai SC sebesar 0,881 pada k=19 dan untuk jurusan IPS memiliki nilai SC sebesar 0,858 pada k=3. b. Pengelompokan dengan menggunakan metode complete linkage untuk jurusan IPA memiliki nilai SC sebesar 0,611 pada k=4 dan untuk jurusan IPS memiliki nilai SC sebesar 0,527 pada k=3. c. Pengelompokan dengan menggunakan metode average linkage untuk jurusan IPA memiliki nilai SC sebesar 0,638 pada k=3 dan untuk jurusan IPS memiliki nilai SC sebesar 0,598 pada k=2. 3. Berdasarkan peraturan Mentri Pendidikan dan Kebudayaan no.143 tahun 2014 tentang petunjuk teknis pelaksanaan jabatan fungsional pengawas sekolah dan angka kreditnya di mana satu pengawas sekolah mengawasi minimal 7 sekolah, maka disimpulkan : a. Pengelompokan dengan menggunakan metode single linkage kurang sesuai digunakan untuk menentukan jumlah pengawas sekolah dikarenakan dalam hasil pengelompokan dengan metode single linkage selalu ada kelompok yang hanya memiliki satu anggota. b. Dengan menggunakan metode complete linkage, jumlah k yang dapat digunakan untuk menentukan jumlah pengawas sekolah untuk jurusan IPA yaitu ketika k=2 dan k=3. Sedangkan untuk jurusan IPS ketika k=2, k=3, k=4, k=5, dan k=6. c. Dengan menggunakan metode average linkage, jumlah k yang dapat digunakan untuk menentukan jumlah pengawas sekolah untuk jurusan IPA yaitu ketika k=2. Sedangkan untuk jurusan IPS ketika k=2, k=3, dan k=4. 4. Berdasarkan hasil evaluasi set data, pengelompokan dengan menggunakan metode single linkage memiliki struktur pengelompokan yang kuat sedangkan untuk metode complete linkage dan average linkage memiliki struktur pengelompokan yang baik 5. Pada metode single linkage selalu ditemukan cluster dengan jumlah anggota 1 sehingga nilai SI Global menjadi cenderung tinggi.

6.2 SARAN

Penelitian pengelompokan Sekolah Menengah Atas di Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan Agglomerative Hierarchical Clustering ini memberikan saran untuk pengembangan penelitian di masa mendatang, yaitu: 1. Perangkat lunak dapat menerima masukan data dari file bertipe selain .xls. 2. Perangkat lunak dapat menyimpan hasil pengelompokan data ke dalam file bertipe selain .xls. 3. Perangkat lunak dapat melakukan seleksi baris. 4. Perangkat lunak dapat menampilkan hasil pengelompokan data ke dalam tampilan yang lebih menarik misanya grafik atau tabel. 5. Penelitian menggunakan dataset yang berbeda. Misalnya dataset Ujian Nasional pada tahun yang berbeda atau dataset mata pelajaran yang sama untuk tahun yang berbeda. 6. Penelitian kasus selain pembagian pengawas sekolah untuk pembinaan sekolah PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 56 DAFTAR PUSTAKA Han, Jiawei, Kamber, M., 2006. Data Mning Concepts and Techniques Second Edition. Elsevier:USA. Han, Jiawei, Kamber, M., 2012. Data Mning Concepts and Techniques 3rd Edition. Elsevier:USA. Hermawati, Fajar Astuti.2013. Data Mining. Andi. Yogyakarta. Kartowagiran, Badrun.2008.Validasi dimensionalitas perngkat tes ujian akhir nasional SMP mata elajaran matematika 2003-2006.Yogyakarta Kaufman, Leonard, Rousseeuw, Peter J. 1990.Finding Groups in Data.John Willey Sons, Inc.Kanada Prasetyo, Eko.2014. Data Mining Mengolah Data Menjadi Informasi Menggunakan Matlab.Andi.Yogyakarta. Santosa, Budi.2007. DATA MINING : Teknik Pemanfaatan Data untuk Keperluan Bisnis. Graha Ilmu. Yogyakarta. Anonim.2014.Peraturan Menteri Pendidikan dan Kebudayaan Nomor 143 Tahun 2014.Jakarta Anonim.2014.Lampiran Peraturan Menteri Pendidikan dan Kebudayaan Nomor 143 Tahun 2014.Jakarta LAMPIRAN LAMPIRAN 1 NARASI USE CASE 1. Narasi Use Case Input Berkas .xls Input Berkas .xls Nama Use Case Input berkas .xls ID Use Case 001 Aktor User Deskripsi Use case ini merupakan proses memasukan data file bertipe .xls Kondisi Awal User Telah masuk ke sistem dan berada pada halaman AHC Kondisi Akhir Data yang terpilih tampil dalam tabel data pada halaman AHC Typical Course Aksi Aktor Reaksi Sistem Langkah 1 : Menekan tombol bergambar folder untuk memilih file berekstensi .xls Langkah 2 : Menampilkan kotak dialog untuk pemilihan file yang berada di salah satu direktori komputer. Langkah 3 : Memilih file yang akan dikelompokan datanya Langkah 4 : Menampilkan data dari file yang terpilih ke dalam tabel data yang ada pada halaman AHC 2. Narasi Use Case Seleksi Atribut Seleksi Atribut Nama Use Case Seleksi Atribut ID Use Case 002 Aktor User Deskripsi Use case ini merupakan proses pemilihan atribut dari data terpilih yang akan digunakan untuk proses clustering data Kondisi Awal Data dari file terpilih sudah tampil dalam tabel data pada halaman AHC Kondisi Akhir Pemilihan data dan seleksi atribut yang akan dikelompokan selesai. Typical Course Aksi Aktor Reaksi Sistem