54
5.2.2 Pengujian Perbandingan Hasil Hitung Manual dengan Hasil
Perangkat Lunak
Data uji yang dilakukan secara manual dan sistem yaitu dengan banyak data sejumlah 29 atribut dan 20 data. Data uji yang digunakan dicuplik dari data nilai daya
serap Ujian Nasional Matematika SMA jurusan IPA di DIY tahun ajaran 20142015. Contoh input data yang digunakan sebagai data uji ditunjukkan pada lampiran 4.
5.2.2.1 Perhitungan Manual
Pengujian perhitungan manual menggunakan dataset daya serap Ujian Nasional SMA mata pelajaran Matematika jurusan IPA di DIY tahun 20142015
sejumlah 29 atribut dan 20 data. Proses perhitungan manual dilakukan dengan menggunakan aplikasi Microsoft Excel dengan hasil pengelompokkan 3 kolompok.
Proses perhitungan manual beserta dengan hasilnya dapat dilihat pada lampiran 5.
5.2.2.2 Perhitungan Perangkat Lunak
Pengujian perhitungan perangkat lunak menggunakan data yang sama dengan perhitungan manual yaitu menggunakan dataset daya serap Ujian Nasional SMA mata
pelajaran Matematika jurusan IPA di DIY tahun 20142015 sejumlah 29 atribut dan 20 data. Hasil perhitungan perangkat lunak dapat dilihat pada gambar 5.9 berikut.
55
Gambar 5.10 Hasil Penambangan Data Menggunakan Perangkat Lunak 5.2.2.3
Evaluasi Pengujian Perbandingan Hitung Manual dengan Hasil Perangkat Lunak
Setelah dilakukan pengujian pada perhitungan secara manual dibandingkan dengan sistem didapatkan hasil perbandingan implementasi algoritma k-medoids
seperti ditunjukkan pada tabel 5.3 dan tabel 5.4 sebagai berikut. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
Tabel 5.3 Uji Perbandingan Algoritma K-Medoids Secara Manual dan Sistem
No Uji Ms. Excel
Sistem 1
Jumlah data 20
20 2
Jumlah atribut 29
29 3
Jumlah anggota
Cluster
1 9
9 4
Jumlah anggota
Cluster
2 3
3 5
Jumlah anggota
Cluster
3 8
8
Tabel 5.4 Hasil Uji Perbandingan Anggota Cluster Secara Manual dan Sistem
Manual Sistem
Cluster
1
SMA NEGERI 4 YOGYAKARTA SMA NEGERI 6 YOGYAKARTA
SMA NEGERI 9 YOGYAKARTA SMA NEGERI 11 YOGYAKARTA
SMA STELLA DUCE 1 YOGYAKARTA SMA BOPKRI 1 YOGYAKARTA
SMA MUHAMMADIYAH 1 YOGYAKARTA SMA NEGERI 2 YOGYAKARTA
SMA NEGERI 7 YOGYAKARTA SMA NEGERI 4 YOGYAKARTA
SMA NEGERI 6 YOGYAKARTA SMA NEGERI 9 YOGYAKARTA
SMA NEGERI 11 YOGYAKARTA SMA STELLA DUCE 1 YOGYAKARTA
SMA BOPKRI 1 YOGYAKARTA SMA MUHAMMADIYAH 1 YOGYAKARTA
SMA NEGERI 2 YOGYAKARTA SMA NEGERI 7 YOGYAKARTA
Cluster
2
SMA NEGERI 3 YOGYAKARTA SMA NEGERI 1 YOGYAKARTA
SMA NEGERI 10 YOGYAKARTA SMA NEGERI 3 YOGYAKARTA
SMA NEGERI 1 YOGYAKARTA SMA NEGERI 10 YOGYAKARTA
Cluster
3
SMA BOPKRI 2 YOGYAKARTA SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA SMA MUHAMMADIYAH 6 YOGYAKARTA
SMA BOPKRI 2 YOGYAKARTA SMA BUDYA WACANA YOGYAKARTA
SMA BHINNEKA TUNGGAL IKA YOGYAKARTA
SMA TAMAN MADYA JETIS YOGYAKARTA
SMA BUDI LUHUR YOGYAKARTA SMA MUHAMMADIYAH 3 YOGYAKARTA
SMA MUHAMMADIYAH 7 YOGYAKARTA SMA MUHAMMADIYAH 6 YOGYAKARTA
57 Kesimpulan hasil perbandingan algoritma k-medoids secara manual dan
dengan sistem yaitu bahwa sistem telah dapat mengimplementasikan algoritma k- medoids dengan baik dengan menghasilkan jumlah dan data anggota
cluster
yang sama dengan pehitungan secara manual.
5.2.2.4 Pengujian Perangkat Lunak Dengan Menggunakan Dataset
Perangkat lunak yang telah dibuat diuji menggunakan
dataset
. Dataset yang digunakan pada pengujian perangkat lunak adalah daaset nilai daya serap ujian nasional
mata pelajaran matematika SMA jurusan IPA di Provinsi DIY tahun ajaran 20142015. Atribut yang digunakan dalam pengujian perangkat lunak menggunakan semua atribut
29 atribut, dan pengujian dilakukan dengan mengelompokkan sampai n2 data. Dalam dataset nilai daya serap ujian nasional mata pelajaran matematika SMA
jurusan IPA di Provinsi DIY tahun ajaran 20142015 terdapat 137 baris data dan 29 atribut kompetensi. Hasil pengelompokan dan hasil
Silhouette Index
Global tiap
cluster
dapat dilihat pada lampiran 6.
5.2.2.5 Evaluasi Hasil Clustering
Dari hasil pengujian
dataset
yang telah dilakukan, selanjutnya adalah mengevaluasi hasil pengelompokan. Evaluasi
clustering
yang digunakan oleh peneliti adalah menggunakan
Silhouette Coefficient
SC. Berdasarkan pengujian yang telah dilakukan terhadap
dataset
nilai daya serap Ujian Nasional mata pelajaran matematika di provinsi DIY tahun ajaran 20142015, didapatkan hasil SI Global dari tiap
cluster
seperti pada Tabel 5.5 berikut.
Tabel 5.5 Hasil Perhitungan
Silhouette Coefficient
SC
Jumlah
Cluster
k SI Global
Jumlah
Cluster
k SI Global
2 0.4361
5 0.2994
3 0.2134
6 0.2629
4 0.1893
7 0.2246
58 8
0.3294 40
0.4460 9
0.2187 41
0.3289 10
0.279 42
0.3617 11
0.2483 43
0.3616 12
0.3007 44
0.37 13
0.2178 45
0.456 14
0.1796 46
0.4585 15
0.1827 47
0.4657 16
0.1762 48
0.4364 17
0.3210 49
0.3811 18
0.2459 50
0.4638 19
0.2829 51
0.5148 20
0.3004 52
0.4317 21
0.2743 53
0.4234 22
0.2884 54
0.3427 23
0.2063 55
0.4616 24
0.1806 56
0.4169 25
0.3359 57
0.4615 26
0.4593 58
0.4701 27
0.3076 59
0.5019 28
0.2570 60
0.4235 29
0.1836 61
0.5056 30
0.3546 62
0.51 31
0.2933 63
0.5454 32
0.2752 64
0.4772 33
0.3142 65
0.5167 34
0.2671 66
0.5031 35
0.2459 67
0.5118 36
0.4505 68
0.5379 37
0.3813 SC
0.5454
38 0.3839
39 0.3148
59
Gambar 5.11 Grafik Perhitungan Nilai
Silhouette Index
Berdasarkan hasil pengujian
dataset
nilai daya serap Ujian Nasional SMA mata pelajaran matematika tahun ajaran 20142015 yang terlihat pada Tabel 5.5 didapatkan
hasil sebagai berikut : 1.
Nilai untuk
Silhouette Coefficient
nilai maksimum dari
Silhouette Index
dari pengujian jumlah
cluster
k=2 hingga jumlah
cluster
k=68 sebesar 0.5454. Nilai
Silhouette Coefficient
SC sebesar 0.5454 berada pada interval 0.51
– 0.70 yang menurut interpretasi Kauffman dan Rousseeuw 1990 nilai SC tersebut dikatakan memiliki struktur yang baik. Pada Tabel
5.5 dapat dilihat bahwa SI Global bernilai 0.5454 terdapat pada jumlah
cluster
k = 63. Menurut peraturan Menteri Pendidikan dan Kebudayaan no.143 tahun 2014 tentang petunjuk teknik pelaksanaan jabatan fungsional
pengawas sekolah dan angka kreditnya, setiap pengawas pendidikan tingkat SMA mengawasi minimal 7 sekolah berarti jumlah
cluster
yang relevan untuk 138 sekolah berkisar antara 2 hingga 19
cluster.
2. Berdasarkan Tabel 5.5 dan Gambar 5.11 dapat dilihat hasil
Silhouette Index
Global ketika diberi jumlah
cluster
k=2 hasil
Silhouette Index
Global yang didapatkan sebesar 0.4361 dan ketika diberikan jumlah
cluster
k yang
0.1 0.2
0.3 0.4
0.5 0.6
10 20
30 40
50 60
70 80
S I
G lo
b al
Jumlah Cluster
SI Global
60 semakin besar maka hasil
Silhouette Index
Global yang didapatkan beragam namun cenderung lebih kecil dibandingkan jumlah
cluster
k yang diberikan sebelumnya. Nilai
Silhouette Index
Global terlihat besar kembali ketika jumlah
cluster
k yang diberikan 26 sebesar 0.4593, namun ketika nilai dari jumlah
cluster
k ditambah kembali hasil
Silhouette Index
Global yang didapatkan beragam kembali. Ketika jumlah
cluster
k yang diberikan k=57 nilai
Silhouette Index
Global cenderung lebih besar dibandingkan jumlah
cluster
k yang diberikan sebelumnya. Nilai
Silhouette Index
Global terkecil terdapat pada jumlah
cluster
k=16 yaitu sebesar 0.1762. Berdasarkan hal tersebut nilai
Silhouette Index
Global tertinggi dan yang paling relevan adalah ketika jumlah
cluster
k=2 dengan nilai 0.4361 yang menurut interpretasi Kauffman dan Rousseeuw 1990
nilai tersebut dikatagorikan dalam struktur lemah.
Selain pengelompokan dengan menggunakan
dataset
dengan 29 kompetensi, juga dilakukan pengelompokan menggunakan nilai rata-rata dari 29 kompetensi tiap
sekolah. Proses pengelompokan ulang dibagi menjadi 3
cluster
untuk mendapatkan kelompok sekolah sesuai dengan kriteria dalam akreditasi SMA. Tabel 5.6 merupakan
tabel hasil proses perhitungan standar deviasi. Standar deviasi digunakan untuk melihat keberagaman anggota dari tiap
cluster
. Jika nilai standar deviasi yang didapatkan tinggi maka anggota dari
cluster
tersebut memiliki tingkat keberagaman nilai yang tinggi. Tetapi, jika nilai standar deviasi yang didapatkan rendah maka anggota dari
cluster
tersebut memiliki tingkat keberagaman nilai yang rendah. Dari perhitungan standar deviasi tersebut di dapatkan pula nilai tertinggi dan nilai terendah dari setiap
cluster
. Hasil pengelompokan ulang beserta anggota tiap
cluster
dan hasil perhitungan standar deviasi tiap
cluster
dapat dilihat pada lampiran 7. Nilai
Silhouette Index
Global dari pengelompokan menggunakan nilai rata-rata dari 29 kompetensi tiap sekolah yang dikelompokan menjadi 3
cluster
adalah 0.2724. Nilai tersebut lebih tinggi dibandingkan dengan nilai
Silhouette Index
Global dari PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
61 pengelompokan menggunakan nilai dari 29 kompetensi yang dikelompokan menjadi 3
cluster
, yaitu sebesar 0.2134.
Tabel 5.6 Hasil Standar Deviasi Tiap
Cluster
No Nilai
Cluster
1
Cluster
2
Cluster
3 1
Jumlah anggota
cluster
66 40
31 2
Nilai maksimal
cluster
35.72 88.87
46.15 3
Nilai minimal
cluster
18.10 46.98
36.13 4
Nilai rata-rata
cluster
29.03 59.93
40.44 5
Standar deviasi
cluster
4.5684 9.5281
3.3144
Dari tabel 5.6 dapat dilihat bahwa
cluster
2 memiliki standar deviasi yang tertinggi diantara
cluster
yang lainnya. Hal ini dapat dikatakan bahwa
cluster
2 memiliki variasi nilai yang beragam.
Cluster
3 memiliki standar deviasi yang terendah diantara
cluster
yang lainnya. Hal ini dapat dikatakan bahwa
cluster
3 merupakan memiliki variasi nilai yang cenderung samatidak beragam.
Cluster
1 memiliki standar deviasi yang sedang diantara
cluster
yang lainnya. Sekolah yang memiliki rata-rata tertinggi pada
cluster
2 adalah SMA MUHAMMADIYAH 1 PRAMBANAN dengan nilai rata-rata 88.87. Pada
cluster
3 sekolah yang memiliki rata-rata tertinggi adalah SMA 1 SEMIN dengan nilai rata-rata
46.15. Pada
cluster
1 sekolah yang memiliki rata-rata tertinggi SMA NEGERI 1 MINGGIR adalah dengan nilai rata-rata 35.72.
Sekolah yang memiliki rata-rata terendah pada
cluster
2 adalah SMA MUHAMMADIYAH BANTUL dengan nilai rata-rata 46.98. Pada
cluster
3 sekolah yang memiliki rata-rata terendah adalah SMA 1 TURI dengan nilai rata-rata 36.16.
Pada
cluster
1 sekolah yang memiliki rata-rata terendah SMA MANDALA BHAKTI adalah dengan nilai rata-rata 18.10.
Ketiga sekolah yang memiliki nilai rata-rata tertinggi dapat menjadi contoh untuk sekolah lainnya dalam tiap kelompoknya. Ketiga sekolah yang memiliki nilai
62 rata-rata terendah dapat menjadikan sekolah yang memiliki nilai rata-rata tertinggi
menjadi contoh agar dapat meningkat nilai rata-rata sekolanya. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
63
BAB VI PENUTUP
6.1 Kesimpulan
Hasil penelitian Impementasi Algoritma
Partitioning Around Medoids
PAM untuk pengelompokan Sekolah Menengah Atas di Daerah Istimewa Yogyakarta
berdasarkan nilai daya serap Ujian Nasional mata pelajaran matematika menghasilkan kesimpulan sebagai berikut :
1. Implementasi algoritma
Partitioning Around Medoids
PAM untuk mengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya
serap Ujian Nasional mata pelajaran matematika telah berhasil dibangun dan dapat digunakan untuk pengelompokan Sekolah Menengah Atas di DIY.
2. Metode
Clustering
dengan algoritma
Partitioning Around Medoids
PAM terbukti dapat digunakan untuk mengelompokan data sekolah berdasarkan
Nilai Daya Serap Ujian Nasional Jurusan IPA Mata Pelajaran Matematika tahun ajaran 20142015 di DIY.
3. Berdasarkan hasil evaluasi dari pengelompokkan nilai daya serap Ujian
Nasional mata pelajaran matematika tahun ajaran 20142015 dengan nilai jumlah
cluster
k=2 sampai dengan jumlah
cluster
k=12n, dapat disimpulkan bahwa :
Tidak terdapat nilai
Silhouette Index
Global yang bernilai negatif, berarti data yang terdapat dalam
cluster
telah tepat berada didalam
cluster
masing-masing.
Nilai
Silhouette Index
Global yang didapatkan bernilai antara 0.1762 yang terdapat pada jumlah
cluster
k=16 hingga 0.5454 yang terdapat pada jumlah
cluster
k=63.
Nilai
Silhouette Index
Global ketika diberi jumlah
cluster
k=2 hasil
Silhouette Index
Global yang didapatkan sebesar 0.4361 dan ketika PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
64 diberikan jumlah
cluster
k yang semakin besar maka hasil
Silhouette Index
Global yang didapatkan beragam namun cenderung lebih kecil dibandingkan jumlah
cluster
k yang diberikan sebelumnya. Nilai
Silhouette Index
Global terlihat besar kembali ketika jumlah
cluster
k yang diberikan 26 sebesar 0.4593, namun ketika nilai dari jumlah
cluster
k ditambah kembali hasil
Silhouette Index
Global yang didapatkan beragam kembali. Ketika jumlah
cluster
k yang diberikan k=57 nilai
Silhouette Index
Global cenderung lebih besar dibandingkan jumlah
cluster
k yang diberikan sebelumnya. Nilai
Silhouette Index
Global terkecil terdapat pada jumlah
cluster
k=16 yaitu sebesar 0.1762.
Nilai
Silhouette Coefficient
SC yang didapatkan adalah 0.5454. Nilai tersebut berada pada interval 0.51
– 0.70 yang dapat dikatakan memiliki struktur pengelompokan yang baik. Jumlah
cluster
yang disarankan untuk pengelompokkan adalah 2.
4. Hasil pengelompokan nilai daya serap ujian nasional mata pelajaran
matematika dengan menggunakan nilai rata-rata dari 29 kompetensi yang dikelompokan menjadi 3
cluster
didapatkan hasil sebagai berikut :
Nilai
Silhouette Index
Global yang didapatkan bernilai 0.2724. nilai tersebut berada pada interval 0.26
– 0.50 yang dapat dikatakan memiliki struktur pengelompokan yang lemah.
Jumlah anggota tiap
cluster
yang didapatkan adalah
cluster
1 sebanyak 66 anggota,
cluster
2 sebanyak 40 anggota, dan
cluster
3 sebanyak 31 anggota.
Standar deviasi tiap
cluster
yang didapatkan adalah
cluster
1 bernilai 4.5684,
cluster
2 bernilai 9.5281, dan
cluster
3 bernilai 3.3144. 5.
Hasil anggota pengelompokan
clustering
bisa berbeda-beda walaupun menggunakan jumlah
cluster
yang sama. Hal ini disebabkan karena ketika proses
clustering
terjadi menggunakan baris yang
random
acak untuk tiap
medoids
. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
65
6.2 Saran
Penelitian Impementasi Algoritma
Partitioning Around Medoids
PAM untuk pengelompokan Sekolah Menengah Atas di Daerah Istimewa Yogyakarta berdasarkan
nilai daya serap Ujian Nasional ini memberikan saran untuk pengembangan penelitian di masa mendatang, yaitu :
1. Perangkat lunak perlu dikembangkan agar dapat menyimpan hasil
pengelompokkan data ke dalam file selain berekstensi .doc dan .txt. 2.
Perangkat lunak
dikembangkan agar
dapat menampilkan
hasil pengelompokan ke dalam bentuk yang lebih menarik dan mudah dipahami
misalnya tabel, diagram atau grafik. 3.
Penelitian dikembangkan menggunakan
dataset
yang berbeda. Misalnya
dataset
mata pelajaran yang berbeda untuk tahun ajaran yang sama atau
dataset
mata pelajaran yang sama untuk tahun ajaran yang berbeda atau
dataset
mata pelajaran yang sama dengan provinsi yang bebeda atau seluruh indonesia.