PEMANFAATAN METODE K-MEANS CLUSTERING DALAM PENENTUAN PENJURUSAN SISWA SMA.

perpustakaan.uns.ac.id

digilib.uns.ac.id

PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu
Jurusan Informatika

Disusun oleh :
CHANDRA PURNAMANINGSIH
NIM. M0509018

JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA & ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2013


commit to user

i

perpustakaan.uns.ac.id

digilib.uns.ac.id

PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu
Jurusan Informatika

Disusun oleh :
CHANDRA PURNAMANINGSIH
NIM. M0509018


JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA & ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2013

commit to user

i

perpustakaan.uns.ac.id

digilib.uns.ac.id

SKRIPSI

PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA


Disusun oleh :
CHANDRA PURNAMANINGSIH
NIM. M0509018

Skripsi ini telah disetujui untuk dipertahankan di hadapan Dewan Penguji
pada tanggal 17 Desember 2013:

Pembimbing I

Pembimbing II

Ristu Saptono, S.Si., M.T.

Abdul Aziz, S.Kom, M.Cs

NIP. 19790210 200212 1 001

NIP. 19810413 200501 1 001

commit to user


ii

perpustakaan.uns.ac.id

digilib.uns.ac.id

SKRIPSI
PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA
HALAMAN PENGESAHAN
Disusun oleh :
CHANDRA PURNAMANINGSIH
NIM. M0509018
Telah dipertahankan di hadapan Dewan Penguji
Pada tanggal 17 Desember 2013 :
Susunan Dewan Penguji
1. Ristu Saptono, S.Si., M.T.
NIP. 19790210 200212 1 001


(

)

2. Abdul Aziz, S. Kom, M.Cs
NIP. 19810413 200501 1 001

(

)

3. Umi Salamah S.Si, M.Kom
NIP. 19700217 199702 2 001

(

)

4. Rini Anggrainingsih, S.T.,M.T.
NIP.19780909 200812 2 002


(

)

Disahkan oleh
Dekan FMIPA UNS

Ketua Jurusan Informatika

Prof.Ir.Ari Handono Ramelan,M.Sc.(Hons),Ph.D
NIP. 19610223 198601 1 001

Umi Salamah, S.Si., M.Kom
NIP. 19700217 199702 2 001

commit to user

iii


perpustakaan.uns.ac.id

digilib.uns.ac.id

MOTTO
“Sesungguhnya Shalatku, Ibadahku, Hidupku dan Matiku hanya untuk Allah
semata” (Q.S. Al-An’aam: 162)
“Karena sesungguhnya sesudah kesulitan itu ada kemudahan, sesungguhnya
sesudah kesulitan itu ada kemudahan, Maka apabila kamu telah selesai (dari
sesuatu urusan), kerjakanlah dengan sungguh-sungguh (urusan) yang lain”
(Q.S. Al-Insyirah : 5-7)
“Don’t wish it were easier, wish you were better.” (Jim Rohn)
“Your time is limited, so don't waste it living someone else's life.” (Steve Jobs)

commit to user

iv

perpustakaan.uns.ac.id


digilib.uns.ac.id

PERSEMBAHAN

Karya ini penulis persembahkan kepada :

“Mama dan Bapak tercinta atas segala pengorbanan, do’a, dukungan dan
semangat yang tak pernah putus.”

commit to user

v

perpustakaan.uns.ac.id

digilib.uns.ac.id

PEMANFAATAN METODE K-MEANS CLUSTERING DALAM
PENENTUAN PENJURUSAN SISWA SMA
CHANDRA PURNAMANINGSIH

Jurusan Informatika. Fakultas MIPA. Universitas Sebelas Maret.

ABSTRAK
Penentuan penjurusan siswa SMA dilakukan berdasarkan kriteria nilai
akademik yang menjadi ciri dari masing-masing jurusan IPA/IPS, hal ini
memungkinkan bagi seorang siswa untuk memenuhi kriteria diterima di kedua
jurusan atau ditolak di keduanya. Usaha untuk mengurangi kemungkinan tersebut
adalah dengan cara memperhatikan pertimbangan kriteria lainnya seperti ditinjau
dari nilai IQ dan minat siswa.
Proses penentuan penjurusan siswa SMA dengan teknik clustering
menggunakan metode K-Means clustering. Pada penelitian ini dilakukan
clustering sendiri-sendiri untuk IPA/IPS dan dipaparkan perbandingan hasil
clustering K-Means kriteria nilai akademik, nilai IQ, minat siswa dengan
clustering K-Means nilai akademik. Data siswa dikelompokkan sendiri-sendiri
sesuai jurusan masing-masing. Jurusan IPA dikelompokkan menjadi dua yaitu
diterima IPA dan ditolak IPA. Untuk jurusan IPS dikelompokkan menjadi dua
yaitu diterima IPS dan ditolak IPS. Kemudian setiap cluster diklasifikasikan
berdasarkan kriteria mana yang lebih diprioritaskan. Cluster dengan nilai terbesar
pada centroid akhir merupakan cluster yang diterima IPA/IPS, sedangkan
cluster dengan nilai terkecil pada centroid akhir merupakan cluster yang

ditolak IPA/IPS.
Hasil penelitian pengujian terbaik pada praprocessing clustering K-Means
IPA dengan hasil akurasi 0.905882, tingkat kesesuaian hasil prediksi dengan data
sebenarnya (recall) 1, ketepatan hasil pengujian dalam memprediksi clustering
(sensitivity) 0.876923, kesesuaian prediksi negatif terhadap aktual negatif
(specificity) 0.714285. Sedangkan pengujian terbaik juga pada praprocessing
clustering K-Means IPS didapatkan akurasi 0.905882, recall 0.714285, sensitivity
1, dan specificity 1. Hasil perbandingan clustering terbaik pada praprocessing
clustering K-Means IPA dengan praprocessing clustering K-Means IPS
menunjukkan bahwa tidak ada siswa yang diterima di dua jurusan IPA/IPS atau
siswa ditolak di keduanya.
Kata Kunci: Centroid, Clustering, IPA, IPS, K-Means ,Penjurusan

commit to user

vi

perpustakaan.uns.ac.id

digilib.uns.ac.id


THE USE OF K-MEANS CLUSTERING METHOD TO DETERMINE
MAJOR OF SENIOR HIGH SCHOOL STUDENT
CHANDRA PURNAMANINGSIH
Department of Informatic. Mathematic and Science Faculty.
Sebelas Maret University

ABSTRACT
Major placement of senior high school student is conducted by the criteria
of academic result of each major; the IPA/IPS. It is possible for the students are
included into those two major or aren’t included into both.The effort to reduce
the possibility that would occur if the students had an error in the placement of
the majors is with due regard to other considerations like students’ IQ scores and
students’ interest.
The process of determining the major of senior high school student by
using K-Means clustering method. In this research, clustering are separately
implemented for IPA/IPS and presented the comparison results using clustering
criteria with modifications academic values between IQ criteria of students,
students’ interest and academic grades of students using the K-Means clustering
method. Data of the students are separately grouped according to their respective
major. The IPA major are grouped into two, they are accepted to IPA and
rejected to IPA. For the IPS major are grouped into two, that is accepted to IPS
and rejected to IPS. Then each cluster is classified based on criteria which are
more prioritized. Clusters with the greatest value at the end of centroid is the
cluster which is received to IPA/IPS, while the cluster with the smallest value at
the end of centroid is the cluster which is rejected to IPA/IPS.
The best research result of testing on K-Means clustering preprocessing
IPA with accuracy results 0.905882, level of compatibility the predicted result
with the actual data (recall) 1, accuracy in predicting test results clustering
(sensitivity) 0.876923, negative predictive suitability to the negative actual
(specificity) 0.714285. Meanwhile, the best testing result is also obtained on KMeans clustering preprocessing IPS that showed the accuracy 0.905882, recall
0.714285, sensitivity 1, and specificity 1. The best comparison clustering result on
K-Means clustering preprocessing IPA with K-Means clustering preprocessing
IPS indicates that no student who received into two majors IPA / IPS or students
declined in both.
Key words: Centroid, Clustering, IPA, IPS, K-Means, Major

commit to user

vii

perpustakaan.uns.ac.id

digilib.uns.ac.id

KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah Subhanahu Wa Ta’ala
yang senantiasa memberikan nikmat dan karunia-Nya sehingga penulis dapat
menyelesaikan skripsi dengan judul Pemanfaatan Metode K-Means Clustering
dalam Penentuan Penjurusan Siswa SMA, yang menjadi salah satu syarat wajib
untuk memperoleh gelar Sarjana Informatika di Universitas Sebelas Maret (UNS)
Surakarta.
Penulis menyadari akan keterbatasan yang dimiliki, begitu banyak
bimbingan, bantuan, serta motivasi yang diberikan dalam proses penyusunan
skripsi ini. Oleh karena itu, ucapan terima kasih penulis sampaikan kepada :
1. Bapak Ristu Saptono, S.Si., M.T selaku Dosen Pembimbing I yang penuh
kesabaran, ketelitian, koreksi, masukan, motivasi, semangat dan
memberikan waktunya untuk mengarahkan, dan membimbing penulis
selama proses penyelesaian skripsi ini,
2. Bapak Abdul Aziz, S.Kom, M.Cs selaku Dosen Pembimbing II terimakasih
atas setiap diskusi, semangat, motivasi, ketelitian, koreksi, masukan dan
kesabarannya selama proses penyelesaian skripsi ini.
3. Ibu Umi Salamah, S.Si.,M.Kom selaku Ketua Jurusan S1 Informatika
FMIPA UNS,
4. Bapak Didiek S. Wiyono, S.T., M.T. selaku Pembimbing Akademik.
5. Bapak dan Ibu dosen serta karyawan di Jurusan Informatika FMIPA UNS
yang telah mengajar penulis selama masa studi dan membantu dalam proses
penyusunan skripsi ini,
6. Mama dan bapak tercinta yang tak hentinya memberikan dukungan moral
dan material selama proses penyusunan Tugas Akhir ini,
7. Teman-teman semua terutama mahasiswa informatika FMIPA UNS dan
Yudi Chandri Setiawan selalu memberikan dukungan, motivasi dan bantuan
kepada penulis.
Penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak
yang berkepentingan.
Surakarta, 17 November 2013

Penulis
commit to user

viii

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR ISI

HALAMAN JUDUL..................................................................................................... i
HALAMAN PERSETUJUAN ..................................................................................... ii
HALAMAN PENGESAHAN ..................................................................................... iii
HALAMAN MOTTO ................................................................................................. iv
HALAMAN PERSEMBAHAN .................................................................................. v
ABSTRAK ................................................................................................................ vi
ABSTRACT ............................................................................................................... vii
KATA PENGANTAR .............................................................................................. viii
DAFTAR ISI ............................................................................................................... ix
DAFTAR TABEL ...................................................................................................... xii
DAFTAR GAMBAR ................................................................................................ xiv
DAFTAR LAMPIRAN .............................................................................................. xv
BAB I PENDAHULUAN ............................................................................................ 1
1.1 Latar Belakang ................................................................................................. 1
1.2 Rumusan Masalah ............................................................................................ 3
1.3 Batasan Masalah ............................................................................................... 3
1.4 Tujuan Penelitian.............................................................................................. 3
1.5 Manfaat Penelitian............................................................................................ 4
1.6 Sistematika Penulisan ....................................................................................... 4
BAB II TINJAUAN PUSTAKA.................................................................................. 5
2.1 Landasan Teori ................................................................................................. 5
2.1.1 Clustering ............................................................................................... 5
2.1.2 K-Means ................................................................................................. 5

commit to user

ix

perpustakaan.uns.ac.id

digilib.uns.ac.id

2.1.3 Confusion Matrik ................................................................................. 11
2.1.4 Kriterian Penjurusan Sekolah Menengah Atas (SMA) ........................ 13
2.2 Penelitian Terkait ........................................................................................... 14
2.2.1 Aplikasi K-Means untuk Pengelompokkan Mahasiswa Berdasarkan
Nilai Body Mass Index (BMI) dan Ukuran Kerangka (Tedy
Rismawan dan Kusumadewi,2008)...................................................... 14
2.2.2 Sistem Pendukung Keputusan Penjurusan Siswa Kelas X SMA
Negeri 2 Surakarta Dengan Metode Fuzzy C-Means Dengan
Penggunaan Daya Dukung Minat Siswa (Erfan Agil Putranto,
2012)..................................................................................................... 14
2.2.3 Performance Evaluation of K-Means and Fuzzy C-Means Clustering
Algorithms for Statistical Distributions of Input Data Points
(Santhanam dan Velmurugan, 2010).................................................... 15
2.2.4 Clustering Data Non-Numerik Dengan Pendekatan Algoritma KMeans Dan Hamming Distance Studi Kasus Biro Jodoh (Darlis Heru
Murti, Nanik Suciati, dan Daru Jani Nanjaya,2005)............................. 16
2.3 Rencana Penelitian ......................................................................................... 16
BAB III METODE PENELITIAN............................................................................. 18
3.1 Pengumpulan Data ......................................................................................... 18
3.1.1 Study Literature .................................................................................... 18
3.1.2 Telaah Dokumen .................................................................................. 18
3.2 Pemodelan Data.............................................................................................. 19
3.3 Proses Clustering............................................................................................ 20
3.3.1 Praprocessing Clustering K-Means ..................................................... 20
3.3.2 Clustering K-Means ............................................................................. 21
3.4 Klasifikasi Hasil Clustering ........................................................................... 24
3.5 Pengujian dan Validasi Hasil ......................................................................... 25
3.5.1 Tahap Pengujian Perbandingan berdasarkan Clustering...................... 25
3.3.2 Tahap Pengujian berdasarkan Confusion Matrik ................................. 26
commit to user

x

perpustakaan.uns.ac.id

digilib.uns.ac.id

BAB IV PEMBAHASAN .......................................................................................... 27
4.1 Pemodelan Data .............................................................................................. 27
4.2 Proses Clustering............................................................................................ 28
4.3 Klasifikasi Hasil Clustering ........................................................................... 38
4.4 Hasil Pengujian Clustering............................................................................. 40
4.4.1 Hasil Pengujian Perbandingan berdasarkan Confusion Matrik............ 40
4.4.2 Hasil Pengujian berdasarkan Clustering .............................................. 43
BAB V PENUTUP ..................................................................................................... 40
5.1 Kesimpulan..................................................................................................... 46
5.2 Saran ............................................................................................................... 46
DAFTAR PUSTAKA ................................................................................................ 47

commit to user

xi

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR TABEL

Tabel 2.1 Daftar Objek dalam Clustering .................................................................... 9
Tabel 2.2 Hasil Clustering ......................................................................................... 11
Tabel 2.3 Confusion Matrik (Fawcett,2006) .............................................................. 12
Tabel 3.1 Pengkatagorian Minat ................................................................................ 19
Tabel 3.2 Pengkatagorian Nilai IQ ............................................................................ 19
Tabel 3.3 Pembobotan IPA IPS ................................................................................. 20
Tabel 3.4 Confusion Matrik Data Dua Kelas ............................................................. 26
Tabel 4.1 Pemodelan Data Jurusan IPA ..................................................................... 27
Tabel 4.2 Pemodelan Data Jurusan IPS ..................................................................... 27
Tabel 4.3 Jarak Awal Iterasi-1 clustering K-Means IPA ........................................... 30
Tabel 4.4 Jarak Awal Iterasi-1 clustering K-Means IPS ............................................ 31
Tabel 4.5 Jarak Awal Iterasi-1 clustering praprocessing K-Means IPA ................... 31
Tabel 4.6 Jarak Awal Iterasi-1 clustering praprocessing K-Means IPS .................... 32
Tabel 4.7 Hasil cluster K-Means IPA iterasi-1 .......................................................... 32
Tabel 4.8 Hasil cluster K-Means IPS iterasi-1 ........................................................... 33
Tabel 4.9 Hasil cluster praprocessing K-Means IPA iterasi-1 .................................. 33
Tabel 4.10 Hasil cluster praprocessing K-Means IPS iterasi-1 ................................ 34
Tabel 4.11 Hasil centroid akhir K-Means IPA.......................................................... 36
Tabel 4.12 Hasil centroid akhir K-Means IPS .......................................................... 37
Tabel 4.13 Hasil centroid akhir praprocessing K-Means IPA .................................. 37
Tabel 4.14 Hasil centroid akhir praprocessing K-Means IPS .................................. 37
Tabel 4.15 Klasifikasi cluster K-Means
............................................................ 38
commitIPA
to user

xii

perpustakaan.uns.ac.id

digilib.uns.ac.id

Tabel 4.16 Klasifikasi cluster K-Means IPS ............................................................. 38
Tabel 4.17 Klasifikasi cluster praprocessing K-Means IPA .................................... 39
Tabel 4.18 Klasifikasi cluster praprocessing K-Means IPS ..................................... 39
Tabel 4.19 Confusion Matrik K-Means IPA ............................................................ 40
Tabel 4.20 Confusion Matrik K-Means IPS ............................................................. 40
Tabel 4.21 Confusion Matrik praprocessing K-Means IPA .................................... 41
Tabel 4.22 Confusion Matrik praprocessing K-Means IPS .................................... 41
Tabel 4.23 Rata-Rata Hasil Pengujian ..................................................................... 42
Tabel 4.24 Pengujian K-Means IPA dengan K-Means IPS ..................................... 43
Tabel 4.25 Pengujian praprocessing K-Means IPA dengan praprocessing KMeans IPS ............................................................................................. 44

commit to user

xiii

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR GAMBAR

Gambar 2.1 Ilustrasi algoritma K-Means ..................................................................... 6
Gambar 2.1 Diagram alir algoritma K-Means ............................................................. 8
Gambar 3.1 Alur Rancangan Penelitian ..................................................................... 18
Gambar 3.2 Flowchart praprocessing clustering K-Means IPA/IPS ........................ 21
Gambar 3.3 Flowchart clustering K-Means IPA/IPS ................................................ 22
Gambar 3.5 Ilustrasi Hasil Pengelompokan Penjurusan ............................................ 25
Gambar 4.1 Grafik Perbandingan Hasil Pengujian Clustering .................................. 44

commit to user

xiv

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR LAMPIRAN

Lampiran A. Data Asli Siswa..................................................................................... 51
Lampiran B. Hasil Pemodelan Data Jurusan IPA ...................................................... 57
Lampiran C. Hasil Pemodelan Data Jurusan IPS ....................................................... 63
Lampiran D. Hasil Perhitungan Jarak Awal Iterasi-1 Clustering K-Means IPA, KMeans IPS, praprocessing K-Means IPA, praprocessing K-Means
IPS ......................................................................................................... 70
Lampiran E. Hasil Iterasi – 1 Clustering K-Means IPA, K-Means IPS,
praprocessing K-Means IPA, praprocessing K-Means IPS ................. 75
Lampiran F. Hasil Klasifikasi Siswa Clustering K-Means IPA / IPS ........................ 82
Lampiran G. Hasil Klasifikasi Siswa Clustering praprocessing K-Means IPA dan
praprocessing K-Means IPS ................................................................. 89
Lampiran H. Hasil Pengujian K-Means IPA dengan Data Asli Sekolah. ................. 96
Lampiran I. Hasil Pengujian K-Means IPS dengan Data Asli Sekolah.. ................... 97
Lampiran J. Hasil Pengujian Clustering praprocessing K-Means IPA dengan Data
Asli Sekolah .......................................................................................... 98
Lampiran K. Hasil Pengujian Clustering praprocessing K-Means IPS dengan Data
Asli Sekolah. ......................................................................................... 99
Lampiran L. Hasil Pengujian Clustering K-Means IPA .......................................... 100
Lampiran M. Hasil Pengujian Clustering K-Means IPS .......................................... 101
Lampiran N. Hasil Pengujian Clustering praprocessing K-Means IPA .................. 102
Lampiran O. Hasil Pengujian Clustering praprocessing K-Means IPS ................... 103

commit to user

xv