PERANCANGAN APLIKASI CLUSTERING SEBAGAI SUMBER INFORMASI PENENTU KELAS KONSENTRASI BAGI MAHASISWA INFORMATIKA UMS Perancangan Aplikasi Clustering Sebagai Sumber Informasi Penentu Kelas Konsentrasi Bagi Mahasiswa Informatika UMS Dengan Algoritma K-Means.

PERANCANGAN APLIKASI CLUSTERING SEBAGAI SUMBER INFORMASI
PENENTU KELAS KONSENTRASI BAGI MAHASISWA INFORMATIKA UMS
DENGAN ALGORITMA K-MEANS

SKRIPSI

Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I
pada Program Studi Informatika Fakultas Komunikasi dan Informatika
Universitas Muhammadiyah Surakarta

Oleh :

DIAN SETIAWAN
L200110020

PROGRAM STUDI INFORMATIKA
FAKULTAS KOMUNIKASI DAN INFORMATIKA
UNIVERSITAS MUHAMMADIYAH SURAKARTA
2015

ii


iii

iv

PERSEMBAHAN

Dengan mengucap syukur alhamdulillah atas rahmad dan hidayah Allah SWT,
akan kupersembahkan karya ini kepada orang-orang yang saya sayangi :
1. Ibu, Ayah, kakak dan seluruh keluarga tercinta yang selalu mendo’akan serta
mendukung setiap langkahku dalam meraih kesuksesan baik di dunia dan
akhirat.
2. Bapak Husni Thamrin, ST., MT., Ph.D selaku Dekan Fakultas Komunikasi
dan Informatika Universitas Muhammadiyah Surakarta.
3. Bapak Dr. Heru Supriyono, M.Sc. selaku ketua Program Studi Informatika.
4. Bapak Drs. Sujalwo, M. Kom. selaku Pembimbing Akademik
5. Bapak Yusuf Sulistyo Nugroho, ST., M. Eng. selaku Pembimbing yang telah
memberikan tema skripsi serta banyak membantu dalam memberikan
petunjuk dan saran-saran dalam penyusunan skripsi ini.
6. Biro Skripsi Mas Adjie yang sudah membantu dalam jalannya proses skripsi

ini.
7. Keluarga besar Informatika UMS yang telah banyak memberikan ilmu dan
pengalamannya.
8. Teman-teman HIMATIF dan BEM FKI UMS yang telah memberiku banyak
pengalaman dan kenangan selama ini.
9. Buat Diah seseorang yang selalu memberi semangat, kasih sayang,

dan

motivasi selama masa-masa dalam menyelesaikan studi ini.
10. Sahabat terbaikku Novi dan Aulia yang selalu ada dalam setiap keadaanku
dan selalu memberikan semangat.
v

11. Teman-teman terbaikku Muh. Amin, Rendi, Fajar, Anggun, Neda, Idha,
Reza, Unun, dan Alim yang selalu memberikan motivasi, nasehat dan
semangat.
12. Teman-teman Kontrakan Cholil, Marwanto, dan Agus yang selalu
memotivasi untuk lembur dalam menyelesaikan skripsi ini.
13. Teman-teman Informatika UMS 2011 kelas B yang menemaniku dan

memberi kenangan indah pada masa kuliahku selama ini.
14. Teman-teman Informatika angkatan 2011 yang telah menemaniku berjuang
menempuh gelar sarjana bersama-sama.
15. Teman-teman Galang Harapan yang selama ini selalu memberikan suport
serta nasehat dalam masa-masa studiku.
16. Semua pihak yang tidak dapat saya sebutkan satu persatu atas semua hal yang
telah diberikan.

vi

KATA PENGANTAR

Assalaamu’alaikum Warohmatullohi Wabarakatuh
Dengan mengucapkan syukur kehadirat Allah SWT yang telah melimpahkan rahmat,
hidayah serta nikmat yang tiada terkira kepada hamba-Nya, sehingga penyusun dapat
menyelesaikan skripsi ini dengan judul “Perancangan Aplikasi Clustering Sebagai
Sumber Informasi Penentu Kelas Konsentrasi Bagi Mahasiswa Informatika UMS
Dengan Algoritma K-Means”.
Skripsi ini disusun untuk memenuhi kurikulum pada Fakultas Komunikasi
dan Informatika Jurusan Informatika Universitas Muhammadiyah Surakarta, sebagai

kewajiban mahasiswa dalam rangka menyelesaikan program sarjana komputer.
Dengan segala kemampuan yang optimal, penyusun telah berusaha untuk
menyelesaikan skripsi ini, namun demikian penyusun menyadari bahwa skripsi ini
tentunya masih jauh dari sempurna. Oleh karena itu penyusun mengharapkan dengan
sangat saran serta kritik yang bersifat membangun untuk perbaikan. Akhirnya
penyusun berharap semoga skripsi ini dapat bermanfaat bagi penyusun khususnya,
serta pembaca pada umumnya dalam menambah pengetahuan dan wawasan ilmu
pengetahuan khususnya mengenai data mining. Amin
Wassalaamu’alaikum Warohmatullohi Wabarokatuh.

Surakarta, 20 Juni 2015
Penulis

vii

ABSTRAK

Program Studi Informatika di UMS memiliki tiga konsentrasi jurusan yaitu Sistem
Informasi dan Enterprise, Jaringan Komputer dan Multimedia, serta Rekayasa
Perangkat Lunak dan Animasi. Dengan adanya tiga konsentrasi penjurusan maka

mahasiswa diwajibkan untuk memilih salah satu dari konsentrasi yang ada, pada
akhir semester 4. Saat ini dalam menentukan konsentrasi hanya berdasarkan dari
keinginan mahasiswa itu sendiri tanpa adanya suatu sistem yang memberikan
pertimbangan bagi mahasiswa dalam memilih konsentrasi jurusan.
Dengan melakukan perancangan aplikasi clustering k-means, diharapkan
dapat digunakan sebagai bahan pertimbagan bagi mahasiswa serta sebagai sumber
informasi penentu kelas konsentrasi bagi mahasiswa informatika dalam memilih
konsentrasi jurusan. Variabel yang digunakan untuk proses clustering k-means
adalah nilai mata kuliah yang dominan pada masing-masing konsentrasi dari
semester 1 sampai 4, variabel konsentrasi Sistem Informasi dan Enterprise
(Pemrograman Web Dasar, Algoritma dan Pemrograman, Pengantar Sistem
Informasi, Sistem Basis Data). Jaringan Komputer dan Multimedia (Komunikasi
Data, Jaringan Komputer, Prak. Jaringan Komputer, Sistem Operasi). Rekayasa
Perangkat Lunak dan Animasi (Aljabar Linier dan Matriks, Algoritma dan Struktur
Data, Struktur Diskret 2, Sistem Digital).
Hasil clustering dengan algoritma k-means diperoleh data berdasarkan
sampel sebanyak 312 data dibagi menjadi 2 yaitu angkatan informatika 2011 dan
2012. Angkatan 2011 sebanyak 154 data diperoleh data cluster sebanyak 78 masuk
ke cluster 1 dengan titik centroid (3,333 ; 3,548 ; 3,098) dan 17 data masuk ke
cluster 2 dengan titik centroid (0,915 ; 1,110 ; 0,773) serta 60 data masuk ke cluster

3 dengan titik centroid (2,682 ; 3,221 ; 1,880). Sedangkan untuk data angkatan 2012
diperoleh data cluster sebanyak 69 masuk ke cluster 1 dengan titik centroid (3,359 ;
3,577 ; 3,188), dan 18 data masuk ke cluster 2 dengan titik centroid (0,944 ; 1,383 ;
1,262) serta 64 data masuk ke cluster 3 dengan titik centroid (2,486 ; 3,368 ; 2,250).
Pada cluster 1 maka akan direkomendasikan untuk mengambil konsentrasi Jaringan
Komputer dan Multimedia, untuk anggota cluster 2 maka akan direkomendasikan
untuk konsentrasi Rekayasa Perangkat Lunak dan Animasi sedangkan untuk anggota
cluster 3 akan rekomendasikan untuk masuk ke kelas konsentrasi Sistem Informasi
dan Enterprise.
Kata Kunci : Algoritma K-Means, Data Mining, Jurusan, Kelas Konsentrasi,
Metode Clustering.

viii

DAFTAR ISI

BAB 1

BAB 2


JUDUL .....................................................................................

i

PERSETUJUAN .....................................................................

ii

PENGESAHAN ......................................................................

iii

DAFTAR KONTRIBUSI ........................................................

iv

PERSEMBAHAN ...................................................................

v


KATA PENGANTAR .............................................................

viii

ABSTRAK . .............................................................................

ix

DAFTAR ISI ...........................................................................

x

DAFTAR TABEL ...................................................................

xiv

DAFTAR PERSAMAAN .......................................................

xv


DAFTAR GAMBAR ..............................................................

xvi

DAFTAR LAMPIRAN ...........................................................

xvii

PENDAHULUAN ..................................................................

1

1.1

Latar Belakang ..........................................................

1

1.2


Rumusan Masalah ....................................................

3

1.3

Batasan Masalah ......................................................

3

1.4

Tujuan Penelitian .....................................................

4

1.5

Manfaat Penelitian ...................................................


4

1.6

Sistematika Penulisan ..............................................

5

TINJAUAN PUSTAKA ........................................................

7

2.1

Telaah Penelitian ......................................................

7

2.2

Landasan Teori .........................................................
ix

12

BAB 3

2.2.1

Kelas Konsentrasi ......................................................

12

2.2.2

Data Mining ...............................................................

13

2.2.3

Metode Clustering......................................................

14

2.2.4

Algoritma K-Means....................................................

15

2.2.5

MySQL .......................................................................

16

2.2.6

Java.............................................................................

17

2.2.7

NetBeans ....................................................................

17

METODE PENELITIAN .....................................................

18

3.1

Waktu dan Tempat Penelitian ..................................

18

3.2

Peralatan Utama dan Pendukung .............................

18

3.3

Diagram Alir Penelitian .. ..........................................

19

3.4

Langkah Penelitian .. ..................................................

21

3.4.1

Identifikasi Masalah ..................................................

21

3.4.2

Pengumpulan Data dan Penentuan Kebutuhan ..........

22

3.4.3

Kelengkapan data dan kebutuhan ..............................

26

3.4.3.1 Cleaning Data ...........................................................

26

3.4.3.2 Penentuan Sampel .....................................................

27

Perancangan Aplikasi Data Mining ..........................

27

3.4.4.1 Pengubahan Parameter Nilai .. ...................................

27

3.4.4.2 Menetukan Metode .. .................................................

28

ANALISA DATA DAN HASIL ...........................................

32

1.1

Analisa Data dan Hasil Clustering K-Means .............

32

1.1.1

Menentukan Atribut ...................................................

32

1.1.2

Menentukan Sampel ...................................................

33

1.1.3

Pengolahan Data .......................................................

33

3.4.4

BAB 4

x

1.1.4

Inisialisasi Data Nilai dari Huruf ke Angka .. ............

1.2

Proses Perhitungan Clustering dengan Algoritma

34

K-Means.. ...................................................................

36

1.2.1

Menentukan Jumlah Cluster .. ...................................

36

1.2.2

Menghitung Nilai Centroid Awal .. ...........................

36

1.2.3

Menghitung Dataset ke 1.. ........................................

37

1.2.4

Menghitung Dataset ke 2 .. .......................................

38

1.2.5

Menghitung Dataset ke 3 .. .......................................

39

1.2.6

Menghitung Dataset ke 4 .. .......................................

40

1.2.7

Menghitung Dataset ke 5 .. .......................................

41

1.2.8

Menghitung Dataset ke 6 .. .......................................

42

1.2.9

Menghitung Dataset ke 7 .. .......................................

43

1.2.10

Menghitung Dataset ke 8 .. .......................................

45

1.2.11

Menghitung Dataset ke 9 .. .......................................

46

1.2.12

Menghitung Dataset ke 10 .. .....................................

47

1.2.13

Hasil Centoid Akhir .. ................................................

48

1.3

Implementasi Clustering Algoritma K-Means
dengan Pemrograman Java Netbeans 7.4 .................

49

1.3.1

Pembuatan Form Aplikasi .........................................

49

1.3.2

Menu Utama ...............................................................

50

1.3.3

Menu Clustering .. .....................................................

50

1.3.4

Menu Bar ...................................................................

52

1.3.5

Menu About.. ..............................................................

53

1.4

Tahap Pengujian Sistem ............................................

54

1.4.1

Proses Clustering ......................................................

54

1.4.2

Hasil Clustering ........................................................

55

xi

BAB 5

DISKUSI DAN KESIMPULAN ............................................

58

5.1

Kesimpulan ..............................................................

58

5.2

Saran .........................................................................

59

DAFTAR PUSTAKA .............................................................

60

PROFIL PENULIS ..................................................................

62

LAMPIRAN ............................................................................

63

xii

DAFTAR TABEL

3.1

Daftar Atribut .. .............................................................................

23

3.2

Daftar Perubahan Parameter Nilai .. .............................................

28

4.1

Menentukan Atribut .. ...................................................................

32

4.2

Daftar Mata Kuliah yang Berhubungan dengan Konsentrasi .. ....

34

4.3

Inisialisasi Data Nilai Mata Kuliah .. ............................................

34

4.4

Nilai Rata-rata Konsentrasi .. ........................................................

35

4.5

Nilai Rata-rata Masing-masing Kolom .. ......................................

36

4.6

Nilai Centroid Awal .. ...................................................................

36

4.7

Hasil Centroid Akhir ....................................................................

48

4.8

Data Final Centroid Data 2011 ....................................................

56

4.9

Menentukan Konsentrasi dan Cluster Data 2011 .. ......................

56

4.10

Data Final Centroid Data 2012 ....................................................

57

4.11

Menentukan Konsentrasi dan Cluster Data 2012 .. ......................

57

xiii

DAFTAR PERSAMAAN

(3.1)

Rumus Slovin ...............................................................................

27

(3.2)

Rumus Euclidien Distance Space ................................................

31

xiv

DAFTAR GAMBAR

2.1

Langkah-langkah Melakukan Data Mining . ................................

13

2.2

Flowchart K-Means . ....................................................................

15

3.1

Diagram Alir Penelitian .. .............................................................

20

3.2

Flowchart Kinerja K-Means .. ......................................................

29

4.1

Hasil Centroid dan Cluster Dataset ke 1 .. ...................................

37

4.2

Hasil Centroid dan Cluster Dataset ke 2 .. ...................................

38

4.3

Hasil Centroid dan Cluster Dataset ke 3 .. ...................................

39

4.4

Hasil Centroid dan Cluster Dataset ke 4 .. ...................................

40

4.5

Hasil Centroid dan Cluster Dataset ke 5 .. ...................................

41

4.6

Hasil Centroid dan Cluster Dataset ke 6 .. ...................................

42

4.7

Hasil Centroid dan Cluster Dataset ke 7 .. ...................................

43

4.8

Hasil Centroid dan Cluster Dataset ke 8 .. ...................................

45

4.9

Hasil Centroid dan Cluster Dataset ke 9 .. ...................................

46

4.10

Hasil Centroid dan Cluster Dataset ke 10 .. .................................

47

4.11

Menu Pallete.. ...............................................................................

49

4.12

Tampilan Form Utama .. ...............................................................

50

4.13

Tampilan Form Import Data Mysql .. ...........................................

51

4.14

Tampilan Form Import Data CSV .. .............................................

52

4.15

Tampilan Menu Item Petunjuk .. ..................................................

53

4.16

Menu Form About .. ......................................................................

53

4.17

Tampilan View Profil Dosen Pembimbing .. ................................

54

xv

4.18

Proses Clustering .. .......................................................................

55

4.19

Tampilan Hasil Clustering .. .........................................................

56

xvi

DAFTAR LAMPIRAN

A

Data Pelatihan Clustering K-Means ................................................

63

B

Script Program NetBeans ...............................................................

66

xvii