Analisis Data Jadwal Kuliah dengan Graph-Based Clustering.

(1)

i Universitas Kristen Maranatha

ABSTRAK

Analisis cluster merupakan salah satu metoda dalam data mining. Metoda ini menganalisis cluster atau kelompok yang terbentuk dari kumpulan instance data dalam sebuah dataset. Cluster terbentuk karena terdapat instance data yang memiliki kemiripan sifat atau berkaitan dengan instance data lainnya.

Graph-based clustering menganalisis cluster yang terbentuk dalam sebuah grafik dan

besaran yang dihasilkan. Studi kasus yang digunakan adalah data jadwal kuliah Fakultas Teknologi Informasi semester ganjil dan genap 2013/2014. Algoritma yang digunakan dalam melakukan graph-based clustering adalah algoritma simple

k-means. Analisis cluster menghasilkan pengelompokan atau cluster dalam data

jadwal kuliah berdasarkan jadwal, ruang, dan nilai. Hasil analisis cluster dapat digunakan untuk masa depan sebagai bahan pertimbangan seperti penyebaran jadwal yang lebih merata, penggunaan ruang yang lebih merata, dan pertimbangan pembuatan jadwal terhadap nilai.


(2)

ABSTRACT

Cluster analysis is one of the methods in data mining. This method analyzes the cluster or group that is formed from a collection of instance data in a dataset. Clusters are formed because there is an instance of data that has a similar of character or have associated with the other instance. Graph-based clustering is used to analyze clusters formed in a graph and the amount produced. The case study used in this project is the class scheduling in Faculty of Information Technology odd and even semester 2013/2014. The algorithm used in graph-based clustering is simple k-means. Cluster analysis produce clusters in the data schedule based on the schedule, room, and grade. Results of cluster analysis can be used for future consideration such as schedule deployment more equitable, room used more equitable, and creating a schedule based of the grade.


(3)

iii Universitas Kristen Maranatha

DAFTAR ISI

ABSTRAK ... i

ABSTRACT ... ii

DAFTAR ISI ... iii

DAFTAR GAMBAR ... vi

DAFTAR TABEL ... xi

BAB I PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Rumusan Masalah ... 2

1.3. Tujuan ... 2

1.4. Batasan Masalah ... 2

1.5. Sistematika Pembahasan ... 3

BAB II LANDASAN TEORI ... 4

2.1. Data Mining ... 4

2.2. Cluster Analysis ... 6

2.3. Graph-Based Clustering ... 7

2.3.1. Simple K-Means ... 8

2.3.2. Weka... 9

BAB III ANALISIS DAN DISAIN ... 14

3.1. Analisis ... 14

3.2. Gambaran Keseluruhan ... 23

3.2.1. Persyaratan Antarmuka Eksternal ... 24

3.2.2. Antarmuka dengan Pengguna ... 24

3.2.3. Antarmuka Perangkat Keras ... 24

3.2.4. Antarmuka Perangkat Lunak ... 25

3.2.5. Fitur-fitur Produk Perangkat Lunak ... 26

3.2.5.1. Fitur Input Data ... 26

3.2.5.1.1. Tujuan ... 26

3.2.5.1.2. Urutan Respon ... 26


(4)

3.2.5.2. Fitur Simple K-means... 27

3.2.5.6.1. Tujuan ... 27

3.2.5.6.2. Urutan Respon ... 27

3.2.5.6.3. Persyaratan Fungsional yang Berhubungan ... 28

3.2.5.3. Fitur Parameter Data Mining ... 28

3.2.5.7.1. Tujuan ... 28

3.2.5.7.2. Urutan Respon ... 28

3.2.5.7.3. Persyaratan Fungsional yang Berhubungan ... 29

3.3. Disain Perangkat Lunak ... 29

3.3.1. Pemodelan Perangkat Lunak ... 30

3.3.1.1. Diagram Use Case ... 30

3.3.1.1.1. Use Case Input Data. ... 30

3.3.1.1.2. Use Case Simple K-Means. ... 31

3.3.1.1.3. Use Case Mengubah Parameter. ... 31

3.3.1.2. Diagram Activity ... 32

3.3.1.2.1. Diagram Activity Input Data. ... 32

3.3.1.2.2. Diagram Activity Simple K-means. ... 33

3.3.1.2.3. Diagram Activity Mengubah Parameter. ... 34

3.3.1.3. Diagram Kelas ... 35

BAB IV PENGEMBANGAN PERANGKAT LUNAK ... 37

4.1. Implementasi Graph-Based Clustering ... 37

4.1.1. Jadwal Ganjil 2013/2014 ... 40

4.1.2. Jadwal Genap 2013/2014 ... 50

4.1.3. Ruang Ganjil 2013/2014 ... 60

4.1.4. Ruang Genap 2013/2014 ... 72

4.1.5. Nilai Genap 2013/2014 ... 82

4.1.6. Kesimpulan Implementasi Jadwal Ganjil dan Genap 2013/2014... 91

4.1.7. Kesimpulan Implementasi Ruang Ganjil dan Genap 2013/2014 ... 92

4.1.8. Kesimpulan Implementasi Nilai Genap 2013/2014 ... 92

4.1.9. Kesimpulan Implementasi Perubahan Seed ... 92

4.2. Implementasi Class ... 93


(5)

v Universitas Kristen Maranatha

4.2.2. Implementasi Class GraphBasedView... 94

4.2.3. Implementasi Class GraphBasedThread ... 95

4.2.4. Implementasi Class Dataset ... 96

4.2.5. Implementasi Class Clustering ... 97

4.3. Implementasi Antarmuka ... 98

4.3.1. Implementasi Antarmuka Awal ... 99

4.3.2. Implementasi Antarmuka Input Data ... 99

4.3.3. Implementasi Antarmuka Clustering ... 100

4.3.4. Implementasi Antarmuka About ... 101

BAB V TESTING DAN EVALUASI SISTEM ... 102

5.1. Rencana Pengujian ... 102

5.2. Pelaksanaan Pengujian ... 102

5.2.1 . Black-Box Testing ... 102

5.2.2.1 Input File ... 102

5.2.2.2 Besaran Clustering ... 103

5.2.2.3 Grafik Clustering ... 103

5.2.2.4 Parameter Clustering ... 104

BAB VI KESIMPULAN DAN SARAN ... 105

6.1. Kesimpulan ... 105

6.2. Saran ... 106

DAFTAR PUSTAKA ... 107


(6)

DAFTAR GAMBAR

Gambar 2.1. Contoh Grafik K-means (Han, Kamber and Pei 2012). ... 8

Gambar 2.2. User Interface Weka. ... 9

Gambar 2.3. User Interface Weka Preprocessing. ... 10

Gambar 2.4. User Interface Weka Clustering. ... 11

Gambar 2.5. User Interface Weka Visualize Cluster Assignments. ... 11

Gambar 2.6. User Interface Weka Clusterer Visualize. ... 12

Gambar 3.1. Contoh Arff ... 22

Gambar 3.2. Diagram Use Case. ... 30

Gambar 3.3. Diagram Activity Input Data. ... 33

Gambar 3.5. Diagram Activity K-means. ... 34

Gambar 3.6. Diagram Activity Mengubah Parameter. ... 35

Gambar 3.7. Diagram Kelas. ... 36

Gambar 4.1. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap Hari Text. ... 40

Gambar 4.2. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Jam. ... 41

Gambar 4.3. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap Hari Text. ... 42

Gambar 4.4. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Jam. ... 43

Gambar 4.5. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 10 Terhadap Hari Text. ... 44

Gambar 4.6. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 10 Terhadap Kode Jam. ... 44

Gambar 4.7. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 10 Terhadap Hari Text. ... 45

Gambar 4.8. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 10 Terhadap Kode Jam. ... 46


(7)

vii Universitas Kristen Maranatha

Gambar 4.9. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 15 Terhadap Hari Text. ... 47 Gambar 4.10. Grafik Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 15

Terhadap Kode Jam... 47 Gambar 4.11. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 15

Terhadap Hari Text. ... 48 Gambar 4.12. Grafik Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 15

Terhadap Kode Jam... 49 Gambar 4.13. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap Hari Text. ... 50 Gambar 4.14. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Jam. ... 51 Gambar 4.15. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap Hari Text. ... 52 Gambar 4.16. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Jam. ... 52 Gambar 4.17. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 10

Terhadap Hari Text. ... 54 Gambar 4.18. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 10

Terhadap Kode Jam... 54 Gambar 4.19. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 10

Terhadap Hari Text. ... 56 Gambar 4.20. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 10

Terhadap Kode Jam... 56 Gambar 4.21. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 15

Terhadap Hari Text. ... 57 Gambar 4.22. Grafik Jadwal Genap dengan Jumlah Cluster 3 dan Seed 15

Terhadap Kode Jam... 58 Gambar 4.23. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 15

Terhadap Hari Text. ... 59 Gambar 4.24. Grafik Jadwal Genap dengan Jumlah Cluster 5 dan Seed 15


(8)

Gambar 4.25. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Jam. ... 61 Gambar 4.26. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Kapasitas... 62 Gambar 4.27. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Jam. ... 63 Gambar 4.28. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Kapasitas... 64 Gambar 4.29. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 10

Terhadap Kode Jam... 65 Gambar 4.30. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 10

Terhadap Kode Kapasitas. ... 66 Gambar 4.31. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 10

Terhadap Kode Jam... 67 Gambar 4.32. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 10

Terhadap Kode Kapasitas. ... 68 Gambar 4.33. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 15

Terhadap Kode Jam... 69 Gambar 4.34. Grafik Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 15

Terhadap Kode Kapasitas. ... 70 Gambar 4.35. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 15

Terhadap Kode Jam... 71 Gambar 4.36. Grafik Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 15

Terhadap Kode Kapasitas. ... 72 Gambar 4.37. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Jam. ... 73 Gambar 4.38. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Kapasitas... 73 Gambar 4.39. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Jam. ... 74 Gambar 4.40. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Kapasitas... 75


(9)

ix Universitas Kristen Maranatha

Gambar 4.41. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 10

Terhadap Kode Jam... 76 Gambar 4.42. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 10

Terhadap Kode Kapasitas. ... 76 Gambar 4.43. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 10

Terhadap Kode Jam... 77 Gambar 4.44. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 10

Terhadap Kode Kapasitas. ... 78 Gambar 4.45. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 15

Terhadap Kode Jam... 79 Gambar 4.46. Grafik Ruang Genap dengan Jumlah Cluster 3 dan Seed 15

Terhadap Kode Kapasitas. ... 80 Gambar 4.47. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 15

Terhadap Kode Jam... 81 Gambar 4.48. Grafik Ruang Genap dengan Jumlah Cluster 5 dan Seed 15

Terhadap Kode Kapasitas. ... 81 Gambar 4.49. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap Kode Kualifikasi. ... 82 Gambar 4.50. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 5 Terhadap

Cluster. ... 83

Gambar 4.51. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap Kode Kualifikasi. ... 84 Gambar 4.52. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 5 Terhadap

Cluster. ... 84

Gambar 4.53. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 10 Terhadap Kode Kualifikasi. ... 85 Gambar 4.54. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 10 Terhadap

Cluster. ... 86

Gambar 4.55. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 10 Terhadap Kode Kualifikasi. ... 87 Gambar 4.56. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 10 Terhadap


(10)

Gambar 4.57. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 15 Terhadap

Kode Kualifikasi. ... 89

Gambar 4.58. Grafik Nilai Genap dengan Jumlah Cluster 3 dan Seed 15 Terhadap Cluster. ... 89

Gambar 4.59. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 15 Terhadap Kode Kualifikasi. ... 90

Gambar 4.60. Grafik Nilai Genap dengan Jumlah Cluster 5 dan Seed 15 Terhadap Cluster. ... 91

Gambar 4.61. Implementasi Class GraphBased. ... 93

Gamabr 4.62. Implementasi Class GraphBasedView. ... 94

Gambar 4.63. Implementasi Class GraphBased Thread. ... 95

Gambar 4.64. Implementasi Class Dataset. ... 96

Gambar 4.65. Implementasi Class Clustering. ... 98

Gambar 4.66. Implementasi Antarmuka Awal ... 99

Gamabr 4.67. Impementasi Antarmuka Preprocessing ... 100

Gambar 4.68. Implementasi Antarmuka Clustering. ... 100


(11)

xi Universitas Kristen Maranatha

DAFTAR TABEL

Tabel 2.1. Library Weka. ... 12

Tabel 3.1. Tabel Atribut ... 15

Tabel 3.2. Tabel Dataset... 16

Tabel 3.3. Tabel Atribut ... 17

Tabel 3.4. Tabel Atribut yang Dipertahankan ... 18

Tabel 3.5. Pemodelan Jam ... 19

Tabel 3.6. Pemodelan Kapasitas ... 20

Tabel 3.7. Pemodelan Dosen ... 20

Tabel 3.8. Pemodelan Jenis Mata Kuliah ... 20

Tabel 3.9. Pemodelan Kualifikasi Mata Kuliah ... 21

Tabel 3.10. Pengkodean Nilai Huruf ke Angka. ... 21

Tabel 3.11. Pengkodean Nilai Angka ke Nominal. ... 21

Tabel 3.12. Deskripsi Use Case Input Data. ... 31

Tabel 3.14. Deskripsi Use Case Simple K-Means ... 31

Tabel 3.15. Deskripsi Use Case Mengubah Parameter. ... 32

Tabel 4.1. Implementasi Jadwal Ganjil 2013/2014. ... 37

Tabel 4.2. Implementasi Jadwal Genap 2013/2014. ... 38

Tabel 4.3. Implementasi Ruang Ganjil 2013/2014. ... 38

Tabel 4.4. Implementasi Ruang Genap 2013/2014. ... 39

Tabel 4.5. Implementasi Nilai Genap 2013/2014. ... 39

Tabel 4.6. Cluster Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 5... 40

Tabel 4.7. Cluster Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 5... 41

Tabel 4.8. Cluster Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 10... 43

Tabel 4.9. Cluster Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 10... 45

Tabel 4.10. Cluster Jadwal Ganjil dengan Jumlah Cluster 3 dan Seed 15. ... 46

Tabel 4.11. Cluster Jadwal Ganjil dengan Jumlah Cluster 5 dan Seed 15. ... 48

Tabel 4.12. Cluster Jadwal Genap dengan Jumlah Cluster 3 dan Seed 5. ... 50

Tabel 4.13. Cluster Jadwal Genap dengan Jumlah Cluster 5 dan Seed 5. ... 51


(12)

Tabel 4.15. Cluster Jadwal Genap dengan Jumlah Cluster 5 dan Seed 10. ... 55

Tabel 4.16. Cluster Jadwal Genap dengan Jumlah Cluster 3 dan Seed 15. ... 57

Tabel 4.17. Cluster Jadwal Genap dengan Jumlah Cluster 5 dan Seed 15. ... 59

Tabel 4.18. Cluster Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 5. ... 61

Tabel 4.19. Cluster Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 5. ... 62

Tabel 4.20. Cluster Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 10. ... 64

Tabel 4.21. Cluster Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 10. ... 66

Tabel 4.22. Cluster Ruang Ganjil dengan Jumlah Cluster 3 dan Seed 15. ... 68

Tabel 4.23. Cluster Ruang Ganjil dengan Jumlah Cluster 5 dan Seed 15. ... 70

Tabel 4.24. Cluster Ruang Genap dengan Jumlah Cluster 3 dan Seed 5. ... 72

Tabel 4.25. Cluster Ruang Genap dengan Jumlah Cluster 5 dan Seed 5. ... 74

Tabel 4.26. Cluster Ruang Genap dengan Jumlah Cluster 3 dan Seed 10. ... 75

Tabel 4.27. Cluster Ruang Genap dengan Jumlah Cluster 5 dan Seed 10. ... 77

Tabel 4.28. Cluster Ruang Genap dengan Jumlah Cluster 3 dan Seed 15. ... 79

Tabel 4.29. Cluster Ruang Genap dengan Jumlah Cluster 5 dan Seed 15. ... 80

Tabel 4.30. Cluster Nilai Genap dengan Jumlah Cluster 3 dan Seed 5. ... 82

Tabel 4.31. Cluster Nilai Genap dengan Jumlah Cluster 5 dan Seed 5. ... 83

Tabel 4.32. Cluster Nilai Genap dengan Jumlah Cluster 3 dan Seed 10. ... 85

Tabel 4.33. Cluster Nilai Genap dengan Jumlah Cluster 5 dan Seed 10. ... 87

Tabel 4.34. Cluster Nilai Genap dengan Jumlah Cluster 3 dan Seed 15. ... 88

Tabel 4.35. Cluster Nilai Genap dengan Jumlah Cluster 5 dan Seed 15. ... 90

Tabel 5.3. Pengujian Input File. ... 103

Tabel 5.4. Pengujian Besaran Clustering. ... 103

Tabel 5.5. Pengujian Grafik Clustering. ... 104


(13)

1 Universitas Kristen Maranatha

BAB I

PENDAHULUAN

1.1. Latar Belakang

Perkembangan yang pesat dalam teknologi pengumpulan dan penyimpanan data membuat data yang cukup besar dapat terakumulasi dengan mudah. Mengambil informasi yang berguna dari data tersebut pun menjadi hal yang sangat menantang. Teknik atau alat tradisional dalam mengolah data juga tidak dapat digunakan karena besarnya ukuran dari kumpulan data. Banyak data tersimpan dalam berbagai bidang seperti bisnis, obat-obatan, dan ilmu pengetahuan.

Data mining diperlukan untuk melakukan pengolahan data dengan jumlah yang banyak dan besar. Data mining adalah teknologi yang menyatukan teknik tradisional dalam menganalisis data dengan algortima yang canggih untuk memproses data (Tan, Steinbach and Kumar 2006). Data mentah yang jumlahnya banyak dan besar tidak hanya didiamkan, tetapi melalui proses data mining data tersebut dapat menghasilkan informasi yang berguna. Data mining membuka kesempatan mengetahui sesuatu yang baru dari data yang lama, dengan cara yang baru.

Metode graph-based clustering adalah salah satu metode data mining yang fleksibel. Metode ini dapat digunakan untuk data yang sifatnya tidak teratur atau bahkan data yang teratur, untuk data yang memiliki kesamaan atau tidak memiliki kesamaan antara satu dengan yang lainnya (Tan, Steinbach and Kumar 2006).

Dataset yang memiliki hubungan antar instance salah satunya adalah data jadwal. Data jadwal memiliki hubungan dari segi waktu dan tempat. Data jadwal dapat difokuskan lagi kedalam berbagai macam data salah satunya adalah data penjadwalan kuliah. Data penjadwalan kuliah adalah data jadwal setiap mata kuliah yang ada pada periode tertentu. Data tersebut menyediakan hari dan jam dimana mata kuliah akan dijalankan, dosen yang mengajar, tempat, dan informasi lain seperti jumlah sks setiap mata kuliah, semester mata kuliah, dan jenis mata kuliah. Graph-based clustering yang dapat dilakukan terhadap data penjadwalan


(14)

2

kuliah. Hasil clustering dapat melihat pengelompokan yang terjadi terhadap jadwal dan juga ruangan. Hasil tersebut dapat digunakan untuk pengambilan keputusan di masa depan dalam pembuatan jadwal kuliah.

1.2. Rumusan Masalah

Berdasarkan latar belakang yang terjadi maka dapat diambil dua rumusan masalah dalam penelitian ini. Rumusan masalah tersebut adalah:

1. Bagaimana melakukan analisis data mining menggunakan graph-based

clustering dengan algoritma simple k-means.

2. Bagaimana implementasi perangkat lunak untuk melakukan data mining dengan graph-based clustering dengan algoritma simple k-means.

1.3. Tujuan

Berdasarkan rumusan masalah yang ada maka dapat diambil dua tujuan dari penelitian ini. Tujuan tersebut adalah:

1. Melakukan analisis graph-based clustering terhadap kelompok data menggunakan algoritma simple k-means dengan perubahan parameter seed dan jumlah cluster.

2. Implementasi perangkat lunak untuk melakukan data mining dengan

graph-based clustering menggunakan algoritma simple k-means.

1.4. Batasan Masalah

Penelitian data mining menggunakan metode graph-based clustering ini perlu dibatasi agar tidak meluas. Batasan dari penelitian ini diantaranya adalah: 1. Aplikasi memproses file data dengan format .arff dan .csv.

2. Aplikasi melakukan proses data mining dengan graph-based clustering tanpa memperhitungkan waktu pemrosesan.

3. Aplikasi menggunakan library Weka.

4. Aplikasi melakukan analisis cluster terhadap data jadwal perkuliahan Fakultas Teknologi Indormasi Semester Genap 2013/2014 dan Semester Ganjil 2014/2015 sebagai data studi kasus.


(15)

3

Universitas Kristen Maranatha

1.5. Sistematika Pembahasan

Laporan penelitian mengenai graph-based clustering ini dibagi menjadi ke dalam enam bab besar. Setiap bab terbagi kedalam beberapa sub bab. Sistematika pembagian bab tersebut adalah:

Bab I adalah bab pendahuluan. Bab ini membahas latar belakang pembuatan penelitian data mining menggunakan graph-based clustering, masalah-masalah yang diangkat, tujuan dari penelitian, batasan dari penelitian, dan sistematika laporan penelitian.

Bab II adalah bab landasan teori. Bab ini memberikan informasi teori yang digunakan dalam penelitian. Teori analisis maupun implementasi. Bab ini memberikan informasi teori analisis mengenai data mining, apa itu data mining, data, clustering, graph-based clustering, dan Weka.

Bab III adalah bab analisis dan disain. Bab ini menjabarkan analisis mengenai graph-based clustering dan disain perancangan aplikasi. Bab ini terdiri dari analisis proses graph-based clustering, gambaran dari antarmuka aplikasi, antarmuka perangkat keras, antarmuka perangkat lunak, disain penyimpanan data, dan disain antarmuka aplikasi.

Bab IV adalah bab pengembangan perangkat lunak. Bab ini menjabarkan implementasi dari perangkat lunak yang dibuat dalam penelitian. Bab ini terdiri dari implementasi class, implementasi penyimpanan data, dan implementasi antarmuka aplikasi.

Bab V adalah bab testing dan evaluasi sistem. Bab ini melakukan testing terhadap aplikasi yang dibuat. Bab ini terdiri dari rencana pengujian yang akan dilakukan terhadap aplikasi dan pelaksanaan pengujian dengan metode white box dan black box testing.

Bab VI adalah bab kesimpulan dan saran. Bab terakhir ini akan membahas kesimpulan yang dihasilkan dari penelitian ini dan saran untuk pengembangan analisis data mining dengan graph-based clustering dan pengembangan aplikasi.


(16)

BAB VI

KESIMPULAN DAN SARAN

Bab VI berisi kesimpulan dan saran dari hasil penelitian. Bab ini memberikan kesimpulan terhadap hasil penelitian dari keseluruhan bab yang ada. Bab ini juga memberikan saran terhadap pengembangan penelitian.

6.1. Kesimpulan

Kesimpulan dari hasil penelitian untuk menganalisis data jadwal kuliah Fakultas Teknologi Informasi Semester Ganjil dan Genap 2013/2014 menggunakan graph-based clustering terdapat dalam lima point. Kesimpulan tersebut adalah:

1. Pada Semester Ganjil 2013/2014 terdapat banyak mata kuliah dengan kualifikasi Utama dan Khusus pada hari Senin hingga Jumat seperti ditunjukkan pada tabel 4.9 sedangkan pada Semester Genap 2013/2014 terdapat banyak mata kuliah dengan kualifikasi Utama dan Pemprograman pada hari Senin, Selasa, dan Rabu seperti ditunjukkan pada tabel 4.15.

2. Terdapat kekosongan penggunaan ruang pada hari Kamis jam 09.30 – 12.00, Jumat jam 09.30 – 15.00, dan Sabtu jam 17.30 – 22.30 pada pemakaian Ruang baik untuk Ganjil dan Genap 2013/2014. Gambar 3.31 dan 4.43 menunjukkan grafik hasil clustering terhadap pemakaian Ruang pada Semester Ganjil dan Genap 2013/2014.

3. Terdapat penggunaan ruang dengan kapasitas kecil pada Semester Ganjil 2013/2014 seperti ditunjukkan pada gambar 4.32. Berbeda dengan Semester Ganjil 2013/2014, Semester Genap 2013/2014 tidak terdapat penggunaan ruang dengan kapasitas kecil seperti ditunjukkan pada gambar 4.44.

4. Mata kuliah pemprograman yang diadakan pada hari Senin jam 12.30 hingga 15.00 cenderung memiliki nilai yang kurang seperti ditunjukkan pada tabel 4.33 pada cluster 3. Mata kuliah pemprograman yang diadakan pada hari Rabu jam 15.00 – 17.30 cenderung memiliki nilai baik.


(17)

106

Universitas Kristen Maranatha

5. Pengembangan perangkat lunak menggunakan PHP dan Java dapat dilakukan dengan menggunakan PHP dengan versi 5 ke atas yang sudah mendukung pemprograman berorientasi objek dan dengan server yang mendukung Java seperti Tomcat.

6.2. Saran

Penelitian untuk menganalisis data jadwal menggunakan graph-based

clustering ini masih dapat dikembangkan dan terus berkembang.

Algoritma-algoritma data mining untuk graph-based clustering pun terus dikembangkan. Pengembangan dapat dilakukan dengan berbagai cara. Saran-saran untuk pengembangan penelitian ini adalah:

1. Penelitian dapat dikembangkan menggunakan algoritma-algoritma

graph-based clustering lain. Penelitian menggunakan algoritma-algoritma yang lain

akan menguatkan hasil penelitian untuk menarik kesimpulan yang lebih matang.

2. Penelitian dapat dikembangkan menggunakan sampel data atau dataset yang berbeda menggunakan graph-based clustering. Penelitian menggunakan dataset yang berbeda. Dataset dengan jenis yang berbeda memungkinkan memperoleh hasil yang hasil yang lebih maksimal dengan graph-based

clustering.

3. Pengembangan perangkat lunak. Perangkat lunak dapat dikembangkan dengan menambahkan algoritma lain dalam graph-based clustering atau metode lain dalam data mining.


(18)

DAFTAR PUSTAKA

Han, Jiawei, Micheline Kamber, and Jian Pei. Data Mining Concepts and

Techniques. USA: Elsevier Inc., 2012.

Hermawati, Astuti Fajar. Data Mining. Yogyakarta: CV Andi Offset, 2013.

Prasetyo, Eko. Data Mining - Mengolah Data Menjadi Informasi Menggunakan

Matlab. Yogyakarta: CV. Andi Offset, 2014.

Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar. Introduction To Data

Mining. Boston: Pearson Education, Inc., 2006.

Widodo, Prabowo Pudjo, Rahmadya Trias Handayanto, and Herlawati. Penerapan

Data Mining dengan Matlab. Bandung: Rekayasa Sains, 2013.

Witten, Ian H, Eibe Frank, and Mark A Hall. Data Mining Practical Machine


(1)

1 Universitas Kristen Maranatha

BAB I

PENDAHULUAN

1.1. Latar Belakang

Perkembangan yang pesat dalam teknologi pengumpulan dan

penyimpanan data membuat data yang cukup besar dapat terakumulasi dengan mudah. Mengambil informasi yang berguna dari data tersebut pun menjadi hal yang sangat menantang. Teknik atau alat tradisional dalam mengolah data juga tidak dapat digunakan karena besarnya ukuran dari kumpulan data. Banyak data tersimpan dalam berbagai bidang seperti bisnis, obat-obatan, dan ilmu pengetahuan.

Data mining diperlukan untuk melakukan pengolahan data dengan jumlah yang banyak dan besar. Data mining adalah teknologi yang menyatukan teknik tradisional dalam menganalisis data dengan algortima yang canggih untuk memproses data (Tan, Steinbach and Kumar 2006). Data mentah yang jumlahnya banyak dan besar tidak hanya didiamkan, tetapi melalui proses data mining data tersebut dapat menghasilkan informasi yang berguna. Data mining membuka kesempatan mengetahui sesuatu yang baru dari data yang lama, dengan cara yang baru.

Metode graph-based clustering adalah salah satu metode data mining yang fleksibel. Metode ini dapat digunakan untuk data yang sifatnya tidak teratur atau bahkan data yang teratur, untuk data yang memiliki kesamaan atau tidak memiliki kesamaan antara satu dengan yang lainnya (Tan, Steinbach and Kumar 2006).

Dataset yang memiliki hubungan antar instance salah satunya adalah data jadwal. Data jadwal memiliki hubungan dari segi waktu dan tempat. Data jadwal dapat difokuskan lagi kedalam berbagai macam data salah satunya adalah data penjadwalan kuliah. Data penjadwalan kuliah adalah data jadwal setiap mata kuliah yang ada pada periode tertentu. Data tersebut menyediakan hari dan jam dimana mata kuliah akan dijalankan, dosen yang mengajar, tempat, dan informasi lain seperti jumlah sks setiap mata kuliah, semester mata kuliah, dan jenis mata kuliah. Graph-based clustering yang dapat dilakukan terhadap data penjadwalan


(2)

kuliah. Hasil clustering dapat melihat pengelompokan yang terjadi terhadap jadwal dan juga ruangan. Hasil tersebut dapat digunakan untuk pengambilan keputusan di masa depan dalam pembuatan jadwal kuliah.

1.2. Rumusan Masalah

Berdasarkan latar belakang yang terjadi maka dapat diambil dua rumusan masalah dalam penelitian ini. Rumusan masalah tersebut adalah:

1. Bagaimana melakukan analisis data mining menggunakan graph-based

clustering dengan algoritma simple k-means.

2. Bagaimana implementasi perangkat lunak untuk melakukan data mining

dengan graph-based clustering dengan algoritma simple k-means.

1.3. Tujuan

Berdasarkan rumusan masalah yang ada maka dapat diambil dua tujuan dari penelitian ini. Tujuan tersebut adalah:

1. Melakukan analisis graph-based clustering terhadap kelompok data

menggunakan algoritma simple k-means dengan perubahan parameter seed dan jumlah cluster.

2. Implementasi perangkat lunak untuk melakukan data mining dengan

graph-based clustering menggunakan algoritma simple k-means.

1.4. Batasan Masalah

Penelitian data mining menggunakan metode graph-based clustering ini perlu dibatasi agar tidak meluas. Batasan dari penelitian ini diantaranya adalah:

1. Aplikasi memproses file data dengan format .arff dan .csv.

2. Aplikasi melakukan proses data mining dengan graph-based clustering tanpa

memperhitungkan waktu pemrosesan.


(3)

3

Universitas Kristen Maranatha

1.5. Sistematika Pembahasan

Laporan penelitian mengenai graph-based clustering ini dibagi menjadi ke dalam enam bab besar. Setiap bab terbagi kedalam beberapa sub bab. Sistematika pembagian bab tersebut adalah:

Bab I adalah bab pendahuluan. Bab ini membahas latar belakang pembuatan penelitian data mining menggunakan graph-based clustering, masalah-masalah yang diangkat, tujuan dari penelitian, batasan dari penelitian, dan sistematika laporan penelitian.

Bab II adalah bab landasan teori. Bab ini memberikan informasi teori yang digunakan dalam penelitian. Teori analisis maupun implementasi. Bab ini memberikan informasi teori analisis mengenai data mining, apa itu data mining, data, clustering, graph-based clustering, dan Weka.

Bab III adalah bab analisis dan disain. Bab ini menjabarkan analisis mengenai graph-based clustering dan disain perancangan aplikasi. Bab ini terdiri dari analisis proses graph-based clustering, gambaran dari antarmuka aplikasi, antarmuka perangkat keras, antarmuka perangkat lunak, disain penyimpanan data, dan disain antarmuka aplikasi.

Bab IV adalah bab pengembangan perangkat lunak. Bab ini menjabarkan implementasi dari perangkat lunak yang dibuat dalam penelitian. Bab ini terdiri dari implementasi class, implementasi penyimpanan data, dan implementasi antarmuka aplikasi.

Bab V adalah bab testing dan evaluasi sistem. Bab ini melakukan testing terhadap aplikasi yang dibuat. Bab ini terdiri dari rencana pengujian yang akan dilakukan terhadap aplikasi dan pelaksanaan pengujian dengan metode white box dan black box testing.

Bab VI adalah bab kesimpulan dan saran. Bab terakhir ini akan membahas kesimpulan yang dihasilkan dari penelitian ini dan saran untuk pengembangan analisis data mining dengan graph-based clustering dan pengembangan aplikasi.


(4)

Bab VI berisi kesimpulan dan saran dari hasil penelitian. Bab ini memberikan kesimpulan terhadap hasil penelitian dari keseluruhan bab yang ada. Bab ini juga memberikan saran terhadap pengembangan penelitian.

6.1. Kesimpulan

Kesimpulan dari hasil penelitian untuk menganalisis data jadwal kuliah Fakultas Teknologi Informasi Semester Ganjil dan Genap 2013/2014 menggunakan graph-based clustering terdapat dalam lima point. Kesimpulan tersebut adalah:

1. Pada Semester Ganjil 2013/2014 terdapat banyak mata kuliah dengan

kualifikasi Utama dan Khusus pada hari Senin hingga Jumat seperti ditunjukkan pada tabel 4.9 sedangkan pada Semester Genap 2013/2014 terdapat banyak mata kuliah dengan kualifikasi Utama dan Pemprograman pada hari Senin, Selasa, dan Rabu seperti ditunjukkan pada tabel 4.15.

2. Terdapat kekosongan penggunaan ruang pada hari Kamis jam 09.30 – 12.00,

Jumat jam 09.30 – 15.00, dan Sabtu jam 17.30 – 22.30 pada pemakaian Ruang

baik untuk Ganjil dan Genap 2013/2014. Gambar 3.31 dan 4.43 menunjukkan grafik hasil clustering terhadap pemakaian Ruang pada Semester Ganjil dan Genap 2013/2014.

3. Terdapat penggunaan ruang dengan kapasitas kecil pada Semester Ganjil

2013/2014 seperti ditunjukkan pada gambar 4.32. Berbeda dengan Semester Ganjil 2013/2014, Semester Genap 2013/2014 tidak terdapat penggunaan ruang dengan kapasitas kecil seperti ditunjukkan pada gambar 4.44.


(5)

106

Universitas Kristen Maranatha

5. Pengembangan perangkat lunak menggunakan PHP dan Java dapat dilakukan

dengan menggunakan PHP dengan versi 5 ke atas yang sudah mendukung pemprograman berorientasi objek dan dengan server yang mendukung Java seperti Tomcat.

6.2. Saran

Penelitian untuk menganalisis data jadwal menggunakan graph-based clustering ini masih dapat dikembangkan dan terus berkembang. Algoritma-algoritma data mining untuk graph-based clustering pun terus dikembangkan. Pengembangan dapat dilakukan dengan berbagai cara. Saran-saran untuk pengembangan penelitian ini adalah:

1. Penelitian dapat dikembangkan menggunakan algoritma-algoritma

graph-based clustering lain. Penelitian menggunakan algoritma-algoritma yang lain akan menguatkan hasil penelitian untuk menarik kesimpulan yang lebih matang.

2. Penelitian dapat dikembangkan menggunakan sampel data atau dataset yang

berbeda menggunakan graph-based clustering. Penelitian menggunakan dataset yang berbeda. Dataset dengan jenis yang berbeda memungkinkan memperoleh hasil yang hasil yang lebih maksimal dengan graph-based clustering.

3. Pengembangan perangkat lunak. Perangkat lunak dapat dikembangkan dengan

menambahkan algoritma lain dalam graph-based clustering atau metode lain dalam data mining.


(6)

Han, Jiawei, Micheline Kamber, and Jian Pei. Data Mining Concepts and Techniques. USA: Elsevier Inc., 2012.

Hermawati, Astuti Fajar. Data Mining. Yogyakarta: CV Andi Offset, 2013.

Prasetyo, Eko. Data Mining - Mengolah Data Menjadi Informasi Menggunakan Matlab. Yogyakarta: CV. Andi Offset, 2014.

Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar. Introduction To Data Mining. Boston: Pearson Education, Inc., 2006.

Widodo, Prabowo Pudjo, Rahmadya Trias Handayanto, and Herlawati. Penerapan Data Mining dengan Matlab. Bandung: Rekayasa Sains, 2013.

Witten, Ian H, Eibe Frank, and Mark A Hall. Data Mining Practical Machine Learning Tools and Techniques. USA: Elsevier Inc, 2011.