Classification dan Clustering terhadap Data Mahasiswa Universitas Kristen Maranatha dengan Metode NBTree, X-means, dan DBScan.

(1)

ABSTRAK

Data merupakan hal yang crucial pada saat ini baik bagi perusahaan, pemerintahan, instansi, maupun individu yang ada. Kumpulan data yang ada dapat diolah menjadi suatu informasi yang berharga bagi setiap organisasi dan atau individu yang membutuhkannya. Salah satu kegunaan dari data yang terkumpul dalam bidang pendidikan adalah untuk membenahi dan meningkatkan kualitas pendidikan bagi mahasiswa. Data mining merupakan proses untuk mencari pola pada sekumpulan data besar dan diperoleh suatu pengetahuan. Dengan menggunakan beberapa metode seperti NBTree untuk classification, XMeans dan DBScan untuk clustering, maka dilakukan percobaan untuk menerapkan metode- metode tersebut pada analisis data mahasiswa. Dari hasil analisis dengan classification diperoleh pola dan dengan clustering diperoleh kelompok data (cluster). Pola dari tree yang terbentuk pada proses classification dan hasil kelompok data yang terbentuk pada proses clustering dapat memberikan sesuatu yang bermanfaat bagi jurusan, fakultas, dan universitas serta memberikan pengaruh terhadap kualitas dari mahasiswa.


(2)

ABSTRACT

Data is one of the crucial things at this time for companies, governments, institution, or individuals. A dataset can be a valuable information for those who need it. For example in education, a datasets can be used to improve the quality of education for students. Data mining is a process to search a pattern from datasets and get a knowledge from it. By using some method like NBTree in classification, XMeans and DBScan in clustering, some experiments is conducted to implemented those method to analyze student’s data. From classification result obtained a pattern and from clustering result obtained a group of data (cluster). Pattern from classification process and cluster from clustering process can give some benefit for department level, faculty level, and university level and also give some effect in student’s performances.


(3)

DAFTAR ISI

LEMBAR PENGESAHAN ... i

PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... ii

PRAKATA ... iii

ABSTRAK...v

ABSTRACT ... vi

DAFTAR ISI ... vii

DAFTAR TABEL ... xii

DAFTAR GAMBAR ...xv

DAFTAR LAMPIRAN ... xvii

BAB I PENDAHULUAN ...1

1.1. Latar Belakang ...1

1.2. Rumusan Masalah ...2

1.3. Tujuan ...2

1.4. Batasan Masalah...3

1.5. Sistematika Penulisan...3

BAB II LANDASAN TEORI ...5

2.1. Data Mining ...5

2.1.1. Classification ...6

2.1.1.1. Decision Tree ...6

2.1.1.2. Naïve Bayes Classifier ...8

2.1.1.3. NBTree ...10

2.1.2. Clustering ...11

2.1.2.1. DBScan ...11

2.1.2.2. XMeans ...12

2.1.3. Evaluasi dalam Data Mining ...13

2.1.3.1. Training & Testing ...14

2.1.3.2. Cross-validation ...14

2.2. WEKA ...15

2.2.1. Parameter DBScan ...16

2.2.2. Parameter XMeans ...16

2.2.3. Methodclass NBTree ...17

BAB III DESAIN & ANALISA SISTEM ...18

3.1. Unified Modeling Language (UML) ...18

3.1.1. Use Case Diagram ...18

3.1.1.1. Package Preprocessing ...19

3.1.1.2. Package Clustering ...19

3.1.1.3. Package Classification ...20

3.1.2. Activity Diagram ...21

3.1.2.1. Preprocessing ...22


(4)

3.1.2.1.2. Aktivitas Save File ...23

3.1.2.1.3. Aktivitas Remove Attribute ...24

3.1.2.1.4. Aktivitas Filter ...25

3.1.2.2. Clustering ...25

3.1.2.2.1. Aktivitas Load File ...26

3.1.2.2.2. Aktivitas Start Clustering ...26

3.1.2.2.3. Aktivitas Load Model ...28

3.1.2.2.4. Aktivitas View as Table ...28

3.1.2.2.5. Aktivitas View as Graphic ...29

3.1.2.2.6. Aktivitas View as Text ...30

3.1.2.2.7. Aktivitas Save Result ...31

3.1.2.2.8. Aktivitas Start Clustering Data Test ...31

3.1.2.2.9. Aktivitas Save Result ...33

3.1.2.2.10. Aktivitas Save Model ...33

3.1.2.3. Classification ...34

3.1.2.3.1. Aktivitas Load File ...34

3.1.2.3.2. Aktivitas Load Model ...35

3.1.2.3.3. Aktivitas View as Tree ...36

3.1.2.3.4. Aktivitas Start Classify ...36

3.1.2.3.5. Aktivitas View as Text ...38

3.1.2.3.6. Aktivitas Save Model ...38

3.1.2.3.7. Aktivitas Start Test Model ...39

3.1.2.3.8. Aktivitas View Result ...40

3.1.2.3.9. Aktivitas Start Prediction ...41

3.1.2.3.10. Aktivitas Save Result ...42

3.1.3. Class Diagram ...43

3.1.3.1. Class Diagram Attributes ...44

3.1.3.2. Class Diagram Classification ...44

3.1.3.3. Class Diagram ClassificationTreeFormat ...45

3.1.3.4. Class Diagram ClassificationModel ...45

3.1.3.5. Class Diagram ClusteringTableFormat ...46

3.1.3.6. Class Diagram Clustering ...46

3.1.3.7. Class Diagram FileProcessing ...46

3.1.3.8. Class Diagram ClusterModel ...47

3.1.3.9. Class Diagram InstancesCustom ...48

3.2. Rancangan Layout ...48

3.2.1. Layout MainForm ...48

3.2.2. Layout Preprocessing ...49

3.2.3. Layout Clustering ...50

3.2.4. Layout TableResult ...50

3.2.5. Layout Text Result ...51

3.2.6. Layout Classification ...51

3.2.7. Layout Tree View ...52


(5)

BAB IV PENGEMBANGAN PERANGKAT LUNAK ...53

4.1. Analisa terhadap penerapan metode Classification dan Clustering ...53

4.1.1. Classification ...53

4.1.1.1. Scope Universitas ...54

4.1.1.1.1. Data Mahasiswa Aktif jalur USM ...54

4.1.1.1.2. Data Mahasiswa Lulusan jalur USM ...60

4.1.1.2. Scope Fakultas ...66

4.1.1.1.3. Fakultas Ekonomi ...66

4.1.1.1.3.1. Data Mahasiswa Aktif jalur USM ...66

4.1.1.1.3.2. Data Mahasiswa Lulusan jalur USM ...70

4.1.1.1.4. Fakultas Teknologi Informasi ...75

4.1.1.1.4.1. Data Mahasiswa Aktif jalur USM ...75

4.1.1.1.4.2. Data Mahasiswa Lulusan jalur USM ...78

4.1.1.3. Scope Jurusan ...83

4.1.1.1.5. Jurusan Akuntansi ...83

4.1.1.1.5.1. Data Mahasiswa Aktif jalur USM ...83

4.1.1.1.5.2. Data Mahasiswa Lulusan jalur USM ...85

4.1.1.1.6. Jurusan Manajemen ...87

4.1.1.1.6.1. Data Mahasiswa Aktif jalur USM ...87

4.1.1.1.6.2. Data Mahasiswa Lulusan jalur USM ...91

4.1.1.1.7. Jurusan Teknik Informatika ...97

4.1.1.1.7.1. Data Mahasiswa Aktif jalur USM ...97

4.1.1.1.7.2. Data Mahasiswa Lulusan jalur USM ...100

4.1.1.1.8. Jurusan Sistem Informasi ...105

4.1.1.1.8.1. Data Mahasiswa Aktif jalur USM ...105

4.1.1.1.8.2. Data Mahasiswa Lulusan jalur USM ...108

4.1.2. Clustering ...111

4.1.2.1. Scope Universitas ...111

4.1.2.1.1. Data Mahasiswa Aktif jalur USM ...111

4.1.2.1.2. Data Mahasiswa Lulusan jalur USM ...113

4.1.2.2. Scope Fakultas ...115

4.1.2.2.1. Fakultas Ekonomi ...115

4.1.2.2.1.1. Data Mahasiswa Aktif jalur USM ...115

4.1.2.2.1.2. Data Mahasiswa Lulusan jalur USM ...117

4.1.2.2.2. Fakultas Teknologi Informasi ...119

4.1.2.2.2.1. Data Mahasiswa Aktif jalur USM ...120

4.1.2.2.2.2. Data Mahasiswa Lulusan jalur USM ...122

4.1.2.3. Scope Jurusan ...124

4.1.2.3.1. Jurusan Akuntansi ...124

4.1.2.3.1.1. Data Mahasiswa Aktif jalur USM ...124

4.1.2.3.1.2. Data Mahasiswa Lulusan jalur USM ...126

4.1.2.3.2. Jurusan Manajemen ...128

4.1.2.3.2.1. Data Mahasiswa Aktif jalur USM ...128


(6)

4.1.2.3.3. Jurusan Teknik Informatika ...132

4.1.2.3.3.1. Data Mahasiswa Aktif jalur USM ...132

4.1.2.3.3.2. Data Mahasiswa Lulusan jalur USM ...134

4.1.2.3.4. Jurusan Sistem Informasi ...136

4.1.2.3.4.1. Data Mahasiswa Aktif jalur USM ...136

4.1.2.3.4.2. Data Mahasiswa Lulusan jalur USM ...138

4.1.2.4. Pembahasan Clustering ...140

4.2. Implementasi Class ...140

4.2.1. Class Attribute ...140

4.2.2. Class Classification ...141

4.2.3. Class ClassificationModel ...142

4.2.4. Class ClassificationTreeFormat ...143

4.2.5. Class Clustering ...144

4.2.6. Class ClusteringTableFormat ...144

4.2.7. Class ClusterModel ...145

4.2.8. Class FileProcessing ...146

4.2.9. Class InstancesCustom ...147

4.3. Implementasi Code...149

4.3.1. Clustering Code ...149

4.3.2. Classification Code ...157

4.4. Implementasi Rancangan User Interface ...164

4.4.1. Main Form ...164

4.4.2. Preprocessing Form ...165

4.4.3. Clustering Form ...165

4.4.4. Table Result Form ...166

4.4.5. Text Result Form ...167

4.4.6. Classification Form ...167

4.4.7. Tree View Form ...168

4.4.8. Graphic Form ...169

4.5. Format File ...169

4.6. Modul Pendukung ...170

4.6.1. WEKA Library ...170

4.6.2. Aplikasi Lain ...170

BAB V TESTING DAN EVALUASI SISTEM ...172

5.1. Black Box Testing ...172

5.1.1. Main Form ...172

5.1.2. Clustering Form ...172

5.1.3. Classification Form ...173

5.1.4. Preprocessing Form ...174

5.1.5. Graphic Result Form ...175

5.1.6. Text Result Form ...175

5.1.7. Table Result Form ...176

5.1.8. Graphic Result Form ...176


(7)

5.2.1. Pengujian Class ClassificationModel ...176

5.2.2. Pengujian Class ClusteringModel ...179

5.3. Data Testing ...180

6.1. Kesimpulan ...184

6.2. Saran ...185


(8)

DAFTAR TABEL

Tabel 4.1. Hasil percobaan dataset perbandingan 1:2 (class StatusMahasiswa) ...55

Tabel 4.2. Hasil percobaan dataset perbandingan 1:3 (class StatusMahasiswa) ...55

Tabel 4.3. Hasil dengan SMOTE untuk class StatusMahasiswa ...56

Tabel 4.4. Dataset Mahasiswa Aktif (Universitas) ...56

Tabel 4.5. Confussion Matrix Mahasiswa Aktif (Universitas) ...57

Tabel 4.6. Leaf / rules dataset Mahasiswa Aktif (Universitas) ...58

Tabel 4.7. Dataset Mahasiswa Lulusan (Universitas) ...60

Tabel 4.8. Confussion Matrix Mahasiswa Lulusan class IPK (Universitas) ...61

Tabel 4.9. Leaf / rules dataset Mahasiswa Lulusan class IPK (Universitas) ...62

Tabel 4.10. Persentase pengaruh rules terhadap class ...62

Tabel 4.11 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Universitas) ...63

Tabel 4.12. Hasil leaf / rules Mahasiswa Lulusan LamaStudi scope Universitas ...64

Tabel 4.13. Dataset Mahasiswa Aktif (Fakultas Ekonomi) ...66

Tabel 4.14. Confussion Matrix Mahasiswa Aktif (Fakultas Ekonomi) ...67

Tabel 4.15. Leaf / rules dataset Mahasiswa Aktif (Fakultas Ekonomi) ...68

Tabel 4.16. Dataset Mahasiswa Lulusan (Fakultas Ekonomi) ...70

Tabel 4.17 Confussion Matrix Mahasiswa Lulusan class IPK (Fakultas Ekonomi) ...71

Tabel 4.18. Leaf / rules Mahasiswa Lulusan class IPK (Fakultas Ekonomi) ...72

Tabel 4.19 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Fakultas Ekonomi) ...73

Tabel 4.20. Leaf / rules Mahasiswa Lulusan class LamaStudi (Fakultas Ekonomi) ...74

Tabel 4.21. Dataset Mahasiswa Aktif (Fakultas Teknologi Informasi) ...75

Tabel 4.22. Confussion Matrix Mahasiswa Aktif (Fakultas Teknologi Informasi) ...76

Tabel 4.23. Leaf / rules Mahasiswa Aktif (Fakultas Teknologi Informasi) ...77

Tabel 4.24. Dataset Mahasiswa Lulusan (Fakultas Teknologi Informasi) ...78

Tabel 4.25 Confussion Matrix Mahasiswa Lulusan class IPK (Fakultas Teknologi Informasi) ...79

Tabel 4.26 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Fakultas Teknologi Informasi) ...79

Tabel 4.27. Leaf / rules Mahasiswa Lulusan class LamaStudi (Fakultas T. Informasi) ...81

Tabel 4.28. Dataset Mahasiswa Aktif (Jurusan Akuntansi) ...83

Tabel 4.29. Confussion Matrix Mahasiswa Aktif (Jurusan Akuntansi) ...84

Tabel 4.30. Dataset Mahasiswa Lulusan (Jurusan Akuntansi)...85

Tabel 4.31 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan Akuntansi) ...86

Tabel 4.32 Confussion Matrix Mahasiswa Lulusan LamaStudi jurusan Akuntansi ....86

Tabel 4.33. Leaf / rules Mahasiswa Lulusan class LamaStudi (Jurusan Akuntansi) ..87

Tabel 4.34. Dataset Mahasiswa Aktif (Jurusan Manajemen)...88

Tabel 4.35. Confussion Matrix Mahasiswa Aktif (Jurusan Manajemen) ...88

Tabel 4.36. Hasil leaf / rules Mahasiswa Aktif jurusan Manajemen ...90

Tabel 4.37. Dataset Mahasiswa Lulusan (Jurusan Manajemen) ...91

Tabel 4.38 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan Manajemen) 92 Tabel 4.39. Leaf / rules Mahasiswa Lulusan class IPK (Jurusan Manajemen) ...93

Tabel 4.40 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Jurusan Manajemen) ...94


(9)

Tabel 4.42. Dataset Mahasiswa Aktif (Jurusan Teknik Informatika) ...97

Tabel 4.43. Confussion Matrix Mahasiswa Aktif (Jurusan Teknik Informatika) ...98

Tabel 4.44. Leaf / rules Mahasiswa Aktif (Jurusan Teknik Informatika) ...99

Tabel 4.45. Dataset Mahasiswa Lulusan (Jurusan Teknik Informatika) ...100

Tabel 4.46 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan T. Informatika) ...101

Tabel 4.47. Leaf / rules Mahasiswa Lulusan class IPK (Jurusan T. Informatika) ....102

Tabel 4.48. Confussion Matrix Mahasiswa Lulusan class LamaStudi (Jurusan T. Informatika) ...103

Tabel 4.49. Leaf / rules Mahasiswa Lulusan class LamaStudi (Jurusan T. Informatika) ...104

Tabel 4.50. Dataset Mahasiswa Aktif (Jurusan Sistem Informasi) ...105

Tabel 4.51. Confussion Matrix Mahasiswa Aktif (Jurusan Sistem Informasi) ...106

Tabel 4.52. Leaf / rules Mahasiswa Aktif (Jurusan Sistem Informasi) ...107

Tabel 4.53. Dataset Mahasiswa Lulusan (Jurusan Sistem Informasi) ...108

Tabel 4.54 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan S. Informasi) ...108

Tabel 4.55 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Jurusan S. Informasi) ...109

Tabel 4.56. Hasil leaf / rules Mahasiswa Lulusan LamaStudi jurusan S. Informasi .110 Tabel 4.57. Centroidclustering data Mahasiswa Aktif (Universitas) ...112

Tabel 4.58. Cluster Mahasiswa Aktif (Universitas) ...112

Tabel 4.59. Hasil DBScan data Mahasiswa Aktif (Universitas) ...113

Tabel 4.60. Centroid clustering data Mahasiswa Lulusan (Universitas) ...114

Tabel 4.61. Cluster Mahasiswa Lulusan (Universitas) ...114

Tabel 4.62. Hasil DBScan terhadap data Mahasiswa Lulusan scope Universitas ...115

Tabel 4.63. Centroid clustering data Mahasiswa Aktif (Fakultas Ekonomi) ...116

Tabel 4.64. Cluster Mahasiswa Aktif (Fakultas Ekonomi) ...116

Tabel 4.65. Hasil DBScan data Mahasiswa Aktif (Fakultas Ekonomi) ...117

Tabel 4.66. Centroid clustering data Mahasiswa Lulusan (Fakultas Ekonomi) ...118

Tabel 4.67. Cluster Mahasiswa Lulusan (Fakultas Ekonomi) ...118

Tabel 4.68. Hasil DBScan data Mahasiswa Lulusan (Fakultas Ekonomi) ...119

Tabel 4.69. Centroid clustering data Mahasiswa Aktif (Fakultas T. Informasi) ...120

Tabel 4.70. Cluster Mahasiswa Aktif (Fakultas T. Informasi) ...121

Tabel 4.71. Hasil DBScan data Mahasiswa Aktif (Fakultas T. Informasi) ...121

Tabel 4.72. Centroid clustering data Mahasiswa Lulusan (Fakultas T. Informasi) ..122

Tabel 4.73. Cluster Mahasiswa Lulusan (Fakultas T. Informasi) ...123

Tabel 4.74. Hasil DBScan data Mahasiswa Lulusan (Fakultas T. Informasi) ...123

Tabel 4.75. Centroid clustering data Mahasiswa Aktif (Jurusan Akuntansi) ...124

Tabel 4.76. Cluster Mahasiswa Aktif (Jurusan Akuntansi) ...125

Tabel 4.77. Hasil DBScan data Mahasiswa Aktif (Jurusan Akuntansi) ...125

Tabel 4.78. Centroid clustering data Mahasiswa Lulusan (Jurusan Akuntansi) ...126

Tabel 4.79. Cluster Mahasiswa Lulusan (Jurusan Akuntansi) ...127

Tabel 4.80. Hasil DBScan data Mahasiswa Lulusan (Jurusan Akuntansi) ...127

Tabel 4.81. Centroid clustering data Mahasiswa Aktif (Jurusan Manajemen) ...128

Tabel 4.82. Cluster Mahasiswa Aktif (Jurusan Manajemen) ...129

Tabel 4.83. Hasil DBScan data Mahasiswa Aktif (Jurusan Manajemen) ...129

Tabel 4.84. Centroid clustering data Mahasiswa Lulusan (Jurusan Manajemen) ...130

Tabel 4.85. Cluster Mahasiswa Lulusan (Jurusan Manajemen) ...131


(10)

Tabel 4.87. Centroid clustering data Mahasiswa Aktif (Jurusan T. Informatika) ...132

Tabel 4.88. Cluster Mahasiswa Aktif (Jurusan T. Informatika) ...133

Tabel 4.89. Hasil DBScan data Mahasiswa Aktif (Jurusan T. Informatika) ...133

Tabel 4.90. Centroid clustering data Mahasiswa Lulusan (Jurusan T. Informatika) 134 Tabel 4.91. Cluster Mahasiswa Lulusan (Jurusan T. Informatika) ...135

Tabel 4.92. Hasil DBScan data Mahasiswa Lulusan (Jurusan T. Informatika) ...135

Tabel 4.93. Centroid clustering data Mahasiswa Aktif (Jurusan S. Informasi) ...136

Tabel 4.94. Cluster Mahasiswa Aktif (Jurusan S. Informasi) ...137

Tabel 4.95. Hasil DBScan data Mahasiswa Aktif (Jurusan S. Informasi) ...137

Tabel 4.96. Centroid clustering data Mahasiswa Lulusan (Jurusan S. Informasi) ....138

Tabel 4.97. Cluster Mahasiswa Lulusan (Jurusan S. Informasi) ...139

Tabel 4.98. Hasil DBScan data Mahasiswa Lulusan (Jurusan S. Informasi) ...139

Tabel 4.99. PropertyClass Attributes ...141

Tabel 4.100. Method Class Attributes ...141

Tabel 4.101. PropertyClass Classification ...141

Tabel 4.102. Method Class Classification ...141

Tabel 4.103. PropertyClass ClassificationModel ...142

Tabel 4.104. Method Class ClassificationModel ...142

Tabel 4.105. PropertyClass ClassificationTreeFormat ...143

Tabel 4.106. Method Class ClassificationTreeFormat ...143

Tabel 4.107. PropertyClass Clustering ...144

Tabel 4.108. Method Class Clustering ...144

Tabel 4.109. PropertyClass ClusteringTableFormat ...144

Tabel 4.110. Method Class ClusteringTableFormat ...145

Tabel 4.111. PropertyClass ClusterModel ...145

Tabel 4.112. Method Class ClusterModel ...145

Tabel 4.113. Method Class FileProcessing ...147

Tabel 4.114. PropertyClass InstancesCustom ...147

Tabel 4.115. Method Class InstancesCustom ...148

Tabel 4.116. Tabel format file ...169

Tabel 5.1. Pengujian Main Form ...172

Tabel 5.2. Pengujian Clustering Form ...173

Tabel 5.3. Pengujian Classification Form ...173

Tabel 5.4. Pengujian Preprocessing Form ...174

Tabel 5.5. Pengujian Graphic Result Form ...175

Tabel 5.6. Pengujian Text Result Form ...175

Tabel 5.7. Pengujian Table Result Form ...176

Tabel 5.8. Pengujian Graphic Result Form ...176

Tabel 5.9. Hasil classification ...181


(11)

DAFTAR GAMBAR

Gambar 2.1. Contoh dari Decision Tree (Han, et al. 2011:331) ... 6

Gambar 2.2. Skenario pemisahan Decision Tree (Han, et al. 2011:334) ... 8

Gambar 2.3. DBScan (Tan, et all. 2006:531) ... 12

Gambar 2.4. WEKA explorer ... 15

Gambar 3.1. Use Case Aplikasi ... 18

Gambar 3.2. Package Preprocessing ... 19

Gambar 3.3. Package Clustering ... 20

Gambar 3.4. Package Classificaiton ... 21

Gambar 3.5. Aktivitas Load File ... 22

Gambar 3.6. Aktivitas Save File ... 23

Gambar 3.7. Aktivitas Remove Attribute ... 24

Gambar 3.8. Aktivitas Filter ... 25

Gambar 3.9. Aktivitas Load File ... 26

Gambar 3.10. Aktivitas Start Clustering ... 27

Gambar 3.11. Aktivitas Load Model ... 28

Gambar 3.12. Aktivitas View as Table ... 29

Gambar 3.13. Aktivitas View as Graphic ... 30

Gambar 3.14. Aktivitas View as Text ... 30

Gambar 3.15. Aktivitas Save Result... 31

Gambar 3.16. Aktivitas Start Clustering Data Test ... 32

Gambar 3.17. Aktivitas Save Result... 33

Gambar 3.18. Aktivitas Save Model ... 34

Gambar 3.19. Aktivitas Load File ... 35

Gambar 3.20. Aktivitas Load Model ... 35

Gambar 3.21. Aktivitas View as Tree ... 36

Gambar 3.22. Aktivitas Start Classify ... 37

Gambar 3.23. Aktivitas View as Text ... 38

Gambar 3.24. Aktivitas Save Model ... 39

Gambar 3.25. Aktivitas Start Test Model ... 40

Gambar 3.26. Aktivitas View Result ... 41

Gambar 3.27. Aktivitas Start Prediction ... 42

Gambar 3.28. Aktivitas Save Result... 43

Gambar 3.29. Class diagram keseluruhan aplikasi ... 43

Gambar 3.30. Class Diagram Attributes ... 44

Gambar 3.31. Class Diagram Classification ... 44

Gambar 3.32. Class Diagram ClassificationTreeFormat ... 45

Gambar 3.33. Class Diagram ClassificationModel ... 45

Gambar 3.34. Class Diagram ClusteringTableFormat... 46

Gambar 3.35. Class Diagram Clustering ... 46

Gambar 3.36. Class Diagram FileProcessing ... 47

Gambar 3.37. Class Diagram ClusterModel ... 47


(12)

Gambar 3.39. Layout Main Form ... 49

Gambar 3.40. Layout Preprocessing... 49

Gambar 3.41. Layout Clustering ... 50

Gambar 3.42. Layout Table Result... 50

Gambar 3.43. Layout Text Result ... 51

Gambar 3.44. Layout Classification ... 51

Gambar 3.45. Layout Tree View ... 52

Gambar 3.46. Layout Graphic Result ... 52

Gambar 4.1. Tree Mahasiswa Aktif class StatusMahasiswa ... 58

Gambar 4.2. Tree Mahasiswa Lulusan class IPK ... 62

Gambar 4.3. Tree Mahasiswa Lulusan class LamaStudi ... 64

Gambar 4.4. Tree Mahasiswa Aktif class StatusMahasiswa ... 68

Gambar 4.5. Tree Mahasiswa Lulusan class IPK ... 72

Gambar 4.6. Tree Mahasiswa Lulusan class LamaStudi ... 74

Gambar 4.7. Tree Mahasiswa Aktif class StatusMahasiswa ... 77

Gambar 4.8. Tree Mahasiswa Lulusan class LamaStudi ... 81

Gambar 4.9. Tree Mahasiswa Lulusan class LamaStudi ... 87

Gambar 4.10. Tree Mahasiswa Aktif class StatusMahasiswa ... 89

Gambar 4.11. Tree Mahasiswa Lulusan class IPK ... 93

Gambar 4.12. Tree Mahasiswa Lulusan class LamaStudi ... 95

Gambar 4.13. Tree Mahasiswa Aktif class StatusMahasiswa ... 99

Gambar 4.14. Tree Mahasiswa Lulusan class IPK ... 102

Gambar 4.15. Tree Mahasiswa Lulusan class LamaStudi ... 104

Gambar 4.16. Tree Mahasiswa Aktif (Jurusan Sistem Informasi) ... 107

Gambar 4.17. Tree Mahasiswa Lulusan class LamaStudi ... 110

Gambar 4.18. Contoh hasil SetResultStatisticForDataTest ... 153

Gambar 4.19. Hasil tabel default ... 154

Gambar 4.20. Hasil tabel pivot... 154

Gambar 4.21. Hasil pivot table ... 156

Gambar 4.22. Hasil dalam bentuk grafik ... 157

Gambar 4.23. Hasil tree yang telah diolah ... 161

Gambar 4.24. Main Form ... 164

Gambar 4.26. Clustering Form ... 166

Gambar 4.27. Table Result Form ... 166

Gambar 4.28. Text Result Form ... 167

Gambar 4.29. Classification Form ... 168

Gambar 4.30. Tree Result Form... 168

Gambar 4.31. Graphic Form... 169

Gambar 4.32. Aplikasi pendukung ... 171

Gambar 5.1. Pengujian methodclassifyDataTest ... 178


(13)

DAFTAR KODE PROGRAM

Kode Program 2.1. Pseudo-code untuk Decision Tree (Han, et al. 2011:333) ... 7

Kode Program 2.2. Pseudo-code NBTree ... 10

Kode Program 4.1. Tree Mahasiswa Aktif (Universitas) ... 58

Kode Program 4.2. Tree Mahasiswa Lulusan class IPK (Universitas) ... 61

Kode Program 4.3. Tree Mahasiswa Lulusan class LamaStudi (Universitas) ... 64

Kode Program 4.4. Tree Mahasiswa Aktif (Fakultas Ekonomi) ... 68

Kode Program 4.5. Tree Mahasiswa Lulusan class IPK (Fakultas Ekonomi) ... 71

Kode Program 4.6. Tree Mahasiswa Lulusan class LamaStudi (Fakultas Ekonomi) ... 73

Kode Program 4.7. Tree Mahasiswa Aktif (Fakultas Teknologi Informasi) ... 76

Kode Program 4.8. Tree Mahasiswa Lulusan class LamaStudi (Fakultas T. Informasi) . 80 Kode Program 4.9. Tree Mahasiswa Lulusan class LamaStudi (Jurusan Akuntansi) ... 87

Kode Program 4.10. Tree Mahasiswa Aktif (Jurusan Manajemen) ... 89

Kode Program 4.11. Tree Mahasiswa Lulusan class IPK (Jurusan Manajemen) ... 92

Kode Program 4.12. Tree Mahasiswa Lulusan class LamaStudi (Jurusan Manajemen) .. 95

Kode Program 4.13. Tree Mahasiswa Aktif (Jurusan Teknik Informatika) ... 98

Kode Program 4.14. Tree Mahasiswa Lulusan class IPK (Jurusan T. Informatika) ... 102

Kode Program 4.15. Tree Mahasiswa Lulusan class LamaStudi ... 104

Kode Program 4.16. Tree Mahasiswa Aktif (Jurusan Sistem Informasi) ... 106

Kode Program 4.17. Tree Mahasiswa Lulusan class LamaStudi (Jurusan S.Informasi) 110 Kode Program 4.18. Kode ClusterDataTest ... 149

Kode Program 4.18. Kode ClusterDataTest (lanjutan) ... 150

Kode Program 4.19. Kode SplitByCluster ... 151

Kode Program 4.20. Kode SetResultStatisticForDataTest ... 152

Kode Program 4.20. Kode SetResultStatisticForDataTest (lanjutan) ... 153

Kode Program 4.21. Kode SetResultTableForDataTest ... 154

Kode Program 4.22. Kode inverseDataTable ... 155

Kode Program 4.22. Kode inverseDataTable (lanjutan) ... 156

Kode Program 4.23. Kode doNBTreeClassification ... 157

Kode Program 4.24. Kode setTreeModelForNBTree ... 158

Kode Program 4.25. Outputtree WEKA ... 159

Kode Program 4.26. Output leaf WEKA ... 159

Kode Program 4.27. Outputtree untuk proses ... 160

Kode Program 4.28. Kode createTree ... 160

Kode Program 4.28. Kode createTree (lanjutan) ... 161

Kode Program 4.29. Kode classifyDataTest ... 162

Kode Program 4.29. Kode classifyDataTest (lanjutan) ... 163

Kode Program 5.1. Kode method classifyDataTest (lanjutan) ... 177

Kode Program 5.1. Kode method classifyDataTest (lanjutan) ... 178

Kode Program 5.2. Kode method clusterDataTest ... 179


(14)

DAFTAR LAMPIRAN

LAMPIRAN A - CLASSIFICATION ... A-1 LAMPIRAN B - CLUSTERING ... B-1


(15)

BAB I

PENDAHULUAN

1.1. Latar Belakang

Data merupakan hal yang crucial pada saat ini. Baik bagi perusahaan, pemerintahan, instansi, maupun masing-masing individu yang ada. Setiap harinya, jumlah data yang ada semakin bertambah dan semakin menumpuk. Dengan perkembangan internet pada saat ini dan kemudahan mengaksesnya, jumlah data maupun tumpukan data akan semakin bertambah. Timbunan data-data tersebut dapat menjadi timbunan yang tidak berguna jika tidak ada yang dapat memanfaatkannya dengan baik. Pemrosesan data-data secara manual sangat sulit untuk dilakukan melihat banyaknya data yang ada saat ini. Salah satu data yang menyediakan informasi yang bermanfaat adalah data di dalam bidang pendidikan. Terdapat cukup banyak data dalam bidang tersebut yang setiap semesternya dapat bertambah. Sayangnya, pengelolaan data dalam bidang tersebut hanya sekedar melihat secara sekilas saja. Dengan jumlah data yang memadahi dan cara yang tepat dapat diperoleh sebuah informasi yang mungkin sangat bermanfaat untuk membenahi atau memajukan bidang pendidikan.

Data mining merupakan proses untuk mencari sebuah pola dalam sekumpulan data yang besar sehingga diperoleh sebuah pengetahuan yang bermanfaat (Han, et al. 2012:8). Penerapan data mining sendiri dapat dilakukan di dalam berbagai bidang yang ada sekarang. Terdapat dua kategori di dalam pencarian pola dalam data mining yaitu descriptive, misalnya clustering dan predictive, misalnya classification (Han, et al. 2012: 15). Data yang digunakan akan mempengaruhi error rate dari teknik yang digunakan untuk mengelola data tersebut. Implementasi data mining dalam bidang pendidikan khususnya untuk tingkat universitas akan sangat membantu di dalam memperoleh suatu pola atau pattern data baik dari data mahasiswa maupun dari data dosen. Dengan studi kasus terhadap data mahasiswa pada beberapa fakultas di Universitas Kristen Maranatha dilakukanlah penerapan data mining untuk mendapatkan pola atau pattern yang dapat bermanfaat bagi universitas maupun fakultas yang ada.


(16)

2

Tugas Akhir ini merupakan pengembangan ide dari hibah bersaing (Ayub & Kristanti, 2013). Dalam Tugas Akhir ini akan dibuat dan diimplementasikan sebuah aplikasi untuk clustering dan classification yang membantu analisis data-data tersebut. Dilakukan juga analisa terhadap pola atau pattern yang terbentuk dari hasil classification dan clustering yang dilakukan dalam Tugas Akhir. Sehingga diperoleh hasil yang bermanfaat bagi universitas untuk meningkatkan kualitas pendidikan mahasiswa yang ada.

1.2. Rumusan Masalah

Rumusan masalah yang muncul dari latar belakang tersebut adalah: 1. Pola atau pattern seperti apa yang dihasilkan dari classification yang

mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa?

2. Di dalam melakukan clustering, metode apa yang disarankan untuk melakukan clustering terhadap dataset mahasiswa Universitas Kristen Maranatha?

1.3. Tujuan

Tujuan dilakukannya penelitian dan pembuatan aplikasi adalah:

1. Memperoleh pola atau pattern yang dihasilkan dari classification yang mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa.

2. Mendapatkan metode yang disarankan untuk melakukan clustering terhadap dataset mahasiswa Universitas Kristen Maranatha.


(17)

3

1.4. Batasan Masalah

Beberapa batasan masalah yang diberikan adalah:

1. Data yang digunakan adalah data mahasiswa beberapa fakultas yaitu fakultas Ekonomi dan fakultas Teknologi Informasi yang sudah berupa schema.

2. Data Mahasiswa yang digunakan dipisahkan menjadi dua, yaitu data Mahasiswa Aktif tahun pertama (semester 1 & 2) dan data Mahasiswa Lulusan.

3. Schema yang digunakan dalam Tugas Akhir ini berasal dari hibah bersaing (Ayub & Kristanti, 2013) yang diimplementasikan sebagai data mart dalam Kerja Praktek (Natalia, 2013).

4. Metode classification yang digunakan adalah NBTree sedangkan metode clustering yang digunakan adalah DBScan dan XMeans. 5. Aplikasi yang dibuat menggunakan library yang telah disediakan oleh

WEKA dan dikhususkan untuk mengolah data mahasiswa di Universitas Kristen Maranatha.

6. Dalam classification, hal yang dianalisis meliputi data mahasiswa aktif untuk mencari attribute yang mempengaruhi drop-out, data mahasiswa lulus untuk mencari attribute yang mempengaruhi IPK dan lama studi. 7. Dalam clustering, dilakukan pembentukkan cluster dengan metode yang ada yaitu X-Means dan DBScan, dilakukan perbandingan untuk mencari metode yang sesuai terhadap dataset yang digunakan.

1.5. Sistematika Penulisan

Sistematika penulisan untuk tugas akhir ini adalah : BAB I PENDAHULUAN

Bab ini menjelaskan latar belakang, rumusan masalah, tujuan, batasan masalah dan sistematika pembahasan.

BAB II LANDASAN TEORI

Bab ini menjelaskan teori-teori yang berkaitan dengan pembuatan sistem dan mendukung pembuatan sistem atau aplikasi yang ada.


(18)

4

BAB III ANALISIS DAN DISAIN

Bab ini menjelaskan bagaimana analisis keadaan, kebutuhan dari aplikasi, perancangan aplikasi, UML, dan gambaran arsitektur dari aplikasi yang dibuat.

BAB IV PENGEMBANGAN PERANGKAT LUNAK

Bab ini digunakan untuk menjelaskan mengenai implementasi dari teknik serta perancangan aplikasi dan hasil yang didapat dari percobaan yang telah dilakukan dalam Tugas Akhir.

BAB V TESTING DAN EVALUASI SISTEM

Bab ini menjelaskan tentang pengujian dari teknik atau aplikasi yang telah dibuat beserta testing terhadap hasil percobaan yang telah dilakukan dalam Tugas Akhir.

BAB VI KESIMPULAN DAN SARAN

Bab ini menjelaskan mengenai kesimpulan yang didapatkan dari hasil implementasi atau penelitian.


(19)

BAB VI

KESIMPULAN DAN SARAN

Bab VI digunakan untuk menyatakan kesimpulan yang diperoleh dalam Tugas Akhir dan saran yang diberikan untuk pengembangan berikutnya.

6.1. Kesimpulan

Berdasarkan implementasi yang telah dilakukan dan percobaan yang dilakukan, dihasilkan beberapa kesimpulan seperti:

1. Pola atau pattern yang didapatkan dalam classification yang dilakukan dengan menggunakan NBTree pada dataset mahasiswa aktif dan lulusan yang mempengaruhi mempengaruhi drop-out, lama masa studi, dan tingkat IPK mahasiswa memiliki pola atau pattern yang berbeda-beda. Hal ini dipengaruhi oleh karakteristik dataset sesuai dengan scope-nya masing-masing. Pola atau pattern yang didapatkankan dapat dilihat pada pembahasan bab IV subbab 4.1.1 pada masing-masing scope dan dataset yang digunakan.

2. Metode yang sesuai untuk dataset yang digunakan, yaitu data mahasiswa Universitas Kristen Maranatha, adalah metode X-Means. Metode DBScan tidak sesuai untuk melakukan pengelompokan pada dataset atau studi kasus yang digunakan karena jumlah cluster yang terbentuk terlalu besar dan jumlah unclustered instances yang muncul masih tergolong besar. Pembahasan lebih lanjut mengenai hal ini dapat dilihat pada bab IV subbab 4.1.2 dan 4.1.2.4.


(20)

185

6.2. Saran

Beberapa saran yang dapat diberikan setelah percobaan dan analisis yang dilakukan adalah:

1. Dengan menggunakan pola yang didapat dengan menggunakan NBTree, dapat dilakukan penelitian lebih lanjut mengenai model yang terbentuk dan attribute yang digunakan sehingga diperoleh hasil yang lebih baik dan lebih bermanfaat lagi.

2. Perlunya dilakukan pemeriksaan terhadap data yang telah dijadikan sebagai data training (schema yang digunakan) dengan data asli yang ada agar mendapatkan hasil yang lebih valid dan lebih baik untuk hasil yang didapat.


(21)

DAFTAR PUSTAKA

Ayub, M., & Kristanti, T. (2013). Model Analisis Classification dan Clustering untuk Data Mahasiswa dan Dosen di Perguruan Tinggi. Bandung: Laporan Hibah Bersaing DIKTI tahun anggaran 2013 di Universitas Kristen Maranatha.

Chonoles, M. J., & Schardt, J. A. (2003). UML 2 for Dummies. Indianapolis: Wiley Publishing.

Ganganwar, V. (2012). An overview of classification algorithms for imbalanced datasets. International Journal of Emerging Technology and Adavanced Engineering, 42-47.

Gorunescu, F. (2011). Data Mining Concepts, Models and Techniques. Berlin: Springer.

Han, J., Kamber, M., & Pei, J. (2011). Data Mining Concepts and Techniques Third Edition. Waltham: Elsevier Inc.

Kohavi, R. (1996). Scaling Up the Accuracy of Naive-Bayes Classifiers: a Decision-Tree Hybrid.

Natalia, L. A. (2013). Implementasi Skema Star dan Snowflake dalam pembuatan data mart dengan menggunakan data mahasiswa dan dosen di Universitas Kristen Maranatha. Bandung: Laporan Kerja Praktek Program Studi Teknik Informatika Universitas Kristen Maranatha.

Pelleg, D., & Moore, A. (2000). X-means: Extending K-means with Efficient Estimation of the Number of CLusters.

Penker, M., Lyons, B., Fado, D., & Eriksson, H.-E. (2004). UMK 2 Toolkit. Indianapolis: Wiley Publishing.

Sempf, B. (2010). C# 2010 all-in-one for Dummies. Indianapolis: Wiley Publishing. Silberschatz, A., Korth, H. F., & Sudarshan, S. (2011). Database System Concepts

Sixth Edition. New York: McGraw-Hill.

Tan, P.-N., Steinbach, M., & Kumar, V. (2006). Introduction to Data Mining. Boston: Pearson.

Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining Practical Machine Learning. Burlington: Elsevier


(1)

Tugas Akhir ini merupakan pengembangan ide dari hibah bersaing (Ayub & Kristanti, 2013). Dalam Tugas Akhir ini akan dibuat dan diimplementasikan sebuah aplikasi untuk clustering dan classification yang membantu analisis data-data tersebut. Dilakukan juga analisa terhadap pola atau

pattern yang terbentuk dari hasil classification dan clustering yang dilakukan dalam Tugas Akhir. Sehingga diperoleh hasil yang bermanfaat bagi universitas untuk meningkatkan kualitas pendidikan mahasiswa yang ada.

1.2. Rumusan Masalah

Rumusan masalah yang muncul dari latar belakang tersebut adalah: 1. Pola atau pattern seperti apa yang dihasilkan dari classification yang

mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa?

2. Di dalam melakukan clustering, metode apa yang disarankan untuk melakukan clustering terhadap dataset mahasiswa Universitas Kristen Maranatha?

1.3. Tujuan

Tujuan dilakukannya penelitian dan pembuatan aplikasi adalah:

1. Memperoleh pola atau pattern yang dihasilkan dari classification yang mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa.

2. Mendapatkan metode yang disarankan untuk melakukan clustering


(2)

Universitas Kristen Maranatha

1.4. Batasan Masalah

Beberapa batasan masalah yang diberikan adalah:

1. Data yang digunakan adalah data mahasiswa beberapa fakultas yaitu fakultas Ekonomi dan fakultas Teknologi Informasi yang sudah berupa

schema.

2. Data Mahasiswa yang digunakan dipisahkan menjadi dua, yaitu data Mahasiswa Aktif tahun pertama (semester 1 & 2) dan data Mahasiswa Lulusan.

3. Schema yang digunakan dalam Tugas Akhir ini berasal dari hibah bersaing (Ayub & Kristanti, 2013) yang diimplementasikan sebagai data mart dalam Kerja Praktek (Natalia, 2013).

4. Metode classification yang digunakan adalah NBTree sedangkan metode clustering yang digunakan adalah DBScan dan XMeans. 5. Aplikasi yang dibuat menggunakan library yang telah disediakan oleh

WEKA dan dikhususkan untuk mengolah data mahasiswa di Universitas Kristen Maranatha.

6. Dalam classification, hal yang dianalisis meliputi data mahasiswa aktif untuk mencari attribute yang mempengaruhi drop-out, data mahasiswa lulus untuk mencari attribute yang mempengaruhi IPK dan lama studi. 7. Dalam clustering, dilakukan pembentukkan cluster dengan metode yang ada yaitu X-Means dan DBScan, dilakukan perbandingan untuk mencari metode yang sesuai terhadap dataset yang digunakan.

1.5. Sistematika Penulisan

Sistematika penulisan untuk tugas akhir ini adalah : BAB I PENDAHULUAN

Bab ini menjelaskan latar belakang, rumusan masalah, tujuan, batasan masalah dan sistematika pembahasan.

BAB II LANDASAN TEORI

Bab ini menjelaskan teori-teori yang berkaitan dengan pembuatan sistem dan mendukung pembuatan sistem atau aplikasi yang ada.


(3)

BAB III ANALISIS DAN DISAIN

Bab ini menjelaskan bagaimana analisis keadaan, kebutuhan dari aplikasi, perancangan aplikasi, UML, dan gambaran arsitektur dari aplikasi yang dibuat.

BAB IV PENGEMBANGAN PERANGKAT LUNAK

Bab ini digunakan untuk menjelaskan mengenai implementasi dari teknik serta perancangan aplikasi dan hasil yang didapat dari percobaan yang telah dilakukan dalam Tugas Akhir.

BAB V TESTING DAN EVALUASI SISTEM

Bab ini menjelaskan tentang pengujian dari teknik atau aplikasi yang telah dibuat beserta testing terhadap hasil percobaan yang telah dilakukan dalam Tugas Akhir.

BAB VI KESIMPULAN DAN SARAN

Bab ini menjelaskan mengenai kesimpulan yang didapatkan dari hasil implementasi atau penelitian.


(4)

184

Universitas Kristen Maranatha

BAB VI

KESIMPULAN DAN SARAN

Bab VI digunakan untuk menyatakan kesimpulan yang diperoleh dalam Tugas Akhir dan saran yang diberikan untuk pengembangan berikutnya.

6.1. Kesimpulan

Berdasarkan implementasi yang telah dilakukan dan percobaan yang dilakukan, dihasilkan beberapa kesimpulan seperti:

1. Pola atau pattern yang didapatkan dalam classification yang dilakukan dengan menggunakan NBTree pada dataset mahasiswa aktif dan lulusan yang mempengaruhi mempengaruhi drop-out, lama masa studi, dan tingkat IPK mahasiswa memiliki pola atau pattern yang berbeda-beda. Hal ini dipengaruhi oleh karakteristik dataset sesuai dengan

scope-nya masing-masing. Pola atau pattern yang didapatkankan dapat dilihat pada pembahasan bab IV subbab 4.1.1 pada masing-masing

scope dan dataset yang digunakan.

2. Metode yang sesuai untuk dataset yang digunakan, yaitu data mahasiswa Universitas Kristen Maranatha, adalah metode X-Means. Metode DBScan tidak sesuai untuk melakukan pengelompokan pada

dataset atau studi kasus yang digunakan karena jumlah cluster yang terbentuk terlalu besar dan jumlah unclustered instances yang muncul masih tergolong besar. Pembahasan lebih lanjut mengenai hal ini dapat dilihat pada bab IV subbab 4.1.2 dan 4.1.2.4.


(5)

6.2. Saran

Beberapa saran yang dapat diberikan setelah percobaan dan analisis yang dilakukan adalah:

1. Dengan menggunakan pola yang didapat dengan menggunakan NBTree, dapat dilakukan penelitian lebih lanjut mengenai model yang terbentuk dan attribute yang digunakan sehingga diperoleh hasil yang lebih baik dan lebih bermanfaat lagi.

2. Perlunya dilakukan pemeriksaan terhadap data yang telah dijadikan sebagai data training (schema yang digunakan) dengan data asli yang ada agar mendapatkan hasil yang lebih valid dan lebih baik untuk hasil yang didapat.


(6)

186

Universitas Kristen Maranatha

DAFTAR PUSTAKA

Ayub, M., & Kristanti, T. (2013). Model Analisis Classification dan Clustering untuk Data Mahasiswa dan Dosen di Perguruan Tinggi. Bandung: Laporan Hibah Bersaing DIKTI tahun anggaran 2013 di Universitas Kristen Maranatha.

Chonoles, M. J., & Schardt, J. A. (2003). UML 2 for Dummies. Indianapolis: Wiley Publishing.

Ganganwar, V. (2012). An overview of classification algorithms for imbalanced datasets. International Journal of Emerging Technology and Adavanced Engineering, 42-47.

Gorunescu, F. (2011). Data Mining Concepts, Models and Techniques. Berlin: Springer.

Han, J., Kamber, M., & Pei, J. (2011). Data Mining Concepts and Techniques Third Edition. Waltham: Elsevier Inc.

Kohavi, R. (1996). Scaling Up the Accuracy of Naive-Bayes Classifiers: a Decision-Tree Hybrid.

Natalia, L. A. (2013). Implementasi Skema Star dan Snowflake dalam pembuatan data mart dengan menggunakan data mahasiswa dan dosen di Universitas Kristen Maranatha. Bandung: Laporan Kerja Praktek Program Studi Teknik Informatika Universitas Kristen Maranatha.

Pelleg, D., & Moore, A. (2000). X-means: Extending K-means with Efficient Estimation of the Number of CLusters.

Penker, M., Lyons, B., Fado, D., & Eriksson, H.-E. (2004). UMK 2 Toolkit.

Indianapolis: Wiley Publishing.

Sempf, B. (2010). C# 2010 all-in-one for Dummies. Indianapolis: Wiley Publishing. Silberschatz, A., Korth, H. F., & Sudarshan, S. (2011). Database System Concepts

Sixth Edition. New York: McGraw-Hill.

Tan, P.-N., Steinbach, M., & Kumar, V. (2006). Introduction to Data Mining.

Boston: Pearson.

Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining Practical Machine Learning. Burlington: Elsevier