Classification dan Clustering terhadap Data Mahasiswa Universitas Kristen Maranatha dengan Metode NBTree, X-means, dan DBScan.
ABSTRAK
Data merupakan hal yang crucial pada saat ini baik bagi perusahaan, pemerintahan, instansi, maupun individu yang ada. Kumpulan data yang ada dapat diolah menjadi suatu informasi yang berharga bagi setiap organisasi dan atau individu yang membutuhkannya. Salah satu kegunaan dari data yang terkumpul dalam bidang pendidikan adalah untuk membenahi dan meningkatkan kualitas pendidikan bagi mahasiswa. Data mining merupakan proses untuk mencari pola pada sekumpulan data besar dan diperoleh suatu pengetahuan. Dengan menggunakan beberapa metode seperti NBTree untuk classification, XMeans dan DBScan untuk clustering, maka dilakukan percobaan untuk menerapkan metode- metode tersebut pada analisis data mahasiswa. Dari hasil analisis dengan classification diperoleh pola dan dengan clustering diperoleh kelompok data (cluster). Pola dari tree yang terbentuk pada proses classification dan hasil kelompok data yang terbentuk pada proses clustering dapat memberikan sesuatu yang bermanfaat bagi jurusan, fakultas, dan universitas serta memberikan pengaruh terhadap kualitas dari mahasiswa.
(2)
ABSTRACT
Data is one of the crucial things at this time for companies, governments, institution, or individuals. A dataset can be a valuable information for those who need it. For example in education, a datasets can be used to improve the quality of education for students. Data mining is a process to search a pattern from datasets and get a knowledge from it. By using some method like NBTree in classification, XMeans and DBScan in clustering, some experiments is conducted to implemented those method to analyze student’s data. From classification result obtained a pattern and from clustering result obtained a group of data (cluster). Pattern from classification process and cluster from clustering process can give some benefit for department level, faculty level, and university level and also give some effect in student’s performances.
(3)
DAFTAR ISI
LEMBAR PENGESAHAN ... i
PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... ii
PRAKATA ... iii
ABSTRAK...v
ABSTRACT ... vi
DAFTAR ISI ... vii
DAFTAR TABEL ... xii
DAFTAR GAMBAR ...xv
DAFTAR LAMPIRAN ... xvii
BAB I PENDAHULUAN ...1
1.1. Latar Belakang ...1
1.2. Rumusan Masalah ...2
1.3. Tujuan ...2
1.4. Batasan Masalah...3
1.5. Sistematika Penulisan...3
BAB II LANDASAN TEORI ...5
2.1. Data Mining ...5
2.1.1. Classification ...6
2.1.1.1. Decision Tree ...6
2.1.1.2. Naïve Bayes Classifier ...8
2.1.1.3. NBTree ...10
2.1.2. Clustering ...11
2.1.2.1. DBScan ...11
2.1.2.2. XMeans ...12
2.1.3. Evaluasi dalam Data Mining ...13
2.1.3.1. Training & Testing ...14
2.1.3.2. Cross-validation ...14
2.2. WEKA ...15
2.2.1. Parameter DBScan ...16
2.2.2. Parameter XMeans ...16
2.2.3. Methodclass NBTree ...17
BAB III DESAIN & ANALISA SISTEM ...18
3.1. Unified Modeling Language (UML) ...18
3.1.1. Use Case Diagram ...18
3.1.1.1. Package Preprocessing ...19
3.1.1.2. Package Clustering ...19
3.1.1.3. Package Classification ...20
3.1.2. Activity Diagram ...21
3.1.2.1. Preprocessing ...22
(4)
3.1.2.1.2. Aktivitas Save File ...23
3.1.2.1.3. Aktivitas Remove Attribute ...24
3.1.2.1.4. Aktivitas Filter ...25
3.1.2.2. Clustering ...25
3.1.2.2.1. Aktivitas Load File ...26
3.1.2.2.2. Aktivitas Start Clustering ...26
3.1.2.2.3. Aktivitas Load Model ...28
3.1.2.2.4. Aktivitas View as Table ...28
3.1.2.2.5. Aktivitas View as Graphic ...29
3.1.2.2.6. Aktivitas View as Text ...30
3.1.2.2.7. Aktivitas Save Result ...31
3.1.2.2.8. Aktivitas Start Clustering Data Test ...31
3.1.2.2.9. Aktivitas Save Result ...33
3.1.2.2.10. Aktivitas Save Model ...33
3.1.2.3. Classification ...34
3.1.2.3.1. Aktivitas Load File ...34
3.1.2.3.2. Aktivitas Load Model ...35
3.1.2.3.3. Aktivitas View as Tree ...36
3.1.2.3.4. Aktivitas Start Classify ...36
3.1.2.3.5. Aktivitas View as Text ...38
3.1.2.3.6. Aktivitas Save Model ...38
3.1.2.3.7. Aktivitas Start Test Model ...39
3.1.2.3.8. Aktivitas View Result ...40
3.1.2.3.9. Aktivitas Start Prediction ...41
3.1.2.3.10. Aktivitas Save Result ...42
3.1.3. Class Diagram ...43
3.1.3.1. Class Diagram Attributes ...44
3.1.3.2. Class Diagram Classification ...44
3.1.3.3. Class Diagram ClassificationTreeFormat ...45
3.1.3.4. Class Diagram ClassificationModel ...45
3.1.3.5. Class Diagram ClusteringTableFormat ...46
3.1.3.6. Class Diagram Clustering ...46
3.1.3.7. Class Diagram FileProcessing ...46
3.1.3.8. Class Diagram ClusterModel ...47
3.1.3.9. Class Diagram InstancesCustom ...48
3.2. Rancangan Layout ...48
3.2.1. Layout MainForm ...48
3.2.2. Layout Preprocessing ...49
3.2.3. Layout Clustering ...50
3.2.4. Layout TableResult ...50
3.2.5. Layout Text Result ...51
3.2.6. Layout Classification ...51
3.2.7. Layout Tree View ...52
(5)
BAB IV PENGEMBANGAN PERANGKAT LUNAK ...53
4.1. Analisa terhadap penerapan metode Classification dan Clustering ...53
4.1.1. Classification ...53
4.1.1.1. Scope Universitas ...54
4.1.1.1.1. Data Mahasiswa Aktif jalur USM ...54
4.1.1.1.2. Data Mahasiswa Lulusan jalur USM ...60
4.1.1.2. Scope Fakultas ...66
4.1.1.1.3. Fakultas Ekonomi ...66
4.1.1.1.3.1. Data Mahasiswa Aktif jalur USM ...66
4.1.1.1.3.2. Data Mahasiswa Lulusan jalur USM ...70
4.1.1.1.4. Fakultas Teknologi Informasi ...75
4.1.1.1.4.1. Data Mahasiswa Aktif jalur USM ...75
4.1.1.1.4.2. Data Mahasiswa Lulusan jalur USM ...78
4.1.1.3. Scope Jurusan ...83
4.1.1.1.5. Jurusan Akuntansi ...83
4.1.1.1.5.1. Data Mahasiswa Aktif jalur USM ...83
4.1.1.1.5.2. Data Mahasiswa Lulusan jalur USM ...85
4.1.1.1.6. Jurusan Manajemen ...87
4.1.1.1.6.1. Data Mahasiswa Aktif jalur USM ...87
4.1.1.1.6.2. Data Mahasiswa Lulusan jalur USM ...91
4.1.1.1.7. Jurusan Teknik Informatika ...97
4.1.1.1.7.1. Data Mahasiswa Aktif jalur USM ...97
4.1.1.1.7.2. Data Mahasiswa Lulusan jalur USM ...100
4.1.1.1.8. Jurusan Sistem Informasi ...105
4.1.1.1.8.1. Data Mahasiswa Aktif jalur USM ...105
4.1.1.1.8.2. Data Mahasiswa Lulusan jalur USM ...108
4.1.2. Clustering ...111
4.1.2.1. Scope Universitas ...111
4.1.2.1.1. Data Mahasiswa Aktif jalur USM ...111
4.1.2.1.2. Data Mahasiswa Lulusan jalur USM ...113
4.1.2.2. Scope Fakultas ...115
4.1.2.2.1. Fakultas Ekonomi ...115
4.1.2.2.1.1. Data Mahasiswa Aktif jalur USM ...115
4.1.2.2.1.2. Data Mahasiswa Lulusan jalur USM ...117
4.1.2.2.2. Fakultas Teknologi Informasi ...119
4.1.2.2.2.1. Data Mahasiswa Aktif jalur USM ...120
4.1.2.2.2.2. Data Mahasiswa Lulusan jalur USM ...122
4.1.2.3. Scope Jurusan ...124
4.1.2.3.1. Jurusan Akuntansi ...124
4.1.2.3.1.1. Data Mahasiswa Aktif jalur USM ...124
4.1.2.3.1.2. Data Mahasiswa Lulusan jalur USM ...126
4.1.2.3.2. Jurusan Manajemen ...128
4.1.2.3.2.1. Data Mahasiswa Aktif jalur USM ...128
(6)
4.1.2.3.3. Jurusan Teknik Informatika ...132
4.1.2.3.3.1. Data Mahasiswa Aktif jalur USM ...132
4.1.2.3.3.2. Data Mahasiswa Lulusan jalur USM ...134
4.1.2.3.4. Jurusan Sistem Informasi ...136
4.1.2.3.4.1. Data Mahasiswa Aktif jalur USM ...136
4.1.2.3.4.2. Data Mahasiswa Lulusan jalur USM ...138
4.1.2.4. Pembahasan Clustering ...140
4.2. Implementasi Class ...140
4.2.1. Class Attribute ...140
4.2.2. Class Classification ...141
4.2.3. Class ClassificationModel ...142
4.2.4. Class ClassificationTreeFormat ...143
4.2.5. Class Clustering ...144
4.2.6. Class ClusteringTableFormat ...144
4.2.7. Class ClusterModel ...145
4.2.8. Class FileProcessing ...146
4.2.9. Class InstancesCustom ...147
4.3. Implementasi Code...149
4.3.1. Clustering Code ...149
4.3.2. Classification Code ...157
4.4. Implementasi Rancangan User Interface ...164
4.4.1. Main Form ...164
4.4.2. Preprocessing Form ...165
4.4.3. Clustering Form ...165
4.4.4. Table Result Form ...166
4.4.5. Text Result Form ...167
4.4.6. Classification Form ...167
4.4.7. Tree View Form ...168
4.4.8. Graphic Form ...169
4.5. Format File ...169
4.6. Modul Pendukung ...170
4.6.1. WEKA Library ...170
4.6.2. Aplikasi Lain ...170
BAB V TESTING DAN EVALUASI SISTEM ...172
5.1. Black Box Testing ...172
5.1.1. Main Form ...172
5.1.2. Clustering Form ...172
5.1.3. Classification Form ...173
5.1.4. Preprocessing Form ...174
5.1.5. Graphic Result Form ...175
5.1.6. Text Result Form ...175
5.1.7. Table Result Form ...176
5.1.8. Graphic Result Form ...176
(7)
5.2.1. Pengujian Class ClassificationModel ...176
5.2.2. Pengujian Class ClusteringModel ...179
5.3. Data Testing ...180
6.1. Kesimpulan ...184
6.2. Saran ...185
(8)
DAFTAR TABEL
Tabel 4.1. Hasil percobaan dataset perbandingan 1:2 (class StatusMahasiswa) ...55
Tabel 4.2. Hasil percobaan dataset perbandingan 1:3 (class StatusMahasiswa) ...55
Tabel 4.3. Hasil dengan SMOTE untuk class StatusMahasiswa ...56
Tabel 4.4. Dataset Mahasiswa Aktif (Universitas) ...56
Tabel 4.5. Confussion Matrix Mahasiswa Aktif (Universitas) ...57
Tabel 4.6. Leaf / rules dataset Mahasiswa Aktif (Universitas) ...58
Tabel 4.7. Dataset Mahasiswa Lulusan (Universitas) ...60
Tabel 4.8. Confussion Matrix Mahasiswa Lulusan class IPK (Universitas) ...61
Tabel 4.9. Leaf / rules dataset Mahasiswa Lulusan class IPK (Universitas) ...62
Tabel 4.10. Persentase pengaruh rules terhadap class ...62
Tabel 4.11 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Universitas) ...63
Tabel 4.12. Hasil leaf / rules Mahasiswa Lulusan LamaStudi scope Universitas ...64
Tabel 4.13. Dataset Mahasiswa Aktif (Fakultas Ekonomi) ...66
Tabel 4.14. Confussion Matrix Mahasiswa Aktif (Fakultas Ekonomi) ...67
Tabel 4.15. Leaf / rules dataset Mahasiswa Aktif (Fakultas Ekonomi) ...68
Tabel 4.16. Dataset Mahasiswa Lulusan (Fakultas Ekonomi) ...70
Tabel 4.17 Confussion Matrix Mahasiswa Lulusan class IPK (Fakultas Ekonomi) ...71
Tabel 4.18. Leaf / rules Mahasiswa Lulusan class IPK (Fakultas Ekonomi) ...72
Tabel 4.19 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Fakultas Ekonomi) ...73
Tabel 4.20. Leaf / rules Mahasiswa Lulusan class LamaStudi (Fakultas Ekonomi) ...74
Tabel 4.21. Dataset Mahasiswa Aktif (Fakultas Teknologi Informasi) ...75
Tabel 4.22. Confussion Matrix Mahasiswa Aktif (Fakultas Teknologi Informasi) ...76
Tabel 4.23. Leaf / rules Mahasiswa Aktif (Fakultas Teknologi Informasi) ...77
Tabel 4.24. Dataset Mahasiswa Lulusan (Fakultas Teknologi Informasi) ...78
Tabel 4.25 Confussion Matrix Mahasiswa Lulusan class IPK (Fakultas Teknologi Informasi) ...79
Tabel 4.26 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Fakultas Teknologi Informasi) ...79
Tabel 4.27. Leaf / rules Mahasiswa Lulusan class LamaStudi (Fakultas T. Informasi) ...81
Tabel 4.28. Dataset Mahasiswa Aktif (Jurusan Akuntansi) ...83
Tabel 4.29. Confussion Matrix Mahasiswa Aktif (Jurusan Akuntansi) ...84
Tabel 4.30. Dataset Mahasiswa Lulusan (Jurusan Akuntansi)...85
Tabel 4.31 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan Akuntansi) ...86
Tabel 4.32 Confussion Matrix Mahasiswa Lulusan LamaStudi jurusan Akuntansi ....86
Tabel 4.33. Leaf / rules Mahasiswa Lulusan class LamaStudi (Jurusan Akuntansi) ..87
Tabel 4.34. Dataset Mahasiswa Aktif (Jurusan Manajemen)...88
Tabel 4.35. Confussion Matrix Mahasiswa Aktif (Jurusan Manajemen) ...88
Tabel 4.36. Hasil leaf / rules Mahasiswa Aktif jurusan Manajemen ...90
Tabel 4.37. Dataset Mahasiswa Lulusan (Jurusan Manajemen) ...91
Tabel 4.38 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan Manajemen) 92 Tabel 4.39. Leaf / rules Mahasiswa Lulusan class IPK (Jurusan Manajemen) ...93
Tabel 4.40 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Jurusan Manajemen) ...94
(9)
Tabel 4.42. Dataset Mahasiswa Aktif (Jurusan Teknik Informatika) ...97
Tabel 4.43. Confussion Matrix Mahasiswa Aktif (Jurusan Teknik Informatika) ...98
Tabel 4.44. Leaf / rules Mahasiswa Aktif (Jurusan Teknik Informatika) ...99
Tabel 4.45. Dataset Mahasiswa Lulusan (Jurusan Teknik Informatika) ...100
Tabel 4.46 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan T. Informatika) ...101
Tabel 4.47. Leaf / rules Mahasiswa Lulusan class IPK (Jurusan T. Informatika) ....102
Tabel 4.48. Confussion Matrix Mahasiswa Lulusan class LamaStudi (Jurusan T. Informatika) ...103
Tabel 4.49. Leaf / rules Mahasiswa Lulusan class LamaStudi (Jurusan T. Informatika) ...104
Tabel 4.50. Dataset Mahasiswa Aktif (Jurusan Sistem Informasi) ...105
Tabel 4.51. Confussion Matrix Mahasiswa Aktif (Jurusan Sistem Informasi) ...106
Tabel 4.52. Leaf / rules Mahasiswa Aktif (Jurusan Sistem Informasi) ...107
Tabel 4.53. Dataset Mahasiswa Lulusan (Jurusan Sistem Informasi) ...108
Tabel 4.54 Confussion Matrix Mahasiswa Lulusan class IPK (Jurusan S. Informasi) ...108
Tabel 4.55 Confussion Matrix Mahasiswa Lulusan class LamaStudi (Jurusan S. Informasi) ...109
Tabel 4.56. Hasil leaf / rules Mahasiswa Lulusan LamaStudi jurusan S. Informasi .110 Tabel 4.57. Centroidclustering data Mahasiswa Aktif (Universitas) ...112
Tabel 4.58. Cluster Mahasiswa Aktif (Universitas) ...112
Tabel 4.59. Hasil DBScan data Mahasiswa Aktif (Universitas) ...113
Tabel 4.60. Centroid clustering data Mahasiswa Lulusan (Universitas) ...114
Tabel 4.61. Cluster Mahasiswa Lulusan (Universitas) ...114
Tabel 4.62. Hasil DBScan terhadap data Mahasiswa Lulusan scope Universitas ...115
Tabel 4.63. Centroid clustering data Mahasiswa Aktif (Fakultas Ekonomi) ...116
Tabel 4.64. Cluster Mahasiswa Aktif (Fakultas Ekonomi) ...116
Tabel 4.65. Hasil DBScan data Mahasiswa Aktif (Fakultas Ekonomi) ...117
Tabel 4.66. Centroid clustering data Mahasiswa Lulusan (Fakultas Ekonomi) ...118
Tabel 4.67. Cluster Mahasiswa Lulusan (Fakultas Ekonomi) ...118
Tabel 4.68. Hasil DBScan data Mahasiswa Lulusan (Fakultas Ekonomi) ...119
Tabel 4.69. Centroid clustering data Mahasiswa Aktif (Fakultas T. Informasi) ...120
Tabel 4.70. Cluster Mahasiswa Aktif (Fakultas T. Informasi) ...121
Tabel 4.71. Hasil DBScan data Mahasiswa Aktif (Fakultas T. Informasi) ...121
Tabel 4.72. Centroid clustering data Mahasiswa Lulusan (Fakultas T. Informasi) ..122
Tabel 4.73. Cluster Mahasiswa Lulusan (Fakultas T. Informasi) ...123
Tabel 4.74. Hasil DBScan data Mahasiswa Lulusan (Fakultas T. Informasi) ...123
Tabel 4.75. Centroid clustering data Mahasiswa Aktif (Jurusan Akuntansi) ...124
Tabel 4.76. Cluster Mahasiswa Aktif (Jurusan Akuntansi) ...125
Tabel 4.77. Hasil DBScan data Mahasiswa Aktif (Jurusan Akuntansi) ...125
Tabel 4.78. Centroid clustering data Mahasiswa Lulusan (Jurusan Akuntansi) ...126
Tabel 4.79. Cluster Mahasiswa Lulusan (Jurusan Akuntansi) ...127
Tabel 4.80. Hasil DBScan data Mahasiswa Lulusan (Jurusan Akuntansi) ...127
Tabel 4.81. Centroid clustering data Mahasiswa Aktif (Jurusan Manajemen) ...128
Tabel 4.82. Cluster Mahasiswa Aktif (Jurusan Manajemen) ...129
Tabel 4.83. Hasil DBScan data Mahasiswa Aktif (Jurusan Manajemen) ...129
Tabel 4.84. Centroid clustering data Mahasiswa Lulusan (Jurusan Manajemen) ...130
Tabel 4.85. Cluster Mahasiswa Lulusan (Jurusan Manajemen) ...131
(10)
Tabel 4.87. Centroid clustering data Mahasiswa Aktif (Jurusan T. Informatika) ...132
Tabel 4.88. Cluster Mahasiswa Aktif (Jurusan T. Informatika) ...133
Tabel 4.89. Hasil DBScan data Mahasiswa Aktif (Jurusan T. Informatika) ...133
Tabel 4.90. Centroid clustering data Mahasiswa Lulusan (Jurusan T. Informatika) 134 Tabel 4.91. Cluster Mahasiswa Lulusan (Jurusan T. Informatika) ...135
Tabel 4.92. Hasil DBScan data Mahasiswa Lulusan (Jurusan T. Informatika) ...135
Tabel 4.93. Centroid clustering data Mahasiswa Aktif (Jurusan S. Informasi) ...136
Tabel 4.94. Cluster Mahasiswa Aktif (Jurusan S. Informasi) ...137
Tabel 4.95. Hasil DBScan data Mahasiswa Aktif (Jurusan S. Informasi) ...137
Tabel 4.96. Centroid clustering data Mahasiswa Lulusan (Jurusan S. Informasi) ....138
Tabel 4.97. Cluster Mahasiswa Lulusan (Jurusan S. Informasi) ...139
Tabel 4.98. Hasil DBScan data Mahasiswa Lulusan (Jurusan S. Informasi) ...139
Tabel 4.99. PropertyClass Attributes ...141
Tabel 4.100. Method Class Attributes ...141
Tabel 4.101. PropertyClass Classification ...141
Tabel 4.102. Method Class Classification ...141
Tabel 4.103. PropertyClass ClassificationModel ...142
Tabel 4.104. Method Class ClassificationModel ...142
Tabel 4.105. PropertyClass ClassificationTreeFormat ...143
Tabel 4.106. Method Class ClassificationTreeFormat ...143
Tabel 4.107. PropertyClass Clustering ...144
Tabel 4.108. Method Class Clustering ...144
Tabel 4.109. PropertyClass ClusteringTableFormat ...144
Tabel 4.110. Method Class ClusteringTableFormat ...145
Tabel 4.111. PropertyClass ClusterModel ...145
Tabel 4.112. Method Class ClusterModel ...145
Tabel 4.113. Method Class FileProcessing ...147
Tabel 4.114. PropertyClass InstancesCustom ...147
Tabel 4.115. Method Class InstancesCustom ...148
Tabel 4.116. Tabel format file ...169
Tabel 5.1. Pengujian Main Form ...172
Tabel 5.2. Pengujian Clustering Form ...173
Tabel 5.3. Pengujian Classification Form ...173
Tabel 5.4. Pengujian Preprocessing Form ...174
Tabel 5.5. Pengujian Graphic Result Form ...175
Tabel 5.6. Pengujian Text Result Form ...175
Tabel 5.7. Pengujian Table Result Form ...176
Tabel 5.8. Pengujian Graphic Result Form ...176
Tabel 5.9. Hasil classification ...181
(11)
DAFTAR GAMBAR
Gambar 2.1. Contoh dari Decision Tree (Han, et al. 2011:331) ... 6
Gambar 2.2. Skenario pemisahan Decision Tree (Han, et al. 2011:334) ... 8
Gambar 2.3. DBScan (Tan, et all. 2006:531) ... 12
Gambar 2.4. WEKA explorer ... 15
Gambar 3.1. Use Case Aplikasi ... 18
Gambar 3.2. Package Preprocessing ... 19
Gambar 3.3. Package Clustering ... 20
Gambar 3.4. Package Classificaiton ... 21
Gambar 3.5. Aktivitas Load File ... 22
Gambar 3.6. Aktivitas Save File ... 23
Gambar 3.7. Aktivitas Remove Attribute ... 24
Gambar 3.8. Aktivitas Filter ... 25
Gambar 3.9. Aktivitas Load File ... 26
Gambar 3.10. Aktivitas Start Clustering ... 27
Gambar 3.11. Aktivitas Load Model ... 28
Gambar 3.12. Aktivitas View as Table ... 29
Gambar 3.13. Aktivitas View as Graphic ... 30
Gambar 3.14. Aktivitas View as Text ... 30
Gambar 3.15. Aktivitas Save Result... 31
Gambar 3.16. Aktivitas Start Clustering Data Test ... 32
Gambar 3.17. Aktivitas Save Result... 33
Gambar 3.18. Aktivitas Save Model ... 34
Gambar 3.19. Aktivitas Load File ... 35
Gambar 3.20. Aktivitas Load Model ... 35
Gambar 3.21. Aktivitas View as Tree ... 36
Gambar 3.22. Aktivitas Start Classify ... 37
Gambar 3.23. Aktivitas View as Text ... 38
Gambar 3.24. Aktivitas Save Model ... 39
Gambar 3.25. Aktivitas Start Test Model ... 40
Gambar 3.26. Aktivitas View Result ... 41
Gambar 3.27. Aktivitas Start Prediction ... 42
Gambar 3.28. Aktivitas Save Result... 43
Gambar 3.29. Class diagram keseluruhan aplikasi ... 43
Gambar 3.30. Class Diagram Attributes ... 44
Gambar 3.31. Class Diagram Classification ... 44
Gambar 3.32. Class Diagram ClassificationTreeFormat ... 45
Gambar 3.33. Class Diagram ClassificationModel ... 45
Gambar 3.34. Class Diagram ClusteringTableFormat... 46
Gambar 3.35. Class Diagram Clustering ... 46
Gambar 3.36. Class Diagram FileProcessing ... 47
Gambar 3.37. Class Diagram ClusterModel ... 47
(12)
Gambar 3.39. Layout Main Form ... 49
Gambar 3.40. Layout Preprocessing... 49
Gambar 3.41. Layout Clustering ... 50
Gambar 3.42. Layout Table Result... 50
Gambar 3.43. Layout Text Result ... 51
Gambar 3.44. Layout Classification ... 51
Gambar 3.45. Layout Tree View ... 52
Gambar 3.46. Layout Graphic Result ... 52
Gambar 4.1. Tree Mahasiswa Aktif class StatusMahasiswa ... 58
Gambar 4.2. Tree Mahasiswa Lulusan class IPK ... 62
Gambar 4.3. Tree Mahasiswa Lulusan class LamaStudi ... 64
Gambar 4.4. Tree Mahasiswa Aktif class StatusMahasiswa ... 68
Gambar 4.5. Tree Mahasiswa Lulusan class IPK ... 72
Gambar 4.6. Tree Mahasiswa Lulusan class LamaStudi ... 74
Gambar 4.7. Tree Mahasiswa Aktif class StatusMahasiswa ... 77
Gambar 4.8. Tree Mahasiswa Lulusan class LamaStudi ... 81
Gambar 4.9. Tree Mahasiswa Lulusan class LamaStudi ... 87
Gambar 4.10. Tree Mahasiswa Aktif class StatusMahasiswa ... 89
Gambar 4.11. Tree Mahasiswa Lulusan class IPK ... 93
Gambar 4.12. Tree Mahasiswa Lulusan class LamaStudi ... 95
Gambar 4.13. Tree Mahasiswa Aktif class StatusMahasiswa ... 99
Gambar 4.14. Tree Mahasiswa Lulusan class IPK ... 102
Gambar 4.15. Tree Mahasiswa Lulusan class LamaStudi ... 104
Gambar 4.16. Tree Mahasiswa Aktif (Jurusan Sistem Informasi) ... 107
Gambar 4.17. Tree Mahasiswa Lulusan class LamaStudi ... 110
Gambar 4.18. Contoh hasil SetResultStatisticForDataTest ... 153
Gambar 4.19. Hasil tabel default ... 154
Gambar 4.20. Hasil tabel pivot... 154
Gambar 4.21. Hasil pivot table ... 156
Gambar 4.22. Hasil dalam bentuk grafik ... 157
Gambar 4.23. Hasil tree yang telah diolah ... 161
Gambar 4.24. Main Form ... 164
Gambar 4.26. Clustering Form ... 166
Gambar 4.27. Table Result Form ... 166
Gambar 4.28. Text Result Form ... 167
Gambar 4.29. Classification Form ... 168
Gambar 4.30. Tree Result Form... 168
Gambar 4.31. Graphic Form... 169
Gambar 4.32. Aplikasi pendukung ... 171
Gambar 5.1. Pengujian methodclassifyDataTest ... 178
(13)
DAFTAR KODE PROGRAM
Kode Program 2.1. Pseudo-code untuk Decision Tree (Han, et al. 2011:333) ... 7
Kode Program 2.2. Pseudo-code NBTree ... 10
Kode Program 4.1. Tree Mahasiswa Aktif (Universitas) ... 58
Kode Program 4.2. Tree Mahasiswa Lulusan class IPK (Universitas) ... 61
Kode Program 4.3. Tree Mahasiswa Lulusan class LamaStudi (Universitas) ... 64
Kode Program 4.4. Tree Mahasiswa Aktif (Fakultas Ekonomi) ... 68
Kode Program 4.5. Tree Mahasiswa Lulusan class IPK (Fakultas Ekonomi) ... 71
Kode Program 4.6. Tree Mahasiswa Lulusan class LamaStudi (Fakultas Ekonomi) ... 73
Kode Program 4.7. Tree Mahasiswa Aktif (Fakultas Teknologi Informasi) ... 76
Kode Program 4.8. Tree Mahasiswa Lulusan class LamaStudi (Fakultas T. Informasi) . 80 Kode Program 4.9. Tree Mahasiswa Lulusan class LamaStudi (Jurusan Akuntansi) ... 87
Kode Program 4.10. Tree Mahasiswa Aktif (Jurusan Manajemen) ... 89
Kode Program 4.11. Tree Mahasiswa Lulusan class IPK (Jurusan Manajemen) ... 92
Kode Program 4.12. Tree Mahasiswa Lulusan class LamaStudi (Jurusan Manajemen) .. 95
Kode Program 4.13. Tree Mahasiswa Aktif (Jurusan Teknik Informatika) ... 98
Kode Program 4.14. Tree Mahasiswa Lulusan class IPK (Jurusan T. Informatika) ... 102
Kode Program 4.15. Tree Mahasiswa Lulusan class LamaStudi ... 104
Kode Program 4.16. Tree Mahasiswa Aktif (Jurusan Sistem Informasi) ... 106
Kode Program 4.17. Tree Mahasiswa Lulusan class LamaStudi (Jurusan S.Informasi) 110 Kode Program 4.18. Kode ClusterDataTest ... 149
Kode Program 4.18. Kode ClusterDataTest (lanjutan) ... 150
Kode Program 4.19. Kode SplitByCluster ... 151
Kode Program 4.20. Kode SetResultStatisticForDataTest ... 152
Kode Program 4.20. Kode SetResultStatisticForDataTest (lanjutan) ... 153
Kode Program 4.21. Kode SetResultTableForDataTest ... 154
Kode Program 4.22. Kode inverseDataTable ... 155
Kode Program 4.22. Kode inverseDataTable (lanjutan) ... 156
Kode Program 4.23. Kode doNBTreeClassification ... 157
Kode Program 4.24. Kode setTreeModelForNBTree ... 158
Kode Program 4.25. Outputtree WEKA ... 159
Kode Program 4.26. Output leaf WEKA ... 159
Kode Program 4.27. Outputtree untuk proses ... 160
Kode Program 4.28. Kode createTree ... 160
Kode Program 4.28. Kode createTree (lanjutan) ... 161
Kode Program 4.29. Kode classifyDataTest ... 162
Kode Program 4.29. Kode classifyDataTest (lanjutan) ... 163
Kode Program 5.1. Kode method classifyDataTest (lanjutan) ... 177
Kode Program 5.1. Kode method classifyDataTest (lanjutan) ... 178
Kode Program 5.2. Kode method clusterDataTest ... 179
(14)
DAFTAR LAMPIRAN
LAMPIRAN A - CLASSIFICATION ... A-1 LAMPIRAN B - CLUSTERING ... B-1
(15)
BAB I
PENDAHULUAN
1.1. Latar Belakang
Data merupakan hal yang crucial pada saat ini. Baik bagi perusahaan, pemerintahan, instansi, maupun masing-masing individu yang ada. Setiap harinya, jumlah data yang ada semakin bertambah dan semakin menumpuk. Dengan perkembangan internet pada saat ini dan kemudahan mengaksesnya, jumlah data maupun tumpukan data akan semakin bertambah. Timbunan data-data tersebut dapat menjadi timbunan yang tidak berguna jika tidak ada yang dapat memanfaatkannya dengan baik. Pemrosesan data-data secara manual sangat sulit untuk dilakukan melihat banyaknya data yang ada saat ini. Salah satu data yang menyediakan informasi yang bermanfaat adalah data di dalam bidang pendidikan. Terdapat cukup banyak data dalam bidang tersebut yang setiap semesternya dapat bertambah. Sayangnya, pengelolaan data dalam bidang tersebut hanya sekedar melihat secara sekilas saja. Dengan jumlah data yang memadahi dan cara yang tepat dapat diperoleh sebuah informasi yang mungkin sangat bermanfaat untuk membenahi atau memajukan bidang pendidikan.
Data mining merupakan proses untuk mencari sebuah pola dalam sekumpulan data yang besar sehingga diperoleh sebuah pengetahuan yang bermanfaat (Han, et al. 2012:8). Penerapan data mining sendiri dapat dilakukan di dalam berbagai bidang yang ada sekarang. Terdapat dua kategori di dalam pencarian pola dalam data mining yaitu descriptive, misalnya clustering dan predictive, misalnya classification (Han, et al. 2012: 15). Data yang digunakan akan mempengaruhi error rate dari teknik yang digunakan untuk mengelola data tersebut. Implementasi data mining dalam bidang pendidikan khususnya untuk tingkat universitas akan sangat membantu di dalam memperoleh suatu pola atau pattern data baik dari data mahasiswa maupun dari data dosen. Dengan studi kasus terhadap data mahasiswa pada beberapa fakultas di Universitas Kristen Maranatha dilakukanlah penerapan data mining untuk mendapatkan pola atau pattern yang dapat bermanfaat bagi universitas maupun fakultas yang ada.
(16)
2
Tugas Akhir ini merupakan pengembangan ide dari hibah bersaing (Ayub & Kristanti, 2013). Dalam Tugas Akhir ini akan dibuat dan diimplementasikan sebuah aplikasi untuk clustering dan classification yang membantu analisis data-data tersebut. Dilakukan juga analisa terhadap pola atau pattern yang terbentuk dari hasil classification dan clustering yang dilakukan dalam Tugas Akhir. Sehingga diperoleh hasil yang bermanfaat bagi universitas untuk meningkatkan kualitas pendidikan mahasiswa yang ada.
1.2. Rumusan Masalah
Rumusan masalah yang muncul dari latar belakang tersebut adalah: 1. Pola atau pattern seperti apa yang dihasilkan dari classification yang
mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa?
2. Di dalam melakukan clustering, metode apa yang disarankan untuk melakukan clustering terhadap dataset mahasiswa Universitas Kristen Maranatha?
1.3. Tujuan
Tujuan dilakukannya penelitian dan pembuatan aplikasi adalah:
1. Memperoleh pola atau pattern yang dihasilkan dari classification yang mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa.
2. Mendapatkan metode yang disarankan untuk melakukan clustering terhadap dataset mahasiswa Universitas Kristen Maranatha.
(17)
3
1.4. Batasan Masalah
Beberapa batasan masalah yang diberikan adalah:
1. Data yang digunakan adalah data mahasiswa beberapa fakultas yaitu fakultas Ekonomi dan fakultas Teknologi Informasi yang sudah berupa schema.
2. Data Mahasiswa yang digunakan dipisahkan menjadi dua, yaitu data Mahasiswa Aktif tahun pertama (semester 1 & 2) dan data Mahasiswa Lulusan.
3. Schema yang digunakan dalam Tugas Akhir ini berasal dari hibah bersaing (Ayub & Kristanti, 2013) yang diimplementasikan sebagai data mart dalam Kerja Praktek (Natalia, 2013).
4. Metode classification yang digunakan adalah NBTree sedangkan metode clustering yang digunakan adalah DBScan dan XMeans. 5. Aplikasi yang dibuat menggunakan library yang telah disediakan oleh
WEKA dan dikhususkan untuk mengolah data mahasiswa di Universitas Kristen Maranatha.
6. Dalam classification, hal yang dianalisis meliputi data mahasiswa aktif untuk mencari attribute yang mempengaruhi drop-out, data mahasiswa lulus untuk mencari attribute yang mempengaruhi IPK dan lama studi. 7. Dalam clustering, dilakukan pembentukkan cluster dengan metode yang ada yaitu X-Means dan DBScan, dilakukan perbandingan untuk mencari metode yang sesuai terhadap dataset yang digunakan.
1.5. Sistematika Penulisan
Sistematika penulisan untuk tugas akhir ini adalah : BAB I PENDAHULUAN
Bab ini menjelaskan latar belakang, rumusan masalah, tujuan, batasan masalah dan sistematika pembahasan.
BAB II LANDASAN TEORI
Bab ini menjelaskan teori-teori yang berkaitan dengan pembuatan sistem dan mendukung pembuatan sistem atau aplikasi yang ada.
(18)
4
BAB III ANALISIS DAN DISAIN
Bab ini menjelaskan bagaimana analisis keadaan, kebutuhan dari aplikasi, perancangan aplikasi, UML, dan gambaran arsitektur dari aplikasi yang dibuat.
BAB IV PENGEMBANGAN PERANGKAT LUNAK
Bab ini digunakan untuk menjelaskan mengenai implementasi dari teknik serta perancangan aplikasi dan hasil yang didapat dari percobaan yang telah dilakukan dalam Tugas Akhir.
BAB V TESTING DAN EVALUASI SISTEM
Bab ini menjelaskan tentang pengujian dari teknik atau aplikasi yang telah dibuat beserta testing terhadap hasil percobaan yang telah dilakukan dalam Tugas Akhir.
BAB VI KESIMPULAN DAN SARAN
Bab ini menjelaskan mengenai kesimpulan yang didapatkan dari hasil implementasi atau penelitian.
(19)
BAB VI
KESIMPULAN DAN SARAN
Bab VI digunakan untuk menyatakan kesimpulan yang diperoleh dalam Tugas Akhir dan saran yang diberikan untuk pengembangan berikutnya.
6.1. Kesimpulan
Berdasarkan implementasi yang telah dilakukan dan percobaan yang dilakukan, dihasilkan beberapa kesimpulan seperti:
1. Pola atau pattern yang didapatkan dalam classification yang dilakukan dengan menggunakan NBTree pada dataset mahasiswa aktif dan lulusan yang mempengaruhi mempengaruhi drop-out, lama masa studi, dan tingkat IPK mahasiswa memiliki pola atau pattern yang berbeda-beda. Hal ini dipengaruhi oleh karakteristik dataset sesuai dengan scope-nya masing-masing. Pola atau pattern yang didapatkankan dapat dilihat pada pembahasan bab IV subbab 4.1.1 pada masing-masing scope dan dataset yang digunakan.
2. Metode yang sesuai untuk dataset yang digunakan, yaitu data mahasiswa Universitas Kristen Maranatha, adalah metode X-Means. Metode DBScan tidak sesuai untuk melakukan pengelompokan pada dataset atau studi kasus yang digunakan karena jumlah cluster yang terbentuk terlalu besar dan jumlah unclustered instances yang muncul masih tergolong besar. Pembahasan lebih lanjut mengenai hal ini dapat dilihat pada bab IV subbab 4.1.2 dan 4.1.2.4.
(20)
185
6.2. Saran
Beberapa saran yang dapat diberikan setelah percobaan dan analisis yang dilakukan adalah:
1. Dengan menggunakan pola yang didapat dengan menggunakan NBTree, dapat dilakukan penelitian lebih lanjut mengenai model yang terbentuk dan attribute yang digunakan sehingga diperoleh hasil yang lebih baik dan lebih bermanfaat lagi.
2. Perlunya dilakukan pemeriksaan terhadap data yang telah dijadikan sebagai data training (schema yang digunakan) dengan data asli yang ada agar mendapatkan hasil yang lebih valid dan lebih baik untuk hasil yang didapat.
(21)
DAFTAR PUSTAKA
Ayub, M., & Kristanti, T. (2013). Model Analisis Classification dan Clustering untuk Data Mahasiswa dan Dosen di Perguruan Tinggi. Bandung: Laporan Hibah Bersaing DIKTI tahun anggaran 2013 di Universitas Kristen Maranatha.
Chonoles, M. J., & Schardt, J. A. (2003). UML 2 for Dummies. Indianapolis: Wiley Publishing.
Ganganwar, V. (2012). An overview of classification algorithms for imbalanced datasets. International Journal of Emerging Technology and Adavanced Engineering, 42-47.
Gorunescu, F. (2011). Data Mining Concepts, Models and Techniques. Berlin: Springer.
Han, J., Kamber, M., & Pei, J. (2011). Data Mining Concepts and Techniques Third Edition. Waltham: Elsevier Inc.
Kohavi, R. (1996). Scaling Up the Accuracy of Naive-Bayes Classifiers: a Decision-Tree Hybrid.
Natalia, L. A. (2013). Implementasi Skema Star dan Snowflake dalam pembuatan data mart dengan menggunakan data mahasiswa dan dosen di Universitas Kristen Maranatha. Bandung: Laporan Kerja Praktek Program Studi Teknik Informatika Universitas Kristen Maranatha.
Pelleg, D., & Moore, A. (2000). X-means: Extending K-means with Efficient Estimation of the Number of CLusters.
Penker, M., Lyons, B., Fado, D., & Eriksson, H.-E. (2004). UMK 2 Toolkit. Indianapolis: Wiley Publishing.
Sempf, B. (2010). C# 2010 all-in-one for Dummies. Indianapolis: Wiley Publishing. Silberschatz, A., Korth, H. F., & Sudarshan, S. (2011). Database System Concepts
Sixth Edition. New York: McGraw-Hill.
Tan, P.-N., Steinbach, M., & Kumar, V. (2006). Introduction to Data Mining. Boston: Pearson.
Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining Practical Machine Learning. Burlington: Elsevier
(1)
Tugas Akhir ini merupakan pengembangan ide dari hibah bersaing (Ayub & Kristanti, 2013). Dalam Tugas Akhir ini akan dibuat dan diimplementasikan sebuah aplikasi untuk clustering dan classification yang membantu analisis data-data tersebut. Dilakukan juga analisa terhadap pola atau
pattern yang terbentuk dari hasil classification dan clustering yang dilakukan dalam Tugas Akhir. Sehingga diperoleh hasil yang bermanfaat bagi universitas untuk meningkatkan kualitas pendidikan mahasiswa yang ada.
1.2. Rumusan Masalah
Rumusan masalah yang muncul dari latar belakang tersebut adalah: 1. Pola atau pattern seperti apa yang dihasilkan dari classification yang
mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa?
2. Di dalam melakukan clustering, metode apa yang disarankan untuk melakukan clustering terhadap dataset mahasiswa Universitas Kristen Maranatha?
1.3. Tujuan
Tujuan dilakukannya penelitian dan pembuatan aplikasi adalah:
1. Memperoleh pola atau pattern yang dihasilkan dari classification yang mempengaruhi tingkat drop-out, lama masa studi, dan tingkat IPK mahasiswa.
2. Mendapatkan metode yang disarankan untuk melakukan clustering
(2)
Universitas Kristen Maranatha
1.4. Batasan Masalah
Beberapa batasan masalah yang diberikan adalah:
1. Data yang digunakan adalah data mahasiswa beberapa fakultas yaitu fakultas Ekonomi dan fakultas Teknologi Informasi yang sudah berupa
schema.
2. Data Mahasiswa yang digunakan dipisahkan menjadi dua, yaitu data Mahasiswa Aktif tahun pertama (semester 1 & 2) dan data Mahasiswa Lulusan.
3. Schema yang digunakan dalam Tugas Akhir ini berasal dari hibah bersaing (Ayub & Kristanti, 2013) yang diimplementasikan sebagai data mart dalam Kerja Praktek (Natalia, 2013).
4. Metode classification yang digunakan adalah NBTree sedangkan metode clustering yang digunakan adalah DBScan dan XMeans. 5. Aplikasi yang dibuat menggunakan library yang telah disediakan oleh
WEKA dan dikhususkan untuk mengolah data mahasiswa di Universitas Kristen Maranatha.
6. Dalam classification, hal yang dianalisis meliputi data mahasiswa aktif untuk mencari attribute yang mempengaruhi drop-out, data mahasiswa lulus untuk mencari attribute yang mempengaruhi IPK dan lama studi. 7. Dalam clustering, dilakukan pembentukkan cluster dengan metode yang ada yaitu X-Means dan DBScan, dilakukan perbandingan untuk mencari metode yang sesuai terhadap dataset yang digunakan.
1.5. Sistematika Penulisan
Sistematika penulisan untuk tugas akhir ini adalah : BAB I PENDAHULUAN
Bab ini menjelaskan latar belakang, rumusan masalah, tujuan, batasan masalah dan sistematika pembahasan.
BAB II LANDASAN TEORI
Bab ini menjelaskan teori-teori yang berkaitan dengan pembuatan sistem dan mendukung pembuatan sistem atau aplikasi yang ada.
(3)
BAB III ANALISIS DAN DISAIN
Bab ini menjelaskan bagaimana analisis keadaan, kebutuhan dari aplikasi, perancangan aplikasi, UML, dan gambaran arsitektur dari aplikasi yang dibuat.
BAB IV PENGEMBANGAN PERANGKAT LUNAK
Bab ini digunakan untuk menjelaskan mengenai implementasi dari teknik serta perancangan aplikasi dan hasil yang didapat dari percobaan yang telah dilakukan dalam Tugas Akhir.
BAB V TESTING DAN EVALUASI SISTEM
Bab ini menjelaskan tentang pengujian dari teknik atau aplikasi yang telah dibuat beserta testing terhadap hasil percobaan yang telah dilakukan dalam Tugas Akhir.
BAB VI KESIMPULAN DAN SARAN
Bab ini menjelaskan mengenai kesimpulan yang didapatkan dari hasil implementasi atau penelitian.
(4)
184
Universitas Kristen Maranatha
BAB VI
KESIMPULAN DAN SARAN
Bab VI digunakan untuk menyatakan kesimpulan yang diperoleh dalam Tugas Akhir dan saran yang diberikan untuk pengembangan berikutnya.
6.1. Kesimpulan
Berdasarkan implementasi yang telah dilakukan dan percobaan yang dilakukan, dihasilkan beberapa kesimpulan seperti:
1. Pola atau pattern yang didapatkan dalam classification yang dilakukan dengan menggunakan NBTree pada dataset mahasiswa aktif dan lulusan yang mempengaruhi mempengaruhi drop-out, lama masa studi, dan tingkat IPK mahasiswa memiliki pola atau pattern yang berbeda-beda. Hal ini dipengaruhi oleh karakteristik dataset sesuai dengan
scope-nya masing-masing. Pola atau pattern yang didapatkankan dapat dilihat pada pembahasan bab IV subbab 4.1.1 pada masing-masing
scope dan dataset yang digunakan.
2. Metode yang sesuai untuk dataset yang digunakan, yaitu data mahasiswa Universitas Kristen Maranatha, adalah metode X-Means. Metode DBScan tidak sesuai untuk melakukan pengelompokan pada
dataset atau studi kasus yang digunakan karena jumlah cluster yang terbentuk terlalu besar dan jumlah unclustered instances yang muncul masih tergolong besar. Pembahasan lebih lanjut mengenai hal ini dapat dilihat pada bab IV subbab 4.1.2 dan 4.1.2.4.
(5)
6.2. Saran
Beberapa saran yang dapat diberikan setelah percobaan dan analisis yang dilakukan adalah:
1. Dengan menggunakan pola yang didapat dengan menggunakan NBTree, dapat dilakukan penelitian lebih lanjut mengenai model yang terbentuk dan attribute yang digunakan sehingga diperoleh hasil yang lebih baik dan lebih bermanfaat lagi.
2. Perlunya dilakukan pemeriksaan terhadap data yang telah dijadikan sebagai data training (schema yang digunakan) dengan data asli yang ada agar mendapatkan hasil yang lebih valid dan lebih baik untuk hasil yang didapat.
(6)
186
Universitas Kristen Maranatha
DAFTAR PUSTAKA
Ayub, M., & Kristanti, T. (2013). Model Analisis Classification dan Clustering untuk Data Mahasiswa dan Dosen di Perguruan Tinggi. Bandung: Laporan Hibah Bersaing DIKTI tahun anggaran 2013 di Universitas Kristen Maranatha.
Chonoles, M. J., & Schardt, J. A. (2003). UML 2 for Dummies. Indianapolis: Wiley Publishing.
Ganganwar, V. (2012). An overview of classification algorithms for imbalanced datasets. International Journal of Emerging Technology and Adavanced Engineering, 42-47.
Gorunescu, F. (2011). Data Mining Concepts, Models and Techniques. Berlin: Springer.
Han, J., Kamber, M., & Pei, J. (2011). Data Mining Concepts and Techniques Third Edition. Waltham: Elsevier Inc.
Kohavi, R. (1996). Scaling Up the Accuracy of Naive-Bayes Classifiers: a Decision-Tree Hybrid.
Natalia, L. A. (2013). Implementasi Skema Star dan Snowflake dalam pembuatan data mart dengan menggunakan data mahasiswa dan dosen di Universitas Kristen Maranatha. Bandung: Laporan Kerja Praktek Program Studi Teknik Informatika Universitas Kristen Maranatha.
Pelleg, D., & Moore, A. (2000). X-means: Extending K-means with Efficient Estimation of the Number of CLusters.
Penker, M., Lyons, B., Fado, D., & Eriksson, H.-E. (2004). UMK 2 Toolkit.
Indianapolis: Wiley Publishing.
Sempf, B. (2010). C# 2010 all-in-one for Dummies. Indianapolis: Wiley Publishing. Silberschatz, A., Korth, H. F., & Sudarshan, S. (2011). Database System Concepts
Sixth Edition. New York: McGraw-Hill.
Tan, P.-N., Steinbach, M., & Kumar, V. (2006). Introduction to Data Mining.
Boston: Pearson.
Witten, I. H., Frank, E., & Hall, M. A. (2011). Data Mining Practical Machine Learning. Burlington: Elsevier