DAFTAR ISI
Halaman KATA PENGANTAR
i ABSTRAK
iii ABSTRACT
iv DAFTAR ISI
v DAFTAR GAMBAR
vii DAFTAR TABEL
viii DAFTAR LAMPIRAN
ix
BAB I PENDAHULUAN
1
1.1 Latar Belakang
1 1.2
Perumusan Masalah 6
1.3 Batasan Masalah
6 1.4
Tujuan Penelitian 7
1.5 Manfaat Penelitian
7
BAB II TINJAUAN PUSTAKA
9
2.1 Penambangan Data Data Mining
9 2.2
Penambangan Data Pada Pendidikan Tinggi 11
2.3 Algoritma Clustering Clustering Algorithm
15 2.3.1 Clustering Hirarkhi Hierarchical Clustering
19 2.3.2 Clustering Partisional Partisional Clustering
20 2.4
Analisis Cluster 22
2.5 Metode Kernel
23 2.6
Fungsi Kernel 24
2.7 Kernel K-Means Clustering
26 2.8
Decision Tree 31
2.9 Algoritma C 4.5
32 2.10
Persamaan dengan Riset-Riset Lain 37
2.11 Perbedaan dengan Riset-Riset Lain
38 2.12
Kontribusi Riset 39
BAB III METODOLOGI PENELITIAN
40
3.1 Lokasi dan Waktu Penelitian
40 3.2
Rancangan Penelitian 40
3.2.1 Perhitungan dengan menggunakan Gain dan Entropy 41
3.3 Diagram Aktivitas Penelitian
42 3.4
Teknik Pengumpulan Data 43
3.5 Pra Pemrosesan Data Preprocessing Data
44 3.6
Clustering Kernel k-Means 47
Universitas Sumatera Utara
3.7 Model Cluster
47 3.8
Interpretasi 48
BAB IV HASIL DAN PEMBAHASAN
53
4.1 Pendahuluan
53 4.2
Hasil Penelitian 53
4.3 Cluster Model
55 4.4
Cluster Data Berdasarkan Predikat Prestasi Akademik 57
4.5 Analisis Cluster
58 4.6
Analisis Percobaan Decision Tree 59
4.6.1. Cara untuk menghitung atribut pada nilai Gain dan Entropy
65
BAB V KESIMPULAN DAN SARAN
70
5.1 Kesimpulan
70 5.2
Saran 70
DAFTAR PUSTAKA 71
LAMPIRAN L-1
Universitas Sumatera Utara
DAFTAR GAMBAR
Nomor Gambar
Judul Halaman
2.1 Tahap-Tahap Menggali Pengetahuan Dari
Pangkalan Data 9
2.2 Proses Pemetaan Kernel
26 3.1
Diagram aktivitas Kerja Penelitian 54
4.1 Cluster Model
55 4.2
Distribusi data antara IPK dengan minat belajar, kepercayaan diri, prilaku belajar, dukungan
orangtua dan waktu belajar 57
4.3 Anggota Cluster berdasarkan Predikat
58 4.4
Grafik Decision Tree 59
4.5 Model Aturan Text Decision Tree
64 4.6
Profil Predikat Kelulusan 65
4.7 Pohon keputusan berdasarkan urutan gain
tertinggi 67
Universitas Sumatera Utara
DAFTAR TABEL
Nomor Tabel
Judul Halaman
3.1 Tampilan Data Set
44 3.2
Tampilan Data 45
3.3 Kategorisasi IPK
46 3.4
Tampilan Kategorisasi Data 46
4.1 Data dalam bentuk XML
54 4.2
Hasil Clustering dalam Data View 56
Universitas Sumatera Utara
DAFTAR LAMPIRAN
Nomor Lampiran
Judul Halaman
A KUESIONER
L-1 B
Korelasi Penelitian 400 Data L-5
C Data percobaan pembuatan aturan decision tree
L-10 D
Data aturan Decision Tree berpotensial DO atau Tidak L-19
Universitas Sumatera Utara
MODEL PROFIL MAHASISWA YANG POTENSIAL DROP OUT MENGGUNAKAN TEKNIK KERNEL K-MEAN CLUSTERING
DAN DECISION TREE
ABSTRAK
Tesis ini merepresentasikan suatu model profil mahasiswa yang potensial drop out. Model ini disusun dengan menggunakan kernel k-mean clustering dan
Decision Tree. Ini dimotivasi oleh adanya ketidakseragaman penyebab mahasiswa yang drop out dalam program D3 Tehnik Informatika FMIPA USU Medan. Oleh
karena itu perlu sebuah model profil mahasiswa yang kemungkinan drop out seorang mahasiswa. Sebagai contoh kasus diambil data mahasiswa D3 Tehnik
Informatika FMIPA USU Medan untuk angkatan 20092010 dan 20102011. Data yang diperoleh terlebih dahulu dikelompokkan untuk mendapatkan informasi
kondisi mahasiswa secara keseluruhan. Berdasarkan analisa model yang diperoleh ditemukan Mahasiswa yang potensial drop out disebabkan oleh karena tidak ada
lagi minat belajar mahasiswa, kurangnya faktor dukungan orang tua, kurangnya kepercayaan diri juga kurangnya prilaku dan waktu belajar mahasiswa.
Kata Kunci : K-mean clustering, Decision tree, Drop Out, Algoritma C-45, Indeks Prestasi
Universitas Sumatera Utara
MODEL PROFILE OF POTENTIAL STUDENTS DROP OUT TECHNIQUE USING KERNEL K-MEANS CLUSTERING
AND DECISION TREE
ABSTRACT
This thesis presents a model profile of potential students who drop out. The model was compiled using kernel k-means clustering and Decision Tree. This is
motivated by the existence of unequal causes students who drop out in the program D3 Technical Information Faculty USU Medan. Therefore need a model
profile of students who drop out the possibility of a student. For example take the case of student data D3 Technical Information Faculty USU Medan to force
20092010 and 20102011. The data obtained were grouped to obtain advance information of students overall condition. Based on the analysis of models
obtained are found students who drop out due to potential because there is no interest in learning of students, lack of parental support factor, a lack of
confidence is also a lack of time behavior and student learning
.
Keywords : K-mean clustering, Decision tree, Drop Out, Algoritma C-45, Indeks Prestasi
Universitas Sumatera Utara
BAB I PENDAHULUAN