MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH DENGAN METODE DECISION TREE TESIS AFEN PRANA UTAMA SEMBIRING
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE DECISION TREE
TESIS
AFEN PRANA UTAMA SEMBIRING
097038029/TIF
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE DECISION TREE
TESIS
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Magister Teknik Informatika
AFEN PRANA UTAMA SEMBIRING
097038029/TIF
PROGRAM STUDI S2 TEKNIK INFORMATIKA
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2013
PERSETUJUAN
RULEJudul : MODEL PENYEBAB MAHASISWA
PERGURUAN TINGGI PINDAH DENGAN METODEDECISION TREE
Kategori : Tesis Nama : Afen Prana Utama Sembiring Nomor Induk Mahasiswa : 097038029 Program Studi : S2 Teknik Informatika Fakultas : ILMUKOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA Komisi Pembimbing : Pembimbing 2 Pembimbing 1 Dr. ZakariasSitumorang Prof. Dr. Muhammad Zarlis Diketahui/disetujui oleh Program Studi S2 Teknik Informatika Ketua Prof. Dr. Muhammad Zarlis NIP : 195707011986011003
PERNYATAAN
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI PINDAH
DENGAN METODE DECISION TREE
TESIS
Saya mengakui bahwa tesis ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 10 Juli 2013
Afen Prana Utama Sembiring 097038029
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini: Nama : AFEN PRANA UTAMA SEMBIRING Nim : 097038029 Program Studi : Magister (S2) TeknikInformatika JenisKaryaIlmiah : TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty free Right) atas tesis saya yang berjudul:
MODEL RULE PENYEBAB MAHASISWA PERGURUAN TINGGI
PINDAH DENGAN METODE DECISION TREE
Beserta perangkat yang ada (jika diperlukan).Dengan Hak Bebas Royalti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta. Demikian pernyataan ini dibuat dengan sebenarnya.
Medan, 10 Juli 2013 Afen Prana Utama Sembiring.
097038029
Telah diuji pada Tanggal :10 Juli 2013 PANITIA PENGUJI TESIS Ketua : Prof. Dr. Muhammad Zarlis. Anggota : 1. Dr. ZakariasSitumorang, M.T.
2. Prof. Dr. Opim Salim Sitompul.
3. Prof. Dr.Herman Mawengkang.
4. Prof. Dr. Tulus, VorDipl.Math., M.Si.
RIWAYAT HIDUP DATA PRIBADI Nama lengkap : AfenPranaUtama Sembiring, S.T., M.Kom.
TempatdanTanggalLahir : Medan, 27 April 1974 AlamatRumah : Jl. Sei Batanghari No. 58 A
Medan - 20121 Telepon / HP : (061)4155410 / +628126088893 Email InstansiTempatBekerja : STMIK-STIE MIKROSKIL Alamat Kantor : Jl. Thamrin No 122, 124, 140
Medan - 20212 Telepon : (061) 4573767
DATA PENDIDIKAN
SD : SD NEGERI No. 060831 TAMAT : 1987 SMP : SMP TUNAS KARTIKA-1 TAMAT : 1990 SMU : SMA TUNAS KARTIKA-2 TAMAT : 1993 S1 : STT Mandala Bandung TAMAT : 2001 S2 : Teknik Informatika USU TAMAT : 2013
KATA PENGANTAR
Pertama-tama kami panjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas segala limpahan rakhmad dan karunia-Nya sehingga Tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, khususnya mahasiswa Program Studi S2 Teknik Informatika di Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Tesis dengan jud ul: ”Model Rule Penyebab Mahasiswa Perguruan Tinggi Pindah Dengan Metode Decision Tree
” adalah merupakan Tesis dan syarat untuk memperoleh ijazah magister pada Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Dengan selesainya tesis ini, perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada: Ketua STMIK Mikroskil Dr. Mimpin Ginting, M.S, beserta jajarannya yang telah memberikan izin, dukungan dan kesempatan kepada penulis untuk mengikuti pendidikan lanjutan pada Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Studi S2 Teknik Informatika Universitas Sumatera Utara.
Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara, Prof. Dr. Muhammad Zarlis yang juga sebagai Ketua Program Studi S2 Teknik Informatika atas kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Studi S2 Teknik Informatika Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara.
Sekretaris Program Studi S2 Teknik Informatika M. Andri Budiman, ST, M. Comp. Sc, M.EM. beserta seluruh Staff Pengajar dan Staff Administrasi yang telah memberikan bantuan dan pelayanan yang baik selama mengikuti perkuliahan.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kami ucapkan kepada Prof. Dr. Muhammad Zarlis selaku Pembimbing Utama dan Dr. Zakarias Situmorang, M.T selaku Pembimbing Anggota yang dengan penuh kesabaran membimbing dan memotivasi, serta memberi saran yang berkaitan dengan penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya kepada Prof. Dr. Herman Mawengkang, Prof. Dr. Opim Salim Sitompul, Prof. Dr. Tulus sebagai pembanding, yang telah memberikan saran, masukan dan arahan yang baik demi penyelesaian tesis ini.
Orangtua tercinta Ibunda M Br Ginting, serta Ibu Mertua K Br Sitepu (+) serta semua keluarga yang senantiasa mendoakan, dan memberikan dorongan kepada penulis.
Istri tercinta, Helen Morina Ginting, A.Md, beserta anak anakku terkasih Deryl Aditya, Jessica Nadine Regina dan Shelly Christine yang selalu mendoakan, memberikan semangat, dengan kasih dan sabar selama penulis mengikuti pendidikan, budi baik ini tidak dapat dibalas hanya diserahkan kepada Tuhan Yang Maha Esa. Sekali lagi terima kasih.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun yang Anda berikan untuk penulis turut menghantarkan penulis untuk menyelesaikan pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan hati, semoga kiranya Tuhan Yang Maha Kuasa membalas segala bantuan, kebaikan yang telah diberikan.
Medan, 10 Juli 2013 Penulis, Afen Prana Utama Sembiring
ABSTRAK
Faktor-faktor yang mempengaruhi potensi mahasiswa mengundurkan diri/pindah masih belum dapat diketahui dengan pasti. Data mahasiswa diperoleh dari database mahasiswa STMIK Mikroskil dan hasil survei terhadap mahasiswa tahun ajaran 2011 dan 2012 yang dilakukan melalui website. Algoritma teknik data mining yang digunakan adalah algoritma C 4.5 untuk mendapatkan decision tree sehingga mendapatkan suatu model aturan/rule yang dapat memperlihatkan keterhubungan
IPK antara data ekonomi orang tua, dukungan keluarga, fasilitas, motivasi,
confidence , dan kualitas pelayanan terhadap faktor-faktor mahasiswa yang diprediksi
berpotensi mengundurkan diri/pindah dan memerlukan perhatian ekstra. Model aturan yang diperoleh menunjukkan bahwa keenam variable predictor memberikan kontribusi 80.2 %. Sedangkan variabel terbaik dari prediktor yang digunakan adalah faktor ekonomi yang memberikan kontribusi sebesar 58.3% terhadap mahasiswa yang berpotensi mengundurkan diri/pindah. Key Word : Algoritma C4.5, decision tree, model rule.
MODEL RULE THE CAUSE OF COLLEGE STUDENT MOVING
WITH A METHOD OF DECISION TREE
ABSTRACT
Factors that influence students' potential resigned still not be known with certainty.Student data obtained from the database of students STMIK Mikroskil and the results of a survey of student academic year 2011 and 2012 were carried out through the website. Algorithms data mining technique used is the algorithm C 4.5 to get the decision tree so getting a model rule that can demonstrate a grade point average connectedness between economic data of parents, family support, facilities, motivation, confidence, and quality of service to the factors students potentially predictable resigned and require extra attention. Model rules showed that six predictor variables contribute 80.2%. While the best of predictor variables used are economic factors which contributed 58.3% of the students who could potentially resigned. Key Word : Algorithms C 4.5, decision tree, model rule.
DAFTAR ISI
BAB I PENDAHULUAN
2.9 Perbedaan dengan Riset-riset lain
12
2.5 Algoritma C 4.5
13
2.6 Ekstraksi Rule dari Decision Tree
20
2.7 Riset- riset Terkait
23
2.8 Persamaan dengan Riset
23
24
10
2.10 Kontribusi Riset
24 BAB III METODE PENELITIAN
26
3.1. Pendahuluan
26
3.2 Lokasi dan Waktu Penelitian
26
3.3 Rancangan Penelitian
26
2.4 Pengertian Decision Tree
2.3 Pengelompokan Data Mining
Halaman KATA PENGANTAR i
1.2 Perumusan Masalah
ABSTRAK iii
ABSTRACT iv
DAFTAR ISI v
DAFTAR TABEL viii
DAFTAR GAMBAR x
DAFTAR LAMPIRAN xi
1
1.1 Latar Belakang
1
2
5
1.3. Batasan Masalah
2
1.4 Tujuan Penelitian
3
1.5 Manfaat Penelitian
3 BAB II TINJAUAN PUSTAKA
4
2.1 Pengunduran Diri Mahasiswa
4
2.2 Pengertian Data Mining
- – riset lain
3.4 Prosedur Pengumpulan Data
4.3.3.4 Statistik Frekuensi Faktor Motivasi
42
4.3.2 Hasil Percobaan Descriptive Data
45
4.3.3 Hasil Percobaan Frekuensi Data
46
4.3.3.1 Statistik Frekuensi Faktor Ekonomi
46
4.3.3.2 Statistik Frekuensi Faktor Dukungan Keluarga
47
4.3.3.3 Statistik Frekuensi Faktor Fasilitas Belajar
47
48
42
4.3.3.5 Statistik Frekuensi Faktor Confidence
49
4.3.3.6 Statistik Frekuensi Faktor Kualitas Pelayanan
50
4.3.4 Signifikan
51
4.4.4 Hasil Percobaan Decision Tree
53 BAB V KESIMPULAN DAN SARAN
70
5.1. Kesimpulan
70
5.2 Saran
4.3.1 Hasil Percobaan Sampel Data
4.3 Hasil Transformasi Data Set
27
3.7 Alat Analisis Data
3.4.1 Mahasiswa Mengundurkan Diri
27
3.4.2 Mahasiswa Berpotensi Mengundurkan Diri
27
3.5 Validitas dan Reabilitas (Keakuratan Data)
30
3.6 Preprocessing Data
30
3.6.1 Preprocessing Database Akademik
30
3.6.2 Preprocessing Data Kuesioner
33
34
40
3.7.1 Paket Statitik Untuk Ilmu Sosial
34
3.7.2 Komunitas Rapid Miner
34
3.8 Instrument Penelitian
35
3.9 Diagram Aktifitas Kerja Penelitian
37 BAB IV HASIL DAN PEMBAHASAN
40
4.1. Pendahuluan
40
4.2 Hasil Transformasi Data Set Pengunduran Diri Mahasiswa
70
DAFTAR PUSTAKA
72 LAMPIRAN
74
DAFTAR TABEL
41 Tabel 4.2 Signifikan dan Reliabilitas Statistik Faktor Ekonomi Orang Tua
48 Tabel 4.13 Hasil Uji Frekuensi Faktor Motivasi
47 Tabel 4.12 Hasil Uji Frekuensi Faktor Fasilitas Belajar
46 Tabel 4.11 Hasil Uji Frekuensi Faktor Dukungan Keluarga
45 Tabel 4.10 Hasil Uji Frekuensi Faktor Ekonomi Orang Tua
Statistik Testing Data
Descriptive
44 Tabel 4.9
44 Tabel 4.8 Signifikan dan Reliabilitas Statistic Data
43 Tabel 4.7 Signifikan dan Reliabilitas Statistik Faktor Kualitas Pelayanan
43 Tabel 4.6 Signifikan dan Reliabilitas Statistik Faktor Confidence
43 Tabel 4.5 Signifikan dan Reliabilitas Statistik Faktor Motivasi
42 Tabel 4.4 Signifikan dan Reliabilitas Statistik Faktor Fasilitas Belajar
42 Tabel 4.3 Signifikan dan Reliabilitas Statistik Faktor Dukungan Keluarga
33 Tabel 4.1 Korelasi Signifikan IPK dan Pendidikan Orang Tua
Halaman
33 Tabel 3.9 Data Kuesioner
32 Tabel 3.8 Data Penelitian
32 Tabel 3.7 Sks Lulus Mahasiswa
31 Tabel 3.6 Biodata Mahasiswa
29 Tabel 3.5 Mahasiswa Pindah
28 Tabel 3.4 Tampilan Data Set Pertama dan Kedua
28 Tabel 3.3 Tampilan Data Set Kedua
27 Tabel 3.2 Tampilan Data Set Pertama Potensi Mengundurkan Diri
19 Tabel 3.1 Tampilan Data Set Pertama Pengunduran Diri
18 Tabel 2.4 Perhitungan Node 1.1.2
17 Tabel 2.3 Perhitungan Node 1.1
15 Tabel 2.2 Perhitungan Node 1
Tabel 2.1 Keputusan Bermain Tenis48
Tabel 4.14 Hasil Uji Frekuensi Faktor Confidence49 Tabel 4.15 Hasil Uji Frekuensi Faktor Kualitas Pelayanan
50 Tabel 4.16 Statistik Frekuensi Enam Faktor Pendukung
51 Tabel 4.17 Korelasi Signifikan dari Enam Prediktor Variable Predikat
52 Tabel 4.18 Signifikan Dari Enam Variable Prediktor
53 Tabel 4.19 Keterangan Rule Grafik
54 Tabel 4.20 Keterangan Rule Text dengan Gain Rasio
59 Tabel 4.21 Model Aturan Penyederhanaan Induction Rule
64
DAFTAR GAMBAR
53 Gambar 4.2 Model Aturan Text Decision Tree
68 Gambar 4.9 Hubungan Antara Predikat Kualitas Pelayanan
68 Gambar 4.8 Hubungan Antara Predikat Confidence
67 Gambar 4.7 Hubungan Antara Predikat Dengan Motivasi
67 Gambar 4.6 Hubungan Antara Predikat Dengan Fasilitas
66 Gambar 4.5 Hubungan Antara Predikat Dengan Dukungan Keluarga
64 Gambar 4.4 Hubungan Antara Predikat Dengan Ekonomi Orang Tua
58 Gambar 4.3 Model Aturan Induction Rule
38 Gambar 4.1 Grafik Decision Tree
Halaman
35 Gambar 3.2 Diagram Aktivitas Kerja Penelitian
20 Gambar 3.1 Proses Percobaan
19 Gambar 2.6 Pohon Keputusan Hasil Perhitungan Node 1.1.2
18 Gambar 2.5 Pohon Keputusan Hasil Perhitungan Node 1.1
8 Gambar 2.4 Pohon Keputusan Hasil Perhitungan Node 1
7 Gambar 2.3 Tahap-tahap Data Mining
6 Gambar 2.2 Taksonomi Data Mining
Gambar 2.1 Bidang Ilmu Data Mining69