IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS Implementasi Data Mining Untuk Memprediksi Kelulusan Mahasiswa Fakultas Komunikasi Dan Informatika UMS Menggunakan Metode Naive Bayes.

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI KELULUSAN
MAHASISWA FAKULTAS KOMUNIKASI DAN INFORMATIKA UMS
MENGGUNAKAN METODE NAIVE BAYES

SKRIPSI
Disusun sebagai salah satu syarat menyelesaikan Jenjang Strata I
pada Program Studi Teknik Informatika Fakultas Komunikasi dan Informatika
Universitas Muhammadiyah Surakarta
Oleh :
AHMAD FIKRI MAURIZA
L200100123

PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS KOMUNIKASI DAN INFORMATIKA
UNIVERSITAS MUHAMMADIYAH SURAKARTA
2014

i

ii


iii

DAFTAR KONTRIBUSI
Dengan ini saya menyatakan bahwa skripsi ini tidak terdapat karya yang
pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi,
dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang
pernah ditulis atau diterbitkan oleh orang lain kecuali yang secara tertulis diacu
dalam naskah ini dan disebutkan dalam daftar pustaka.
Berikut saya sampaikan daftar kontribusi dalam penyusunan skripsi:
1. Mas Setiawan sebagai rekan untuk pencarian data sebagai bahan olah data
mining.

2. Saya sendiri yang mengolah data dan penghitungan metode naive bayes
berdasarkan sumber-sumber pada buku, literatur dan internet. .
3. Aplikasi yang saya gunakan untuk membantu skripsi ini yaitu.
a. WEKA 3.7.10.
b. Microsoft Excel 2007.
c. Excel2Arrf Converter V.1.0-Beta.
d. Notepad ++
4. Laptop yang


digunakan memiliki spesifikasi Processor Intel Dual-Core

2,30 GHz, Ram 3,00 GB, Hardisk 250 GB, VGA mobile Intel (R) 45
Express Chipset Family dengan ukuran memori 1341 MB.
5. Laporan diketik menggunakan software Microsoft Office 2007.
6. Yusuf Sulistyo Nugroho, S.T., M.Eng, selaku dosen pembimbing yang
memberikan masukan dan arahan dalam penyusunan skripsi ini.

iv

Demikian pernyataan dan daftar kontribusi ini saya buat dengan sejujurnya.
Saya bertanggungjawab atas isi dan kebenaran daftar diatas.

Surakarta,

Desember 2013

Ahmad Fikri Mauriza


Mengetahui :
Pembimbing

Yusuf Sulistyo Nugroho, S.T,. M.Eng
NIK : 100.1197

v

MOTTO DAN PERSEMBAHAN

MOTTO :

“Manfaatkan waktu dan kesempatan mu dengan sebaik-baiknya sebelum
p y

-Ibu“Bismillah, semua hal itu pasti dapat kita taklukan dengan tangan kita
bermodal

-Penulis“H


p

y
-Benjamin Franklin-

vi



PERSEMBAHAN :

Dengan mengucap syukur Alhamdulillah atas rahmad dan hidayah
Allah SWT, akan kupersembahkan karya ini kepada orang-orang saya sayangi:
1. Bapak - Ibuku tercinta yang tak pernah lelah dalam memotifasiku dan
mendoakan untuk meraih kesuksesan di dunia dan akhirat.
2. Nada dan Irsya sebagai adik, penghibur dan teman saat dirumah.
3. Keluarga besar H. Abdullah Syafii (mbah kakung) yang telah mendukung
dan mendoakan di setiap langkahku agar dapat menyelesaikan kuliah lebih
cepat dan menuju kesuksesan setiap lulus.
4. Devi, Asri, Nurul dan Lukman yang telah bersedia menjadi teman,

sahabat, dan keluarga yang menemani hari-hari dengan keceriaan dan
kebahagiaan.
5. Pak Nursito (Pak kost) dan teman-teman kost AL-FIKR yang sudah
menemani mulai awal kuliah sampai lulus.
6. Teman-teman Teknik Informatika angkatan 2010 terutama teman-teman
gembel dan kepompong yang telah menemaniku mulai semester 1 sampai
semester 7 dan berjuang menempuh gelar sarjana bersama-sama.
7.

Keluarga besar Teknik Informatika UMS yang telah banyak memberikan
ilmu dan pengalamannya.

8. Semua pihak yang tidak dapat saya sebutkan satu persatu atas semua hal
yang telah diberikan.

vii

KATA PENGANTAR

Assalamu’alaikum warohmatullohi Wabarakatuh

Puji syukur kehadirat Allah SWT, yang telah melimpahkan nikmat dan
anugerah yang sangat luar biasa sehingga saya dapat menyelesaikan skripsi
dengan baik yang berjudul “Implementasi Data Mining Untuk Memprediksi
Kelulusan

Mahasiswa Fakultas Komunikasi

Dan

Informatika Ums

Menggunakan Metode Naive Bayes”.
Skripsi ini disusun sebagai syarat wajib untuk menyelesaikan pendidikan
jenjang Strata 1 pada Program Studi Teknik Informatika Universitas
Muhammadiyah Surakarta. Atas selesainya skripsi ini tidak lepas dari dukungan
dan bantuan dari berbagai pihak sehingga dapat berjalan dengan lancar dan sesuai
harapan, oleh karena itu pada kesempatan ini penulis ingin menyampaikan banyak
terima kasih kepada :
1. Allah SWT yang telah memberikan nikmat dan hidayahnya kepada
penulis sehingga diizinkan untuk menyelesaikan skripsi ini.

2. Orang tua dan keluarga besar penulis yang telah memberikan segala
dukungan berupa doa, moral dan materi.
3. Bapak Husni Thamrin, S.T, M.T., Ph.D selaku dekan Fakultas Komunikasi
Dan Informatika Universitas Muhammadiyah Surakarta.
4. Bapak Dr. Heru Supriyono, M.Sc selaku ketua Program Studi Teknik
Informatika.

viii

5. Bapak Yusuf Sulistyo Nugroho, S.T, M.Eng selaku pembimbing skripsi
yang telah banyak membantu dalam memberikan petunjuk dan saran-saran
dalam penyusunan skripsi ini.
6. Mas Setiawan sebagai partner dalam kolaborasi skripsi ini yang telah
menemani mengerjakan skripsi dan membantu dalam pencarian data-data
yang diperlukan dalam penyusunan skripsi.
7. Bapak dan ibu dosen pengampu mata kuliah pada Program studi teknik
informatika yang telah memberikan ilmu serta pengalamannya kepada
penulis.
8. Teman-teman Teknik Informatika khususnya angkatan 2010 kelas E yang
telah mendukung dan menjadi teman yang sama-sama berjuang meraih

gelar sarjana.
9. Semua pihak yang tidak dapat penulis sebutkan satu persatu yang berperan
dan membantu dalam penyelesaian skripsi ini.
Semoga Allah SWT selalu melimpahkan nikmat dan hidayahnya kepada
orang-orang yang telah membantu dalam kelacaran penyusunan ini. Penulis
berharap semoga skripsi ini dapat bermanfaat bagi penulis dan orang lain untuk
dikembangkan sehingga akan dapat menghasilkan penelitian-penelitan yang lebih
baik lagi dari sebelum-sebelumnya.
Wassalamu’alaikum Warohmatullohi Wabarokatuh.
Surakarta, 20 Desember 2013

Penulis

ix

DAFTAR ISI

HALAMAN JUDUL ................................................................................... i
HALAMAN PERSETUJUAN ..................................................................... ii
HALAMAN PENGESAHAN ...................................................................... iii

DAFTAR KONTRIBUSI ............................................................................. iv
MOTTO DAN PERSEMBAHAN ................................................................ vi
KATA PENGANTAR ................................................................................. viiii
DAFTAR ISI ............................................................................................... x
DAFTAR TABEL ........................................................................................ xiii
DAFTAR PERSAMAAN ............................................................................ xiii
DAFTAR GAMBAR ................................................................................... xiv
ABSTRAKSI ............................................................................................... xvi
BAB I

PENDAHULUAN .................................................................... 1
A. Latar Belakang .................................................................... 1
B. Rumusan Masalah ............................................................... 4
C. Batasan Masalah ................................................................. 4
D. Tujuan Masalah .................................................................. 5
E. Manfaat Penelitian .............................................................. 5
F. Sistematika Penulisan ......................................................... 6

BAB II


TINJAUAN PUSTAKA ............................................................ 8
A. Telaah Penelitian ................................................................ 8
B. Landasan Teori ................................................................... 11
x

1. Prediksi ......................................................................... 11
2. Kelulusan Mahasiswa .................................................... 12
3. Data Mining .................................................................. 12
4. Proses Data Mining ....................................................... 13
5. Naive Bayes .................................................................. 15
6. Weka ............................................................................. 15
BAB III

METODOLOGI PENELITIAN ................................................ 17
A. Waktu Dan Tempat Penelitian ............................................. 17
B. Peralatan Utama Dan Pendukung ........................................ 17
C. Alur Penelitian .................................................................... 18
D. Langkah Penelitian ............................................................. 21
1. Identifikasi Masalah ...................................................... 21
2. Pengumpulan Data ........................................................ 21

3. Kelengkapan Data Dan Kebutuhan ................................ 24
a. Cleaning Data .......................................................... 24
b. Penentuan Sampel ................................................... 25
4. Implementasi Data Mining ............................................ 25
a. Pengubahan Format Arff ......................................... 25
b. Menentukan Metode ................................................ 26

BAB IV

HASIL DAN PEMBAHASAN ................................................. 28
A. Hasil Penelitian ................................................................... 28
B. Analisis Dan Pembahasan ................................................... 28
1. Menentukan Atribut ...................................................... 28

xi

2. Penentuan Sampel ......................................................... 29
3. Pengolahan Data ........................................................... 30
4. Pengubahan Data Dalam Arff ........................................ 31
5. Implementasi Dengan Naive Bayes ............................... 32
6. Implementasi Dalam Weka 3.7.10 ................................. 36
7. Membandingkan Metode Naive Bayes .......................... 57
BAB V

PENUTUP ................................................................................. 61
A. Kesimpulan ......................................................................... 61
B. Saran ................................................................................... 61
1. Bagi Peneliti Berikutnya ............................................... 61
2. Bagi Fakultas ................................................................ 62

DAFTAR PUSTAKA .................................................................................. 63
LAMPIRAN ................................................................................................ 66

xii

DAFTAR TABEL

Tabel 3.1 Daftar Atribut .............................................................................. 22
Tabel 3.2 Daftar Atribut Beserta Isinya ....................................................... 24
Tabel 4.1 Perbandingan dari Naive Bayes, J48 dan OneR ............................ 55

DAFTAR PERSAMAAN

Persamaan (3.1) Metode Slovin .................................................................. 25
Persamaan (3.2) Irisan (X|Y) ...................................................................... 27
Persamaan (3.3) Naive Bayes ..................................................................... 27

xiii

DAFTAR GAMBAR

Gambar 2.1 Tahap-Tahap Data Mining ....................................................... 13
Gambar 3.1 Diagram Alir Penelitian ........................................................... 19
Gambar 3.2 Diagram Ven ........................................................................... 27
Gambar 4.1 Data Asal Sebelum Dikelompokkan ........................................ 30
Gambar 4.2 Hasil Data Yang Sudah Dikodekan .......................................... 30
Gambar 4.3 Jendela Excel2Arrf Converter V.1.0-Beta ................................ 31
Gambar 4.4 Cara Upload .Xls Pada Converter ............................................ 31
Gambar 4.5 Hasil Converter ....................................................................... 32
Gambar 4.6 Data Training .......................................................................... 33
Gambar 4.7 Data Praproses ........................................................................ 36
Gambar 4.8 Jurusan Pada Lama Studi ......................................................... 37
Gambar 4.9 Gender Pada Lama Studi ......................................................... 38
Gambar 4.10 Daerah Pada Lama Studi ....................................................... 39
Gambar 4.11 Asal Sekolah Pada Lama Studi .............................................. 40
Gambar 4.12 Jumlah SKS Pada Lama Studi ............................................... 41
Gambar 4.13 Jumlah MK Pada Lama Studi ................................................ 42
Gambar 4.14 Asisten Pada Lama Studi ....................................................... 43
Gambar 4.15 Penyebaran Jurusan dan Gender ............................................ 44
Gambar 4.16 Penyebaran Jurusan dan Daerah ............................................. 45
Gambar 4.17 Penyebaran Gender dan Daerah ............................................. 46
Gambar 4.18 Penyebaran Jurusan dan SKS.................................................. 47

xiv

Gambar 4.19 Penyebaran Jurusan dan MK ................................................. 48
Gambar 4.20 Penyebaran Jurusan dan Gender ............................................ 49
Gambar 4.21 Penyebaran Gender dan SKS ................................................ 44
Gambar 4.22 Hasil Klasifikasi Naive Bayes ............................................... 47
Gambar 4.23 Hasil Evaluasi ....................................................................... 48
Gambar 4.24 Detail Akurasi Dan Confusion Matrix ................................... 49
Gambar 4.25 Memasukkan Data Uji ........................................................... 50
Gambar 4.26 Pencarian File Data Uji .......................................................... 50
Gambar 4.27 Hasil Evaluasi Akurasi Data Uji ............................................ 51
Gambar 4.28 Visualiza Classifier Errors ..................................................... 51
Gambar 4.29 Hasil Prediksi Data Uji .......................................................... 52
Gambar 4.30 Evaluasi J48 .......................................................................... 53
Gambar 4.31 Evaluasi Oner ........................................................................ 54

xv

ABSTRAKSI
Fakultas Komunikasi dan Informatika Universitas Muhammadiyah
Surakarta memiliki jumlah 2358 mahasiswa dengan jumlah lulusan 388
mahasiswa, Dengan bertambah pesatnya jumlah mahasiswa baru setiap tahunnya
dengan demikian secara otomatis akan terciptanya data-data yang sangat banyak
dan akan menambah melimpahnya data yang tersimpan tapi minim informasi.
Agar data yang awalnya tidak terpakai tersebut dapat diubah menjadi suatu
informasi data yang sangat bermanfaat dengan menggunakan teknik data mining.
Salah satunya dapat untuk memprediksi lama studi mahasiswa apakah dapat lulus
kurang dari 4 tahun atau lebih dari 4 tahun dengan berdasarkan atribut-atribut
yang digunakan.
Metode Naive Bayes digunakan untuk menganalisis data dalam
pengenalan pola dan memprediksi kelulusan mahasiswa. Data yang diperlukan
yaitu data-data mahasiswa yang sudah lulus sebagai data training sedangkan
data-data mahasiswa yang masih menempuh studi kuliah sebagai data uji.
Dengan adanya penelitian ini dapat memberikan informasi yang berguna
sehingga dapat meningkatkan kualitas atau dijadikan suatu acuan bagi
mahasiswa untuk memprediksi kelulusan dengan tepat waktu. Berdasarkan hasil
prediksi dari jumlah 342 data sampel yang diuji hanya 86 mahasiswa yang akan
lulus tepat waktu atau hanya sekitar 25,15 %, sedangkan mahasiswa yang akan
lulus terlambat berjumlah 256 mahasiswa mencapai 74,85% dari jumlah data
sampel.

Kata kunci : Data Mining, Naive Bayes, Prediksi

xvi