APLIKASI UNTUK MENGETAHUI TINGKAT KELULU

APLIKASI UNTUK MENGETAHUI TINGKAT KELULUSAN
MAHASISWA UMSIDA TAHUN 2008 MENGGUNAKAN
METODE DATA MINING C4.5 STUDI KASUS DI
UNIVERSITAS MUHAMMADIAYAH SIDOARJO
Evita
Teknik Informatika(S1), FakultasTeknik, Universitas Muhammadiyah Sidoarjo,
Jl. Raya Gelam 250 CandiSidoarjo 61271
E-mail: evita@gmail.com

Abstrak - Data mining adalah penambangan atau penemuan informasi baru dengan mencari
pola atau aturan tertentu dari sejumlah data dalam jumlah besar yang diharap dapat
mengatasi kondisi tersebut. Dengan memanfaatkan data induk mahasiswa dan data kelulusan
mahasiswa diharapkan dapat menghasilkan informasi tentang tingkat kelulusan dengan data
induk mahasiwa melaluli teknik data mining. Kategori tingkat kelulusan di ukur dari SKS dan
IPK. Algoritma yang digunakan adalah algoritma C4.5. System bisa menampilkan informasi
tentang tingkat kelulusan mahasiswa Teknik Informatika UMSIDA Sidoarjo dengan menggunakan
metode C4.5.
Keywords – Pohon Keputusan, C4.5, Data mining, Kelulusan Mahasiswa .

I. PENDAHULUAN


Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi
yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga informasi akan
menjadi suatu elemen penting dalam perkembangan masyarakat saat ini dan waktu
mendatang. Namun kebutuhan informasi yang tinggi kadang tidak diimbangi dengan
penyajian informasi yang memadai, sering kali informasi tersebut masih harus di gali
ulang dari data yang jumlahnya sangat besar. Para pengambil keputusan berusaha untuk
memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi yang berguna
membantu mengambil keputusan, hal ini mendorong munculnya cabang ilmu baru untuk
mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data
dalam jumlah besar, yang disebut dengan data mining.
II. KAJIAN PUSTAKA

Secara sederhana data mining adalah penambangan atau penemuan informasi
baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar
(Davies, 2004). Data mining juga disebut sebagai serangkaian proses untuk menggali
nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari
suatu kumpulan data (Pramudiono, 2007). Data mining, sering juga disebut sebagai
knowledge discovery in database (KDD). KDD adalah kegiatan yang meliputi
pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau


1

hubungan dalam set data berukuran besar (Santoso, 2007). Dalam decision tree tidak
menggunakan vector jarak untuk mengklasifikasikan obyek. Seringkali data observasi
mempunyai atribut-atribut yang bernilai nominal. Misalkan obyeknya adalah sekumpulan
buah-buahan yang bisa dibedakan berdasarkan atribut bentuk, warna, ukuran dan rasa.
Bentuk, warna, ukuran dan rasa adalah besaran nominal, yaitu bersifat kategoris dan tiap
nilai tidak bis dijumlahkan atau dikurangkan. Dalam atribut warna ada beberapa nilai
yang mungkin yaitu hijau, kuning, merah. Dalam atribut ukuran ada nilai besar, sedang
dan kecil. Dengan nilai-nilai atribut ini, kemudian dibuat decision tree untuk menentukan
suatu obyek termasuk jenis buah apa jika nilai tiap-tiap atribut diberikan (Santoso, 2007).
Algoritma Decision Tree
Pohon keputusan (Decision Tree) merupakan metode klasifikasi dan prediksi
yang sangat kuat dan terkenal.Metode pohon keputusan mengubah fakta yang sangat
besar menjadi pohon keputusan yang mempresentasikan aturan.Aturan dapat dengan
mudah dipahami dengan bahasa alami. Aturan ini juga dapat di ekspresikan dalm bentuk
bahasa basisi data seperti SQL untuk mencari record pada kategori tertentu. Pohon
keputusan juga berguna untuk mengesplorasi data, menemukan hubungan tersembunyi
antara sejumblah calon variable input dengan variable target. Karena pohon keputusan
memadukan antara explorasi data dan pemodelan, pohon keputusan ini sangat bagus

sebagai langka awal dalam proses pemodelan bahkan ketika dijadikan sebagai model
akhir dari beberapa teknik lain (J R Quinlan,1993).
Berikut algoritmanya:

¿ ∗¿
¿ S∨¿
¿
Entropy(Si)
k
∑¿

¿ Si∨
Gain(S,A) = Entropy(S) -

i=1

Dan untukmencari entropy nya:

¿ ∗¿
¿ S∨¿

¿
Entropy(Si)
k
∑¿

¿ Si∨
Gain(S,A) = Entropy(S) -

i=1

III. METODE PENELITIAN

Analisis Data Mining
Dalam penulisan tugas akhir ini akan dicari nilai support dan confidence dari
hubungan tingkat kelulusan dengan data induk mahasiswa. Tidak semua data induk siswa
akan dicari hubungannya dengan data kelulusan, hanya beberapa atribut yang kira – kira
berguna dan sebarannya tidak terlalu acak. Karena data yang terlalu acak akan membuat
proses mining memakan waktu lama dan tingkat hubungannya pun rendah. Data induk
mahasiswa yang akan dicari hubungannya meliputi proses masuk, asal sekolah, kota asal
sekolah, dan program studi.

2

Table Data Awal
Data yang digunakan dalam penulisan tugas akhir ini terdiri dari dua sumber data,
yaitu data awal dan data kelulusan.

1. Data awal
Data yang akan di tunjukkan pada table 3.1 sebagai berikut :

Table 3.1Tabel data kelulusan

Atribut
NIM

Nama mahasiswa
Jenis Kelamin
Asal Sekolah
SKS
IPK
Kelulusan


Keterangan
Nomor induk mahasiswa (NIM) adalah kode yang
dimiliki mahasiswa sebagai nomer unik identitas
diperguruan tinggi. Terdiri dari 12 digit yang
mempresentasikan fakultas, jurusan, dan angkatan
masuk.
Merupakan nama lengkap mahasiswa yang
bersangkutan
Merupakanjenis kelamin mahasiswa yang
bersangkutan
Merupakan asal sekolah mahassiswa yang
bersangkutan
Merupakan sebagai ukuran tingkat kelulusan
mahasiswa
Merupakan indeks prestasi komulatif yang
menentukan kelulusan mahasiswa
Merupakan outputan dari kelulusan. Apakah tepat
waktu atau tidak


Transformasi Data
Transformasi data merupakan proses pengubahan atau penggabungan data
kedalam format yang sesuai untuk diproses dalam data mining. Seringkali data yang akan
digunakan dalam proses data mining mempunyai format yang belum langsung bisa
digunakan, oleh karena itu perlu dirubah formatnya.
Tabel 3.2Transformasi Data
Ketegori
I1
I2
I3
SK1
SK2
Negeri
Swasta

Keterangan
3,50-4,00
3,00-3,49
3,00-2,75
/=144

Dari Sekolah Negeri
Dari Sekolah Swasta
3

L
P

Laki-Laki
Perempuan

IV. HASIL DAN PEMBAHASAN

Hasil Penelitian
Hasil penelitian sebagai berikut :
1. System bisa menampilkan informasi tentang tingkat kelulusan
mahasiswa Teknik Informatika UMSIDA Sidoarjo dengan
menggunakan metode C4.5. metode ini digunakan untuk menentukan
keputusan ketepatan kelulusan mahasiswa tersebut.
2. System juga memproses perhitungan dengan menggunakan algoritma
yang sudah di jelaskan pada bab sebelumnya. Data yang digunakan

dalam tugas akhir ini merupakan data survey yang diperoleh dari
Universitas Muhammadiyah Sidoarjo. Data merupakan data
kategorikal dan tidak ada mising value pada data. Jumlah data yang
digunakan sebanyak 132 data Dalam implementasinya, data dipecah
menjadi beberapa bagian,yaituC4.5 akan memecah menjadi 3, yaitu:
a. Data training: digunakan untuk membentuk pohon
keputusan.
b. Data ujicoba: digunakan untuk uji coba pada pohon yang
telah dibentuk guna menghitung nilai error rate.
Menu Home

Gambar 4.1 Menu Home

4

Pada menu home berisikan sekilas tentang apa itu data mining beserta
metodenya yaitu metode c4.5. Metode ini merupakan metode yang menggunakan
pohon keputusan untuk mengetahui hasil akhir keputusannya. Metode ini juga
sangat familiyar dalam data mining.
Menu Perhitungan


Gambar 4.2 Form Data Perhitungan C4.5

Pada form perhitungan C4.5 ini system menghitung secara otomatis
inputan data training yang ada dan system juga menghitung sesuai dengan
algoritma C4.5. pada form ini berisikan perhitungan yang real. Perhitungan
dilakukan system untuk mengetahui hasil keputusan.
Pohon Keputusan

5

Gambar 4.3 Form Pohon keputusan

Pengujian Mengenai Kinerja Aplikasi

Gambar 4.12Hasil Ujicoba

V. KESIMPULAN
Kesimpulan
Namun demikian pada akhir ini akan diuraikan secara garis besarnya saja dari

apa yang telah dibahas dan dapat disimpulkan sebaga iberikut.

6

Bahwadalam penilaian kelulusan untuk menentukanya atau tidaknya mahasiswa
lulus tepat atau tidaknya bisa ditentukan dengan tepat dan akurat dengan metrode data
mining c4.5.Telah terbukti keakuratannya dengan metode ini.
Saran
Setelah selesainya penulisan dan pembuatan aplikasi ini, mulai dari tahap-tahap
awal hingga akhir, maka penulis ingin mengungkapkan dan memberikan saran-saran
untuk menunjang kemajuan sekolah sesuai dengan kemampuan penulis dari apa yang
telah dialamiselama penyelesaian Skripsi ini. Adapun saran-saran tersebut adalah :
1. Untuk pengembangan aplikasi selanjutnya diharapkan dilakukan ujicoba
dengan data training dan data testing yang lebih banyak, dengan begitu maka
klasifikasi data akan semakin besar tingkat kebenarannya.
2. Disarankan aplikasi ini dapat diimplementasikan walaupun belum sempurna,
sehingga dapat membantu proses dalam mencari tingkat kelulusan mahasiswa
umsida.
Demikian kesimpulan dan saran-saran yang dapat diberikan, semoga bermanfaat
bagisemua, sekian dan terima kasih.

DAFTAR PUSTAKA
[1] Santosa, Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan

Bisnis”, GrahaIlmu, Yogyakarta.
[2] NurIsani, M.sc (2003), Analisis Proses Data Mining Data mining
[3] Han, J. and Kamber, M, 2006, “Data Mining Concepts and Techniques

SecondEdition”. Morgan Kauffman, San Francisco.
[4] Pramudiono, I. 2007. Pengantar Data Mining :MenambangPermataPengetahuan
[5]
[6]
[7]
[8]

di Gunung Data.
http://www.ilmukomputer.org/wp-content/uploads/2006/08/iko-datamining.zip,
Diakses pada 15 Maret 2009jam 08.54
Davies, and Paul Beynon, 2004, “Database Systems Third Edition”,Palgrave
Macmillan, New York.
Elmasri, Ramez and Shamkant B. Navathe, 2000, “Fundamentals of Database
Sommerville, Ian, 2003, “Software Engineering (Rekayasa Perangkat
Lunak)/Edisi 6/Jilid 1” Erlangga, Jakarta.

7