APLIKASI DATAMINING UNTUK MENAMPILKAN IN

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015

1

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN
MAHASISWA
Akhmad Ulil Albab1, Ade Eviyanti, S.Kom.2
Teknik Informatika, Universitas Muhammadiyah Sidoarjo
Jl. Raya Gelam 250, Candi – Sidoarjo
akhmadulil@gmail.com1, orline09@yahoo.com2

Abstrak
Tingkat kelulusan program pendidikan akademik strata 1 memiliki beban studi sekurangkurangnya 144 (seratus empat puluh empat) sks (satuan kredit semester) dan sebanyak-banyaknya 160
(seratus enam puluh ) sks yang dijadwalkan untuk 8 (delapan) semester dan dapat ditempuh dalam waktu
kurang dari 8 (delapan) semester dan paling lama 14 (empat belas) semester. Data mining, sering juga
disebut knowledge discovery in database (KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian
data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar.
Keluaran dari data mining ini bisa dipakai untuk memperbaiki pengambilan keputusan di masa depan.
Metode Naive Bayes adalah suatu metode untuk memulai prediksi suatu data dari fakta-fakta
yang ada menuju suatu kesimpulan. Berdasarkan uraian tersebut diatas, maka dilakukan penelitian

penerapan metode Naive Bayes pada proses menampilkan tingkat kelulusan mahasiswa dengan
menggunakan data master dan faktor-faktor yang mempengaruhi sehingga diharapkan akan mendapat
suatu output yang berupa informasi bagi universitas maupun bagi mahasiswai,dengan adanya informasi
tersebut kita dapat menyimpulkan apakah mahasiswa akan lulus tepat waktu ataupun terlambat.
Kata Kunci: Tingkat kelulusan, data mining, naive bayes
Abstract
The graduation rate academic education program strata 1 has a study load of at least 144 ( one
hundred and forty-four ) SKS ( semester credit units ) and up to 160 ( one hundred and sixty ) credits
which are scheduled for 8 ( eight ) semesters and can be reached within less than eight (8 ) semesters and
a maximum of 14 ( fourteen ) semester. Data mining , often also called knowledge discovery in databases
( KDD ) , is an activity that includes the collection , use historical data to find regularities , patterns or
relationships in large data sets . Output of data mining can be used to improve decision making in the
future .
Naive Bayes method is a method to start the prediction of the data of facts that exist towards a
conclusion . Based on the description above, the application of the research performed at the Naive Bayes
method to show the graduation rate of students using the master data and the factors that influence which
is expected to receive an output in the form of information to the university and for mahasiswai , with this
information we can conclude whether students will graduate on time or late
Keyword : Graduation rates , data mining , Naive Bayes


1. Latar Belakang
Perguruan tinggi saat ini dituntut untuk
memiliki
keunggulan
bersaing
dengan
memanfaatkan semua sumber daya yang dimiliki.
Selain sumber daya sarana, prasarana, dan manusia,
sistem informasi adalah salah satu sumber daya
yang dapat digunakan untuk meningkatkan
keunggulan bersaing. Sistem informasi dapat
digunakan untuk mendapatkan, mengolah dan
menyebarkan informasi untuk menunjang kegiatan
operasional sehari-hari sekaligus menunjang
kegiatan pengambilan keputusan strategis.
Di dalam peraturan akademik Universitas
MUHAMMADIYAH
SIDOARJO
“Program
Sarjana (S1) reguler adalah program pendidikan

akademik setelah pendidikan menengah, yang
memiliki beban studi sekurang-kurangnya 144

(seratus empat puluh empat) sks (satuan kredit
semester) dan sebanyak-banyaknya 160 (seratus
enam puluh ) sks yang dijadwalkan untuk 8
(delapan) semester dan dapat ditempuh dalam
waktu kurang dari 8 (delapan) semester dan paling
lama 14 (empat belas) semester”. Berdasarkan
buku panduan akademik tahun 2011/2012, peserta
wisuda Program Sarjana (S1) reguler di Fakultas
Teknik Jurusan Informatika menempuh masa studi
lebih dari 8 semester. Hal ini menunjukkan bahwa
masih banyak mahasiswa Program Sarjana (S1)
reguler di Fakultas Teknik Informatika yang
menempuh lama studi lebih dari 8 semester dari
yang dijadwalkan 8 semester.
Dengan perkembangan teknologi yang
sangat pesat pada era globalisasi ini, kebutuhan
akan informasi yang akurat sangat dibutuhkan

dalam kehidupan sehari-hari, sehingga informasi
akan menjadi suatu elemen penting dalam
perkembangan masyarakat saat ini dan waktu

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015
mendatang. Namun kebutuhan informasi yang
tinggi kadang tidak diimbangi dengan penyajian
informasi yang memadai, sering kali informasi
tersebut masih harus di gali ulang dari data yang
jumlahnya sangat besar. Kemampuan teknologi
informasi untuk mengumpulkan dan menyimpan
berbagai tipe data jauh meninggalkan kemampuan
untuk menganalisis, meringkas dan mengekstrak
pengetahuan dari data. Metode tradisional untuk
menganalisis data yang ada, tidak dapat menangani
data dalam jumlah besar.
Pemanfaatan data yang ada di dalam
sistem informasi untuk menunjang kegiatan
pengambilan keputusan, tidak cukup hanya

mengandalkan data operasional saja, diperlukan
suatu analisis data untuk menggali potensi-potensi
informasi yang ada. Para pengambil keputusan
berusaha untuk memanfaatkan gudang data yang
sudah dimiliki untuk menggali informasi yang
berguna membantu mengambil keputusan, hal ini
mendorong munculnya cabang ilmu baru untuk
mengatasi masalah penggalian informasi atau pola
yang penting atau menarik dari data dalam jumlah
besar, yang disebut dengan data mining.
Penggunaan teknik data mining diharapkan dapat
memberikan
pengetahuan-pengetahuan
yang
sebelumnya tersembunyi di dalam gudang data
sehingga menjadi informasi yang berharga. Oleh
karena itu, dengan memanfaatkan data induk
mahasiswa dan data kelulusan mahasiswa, dapat
diketahui informasi tingkat kelulusan mahasiswa
melalui teknik data mining.

Metode Naive Bayes adalah suatu metode
untuk memulai prediksi suatu data dari fakta-fakta
yang ada menuju suatu kesimpulan. Berdasarkan
uraian tersebut diatas, maka dilakukan penelitian
penerapan metode Naive Bayes pada proses
menampilkan tingkat kelulusan mahasiswa
sehingga diharapkan akan mendapat suatu output
yang berupa informasi bagi universitas maupun
bagi mahasiswai,dengan adanya informasi tersebut
kita dapat menyimpulkan apakah mahasiswa akan
lulus tepat waktu ataupun terlambat. Pada metode
Naive Bayes, pelacakan dimulai dari penelusuran
semua data dan faktor-faktor yang mempengaruhi
tingkat kelulusan mahasiwa untuk mendapat
informasi yang lebih akurat. Metode Naive Bayes
cocok untuk menampilkan informasi tingkat
kelulusan mahasiswa dengan pelacakan dari faktorfaktor yang mempengaruhi tingkat kelulusan.
1.2 Batasan Masalah
Untuk menghindari pembahasan diluar
permasalahan,berikut ini adalah batasan

permasalahan :
1.

Data yang diambil adalah data mahasiswa
angkatan 2009 dan 2010 dengan ruang
lingkup fakultas teknik informatika.

2.
3.

2

Pembahasan terfokus pada program sarjana
S1
reguler
di
fakultas
informatika
MUHAMMADIYAH Sidoarjo.
Tingkat kelulusan diukur dari lama studi, IPK,

jenis kelamin, status mahasiswa, mahasiswa
masuk, dan asal sekolah

2. Landasan Teori
2.2.1 Prodi Teknik Informatika
Seiring dengan perkembangan teknologi
informasi prodi teknik informatika merupakan
jurusan yang paling banyak diminati oleh para
lulusan SMA,SMK, dan MA. Ini tercermin pada
jumlah mahasiswa prodi teknik informatika yang
terus meningkat pada tiap tahunnya. Program
pendidikan akademik memiliki beban studi
sekurang-kurangnya 144 (seratus empat puluh
empat) sks (satuan kredit semester) dan sebanyakbanyaknya 160 (seratus enam puluh ) sks yang
dijadwalkan untuk 8 (delapan) semester dan dapat
ditempuh dalam waktu kurang dari 8 (delapan)
semester dan paling lama 14 (empat belas)
semester. Berdasarkan buku panduan akademik
tahun 2011, peserta wisuda Program Sarjana (S1)
reguler di Fakultas Teknik Jurusan Informatika

menempuh masa studi lebih dari 8 semester. Hal ini
menunjukkan bahwa masih banyak mahasiswa
Program Sarjana (S1) reguler di Fakultas Teknik
Informatika yang menempuh lama studi lebih dari
8 semester dari yang dijadwalkan 8 semester.
2.2.2 Data Mining
Secara sederhana data mining adalah
penambangan atau penemuan informasi baru
dengan mencari pola atau aturan tertentu dari
sejumlah data yang sangat besar (Davies, 2004).
Data mining juga disebut sebagai serangkaian
proses untuk menggali nilai tambah berupa
pengetahuan yang selama ini tidak diketahui secara
manual dari suatu kumpulan data (Pramudiono,
2007). Data mining, sering juga disebut sebagai
knowledge discovery in database (KDD). KDD
adalah kegiatan yang meliputi pengumpulan,
pemakaian data, historis untuk menemukan
keteraturan, pola atau hubungan dalam set data
berukuran besar (Santoso, 2007).


Data mining adalah kegiatan menemukan pola
yang menarik dari data dalam jumlah besar, data
dapat disimpan dalam database, data warehouse,
atau penyimpanan informasi lainnya. Data mining
berkaitan dengan bidang ilmu – ilmu lain, seperti
database system, data warehousing, statistik,
machine learning, information retrieval, dan
komputasi tingkat tinggi. Selain itu, data mining
didukung oleh ilmu lain seperti neural network,
pengenalan pola, spatial data analysis, image
database, signal processing (Han, 2006). Data

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015
mining didefinisikan sebagai proses menemukan
pola-pola dalam data. Proses ini otomatis atau
seringnya semiotomatis. Pola yang ditemukan
harus penuh arti dan pola tersebut memberikan
keuntungan, biasanya keuntungan secara ekonomi.

Data yang dibutuhkan dalam jumlah besar (Witten,
2005).
Karakteristik data mining sebagai berikut

1 Data mining berhubungan dengan penemuan
sesuatu yang tersembunyi dan pola data tertentu
yang tidak diketahui sebelumnya.
2 Data mining biasa menggunakan data yang
sangat besar. Biasanya data yang besar digunakan
untuk membuat hasil lebih dipercaya.
3 Data mining berguna untuk membuat keputusan
yang kritis, terutama dalam strategi (Davies, 2004).
Berdasarkan beberapa pengertian tersebut
dapat ditarik kesimpulan bahwa data mining adalah
suatu teknik menggali informasi berharga yang
terpendam atau tersembunyi pada suatu koleksi
data (database) yang sangat besar sehingga
ditemukan suatu pola yang menarik yang
sebelumnya tidak diketahui. Kata mining sendiri
berarti usaha untuk mendapatkan sedikit barang
berharga dari sejumlah besar material dasar. Karena
itu data mining sebenarnya memiliki akar yang
panjang dari bidang ilmu seperti kecerdasan buatan
(artificial intelligent), machine learning, statistik
dan database. Beberapa metode yang sering
disebutsebut dalam literatur data mining antara
lain clustering, classification, association rules
mining, neural network, genetic algorithm dan
lain-lain (Pramudiono, 2007).

3

digunakan karena termasuk bagian dari data
mining (Santoso, 2007).

Machine Learning adalah suatu area dalam
artificial intelligence atau kecerdasan buatan yang
berhubungan dengan pengembangan teknik-teknik
yang bisa diprogramkan dan belajar dari data
masa lalu. Pengenalan pola, data mining dan
machine learning sering dipakai untuk menyebut
sesuatu yang sama. Bidang ini bersinggungan
dengan ilmu probabilitas dan statistik kadang juga
optimasi. Machine learning menjadi alat analisis
dalam data mining. Bagaimana bidangbidang ini
berhubungan bisa dilihat dalam gambar 2.4
(Santoso, 2007).
2.2.2.2 Tahap-Tahap Data mining
Sebagai suatu rangkaian proses, data mining
dapat dibagi menjadi beberapa tahap yang
diilustrasikan di Gambar 2.5. Tahap-tahap tersebut
bersifat interaktif, pemakai terlibat langsung atau
dengan perantaraan knowledge base.

2.2.1.1 Pengenalan Pola, Data Mining, dan
Machine Learning
Pengenalan pola adalah suatu disiplin ilmu
yang mempelajari cara-cara mengklasifikasikan
obyek ke beberapa kelas atau kategori dan
mengenali kecenderungan data. Tergantung pada
aplikasinya, obyek-obyek ini bisa berupa pasien,
mahasiswa, pemohon kredit, image atau signal atau
pengukuran lain yang perlu diklasifikasikan atau
dicari fungsi regresinya (Santoso, 2007).

Data mining, sering juga disebut
knowledge discovery in database (KDD), adalah
kegiatan yang meliputi pengumpulan, pemakaian
data historis untuk menemukan keteraturan, pola
atau hubungan dalam set data berukuran besar.
Keluaran dari data mining ini bisa dipakai untuk
memperbaiki pengambilan keputusan di masa
depan. Sehingga istilah pattern recognition jarang

Gambar 2.2 Tahap -Tahap
Data Mining
Tahap-tahap data mining ada 6 yaitu :

1. Pembersihan data (data cleaning)
Pembersihan
data
merupakan
proses
menghilangkan noise dan data yang tidak
konsisten atau data tidak relevan. Pada
umumnya data yang diperoleh, baik dari
database suatu perusahaan maupun hasil
eksperimen, memiliki isian-isian yang tidak
sempurna seperti data yang hilang, data yang
tidak valid atau juga hanya sekedar salah ketik.
Selain itu, ada juga atribut-atribut data yang
tidak relevan dengan hipotesa data mining yang
dimiliki. Data-data yang tidak relevan itu juga

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015
lebih baik dibuang. Pembersihan data juga akan
mempengaruhi performasi dari teknik data
mining karena data yang ditangani akan
berkurang jumlah dan kompleksitasnya.

2. Integrasi data (data integration)
Integrasi data merupakan penggabungan data
dari berbagai database ke dalam satu database
baru. Tidak jarang data yang diperlukan untuk
data mining tidak hanya berasal dari satu
database tetapi juga berasal dari beberapa
database atau file teks. Integrasi data dilakukan
pada atribut-aribut yang mengidentifikasikan
entitas-entitas yang unik seperti atribut nama,
jenis produk, nomor pelanggan dan lainnya.
Integrasi data perlu dilakukan secara cermat
karena kesalahan pada integrasi data bisa
menghasilkan hasil yang menyimpang dan
bahkan menyesatkan pengambilan aksi nantinya.
Sebagai contoh bila integrasi data berdasarkan
jenis produk ternyata menggabungkan produk
dari kategori yang berbeda maka akan
didapatkan korelasi antar produk yang
sebenarnya tidak ada.

3. Seleksi Data (Data Selection)
Data yang ada pada database sering kali tidak
semuanya dipakai, oleh karena itu hanya data
yang sesuai untuk dianalisis yang akan diambil
dari database. Sebagai contoh, sebuah kasus
yang meneliti faktor kecenderungan orang
membeli dalam kasus market basket analysis,
tidak perlu mengambil nama pelanggan, cukup
dengan id pelanggan saja.

4. Transformasi data (Data Transformation)
Data diubah atau digabung ke dalam format
yang sesuai untuk diproses dalam data mining.
Beberapa metode data mining membutuhkan
format data yang khusus sebelum bisa
diaplikasikan. Sebagai contoh beberapa metode
standar seperti analisis asosiasi dan clustering
hanya bisa menerima input data kategorikal.
Karenanya data berupa angka numerik yang
berlanjut perlu dibagibagi menjadi beberapa
interval. Proses ini sering disebut transformasi
data.

5. Proses mining,
Merupakan suatu proses utama saat metode
diterapkan untuk menemukan pengetahuan
berharga dan tersembunyi dari data.

6. Evaluasi pola (pattern evaluation),

4

Untuk mengidentifikasi pola-pola
menarik
kedalam knowledge based yang ditemukan.
Dalam tahap ini hasil dari teknik data mining
berupa pola-pola yang khas maupun model
prediksi dievaluasi untuk menilai apakah
hipotesa yang ada memang tercapai. Bila
ternyata hasil yang diperoleh tidak sesuai
hipotesa ada beberapa alternatif yang dapat
diambil seperti menjadikannya umpan balik
untuk memperbaiki proses data mining,
mencoba metode data mining lain yang lebih
sesuai, atau menerima hasil ini sebagai suatu
hasil yang di luar dugaan yang mungkin
bermanfaat.

7. Presentasi

presentation),

pengetahuan

(knowledge

Merupakan visualisasi
dan
penyajian
pengetahuan mengenai metode yang digunakan
untuk memperoleh pengetahuan yang diperoleh
pengguna. Tahap terakhir dari proses data
mining adalah bagaimana memformulasikan
keputusan atau aksi dari hasil analisis yang
didapat. Ada kalanya hal ini harus melibatkan
orang-orang yang tidak memahami data mining.
Karenanya presentasi hasil data mining dalam
bentuk pengetahuan yang bisa dipahami semua
orang adalah satu tahapan yang diperlukan
dalam proses data mining. Dalam presentasi ini,
visualisasi
juga
bisa
membantu
mengkomunikasikan hasil data mining (Han,
2006).
2.2.3 Pengertian Metode Naive Bayes

Naive Bayes Classifier merupakan salah
satu metode pengklasifikasian sederhana yang
berdasarkan pada penerapan Teorema Bayes
dengan asumsi antar variabel penjelas saling bebas
(independen). Algoritma ini memanfaatkan metode
probabilitas dan statistik yang dikemukakan oleh
ilmuwan Inggris Thomas Bayes, yaitu memprediksi
probabilitas
di
masa
depan
berdasarkan
pengalaman di masa sebelumnya. Dua kelompok
peneliti, satu oleh Pantel dan Lin, dan yang lain
oleh Microsoft Research memperkenalkan metode
statistik Bayesian ini pada teknologi anti spam
filter. Tetapi yang membuat algoritma Bayesian
filtering ini popular adalah pendekatan yang
dilakukan oleh Paul Graham.
Algoritma Naive Bayes merupakan salah satu
algoritma yang terdapat pada teknik klasifikasi.
Naive Bayes merupakan pengklasifikasian dengan
metode probabilitas dan statistik yang dikemukan
oleh ilmuwan Inggris Thomas Bayes, yaitu
memprediksi peluang di masa depan berdasarkan
pengalaman dimasa sebelumnya sehingga dikenal

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015
sebagai Teorema Bayes. Teorema tersebut
dikombinasikan dengan Naive dimana diasumsikan
kondisi antar atribut saling bebas. Klasifikasi Naive
Bayes diasumsikan bahwa ada atau tidak ciri
tertentu dari sebuah kelas tidak ada hubungannya
dengan ciri dari kelas lainnya.
Persamaan dari teorema Bayes adalah :
Bayes' Teorema berhubungan dengan kondisi dan
dan
marjinal
kendala
peristiwa-peristiwaA
B,dimana B telah non-vanishing kemungkinan:
PHX=

PXH .P (H)
P (X)

P C F1...Fn=

PCP (F1...Fn | C)
P (F1...Fn)

Di mana Variabel C merepresentasikan kelas,
sementara variabel F1 ... Fn merepresentasikan
karakteristik petunjuk yang dibutuhkan untuk
melakukan klasifikasi. Maka rumus tersebut
menjelaskan bahwa peluang masuknya sampel
karakteristik tertentu dalam kelas C (Posterior)
adalah peluang munculnya kelas C (sebelum
masuknya sampel tersebut, seringkali disebut prior),
dikali dengan peluang kemunculan karakteristik
karakteristik sampel pada kelas C (disebut juga
likelihood), dibagi dengan peluang kemunculan
karakteristik karakteristik sampel secara global
( disebut juga evidence). Karena itu, rumus diatas
dapat pula ditulis secara sederhana sebagai berikut :
Posterior=

priorxlikehood
evidence

Nilai Evidence selalu tetap untuk setiap kelas pada
satu sampel.Untuk klasifikasi dengan data kontinyu
digunakan rumus Densitas Gauss :

1
exp
p(Xi = xiY = yi ) =
2πσ ij
Di mana :
P : Peluang

Xi : Atribut ke i
xi : Nilai atribut ke i
Y : Kelas yang dicari
yi : Sub kelas Y yang dicari
μ : mean, menyatakan rata – rata dari seluruh
atribut
σ :Deviasi standar, menyatakan varian dari
Hitung Jumlah dan probabilitas, namun apabila
data numerik maka :
a. Cari nilai mean dan standar deviasi dari masing
masing parameter yang merupakan data numerik.
Adapun persamaan yang digunakan untuk
menghitung nilai rata – rata hitung ( mean ) dapat
dilihat sebagai berikut :

µ=

Di mana :
X :Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) :Probabilitas hipotesis H berdasar kondisi X
(posteriori probabilitas)
P(H) : Probabilitas hipotesis H (prior probabilitas)
P(X|H) :Probabilitas X berdasarkan kondisi pada
hipotesis H
P(X) : Probabilitas X
Untuk menjelaskan metode Naive Bayes, perlu
diketahui bahwa proses klasifikasi memerlukan
sejumlah petunjuk untuk menentukan kelas apa
yang cocok bagi sampel yang dianalisis tersebut.
Karena itu, metode Naive Bayes di atas disesuaikan
sebagai berikut :

(x i − µij )2


2ij

5

n
i =1 i

x
n

di mana :
μ : rata – rata hitung ( mean )
xi : nilai sample ke -i
n : jumlah sampel
dan persamaan untuk menghitung nilai simpangan
baku ( standar deviasi ) dapat dilihat sebagai
berikut:

σ=

n
i =1

(x i − µ ) 2
n −1

di mana :
σ : standar deviasi
xi : nilai x ke -i
μ : rata-rata hitung
n : jumlah sampel
Mengingat data mempunyai banyak atribut, maka
akan sangat sulit dalam mengkomputasi untuk
menghitung P(X|Ci). Agar dapat mengurangi
perhitungan dalam mengevaluasi P(X|Ci), asumsi
naïve
independensi kelas bersyarat dibuat.
Dianggap bahwa nilai-nilai dari atribut adalah
kondisional independen satu sama lain, diberikan
kelas label dari tuple (yaitu bahwa tidak ada
hubungan ketergantungan diantara atribut ) dengan
demikian :

Maka dapat dengan mudah memperkirakan
probabilitas P (x1 | Ci), P (x2 | Ci),. . . , P (xn | Ci)
dari pelatihan tuple.
3.1 Perancangan Sistem
Perancangan Mesin Inferensi
1.Perancangan
1.
Dalam perancangan aplikasi untuk
menamiplkan
informasi
tingkat
kelulusan
mahasiswa yaitu dimulai dari sekumpulan data dan
faktor-faktor yang mempengaruhi , Untuk proses
penarikan kesimpulan dapat dilihat pada
Gambar3.1 yang merupakan gambaran alur dari

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015
data mining dan nive bayes flowchart atau diagram
alir

Mulai

6

4.1Pengujian Aplikasi Data Mining Untuk
Menampilkan Informasi Tingkat Kelulusan
Mahasiswa
Tampilan Aplikasi
Halaman yang pertama kali muncul dari
aplikasi data mining untuk menentukan informasi

Basis Data Realisional

tingkat kelulusan mahasiswa adalah. Pada tampilan
awal aplikasi terdapat menu “Home, Data mining
model probabilitas , Data distribusi normal dan

Ekstrasi Data

Tentang”. Menu “Home” merupakan halamam
utama

aplikasi data minig untuk menentukan

informasi tigkat kelulusan mahasiswa. Menu “Data

Transformasi Data

mining model probabilias” digunakan oleh user
untuk melakukan input data mahasiswa. Pada menu

Pembersihan Data
Menjalankan Algoritma
Naive Bayes

"data

distribusi

normal"

menampilkan

data

mahasiswa master. Menu “Tentang” digunakan
untuk menjelaskan dan memberi pengetahuan
bagaimana alur perhitungan aloritma naive bayes.

Selesai

Gambar 3.1 Flowchat data mining

Gambar 4.7Tampilan halaman utama
1.

Menu Data Mining model Probabilitas
Menu

data mining

model probabilitas

digunakan oleh user untuk memasukkan data
mahasiswa. Pada menu ini user harus memasukkan
identitas berupa nama, jenis kelamin, status
mahasiswa, kelas, asal sekolah dan IPK, dan Pada
bagian bawah terdapat tombol “proses” kemudian
hasil

dari

inputan

tersebut

di

proses

dan

menunjukkan hasilnya apakah mahasiswa tersebut
Gambar 3.2 flowchart naive bayes

4. HASIL DAN PEMBAHASAN

dapat lulus tepat waktu atau terlambat.

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015

7

4.10 Gambar tampilan
tabel probabilitas
3.

Menu Tentang
Menu Tentang adalah petunjuk bagi user

bagaimana cara perhitungan dari algoritma naive
bayes.

Gambar 4.8 Tampilan inputan mahasiswa

2.

Menu Data Mining distribusi Normal
Menu

ini

digunakan

untuk

Gambar 4.11 Tampilan menu tentang

menunjukkan data master. Data master adalah
data

mahasiswa

yang

digunakan

utuk

memproses data mahasiswa yang akan di

5.

inputkan.

Menu Login
Menu login

merupakan menu yang

digunakan oleh admin untuk masuk kesistem yang
bertujuan untuk mengelola data mahasiswa.

4.9 Gambar Tampilan menu data distribusi normal
Tabel probabilitas adalah tabel untuk mengetahui
perhitungan probabilitas setiap

Gambar 4.12 Tampilan menu login

atribut.

6.

Menu Halaman Admin
Menu Halaman admin merupakan menu

yang digunakan oleh admin untuk menginputkan
data master.

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015

8

Gambar 4.13 Tampilan menu gejala halaman pakar
4.2.2

Pengujian Aplikasi

6. Menu Data Mining Model Probabilitas

Gambar 4.15 Hasil Proses
Gambar 4.10 Hasil Proses

Menu data mining model probabilitas digunakan
oleh user untuk memasukkan data mahasiswa. Pada
menu ini user harus memasukkan identitas berupa
nama, jenis kelamin, status mahasiswa, kelas, asal
sekolah dan IPK, disini IPK yang digunakan adalah
hasil IPK maksimal IPK semester 8 lalu Pada
bagian bawah terdapat tombol “proses” kemudian
hasil dari inputan tersebut di proses berdasarkan
data yang dimasukkan dan menampilkan hasilnya
apakah mahasiswa tersebut dapat lulus tepat waktu
atau terlambat.
Contoh dari proses data mining model probabilitas
setelah data di inputkan.

Gambar 4.14 Input mahasiswa
Kemudian tekan tombol proses untuk mengetahui
apakah mahasiswa tersebut lulus tepat waktu atau
lulus terlambat.

5.1 Kesimpulan
Setelah
penulis
menguraikan
secara
menyeluruh tentang perancangan dan implementasi
dari Aplikasi Data Mining Untuk Menampilkan
Informasi Tingkat Kelulusan Mahasiswa ini, maka
penulis mengambil beberapa kesimpulan yaitu :
1. Penggunan teknik data mining diharapkan
dapat memberikan pengetahuan yang
sebelumnya tersembunyi di dalam
gudang data sehingga menjadi informasi
yang berharga, oleh karena itu dengn
memanfaatkan data master mahasiswa
dan data kelulusan mahasiswa, sehingga
dapat diketahui informasi tigkat kelulusan
mahasiswa melalui teknik data mining.
Kebanyakan mahsiswa sekarng tidak
mengetahui apakah mereka lulus tepat
waktu atau lulus terlambat. Oleh karena
itu, dengan mengandalkan kemajuan
teknologi dan informasi, Sistem Aplikasi
Data
Mining
Untuk
Menentukan
Informasi Tigkat Kelulusan Mahasiswa
diharapkan mampu memprediksi tingkat
kelulusan mahsiswa secara cepat, tepat,
dan akurat. Penulis berharap agar
kedepannya maahsiswa mendapatkan
informasi tentang tingkat kelulusannya.
2. Aplikasi Data Mining Untuk Menentukan
Informasi Tigkat Kelulusan Mahasiswa
bisa melacak melalui penelusuran data
dan faktor-faktor yang mempengruhi
tingkat kelulusan mahasiswa untuk
mendapat informasi yang lebih akurat.
3. Dengan adanya Aplikasi Data Mining
Untuk Menentukan Informasi Tigkat
Kelulusan Mahasiswa ini maka dapat
memberikan informasi bagi mahasiswa
dan universitas berapa persen mahasiswa
yang akan lulus tepat waktu dn lulus
terlambat.
5.2 Saran
Berdasarkan analisa dan kesimpulan di
atas, Aplikasi Data Mining Untuk Menentukan
Informasi Tigkat Kelulusan Mahasiswa ini masih

Jurnal Teknik Informatika Universitas Muhammadiyah Sidoarjo
Tahun Ajaran 2015
memiliki beberapa kekurangan. Saran yang dapat
diberikan
untuk
pengembangan
penelitian
selanjutnya antara lain :
1. Untuk pengembangan lebih lanjut, sistem
ini
dapat
dikembangkan
dengan
menggunakan metode yang berbeda atau
mengkombinasikan algoritma naive bayes
dengan metode lain.
2. Sistem dapat dikembangkan untuk kasus
pada domain lain, yang memiliki data dan
faktor-faktor lain.
3. Dapat dikembangkan ke platform yang
lain seperti IOS dan android.
DAFTAR PUSTAKA
Huda Nuqson Masykur (2010), "Aplikasi Data
Minning untuk Menampilkan Tingkat
Kelulusan Mahasiswa". Fakultas MIPA.
Fachrurozi Much. (2012), "Penerapan Data
Minning Untuk Menganalisa Tingkat Kelulusan
Mahasiswa Terhadap Matakuliah Dengan
Metode Kernel Means clustering". Universitas
Muhammadiyah Sidoarjo.
Pramudiono, I. 2007. Pengantar Data Mining :
Menambang Permata Pengetahuan di Gunung
Data. http://www.ilmukomputer.org/wpcontent/uploads/2006/08/iko-datamining.zip
Diakses pada tanggal 15 Maret 2009 jam 08.54
Santosa, Budi, 2007, “Data Mining Teknik
Pemanfaatan Data untuk Keperluan Bisnis”,
Graha Ilmu, Yogyakarta.
Witten, I. H and Frank, E. 2005. Data Mining :
Practical Machine Learning Tools and
Techniques Second Edition. Morgan Kauffman :
San Francisco.
Han, J. and Kamber, M, 2006, “Data Mining
Concepts and Techniques Second Edition”.
Morgan Kauffman, San Francisco.
Darmanto
Eko,
Fithri
Diana
Laily
(2014),"Sistem Pendukung Keputusan untuk
Memprediksi
Kelulusan
Mahasiswa
Naive
Bayes".
Menggunakan
Metode
Universitas Muria Kudus.
Bustami (2013), "Penerapan Algoritma Naive
Bayes Untuk Mengklasifikasi Data Nasabah
Asuransi". Universitas Malikussaleh. (jurnal
penelitian)
Nugroho, Yuda Septian (2014), "Data Mining
Menggunakan Algoritma Naive Bayes untuk
Klasifikasi Kelulusan Mahasiswa Universitas
Dian
Nuswantoro".
Universitas
Dian
Nuswantoro.(skripsi)

9