Perbandingan Metode Naive Bayes dan K- Nearest Neighbor untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi)
INSIGHT
Volume 1 No. 1 | April 2018 : 182-187
Perbandingan Metode Naive Bayes dan K-
Nearest Neighbor untuk Prediksi Perceraian
(Studi Kasus : Pengadilan Agama Cimahi)
1 2 3 Irma Apriliani Dahlia , Mohamad Irfan , Wisnu UriawanJurusan Teknik Informatika, Fakultas Sains dan Teknologi UIN SGD Bandung
Jl.A.H Nasution 105 Bandung 40614
Abstract- Divorce in Cimahi Religious Courts have continued to rise each year, each month receives an average of 800 cases
of divorce, of the 800 cases, 75% of divorce cases households, while the remaining other matters, such as marriage and
inheritance confirmation. Based on these problems need for action in the form of a prediction to determine how many
divorces every month. One suitable data processing techniques in helping the process of prediction occurrence of a divorce by
using data mining techniques such as Naive Bayes algorithm and K-Nearest Neighbor. This algorithm has a high accuracy
rate in predicting. This level of accuracy is best in between the two algorithms can be determined by doing a comparison.
Comparison of algorithms aims to get the best algorithms considered in the process of predicting an issue, after making a
comparison it can be concluded that Naive Bayes algorithm resulted in a 72.5% accuracy and K-Nearest neigbor algorithm
produces an accuracy of 57.5%.Keywords- Comparison, Predicts Divorce, Naive Bayes, K-Nearest Neighbor.
Abstrak- Perceraian di Pengadilan Agama Cimahi setiap tahun terus mengalami kenaikan, setiap bulannya rata-rata
menerima 800 perkara cerai, dari 800 perkara tersebut, 75% perkara perceraian rumah tangga, sedangkan sisanya perkara
lain, seperti nikah isbat dan waris. Berdasarkan masalah tersebut perlu adanya tindakan berupa prediksi untuk mengetahui
seberapa banyak perceraian disetiap bulannya. Salah satu teknik pengolahan data yang cocok dalam membantu proses
prediksi terjadinya suatu perceraian yaitu dengan menggunakan teknik data mining seperti algoritma Naive Bayes dan K-
Nearest Neighbor. Algoritma ini memiliki tingkat akurasi yang tinggi dalam memprediksi. Tingkat akurasi yang terbaik di
antara kedua algoritma ini dapat diketahui dengan cara melakukan perbandingan. Perbandingan algoritma bertujuan
untuk mendapatkan algoritma yang dianggap paling baik pada proses memprediksi suatu permasalahan, setelah melakukan
perbandingan maka dapat disimpulkan bahwa algoritma Naive Bayes menghasilkan akurasi 72,5% dan algoritma K-Nearest
Neigbor menghasilkan akurasi 57,5%.Kata Kunci- Perbandingan, Prediksi Perceraian, Naive Bayes, K-Nearest Neighbor.
I. PENDAHULUAN dapat mengguncangkan sebuah pernikahan. Menurut Pernikahan dalam pandangan Islam merupakan salah satu media online [1], perceraian di wilayah sesuatu yang sakral, bermakna ibadah kepada Allah, Kabupaten Bandung, Kota Cimahi, setiap tahun terus mengikuti sunnah Rasulullah dan dilaksanakan atas dasar mengalami kenaikan. Berdasarkan data dari Kantor keikhlasan, tanggung jawab, dan mengikuti ketentuan- Pengadilan Agama Cimahi yang membawahi daerah ketentuan hukum yang harus diindahkan. Sedangkan tersebut, sejak 2014 lalu, perkara perceraian yang tujuan pernikahan sebagaimana difirmankan Allah SWT ditangani rata-rata naik 25 persen. Panitera Pengadilan dalam surat Ar- Agama Cimahi, Saefuloh mengatakan, setiap bulan rata-
Rum ayat 21 yang artinya “Dan di antara
tanda-tanda kekuasaan-Nya ialah Dia menciptakan rata pihaknya menerima 800 perkara. Dari 800 perkara
untukmu isteri-isteri dari jenismu sendiri, supaya kamu tersebut, 75 persen di antaranya adalah perkara perceraian
cenderung dan merasa tenteram kepadanya dan rumah tangga. Sedangkan sisanya perkara lain, seperti
dijadikan-Nya di antaramu rasa kasih dan sayang. nikah isbat, waris dan lainnya.Sesungguhnya pada yang demikian itu benar-benar Berdasarkan tingkat perceraian yang setiap tahun
terdapat tanda-tanda bagi kaum yang berfikir terus mengalami kenaikan, perlu adanya tindakan berupa
”. Namun tidak dapat dipungkiri perbedaan-perbedaan putusan perkara untuk mengetahui seberapa banyak dalam pernikahan sering menimbulkan pertengkaran antar perceraian disetiap bulannya. Salah satu teknik suami istri. Munculnya berbagai permasalahan dalam pengolahan data yang cocok dalam membantu proses pernikahan, seperti lingkungan, perselingkuhan, masalah prediksi terjadinya suatu perceraian yaitu dengan anak, masalah ekonomi, usia mereka saat menikah, itu menggunakan teknik data mining [2]. Teknik data mining INSIGHT | Volume 1 No. 1 | April 2018 : 182-187 183 yang sering digunakan adalah Naive Bayes dan K-Nearest
Neighbor. Algoritma Naive Bayes merupakan
pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu kelas [3]. Sedangkan K-Nearest Neighbor mencari jarak terdekat antara data yang akan dievaluasi dengan data kasus sebelumnya [4]. Dari kedua metode tersebut perlu adanya perbandingan untuk mengetahui metode mana yang paling baik diantaranya sehingga pada proses prediksi akan lebih efektif, dan akurat.
A. CONTOH PERHITUNGAN NAIVE BAYES
Cara kerja metode Naive Bayes dan K-nearest neighbor hampir sama, yang membedakannya pada saat pengelompokan data dimana metode Naive Bayes hanya mengelompokan data atribut yang dipakainya saja, sedangkan metode K-Nearest Neighbor atributnya diberikan nilai bobot dan data atribut yang sudah di kelompokan diberikan nilai kedekatan untuk memudahkan dalam proses perhitungan.
III. HASIL DAN PEMBAHASAN Objek penelitian ini yaitu data perceraian yang di ambil dari Pengadilan Agama Cimahi, dimana data training maupun data testing terdiri dari beberapa atribut seperti usia penggugat, usia tergugat, lama perkawinan, usia anak dan indikator. Hal ini akan menjadi satu kesatuan dalam pemrosesannya.
100%
evaluasi model klasifikasi untuk memperkirakan objek yang benar atau salah. Sebuah matrix dari prediksi yang akan dibandingkan dengan kelas yang asli dari inputan atau dengan kata lain berisi informasi nilai aktual dan prediksi [7]. Dengan perhitungan : Accuracy = jumlah nilai yang benar jumlah data keseluruhan
Confusion matrix adalah tool yang digunakan untuk
D. PENGUJIAN AKURASI
(1) Keterangan: T : Kasus baru S : kasus yang ada dalam penyimpanan N : jumlah atribut I : atriut individu antara 1 – n f : fungsi similarity atribut i antarakasus T dan kasus S w : bobot yang diberikan pada atribut ke-i
∑ ( , ) =1
Similarity=
Metode K-Nearest Neighbor adalah metode pencarian kedekatan antara kasus baru dengan kasus lama berdasarkan pada pencocokan bobot dari beberapa atribut yang sudah ditentukan sebelumnya. Misalkan diinginkan untuk mencari solusi terhadap seorang pasien baru dengan menggunakan solusi dari pasien terdahulu. Untuk mencari kasus pasien mana yang akan digunakan, maka dihitung kedekatan kasus pasien baru dengan semua kasus pasien lama. Kasus pasien lama dengan kedekatan terbesar yang akan diambil sebagai solusi pada kasus pasien baru [6].
P(X) : Probabilitas dari X C.
hipotesis H
P(X|H) : Probabilitas X berdasarkan kondisi pada
X : Data dengan class yang belum diketahui H : Hipotesis data X merupakan suatu class spesifik P(H|X) : Probabilitas hipotesis H berdasarkan kondisi X (posteriori probabilitas) P(H) : Probabilitas hipotesis H (probabilitas)
Sehubungan dengan hal tersebut, maka dalam penelitian ini peneliti mengambil judul
K-NEAREST NEIGBOR
Metode Naive Bayes adalah pengklasifikasian statistik yang dapat digunakan untuk memprediski probabilitas keanggotaan suatu class. Naive Bayes didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan decesion tree dan neural network. Naive Bayes terbukti memiliki akurasai dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar [3].
(KDD) [4] B.
atas database. Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge Discovery in Databases
machine learning atau analisa statistik yang berjalan di
( | ) =
1.1 Prototype
Gambar
II. METODE PENELITIAN Metode pengembangan perangkat lunak yang digunakan penulis sebagai kerangka dalam penilitian dengan studi kasus ini adalah model prototype. Prototype merupakan suatu metode dalam pengembangan sistem yang cocok digunakan untuk tingkat penelitian yang masih baru dan ruang lingkup kecil [5].
“Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi)”
NAIVE BAYES
P(X|H). P(H)
P(X) Di mana :
A. DATA MINING Secara sederhana, data mining mengacu pada penggalian atau “mining” pengetahuan dari sejumlah data yang besar. Data mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan menempatkan data mining di bidang ilmu mana karena data mining melibatkan integrasi teknik dari berbagai disiplin ilmu. Ada pihak yang berpendapat bahwa data mining tidak lebih dari
INSIGHT
Pengelompokan Lama Perkawinan
2. Menghitung jumlah kasus yang sama dengan class yang sama Jumlah data P(X|Y=CERAI) dengan keterangan “CERAI” dibagi jumlah data CERAI dan Jumlah data P(X|Y=TIDAK) dengan keterangan “TIDAK” dibagi jumlah data TIDAK.
1. Menghitung jumlah class atau label Tentukan P(Y=CERAI) sebagai probabilitas orang yang cerai dan P(Y=TIDAK) sebagai probabilitas orang yang tidak cerai.
D. PROSES PERHITUNGAN KEMIRIPANN KASUS
Tabel 3.7 Contoh Kasus BaruC. KASUS BARU
Pengelompokan Indikator
Tabel 3.5 Pengelompokan Jumlah Anak Tabel 3.6Tabel 3.4
ISSN 2620-5467 (Online)
Pengelompokan Usia Tergugat
Tabel 3.3
Tabel 3.2 Pengelompokan Usia PengugugatB. PENGELOMPOKAN ATRIBUT Pengelompokan ini bertujaun untuk mempermudah perhitungan dalam proses pengambilan keputusan bagi calon penggugat sebelum melakukan sidang perkara yang disajikan kedalam bentuk beberapa tabel berikut ini :
Tabel 3.1 Data Penelitian Naive BayesPada penelitian ini menggunakan data kasus perkara cerai yang diambil dari Pengadilan Agama Cimahi tahun 2016 [8]. Salah satu contoh kasus perkara yang diambil dari Pengadilan Agama Cimahi seperti pada Tabel dibawah ini.
Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi) 184
3. Kalikan semua hasil variabel CERAI dan TIDAK INSIGHT | Volume 1 No. 1 | April 2018 : 182-187 185
4. Bandingkan hasil class CERAI dan TIDAK Karena hasil (P|TIDAK) lebih besar dari (P|CERAI) maka keputusanya adalah “TIDAK”
Kedekatan Usia Pengugat
d. Kedekatan Nilai Variabel Jumlah Anak Berikut ini adalah model kedekatan nilai variabel
Kedekatan Lama Perkawinan
Tabel 3.13
Lama Perkawinan yang didefinisikan :
c. Kedekatan Nilai Variabel Lama Perkawinan Berikut ini adalah model kedekatan nilai variabel
Tabel 3.12 Kedekatan Usia TergugatTergugat didefinisikan :
b. Kedekatan Nilai Variabel Usia Tergugat Berikut ini model kedekatan nilai variabel Usia
Tabel 3.11
E. CONTOH PERHITUNGAN KNN
a. Kedekatan Nilai Variabel Usia Penggugat Berikut ini adalah kedekatan nilai variabel Usia Penggugat.
G. KEDEKATAN VARIABEL Kedekatan antara nilai-nilai dalam variabel juga perlu didefinisikan. Berikut adalah kedekatan antara nilai- nilai dalam variabel yang didefinisikan, yaitu :
Tabel 3.10 PembobotanBobot satu atribut dengan atribut lain pada atribut bukan tujuan dapat didefinisikan dengan nilai berbeda yang disajikan kedalam bentuk beberapa tabel berikut ini :
F. PEMBOBOTAN VARIABEL Pembobotan ini bertujuan untuk mempermudah perhitungan dalam proses pengambilan keputusan nilai kasus lama dan kasus baru. Bobot jarak ini diberikan nilai antara 0 sampai dengan 1. Nilai 0 artinya jika atribut tidak berpengaruh dan sebaliknya nilai 1 jika atribut sangat berpengaruh.
Tabel 3.9 Data Penelitian KNNContoh Kasus Baru Kemudian dari data kasus yang sudah ada dicari nilai kedekatan dari usia tergugat, usia penggugat, lama perkawinan, jumlah anak, indikator dapat dilihat pada tabel berikut :
Tabel 3.8
Jumlah Anak yang didefinisikan :
INSIGHT
=
memprediksi perceraian di Pengadilan Agama Cimahi dengan 20 data testing yang berbeda dihasilkan presentase keakurasian yang berberbeda pula. J. HASIL
Naive Bayes dan K-Nearest Neighbor. Untuk
Uji Perhitungan Akurasi 2 Dari dua kali percobaan membandingkan algoritma
Tabel 3.13 Uji Perhitungan Akurasi 1 Tabel 3.14sehingga bisa diketahui jumlah benar dan salah saat melakukan prediksi pada data testing dapat dilihat pada tabel berikut :
Bayes dan K-Nearest Neighbor, kemudian akan di analisa
I. PERBANDINGAN AKURASI Pada pengujian akurasi menggunakan dua kali percobaan dengan 20 data testing yang berbeda, 130 data training yang sama. Data tersebut akan diuji untuk mengetahui akurasi yang dihasilkan oleh algoritma Naive
Hasil perhitungan K1-K7
Tabel 3.12
Perhitungan seperti diatas berlaku sampai kasus ke 7, sehingga didapatkan hasil, dapat dilihat pada tabel berikut :
2.6 = 0.593
1.544
= (0.666 0.6) + (0.399 0.6) + (0.833 0.4) + (0.5 0.2) + (0.571 08) 0.6 + 0.6 + 0.4 + 0.2 + 0.8
ISSN 2620-5467 (Online)
Bobot status lama perkawinan = 0.4 Kedekatan status jumlah anak kasus baru terhadap kasus lama = 0.5 Bobot status jumlah anak = 0.2 Kedekatan status indikator kasus baru terhadap kasus lama = 0.571 Bobot status indikator = 0.8
Kasus K1 Kedekatan status usia penggugat kasus baru terhadap kasus lama = 0.666 Bobot status usia penggugat = 0.6 Kedekatan status usia tergugat kasus baru terhadap kasus lama = 0.399 Bobot status usia tergugat= 0.6 Kedekatan status lama perkawian kasus baru terhadap kasus lama = 0.833
similarity nya :
Berikut adalah proses perhitungan untuk mencari
H. PROSES PERHITUNGAN KEMIRIPAN KASUS Untuk mencari kemiripannya antara kasus lama dan kasus baru. Sebelum melakukan perhitungan, untuk mempermudah dan mengefisienkan penulisan rumus maka dilakukan pendefinisian variabel sebagai berikut : NK = Nilai Kedekatan Kasus NB = Nilai Bobot NK = Kedekatan status usia penggugat kasus baru terhadap kasus lama NB = Bobot status usia penggugat NK = Kedekatan status usia tergugat kasus baru terhadap kasus lama NK = Bobot status usia tergugat NB = Kedekatan status lama perkawinan kasus baru terhadap kasus lama NK = Bobot status lama perkawinan NB = Kedekatan status jumlah anak kasus baru terhadap kasus lama NK = Bobot status jumlah anak NB = Kedekatan status indikator kasus baru terhadap kasus lama NK = Bobot status indikator S = Jarak
Kedekatan Indikator
Tabel 3.15
Indikator yang didefinisikan :
e. Kedekatan Nilai Variabel Indikator Berikut ini adalah model kedekatan nilai variabel
Kedekatan Jumlah Anak
Tabel 3.14
Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi) 186
Dari dua akurasi diatas masing-masing algoritma memiliki rata-rata yaitu 72,5% untuk algoritma Naive Bayes dan 57,5% untuk algoritma K-Nearest Neighbor. INSIGHT | Volume 1 No. 1 | April 2018 : 182-187 187
IV. KESIMPULAN DAN SARAN
yang lebih baik dalam proses memprediksi perceraian pada Pengadilan Agama Cimahi.
[7] Eska sarti Kundari, “PERBANDINGAN KINERJA METODE NAIVE BAYES DAN C4.5 DALAM PENGKLASIFIKASIAN PENYAKIT DIABETES MELITUS DI RUMAH SAKIT
[6] P. Mata, “PERBANDINGAN NAIVE BAYES CLASSIFIER DENGAN NEAREST NEIGHBOR UNTUK IDENTIFIKASI,” vol. 1, no. 2, pp. 82 –86, 2016.
Pendekatan Praktisi (Buku I). Yogyakarta: Andi, 2002.
Yogyakarta: Andi, 2009. [4] Y. Agusta, “K-Means - Penerapan, Permasalahan dan Metode Terkait,” J. Sist. dan Inform., vol. 3, no. Pebruari, pp. 47 –60, 2007. [5] P. Roger S, Rekayasa Perangkat Lunak :
[2] P. Labu and J. Selatan, “Komparasi Metode Data Mining Untuk Prediksi,” pp. 1–6, 2016. [3] luthfi taufiq E. Kusrini, Algoritma Data Mining.
V. REFERENSI [1] “Berita Perceraian Wilayah KBB.” [Online]. Available: http://www.materikelas.com/2015/09/nikah- pengertian-hukum-rukun-dan syarat.html# / diakses pada tanggal 15/04/2017 11:31.
Neural Network agar dapat mengetahuan algoritma
A. KESIMPULAN Berdasarkan penelitian yang telah dilakukan diatas, maka dapat disimpulkan sebagai berikut :
1. Diharapkan dapat membandingkkan dengan algoritma yang lain seperti Decesion Tree atau
B. SARAN Untuk meningkatkan kinerja dan menyempurnakan penelitian yang telah dibuat, maka ada saran untuk pengembangan sistem sejenis sebagai berikut :
130 data training, maka algoritma Naive Bayes tepat untuk melakukan prediksi perceraian di Pengadilan Agama Cimahi.
Neighbor dengan menggunkan 20 data testing dan
2. Algoritma Naive Bayes dan K-Nearest Neighbor untuk prediksi perceraian di Pengadilan Agama Cimahi menghasilkan akurasi 72,5% untuk algoritma niave bayes dan 57,5% untuk algoritma K-Nearest
1. Kinerja algoritma Naive Bayes pada saat melakukan prediksi tidak membutuhkan waktu lama karena memiliki kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar dan perhitungan manualnya tidak rumit, sedangkan pada algoritma K-Nearest Neighbor membutuhkan waktu cukup lama karena diperlukan perhitungan jarak dari tiap kasus baru pada keseluruhan kasus lama dan perhitungan manualnya lumayan cukup rumit.
KUMALA SIWI KUDUS,” UNIVERSITAS DIAN NUSWANTORO SEMARANG, 2015. [8] P. A. Cimahi, Ekspedisi Perkara Cerai. Cimahi.