Perbandingan Metode Naive Bayes dan K- Nearest Neighbor untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi)

  INSIGHT

  Volume 1 No. 1 | April 2018 : 182-187

  

Perbandingan Metode Naive Bayes dan K-

Nearest Neighbor untuk Prediksi Perceraian

  

(Studi Kasus : Pengadilan Agama Cimahi)

1 2 3 Irma Apriliani Dahlia , Mohamad Irfan , Wisnu Uriawan

Jurusan Teknik Informatika, Fakultas Sains dan Teknologi UIN SGD Bandung

Jl.A.H Nasution 105 Bandung 40614

  

  

  

  

Abstract- Divorce in Cimahi Religious Courts have continued to rise each year, each month receives an average of 800 cases

of divorce, of the 800 cases, 75% of divorce cases households, while the remaining other matters, such as marriage and

inheritance confirmation. Based on these problems need for action in the form of a prediction to determine how many

divorces every month. One suitable data processing techniques in helping the process of prediction occurrence of a divorce by

using data mining techniques such as Naive Bayes algorithm and K-Nearest Neighbor. This algorithm has a high accuracy

rate in predicting. This level of accuracy is best in between the two algorithms can be determined by doing a comparison.

Comparison of algorithms aims to get the best algorithms considered in the process of predicting an issue, after making a

comparison it can be concluded that Naive Bayes algorithm resulted in a 72.5% accuracy and K-Nearest neigbor algorithm

produces an accuracy of 57.5%.

  Keywords- Comparison, Predicts Divorce, Naive Bayes, K-Nearest Neighbor.

  

Abstrak- Perceraian di Pengadilan Agama Cimahi setiap tahun terus mengalami kenaikan, setiap bulannya rata-rata

menerima 800 perkara cerai, dari 800 perkara tersebut, 75% perkara perceraian rumah tangga, sedangkan sisanya perkara

lain, seperti nikah isbat dan waris. Berdasarkan masalah tersebut perlu adanya tindakan berupa prediksi untuk mengetahui

seberapa banyak perceraian disetiap bulannya. Salah satu teknik pengolahan data yang cocok dalam membantu proses

prediksi terjadinya suatu perceraian yaitu dengan menggunakan teknik data mining seperti algoritma Naive Bayes dan K-

Nearest Neighbor. Algoritma ini memiliki tingkat akurasi yang tinggi dalam memprediksi. Tingkat akurasi yang terbaik di

antara kedua algoritma ini dapat diketahui dengan cara melakukan perbandingan. Perbandingan algoritma bertujuan

untuk mendapatkan algoritma yang dianggap paling baik pada proses memprediksi suatu permasalahan, setelah melakukan

perbandingan maka dapat disimpulkan bahwa algoritma Naive Bayes menghasilkan akurasi 72,5% dan algoritma K-Nearest

Neigbor menghasilkan akurasi 57,5%.

  Kata Kunci- Perbandingan, Prediksi Perceraian, Naive Bayes, K-Nearest Neighbor.

  I. PENDAHULUAN dapat mengguncangkan sebuah pernikahan. Menurut Pernikahan dalam pandangan Islam merupakan salah satu media online [1], perceraian di wilayah sesuatu yang sakral, bermakna ibadah kepada Allah, Kabupaten Bandung, Kota Cimahi, setiap tahun terus mengikuti sunnah Rasulullah dan dilaksanakan atas dasar mengalami kenaikan. Berdasarkan data dari Kantor keikhlasan, tanggung jawab, dan mengikuti ketentuan- Pengadilan Agama Cimahi yang membawahi daerah ketentuan hukum yang harus diindahkan. Sedangkan tersebut, sejak 2014 lalu, perkara perceraian yang tujuan pernikahan sebagaimana difirmankan Allah SWT ditangani rata-rata naik 25 persen. Panitera Pengadilan dalam surat Ar- Agama Cimahi, Saefuloh mengatakan, setiap bulan rata-

  Rum ayat 21 yang artinya “Dan di antara

  

tanda-tanda kekuasaan-Nya ialah Dia menciptakan rata pihaknya menerima 800 perkara. Dari 800 perkara

untukmu isteri-isteri dari jenismu sendiri, supaya kamu tersebut, 75 persen di antaranya adalah perkara perceraian

cenderung dan merasa tenteram kepadanya dan rumah tangga. Sedangkan sisanya perkara lain, seperti

dijadikan-Nya di antaramu rasa kasih dan sayang. nikah isbat, waris dan lainnya.

Sesungguhnya pada yang demikian itu benar-benar Berdasarkan tingkat perceraian yang setiap tahun

terdapat tanda-tanda bagi kaum yang berfikir terus mengalami kenaikan, perlu adanya tindakan berupa

  ”. Namun tidak dapat dipungkiri perbedaan-perbedaan putusan perkara untuk mengetahui seberapa banyak dalam pernikahan sering menimbulkan pertengkaran antar perceraian disetiap bulannya. Salah satu teknik suami istri. Munculnya berbagai permasalahan dalam pengolahan data yang cocok dalam membantu proses pernikahan, seperti lingkungan, perselingkuhan, masalah prediksi terjadinya suatu perceraian yaitu dengan anak, masalah ekonomi, usia mereka saat menikah, itu menggunakan teknik data mining [2]. Teknik data mining INSIGHT | Volume 1 No. 1 | April 2018 : 182-187 183 yang sering digunakan adalah Naive Bayes dan K-Nearest

  Neighbor. Algoritma Naive Bayes merupakan

  pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu kelas [3]. Sedangkan K-Nearest Neighbor mencari jarak terdekat antara data yang akan dievaluasi dengan data kasus sebelumnya [4]. Dari kedua metode tersebut perlu adanya perbandingan untuk mengetahui metode mana yang paling baik diantaranya sehingga pada proses prediksi akan lebih efektif, dan akurat.

  A. CONTOH PERHITUNGAN NAIVE BAYES

  Cara kerja metode Naive Bayes dan K-nearest neighbor hampir sama, yang membedakannya pada saat pengelompokan data dimana metode Naive Bayes hanya mengelompokan data atribut yang dipakainya saja, sedangkan metode K-Nearest Neighbor atributnya diberikan nilai bobot dan data atribut yang sudah di kelompokan diberikan nilai kedekatan untuk memudahkan dalam proses perhitungan.

  III. HASIL DAN PEMBAHASAN Objek penelitian ini yaitu data perceraian yang di ambil dari Pengadilan Agama Cimahi, dimana data training maupun data testing terdiri dari beberapa atribut seperti usia penggugat, usia tergugat, lama perkawinan, usia anak dan indikator. Hal ini akan menjadi satu kesatuan dalam pemrosesannya.

  100%

  evaluasi model klasifikasi untuk memperkirakan objek yang benar atau salah. Sebuah matrix dari prediksi yang akan dibandingkan dengan kelas yang asli dari inputan atau dengan kata lain berisi informasi nilai aktual dan prediksi [7]. Dengan perhitungan : Accuracy = jumlah nilai yang benar jumlah data keseluruhan

  Confusion matrix adalah tool yang digunakan untuk

  D. PENGUJIAN AKURASI

  (1) Keterangan: T : Kasus baru S : kasus yang ada dalam penyimpanan N : jumlah atribut I : atriut individu antara 1 – n f : fungsi similarity atribut i antarakasus T dan kasus S w : bobot yang diberikan pada atribut ke-i

  ∑ ( , ) =1

  Similarity=

  Metode K-Nearest Neighbor adalah metode pencarian kedekatan antara kasus baru dengan kasus lama berdasarkan pada pencocokan bobot dari beberapa atribut yang sudah ditentukan sebelumnya. Misalkan diinginkan untuk mencari solusi terhadap seorang pasien baru dengan menggunakan solusi dari pasien terdahulu. Untuk mencari kasus pasien mana yang akan digunakan, maka dihitung kedekatan kasus pasien baru dengan semua kasus pasien lama. Kasus pasien lama dengan kedekatan terbesar yang akan diambil sebagai solusi pada kasus pasien baru [6].

  P(X) : Probabilitas dari X C.

  hipotesis H

  P(X|H) : Probabilitas X berdasarkan kondisi pada

  X : Data dengan class yang belum diketahui H : Hipotesis data X merupakan suatu class spesifik P(H|X) : Probabilitas hipotesis H berdasarkan kondisi X (posteriori probabilitas) P(H) : Probabilitas hipotesis H (probabilitas)

  Sehubungan dengan hal tersebut, maka dalam penelitian ini peneliti mengambil judul

K-NEAREST NEIGBOR

  Metode Naive Bayes adalah pengklasifikasian statistik yang dapat digunakan untuk memprediski probabilitas keanggotaan suatu class. Naive Bayes didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan decesion tree dan neural network. Naive Bayes terbukti memiliki akurasai dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar [3].

  (KDD) [4] B.

  atas database. Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge Discovery in Databases

  machine learning atau analisa statistik yang berjalan di

  ( | ) =

  1.1 Prototype

  Gambar

  II. METODE PENELITIAN Metode pengembangan perangkat lunak yang digunakan penulis sebagai kerangka dalam penilitian dengan studi kasus ini adalah model prototype. Prototype merupakan suatu metode dalam pengembangan sistem yang cocok digunakan untuk tingkat penelitian yang masih baru dan ruang lingkup kecil [5].

  “Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi)”

NAIVE BAYES

P(X|H). P(H)

  P(X) Di mana :

  A. DATA MINING Secara sederhana, data mining mengacu pada penggalian atau “mining” pengetahuan dari sejumlah data yang besar. Data mining memang salah satu cabang ilmu komputer yang relatif baru. Dan sampai sekarang orang masih memperdebatkan menempatkan data mining di bidang ilmu mana karena data mining melibatkan integrasi teknik dari berbagai disiplin ilmu. Ada pihak yang berpendapat bahwa data mining tidak lebih dari

  INSIGHT

  Pengelompokan Lama Perkawinan

  2. Menghitung jumlah kasus yang sama dengan class yang sama Jumlah data P(X|Y=CERAI) dengan keterangan “CERAI” dibagi jumlah data CERAI dan Jumlah data P(X|Y=TIDAK) dengan keterangan “TIDAK” dibagi jumlah data TIDAK.

  1. Menghitung jumlah class atau label Tentukan P(Y=CERAI) sebagai probabilitas orang yang cerai dan P(Y=TIDAK) sebagai probabilitas orang yang tidak cerai.

  D. PROSES PERHITUNGAN KEMIRIPANN KASUS

Tabel 3.7 Contoh Kasus Baru

  C. KASUS BARU

  Pengelompokan Indikator

Tabel 3.5 Pengelompokan Jumlah Anak Tabel 3.6

  Tabel 3.4

  ISSN 2620-5467 (Online)

  Pengelompokan Usia Tergugat

  Tabel 3.3

Tabel 3.2 Pengelompokan Usia Pengugugat

  B. PENGELOMPOKAN ATRIBUT Pengelompokan ini bertujaun untuk mempermudah perhitungan dalam proses pengambilan keputusan bagi calon penggugat sebelum melakukan sidang perkara yang disajikan kedalam bentuk beberapa tabel berikut ini :

Tabel 3.1 Data Penelitian Naive Bayes

  Pada penelitian ini menggunakan data kasus perkara cerai yang diambil dari Pengadilan Agama Cimahi tahun 2016 [8]. Salah satu contoh kasus perkara yang diambil dari Pengadilan Agama Cimahi seperti pada Tabel dibawah ini.

  Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi) 184

  3. Kalikan semua hasil variabel CERAI dan TIDAK INSIGHT | Volume 1 No. 1 | April 2018 : 182-187 185

  4. Bandingkan hasil class CERAI dan TIDAK Karena hasil (P|TIDAK) lebih besar dari (P|CERAI) maka keputusanya adalah TIDAK”

  Kedekatan Usia Pengugat

  d. Kedekatan Nilai Variabel Jumlah Anak Berikut ini adalah model kedekatan nilai variabel

  Kedekatan Lama Perkawinan

  Tabel 3.13

  Lama Perkawinan yang didefinisikan :

  c. Kedekatan Nilai Variabel Lama Perkawinan Berikut ini adalah model kedekatan nilai variabel

Tabel 3.12 Kedekatan Usia Tergugat

  Tergugat didefinisikan :

  b. Kedekatan Nilai Variabel Usia Tergugat Berikut ini model kedekatan nilai variabel Usia

  Tabel 3.11

  E. CONTOH PERHITUNGAN KNN

  a. Kedekatan Nilai Variabel Usia Penggugat Berikut ini adalah kedekatan nilai variabel Usia Penggugat.

  G. KEDEKATAN VARIABEL Kedekatan antara nilai-nilai dalam variabel juga perlu didefinisikan. Berikut adalah kedekatan antara nilai- nilai dalam variabel yang didefinisikan, yaitu :

Tabel 3.10 Pembobotan

  Bobot satu atribut dengan atribut lain pada atribut bukan tujuan dapat didefinisikan dengan nilai berbeda yang disajikan kedalam bentuk beberapa tabel berikut ini :

  F. PEMBOBOTAN VARIABEL Pembobotan ini bertujuan untuk mempermudah perhitungan dalam proses pengambilan keputusan nilai kasus lama dan kasus baru. Bobot jarak ini diberikan nilai antara 0 sampai dengan 1. Nilai 0 artinya jika atribut tidak berpengaruh dan sebaliknya nilai 1 jika atribut sangat berpengaruh.

Tabel 3.9 Data Penelitian KNN

  Contoh Kasus Baru Kemudian dari data kasus yang sudah ada dicari nilai kedekatan dari usia tergugat, usia penggugat, lama perkawinan, jumlah anak, indikator dapat dilihat pada tabel berikut :

  Tabel 3.8

  Jumlah Anak yang didefinisikan :

  INSIGHT

  =

  memprediksi perceraian di Pengadilan Agama Cimahi dengan 20 data testing yang berbeda dihasilkan presentase keakurasian yang berberbeda pula. J. HASIL

  Naive Bayes dan K-Nearest Neighbor. Untuk

  Uji Perhitungan Akurasi 2 Dari dua kali percobaan membandingkan algoritma

Tabel 3.13 Uji Perhitungan Akurasi 1 Tabel 3.14

  sehingga bisa diketahui jumlah benar dan salah saat melakukan prediksi pada data testing dapat dilihat pada tabel berikut :

  Bayes dan K-Nearest Neighbor, kemudian akan di analisa

  I. PERBANDINGAN AKURASI Pada pengujian akurasi menggunakan dua kali percobaan dengan 20 data testing yang berbeda, 130 data training yang sama. Data tersebut akan diuji untuk mengetahui akurasi yang dihasilkan oleh algoritma Naive

  Hasil perhitungan K1-K7

  Tabel 3.12

  Perhitungan seperti diatas berlaku sampai kasus ke 7, sehingga didapatkan hasil, dapat dilihat pada tabel berikut :

  2.6 = 0.593

  1.544

  = (0.666 0.6) + (0.399 0.6) + (0.833 0.4) + (0.5 0.2) + (0.571 08) 0.6 + 0.6 + 0.4 + 0.2 + 0.8

  ISSN 2620-5467 (Online)

  Bobot status lama perkawinan = 0.4 Kedekatan status jumlah anak kasus baru terhadap kasus lama = 0.5 Bobot status jumlah anak = 0.2 Kedekatan status indikator kasus baru terhadap kasus lama = 0.571 Bobot status indikator = 0.8

  Kasus K1 Kedekatan status usia penggugat kasus baru terhadap kasus lama = 0.666 Bobot status usia penggugat = 0.6 Kedekatan status usia tergugat kasus baru terhadap kasus lama = 0.399 Bobot status usia tergugat= 0.6 Kedekatan status lama perkawian kasus baru terhadap kasus lama = 0.833

  similarity nya :

  Berikut adalah proses perhitungan untuk mencari

  H. PROSES PERHITUNGAN KEMIRIPAN KASUS Untuk mencari kemiripannya antara kasus lama dan kasus baru. Sebelum melakukan perhitungan, untuk mempermudah dan mengefisienkan penulisan rumus maka dilakukan pendefinisian variabel sebagai berikut : NK = Nilai Kedekatan Kasus NB = Nilai Bobot NK = Kedekatan status usia penggugat kasus baru terhadap kasus lama NB = Bobot status usia penggugat NK = Kedekatan status usia tergugat kasus baru terhadap kasus lama NK = Bobot status usia tergugat NB = Kedekatan status lama perkawinan kasus baru terhadap kasus lama NK = Bobot status lama perkawinan NB = Kedekatan status jumlah anak kasus baru terhadap kasus lama NK = Bobot status jumlah anak NB = Kedekatan status indikator kasus baru terhadap kasus lama NK = Bobot status indikator S = Jarak

  Kedekatan Indikator

  Tabel 3.15

  Indikator yang didefinisikan :

  e. Kedekatan Nilai Variabel Indikator Berikut ini adalah model kedekatan nilai variabel

  Kedekatan Jumlah Anak

  Tabel 3.14

  Perbandingan Metode Naive Bayes Dan K-Nearest Neighbor Untuk Prediksi Perceraian (Studi Kasus : Pengadilan Agama Cimahi) 186

  Dari dua akurasi diatas masing-masing algoritma memiliki rata-rata yaitu 72,5% untuk algoritma Naive Bayes dan 57,5% untuk algoritma K-Nearest Neighbor. INSIGHT | Volume 1 No. 1 | April 2018 : 182-187 187

  IV. KESIMPULAN DAN SARAN

  yang lebih baik dalam proses memprediksi perceraian pada Pengadilan Agama Cimahi.

  [7] Eska sarti Kundari, “PERBANDINGAN KINERJA METODE NAIVE BAYES DAN C4.5 DALAM PENGKLASIFIKASIAN PENYAKIT DIABETES MELITUS DI RUMAH SAKIT

  [6] P. Mata, “PERBANDINGAN NAIVE BAYES CLASSIFIER DENGAN NEAREST NEIGHBOR UNTUK IDENTIFIKASI,” vol. 1, no. 2, pp. 82 –86, 2016.

  Pendekatan Praktisi (Buku I). Yogyakarta: Andi, 2002.

  Yogyakarta: Andi, 2009. [4] Y. Agusta, “K-Means - Penerapan, Permasalahan dan Metode Terkait,” J. Sist. dan Inform., vol. 3, no. Pebruari, pp. 47 –60, 2007. [5] P. Roger S, Rekayasa Perangkat Lunak :

  [2] P. Labu and J. Selatan, “Komparasi Metode Data Mining Untuk Prediksi,” pp. 1–6, 2016. [3] luthfi taufiq E. Kusrini, Algoritma Data Mining.

  V. REFERENSI [1] “Berita Perceraian Wilayah KBB.” [Online]. Available: http://www.materikelas.com/2015/09/nikah- pengertian-hukum-rukun-dan syarat.html# / diakses pada tanggal 15/04/2017 11:31.

  Neural Network agar dapat mengetahuan algoritma

  A. KESIMPULAN Berdasarkan penelitian yang telah dilakukan diatas, maka dapat disimpulkan sebagai berikut :

  1. Diharapkan dapat membandingkkan dengan algoritma yang lain seperti Decesion Tree atau

  B. SARAN Untuk meningkatkan kinerja dan menyempurnakan penelitian yang telah dibuat, maka ada saran untuk pengembangan sistem sejenis sebagai berikut :

  130 data training, maka algoritma Naive Bayes tepat untuk melakukan prediksi perceraian di Pengadilan Agama Cimahi.

  Neighbor dengan menggunkan 20 data testing dan

  2. Algoritma Naive Bayes dan K-Nearest Neighbor untuk prediksi perceraian di Pengadilan Agama Cimahi menghasilkan akurasi 72,5% untuk algoritma niave bayes dan 57,5% untuk algoritma K-Nearest

  1. Kinerja algoritma Naive Bayes pada saat melakukan prediksi tidak membutuhkan waktu lama karena memiliki kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar dan perhitungan manualnya tidak rumit, sedangkan pada algoritma K-Nearest Neighbor membutuhkan waktu cukup lama karena diperlukan perhitungan jarak dari tiap kasus baru pada keseluruhan kasus lama dan perhitungan manualnya lumayan cukup rumit.

  KUMALA SIWI KUDUS,” UNIVERSITAS DIAN NUSWANTORO SEMARANG, 2015. [8] P. A. Cimahi, Ekspedisi Perkara Cerai. Cimahi.