APLIKASI DATA MINING METODE K NEAREST NE

A.

Latar Belakang

Dalam buku Psikologi Abnormal oleh G.C.Davidson dkk, pada
tahun 2000, depresi adalah sinonim dengan perasaan sedih, murung,
kesal, tidak bahagia, dan menderita. Orang pada umumnya
menggunakan istilah depresi untuk merujuk pada keadaan yang
melibatkan kesedihan, rasa kesal, rasa tidak punya harga diri, tidak
bertenaga, dan lain-lain.
Menurut data dari WHO (World Health Organization) pada tahun
1993, kurang lebih 18% penduduk dunia pernah mengalami gangguan
kesehatan dengan keluhan yang sedemikian hebatnya sehingga
menyebabkan tekanan jiwa bagi penderitanya (Lanywati, 2001). Pada
tahun 2020 depresi akan jadi beban global sebagai penyakit kedua di
dunia setelah penyakit jantung.
Di dalam perkembangan komputer, para ahli komputer mencoba
membangun suatu sistem komputer yang dapat membantu proses
pengolahan data, sehingga dapat mengurangi resiko kesalahan yang
dapat terjadi karena beberapa kekurangan yang dimiliki oleh manusia.
Sistem inilah yang dikenal dengan istilah data mining.

Peneliti tertarik untuk merancang suatu aplikasi pengolahan data
yang digunakan untuk mengklasifikasikan gejala depresi. Untuk
mengolah data gejala depresi, aplikasi dibangun menggunakan metode
K-Nearest Neighbor (KNN). KNN merupakan salah satu metode untuk
mengambil keputusan yang menggunakan algoritma pembelajaran
terawasi dimana hasil dari data masukan yang baru diklasifikasi
berdasarkan jarak terdekat dalam data pelatihan. Aplikasi juga
dibangun menggunakan bahasa pemrograman desktop java dan
menggunakan basis data Microsoft Excel.
B.

Rumusan Masalah

Berdasarkan uraian latar belakang masalah di atas dan melihat
bahwa begitu penting kesehatan bagi manusia dapat dirumuskan yaitu,
bagaimana membuat aplikasi yang dapat mengklasifikasikan gejala
depresi menggunakan metode K-Nearest Neighbor .
C.

Ruang Lingkup Masalah

Ruang lingkup dari penelitian dan pembuatan aplikasi ini adalah:

1.
2.
3.

Aplikasi yang akan dibuat dibatasi pada analisis dan olah data
yang sudah tersedia sebagai data pelatihan.
Basis data yang digunakan dalam aplikasi yang akan dibuat
menggunakan pengolah data Microsoft Office Excel 2007.
Aplikasi akan dibuat mengunakan pemrograman Java Desktop
Standard Edition (J2SE).

4.

D.

Metode data mining yang digunakan dalam aplikasi ini yaitu
metode Klasifikasi K-Nearest Neighbor (KNN).
Tujuan Penelitian


Dari perumusan masalah diatas peneliti bertujuan untuk
membuat sebuah aplikasi yang dapat mengolah data menjadi sebuah
sistem pendukung keputusan yang dapat mengklasifikasikan gejala
depresi dan insomnia.
E.

Tinjauan Pustaka

Dari penelitian yang dilakukan oleh Andreas Pamungkas dan
Hastin Nur Al-Fatah berjudul Clustering terhadap Indeks Prestasi
Mahasiswa STMIK Akakom, telah dilakukan pembangunan suatu aplikasi
clustering data menggunakan metode K-Means. Didalam aplikasi
tersebut dimasukkan suatu pola dari data yang diamati ke kelas pola
yang belum diketahui dengan sifat tanpa arahan (unsupervised). Objek
dari penelitian tersebut menggunakan indeks prestasi mahasiswa STMIK
Akakaom Yogyakarta.
F.

Dasar Teori


1. Data mining
1.1
Pengertian Data mining
Data mining merupakan salah satu cabang ilmu komputer
yang masih baru, ada ahli yang menempatkan data mining sebagai
bidang ilmu database, kecerdasan buatan dan statistik. Ada pula
pihak yang berpendapat data mining tidak lebih dari machine
learning atau analaisa statistik yang berjalan di atas database.
Alasan memilih data mining disbanding analisis data secara
tradisional adalah :
a. Data mining mampu menangani jumlah data kecil sampai data
yang berukuran terabyte,
b. Mampu menangani data dengan kompleksitas yang tinggi,
misalnya data stream, data sensor, data spasial, teks data web,
dan lain-lain,
c. Mampu menangani data yang mempunyai banyak dimensi, yaitu
puluhan sampai ribuan dimensi.
1.2


Klasifikasi Metode K-Nearest Neighbor (KNN)
Secara difinisi, K-Nearest Neighbor (KNN) adalah suatu
metode data mining yang menggunakan algoritma terarah
(supervised) dimana dari query instance yang baru diklasifikasikan
berdasarkan mayoritas dari kategori pada KNN. Tujuan dari
algoritma ini adalah mengklasifikasi objek baru berdasarkan atribut
dan training sampel. Classifier tidak menggunakan model apapun
untuk dicocokan dan hanya berdasarkan pada memori. Diberikan

titik query, akan ditemukan sejumlah K objek atau (titik training)
yang paling dekat dengan query. Klasifikasi menggunakan voting
terbanyak diantara klasifikasi dari K objek. Algoritma KNN
menggunakan klasifikasi ketetanggaan sebagai nilai prediksi dari
query instance yang baru.
KNN memiliki beberapa kelebihan yaitu bahwa dia tangguh
terhadap training data yang noisy dan efektif apabila training datanya besar. Sedangkan kelemahan dari KNN adalah perlu menentukan
nilai dari parameter K (jumlah dari tetangga terdekat). Pembelajaran
berdasarkan jarak tidak jelas mengenai jenis jarak apa yang harus
digunakan dan atribut mana yang harus digunakan untuk
mendapatkan hasil yang terbaik, dan biaya komputasi yang tinggi

karena diperlukan jarak dari tiap query instance pada keseluruhan
training sample.
1.3

Algoritma KNN
Metode KNN ini memiliki algoritma yang tidak sulit. Algoritma
metode ini adalah sebagai berikut.
1. Tentukan parameter K (jumlah tetangga terdekat).
2. Hitung jarak antara data yang akan dievaluasi dengan semua
data pelatihan.
3. Urutkan jarak yang terbentuk (urut naik) dan tentkan jarak
terdekat sampai urutan ke-K.
4. Pasangkan kelas (c) yang berkesuaian.
5. Carilah jumlah kelas dari tetangga yang terdekat tersebut, dan
tetapkan kelas tersebut sebagai kelas data yang dievaluasi.
Metode ini juga mempunyai rumus. Rumus Metode KNearest Neighbor(KNN) adalah.

Keterangan:
X1
i


= data contoh
= variabel data

X2
d

= data uji
= jarak

p = dimensi data

2. Gejala Depresi
2.1

Pengertian Depresi
Depresi adalah gangguan alam perasaan (mood) yang
ditandai dengan kemurungan dan kesedihan yang mendalam dan
berkelanjutan sehingga hilangnya kegairahan hidup, tidak
mengalami gangguan dalam menilai realitas (Reality Testing Ability,

masih baik), kepribadian tetap utuh atau tidak mengalami keretakan

kepribadian (Splitting of personality), perilaku dapat terganggu
tetapi dalam batas-batas normal (Hawari Dadang, 2006).
Selain itu depresi dapat juga diartikan sebagai salah satu
bentuk gangguan kejiwaan pada alam perasaan (afektif mood),
yang ditandai dengan kemurungan, kelesuan, ketidakgairahan
hidup, perasaan tidak berguna, putus asa dan lain sebagainya.
Depresi adalah suatu gangguan perasaan hati dengan ciri
sedih, merasa sendirian, rendah diri, putus asa, biasanya disertai
tanda–tanda retardasi psikomotor atau kadang-kadang agitasi,
menarik diri dan terdapat gangguan vegetatif seperti insomnia dan
anoreksia (Kaplan Sadock,2003).
Bermacam-macam gangguan psikiatrik, dapat dialami
penderita stroke, hal ini sudah lama diketahui oleh para ahli. Emil
Kraeplin mengatakan bahwa penyakit serebrovaskuler bisa
menyertai gangguan manik depresif (Bipolar I) atau menyebabkan
keadaan depresi (Kaplan Sadock,2003).
2.2 Ukuran Skala Depresi
HDRS atau Hamilton Rating Scale for Depression merupakan

salah satu dari berbagai intrumen untuk menilai depresi. Penelitian
yang membandingkan HDRS dengan skor depresi lain didapatkan
konsistensi. Reliabilitas antara pemeriksa pada umumnya cukup
tinggi. Demikian juga halnya reliabilitas oleh satu pemeriksa yang
dilakukan pada waktu yang berbeda (Riwanti,2006).
Adapun untuk mengukur tingkat depresi seseorang
menggunakan Hamilton Rating Scale for Depression. Cara penilaian
masing-masing gejala adalah sebagai berikut (A.Aziz,2007) :
0
1
2
3
4

:
:
:
:
:


Tidak ada (tidak ada gejala sama sekali)
Ringan (satu gejala dari pilihan yang ada)
Sedang (separuh dari gejala yang ada)
Berat (lebih dari separuh dari gejala yang ada)
Sangat berat (semua gejala ada)

Untuk penilaian
Kurang dari 17
18 – 24
25 – 34
35 – 51
52 – 68

skornya
:
:
:
:
:


yaitu (A.Aziz,2007) :
tidak ada depresi
depresi ringan
depresi sedang
depresi berat
depresi berat sekali

Untuk membantu mengungkapkan tingkat depresi seseorang
dapat menggunakan skala depresi beck yang disebut BDI (The Beck
Depression Inventory). Skala BDI terdiri dari 21 kelompok aitem

yang menggambarkan 21 kategori sikap dan gejala depresi, yaitu :
sedih, pesimis,merasa gagal, merasa tidak puas, merasa bersalah,
merasa dihukum, perasaan benci pada diri sendiri, menyalahkan diri
sendiri, kecenderungan bunuh diri, menangis, mudah tersinggung,
manarik diri dari hubungan sosial, tidak mampu mengambil
keputusan, merasa dirinya tidak menarik secara fisik, tidak mampu
melaksanakan aktivitas, gangguan tidur, merasa lelah, kehilangan
selera makan, penurunan berat badan, preokupasi somatic dan
kehilangan libido seks (Lestari, 2003).
G.

Analisa Kebutuhan

Aplikasi yang akan dibangun menggunakan kebutuhan data yang
meliputi input, proses, dan output, serta kebutuhan perangkat keras dan
peragkat lunak.
1. Kebutuhan data
1.1 Input berupa data–data statistik gejala depresi untuk sumber
basisdata pelatihan dan kuisoner gejala depresi metode BDI dan
HDRS untuk masukan perhitungan atau data baru.
1.2 Proses berupa proses perhitungan metode K-NN dari data input
pengguna dan database gejala depresi yang ada dalam aplikasi.
1.3 Output meliputi hasil perhitungan berupa keputusan tingkat
depresi pengguna dan data baru inputan pengguna.
2. Kebutuhan Perangkat Keras :
2.1 Netbook dengan spesifikasi :
a.
b.
c.
d.
e.

Prosessor Intel Pentium Core DuoTM 1.6 GHZ
Harddisk berkapasitas 60 GB
Monitor LCD 15"
RAM 1,5 Gb
Mouse Optical

3. Kebutuhan Perangkat Lunak:
3.1 Sistem Operasi Windows XP SP3
3.2 NetBeans IDE versi 7.0.1 sebagai editor Java
3.3 JDK 1.7 sebagai interpreter Java

H.

Pemodelan yang Digunakan

Pada aplikasi yang akan dibangun menggunakan Unified Modeling
Language
(UML)
yaitu
bahasa
spesifikasi
standar
untuk
mendokumentasikan, menspesifikasikan dan membangun sistem
perangkat lunak. UML menggambarkan himpunan yanng terstruktur
dan teknik untuk pemodelan desain program berorientasi objek (OOP)
serta aplikasinya.
Pada aplikasi hanya terdiri dari satu macam actor yakni pengguna
yang dapat melakukan berbagai macam fungsi yang disediakan oleh
aplikasi. Diagram Use Case untuk pengguna ditunjukkan pada gambar
1 dibawah.



Mengisi kuesioner

Pengguna

Melihat hasil perhitungan

Melihat database gejala depresi



Menambah database gejala depresi

Melihat bantuan

Gambar 1. Diagram Use Case

I.

Daftar Pustaka
Anonim, 2012. BDI (The Beck Depression Inventory) Test.
http://xaesar.files.wordpress.com/2011/03/soal-bdi.doc .
diakses pada November 2011.
Anton, S., 2007, K-Nearest Neighbor. http://asnugroho.
wordpress.com/2007/01/26/k-nearest-neighborclassifier/, diakses pada Januari 2012.
Fikri,

Rijalul., Ipam, F.A. dan Prakoso, Imam.,
Pemrograman JAVA, Yogyakarta : Penerbit Andi.

2005,

Full Document and source code email to chromo256@gmail.com

Itje Sela, Enny. 2012. Diktat Kuliah : Data Mining. Yogyakarta :
STMIK Akakom.
Munawar. 2005 . Pemodelan Visual dengan UML . Yogyakarta :
Penerbit Graha Ilmu.
Riyanto, dkk. 2008. Pengembangan Aplikasi Manajemen
Database dengan Java 2 (SE/ME/EE). Yogyakarta :
Penerbit Gava Media.
Suparyanto.
2012.
Konsep
Depresi.
http://drsuparyanto.blogspot.com/2012/02/konsep-depresi.html,
diakses pada 20 Februari 2012.

Full Document and source code email to chromo256@gmail.com