2
Penelitian tersebut menggunakan KDD CUP 1999 berdasarkan set data untuk menguji penampilan algoritma KMIE. Pada penelitian ini hanya berfokus dalam
mengukur tingkat akurasidetection rate serangan pada sistem IDS sehingga penelitian tersebut digunakan sebagai acuan dalam penelitan ini.
Penelitian selanjutnya berjudul A K-Means and Naive Bayes learning approach for better intrusion detection [4], membahas tentang implementasi
sebuah IDS dengan dua pendekatan pembelajaran, yaitu K-Means dan Naive Bayes KMNB. K-Means digunakan untuk mengidentifikasi kelompok sample
data yang memiliki perilaku yang mirip dan tidak mirip. Naive Bayes digunakan pada tahap kedua untuk mengklasifikasikan semua data ke dalam kategori yang
tepat. Hasil penelitian menunjukkan bahwa K-Means clustering and Naïve Bayes Classifier KMNB secara signifikan meningkatkan akurasi deteksi. Perbedaan
dalam penelitian ini adalah algoritma K-Means digunakan dalam mengukur tingkat akurasi atau detection rate pada sistem IDS, dimana data serangan tersebut
diambil berdasarkan empat kategori serangan.
Berdasarkan penelitian terdahulu yang berkaitan dengan Intrusion Detection System IDS dan Algoritma K-Means, maka penelitian ini melakukan
pengembangan yang membahas mengenai bagaimana mengklasifikasikan serangan pada intrusion detection system menggunakan K-Means dalam
menganalisa data.
3. Metode dan Perancangan Sistem
Metode yang digunakan dalam klasifikasi serangan terdiri dari lima tahapan yaitu, 1 Analisa kebutuhan dan pengumpulan data, 2 Perancangan sistem, 3
Implementasi sistem, 4 Pengujian dan hasil penelitian, 5 Penulisan laporan.
Gambar 1 Tahapan Penelitian [5]
Tahapan penelitian pada Gambar 1 dapat dijelaskan sebagai berikut. Tahap pertama : Pada tahap analisa kebutuhan dan pengumpulan data dilakukan
pengumpulan data berupa literatur yang berkaitan dengan keamanan jaringan dan algoritma K-Means. Tahap kedua : Pada tahap perancangan sitem dilakukan
dengan cara melakukan proses clustering atau pengelompokan data serangan IDS dan menghitung kedekatan antara objek dengan titik centroid dengan
menggunakan fungsi jarak
Euclidean distance. Tahap ketiga : Pada tahap ini dilakukan pengimplementasian Algoritma K-Means dengan cara melakukan
clusterpengelompokan data serangan IDS untuk menentukan nilai Kjumlah
3
cluster dan titik centroid dalam klasifikasikan serangan terhadap IDS. Tahap keempat : Pada tahap ini dilakukan pengujian algoritma K-Means dalam
mengklasifikasikan serangan terhadap IDS. Tahap kelima : Pada tahap ini akan memaparkan seluruh hasil penelitian yang sudah dilakukan, dan akan ditulis pada
laporan penelitian.
Pada Tahap analisis kebutuhan dilakukan untuk mengumpulkan data dengan cara mengumpulkan artikel yang berkaitan dengan keamanan jaringan dan
algoritma K-Means. Pada tahap mengimplementasikan system ini, dibutuhkan beberapa perangkat yang terhubung dalam satu jaringan lokal dan terintegrasi
dengan internet. Adapun perangkat keras dan lunak yang dipakai dalam membangun sistem terdapat pada Tabel 1.
Tabel 1 kebutuhan sistem
Komponen Fungsi
Spesifikasi
1 PC Sebagai IDS server
- CPU Dual C ore
- Ram 1GHz
- 1 Lan Port
- Hardisk 160 Gbyte
1 laptop Sebagai network
administrator Kabel UTP
Penghubung antara
router dan
router, router dengan client
- CAT 5 - TJ45
Ubuntu server 12.04
Ssstem operasi pada IDS server
MYSQL Database
Matlab Sebagai tools dalam
menentukan titik-titik data serangan dan titik
centroid yang dipakai dalam algoritma K-
means
Pada tahap perancangan sistem yang dilakukan adalah dengan cara memperhatikan cara kerja NIDS, alur kerja diagram penelitian serta cara kerja
algoritma K-Means yang digunakan sebagai metode dalam mengklasifikasikan serangan pada IDS. Adapun tahapan-tahapan perancangan yang dilakukan dalam
penelitian ini yang digambarkan pada alur diagram kerja seperti pada Gambar 2 dibawah ini:
4
Gambar 2 Alur Diagram Cara Kerja NIDS [6]
Gambar 2 menunjukan alur diagram cara kerja Network Instrusion Detection system NIDS. Dimulai dari paket data yang memasuki interfaces jaringan yang
sudah dikonfigurasi dalam snort. Paket data tersebut dicocokan dengan signature yang ada dalam database snort. Kemudian apabila paket data tersebut merupakan
sebuah instrusi akan disimpan ke database, jika bukan paket data akan diteruskan. Paket data instusi yang disimpan ke database akan diolah dan dianalisa oleh
BASE. BASE merupakan aplikasi berbasis GUI yang dapat menganalisa data snort. BASE mencari dan memproses kegiatan mencurigakan yang tersimpan
dalam database berdasarkan tools untuk memonitoring jaringan, hasil yang ditampilkan akan menjadi acuan administrator dalam mengambil tindakan.
Adapun gambaran umum dari cara kerja penelitian yang digambarkan dalam alur diagram dalam mengukur tingkat akurasi serangan pada IDS, yang
digambarkan pada Gambar 3 seperti dibawah ini:
Gambar 3 Diagram alur kerja penelitian
5
Pada Gambar 3 menunjukan diagram alur kerja yang dilakukan dalam penelitian ini, dimulai dari pengambilan data pada BASE IDS yang diambil
berdasarkan emapat kategori serangan, yaitu web attack application, trojan activity, attempted dos dan shellcode detect. Pada tahap selanjutnya akan
dikelompokan berdasarkan parameter yang telah dibuat dalam penelitian ini, dimana parameter tersebut adalah IP yang sering kali masuk akan diberikan nilai
dan setelah mendapatkan nilai dari parameter tersebut maka akan dicari posisi atau titik data menggunakan aplikasi matlab sebagai tools untuk mendapatkan
titik-titik data serangan dan juga titik centroid yang diambil pada BASE IDS berdasarkan kategori serangan, dan setelah mendapatkan posisi atau titik data
serangan dan titik centroid dari data serangan tersebut maka tahap selanjutnya adalah menghitung jarak dari tiap posisi data ke titik centroid dengan
menggunakan fungsi jarak, yaitu euclidean distance. Jika tahap perhitungan jarak menggunakan fungsi jarak euclidean distance sudah selesai, maka akan dihitung
nilai rata-rata dari setiap titik data tersebut, guna mendapatkan hasil klasifikasi serangan pada IDS, setelah mendapatkan hasil dari nilai rata-rata tersebut maka
proses dalam klasifikasi serangan pada IDS menggunakan algoritma K-Means selesai.
Pada tahap selanjutnya akan dibahas mengenai perancangan algoritma K- Means dalam klasifikasi serangan pada IDS. Adapun gambaran umum tentang
algoritma K-Means itu sendiri merupakan salah satu metode data clustering non- hirarki
yang mengelompokan
data dalam
bentuk satu
atau lebih
clusterkelompok. Data-data
yang memiliki
karakteristik yang
sama dikelompokan dalam satu clusterkelompok dan data yang memiliki karakteristik
berbeda dikelompokan dengan clusterkelompok yang lain sehingga data yang berada dalam satu clusterkelompok memiliki tingkat variasi yang kecil.
Algoritma K-means merupakan model centroid. Model centroid adalah model yang menggunakan centroid untuk membuat cluster. Centroid
adalah “titik tengah” suatu cluster. Centroid berupa nilai dan centroid digunakan untuk
menghitung jarak suatu objek data terhadap centroid. Suatu objek data termasuk dalam suatu cluster jika memiliki jarak terpendek terhadap centroid cluster
tersebut.
Pada tahap selanjutnya akan dibahas mengenai algoritma K-Means secara keseluruhan meliputi proses pengambilan data serangan pada Base IDS dan
melakukan proses pengelompokancluster serangan serta menghitung jarak centroid.
-
Proses Clustering atau Pengelompokkan
Pada tahapan ini data tersebut akan dikelompokkan melalui proses clustering. Proses clustering dilakukan menggunakan Algoritma K-Means. Berikut ini adalah
proses clustering terhadap data serangan yang sudah diambil dalam BASE IDS sesuai dengan penjelasan mengenai Algoritma K-Means pada bab sebelumnya.
1.
Menentukan nilai K atau jumlah cluster dan centroid
Misalkan nilai K yang dimasukkan adalah dua, sehingga centroid yang ditentukan juga sebanyak dua centroid. Pada kasus penelitian ini, jumlah cluster
dengan hasil clustering tidak ada perubahan dikarenakan jumlah cluster yang dipakai sejumlah dua cluster, terdiri dari Internet Protocol IP dan Port yang
keduanya saling berdekatan.
6
2. Mengelompokkan data ke dalam cluster
Setelah data dikelompokkan ke dalam cluster maka akan dihitung jarak antara titik data ke titik centroid dengan menggunakan fungsi jarak yaitu
Euclidean Distance. Persamaan 1 merupakan formula Euclidean Distance atau perhitungan jarak
yang dipakai dalam mengukur DR pada IDS menggunakan algoritma K-Means sebagai berikut:
[7] 1
dengan : = distance
=
1
,
2
,
3
, ……,
p
=
1
,
2
,
3
, ……,
p
= merepresentasikan nilai atribut � = dimensi data
� = objek data
- Dalam hal dua dimensi k = 1, 2 menjadi X
i
maka: X
1i
menjadi X
i
X
1j
menjadi X
j
X
2i
menjadi Y
i
X
2j
menjadi Y
j
X
ik
= 1 atau X
i1
menjadi X
i
X
jk
= 1 atau X
j1
menjadi X
j
X
ik
= 2 atau X
i2
menjadi Y
i
X
jk
= 2 atau X
j2
menjadi Y
j
Sehingga persamaan 1 dapat disederhanakan menjadi � = −
1 2
+ −
1 2
4. Hasil dan Pembahasan