Metode dan Perancangan Sistem

2 Penelitian tersebut menggunakan KDD CUP 1999 berdasarkan set data untuk menguji penampilan algoritma KMIE. Pada penelitian ini hanya berfokus dalam mengukur tingkat akurasidetection rate serangan pada sistem IDS sehingga penelitian tersebut digunakan sebagai acuan dalam penelitan ini. Penelitian selanjutnya berjudul A K-Means and Naive Bayes learning approach for better intrusion detection [4], membahas tentang implementasi sebuah IDS dengan dua pendekatan pembelajaran, yaitu K-Means dan Naive Bayes KMNB. K-Means digunakan untuk mengidentifikasi kelompok sample data yang memiliki perilaku yang mirip dan tidak mirip. Naive Bayes digunakan pada tahap kedua untuk mengklasifikasikan semua data ke dalam kategori yang tepat. Hasil penelitian menunjukkan bahwa K-Means clustering and Naïve Bayes Classifier KMNB secara signifikan meningkatkan akurasi deteksi. Perbedaan dalam penelitian ini adalah algoritma K-Means digunakan dalam mengukur tingkat akurasi atau detection rate pada sistem IDS, dimana data serangan tersebut diambil berdasarkan empat kategori serangan. Berdasarkan penelitian terdahulu yang berkaitan dengan Intrusion Detection System IDS dan Algoritma K-Means, maka penelitian ini melakukan pengembangan yang membahas mengenai bagaimana mengklasifikasikan serangan pada intrusion detection system menggunakan K-Means dalam menganalisa data.

3. Metode dan Perancangan Sistem

Metode yang digunakan dalam klasifikasi serangan terdiri dari lima tahapan yaitu, 1 Analisa kebutuhan dan pengumpulan data, 2 Perancangan sistem, 3 Implementasi sistem, 4 Pengujian dan hasil penelitian, 5 Penulisan laporan. Gambar 1 Tahapan Penelitian [5] Tahapan penelitian pada Gambar 1 dapat dijelaskan sebagai berikut. Tahap pertama : Pada tahap analisa kebutuhan dan pengumpulan data dilakukan pengumpulan data berupa literatur yang berkaitan dengan keamanan jaringan dan algoritma K-Means. Tahap kedua : Pada tahap perancangan sitem dilakukan dengan cara melakukan proses clustering atau pengelompokan data serangan IDS dan menghitung kedekatan antara objek dengan titik centroid dengan menggunakan fungsi jarak Euclidean distance. Tahap ketiga : Pada tahap ini dilakukan pengimplementasian Algoritma K-Means dengan cara melakukan clusterpengelompokan data serangan IDS untuk menentukan nilai Kjumlah 3 cluster dan titik centroid dalam klasifikasikan serangan terhadap IDS. Tahap keempat : Pada tahap ini dilakukan pengujian algoritma K-Means dalam mengklasifikasikan serangan terhadap IDS. Tahap kelima : Pada tahap ini akan memaparkan seluruh hasil penelitian yang sudah dilakukan, dan akan ditulis pada laporan penelitian. Pada Tahap analisis kebutuhan dilakukan untuk mengumpulkan data dengan cara mengumpulkan artikel yang berkaitan dengan keamanan jaringan dan algoritma K-Means. Pada tahap mengimplementasikan system ini, dibutuhkan beberapa perangkat yang terhubung dalam satu jaringan lokal dan terintegrasi dengan internet. Adapun perangkat keras dan lunak yang dipakai dalam membangun sistem terdapat pada Tabel 1. Tabel 1 kebutuhan sistem Komponen Fungsi Spesifikasi 1 PC Sebagai IDS server - CPU Dual C ore - Ram 1GHz - 1 Lan Port - Hardisk 160 Gbyte 1 laptop Sebagai network administrator Kabel UTP Penghubung antara router dan router, router dengan client - CAT 5 - TJ45 Ubuntu server 12.04 Ssstem operasi pada IDS server MYSQL Database Matlab Sebagai tools dalam menentukan titik-titik data serangan dan titik centroid yang dipakai dalam algoritma K- means Pada tahap perancangan sistem yang dilakukan adalah dengan cara memperhatikan cara kerja NIDS, alur kerja diagram penelitian serta cara kerja algoritma K-Means yang digunakan sebagai metode dalam mengklasifikasikan serangan pada IDS. Adapun tahapan-tahapan perancangan yang dilakukan dalam penelitian ini yang digambarkan pada alur diagram kerja seperti pada Gambar 2 dibawah ini: 4 Gambar 2 Alur Diagram Cara Kerja NIDS [6] Gambar 2 menunjukan alur diagram cara kerja Network Instrusion Detection system NIDS. Dimulai dari paket data yang memasuki interfaces jaringan yang sudah dikonfigurasi dalam snort. Paket data tersebut dicocokan dengan signature yang ada dalam database snort. Kemudian apabila paket data tersebut merupakan sebuah instrusi akan disimpan ke database, jika bukan paket data akan diteruskan. Paket data instusi yang disimpan ke database akan diolah dan dianalisa oleh BASE. BASE merupakan aplikasi berbasis GUI yang dapat menganalisa data snort. BASE mencari dan memproses kegiatan mencurigakan yang tersimpan dalam database berdasarkan tools untuk memonitoring jaringan, hasil yang ditampilkan akan menjadi acuan administrator dalam mengambil tindakan. Adapun gambaran umum dari cara kerja penelitian yang digambarkan dalam alur diagram dalam mengukur tingkat akurasi serangan pada IDS, yang digambarkan pada Gambar 3 seperti dibawah ini: Gambar 3 Diagram alur kerja penelitian 5 Pada Gambar 3 menunjukan diagram alur kerja yang dilakukan dalam penelitian ini, dimulai dari pengambilan data pada BASE IDS yang diambil berdasarkan emapat kategori serangan, yaitu web attack application, trojan activity, attempted dos dan shellcode detect. Pada tahap selanjutnya akan dikelompokan berdasarkan parameter yang telah dibuat dalam penelitian ini, dimana parameter tersebut adalah IP yang sering kali masuk akan diberikan nilai dan setelah mendapatkan nilai dari parameter tersebut maka akan dicari posisi atau titik data menggunakan aplikasi matlab sebagai tools untuk mendapatkan titik-titik data serangan dan juga titik centroid yang diambil pada BASE IDS berdasarkan kategori serangan, dan setelah mendapatkan posisi atau titik data serangan dan titik centroid dari data serangan tersebut maka tahap selanjutnya adalah menghitung jarak dari tiap posisi data ke titik centroid dengan menggunakan fungsi jarak, yaitu euclidean distance. Jika tahap perhitungan jarak menggunakan fungsi jarak euclidean distance sudah selesai, maka akan dihitung nilai rata-rata dari setiap titik data tersebut, guna mendapatkan hasil klasifikasi serangan pada IDS, setelah mendapatkan hasil dari nilai rata-rata tersebut maka proses dalam klasifikasi serangan pada IDS menggunakan algoritma K-Means selesai. Pada tahap selanjutnya akan dibahas mengenai perancangan algoritma K- Means dalam klasifikasi serangan pada IDS. Adapun gambaran umum tentang algoritma K-Means itu sendiri merupakan salah satu metode data clustering non- hirarki yang mengelompokan data dalam bentuk satu atau lebih clusterkelompok. Data-data yang memiliki karakteristik yang sama dikelompokan dalam satu clusterkelompok dan data yang memiliki karakteristik berbeda dikelompokan dengan clusterkelompok yang lain sehingga data yang berada dalam satu clusterkelompok memiliki tingkat variasi yang kecil. Algoritma K-means merupakan model centroid. Model centroid adalah model yang menggunakan centroid untuk membuat cluster. Centroid adalah “titik tengah” suatu cluster. Centroid berupa nilai dan centroid digunakan untuk menghitung jarak suatu objek data terhadap centroid. Suatu objek data termasuk dalam suatu cluster jika memiliki jarak terpendek terhadap centroid cluster tersebut. Pada tahap selanjutnya akan dibahas mengenai algoritma K-Means secara keseluruhan meliputi proses pengambilan data serangan pada Base IDS dan melakukan proses pengelompokancluster serangan serta menghitung jarak centroid. - Proses Clustering atau Pengelompokkan Pada tahapan ini data tersebut akan dikelompokkan melalui proses clustering. Proses clustering dilakukan menggunakan Algoritma K-Means. Berikut ini adalah proses clustering terhadap data serangan yang sudah diambil dalam BASE IDS sesuai dengan penjelasan mengenai Algoritma K-Means pada bab sebelumnya. 1. Menentukan nilai K atau jumlah cluster dan centroid Misalkan nilai K yang dimasukkan adalah dua, sehingga centroid yang ditentukan juga sebanyak dua centroid. Pada kasus penelitian ini, jumlah cluster dengan hasil clustering tidak ada perubahan dikarenakan jumlah cluster yang dipakai sejumlah dua cluster, terdiri dari Internet Protocol IP dan Port yang keduanya saling berdekatan. 6 2. Mengelompokkan data ke dalam cluster Setelah data dikelompokkan ke dalam cluster maka akan dihitung jarak antara titik data ke titik centroid dengan menggunakan fungsi jarak yaitu Euclidean Distance. Persamaan 1 merupakan formula Euclidean Distance atau perhitungan jarak yang dipakai dalam mengukur DR pada IDS menggunakan algoritma K-Means sebagai berikut: [7] 1 dengan : = distance = 1 , 2 , 3 , ……, p = 1 , 2 , 3 , ……, p = merepresentasikan nilai atribut � = dimensi data � = objek data - Dalam hal dua dimensi k = 1, 2 menjadi X i maka: X 1i menjadi X i X 1j menjadi X j X 2i menjadi Y i X 2j menjadi Y j X ik = 1 atau X i1 menjadi X i X jk = 1 atau X j1 menjadi X j X ik = 2 atau X i2 menjadi Y i X jk = 2 atau X j2 menjadi Y j Sehingga persamaan 1 dapat disederhanakan menjadi � = − 1 2 + − 1 2

4. Hasil dan Pembahasan