Motif Bunga Rafflesia Motif Burung Kuau Motif Rembulan

2.1.2 Jenis-jenis Motif Dasar Batik Besurek 1. Motif Relung Paku

Motif ini menggambarkan keadaan tumbuh-tumbuhan dan keadaan binatang. Sering di gunakan untuk upacara adat cukuran bayi. Gambar 2.1 Motif Relung Paku [4]

2. Motif Bunga Rafflesia

Bunga Rafflesia Arnoldi yang merupakan bunga raksasa khas Bengkulu. Motif bunga rafflesia bisa dibilang sebagai motif utama kain besurek setelah kaligrafi. Gambar 2.2 Motif Bunga Rafflesia [2] Universitas Sumatera Utara

3. Motif Burung Kuau

Motif burung kuau menggambarkan keadaan binatang. Jenis motif ini pada waktu dahulu digunakan pada upacara pernikahan, yaitu pada acara ziarah kubur. Gambar 2.3 Motif Burung Kuau [4]

4. Motif Rembulan

Motif rembulan menggambarkan bahwa segala sesuatu yang ada di dunia ini merupakan ciptaan Tuhan Yang Maha Esa. Motif ini dipakai pada rangkaian pernikahan, yaitu pada acara siraman mandi. Gambar 2.4 Motif Rembulan [4] Universitas Sumatera Utara

2.2 Data Mining

Tan 2006 mendefinisikan data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar [6]. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Salah satu teknik yang dibuat dalam data mining adalah bagaimana menelusuri data yang ada untuk membangun sebuah model,kemudian menggunakan model tersebut agar dapat mengenali pola data yang lain yang tidak berada dalam basis data yang tersimpan. Dalam data mining, pengelompokan data juga bisa dilakukan. Tujuannya adalah agar kita dapat mengetahui pola universal data-data yang ada. Pekerjaan yang berkaitan dengan data mining dapat dibagi menjadi empat kelompok, yaitu model prediksi prediction modelling, analisis kelompok cluster analysis, analisis asosiasi association analysis, dan deteksi anomali anomaly detection. 1. Model Prediksi Prediction Modelling Model prediksi berkaitan dengan pembuatan sebuah model yang dapat melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target pada himpunan baru yang didapat. Ada dua jenis model prediksi, yaitu klasifikasi dan regresi. Klasifikasi digunakan untuk variabel target diskret sedangkan regresi untuk variabel target kontinu. 2. Analisis Kelompok cluster analysis Analisis kelompok melakukan pengelompokan data-data ke dalam sejumlah kelompok cluster berdasarkan kesamaan karakteristik masing-masing data pada kelompok-kelompok yang ada. Data-data yang masuk dalam batas kesamaan dengan kelompoknya akan bergabung dalam kelompok tersebut, dan akan terpisah dalam kelompok yang berbeda jika keluar dari batas kesamaan dengan kelompok tersebut. 3. Analisis Asosiasi Association Analysis Analisis asosiasi digunakan untuk menemukan pola yang menggambarkan kekuatan hubungan fitur dalam data. Pola yang ditemukan biasanya merepresntasikan bentuk aturan implikasi atau subset fitur. Tujuannya adalah untuk menemukan pola yang menarik dengan cara yang efisien. Universitas Sumatera Utara 4. Deteksi Anomali Anomaly Detection Pekerjaan deteksi anomali berkaitan dengan pengamatan sebuah data dari sejumlah data yang secara signifikan mempunyai karakteristik yang berbeda dengan dari sisa data yang lain [6].

2.3 K-Nearest Neighbor K-NN

K-Nearest Neighbor K-NN merupakan sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumnya. K-Nearest Neighbor berdasarkan konsep ‘learning by analogy’. Data learning dideskripsikan dengan atribut numerik n-dimensi. Jika sebuah data uji yang labelnya tidak diketahui diinputkan,maka K-Nearest Neighbor akan mencari k buah data latih yang jaraknya paling dekat dengan data uji dihitung dengan cara mengukur jarak antara titik yang mempresentasikan data latih dengan rumus Euclidean Distance. Pada fase pelatihan untuk data latih, algoritma hanya melakukan penyimpanan vektor- vektor fitur dan klasifikasi data latih. Pada fase klasifikasi, fitur-fitur yang sama dihitung untuk data uji dimana data uji adalah data yang klasifikasinya belum diketahui atau pengujian kembali data latih untuk mengetahui ketepatan klasifikasi. Jarak dari vektor data uji terhadap seluruh vektor data latih dihitung dan sejumlah k buah yang paling dekat diambil. Titik dari data uji klasifikasinya diprediksikan berdasarkan klasifikasi data latih terbanyak dari titik-titik tersebut. K-Nearest Neighbor merupakan teknik klasifikasi yang sederhana, tetapi mempunyai hasil kerja yang cukup bagus. Meskipun begitu, K-NN juga mempunyai kelebihan dan kekurangan [6]. Beberapa karakteristik K-NN adalah sebagai berikut : 1. K-NN merupakan algoritma yang menggunakan seluruh data latih untuk melakukan proses klasifikasi. Hal ini mengaikibatkan proses prediksi yang sangat lama untuk data dalam jumlah yang sangat besar. 2. Algoritma K-NN tidak membedakan setiap fitur dengan suatu bobot. 3. Karena K-NN termasuk lazy learning yang menyimpan sebagian atau semua data, K-NN sangat cepat dalam proses pelatihan tetapi sangat lambat dalam proses prediksi. Universitas Sumatera Utara 4. Hal yang rumit adalah menentukan nilai K yang paling sesuai 5. Karena K-NN pada prinsipnya memilih tetangga terdekat, parameter jarak juga penting untuk dipertimbangkan sesuai dengan kasus datanya.

2.3.1 Algoritma K-NN