Support Vector Machine Ekstraksi fitur

19 2.6 atau 2.7 Persamaan di atas bisa diselesaikan untukmencari nilai dengan menyelesaikan 2.8 Untuk eigenvalue dan eigenvector dengan solusi adalah eigenvector dan adalah eigenvalue yang terletak dalam span Santoso, 2007

2.3.1.3 Support Vector Machine

Support Vector Machine SVM dikembangkan oleh Boser, Guyon, Vapnik. Pertama kali dipresentasikan pada tahun 1992 di Annual Workshop on Computational Learning Theory. SVM merupakan metode yang berusaha menemukan hyperplane terbaik pada input space. Prinsip dasar SVM adalah pengklasifikasi linier, dan selanjutnya dikembangkan agar dapat bekerja pada permasalahan nonlinier dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi. Nugroho dkk, 2003. Hyperplane batas keputusan pemisah terbaik antara kedua kelas dapat ditemukan dengan mengukur margin dan mencari titik maksimalnya. Margin adalah jarak antara hyperplane tersebut dengan data terdekat dari masing- masing kelas. Data yang paling dekat ini disebut sebagai support vector. 20 Usaha untuk mencari lokasi hyperplane merupakan inti dari proses pelatihan pada SVM. Data latih yang tersedia dinyatakan oleh xi, yi dengan i = 1, 2, …, N, dan xi = xi1, xi2, … xiqT sebagai atribut fitur set untuk data latih yang ke-i, Untuk yi ϵ {-1,+1} menyatakan label kelas. Diasumsikan terpisah oleh hyperplane klasifikasi linear SVM, yang dinotasikan : 2.9 w dan b adalah parameter model. Secara teknis SVM bertujuan menentukan variabel w dan b sehingga data pelatihan dideskripsikan sebagai : 2.10 2.11 Agar SVM dapat bekerja pada permasalahan non-linear, perlu proses pemetaan dengan menggunakan perhitungan dot-product dua buah data pada ruang fitur baru untuk memetakan data ke dimensi yang lebih tinggi. Teknik komputasi ini disebut dengan kernel trick, yaitu menghitung dot-product dua buah vector di ruang dimensi baru dengan menggunakan komponen kedua buah vector tersebut di ruang dimensi asal sebagai berikut: Kx i ,x j =Φx i .Φx j 2.12 21 Dan untuk prediksi pada set data dengan dimensi fitur yang baru diformulasikan : 2.13 N adalah jumlah data yang menjadi support vector, x i adalah support vector, dan z adalah data uji yang akan dilakukan prediksi.

BAB III METODOLOGI PENELITIAN