berbagai macam fungsi kernel. Kernel trick memberikan berbagai kemudahan, karena dalam proses pembelajaran SVM, untuk menentukan support vector, maka cukup
dengan mengetahui fungsi kernel yang dipakai, dan tidak perlu mengetahui wujud dari fungsi non-linear.
Menurut Karatzouglou, dkk, 2004 ada beberapa fungsi kernel yang sering digunakan dalam literature SVM anatara lain sebagai berikut:
a. Kernel linear adalah kernel yang paling sederhana dari semua fungsi kernel.
Kernel ini biasa digunakan dalam kasus klasifikasi teks. b.
Kernel Radial Basis Gaussian adalah kernel yang umum digunakan untuk data yang sudah valid available dan merupakan default dalam tools SVM.
c. Kernel Polynominal adalah kernel yang sering digunakan untuk klasifikasi
gambar. d.
Kernel Tangent Hyperbolic adalah kernel yang sering digunakan untuk neural networks.
II.4 Receiver Operating Characteristic ROC
Kurva ROC pertama kali digunakan pada perang dunia II untuk menganalisis sinyal radar sebelum dikembangkan dalam signal detection theory. Berdasarkan serangan di
Pearl Harbon tahun 1941, tentara Amerika melakukan riset untuk meningkatkan ketepatan prediksi dalam mendeteksi sinyal radar pesawat Jepang.
Akhir-akhir ini penggunaan kurva ROC semakin popular dalam berbagai aplikasi terutama dalam bidang medis, radiologi, dan processing image. Receiver Operating
Characteristic ROC adalah hasil pengukuran klasifikasi dalam bentuk 2-dimensi. Berikut ada empat peluang yang dapat diformulasikan dalam tabel kontingensi 2 x 2
untuk menganalisis ROC :
Tabel 2.1 Tabel Kontingensi ROC Kelas Sebenarnya
Benar Salah
Kelas Prediksi Positif
Benar Positif Salah Positif
Negatif Benar Negatif
Salah Negatif
Universitas Sumatera Utara
Adapun kriteria ROC adalah sebagai berikut: •
True Positive Rate disebut juga Sensitivity TPR=TPTP+FN •
True Negative Rate disebut juga Specifity TNR= TNTN+FP •
Accuracy = TP+TNTP+FP+TN+FN. Dimana:
TP = True Positive yaitu klasifikasi yang dari kelas yang positif FN = False Negative yaitu kesalahan Type II
FP = False Positive atau kesalahan Type I
Gambar 2.2 Kriteria ROC MedCalc Software bvba, 2010
Jika nilai kriteria yang dipilih lebih tinggi, maka bagian FP akan menurun dan specifity akan meningkat, namun TP dan sensitivity akan menurun. Sebaliknya jika
nilai criteria yang dipilih lebih rendah, maka bagian TP akan meningkat, namun bagian TN dan specificity akan menurun MedCalc Software bvba, 2010.
AUC Area Under Curva adalah luas daerah di bawah kurva ROC.bila nilainya mendekati satu, maka model yang didapat lebih akurat.
Berdasarkan gambar diatas maka dapat dilihat karakteristik dari AUC adalah sebagai berikut:
- Area maksimum adalah 1
- Jika ROC = 0,5 maka model yang dihasilkan belum terlihat optimal
- Sedangkan jika ROC 0,5 maka model yang dihasilkan akan lebih baik
Formula AUC :
Universitas Sumatera Utara
− +
= −
∑ ∑
+ −
− +
= n
n AUC
n i
n j
x f
x f
j i
1 1
1
Keterangan : F. = nilai suatu fungsi
=
− +
x dan
x sampel positif dan negatif
=
− +
n dan
n jumlah sampel positif dan negative
Brefeld, 2005 Penelitian ini menggunakan package caTools dari perangkat lunak R versi
2.13.1 Tuszynski, 2007.
II.5 Implementasi Masalah