5. Interpretasi dan profil dari cluster. 6. Menaksir reliabilitas dan validitas.
2.7 Metode Kernel Kernel Methods
2.7.1 Pendahuluan.
Machine learning untuk penelitian pengolah sinyal sangat dipengaruhi oleh metode yang populer kernel Mercer Cristianini Taylor, 2000. Point utama dalam metode
kernel adalah apa yang disebut kernel trick, yang memungkinkan penghitungan dalam beberapa inner product, kemungkinan dengan dimensi yang tidak terbatas,
ruang fitur. Anggaplah x
i
dan x
j
adalah dua point data ruang input. Jika fungsi kernel k .,. memenuhi kondisi Mercer maka
k x
:
i ,
x
j
= {Φx
i
,Φx
j
} 2.4
Dimana .,. menunjukkan inner product, dan Φ . menunjukkan pemetaan
non
-
linier dari ruang input ke ruang fitur kernel. Kernel trick memungkinkan pelaksanaan dari algoritma pembelajaran, yang dinyatakan dalam bentuk inner
product ruang fitur kernel Metode-metode Kernel
. adalah algoritma yang secara implisit melaksanakan,
melalui penggantian inner product dengan Kernel Mercer yang tepat, sebuah pemetaan
nonlinear dari data input ke ruang fitur berdimensi tinggi Vapnik, 1995. Metode- metode kernel yang sangat disupervisi
telah dikembangkan untuk menyelesaikan masalah-masalah klasifikasi dan regresi
K-means adalah algoritma unsupervised learning yang membagi kumpulan data ke dalam sejumlah cluster yang dipilih dibawah beberapa ukuran-ukuran
optimisasi. Sebagai contoh, kita sering ingin meminimalkan jumlah kuadrat dari jarak Euclidean antara sampel dan centroid. Asumsi di belakang ukuran ini adalah
keyakinan bahwa ruang data terdiri dari daerah elliptical yang terisolasi. Meskipun demikian, asumsi tersebut tidak selalu ada pada aplikasi spesifik. Untuk
.
Universitas Sumatera Utara
menyelesaikan masalah ini, sebuah gagasan meneliti ukuran-ukuran lain, misalnya kesamaan kosinus yang digunakan dalam pencarian informasi. Gagasan lain adalah
memetakan data pada ruang baru yang memenuhi persyaratan untuk ukuran optimisasi. Dalam hal ini, fungsi kernel merupakan pilihan yang baik.
2.7.2 Fungsi Kernel Kernel Function
Ada kalanya tidak cukup bagi machine learning untuk bekerja dalam ruang input karena asumsi di belakang mesin tidak menyesuaikan pola riil dari data. Sebagai
contoh, SVM support vector machine dan Perceptron memerlukan data yang tidak dapat dipisahkan secara linear, sedangkan K-means dengan jarak Euclidean
mengharapkan data terdistribusi ke dalam daerah elliptical. Ketika asumsi tersebut tidak digunakan, maka kita dapat menggunakan beberapa jenis transformasi pada data,
dengan memetakan mereka pada ruang baru di mana machine learning dapat digunakan. Fungsi Kernel memberikan kepada kita sebuah alat untuk mendefinisikan
transformasi.
Anggaplah kita diberikan sekumpulan sampel x
1
, x
2
, x
3
,…, x
N
, dimana x
i
ε R
D
, dan fungsi pemetaan
Φ yang memetakan x
i
dari ruang input R
D
pada ruang baru
Q . Fungsi kernel didefinisikan sebagai dot product dalam ruang baru
H x
Q :
i
, x
j
= Φx
i
. Φ x
j
Sebuah fakta 2.5
penting mengenai fungsi kernel adalah bahwa fungsi ini dibangun tanpa mengetahui bentuk konkrit dari
Φ, yaitu, transformasi yang didefinisikan secara implisit. Tiga fungsi kernel yang secara umum tercantum di bawah ini
PolynomialH x :
i
, x
j
= x
i
. x
j
+ 1
d
Radial H x 2.6
i
, x
j
= exp -r || X
i
– X
j
||
2
Neural H x 2.7
i
, x
j
= tanh ax
i
. x
j
Kelemahan utama dari fungsi Kernel meliputi, pertama, beberapa sifat dari ruang baru hilang, misalnya, dimensionalitas dan tingkatan nilainya, sehingga
+ b 2.8
Universitas Sumatera Utara
kekurangan bentuk eksplisit untuk Φ. Kedua, penentuan bentuk kernel yang tepat untuk kumpulan data tertentu harus diwujudkan melalui eksperimen-eksperimen.
Bahkan, biaya penghitungan dan penyimpanan meningkat menurut margin luas.
Universitas Sumatera Utara
2.7.3 Kernel Trick