Klasifikasi dengan Analisis Komponen Utama Kernel

KLASIFIKASI DENGAN
ANALISIS KOMPONEN UTAMA KERNEL

WIRDANIA USTAZA

DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi dengan
Analisis Komponen Utama Kernel adalah benar karya saya dengan arahan dari
komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.

Bogor, Maret 2014

Wirdania Ustaza
NIM G54090057

ABSTRAK
WIRDANIA USTAZA. Klasifikasi dengan Analisis Komponen Utama Kernel.
Dibimbing oleh SISWADI dan TONI BAKHTIAR.
Analisis komponen utama (AKU) merupakan bentuk khusus dari AKU
kernel dengan fungsi kernel linear. Tujuan dari studi ini ialah untuk
menyelesaikan permasalahan data yang tak terpisah secara linear dan
mengklasifikasikan suatu objek ke dalam suatu kelompok menggunakan AKU
kernel sehingga diperoleh salah klasifikasi terkecil. Pengklasifikasian kelompok
menggunakan AKU kernel diselesaikan dengan fungsi kernel linear dan Gauss.
Hasil untuk data pengenalan anggur menunjukkan bahwa fungsi kernel linear dan
Gauss (parameter 2.5) masing-masing memberikan 30.889% dan 17.416% salah
klasifikasi.
Kata kunci: analisis komponen utama, kernel, salah klasifikasi

ABSTRACT

WIRDANIA USTAZA. Classification with Kernel Principal Component
Analysis. Supervised by SISWADI and TONI BAKHTIAR.
Principal component analysis (PCA) is a special case of the kernel PCA
with linear kernel function. The aim of this study is to resolve the data problem
that is not linearly separated and to classify an object into a group by using kernel
PCA to obtain the smallest classification error. Group classification using kernel
PCA is performed by the linear and Gaussian kernel function. The result of the
study shows for wine recognition data with the linear and Gaussian (parameter
2.5) kernel function produces 30.889% and 17.416% classification error,
respectively.
Keywords: principal component analysis, kernel , classification error

KLASIFIKASI DENGAN
ANALISIS KOMPONEN UTAMA KERNEL

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Sains
pada
Program Studi Matematika


DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014

Judul Skripsi : Klasifikasi dengan Analisis Komponen Utama Kernel
Nama
: Wirdania Ustaza
NIM
: G54090057

Disetujui oleh

Prof Dr Ir Siswadi, MSc
Pembimbing I

Dr Toni Bakhtiar, MSc
Pembimbing II


Diketahui oleh

Dr Toni Bakhtiar, MSc
Ketua Departemen

Tanggal Lulus:

Judul Skripsi : Klasifikasi dengan Analisis Komponen Utama Kernel
Nama
: Wirdania Ustaza
NlM
: G54090057

Disetujui oleh

Prof Dr Ir Siswadi, MSc
Pembimbing I

Dr Toni Bakhtiar, MSc

Pembimbing II

L

,

' oS-

Dr Torti Bakhtiar, MSc
Ketua Departemen
/,/

Tanggal Lulus:

0 4 MAR 2014

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian yang dilaksanakan sejak bulan Maret 2013 ini ialah

analisis data, dengan judul Klasifikasi dengan Analisis Komponen Utama Kernel.
Terima kasih penulis ucapkan kepada Bapak Prof Dr Ir Siswadi MSc yang
banyak memberikan saran, waktu, dan arahannya selama ini, terima kasih yaa pak.
Terima kasih penulis ucapkan kepada Bapak Dr Toni Bakhtiar MSc selaku dosen
pembimbing yang telah banyak memberikan saran dan Bapak Ir Ngakan Komang
Khuta Ardana MSc yang telah banyak memberi saran. Ungkapan terima kasih
juga disampaikan kepada Ayahku, Emakku, Ayekku, Maktoku seluruh keluarga
besarku yang sudah memberikan doa dan semangat, kepada Danty, Meliza,
Nindy, Vina, Risa, Ermi, Nisa, Ivon, Dewi, Fitria, Bu Susi, Ratri, Rizka, Nova,
Nuke, Tika, Restu, Janah, Leli, Syahibah, Wanda, Ara, Farel, Iham, Ka Lina atas
perhatian dan kasih sayangnya, serta kepada Evy, Bari, Rudy, Syukrio dan Meda
yang sudah membantu dalam penggunaan software, kepada seluruh sahabat SMP,
SMA, dan seluruh keluarga Matematika IPB, terima kasih atas segala doa dan
kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.
Bogor, Maret 2014
Wirdania Ustaza

DAFTAR ISI
DAFTAR TABEL


vii

DAFTAR GAMBAR

vii

DAFTAR LAMPIRAN

viii

PENDAHULUAN
Latar Belakang
Tujuan Penelitian

1
1
1

TINJAUAN PUSTAKA

Analisis Komponen Utama
Analisis Komponen Utama Kernel

2
2
5

METODE PENELITIAN
Data
Prosedur Analisis Data

9
9
9

HASIL DAN PEMBAHASAN

10

SIMPULAN DAN SARAN

Simpulan
Saran

17
19
19

DAFTAR PUSTAKA
LAMPIRAN

20
21

RIWAYAT HIDUP

29

DAFTAR TABEL
1
2

3
4
5
6
7
8
9
10

Klasifikasi kelompok
Deskripsi data pengenalan anggur
Fungsi kernel yang diaplikasikan
Matriks kovarians
Matriks korelasi
Hasil salah klasifikasi (SK) fungsi Gauss
Hasil pengklasifikasian kelompok data dengan fungsi linear
Hasil pengklasifikasian kelompok data dengan fungsi Gauss
Hasil pengklasifikasian kelompok data dengan fungsi Gauss
Hasil pengklasifikasian kelompok data dengan fungsi Gauss


0 =1
0 =2.5
0 =6

10
12
12
12
13
17
18
18
18
19

DAFTAR GAMBAR
1 Ide dasar AKU kernel
2 Ide utama metode kernel: memetakan data asal ke dimensi lebih tinggi
ruang fitur
3 Plot pencar dari beberapa pasang peubah data pengenalan anggur
4 AKU atau fungsi linear
5 Fungsi Gauss dengan parameter 0 =1
6 Fungsi Gauss dengan parameter 0 =1.25
7 Fungsi Gauss dengan parameter 0 =1.5
8 Fungsi Gauss dengan parameter 0 =1.75
9 Fungsi Gauss dengan parameter 0 =2
10 Fungsi Gauss dengan parameter 0 =2.25
11 Fungsi Gauss dengan parameter 0 =2.5
12 Fungsi Gauss dengan parameter 0 =2.75
13 Fungsi Gauss dengan parameter 0 =3
14 Fungsi Gauss dengan parameter 0 =3.25
15 Fungsi Gauss dengan parameter 0 =3.5
16 Fungsi Gauss dengan parameter 0 =3.75
17 Fungsi Gauss dengan parameter 0 =4
18 Fungsi Gauss dengan parameter 0 =4.25
19 Fungsi Gauss dengan parameter 0 =4.5
20 Fungsi Gauss dengan parameter 0 =4.75
21 Fungsi Gauss dengan parameter 0 =5
22 Fungsi Gauss dengan parameter 0 =5.25
23 Fungsi Gauss dengan parameter 0 =5.5
24 Fungsi Gauss dengan parameter 0 =5.75
25 Fungsi Gauss dengan parameter 0 =6
26 Perbandingan hasil data pengenalan anggur
27 Perbandingan hasil data tanaman iris
28 Grafik kesalahan klasifikasi

5
6
10
13
13
13
13
14
14
14
14
14
14
14
14
15
15
15
15
15
15
15
15
16
16
16
17
18

DAFTAR LAMPIRAN
1 Data pengenalan anggur
2 Data nilai eigen dan vektor eigen

21
26

PENDAHULUAN
Latar Belakang
Analisis data adalah proses penyederhanaan data agar lebih mudah dibaca
dan diinterpretasikan. Ada banyak alat yang dapat digunakan untuk menganalisis
data baik secara manual ataupun dengan bantuan aplikasi komputer. Salah satunya
ialah dengan menggunakan analisis statistika peubah ganda, yang sudah banyak
berkembang di masyarakat. Analisis statistika peubah ganda mampu
mengidentifikasi pola dalam data dan mengekspresikan data sedemikian rupa
sehingga menyorot persamaan dan perbedaannya (Shen 2007). Salah satu cara
dalam analisis statistika peubah ganda yang dapat digunakan untuk melakukan hal
tersebut ialah analisis komponen utama. Analisis komponen utama (AKU)
pertama kali diperkenalkan oleh Karl Pearson pada tahun 1901. AKU sering
digunakan untuk mereduksi dimensi dari suatu matriks data yang terdiri atas
sejumlah besar peubah yang saling berkorelasi menjadi sejumlah kecil peubah dan
tidak saling berkorelasi, dengan tetap mempertahankan sebanyak mungkin
informasi yang terkandung dalam matriks data baru (Jolliffe 2002). AKU
menggunakan kombinasi linear antarpeubah untuk merepresentasikan suatu data.
Namun, kombinasi linear ini tidak dapat memodelkan data yang kompleksitasnya
tinggi dengan hubungan taklinear antarpeubah. Oleh karena itu diperlukan suatu
metode untuk menyelesaikan masalah tersebut yaitu dengan menggunakan AKU
kernel.
AKU merupakan bentuk khusus dari AKU kernel dengan fungsi kernel
linear. Fungsi kernel memetakan data ke dimensi yang lebih tinggi dan
membangun fungsi pemisah dalam ruang yang terpisahkan. Hal ini dilakukan
dengan menghitung fungsi kernel yang memberikan nilai hasil kali dalam pada
ruang fitur tanpa menunjukkan pemetaan secara eksplisit. AKU kernel juga
sebagai metode berbasis memori, yaitu jika x adalah suatu objek maka
menemukan skor untuk objek tersebut dapat menggunakan nilai eigen dan vektor
eigen dari data asal (Nielsen dan Canty 2008). Karena dalam mengklasifikasikan
suatu objek ke dalam suatu kelompok diperlukan beberapa peubah penciri yang
dapat membedakan antara satu kelompok dengan kelompok lainnya, maka atas
dasar inilah AKU kernel dapat digunakan dalam menyelesaikan pengklasifikasian
suatu objek ke dalam suatu kelompok untuk memperoleh salah klasifikasi terkecil.
Tujuan
Karya ilmiah ini bertujuan untuk menyelesaikan permasalahan data yang tak
terpisah secara linear dan mengklasifikasikan suatu objek ke dalam suatu
kelompok menggunakan AKU kernel dengan fungsi kernel linear dan Gauss
sehingga diperoleh salah klasifikasi terkecil.

2

TINJAUAN PUSTAKA
Analisis Komponen Utama
Analisis komponen utama (AKU) adalah bagian dari analisis statistika
peubah ganda yang banyak digunakan sebagai alat analisis pada data. AKU
merupakan suatu teknik analisis data untuk mereduksi dimensi peubah asal yang
saling berkorelasi menjadi peubah baru yang tidak saling berkorelasi sehingga
lebih mudah dalam menjelaskan data yang digunakan.
AKU membentuk peubah baru yang merupakan kombinasi linear dari
seluruh peubah asal, yang disebut komponen utama. Meskipun dibutuhkan p
komponen untuk menunjukkan keseluruhan variasi data, seringkali variasi ini
dapat diwakili oleh k komponen utama, dengan
(Jollife 2002). Sehingga
data asal yang mengandung n objek dengan p peubah dapat direduksi menjadi n
objek dengan k komponen utama pertama.
Misalkan vektor peubah acak � � = 1 , 2 , … ,
memunyai matriks
kovarians Σ dengan nilai eigen �1 �2

0. Misalkan kombinasi

linear 1 � dari vektor � memiliki varians terbesar, dengan 1 merupakan vektor
koefisien �11 , �12 , … , �1 , sehingga

+ �1
= =1 �1 � .
1 � = �11 1 + �12 2 +

Kombinasi linear kedua, 2 �, tidak berkorelasi dengan 1� �. Kombinasi linear ini
memiliki varians terbesar kedua, dan seterusnya, sehingga kombinasi linear ke-k,

�, memiliki varians maksimum ke-k dan tidak berkorelasi dengan 1� �, �2 �
,…, �−1 �. Dengan demikian terdapat vektor bobot yang tidak diketahui � � =
(� 1 , � 2 , … , � ).
Misalkan X memiliki matriks kovarians � dengan elemen � merupakan
kovarians antara peubah ke-i dan peubah ke-j dari X saat ≠ dan varians peubah
ke-j saat = . Jika X memiliki nilai harapan E[X] maka kovarians X ialah
sebagai berikut
cov � = �[ � − � � � − � � � ]

misalkan = � maka

= �[ � � ]= � �[�]
dengan varians sebagai berikut
var
=�
− �[ ]
− �[ ] �

= �[ � � − � � �
� − � �� �]

= �[ � − � � � − � � � ]
= � cov �
= �� .
Untuk menentukan komponen utama pertama, pandang kombinasi linear
pertama 1� � dan vektor 1 yang memaksimumkan var 1 = 1� � 1 . Nilai
var 1 dapat terus membesar bila 1 dikalikan dengan suatu konstanta yang lebih
besar dari satu maka dibutuhkan batasan 1� 1 = 1, yaitu jumlah kuadrat elemen
1 sama dengan 1. Untuk komponen utama pertama yang ingin memaksimumkan
var 1 = var � � = 1� � 1 dengan kendala 1� 1 = 1 dapat diselesaikan
melalui persamaan Lagrange berikut
ℒ 1 , �1 = 1� � 1 − �1 1� 1 − 1

3
dengan �1 adalah pengganda Lagrange, kemudian mencari titik kritis dari
persamaan Lagrange dapat dilakukan dengan cara mencari turunan pertama
terhadap 1 sebagai berikut:
�ℒ
= 2� 1 − 2�1 1 =
� 1
� 1 − �1 1 =
atau
� − �1
1 =
dengan
merupakan matriks identitas berukuran × . Dengan demikian �1
adalah nilai eigen dari � dan 1 merupakan vektor eigen yang bersesuaian. Untuk
menentukan vektor eigen yang memberikan kombinasi linear 1� � dengan varians
terbesar, kuantitas yang akan dimaksimumkan ialah


1 � 1 = 1 �1 1 = �1
Dengan demikian agar var 1 maksimum maka haruslah �1 merupakan nilai
eigen terbesar dari matriks kovarians � dan 1 merupakan vektor eigen yang
bersesuaian dengan nilai eigen �1 terbesar dari �.
Komponen utama kedua, �2 � , memaksimumkan �2 � 2 dengan kendala


2 2 = 1 dan tidak berkorelasi dengan 1 � , atau ekuivalen dengan syarat


cov 1 �, 2 � = 0, dengan cov 1 , 2 menyatakan kovarians antara peubah 1
dan peubah 2 . Diperoleh
cov 1� �, �2 � = 1� � 2 = �2 � 1 = �2 �1 1
= �1 �2 1 = �1 1� 2
(1)

karena �1 ≠ 0 maka 1 2 = 0. Didefinisikan kembali fungsi Lagrange
ℒ ∗ 2 , �2 , � = �2 � 2 − �2 �2 2 − 1 − � 1 � 2 − 0
dengan �2 dan � adalah pengganda Lagrange, untuk mencari titik kritis dapat
diperoleh sebagai berikut
�ℒ ∗

2−� 1 =

Jika persamaan (2) dikalikan dengan 1 didapatkan
2 1� � 2 − 2�2 1� 2 − � 1� 1 = 0
Persamaan (1) menjadikan 1� 2 = 0 dan karena 1� 1 =
� 2

= 2�

2

− 2�2

(2)

1 maka haruslah � = 0,
sehingga persamaan (2) dapat ditulis menjadi
� 2 − �2 2 =
atau
� − �2
2 =
merupakan persamaan eigen dari matriks �. Dengan demikian �2 merupakan nilai
eigen � dan 2 merupakan vektor eigen yang bersesuaian. Untuk menentukan
vektor eigen yang memberikan kombinasi linear �2 � dengan varians terbesar,
kuantitas yang akan dimaksimumkan ialah


2 � 2 = 2 �2 2 = �2 .
Karena nilai eigen terbesar pertama merupakan varians dari komponen utama
pertama maka �2 dipilih nilai eigen terbesar kedua dari matriks �. Demikian juga
dengan vektor eigen 2 merupakan vektor eigen yang bersesuaian dengan nilai
eigen terbesar kedua �2 .
Berdasarkan uraian sebelumnya, dapat ditunjukkan bahwa komponen utama
ketiga, keempat sampai ke-p, vektor koefisien 3 , 4 , … ,
merupakan vektor

4
eigen � yang bersesuaian dengan nilai eigen �3 , �4 , … , � , secara berturut-turut.
Secara umun, komponen utama ke-k dari X adalah � � dan
var[ � � ] = � untuk k = 1, 2,…, p
dengan � merupakan nilai eigen � terbesar ke-k dan
adalah vektor eigen yang
bersesuaian. Total varians yang dijelaskan oleh komponen utama adalah =1 �
sehingga proporsi total varians dari k komponen utama pertama ialah
� 1 +� 2 + +�
× 100%. Belum ada patokan baku berapa batas minimum banyaknya

� 1 +� 2 + +�

komponen utama, sebagian buku menyebutkan 70%, 80%, dan ada yang 90%.
Apabila satuan pengukuran untuk setiap peubah yang diamati tidak sama
dan varians antarpeubah memiliki perbedaan cukup besar yang mengakibatkan
salah satu peubah menjadi dominan dalam menentukan komponen utama maka
biasanya digunakan matriks korelasi � . Bila peubah telah dibakukan sebagai
berikut
1 − �[�]
1 =
�11

�[�]
2
2 =
�22
=


− �[�]


,…,

adalah kombinasi linear dari p
maka komponen utama dari � =
,
peubah baku
= � � = ��
+ ��
+ + ��� �
= 1, 2, … ,
dalam kasus ini �1 , 1 , �2 , 2 , … , � ,
adalah sepasang nilai eigen dan
−1 2
vektor eigen untuk matriks korelasi � = �
�� −1 2 , dengan � −1 2 =
1
1
1
,
,…,
) dan �1 �2

0 (Johnson dan Wichern
diag(
2007).

σ 11

σ 22

σ pp

Misalkan � ∗ adalah matriks data asal dengan n objek dan p peubah.
Selanjutnya matriks � ∗ dikoreksi terhadap rataanya sehingga diperoleh matiks X,
� = − � �∗
1
1, 1, … , 1 � dan matriks identitas. Apabila matriks kovarians
dengan =


populasi � dan matriks korelasi dari populasi � tidak diketahui, maka dapat
diduga dengan matriks kovarians contoh = � � � (� − 1) dan matriks korelasi
1
1
1
−1 2
contoh
= −1 2 −1 2 dengan
= diag( s ,
,…,
) yang
11

s 22

s

berukuran × .
Permasalahan ini biasa disebut juga sebagai formulasi primal. Formulasi
primal sangat baik digunakan saat ukuran �
, sehingga dapat meringkas dalam
menyelesaikan masalah persamaan eigen. Selain formulasi primal dijelaskan pula
tentang formulasi dual. Formulasi dual dianalisis dengan ��� � − 1 yang
berukuran � × � dalam amatan dapat menjadi sangat besar.
Formulasi dual memiliki permasalahan persamaan eigen sebagai berikut:
���
=�
�−1

5
dengan � adalah nilai eigen dan adalah vektor eigen yang bersesuaian dengan
� . Jika persamaan ini dikalikan � � dari kiri maka akan diperoleh
�� �
= � ��
��
�−1
�� �
=�
�−1
proporsional dengan � � , ∝ � � adalah sebuah vektor eigen dari matriks
kovarians � dengan nilai eigen � . Sehingga dalam hal ini nilai eigen yang
diperoleh dari kedua formulasi adalah sama-sama � dan dengan mengasumsikan
vektor eigen adalah vektor satuan 1 = � ∝ � � � � = � − 1 � � =
1 diperoleh
1
=
�� .


�−1 �

Jika � � berpangkat
min⁡
(�, ) , � � � � − 1 dan ��� � − 1
memunyai r nilai eigen taknol � yang sama dan bahwa vektor eigennya saling
� − 1 � . Formulasi dual
terkait yaitu
= ��
� − 1 � dan = �
akan sangat baik digunakan saat �
. Keuntungan lainnya untuk �
adalah

bahwa unsur-unsur dari matriks � = �� , yang mana diketahui sebagai matriks
Gram, terdiri atas produk dalam (inner, dot atau scalar product) dari pengamatan
peubah ganda dalam baris dari X, yaitu � � � (Nielsen dan Canty 2008).
Analisis Komponen Utama Kernel

AKU adalah suatu metode yang biasa digunakan untuk mereduksi dimensi
dari suatu matriks data. AKU menggunakan kombinasi linear antarpeubah untuk
merepresentasikan suatu data, sehingga hanya dapat mengatasi hubungan linear
antarpeubah. Namun, pada kenyataannya banyak data yang memiliki hubungan
taklinear dan tak terpisah antarpeubah.
Diperlukan suatu metode untuk
menunjukkan bentuk taklinear dari AKU, yaitu dengan menggunakan AKU
kernel. Dengan menggunakan fungsi kernel dapat menghitung komponen utama
secara lebih efisien dalam dimensi lebih tinggi ruang fitur (ruang abstrak yang
kadang tidak diketahui hasil pemetaannya). Transformasi dari taklinear di ruang
input menjadi linear di ruang fitur, dijelaskan pada Gambar 1.

Gambar 1 Ide dasar AKU kernel (Sugiyama 2013)
Dalam kondisi tertentu, fungsi-fungsi kernel dapat diartikan mewakili hasil
kali dalam dari objek data dengan pemetaan taklinear secara implisit pada ruang
fitur. Melalui transformasi ini (dari ruang input ke ruang fitur), diharapkan
terdeteksi pola tertentu dalam data (Schölkopf dan Smola 2002).

6
Selanjutnya akan diformulasikan metode kernel. Lambangkan pemetaan dari
ruang input ke ruang fitur dengan
Φ: � → ℋ
� → Φ � ϵ ℋ.
Transformasi dari taklinear dan tak terpisah di ruang input menjadi linear terpisah
di ruang fitur, dijelaskan pada Gambar 2.

Gambar 2 Ide utama metode kernel: memetakan data asal ke dimensi lebih
tinggi ruang fitur (Schölkopf dan Smola 2002)
Sebuah kernel adalah sebuah fungsi k yang untuk semua �, � � � memenuhi
�, � = Φ � , Φ � .
Misalkan pemetaan fitur diberikan sebagai berikut
Φ: � = 1 , 2 → Φ � = 12 , 22 , 2 1 2 � ℋ = ℛ 3
atau
Φ � = 1 , 2 , 3 = 12 , 22 , 2 1 2 .
Pemetaan fitur mengambil data dari dua dimensi ruang input ke tiga dimensi
ruang fitur dengan cara hubungan linear dalam ruang fitur bersesuaian dengan
hubungan kuadrat dalam ruang input. Semua fungsi linear yang dapat diterapkan
dalam ℋ dapat dinyatakan sebagai
� = 11 12 + 22 22 + 12 2 1 2 .
Komposisi dari pemetaan fitur dengan hasil kali dalam pada ruang fitur dapat
dievaluasi sebagai berikut
2 2
2 2
Φ � , Φ(�) =
1 , 2 , 2 1 2 , �1 , �2 , 2�1 �2
= 12 �12 + 22 �22 + 2 1 2 �1 �2
= 1 �1 + 2 �2 2
= �, � 2 .
Karenanya, fungsi
�, � = �, � 2
adalah sebuah fungsi kernel dengan ℋ sebagai ruang fitur yang bersesuaian. Ini
artinya dapat menghitung hasil kali dalam antara proyeksi dari dua titik ke dalam
ruang fitur tanpa mengevaluasi koordinatnya secara eksplisit. Sebelum
menggunakan fungsi kernel, haruslah ditentukan apa bentuk dari fungsi �, �
untuk memastikan bahwa itu adalah kernel untuk beberapa ruang fitur. Oleh
karena itu, perlu diketahui beberapa hal yang berhubungan dengan fungsi kernel
1. Fungsi kernel harus simetrik
�, � = Φ � , Φ � = Φ � , Φ � = �, � .
2. Memenuhi ketaksamaan Cauchy-Schwarz
�, � 2 = Φ � , Φ � 2

7
Φ � 2 Φ � 2
= Φ � ,Φ � Φ � ,Φ �
= �, � �, � .
Diberikan sebuah kernel dan suatu matriks data, yang dapat membentuk
matriks Gram, yang mana berisi evaluasi dari fungsi kernel pada semua pasang
titik data. Diberikan matriks data, � � = �1 , � 2 , … , � � , matriks Gram
dilambangkan oleh G yang didefinisikan sebagai matriks berukuran � × � yang
berelemen
= � , � . Sehingga
digunakan fungsi kernel k untuk
mengevaluasi hasil kali dalam pada ruang fitur dengan pemetaan fitur Φ ,
dihubungkan dengan matriks Gram G yang berelemen
= Φ � ,Φ � = � ,� .
Dalam kasus ini matriks G disebut juga sebagai matriks kernel K. Lambang
standar untuk menggambarkan matriks kernel K adalah sebagai berikut
�1 , � �
�1 , � 2
�1 , �1
�2, ��
�2, �2
� 2 , �1
.
=

�� , ��
�� , �2
� � , �1


Misalkan matriks data, � = �1 , � 2 , … , � � dengan � = 1 , 2 , … ,
,
terdiri atas n objek dan p peubah. Pemetaan ditunjukkan dengan menggunakan
fungsi Φ: ℛ → ℋ, dengan data asal berada dalam ruang ℛ dan fitur dalam ℋ.
Catat bahwa ℋ dapat memunyai perubahan dimensi yang besar dan mungkin tak
terbatas (Shen 2007). Transformasi fungsi Φ mungkin taklinear dan mungkin
tidak dapat dijelaskan secara eksplisit. Pemetaan oleh fungsi Φ terhadap X
sehingga Φ berisi n objek dan q peubah dengan
menghasilkan matriks data
sebagai berikut:
� �1 �

Φ = � �2
.
� �� �
Asumsikan bahwa data dalam ruang fitur memunyai rata-rata nol, sehingga
matriks
kovarians
memiliki
bentuk



yang bersesuaian dengan
=Φ Φ �−1 =1 �−1
=1 � � � �
formulasi primal sebagai berikut:
Φ� Φ = �
dengan menggunakan kembali simbol � dan
sebagai nilai eigen dan vektor
eigen secara berturut-turut dalam ruang ℋ. Untuk formulasi dual yang
bersesuaian diperoleh
ΦΦ�
=�
�−1
dengan menggunakan kembali simbol � dan sebagai nilai eigen dan vektor
eigen secara berturut-turut. Seperti pada AKU nilai eigen taknol untuk formulasi
primal dan dual adalah sama dan vektor eigen dihubungkan dengan
1
Φ�
=
�−1 �
� − 1 � . Pada formulasi dual ΦΦ� diketahui bersesuaian
dan

dengan matriks Gram atau matriks kernel yang berisi elemen dari fungsi kernel.

8
Mengulang kembali masalah persamaan eigen pada formulasi dual, untuk
nilai eigen taknol � dan vektor eigen yang bersesuaian . Dengan mengganti
produk dalam � � � � � dalam ΦΦ� dengan sebuah fungsi kernel � , � =
yang berasal dari beberapa pemetaan Φ, diperoleh
= �−1 �
dengan = ΦΦ� adalah matriks berukuran � × � . Permasalahan nilai eigen
tersebut normalnya diformulasikan tanpa faktor � − 1,
=�
memberikan semua solusi
dari vektor eigen dan (� − 1)� dari nilai eigen.
�.
Sehingga dalam kasus ini = Φ�
� dan = Φ
Untuk menemukan skor komponen utama kernel dari permasalahan nilai
eigen, proyeksikan pemetaan � atas vektor eigen primal
� � � = � � � Φ�


= � � � �1 � � 2 … � � �


= � � � � �1 � � � � � 2 … � � � � � �
=
�, �1
�, � 2 …
�, � �
�.
Pada kenyataannya tidak dapat diasumsikan bahwa data pada ruang fitur sudah
terkoreksi terhadap nilai tengah. Oleh karena itu agar matriks Gram K terkoreksi
− � . Berikut merupakan tiga
terhadap nilai tengah gunakan ∗ = − �
fungsi kernel yang biasa digunakan


Gauss:

� ,�

= exp(−

� −�
0

2

)



polinom: � , � = � � � + 0
sigmoid:
� , � = tanh
� ,� + �
dengan 0 dan � adalah parameter.
Pada dasarnya ada fungsi kernel yang dapat diketahui jenis pemetaannya
pada ruang fitur, misalnya fungsi kernel polinom dengan menggunakan
�, � ∗ = � � � ∗ + 0 2 dengan vektor 2 dimensi � = 1 2 dan � ∗ =


1
2 . Diperoleh sebagai berikut

�, � = � � � ∗ + 0 2
= ( 1 1 ∗ + 2 2 ∗ + 0 )2
= 1 2 1 ∗2 + 2 2 2 ∗2 + 0 2 + 2 1 1 ∗ 2 2 ∗ + 2 1 1 ∗ 0 + 2 2 2 ∗ 0
2 0 2 12 22
2 1 2 ×
= 0 2 0 1



0

2

0 1



2

0 2



1

∗2

2

∗2

2

1



2





= � � � � �∗ .
Terlihat bahwa fungsi kernel memetakan vektor 2 dimensi ke vektor 6 dimensi.
Namun, untuk banyak fungsi kernel fungsi balikan ke � � � � � ∗ tidak mungkin
diperoleh (Nielsen dan Canty 2008). Djakaria et al. (2010) menjelaskan bahwa
fungsi kernel Gauss dengan parameter 0 = 0.001 2 menghasilkan pemisahan
antarkelompok dengan sangat baik untuk data tanaman iris. Sugiyama (2013)
menjelaskan bahwa fungsi kernel Gauss dengan parameter 0 = 3 menghasilkan
pemisahan antarkelompok dengan cukup baik untuk data pengenalan anggur.

9

METODE PENELITIAN
Data
Data yang digunakan dalam penulisan karya ilmiah ini merupakan data
sekunder sebagai data asal yang diperoleh melalui internet yaitu data tanaman iris
(Fisher 1988) dan data pengenalan anggur (Forina 1991). Matriks data tanaman
iris terdiri atas 150 objek dengan 3 kelompok yaitu Iris setosa, Iris virginica, dan
Iris versicolor di mana setiap kelompok terdiri atas 50 objek dengan empat
peubah yaitu panjang sepal, lebar sepal, panjang petal, dan lebar petal. Matriks
data pengenalan anggur terdiri atas 178 objek dengan 3 kelompok di mana setiap
kelompok terdiri atas 59, 71, dan 48 objek untuk kelompok 1, 2, dan 3 secara
berturut-turut, dengan tiga belas peubah yaitu kadar alkohol, kadar asam malat,
banyaknya abu, banyaknya alkali pada abu, kadar magnesium, kadar fenol, kadar
flavonoid, kadar fenol yang bukan flavonoid, kadar proanthosianin, dan kadar
prolina, intensitas warna dan warna berdasarkan tingkat kecerahannya, dan anggur
yang diencerkan pada OD280/OD315 berdasarkan nilai serapannya.
Prosedur Analisis Data
Data asal merupakan data sekunder yang berasal dari data populasi tanaman
iris dan data pengenalan anggur. Analisis data yang pertama dilakukan dalam
karya ilmiah ini ialah mengamati plot pencar antarpeubah yang dihasilkan.
Kemudian data asal distandarisasi. AKU kernel akan dianalisis menggunakan dua
fungsi kernel yaitu linear dan Gauss. Matriks kernel dengan fungsi linear ialah
bersesuaian dengan AKU dalam formulasi dual yaitu dalam bentuk ��� . Matriks
kernel fungsi Gauss= exp −

� −�
0

2

dengan parameter

0=

0.001 2 untuk

data tanaman iris dan 0 = 1, 1.25,…, 6 untuk data pengenalan anggur. Tiga
langkah berikut adalah perlu untuk menunjukkan AKU kernel:
1. Menentukan fungsi kernel yang akan digunakan dalam hal ini linear dan
Gauss, kemudian menghitung hasil kali dalam matriks kernel = ( )
dengan
= � , � = � � , � � . Matriks kernel juga harus
dikoreksi terhadap nilai tengah setiap fungsi dengan ∗ = − �


.
2. Menyelesaikan permasalahan nilai eigen dan vektor eigen dari matriks ∗
dengan persamaan ∗ = � . Kemudian dipilih 2 nilai eigen terbesar
dan vektor eigen yang bersesuaian. Dua nilai eigen ini adalah varians
maksimum dari komponen utama 1 dan komponen utama 2 secara
berturut-turut.
3. Untuk menemukan skor komponen utama kernel dari permasalahan nilai
eigen, proyeksikan pemetaan x atas vektor eigen primal .

� � � = � � � Φ�
=
�, �1
�, � 2 …
�, � �
�.
Selanjutnya visualisasikan plot pencar 2 komponen utama pertama dari masingmasing fungsi dan parameter.

10
Pengklasifikasian kelompok dengan AKU kernel dilakukan menggunakan
kuadrat jarak Euclid untuk ruang dimensi dua dengan menghitung jarak terdekat
antara objek dengan rataan dari setiap kelompok sebagai berikut
� �0, � = �0 − � � �0 − �
dengan � 0 adalah objek pada skor komponen utama dan � adalah rata-rata skor
komponen utama dari data asal pada setiap kelompok. Evaluasi hasil dapat
diperoleh dengan menghitung jumlah salah klasifikasi dari semua kelompok
seperti yang diberikan pada Tabel 1.
Tabel 1 Klasifikasi kelompok
Kelompok
asal
π1
π2
π3

Kelompok prediksi
π1
n11
n21
n31
n.1

π2
n12
n22
n32
n.2

π3
n13
n23
n33
n.3

Total
n1.
n2.
n3.
n = n..

Salah klasifikasi (SK) didefinisikan sebagai
n-

3



=1
SK =
× 100%
n
dengan nkj = banyaknya anggota kelompok k yang diklasifikasikan menjadi
anggota kelompok j.

HASIL DAN PEMBAHASAN
Analisis dilakukan terhadap data populasi tanaman iris dan data pengenalan
anggur. Kedua data digunakan untuk memverifikasi hasil yang diperoleh
menggunakan AKU kernel. Selanjutnya data yang memberikan hasil yang sama
dengan karya ilmiah ini dipilih untuk dianalisis salah klasifikasinya dalam hal ini
data pengenalan anggur. Gambar 3 memvisualisasikan plot pencar dari beberapa
pasang peubah untuk data pengenalan anggur, diambil beberapa pasang peubah
karena dimensi data yang cukup besar. Pada gambar terlihat bahwa plot pencar
hanya terdiri atas satu kelompok yang berisi baik kelompok 1, 2, dan 3 yang tidak
dapat dipisahkan dengan beberapa data menjadi pencilan. Hal ini tidak cukup baik
bila digunakan dalam menganalisis struktur pada data dan akan menyulitkan
dalam pengklasifikasian data objek ke dalam kelompok tersebut, karena akan
menyebabkan salah klasifikasi yang cukup besar. Oleh karena itu, AKU kernel
akan digunakan untuk menyelesaikan permasalahan ini.

11

Gambar 3 Plot pencar dari beberapa pasang peubah data pengenalan anggur
Terlihat dari gambar bahwa hubungan antarpeubah adalah tak terpisah untuk
setiap kelompok. Deskripsi data yang digunakan dapat diamati dalam Tabel 2.
Pemilihan parameter pada fungsi kernel didasarkan pada plot pencar dari setiap
pasang peubah, dengan mencoba-coba beberapa nilai yang berbeda dan dipilih
parameter dengan hasil yang lebih baik. Karena pada dasarnya belum ada
ketentuan nilai parameter untuk setiap fungsi kernel. Tabel 2 menggambarkan
nilai-nilai yang ada dari setiap peubah. Rata-rata dan simpangan baku (SB) dari
setiap peubah akan digunakan untuk standarisasi data. Karya ilmiah ini akan
menggunakan dua fungsi kernel yaitu linear (sesuai dengan AKU) dan Gauss.
Deskripsi kedua fungsi kernel diberikan pada Tabel 3.

12
Tabel 2 Deskripsi data pengenalan anggur
No
.

Peubah

Rata-rata

Maksimum

Minimum

SB ∗

1

Alkohol (Al)

13.0036

14.83

11.03

0.809732

2

Asam malat (AM)

3.409831

192

0.74

14.25921

3

Abu (Ab)

2.36618

3.23

1.36

0.274265

4

Alkali pada abu (AA)

19.43876

30

10

3.414296

5

Magnesium (Mg)

99.71348

162

70

14.27937

6

Total fenol (TF)

2.28864

3.88

0.128

0.642152

7
8

Flavonoid (Fl)
Fenol yang bukan flavonoid (FF)

2.023927
0.372556

5.08
2.58

0.099
0.13

1.006646
0.206944

9
10
11

Proanthosianin (Pa)
Intensitas warna (IW)
Warna (Wa)
Anggur
yang
diencerkan
OD280/OD315 (OD)
Prolina(Pr)

1.590899
5.05809
0.957506

3.58
13
1.71

0.41
1.28
0.48

0.572359
2.318286
0.228484

2.611629

4

1.27

0.710065

746.8933

1680

278

314.9075

12
13

pada

* SB = simpangan baku

Tabel 3 Fungsi kernel yang diaplikasikan
No. Jenis fungsi
1
Linear
2

� ,�

Gauss

Fungsi
� , � = �� �

Par.
-

= exp(− � − �

2

2
0

0

) 1, 1.25,…, 6

Analisis data dilakukan pada data yang telah distandarisasi, atau bersesuaian
dengan matriks korelasi. Hal ini dikarenakan varians setiap peubah memiliki nilai
yang perbedaannya cukup besar, sehingga tanpa distandarisasi analisis hanya akan
terfokus pada peubah dengan varians terbesar. Tabel 4 dan Tabel 5 masing-masig
menjelaskan matriks kovarians dan matriks korelasi.
Tabel 4 Matriks kovarians
No Peubah

Al

AM

Ab

AA

Mg

TF

Fl

FF

Pa

IW

Wa

OD

Pr

1.481

0.047

-0.852

3.180

0.141

0.198

-0.029

0.062

1.022

-0.012 0.041

203.325 0.432

1.654

21.006

0.303

0.744

-0.008

0.264

1.871

-0.022 -0.246 508.050
-0.005 0.001

1

Al

0.656

2

AM

1.481

3

Ab

0.047

0.432

0.075

0.406

1.104

0.023

0.029

0.011

0.001

0.164

4

AA

-0.852

1.654

0.406

11.657

-5.209

-0.655 -1.107

0.243

-0.370

-0.095 -0.189 -0.600 -468.616

5

Mg

3.180

21.006 1.104

-5.209

203.900

2.003

2.628

-0.540

1.941

6.675

0.176

0.665 1775.845

6

TF

0.141

0.303

0.023

-0.655

2.003

0.412

0.554

-0.037

0.222

-0.090

0.063

0.317

99.648

7

Fl

0.198

0.744

0.029

-1.107

2.628

0.554

1.013

-0.063

0.374

-0.385

0.124

0.560

156.148

8

FF

-0.029

-0.008 0.011

0.243

-0.540

-0.037 -0.063

0.043

-0.024

0.014

-0.007 -0.046 -15.218

9

Pa

0.062

0.264

0.001

-0.370

1.941

0.222

0.374

-0.024

0.328

-0.034

0.039

10

IW

1.022

1.871

0.164

-0.095

6.675

-0.090 -0.385

0.014

-0.034

5.374

-0.276 -0.706 230.768

11

Wa

-0.012

-0.022 -0.005

-0.189

0.176

0.063

-0.007

0.039

-0.276

0.052

12
13

OD
Pr

0.124

0.211
0.092

163.394
19.193

59.554
16.999

0.041 -0.246 0.001
-0.600
0.665
0.317 0.560 -0.046 0.211 -0.706 0.092 0.504 69.923
163.394 508.050 19.193 -468.616 1775.845 99.648 156.148 -15.218 59.554 230.767 16.999 69.923 99166.720

13
Tabel 5 Matriks korelasi
No Peubah

Al

AM

Ab

AA

Mg

TF

Fl

FF

Pa

IW

Wa

OD

Pr
0.641

1

Al

1.000

0.128

0.214 -0.308 0.275

0.271

0.243

-0.174

0.133

0.544

-0.064

0.071

2

AM

0.128

1.000

0.110

0.034

0.103

0.033

0.052

-0.003

0.032

0.057

-0.007

-0.024 0.113

3

Ab

0.214

0.110

1.000

0.433

0.282

0.128

0.106

0.196

0.008

0.258

-0.075

0.003

4

AA

-0.308 0.034

0.433

1.000 -0.107

-0.299

-0.322

0.344

-0.189

-0.012

-0.242

-0.248 -0.436

5

Mg

0.275

0.103

0.282 -0.107 1.000

0.218

0.183

-0.183

0.237

0.202

0.054

0.066

0.395

6

TF

0.271

0.033

0.128 -0.299 0.218

1.000

0.858

-0.281

0.605

-0.061

0.430

0.695

0.493

7

Fl

0.243

0.052

0.106 -0.322 0.183

0.858

1.000

-0.300

0.648

-0.165

0.539

0.784

0.493

8

FF

-0.174 -0.003

0.196

0.344 -0.183

-0.281

-0.300

1.000

-0.199

0.029

-0.150

-0.312 -0.234

9

Pa

0.133

0.032

0.008 -0.189 0.237

0.605

0.648

-0.199

1.000

-0.025

0.296

0.519

10

IW

0.544

0.057

0.258 -0.012 0.202

-0.061

-0.165

0.029

-0.025

1.000

-0.522

-0.429 0.316

11

Wa

-0.064 -0.007 -0.075 -0.242 0.054

0.430

0.539

-0.150

0.296

-0.522

1.000

0.565

0.236

12

OD

0.071 -0.024

0.003 -0.248 0.066

0.695

0.784

-0.312

0.519

-0.429

0.565

1.000

0.313

13

Pr

0.641

0.222 -0.436 0.395

0.493

0.493

-0.234

0.330

0.316

0.236

0.313

1.000

0.113

Analisis data menggunakan AKU kernel cukup baik memisahkan
antarkelompok dengan menggunakan dua komponen utama pertama. Walaupun
masih ada sebagian kecil objek antarkelompok yang bercampur. Dari kedua fungsi
yang digunakan terlihat bahwa plot pencar dari dua komponen utama kernel
pertama cukup mampu mengambarkan pola yang terpisah pada data. Gambar
selanjutnya akan memvisualisasikan plot pencar dari dua komponen utama untuk
setiap fungsi kernel.

Gambar 4 AKU atau fungsi linear

Gambar 5 Fungsi Gauss dengan
parameter 0 = 1

Gambar 6 Fungsi Gauss dengan
parameter 0 = 1.25

Gambar 7 Fungsi Gauss dengan
parameter 0 = 1.5

0.222

0.330

14

Gambar 8 Fungsi Gauss dengan
parameter 0 = 1.75

Gambar 9 Fungsi Gauss dengan
parameter 0 = 2

Gambar 10 Fungsi Gauss dengan
parameter 0 = 2.25

Gambar 11 Fungsi Gauss dengan
parameter 0 = 2.5

Gambar 12 Fungsi Gauss dengan
parameter 0 = 2.75

Gambar 13 Fungsi Gauss dengan
parameter 0 = 3

Gambar 14 Fungsi Gauss dengan
parameter 0 = 3.25

Gambar 15 Fungsi Gauss dengan
parameter 0 = 3.5

15

Gambar 16 Fungsi Gauss dengan
parameter 0 = 3.75

Gambar 17 Fungsi Gauss dengan
parameter 0 = 4

Gambar 18 Fungsi Gauss dengan
parameter 0 = 4.25

Gambar 19 Fungsi Gauss dengan
parameter 0 = 4.5

Gambar 20 Fungsi Gauss dengan
parameter 0 = 4.75

Gambar 21 Fungsi Gauss dengan
parameter 0 = 5

Gambar 22 Fungsi Gauss dengan
parameter 0 = 5.25

Gambar 23 Fungsi Gauss dengan
parameter 0 = 5.5

16

Gambar 24 Fungsi Gauss dengan
parameter 0 = 5.75

Gambar 25 Fungsi Gauss dengan
parameter 0 = 6

Dengan menggunakan dua komponen utama pertama, fungsi kernel linear
dan Gauss memberikan hasil pemisahan antarkelompok yang lebih baik jika
dibandingkan dengan plot pencar antarpeubah. Dalam karya ilmiah ini dilakukan
perbandingan pada dua buah data yaitu data tanaman iris dan data pengenalan
anggur. Keduanya memiliki perbandingan dengan artikel dalam jurnal yang
sudah ada, hasilnya dijelaskan dalam Gambar 26 dan 27. Pada data pengenalan
anggur yang dijelaskan dalam Lampiran 1 untuk fungsi Gauss dengan parameter
0 = 3 diperoleh hasil yang cukup baik dan relatif sama dengan yang diperoleh
pada artikel dalam jurnal. Nilai dan vektor eigen untuk 0 = 3 dijelaskan dalam
Lampiran 2.

(a)
(b)
Gambar 26 Perbandingan hasil data pengenalan anggur (a) karya ilmiah
(b) Sugiyama (2013)
Pemisahan data tanaman iris menggunakan AKU kernel sebelumnya telah
dikerjakan dan menghasilkan plot yang berbeda dengan yang dijelaskan oleh
Djakaria et al. (2010). Karena jurnal tersebut hanya menggunakan fungsi kernel
Gauss dengan tidak menjelaskan setiap parameter yang digunakan, sehingga
perbedaan ini sulit diketahui di mana letaknya. Walaupun ada satu parameter yang
dijelaskan yaitu untuk parameter 0 = 0.001 2 namun hasilnya tetap sangat
berbeda.

17

(a)
(b)
Gambar 27 Perbandingan hasil data tanaman iris (a) karya ilmiah
(b) Djakaria et al. (2010)
Karena tidak mungkin kedua hasil benar, maka kemungkinan salah satu ada
yang salah atau kedua-duanya salah. Oleh karena itu diperlukan penelusuran
selanjutnya yang dapat memberikan hasil yang baik dan benar untuk dalam
penggunaan AKU kernel.
Setelah diperoleh hasil pemisahan yang cukup baik antarkelompok,
selanjutnya akan dibahas tentang pengklasifikasian kelompok menggunakan AKU
kernel. Pengklasifikasian ini akan membandingkan dua fungsi kernel yaitu fungsi
linear (bersesuaian dengan AKU) dan Gauss. Analisis data yang dilakukan pada
prosedur analisis data ialah untuk data yang distandarisasi. Pada Tabel 7, 8, 9, dan
10 dijelaskan hasil yang diperoleh menggunakan fungsi kernel linear dan Gauss.
Pada Tabel 6 dijelaskan jumlah kesalahan untuk setiap parameter dari fungsi
Gauss, serta grafiknya.
Tabel 6 Hasil salah klasifikasi (SK) fungsi Gauss
h0

1

1.25

1.5

1.75

2

2.25

2.5

2.75

3

3.25

3.5

SK

58

65

59

37

53

56

31

61

38

38

41

%SK 32.58% 36.51% 33.15% 20.78% 29.77%

31.46%

17.42% 34.27%

21.35%

21.58% 23.03

h0

3.75

4

4.25

4.5

4.75

5

5.25

5.5

5.75

6

SK

66

45

45

47

71

73

52

50

51

70

25.3%

25.3%

26.4%

39.88%

41.01%

29.2%

28.09%

28.65%

39.33%

%SK 37.08%

Semula diperkirakan ada tren kuadrat dari salah klasifikasi yang dapat
digunakan untuk menduga hasil klasifikasi terkecil dengan menggunakan regresi
kuadratik untuk nilai parameter 0 yang digunakan. Namun, hasil yang diperoleh
terlihat pada Gambar 28 yaitu terjadi perubahan banyaknya salah klasifikasi yang
tidak teratur. Selanjutnya akan digunakan AKU kernel untuk menyelesaikan
klasifikasi kelompok. Pada dasarnya studi dilakukan pada fungsi Gauss untuk
parameter 0 = 1, 1.25, …, 6. Namun, untuk memberikan gambaran hasilnya,
dipilih tiga parameter dengan nilai kesalahan yang berbeda-beda yaitu untuk
0 = 1, 2.5, 6.

18

Gambar 28 Grafik kesalahan klasifikasi
Fungsi linear memiliki salah klasifikasi sebesar 30.89%. Terlihat bahwa
salah klasifikasi kelompok menggunakan fungsi ini banyak terdapat pada
kelompok 3. Hal ini terjadi karena antarkelompok ini memang sulit dipisahkan
secara keseluruhan dan juga karena jarak yang berdekatan antarkelompok.
Tabel 7 Hasil pengklasifikasian kelompok data dengan fungsi linear
Kelompok
asal
1
2
3

1
54
4
3

Kelompok prediksi
2
0
47
23

3
5
20
22

Total

SK

59
71
48

5
24
26

Fungsi Gauss dengan parameter 0 = 1 memiliki salah klasifikasi sebesar
32.584%. Terlihat bahwa salah klasifikasi kelompok menggunakan fungsi ini
banyak terdapat pada kelompok 3. Hal ini juga terjadi karena antarkelompok ini
memang sulit dipisahkan secara keseluruhan dan juga karena jarak yang
berdekatan antarkelompok. Hasil ini relatif mirip dengan fungsi kernel linear.
Tabel 8 Hasil pengklasifikasian kelompok data dengan fungsi Gauss
Kelompok
asal
1
2
3

1
43
0
0

Kelompok prediksi
2
16
58
29

3
0
13
19

0

=1

Total

SK

59
71
48

16
13
29

Fungsi Gauss dengan parameter 0 = 2.5 memiliki salah klasifikasi sebesar
17.416%. Terlihat bahwa salah klasifikasi kelompok menggunakan fungsi ini
banyak terdapat pada kelompok 2. Hal ini berbeda dengan yang hasil diperoleh
sebelumnya.
Tabel 9 Hasil pengklasifikasian kelompok data dengan fungsi Gauss
Kelompok
asal
1
2
3

1
54
0
0

Kelompok prediksi
2
0
47
2

3
5
24
46

0=

2.5

Total

SK

59
71
48

5
24
2

Fungsi Gauss dengan parameter 0 = 6 memiliki salah klasifikasi sebesar
39.326%, hasil ini cukup besar bila dibandingkan dengan yang lainnya. Terlihat

19
bahwa salah klasifikasi kelompok menggunakan fungsi ini banyak terdapat pada
kelompok 2. Hasil salah klasifikasi yang dipeoleh cukup besar dan kurang baik
digunakan untuk klasifikasi kelompok.
Tabel 10 Hasil pengklasifikasian kelompok data dengan fungsi Gauss
Kelompok
asal
1
2
3

1
32
41
0

Kelompok prediksi
2
27
28
0

3
0
2
48

0

=6

Total

SK

59
71
48

27
41
0

Pengklasifikasian menggunakan fungsi Gauss dengan menggunakan
parameter 0 = 1, 2.5, 6 memiliki hasil salah klasifikasi sebesar 32.584%,
17.416% dan 39.326% secara berturut-turut. Terlihat bahwa salah klasifikasi
kelompok menggunakan fungsi ini banyak terdapat pada setiap kelompok
bergantung pada parameter. Hal ini terjadi karena dalam pemilihan parameter
untuk fungsi kernel belum ada ketentuannya, hanya disesuaikan berdasarkan hasil
atau tipe plot yang lebih baik.

SIMPULAN DAN SARAN
Simpulan
Visualisasi data menggunakan AKU kernel akan menghasilkan berbagai
bentuk plot pencar untuk dua komponen utama pertama bergantung pemilihan
fungsi kernelnya. Dalam pemilihan fungsi kernel yang tepat akan memberikan
pola linear terpisah pada data sehingga akan mempermudah saat menganalisis.
Hasil untuk data pengenalan anggur menunjukkan bahwa fungsi kernel linear dan
Gauss (parameter 2.5) masing-masing menghasilkan salah klasifikasi sebesar
30.889% dan 17.416%.
Saran
AKU kernel sebagai salah satu teknik penyelesaian dari AKU taklinear
masih belum dapat memisahkan data kelompok yang digunakan dalam karya
ilmiah secara efisien. Karena karya ilmiah ini memiliki perbandingan dengan
artikel dalam jurnal, dengan metode analisis yang sama, namun hasilnya sangat
berbeda untuk data tanaman iris, disarankan untuk mencoba teknik yang sama
untuk menyelesaikan masalah tersebut. Dengan demikian diharapkan dengan
pemisahan yang lebih baik akan menghasilkan tingkat kesalahan yang lebih kecil
lagi dalam pengklasifikasian kelompok.

20

DAFTAR PUSTAKA
Fisher RA. 1988. Iris Plants Database. [Internet]. [diunduh 2014 Jan 20]. Tersedia
pada: http://archive.ics.uci.edu/ml/machine-learning-databases/iris/
iris.data.
Forina M. 1991. Wine Recognition Data. [Internet]. [diunduh 2014 Jan 20].
Tersedia pada: http://archive.ics.uci.edu/ml/machine-learning-databases/wine/
wine.data.
Djakaria I, Guritno S, Kartiko SH. 2010. Visualisasi Data Iris Menggunakan
Analisis Komponen Utama dan Analisis Komponen Utama Kernel. Jurnal Ilmu
Dasar. 11(1):31-38.
Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis. 6th ed.
New Jersey (US): Pearson Education.
Jolliffe IT. 2002. Principal Component Analysis. 2nd ed. New York (US):
Springer-Verlag.
Nielsen AA, Canty MJ. 2008. Kernel Principal Component Analysis for Change
Detection. Image and Signal for Remote Sensing XIV. 7109. Doi:10.1117
/12.800141.
Shen Y. 2007. Outlier Detection Using the Smallest Kernel Principal Component.
Philadelphia (US): Temple University.
Schölkopf B, Smola AJ. 2002. Learning with Kernels. London (UK): The MIT
Press.
Sugiyama M. 2013. Advanced Data Analysis: Kernel PCA. [Internet]. [diunduh
2014 Jan 20]. Tersedia pada: www.ocw.titech.ac.jp/index.php.

21
Lampiran 1 Data pengenalan anggur
No. Kelompok Al

AM

Ab

AA

Mg

TF
2.8

Fl

FF

Pa

WI

Wa

OD

Pr

1

1

14.23 1.71 2.43 15.6

127

3.06 0.28

2.29

5.64

1.04

3.92

1065

2

1

13.2

100 2.65 2.76 0.26

1.28

4.38

1.05

3.4

1050

3

1

13.16 2.36 2.67 18.6

101

0.3

2.81

5.68

1.03

3.17

1185

4

1

14.37 1.95

113 3.85 3.49 0.24

2.18

7.8

0.86

3.45

1480

5

1

13.24 2.59 2.87

118

6

1

14.2

7

1

8

1.78 2.14 11.2
2.5

16.8
21

2.8

2.69 0.39

1.82

4.32

1.04

2.93

735

112 3.27 3.39 0.34

1.97

6.75

1.05

2.85

1450

14.39 1.87 2.45 14.6

96

2.5

2.52

0.3

1.98

5.25

1.02

3.58

1290

1

14.06 3.15 2.61 17.6

121

2.6

2.51 0.31

1.25

5.05

1.06

3.58

1295

9

1

14.83 1.64 2.17

14

97

2.8

2.98 0.29

1.98

5.2

1.08

2.85

1045

10

1

13.86 1.35 2.27

16

98

2.98 3.15 0.22

1.85

7.22

1.01

3.55

1045

11

1

14.1

18

105 2.95 3.32 0.22

2.38

5.75

1.25

3.17

1510

12

1

14.12 1.48 2.32 16.8

95

2.2

2.43 0.26

1.57

5

1.17

2.82

1280

13

1

13.75 1.73 2.41

89

2.6

2.76 0.29

1.81

5.6

1.15

2.9

1320

14

1

14.75 1.73 2.39 11.4

91

3.1

3.69 0.43

2.81

5.4

1.25

2.73

1150

15

1

14.38 1.87 2.38

102

3.3

3.64 0.29

2.96

7.5

1.2

3

1547

16

1

13.63 1.81

0.3

1.46

7.3

1.28

2.88

1310

17

1

14.3

192 2.72

20

120

3.14 0.33

1.97

6.2

1.07

2.65

1280

18

1

13.83 1.57 2.62

20

115 2.95

3.4

0.4

1.72

6.6

1.13

2.57

1130

19

1

14.19 1.59 2.48 16.5

108

3.3

3.93 0.32

1.86

8.7

1.23

2.82

1680

20

1

13.64

116

2.7

3.03 0.17

1.66

5.1

0.96

3.36

845

21

1

14.06 1.63 2.28

126

3

3.17 0.24

2.1

5.65

1.09

3.71

780

22

1

12.93

2.65 18.6

102 2.41 2.41 0.25

1.98

4.5

1.03

3.52

770

23

1

13.71 1.86 2.36 16.6

101 2.61 2.88 0.27

1.69

3.8

1.11

4

1035

24

1

12.85

1.6

95

2.48 2.37 0.26

1.46

3.93

1.09

3.63

1015

25

1

13.5

1.81 2.61

20

96

2.53 2.61 0.28

1.66

3.52

1.12

3.82

845

26

1

13.05 2.05 3.22

25

124 2.63 2.68 0.47

1.92

3.58

1.13

3.2

830

27

1

13.39 1.77 2.62 16.1

93

2.85 2.94 0.34

1.45

4.8

0.92

3.22

1195

28

1

13.3

1.72 2.14

94

2.4

2.19 0.27

1.35

3.95

1.02

2.77

1285

29

1

13.87

1.9

30

1

14.02 1.68 2.21

31

1

13.73

32

1

33

1.76 2.45 15.2

2.16

3.1
3.8

2.3

2.7

16
12
17.2

2.56 15.2
16

2.52 17.8

2.8

107 2.95 2.97 0.37

1.76

4.5

1.25

3.4

915

96

1.98

4.7

1.04

3.59

1035

22.5

101

3.25 0.29

2.38

5.7

1.19

2.71

1285

13.58 1.66 2.36 19.1

106 2.86 3.19 0.22

1.95

6.9

1.09

2.88

1515

1

13.68 1.83 2.36 17.2

104 2.42 2.69 0.42

1.97

3.84

1.23

2.87

990

34

1

13.76 1.53

2.7

19.5

132 2.95 2.74

0.5

1.35

5.4

1.25

3

1235

35

1

13.51

2.65

19

110 2.35 2.53 0.29

1.54

4.2

1.1

2.87

1095

36

1

13.48 1.81 2.41 20.5

100

5.1

1.04

3.47

920

37

1

13.28 1.64 2.84 15.5

38

1

13.05 1.65 2.55

18

39

1

13.07

40

1

1.8

2.7

19.4

112 2.85 2.91

16

1.5

2.8

17

2.8

3.24

2.65 2.33 0.26
3

2.7

2.98 0.26

1.86

110

2.6

2.68 0.34

1.36

4.6

1.09

2.78

880

98

2.45 2.43 0.29

1.44

4.25

1.12

2.51

1105

15.5

98

2.4

2.64 0.28

1.37

3.7

1.18

2.69

1020

14.22 3.99 2.51 13.2

128

3

3.04

2.08

5.1

0.89

3.53

760

1.5

2.1

0.2

22
41

1

13.56 1.71 2.31 16.2

117 3.15 3.29 0.34

2.34

6.13

0.95

3.38

795

42

1

13.41 3.84 2.12 18.8

90 2.45 2.68 0.27

1.48

4.28

0.91

3

1035

43

1

13.88 1.89 2.59

101 3.25 3.56 0.17

1.7

5.43

0.88

3.56

1095

44

1

13.24 3.98 2.29 17.5

103 2.64 2.63 0.32

1.66

4.36

0.82

3

680

45

1

13.05 1.77

107

0.28

2.03

5.04

0.88

3.35

885

46

1

14.21 4.04 2.44 18.9

111 2.85 2.65

0.3

1.25

5.24

0.87

3.33

1080

47

1

14.38 3.59 2.28

16

102 3.25 3.17 0.27

2.19

4.9

1.04

3.44

1065

48

1

13.9

1.68 2.12

16

101

3.39 0.21

2.14

6.1

0.91

3.33

985

49

1

14.1

2.02

18.8

103 2.75 2.95 0.32

2.38

6.2

1.07

2.75

1060

50

1

13.94 1.73 2.27 17.4

108 2.88 3.54 0.32

2.08

8.9

1.12

3.1

1260

51

1

13.05 1.73 2.04 12.4

92 2.72 3.27 0.17

2.91

7.2

1.12

2.91

1150

52

1

13.83 1.65

17.2

94 2.45 2.99 0.22

2.29

5.6

1.24

3.37

1265

53

1

13.82 1.75 2.42

14

111 3.88 3.74 0.32

1.87

7.05

1.01

3.26

1190

54

1

13.77

2.68 17.1

115

3

2.79 0.39

1.68

6.3

1.13

2.93

1375

55

1

13.74 1.67 2.25 16.4

118

2.6

2.9

0.21

1.62

5.85

0.92

3.2

1060

56

1

13.56 1.73

2.4

20.5

116 2.96 2.78

0.2

2.45

6.25

0.98

3.03

1120

57

1

14.22

2.3

16.3

118

3.2

0.26

2.03

6.38

0.94

3.31

970

58

1

13.29 1.97 2.68 16.8

102

3

3.23 0.31

1.66

6

1.07

2.84

1270

59

1

13.72 1.43

108

3.4

3.67 0.19

2.04

6.8

0.89

2.87

1285

60

2

12.37 0.94 1.36 10.6

88 1.98 0.57 0.28

0.42

1.95

1.05

1.82

520

61

2

12.33

101 2.05 1.09 0.63

0.41

3.27

1.25

1.67

680

62

2

12.64 1.36 2.02 16.8

100 2.02 1.41 0.53

0.62

5.75

0.98

1.59

450

63

2

13.67 1.25 1.92

18

94

2.1

1.79 0.32

0.73

3.8

1.23

2.46

630

64

2

12.37 1.13 2.16

19

87

3.5

3.1

0.19

1.87

4.45

1.22

2.87

420

65

2

12.7

19

104 1.89 1.75 0.45

1.03

2.95

1.45

2.23

355

66

2

12.37 1.21 2.56 18.1

98 2.42 2.65 0.37

2.08

4.6

1.19

2.3

678

67

2

13.11 1.01

78 2.98 3.18 0.26

2.28

5.3

1.12

3.18

502

68

2

12.37 1.17 1.92 19.6

78 2.11

2

0.27

1.04

4.68

1.12

3.48

510

69

2

13.34 0.94 2.36

110 2.53

1.3

0.55

0.42

3.17

1.02

1.93

750

70

2

12.21 1.19 1.75 16.8

151 1.85 1.28 0.14

2.5

2.85

1.28

3.07

718

71

2

12.29 1.61 2.21 20.4

103

1.02 0.375

1.46

3.05 0.906

1.82

870

72

2

13.86 1.51 2.67

25

86 2.95 2.86 0.21

1.87

3.38

1.36

3.16

410

73

2

13.49 1.66 2.24

24

87 1.88 1.84 0.27