Algoritma Analisis Komponen Utama Kernel

21 Gambar 4.1 Visualisasi fungsi kernel Gauss untuk beberapa  Gambar kurva yang memperlihatkan bentuk visualisasi dari kurva fungsi kernel Gauss diperoleh pada nilai  yang berada pada selang    0, max x  . Ketika nilai   max x   , maka kurva yang diperoleh menjadi seperti kurva fungsi kuadratis bahkan untuk  yang cukup besar, kurva menjadi seperti kurva fungsi linear. Selain itu dalam AKU Kernel, fungsi kernel Gauss digunakan untuk menghitung matriks Kernel yang merupakan bentuk dual dari matriks kovarians pada ruang fitur Nielsen Canty 2008. Karena itu pemilihan nilai parameter  sangat menentukan keragaman data pada ruang fitur tersebut. Pemilihan parameter  yang terlalu besar dibanding jarak antarobjek data akan mengakibatkan matriks Kernel yang terbentuk adalah matriks satuan, sehingga objek-objek data pada ruang fitur menjadi terkonsentrasi pada satu titik. Begitu pula, jika dipilih parameter  yang terlalu kecil dibanding jarak antarobjek data, maka matriks Kernel yang terbentuk adalah matriks identitas sehingga mengakibatkan peubah-peubah pada ruang fitur tidak memiliki korelasi sehingga AKU menjadi tidak layak untuk diterapkan. Hal ini mengakibatkan nilai  yang terlalu besar dibanding jarak antarobjek akan membuat peubah pada ruang fitur makin kehilangan keragaman, sedangkan makin kecil ,  makin kecil pula korelasi antarpeubah pada ruang fitur. Oleh karena itu, pada penelitian ini pemilihan parameter  dilakukan pada selang min , max ; i j i j i j         x x x x . Selang interval ini kemudian dipartisi dan setiap titiknya diuji untuk mendapatkan titik yang memberikan nilai parameter  dengan total proporsi salah terkecil. Banyaknya titik pada selang dipilih berdasarkan lebar selang interval. Pada penelitian ini, setiap selang interval dibagi menjadi 200 partisi. Algoritma untuk memilih parameter  yang meminimumkan salah klasifikasi pada interval min , max ; i j i j i j         x x x x diberikan pada Algoritma 3. Algoritma 3 Pemilihan  : Input: data berkelompok Output:  1. Menghitung jarak antarobjek pada data 2. Mendefinisikan interval dari jarak terdekat hingga jarak terjauh 3. Melakukan pereduksian menggunakan AKU Kernel sesuai pers. 23 dengan fungsi kernel Gauss pada pers. 1 untuk setiap nilai  pada interval 4. Untuk setiap objek dari dua komponen utama pertama, diklasifikasikan menggunakan fungsi diskriminan linear Fisher sesuai pers. 35 22 5. Menghitung total proporsi salah klasifikasi AER dengan menggunakan pers. 38 6. Memilih  yang meminimumkan SK 7. Jika ada beberapa titik yang memiliki AER minimum, maka dipilih pada titik- titik tersebut yang memaksimalkan persentase keragaman varians yang diberikan oleh dua komponen utama pertama.

4.2 Hasil Uji Coba dan Analisis

Algoritma 1, algoritma 2 dan algoritma 3 di atas kemudian diaplikasikan pada beberapa data seperti yang tertera pada subbab 3.1. Data-data tersebut divisualisasi menggunakan AKU dan AKU Kernel dan kemudian diklasifikasikan menggunakan fungsi diskriminan linear Fisher untuk melihat keterpisahan secara linear antarkelompok data. 4.2.1 Data Sintetis Wang Data ini terdiri atas 1000 objek dengan 3 peubah dan 2 kelompok data, di mana setiap kelompok data terdiri dari 500 objek. Data ini berbentuk 2 bola. Bola pertama yang berjari-jari 100 digolongkan menjadi data kelompok pertama, sedangkan bola kedua yang berjari-jari 40 digolongkan menjadi data kelompok kedua. Data pada setiap kelompok diperoleh dengan cara membangkitkan bilangan acak pada sistem koordinat bola dengan sudut inklinasi berdistribusi seragam pada interval   0,  dan sudut asimut berdistribusi seragam pada interval   0, 2  . Data ini kemudian ditransformasi ke dalam sistem koordinat Cartesius dan diberi gangguan dengan menggunakan data acak normal yang memiliki simpangan baku satu, sehingga diperoleh data seperti pada Gambar 4.2. Gambar 4.2 Data Sintetis Wang Deskripsi keragaman dari Data Sintetis Wang ini diberikan pada Tabel 4.1 di bawah ini. 23 Tabel 4.1 Deskripsi keragaman Data Sintetis Wang Peubah Varians � 1354.5 � 1601.0 � 2835.7 Data kemudian distandardisasi menjadi data pada Gambar 4.3 untuk menghilangkan dominasi keragaman dari peubah tertentu. Gambar 4.3 Data Sintetis Wang yang telah distandardisasi Gambar 4.2 dan Gambar 4.3 menunjukkan bahwa kedua kelompok tersebut tidak dapat dipisahkan oleh garis linear apapun. Apabila data sintetis ini diklasifikasikan menggunakan analisis diskriminan linear Fisher, maka akan diperoleh fungsi diskriminan linear Fisher seperti yang diberikan pada Tabel 4.2. Tabel 4.2 Fungsi diskriminan linear untuk Data Sintetis Wang Kelompok Fungsi diskriminan linear Fisher 1    1 0.0352 0.0272 0.0021 0.0227 T d              x x 2    2 0.0352 0.0272 0.0021 0.0227 T d               x x Salah klasifikasi dari hasil pengklasifikasian dengan fungsi diskriminan linear pada Tabel 4.2 untuk setiap kelompok diberikan pada Tabel 4.3 di bawah ini. 24 Tabel 4.3 Salah klasifikasi untuk Data Sintetis Wang Kelompok asal Kelompok prediksi Total 1  2  1  277 223 500 2  226 274 500 Total 503 497 1000 Dengan demikian, total persentase salah klasifikasi yang diperoleh adalah sebesar 449 100 44.90 1000   . Data Sintetis Wang ini kemudian direduksi menggunakan AKU sehingga diperoleh dua komponen utama pertama, yaitu KU-1 dan KU-2 untuk divisualisasikan. Hasil visualisasi ditampilkan pada Gambar 4.4. Gambar 4.4 Visualisasi Data Sintesis Wang dengan AKU Pada Gambar 4.4 terlihat bahwa hasil visualisasi dengan menggunakan AKU tidak jauh berbeda dengan plot pencar Data Sintetis Wang baik pada Gambar 4.2 maupun Gambar 4.3. Data hasil visualisasi dengan AKU tetap bersifat tidak terpisah secara linear. Apabila kedua komponen utama hasil pereduksian menggunakan AKU ini diklasifikasikan menggunakan analisis diskriminan linear Fisher, maka akan diperoleh fungsi diskriminan linear Fisher untuk setiap kelompok seperti pada Tabel 4.4. Sementara itu, salah klasifikasi dari hasil pengklasifikasian dengan fungsi diskriminan linear pada Tabel 4.4 untuk setiap kelompok diberikan pada Tabel 4.5.