Algoritma Analisis Komponen Utama

21 Gambar 4.1 Visualisasi fungsi kernel Gauss untuk beberapa  Gambar kurva yang memperlihatkan bentuk visualisasi dari kurva fungsi kernel Gauss diperoleh pada nilai  yang berada pada selang    0, max x  . Ketika nilai   max x   , maka kurva yang diperoleh menjadi seperti kurva fungsi kuadratis bahkan untuk  yang cukup besar, kurva menjadi seperti kurva fungsi linear. Selain itu dalam AKU Kernel, fungsi kernel Gauss digunakan untuk menghitung matriks Kernel yang merupakan bentuk dual dari matriks kovarians pada ruang fitur Nielsen Canty 2008. Karena itu pemilihan nilai parameter  sangat menentukan keragaman data pada ruang fitur tersebut. Pemilihan parameter  yang terlalu besar dibanding jarak antarobjek data akan mengakibatkan matriks Kernel yang terbentuk adalah matriks satuan, sehingga objek-objek data pada ruang fitur menjadi terkonsentrasi pada satu titik. Begitu pula, jika dipilih parameter  yang terlalu kecil dibanding jarak antarobjek data, maka matriks Kernel yang terbentuk adalah matriks identitas sehingga mengakibatkan peubah-peubah pada ruang fitur tidak memiliki korelasi sehingga AKU menjadi tidak layak untuk diterapkan. Hal ini mengakibatkan nilai  yang terlalu besar dibanding jarak antarobjek akan membuat peubah pada ruang fitur makin kehilangan keragaman, sedangkan makin kecil ,  makin kecil pula korelasi antarpeubah pada ruang fitur. Oleh karena itu, pada penelitian ini pemilihan parameter  dilakukan pada selang min , max ; i j i j i j         x x x x . Selang interval ini kemudian dipartisi dan setiap titiknya diuji untuk mendapatkan titik yang memberikan nilai parameter  dengan total proporsi salah terkecil. Banyaknya titik pada selang dipilih berdasarkan lebar selang interval. Pada penelitian ini, setiap selang interval dibagi menjadi 200 partisi. Algoritma untuk memilih parameter  yang meminimumkan salah klasifikasi pada interval min , max ; i j i j i j         x x x x diberikan pada Algoritma 3. Algoritma 3 Pemilihan  : Input: data berkelompok Output:  1. Menghitung jarak antarobjek pada data 2. Mendefinisikan interval dari jarak terdekat hingga jarak terjauh 3. Melakukan pereduksian menggunakan AKU Kernel sesuai pers. 23 dengan fungsi kernel Gauss pada pers. 1 untuk setiap nilai  pada interval 4. Untuk setiap objek dari dua komponen utama pertama, diklasifikasikan menggunakan fungsi diskriminan linear Fisher sesuai pers. 35