K-fold Cross Validation Grid Search

j i x x K , adalah dot-product kernel yang didefinisikan sebagai     j i T j i x x x x K    , . Dengan menggunakan langrange multiplier dan kondisi optimalitas, fungsi regresi secara eksplisit dirumuskan sebagai berikut:       1 - , i i i i f x K x x b        7

2.5 K-fold Cross Validation

K-fold cross validation merupakan salah satu variasi dari teknik cross validation. k-fold cross validation dilakukan untuk membagi training set dan test set. Inti validasi tipe ini adalah membagi data secara acak ke dalam k himpunan bagian. k-fold cross validation mengulang k-kali untuk membagi sebuah himpunan contoh secara acak menjadi k subset yang paling bebas, setiap ulangan disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan. Dari k himpunan bagian tersebut dipilih satu himpunan bagian menjadi data uji dan k-1 dijadikan data latih. Proses ini dilakukan berulang sebanyak k, dimana setiap k himpunan bagian yang ada menjadi data uji dan sisanya menjadi data latih. Namun, secara teori tidak ada tolak ukur yang pasti untuk nilai k. Keuntungan k-fold cross validation dibandingkan dengan variasi cross validation seperti Repeated random sub-sampling validation adalah semua data digunakan baik untuk data uji maupun data latih. Ilustrasi proses validasi dapat dilihat pada Gambar 6. Gambar 6 Ilustrasi pembagian kelompok data latih dan uji pada k-cross validation k=6.

2.6 Grid Search

Metode Grid search merupakan salah satu metode yang sederhana untuk mengatasi masalah pengoptimuman Rao, 2009. Metode ini melibatkan penyusunan grid yang cocok dalam suatu ruang dimensi, mengevaluasi fungsi objektif dari seluruh titik grid, dan menemukan titik grid yang sesuai dengan fungsi objektif yang memiliki nilai optimum. Jika batas atas dan batas bawah dari variable ke- diketahui masing-masing sebagai dan , dapat dibagi range , ke dalam -1 bagian yang sama, sehingga , , …, menunjukkan titik- titik grid sumbu = 1,2,3, …, . Gambar 7 Grid dengan = 4 Hal ini menunjukkan kepada total dari , , …, titik grid dalam dimensi ruang. Sebuah grid dengan = 4 ditunjukkan dalam 2 dimensi ruang seperti pada Gambar 7. Sebagai contoh, akan dicari nilai optimum suatu modelfungsi dengan mencari kombinasi parameter-parameter yang memberikan atau dapat mengaprokmasi nilai terbaik misalnya memiliki eror yang paling kecil. Ilustrasi metode grid search terlihat pada Gambar 8. Gambar 8 Ilustrasi metode grid search. Metode grid search memiliki cara kerja yang hampir serupa dengan percobaan secara manual menggunakan teknik trial dan eror. Mencoba kombinasi parameter satu persatu dan membandingkan nilai terbaik yang diberikan oleh parameter tersebut. Namun perbedaan metode grid search terletak pada proses perbandingan nilai yang tidak dilakukan di awal saat terpilihnya pasangan kombinasi parameter. Pasangan kombinasi dari parameter terlebih dahulu disimpan dalam grid-grid. Selanjutnya perbandingan nilai eror terkecil dilihat dari baris dan kolom pada grid tersebut. Baris ke-i dan kolom ke-j yang memiliki nilai terbaik merupakan kombinasi parameter ke-i dan parameter ke-j terpilih.

BAB III DATA DAN METODOLOGI