maupun informasi yang telah di-ekstrak dalam sebuah low dimensional data Hinton, 2006 .
“Kutukan” dan masalah visualisasi ini dianggap menarik oleh penulis, penulis merasa tertantang menemukan cara melakukan reduksi dan visualisasi terhadap
dimensi data yang diolah sehingga sebuah high dimensional data tetap dapat ditemukan decision boundary-nya secara rational dalam sebuah ruang 2 Dimensi.
Penulis memperkenalkan sebuah algoritma bernama Support Vector Backpropagation, sebuah algoritma hasil modifikasi kombinasi Backpropagation dan Support Vector
Machine yang mampu mengubah sebuah high dimensional data menjadi sebuah low dimensional data hanya memiliki 2 attribut sebagai dimensi dalam ruang sebelum
dilakukan proses analisa diskriminan-nya. Backpropagation dipilih oleh penulis dikarenakan tidak adanya algoritma deterministik yang mampu mentransformasikan
sebuah high dimensional data menjadi low dimensional data. Menggunakan algoritma ini sebuah decision boundary dari sebuah high dimensional data akan mungkin
diciptakan dan ditangkap secara visual. Seperti halnya Support Vector Machine, otak manusia juga selalu terbatas pada
ruang 3D. Kita tidak dapat membayangkan dan memahami apapun yang diletakkan dan digambarkan dalam ruang 4D atau lebih.
1.2. Rumusan Masalah
1. Dapatkah Support Vector Backpropagation melakukan proses cluster pada high dimensional dataset?
2. Apakah proses cluster menggunakan dataset yang telah ditransformasikan oleh Support Vector Backpropagation dapat mencapai performa classifier yang
optimal?
Universitas Sumatera Utara
1.3. Batasan Masalah
Batasan masalah dalam penelitian ini adalah:
1. Perbandingan Support Vector Backpropagation hanyalah dengan metode Support Vector Machine.
2. Penelitian ini hanya menggunakan sebuah pengujian, yaitu: Accuracy Test 3. Penelitian ini menggunakan dataset dalam format .mat dan .txt
4. Penelitian ini menggunakan dataset yang telah tersedia dalam UCI Machine Learning Repository, yaitu: Cleveland Heart Disease, Wisconsin
Diagnostic Breast Cancer Dataset, John Hopkins Univesity Ionosphere Dataset, Fisher Iris Dataset.
5. Penelitian ini menggunakan dataset yang telah mengalami pre-processing terlebih dahulu.
6. Penelitian ini bersifat eksperimental, sehingga pembuatan aplikasi bukan priorotas utama.
7. Bahasa pemrograman yang digunakan dalam penelitian ini adalah MATLAB R2010a.
1.4. Tujuan Penelitian
Tujuan penelitian ini adalah untuk mengetahui tingkat ketelitian proses cluster pada high dimensional dataset yang telah ditransformasi menjadi low dimensional dataset
oleh Support Vector Backpropagation.
Universitas Sumatera Utara
1.5. Manfaat Penelitian
Manfaat penelitian ini adalah: 1. Menemukan cara yang lebih efisien dalam melakukan cluster-isasi pada high
dimensional data walaupun jumlah training sample yang tersedia sangat terbatas.
2. Sebagai alternatif feature reduction dalam mengatasi curse of dimensionality pada semua high dimensional data.
1.6. Metodologi Penelitian
Metodologi penelitian yang digunakan dalam penulisan tugas akhir ini adalah sebagai berikut:
a. Studi Literatur
Penulis melakukan studi kepustakan melalui penelitan berupa buku jurnal maupun artikel-artikel yang relevan mengenai Machine Learning, curse of dimensionality,
Backpropagation, Support Vector Machine, high dimensional data, visualisasi.
b. Analisis dan perancangan
Analisis masalah dimulai dengan tahap mengidentifikasi masalah, memahami cara kerja sistem yang akan dibuat, menganalisis dan membuat laporan tentang hasil
analisis, dan perancangan yang dimaksud adalah menggambarkan sistem menggunakan flowchart.
c. Implementasi
Metode ini dilaksanakan dengan mengimplementasikan rancangan sistem yang telah dibuat pada implementasi sistem menggunakan MATLAB R2010a.
Universitas Sumatera Utara
d. Pengujian
Metode ini dilaksanakan dengan melakukan pengujian terhadap sistem yang telah dibangun.
e. Dokumentasi
Metode ini dilaksanakan dengan membuat dokumentasi dalam bentuk laporan tugas akhir.
1.7. Sistematika Penulisan