12
5. Pilih eigenvector sebanyak k untuk membentuk vektor fitur U, dimana dari vektor
fitur U akan dihasilkan data hasil PCA dengan dimensi k. Pemilihan eigenvector dilakukan berdasarkan nilai eigenvalue dari eigenvector. Akan dipilih eigenvector
dengan nilai eigenvalue tinggi, sehingga informasi data asli tetap akan terjaga pada data hasil PCA. Hal ini dikarenakan eigenvector dengan eigenvalue tinggi
menunjukkan data yang direpresentasikan eigenvector tersebut adalah signifikan. Penentuan nilai dimensi k untuk dataset hasil PCA ditentukan berdasarkan
retain rate. Retain rate adalah persentase informasi yang yang tetap terjaga pada
data hasil PCA dari dataset asli. Pemilihan nilai dimensi k pada umumnya dipilih dengan menjaga retain rate pada nilai 99, yakni memenuhi persamaan 2.7. Hal
ini dilakukan agar seluruh informasi pada dataset asli tetap dapat direpresentasikan oleh dataset hasil PCA.
99 ,
1 1
m i
k i
i
Si S
2.7 S
i
adalah eigenvalue pada posisi ke-i. Seluruh nilai dari eigenvector yang dipilih kemudian disusun sebagai kolom sebuah matriks vektor fitur U.
6. Hasil dataset PCA dihasilkan menggunakan rumus:
X U
Z
T
2.8 , dimana Z merupakan matriks dataset hasil PCA; U adalah matriks vektor hasil
pemilihan eigenvector yang didapatkan pada tahap sebelumnya; X adalah matriks dataset
asli. Metode PCA menghasilkan dataset yang mampu mendeskripsikan dataset asli
dengan tetap menjaga informasi yang tersimpan sebanyak mungkin Amirani, et al. 2008.
2.5. Artificial Neural Network
Negnevitsky 2005 mendefinisikan Artificial Neural Network atau jaringan saraf tiruan sebagai model logika yang bekerja berdasarkan otak manusia. Cara kerja otak
yang dengan menggunakan sejumlah neuron sederhana dan saling terhubung dengan sebuah nilai bobot yang meneruskan signal dari satu neuron menuju neuron lainnya
dapat dimodelkan oleh sebuah jaringan saraf tiruan. Input akan diterima oleh setiap
Universitas Sumatera Utara
13
neuron melalui hubungannya. Sebuah output yang sesuai dengan nilai bobot pada hubungan tersebut akan dihasilkan oleh neuron tersebut, kemudian output akan
diteruskan kembali ke neuron yang lain. Setiap neuron pada jaringan saraf tiruan terdiri dari beberapa layer atau lapisan. Sebuah jaringan saraf tiruan pada umumnya
terdiri dari tiga layer, yakni: input layer yaitu node-node yang menerima signal input, middle layer
yang juga disebut sebagai hidden layer yaitu node yang menghubungkan node
pada input layer dengan node pada output layer, dan output layer yaitu node- node
yang menghasilkan signal output. Jaringan saraf tiruan belajar dengan melakukan penyesuaian nilai bobot yang digunakan untuk mengirimkan nilai dari satu
neuron ke neuron lain. Arsitektur umum dari sebuah jaringan saraf tiruan dapat dilihat pada Gambar 2.3.
Gambar 2.3. Arsitektur Umum Sebuah Jaringan Saraf Tiruan Negnevitsky, 2005
Sebuah fungsi yang disebut sebagai fungsi aktivasi digunakan untuk menentukan output
dari sebuah neuron. Ada empat jenis fungsi aktivasi yang secara umum digunakan, yakni: step function, sign function, sigmoid function, dan linear function.
Setiap jenis fungsi aktivasi berserta grafik yang menggambarkan fungsi dapat dilihat pada Gambar 2.4.
Universitas Sumatera Utara
14
Gambar 2.4. Fungsi Aktivasi Neuron Negnevitsky, 2005
Step function dan sign function disebut sebagai fungsi pembatasan kasar yang
digunakan secara umum pada permasalahan klasifikasi dan pengenalan pola. Sigmoid function
digunakan pada jaringan propagasi balik dan dapat mengubah input yang memiliki jangkauan nilai [-
∞, ∞] menjadi output dengan jangkauan nilai [0,0, 1,0]. Linear
activation function digunakan pada pendekatan linear dan dapat menghasilkan output
yang sama dengan input yang diterima oleh neuron. Jaringan saraf tiruan dapat digunakan untuk dua jenis konsep pembelajaran, yakni:
1. Pembelajaran supervised, yaitu pembelajaran yang dilakukan dengan menerima
sekumpulan contoh yang ditandai sebagai data pelatihan dan membuat prediksi untuk seluruh titik yang tidak diketahui. Pembelajaran ini sudah terlebih dahulu
mengetahui output yang diharapkan berdasarkan input yang diberikan Mohri, et
al., 2012.
2. Pembelajaran unsupervised, yaitu pembelajaran yang dilakukan dengan menerima
sekumpulan data pelatihan yang tidak ditandai dan membuat prediksi untuk seluruh titik yang tidak diketahui. Pembelajaran ini tidak dapat terlebih dahulu
mengetahui output dari input yang diberikan sehingga memerlukan metode lain
untuk mengelompokkan input yang diberikan Mohri, et al., 2012.
2.6. Deep Neural Network