26
Tabel 3.6. Detail Testing Dataset Percobaan Kedua lanjutan Jenis video
Banyak video
Ukuran video minimum byte
Ukuran video maksimum byte
Gerakan tangan atas-bawah 27
89.300 226.000
Gerakan tangan bawah-atas 26
88.700 183.000
3.2. Analisis Sistem
Metode yang diajukan penulis untuk pengenalan gerakan tangan manusia terdiri dari beberapa proses. Proses-proses yang akan dilakukan adalah sebagai berikut:
pengambilan gerakan tangan manusia menggunakan kamera; pegelompokkan video gerakan tangan sesuai dengan jenis gerakan tangan yang ada; 80 dari setiap
kelompok video akan digunakan sebagai training dataset dan 20 sisanya akan digunakan sebagai testing dataset; setiap video gerakan tangan kemudian dipisahkan
menjadi beberapa frame gambar; ukuran setiap gambar terlebih dahulu dikecilkan menggunakan algoritma nearest neighbor; proses grayscalling dilakukan untuk setiap
gambar; proses frame differencing dilakukan pada setiap gambar dengan gambar pertama sebagai pembeda; empat gambar akan dipilih dari kumpulan gambar yang
telah melalui proses frame differencing dan pada keempat gambar tersebut kemudian dilakukan proses PCA; DNN dilatih menggunakan training dataset; DNN yang telah
dilatih kemudian diuji menggunakan testing dataset; DNN kemudian dapat digunakan untuk mengenali gerakan tangan manusia; hasil pengenalan gerakan tangan akan
diimplementasikan untuk mengendalikan aplikasi file explorer, music player, video player
, slideshow dan PDF reader. Arsitektur umum yang mendeskripsikan metodologi pada penelitian ini ditunjukkan pada Gambar 3.1.
Universitas Sumatera Utara
27
Testing Dataset Pre Processing
Perkecil ukuran gambar menggunakan Nearest
Neighbour Grayscaling
Training Dataset
Deep Neural Network yang sudah dilatih
Hasil pengenalan Deep Neural Network
Pengambilan gerakan tangan melalui kamera
Pisahkan video gerakan tangan yang direkam menjadi beberapa
frame gambar
Frame Differencing
File explorer, music player, video player, slideshow dan
PDF reader Implementation
Principal Component Analysis
Gambar 3.1. Arsitektur Umum
3.2.1. Pemisahan video gerakan tangan menjadi beberapa frame gambar
Sebuah video pada dasarnya terdiri atas beberapa gambar. Dengan demikian, setiap video gerakan tangan yang telah direkam harus dipisahkan terlebih dahulu menjadi
beberapa frame gambar sebelum digunakan sebagai input untuk DNN.
3.2.2. Perkecil ukuran gambar menggunakan algoritma neareset neighbor Ukuran setiap gambar dikecilkan menjadi 50 x 23 menggunakan algoritma nearest
neighbor yang telah dibahas pada bagian 2.1. Adapun tujuan dari pengecilan ukuran
gambar adalah untuk mengurangi jumlah parameter yang akan digunakan sebagai input
pada DNN sehingga dapat mempercepat proses pelatihan.
Universitas Sumatera Utara
28
3.2.3. Grayscaling Setelah ukuran gambar dikecilkan, dilakukan proses grayscaling pada gambar.
Grayscalling adalah proses mengubah citra berwarna menjadi citra keabuan. Piksel
gambar yang pada awalnya terdiri atas RGB Red Green Blue akan diubah menjadi satu nilai gray melalui proses grayscaling dengan menggunakan persamaan 2.1.
Proses grayscaling juga bertujuan untuk mengurangi jumlah parameter yang akan digunakan oleh DNN sehingga dapat mempercepat proses pelatihan.
3.2.4. Frame differencing Frame differencing
akan dilakukan pada setiap frame gambar yang telah melalui setiap proses sebelumnya menggunakan persamaan 2.4. Proses frame differencing
dilakukan untuk setiap gambar dengan gambar pertama sebagai pembeda, dengan tujuan untuk menyederhanakan gambar-gambar yang ada dengan menghilangkan
background yang tidak relevan.
Dari kumpulan gambar yang telah melalui proses frame differencing dipilih empat gambar. Pemilihan empat gambar dilakukan dengan selang gambar sebanyak total
gambar yang telah melalui proses frame differencing dibagi dengan lima untuk tiga gambar pertama dan untuk gambar keempat yang dipilih yakni gambar dengan indeks
paling akhir dari total gambar yang telah melalui proses frame differencing, dimana gambar pertama yang telah melalui proses frame differencing tidak diambil karena
gambar pertama berwarna hitam. Hal ini disebabkan karena gambar yang dilakukan frame differencing
dengan gambar itu sendiri tidak memiliki perbedaan sehingga hasil frame differencing
berwarna hitam sepenuhnya.
3.2.5. Principal Component Analysis PCA
Empat gambar frame differencing yang telah dipilih kemudian akan dilakukan proses PCA
sesuai dengan langkah-langkah yang telah dibahas pada bagian 2.4. Proses PCA diterapkan dengan tujuan untuk mengurangi dimensionalitas jumlah piksel dari
empat gambar yang dipilih sehingga dapat mempercepat proses pelatihan. Hasil pengurangan dimensionalitas untuk percobaan pertama dengan enam gerakan tangan
tangan yaitu dari jumlah piksel sebesar 4600 dikurangi menjadi 523 sedangkan untuk percobaan kedua dengan empat gerakan tangan yaitu dari jumlah piksel 4600 menjadi
365. Setiap parameter operasi yang digunakan PCA pada data pelatihan akan
Universitas Sumatera Utara
29
disimpan karena pada data pengujian serta data baru akan menggunakan parameter operasi yang sama pada data pelatihan.
3.2.6. Implementasi Deep Neural Network
Training dataset dan testing dataset yang telah melalui seluruh pre-proses akan
digunakan untuk melatih dan menguji Deep Neural Network DNN. DNN yang diimplementasikan
merupakan Feed-forward
Neural Network
dan dilatih
menggunakan metode backpropagation. Langkah-langkah yang dilakukan pada metode backpropagation dapat dilihat pada bagian 2.7. Adapun parameter pelatihan
yang digunakan untuk DNN pada percobaan dengan enam jenis gerakan tangan pada penelitian ini dapat dilihat pada Tabel 3.7 dan parameter pelatihan untuk percobaan
dengan empat jenis gerakan tangan pada penelitian ini dapat dilihat pada Tabel 3.8.
Tabel 3.7. Nilai Parameter DNN pada Percobaan dengan Enam Gerakan Tangan Parameter
Nomor percobaan 1
2 3
4 5
Banyak neuron pada input layer 523
523 523
523 523
Banyak neuron pada output layer 6
6 6
6 6
Banyak hidden layer 2
2 3
3 4
Banyak neuron pada hidden layer pertama 250
300 200
300 300
Banyak neuron pada hidden layer kedua 50
50 100
150 150
Banyak neuron pada hidden layer ketiga -
- 50
75 100
Banyak neuron pada hidden layer keempat -
- -
- 75
Learning rate 0,01
0,01 0,01
0,01 0,01
Momentum rate 0,0
0,0 0,0
0,0 0,0
Maksimum Epoch 1000 1000
1000 1000 1000
Target error 0,01
0,01 0,01
0,01 0,01
Universitas Sumatera Utara
30
Tabel 3.8. Nilai Parameter DNN pada Percobaan dengan Empat Gerakan Tangan
Parameter Nomor percobaan
1 2
3 4
5
Banyak neuron pada input layer 365
365 365
365 365
Banyak neuron pada output layer 4
4 4
4 4
Banyak hidden layer 2
2 3
3 4
Banyak neuron pada hidden layer pertama 250
300 200
300 300
Banyak neuron pada hidden layer kedua 50
50 100
150 150
Banyak neuron pada hidden layer ketiga -
- 50
75 100
Banyak neuron pada hidden layer keempat -
- -
- 75
Learning rate 0,01
0,01 0,01
0,01 0,01
Momentum rate 0,0
0,0 0,0
0,0 0,0
Maksimum Epoch 100
100 100
100 100
Target error 0,01
0,01 0,01
0,01 0,01
Output yang diharapkan pada pelatihan DNN untuk setiap gerakan tangan pada
percobaan dengan enam jenis gerakan tangan dapat dilihat pada Tabel 3.9. Node pertama pada output layer menunjukkan apakah gerakan tangan merupakan gerakan
tangan dari arah kiri ke kanan. Node kedua pada output layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari arah kanan ke kiri. Node ketiga pada
output layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari
arah atas ke bawah. Node keempat pada output layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari arah bawah ke atas. Node kelima pada output
layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari arah
belakang ke depan. Node keenam pada output layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari arah depan ke belakang.
Universitas Sumatera Utara
31
Tabel 3.9. Target Output untuk Setiap Jenis Gerakan Tangan pada Percobaan dengan Enam Gerakan Tangan
Jenis gerakan tangan Node
1 2
3 4
5 6
Gerakan tangan dari kiri ke kanan 1
Gerakan tangan dari kanan ke kiri 1
Gerakan tangan dari atas ke bawah 1
Gerakan tangan dari bawah ke atas 1
Gerakan tangan dari belakang ke depan 1
Gerakan tangan dari depan ke belakang 1
Output yang diharapkan pada pelatihan DNN untuk setiap gerakan tangan pada
percobaan dengan empat jenis gerakan tangan dapat dilihat pada Tabel 3.10. Node pertama pada output layer menunjukkan apakah gerakan tangan merupakan gerakan
tangan dari arah kiri ke kanan. Node kedua pada output layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari arah kanan ke kiri. Node ketiga pada
output layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari
arah atas ke bawah. Node keempat pada output layer menunjukkan apakah gerakan tangan merupakan gerakan tangan dari arah bawah ke atas.
Tabel 3.10. Target Output untuk Setiap Jenis Gerakan Tangan pada Percobaan dengan Empat Gerakan Tangan
Jenis gerakan tangan Node
1 2
3 4
Gerakan tangan dari kiri ke kanan 1
Gerakan tangan dari kanan ke kiri 1
Gerakan tangan dari atas ke bawah 1
Gerakan tangan dari bawah ke atas 1
3.3. Perancangan Sistem