BAB 2 TINJAUAN PUSTAKA - Deteksi Dan Pencarian Fitur-Fitur Wajah Manusia Dengan Menggunakan Metode Principal Component Analysis (PCA).

BAB 2 TINJAUAN PUSTAKA 2.1. Motion Capture Pada saat ini motion capture banyak ditemukan dalam berbagai bidang,

  terutama pada dunia animasi dalam pembuatan film, industri game, analis bio

  

mekanik dan lain–lain [3]. Dengan semakin berkembangnya industri film dan game

  maka saat ini bidang motion capture telah mengalami perkembangan yang sangat pesat pula. Produk motion capture yang ada saat ini biasanya menggunakan optik, magnetik ataupun alat mekanikal motion capture dengan menggunakan pakaian khusus ataupun marker di seluruh tubuh. motions capture didefinisikan sebagai pembentukan representasi objek 3D secara

  live, game development adalah pasar

  terbesar untuk motion capture dengan pendapatan seperti pendapatan produksi film [1].

  Pada umumnya ada dua tipe utama karakter animasi objek

  3D yang digunakan

  dalam permainan yaitu: real-time playback dan cinematics, real-time playback memungkinkan pemain untuk memilih dari

  pre-created moves, sehingga

  pengendalian bergerak dalam real-time. Sedangkan cinematics adalah animasi full

  

render yang biasa digunakan untuk intro dan cut-scenes dalam game. Cinematics

  umumnya tidak penting untuk game-play, tetapi menambahkan banyak visualisasi ke permainan dan sangat membantu dalam pengembangan cerita. Motion capture banyak digunakan dalam film saat ini,

  motion capture dalam animasi penting untuk menciptakan karakter yang bergerak secara realistis, dalam situasi yang tidak praktis atau terlalu berbahaya untuk aktor. Beberapa karakter film memerlukan penggunaan

  motion capture supaya gerakan animasi tampak nyata [3]. Motion capture dapat

  memberikan penghematan waktu yang besar untuk proyek animasi . Motion capture dapat membuat proses animasi lebih mudah, terutama ketika menciptakan karakter animasi yang realistis, seperti interaksi dari beberapa karakter 3D, atau ketika karakter terlibat dalam aktifitas olahraga. Animasi sederhana, seperti karakter yang sedang berdiri tanpa melakukan hal yang jauh lebih mudah dan lebih realistis ketika menggunakan motion Capture [6].

  2.1.1. Bidang aplikasi

  Video game sering menggunakan motion capture untuk menganimasikan atlet,

  seniman bela diri, dan karakter dalam game, hal ini telah dilakukan sejak game Atari Jaguar berbasis CD Highlander: The Last dari MacLeods, dirilis pada tahun 1995.

  

Motion capture mulai digunakan secara intensif untuk memproduksi film yang

  mensimulasikan tampilan bioskop secara live-action, dengan hasil hampir mendekati fotorealistik dari model karakter digital [9].

  The Polar Express menggunakan motion capture untuk memungkinkan Tom

Hanks dapat tampil beberapa karakter dalam bentuk berbeda. Film adaptasi tentang

Beowulf tahun 2007 adalah karakter animasi digital yang penampilanmnya didasarkan

  sebagian pada para aktor yang memberikan gerakan mereka dan suara. James

  

Cameron's Avatar menggunakan teknik ini untuk menciptakan Na'vi penghuni

  Pandora. Walt Disney Company telah mengumumkan bahwa mereka akan mendistribusikan

  Robert Zemeckis's A Christmas Carol dan Tim Burton's Alice in

Wonderland menggunakan teknik ini. Disney juga telah melakukan akuisisi Zemeckis

Image Movers digital yang memproduksi film motion capture. Film seri televisi yang

  diproduksi sepenuhnya dengan animasi motion capture termasuk Laflaque di Kanada,

  

Sprookjesboom dan Cafe de Wereld di Belanda, dan Headcases di Inggris [9]. Selama

  pembuatan

  film James Cameron's Avatar semua adegan yang dilakukan pada proses

  ini di diarahkan secara realtime dengan menggunakan kostum pada aktor dengan

  

motion cupture yang terlihat seperti di film, sehingga memudahkan Cameron untuk

  mengarahkan film seperti pada viewer. Metode ini memungkinkan Cameron untuk melihat adegan-adegan yang tidak dapat dilihat dari pandangan dan sudut dari animasi.

  2.1.2. Sistem dan metode motion capture

  Motion tracking atau motion capture dimulai sebagai sebuah alat analisis

  fotogrametri dalam penelitian biomekanika pada 1970-an dan 1980-an, dan diperluas ke pendidikan, pelatihan, olahraga, animasi, bioskop, dan video

  game sebagai

  teknologi baru. Seorang aktor memakai penanda atau marker pada masing-masing

  

joint untuk mengidentifikasi gerak seperti pada Gambar 2.1. Akustik, inertial, LED,

marker magnetik atau reflektif, atau kombinasi dari semua gerakan ini diulang

  beberapa kali sesuai dengan tingkat frekuensi yang diinginkan, untuk posisi submillimeter [9].

Gambar 2.1. Reflektif

  marker menempel pada kulit untuk mengidentifikasi landmark

  tulang dan gerakan 3D dari bagian tubuh [9]

  2.1.3. Optical system Sistem

  optik memanfaatkan data yang diambil dari sensor untuk melakukan

tracking pada posisi 3D dari sebuah objek dengan satu atau beberapa kamera yang

  telah dikalibrasi. Pengambilan data secara tradisional dilaksanakan dengan menggunakan marker khusus yang melekat pada aktor yang menyebabkan data yang dihasilkan tidak akurat. Namun dengan sistem terbaru dari optical system mampu menghasilkan data yang akurat dengan melakukan tracking permukaan fitur yang di identifikasi secara dinamis untuk setiap objek. Dalam memperluas area tracking dan daerah

  capture para aktor melakukan dengan penambahan kamera, sistem ini menghasilkan data dengan pergeseran 3 derajat untuk setiap marker [9].

  2.1.4. Marker pasif Sistem marker pasif menggunakan marker yang dilapisi dengan material yang bersifat

  “retroreflective” yang mampu merefleksikan kembali cahaya yang dihasilkan

  dekat dengan lensa kamera. Threshold dari kamera bisa diatur sedemikian rupa hingga hanya cahaya terang hasil refleksi marker yang akan disampel dan tidak melakukan sampling terhadap kulit dan kain yang ada pada aktor.

  Centroid dari marker adalah hasil estimasi dari perhitungan image dua

  dimensi yang ditangkap. Nilai keabuan atau

  graysclae value dari setiap piksel dapat

  digunakan untuk menyediakan akurasi dari sub piksel dengan menemukan centroid dari Gaussian. Sebuah objek dengan posisi marker yang telah diketahui digunakan untuk melakukan kalibrasi kamera dan mendapatkan posisinya dengan distorsi lensa setiap kamera telah diukur [9].

  Secara umum sistem yang ada menggunakan 6 sampai 24 kamera.

  Vendor

  memiliki kendala perangkat lunak untuk mengurangi masalah dari marker swapping karena semua marker tampak identik. Tidak seperti sistem marker aktif dan sistem magnetik, sistem pasif tidak membuat aktor untuk menggunakan kawat atau peralatan elektronik [1].

Gambar 2.2. Contoh beberapa marker ditempatkan di titik-titik tertentu pada tubuh dan wajah aktor selama adegan motion capture [9]

  Sebaliknya, ratusan bola karet melekat dengan selotip reflektif yang perlu diganti secara berkala. Marker biasanya menempel langsung ke kulit seperti dalam biomekanik, atau mereka dipasang pada pakain actor yang mengenakan full body yang dirancang khusus untuk motion capture seperti pada Gambar 2.2 [9].

2.1.5. Marker aktif

  Sistem optikal aktif melakukan triangulasi posisi dengan memperlihatkan satu

  

LED dengan waktu yang sangat cepat atau beberapa LED dengan software untuk

  mengidentifikasi LED terhadap posisi relatif dengan memantulkan kembali cahaya yang dihasilkan secara eksternal, pada marker sendiri mempunyai kemampuan untuk memancarkan cahayanya sendiri. Salah satu penerapan nya adalah pada serial TV ("Stargate SG1") diproduksi menggunakan sistem optik aktif untuk VFX (Visual

  Effects). Aktor harus berjalan di sekitar alat peraga hal ini akan menyulitkan untuk penggunaan sistem

  marker aktif [9].

  2.1.6. Time modulated active marker Sistem marker aktif adalah sistem marker dengan menyalakan satu penanda pada waktu tertentu, atau melakukan tracking beberapa marker dalam waktu tertentu dengan melakukan modulasi dari amplitudo untuk mendapatkan indentitas. Resolusi spasial 12 megapiksel pada sistem yang termodulasi menunjukkan pergerakan lebih halus dari sistem optik 4 megapiksel yang memiliki resolusi yang lebih tinggi. Dengan sistem ini sutradara dapat melihat gerakan aktor secara real time pada

  

motion capture, penempatan marker yang akurat akan mengurangi nilai error

sehingga dapat menghasilkan data yang lebih bersih [1].

  2.1.7. Semi-passive imperceptible marker Sebuah sistem yang didasarkan pada kamera kecepatan tinggi, sistem ini menggunakan multi-LED proyektor berkecepatan tinggi yang murah. Sistem ini dirancang secara khusus pada ruang motion capture. Dibandingkan penggunaan

  

retro-reflektif atau LED marker, sistem ini menggunakan tag marker foto sensitif

  untuk memproses sinyal optik pada poin scene, tag dapat menghitung tidak hanya lokasi pada setiap titik, tetapi juga orientasi, pencahayaan, dan reflektansi [9].

2.1.8. Markerless motion capture

  Teknik dan penelitian dalam visi komputer menuju perkembangan pesat dari pendekatan motion capture beralih ke markerless motion capture, sistem seperti yang dikembangkan di Stanford, University of Maryland, MIT, dan Max Planck Institute dalam melakukan tacking objek tidak memakai peralatan khusus akan tetapi dengan system komputer yang dirancang khusus dan diterapkan pada sistem untuk menganalisisa beberapa aliran

  input optik dan mengidentifikasi bentuk tersebut untuk tracking [10], seperti pada Gambar 2.3.

Gambar 2.3. Contoh aplikasi markerless dalam mendeteksi gerakan ekspresi wajah [ 10]

2.2. Principal Component Analysis (PCA)

  Principal Component Analysis (PCA) adalah teknik reduksi dimensi yang

  umum digunakan pada aplikasi pemorosesan citra dan sinyal processing seperti pada

Gambar 2.4 [4]. Untuk mewakili benda yang mampu terdeformasi, baik dalam 2D dan 3D. Tujuan utama dari PCA adalah untuk pemadatan data atau pengurangan

  dimensi. Komponen yang tidak berkorelasi diberi nama “Principal Component”, yang terbukti sesuai dengan nilai-nilai

  eigen terbesar dan eigen vektor dari matrik varians-kovarians dari data sampel [4]. y arah sebaran titik luas sebaran titik x

Gambar 2.4. Contoh PCA dari distribusi Gaussian multivariat [4]

  Sumbu panjang menunjukkan arah sebaran titik dengan varians terbesar sedangkan sumbu pendek menunjukkan luas sebaran titik, untuk sumbu panjang dijadikan sebagai komponen utama (Principal Component) dan kemudian baru sumbu yang pendek. Principal Component Analysis (PCA) merupakan teknik linier untuk memproyeksikan data vektor yang berdimensi tinggi ke vektor yang mempunyai dimensi lebih rendah, Principal Component Analysis (PCA) lebih banyak digunakan untuk keperluan ektraksi fitur gambar, dimana jumlah dimensi dari gambar jauh lebih besar dibandingkan dengan jumlah data sampel yang digunakan. Untuk melakukan proyeksi sampel vektor dari gambar pelatihan, semua gambar pelatihan disusun dalam bentuk vektor baris. Apabila vektor gambar pelatihan mempunyai dimensi

  mxn

  tersebut diortogonalisasi dengan menentukan eigenvector dan eigenvalue, maka dimensinya akan berubah menjadi mxm, dimana m<n. Pengurangan dimensi yang sangat signifikan ini akan sangat membantu untuk mempercepat proses komputasi saat melakukan klasifikasi fitur. Sebelum klasifikasi fitur dilakukan maka akan dilakukan penyelesaian

  eigenface untuk data pelatihan. Model matrik data pelatihan dapat ditulis dalam persamaan (2.1).

  ............................(2.1) jika

  n>>m dimana n merupakan dimensi gambar, dan m adalah jumlah gambar yang

  dilatih. Berdasarkan persamaan (2.1) maka rata-rata seluruh data sampel dapat dihitung dengan menggunakan persamaan (2.2). Hasil persamaan (2.2) merupakan vektor yang berbasis nilai rata-rata, karena jumlah dimensi adalah n, maka nilai rata- rata seluruh data adalah ( ).

  ............................................................(2.2) Nilai rata-rata nol (zero mean) dari suatu sampel data dapat dihitung dengan mengurangkan nilai masing-masing data sampel dengan rata-rata data jumlah seluruh data sampel. Persoalannya adalah dimensi yang tidak sama antara data sampel (mxn), sedangkan dimensi dari rata-rata seluruh data sampel (1xm). Matrik rata-rata gambar data sampel yang telah digandakan sebanyak m kali dapat ditulis menggunakan persamaan (2.3).

  ................................. (2.3) Dan nilai dari pada baris ke i = nilai baris ke i + 1 dan berlaku , maka hasil persamaan (2.3) dapat digunakan untuk menghitung zero mean. Zero mean data dapat dimodelkan menggunakan persamaan (2.4) [4].

  ...........................................................................(2.4) Atau dapat dimodelkan menggunakan matrik seperti persamaan berikut:

  ..............................................(2.5) Hasil perhitungan zero mean digunakan untuk mendapatkan nilai matrik konvarian selain dapat dimodelkan menggunakan persamaan (2.5), juga dilakukan dengan mengalikan transpos zero mean, seperti pada persamaan (2.6).

  ....................................................(2.6) Matrik konvarian disusun dari nilai-nilai varian yang telah ditentukan, dengan model simetris. Untuk dua parameter yaitu x dan x , maka matrik konvarian dapat

  i i+1

  ditulis seperti pada persamaan (2.4). Untuk 3 parameter dan n parameter persamaan dapat ditulis seperti pada persamaan (2.7) dan (2.8).

  ..................................(2.7)

  ....(2.8) Berdasarkan persamaan (2.8), maka dimensi dari konvarian menjadi mxn, dengan berkurangnya jumlah dimensi yang sangat signifikan pada matrik konvarian, maka akan menyebabkan berkurangnya dimensi pada saat menentukan eigenvector.

  ......(2.9) ............................................. (2.10)

  Untuk mendapatkan ciri dari suatu data sampel yang di representasikan dalam bentuk matrik, maka dihitung eigenvector dan eigenvalue dari matrik konvarian. Jika C adalah matrik bujur sangkar dengan ukuran sembarang m>1, maka vektor tidak nol

  n

  pada R disebut eigenvector dari C jika suatu penggandaan skalar dari , ditunjukan pada persamaan (2.10). Skala tersebut sebagai eigenvalue dari C dan disebut sebagai eigenvector dari C yang berpadanan terhadap , untuk mendapatkan eigenvector dan eigenvalue, maka dapat ditunjukan pada persamaan (2.11).

  ................................................................................. (2.11) .....................................................................(2.12)

  Atau dapat dituliskan menggunakan persamaan (2.13) berikut: ......................(2.13)

  ......................................(2.14) Hasil dari persamaan (2.14) adalah berupa vektor, yaitu

  eigenvalue

  diurutkan secara menurun dari nilai paling besar menuju nilai yang paling kecil . Eigenvector yang bersesuaian dengan nilai terbesar dari

  

eigenvalue mempunyai ciri yang paling dominan, sedangkan nilai eigenvector yang

  bersesuaian dengan

  eigenvalue yang paling kecil mempunyai ciri paling tidak doniman.

  2.3. Active Appearance Models (AAM)

  AAM erat terkait dengan konsep aktif

  blobs dan model morphable, non-linear,

generatif, dan parametrik model dari fenomena visual tertentu untuk memaksimalkan

"match point" antara contoh model dan citra masukan [11,14]. Model parameter yang

  kemudian digunakan dalam aplikasi tertentu. Sebagai contoh, parameter dapat dimasukkan ke classifier untuk menghasilkan algoritma pada pengenalan wajah [12].

  Pendekatan yang biasa secara iteratif memecahkan

  update aditif tambahan untuk

  parameter (bentuk dan koefisien penampilan). Mengingat perkiraan parameter bentuk citra masukan ke koordinat frame model dan kemudian untuk menghitung kesalahan model. AAM merupakan metode pembelajaran statistik, yang dilatih dari sebuah kelas obyek non-rigid dalam hal ini wajah. AAM bekerja dengan fitting model untuk sebuah parameter gambar suatu optimasi pencari jenis obyek [13]. Tujuan dari pencarian ini adalah untuk mencapai deskripsi parameter obyek dalam citra. Active Appearance

  Models memiliki sekumpulan model template deformable, dan dapat dipahami sebagai metode pencocokan template yang canggih [1].

  2.4. Analisis Procrustes

  Korespondensi dan analisis bentuk memainkan peran yang penting dalam bidang komputer vision, tidak hanya dalam menentukan korespondensi, tetapi juga menentukan validitas algoritma yang digunakan untuk menempatkan landmark di lokasi yang akurat. Analisis harus didefinisikan dengan baik sehingga tidak bias dan menyeluruh dalam evaluasi. Procrustes analisis yang digunakan adalah analisis bentuk kaku yang menggunakan skala

  isomorfis, translation, dan rotasi untuk menemukan adanya kesesuaian antara dua atau lebih bentuk landmark. Analisis procrustes adalah orthogonal atau biasa disebut

  Generalized Orthogonal Procrustes Analysis (GPA)

  digunakan untuk korespondensi bentuk karena sifat orthogonal rotasi matriks. Gower telah memerankan peran penting dalam pengenalan dan derivasi dari analisis

  

Procrustes ortogonal pada tahun 1971-1975. Meskipun Hurley dan Cattell pertama

  kali menggunakan istilah analisis procrustes pada tahun 1962 dengan metode yang tidak membatasi untuk transformasi sebuah matriks

  ortogonal [15]. Pada teknik ini mengeksplorasi bentuk dan mempertahankannya.

Tabel 2.1. Algoritma g eneralized orthogonal procrustes analysis (GPA) [15] 1.

  Memililih satu bentuk menjadi bentuk perkiraan rata-rata awal (yaitu set bentuk pertama).

  2. Menyejajarkan posisi bentuk dengan bentuk mean perkiraan.

  a.

  Menghitung centroid masing-masing bentuk (atau sekumpulan Landmark).

  b.

  Menyelaraskan semua bentuk centroid ke bentuk asal.

  c.

  Menormalkan centroid setiap bentuk ukuran.

  d.

  Memutar bentuk masing-masing untuk menyelaraskan dengan rata-rata perkiraan terbaru.

  3. Mengitung rata-rata perkiraan baru dari bentuk selaras.

  4. Jika rata-rata perkiraan dari langkah 2 dan 3 berbeda kembali ke langkah 2, jika tidak, berarti telah menemukan bentuk mean sebenarnya dari himpunan.

  Analisis procrustes memiliki beberapa keunggulan, terutama pada pendekatan proses korespondensi pada bentuk, kompleksitas algoritmanya rendah sehingga memungkinkan untuk diimplementasi dengan mudah. Selain itu

  Generalized

Orthogonal Procrustes Analysis (GPA) merupakan solusi praktis untuk penyelarasan

  obyek yang mirip. Analisis Procrustes adalah cara yang efektif untuk menyesuaikan bentuk bahkan Hurley dan Cattell menulis bahwa analisis procrustes cocok untuk feat brutal terhadap pengambilan hampir semua data [15]. Gambar 2.5 distribusi titik yang merepresentasikan bentuk tangan setelah dilakukan proses rata-rata yang diberikan pada warna merah [15].

  y x

Gambar 2.5. Distribusi titik yang merepresentasikan bentuk tangan setelah dilakukan

  [15]

  proses rata-rata yang diberikan pada warna merah

  2.4.1. Translasi Tahap translasi memindahkan semua bentuk ke pusat dasarnya, titik awalnya adalah (0,0) ini adalah yang paling mungkin untuk mewakili titik pusat umumnya, namun tidak secara eksklusif begitu. Sebagai contoh berikut ini titik asal yang akan menjadi pusat umum.

  .....................................(2.15)

  .......................(2.16)

  Dimana: X: k x m matriks koordinat dari Landmark k dalam dimensi m (m=2 atau 3)

  X c : baru koordinat dari X berpusat pada titik asal Titik pusat dihitung dari jumlah kolom matriks X dibagi dengan jumlah

  

landmark (sejumlah baris). Setelah titik pusat dihitung kemudian mengurangkan titik

pusat dari setiap elemen di pusat akan matriks itu pada titik asal [1].

  2.4.2. Isomorphic Scaling Skala isomorfik adalah teknik manipulasi yang mentransformasikan bentuk yang lebih kecil atau lebih besar sambil mempertahankan rasio proporsi bentuk.

  Normalisasi adalah jenis transformasi isomorfik yang berguna untuk skala bentuk pada ukuran yang sama.

  ..................................................................(2.17) X: koordinat X berpusat pada titik asal Xn: koordinat X berpusat dan normalisasi

  2.4.3. Rotasi Bila matriks telah disesuaikan dan diskalakan selanjutnya akan dilakukan proses rotasi. Pada saat melakukan rotasi perlu dilakukan penyelarasan semua bentuk ke satu bentuk target.

  X: koordinat X berpusat dan normalisasi. Q: rotasi ortogonal matriks untuk menyelaraskan X dengan rata-rata.

  : rata-rata matriks. Rotasi akan menggunakan eucidean/frobenius normal di mana ||A||=trace

  [2]

  . Jadi, akan meminimalkan

  (A'A), yang merupakan jumlah kuadrat dari elemen A

  perbedaan antara rata-rata dan merotasikan bentuk matriks dengan menggunakan jumlah kuadrat.

  ..........................................................(2.18) karena, maka didapatkan persmaan (2.19)

  ........(2.19) Oleh karena bagian pertama tidak mengandung Q, maka:

  ...........................................(2.20) Dengan Menggunakan dekomposisi nilai singular dari dan properti cyclic dari trace maka dapat dilihat pada persamaan ( 2.21).

  …....(2.21)

  

H=V'QU adalah ortogonal (pxp) matriks karena merupakan produk dari orthogonal

matriks. Dengan demikian, memiliki persamaan (2.22).

  ..................................................(2.22) Oleh karena itu, karena s adalah bilangan tidak-negatif dan trace (SH) adalah

  i

  maksimum pada saat h ii = 1 untuk i = 1, 2 ... p (nilai maksimal dari suatu matriks ortogonal), memiliki persamaan (2.23).

  .................................................................(2.23) Sehingga Q minimum

  || XQ - || adalah:

  ............................................................................(2.24) Oleh karena itu rotasi tersebut diselesaikan dengan mengalikan

  VU' ke X matriks agar selaras dengan matrik [1].