Latar Belakang Masalah ESTIMASI PARAMETER MODEL KELAS LATEN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION (EM)

commit to user 1 BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

Secara umum klasifikasi adalah pengelompokan objek ke dalam beberapa kelompok berdasarkan ukuran kemiripan atau ciri-ciri umum antar objek. Dengan klasifikasi diharapkan objek-objek yang ada pada kelompok yang sama memiliki kemiripan yang lebih besar dibandingkan dengan antar objek pada kelompok yang berbeda. Objek dalam hal ini dapat berupa responden, brand atau produk, atau objek pengamatan lainnya. Dalam usaha pengklasifikasian kadang ditemukan objek yang tidak bisa diukur secara langsung. Objek tersebut disebut dengan variabel tidak terukur variabel laten karena variabel tersebut tidak mempunyai nilai kuantitatif. Klasifikasi terhadap variabel laten memerlukan data-data ataupun variabel- variabel yang digunakan sebagai indikator, yang biasa disebut sebagai variabel manifes. Alat statistik yang sering digunakan untuk klasifikasi terhadap variabel laten adalah analisis faktor. Dalam analisis faktor variabel yang diukur disyaratkan bertipe kontinu, padahal dalam kehidupan sehari-hari sering dijumpai data berupa data kategorik, yaitu data yang memiliki ukuran skala yang berupa kategori dan tidak memiliki ukuran kuantitatif. Sebagai contoh, filosofi politik diukur dalam 3 kategori yaitu liberal, moderat dan konservatif. Untuk melakukan klasifikasi pada data kategorik diperlukan suatu alat statistik yaitu analisis kelas laten atau latent class analysis LCA . Dalam analisis kelas laten, estimasi parameter diperlukan untuk mencari estimator dari parameter populasi yang besarnya tidak diketahui. Metode estimasi parameter yang sering digunakan adalah metode estimasi maksimum likelihood karena praktis digunakan untuk mendapatkan estimator yang tidak bias dan bervariansi minimum. Adanya variabel laten mengakibatkan metode estimasi maksimum likelihood tidak bisa digunakan secara langsung, sehingga diperlukan modifikasi atau augmented data agar metode estimasi maksimum likelihood dapat digunakan secara lebih sederhana. commit to user 2 Menurut Andersen [1], terdapat dua metode yang dapat digunakan untuk menyelasaikan estimasi maksimum likelihood pada model kelas laten, yaitu algoritma EM dan algoritma Newton Raphson. Haberman dalam Demster dkk. [4] berpendapat bahwa algoritma EM lebih lambat mencapai konvergen dibandingkan algoritma Newton Raphson, akan tetapi algoritma EM lebih sederhana karena tidak memerlukan matriks turunan kedua dari fungsi likelihood . Dalam analisis kelas laten augmented data dilakukan dengan memasangkan data dari variabel manifes dengan data dari variabel laten. Oleh karena itu, augmented data disebut sebagai data lengkap dan data terobservasi disebut data tidak lengkap karena data dari variabel laten sebagai pasangannya tidak terobservasi. Menurut Demster dkk. [4], algoritma EM digunakan untuk menentukan nilai estimasi maksimum likelihood dari parameter-parameter jika dalam model terdapat data yang tidak lengkap incomplete data . Menurut Linzer dan Lewis [10], model kelas laten adalah model campuran dengan distribusi komponennya berupa tabel kontingensi multinomial dengan semua variabelnya independen. Oleh karena itu, algoritma EM dapat dijalankan memalui pendekatan model campuran. Berdasarkan uraian tersebut, penelitian ini mengkaji ulang estimasi parameter model kelas laten menggunakan algoritma EM melalui pendekatan model campuran mixture model .

1.2 Perumusan Masalah