commit to user
1
BAB I PENDAHULUAN
1.1 Latar Belakang Masalah
Secara umum klasifikasi adalah pengelompokan objek ke dalam beberapa kelompok berdasarkan ukuran kemiripan atau ciri-ciri umum antar objek. Dengan
klasifikasi diharapkan objek-objek yang ada pada kelompok yang sama memiliki kemiripan yang lebih besar dibandingkan dengan antar objek pada kelompok yang
berbeda. Objek dalam hal ini dapat berupa responden,
brand
atau produk, atau objek pengamatan lainnya.
Dalam usaha pengklasifikasian kadang ditemukan objek yang tidak bisa diukur secara langsung. Objek tersebut disebut dengan variabel tidak terukur
variabel laten karena variabel tersebut tidak mempunyai nilai kuantitatif. Klasifikasi terhadap variabel laten memerlukan data-data ataupun variabel-
variabel yang digunakan sebagai indikator, yang biasa disebut sebagai variabel manifes. Alat statistik yang sering digunakan untuk klasifikasi terhadap variabel
laten adalah analisis faktor. Dalam analisis faktor variabel yang diukur disyaratkan bertipe kontinu,
padahal dalam kehidupan sehari-hari sering dijumpai data berupa data kategorik, yaitu data yang memiliki ukuran skala yang berupa kategori dan tidak memiliki
ukuran kuantitatif. Sebagai contoh, filosofi politik diukur dalam 3 kategori yaitu liberal, moderat dan konservatif. Untuk melakukan klasifikasi pada data kategorik
diperlukan suatu alat statistik yaitu analisis kelas laten atau
latent class analysis LCA
.
Dalam analisis kelas laten, estimasi parameter diperlukan untuk mencari estimator dari parameter populasi yang besarnya tidak diketahui. Metode estimasi
parameter yang sering digunakan adalah metode estimasi maksimum
likelihood
karena praktis digunakan untuk mendapatkan estimator yang tidak bias dan bervariansi minimum. Adanya variabel laten mengakibatkan metode estimasi
maksimum
likelihood
tidak bisa digunakan secara langsung, sehingga diperlukan modifikasi atau
augmented data
agar metode estimasi maksimum
likelihood
dapat digunakan secara lebih sederhana.
commit to user 2
Menurut Andersen [1], terdapat dua metode yang dapat digunakan untuk menyelasaikan estimasi maksimum
likelihood
pada model kelas laten, yaitu algoritma EM dan algoritma Newton Raphson. Haberman dalam Demster dkk. [4]
berpendapat bahwa algoritma EM lebih lambat mencapai konvergen dibandingkan algoritma Newton Raphson, akan tetapi algoritma EM lebih sederhana karena
tidak memerlukan matriks turunan kedua dari fungsi
likelihood
. Dalam analisis kelas laten
augmented
data dilakukan dengan memasangkan data dari variabel manifes dengan data dari variabel laten. Oleh
karena itu,
augmented
data disebut sebagai data lengkap dan data terobservasi disebut data tidak lengkap karena data dari variabel laten sebagai pasangannya
tidak terobservasi. Menurut Demster dkk. [4], algoritma
EM
digunakan untuk menentukan nilai estimasi maksimum
likelihood
dari parameter-parameter jika dalam model terdapat data yang tidak lengkap
incomplete data
. Menurut Linzer dan Lewis [10], model kelas laten adalah model campuran
dengan distribusi komponennya berupa tabel kontingensi multinomial dengan semua variabelnya independen. Oleh karena itu, algoritma
EM
dapat dijalankan memalui pendekatan model campuran.
Berdasarkan uraian tersebut, penelitian ini mengkaji ulang estimasi parameter model kelas laten menggunakan algoritma
EM
melalui pendekatan model campuran
mixture model
.
1.2 Perumusan Masalah