Algoritma EM Pengembangan Algoritma EM untuk Data Tidak Lengkap (Incomplete Data) pada Model Log-Linear

Pengembangan Algoritma EM untuk Data ... Bidang Statistika 427 Kaidah pengujian yang digunakan adalah jika lebih kecil dari  2 maka H diterima pada taraf nyata  dengan derajat bebas adalah selisih dari derajat bebas kedua model yang dibandingkan.

2.3. Algoritma EM

Algoritma EM adalah salah satu metode yang digunakan secara luas untuk menghitung penduga kemungkinan maksimum dari data yang tidak lengkap Little dan Donald, 1997. Ada dua tahapan dasar dalam algoritma ini, yaitu : 1. Tahapan E Expectation yaitu tahapan mencari nilai harapan bersyarat dari data tidak lengakap dengan syarat data lengkap dan pendugaan parameter dari suatu fungsi kemungkinan | Y l  , yang kemudian nilai harapan yang diperoleh di subsitusikan ke dalam data hilang. Tahapan E dalam EM dapat ditentukan sebagai berikut :       mis t obs mis t dY Y Y f Y l Q , | | |         5 2. Tahapan M dalam algoritma EM menentukan iterasi penentuan nilai penduga terbaru  t+1 dengan memaksimumkan :     1 | | t t t Q Q       6 Untuk semua nilai  Dalam kasus data tidak lengkap pada data kategori, kedua tahapan penting algoritma EM didefinisikan bahwa setiap tahapan E dari algoritma EM menentukan besarnya frekuensi pada sel pengamatan semu dengan mengalokasikan total marginal dari data tidak lengkap ke dalam sel yang tidak terobservasi. Sedangkan tahapan M menghasilkan pendugaan maksimum likelihood dari sel frekuensi pengamatan semu tersebut dengan cara memaksimumkan pendugaan posterior dari parameter model. Kedua tahapan tersebut dilakukan terus menerus hingga pada akhirnya diperoleh nilai dugaan pada tahap M yang konvergen terhadap satu nilai Park dan Morton, 1994. Tahapan pendugaan data hilang dengan algoritma EM, Little dan Donald, 1997 adalah : Kusman Sadik Seminar Nasional Matematika-FKMS3MI 2008 428 1. Menghitung nilai peluang di setiap sel pengamatan dengan menggunakan statistik cukup yang di peroleh dengan pendugaan maksimum likelihood. 2. Menduga nilai harapan di setiap dengan mendistribukan data tidak lengkap ke dalam tiap sel pengamatan berdasarkan proporsi peluangnya. 3. Ulangi langkah 1-2 sampai memperoleh nilai dugaan parameter yang konvergen ke satu nilai tertentu. Setelah diperoleh hasil pendugaan yang konvergen ke satu nilai. Kekonvergenan dapat diartikan bahwa nilai disetiap pengamatan utnuk beberapa iterasi akhir tidak mengalami perubahan. 3. Bahan dan Metode Ilustrasi yang digunakan untuk memahami pendugaan data tidak lengkap dengan metode EM adalah data mengenai status keadaan bayi setelah dilahirkan pada dua klinik berbeda. Peubah yang digunakan dalam penelitian ini yaitu: Peubah Kategori Kode Survival died, survived S Prenatal Care less, more P Clinic A,B C Ringkasan data di tampilkan ke dalam tabel kontingensi tiga arah pada Tabel 1. Ukuran tabel tersebut 2 x 2 x 2. Tabel 1.Tabel Kontingensi Survival S Clinic C Prenatal Care P Died Survived a Data Lengkap A Less 3 176 More 4 293 B Less 17 197 More 2 23 m=715 b Bagian Data Tak Lengkap Less 10 150 More 5 90 r=255 Sumber : Bishop, Fienberg, dan Holland,1998, Tabel 2.4-2. Pengembangan Algoritma EM untuk Data ... Bidang Statistika 429 Total seluruh responden yang berpartisipasi adalah 970 orang m + r = 970, namun hanya 715 terisi lengkap m = 715, sedangkan 255 tidak lengkap r= 225 terhadap peubah clinic C, sehingga 255 data ini yang akan di distribusikan ke dalam sel-sel pengamatan. Metode yang digunakan : 1. Menentukan model terbaik dari data lengkap yang tersedia. 2. Menentukan nilai peluang setiap sel pengamatan. 3. Menentukan nilai harapan setiap sel dengan mendistribusikan data tak lengkap berdasarkan nilai peluangnya, hingga konvergen. 4. Menentukan model terbaik setelah data di perbaiki. 4. Hasil dan Pembahan

4.1. Model Loglinear pada Tabel Kontingensi