Pemodelan Loglinier G2 Menggunakan Metode Hirarkis Backward Dan Metode Forward
PEMODELAN LOGLINIER G
2MENGGUNAKAN METODE
HIRARKIS BACKWARD DAN METODE FORWARD
SKRIPSI
SITI FATIMAH S
070803063
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2011
(2)
PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS
BACKWARD DAN METODE FORWARD
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
SITI FATIMAH S 070803063
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2011
(3)
PERSETUJUAN
Judul : PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD
Kategori : SKRIPSI
Nama : SITI FATIMAH S Nomor Induk Mahasiswa : 070803063
Program Studi : SARJANA (S1) MATEMATIKA Departemen : MATEMATIKA
Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA
Diluluskan di Medan, Juni 2011 Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Drs. Pasukat Sembiring, M.Si Dr. Sutarman, M.Sc
NIP. 19531113 198503 1 002 NIP. 19631026 199103 1 001
Diketahui/Disetujui oleh
Departemen Matenatika FMIPA USU Ketua,
Prof. Dr. Tulus, M.Si
NIP. 19620901 198803 1 002
(4)
PERNYATAAN
PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing – masing disebutkan sumbernya.
Medan, Juni 2011
SITI FATIMAH S 070803063
(5)
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga skripsi ini dapat diselesaikan dalam waktu yang telah ditetapkan.
Penulis mengucapkan terima kasih kepada Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU dan Bapak Drs. Pasukat Sembiring, M.Si selaku para dosen pembimbing penulis pada penyelesaian skripsi ini yang telah mengarahkan penulis serta telah meluangkan waktu, tenaga, pikiran, dan bantuannya sehingga skripsi ini dapat selesai dengan tepat waktu. Kemudian ucapan terima kasih juga kepada Bapak Prof. Dr. Tulus, M.Si selaku Ketua Departemen Matematika, Ibu Dra. Mardiningsih, M.Si selaku Sekretaris Departemen Matematika di FMIPA USU dan Bapak Drs. Faigiziduhu Bu’ulolo, M.Si dan Bapak Drs. Suwarno Ariswoyo, M.Si selaku penguji skripsi, serta semua staf pengajar beserta para pegawai pada Departemen Matematika FMIPA USU yang banyak membantu penulis.
Penulis juga mengucapkan terima kasih teristimewa kepada Ayahanda penulis Alm Ir. Zakaria Sihotang dan Ibunda tercinta Adek Palem yang senantiasa memberikan do’a, bantuan serta dorongan dalam penyelesaian skripsi ini. Akhirnya penulis mengucapkan terima kasih kepada Siti Hardianti, Rina, Novi, Dian S, Memel, Kesi, Warsini, Rizky dan teman-teman lain yang tidak dapat penulis sebutkan namanya satu per satu atas bantuannya dalam menyelesaikan skripsi ini serta tidak lupa penulis mengucapkan terima kasih kepada Ibu Nasrah yang juga banyak membantu.
Penulis hanya bisa memanjatkan do’a semoga Allah SWT akan membalas segala kebaikan dan bantuan yang diberikan kepada penulis. Semoga apa yang penulis perbuat akan selalu diridhoi oleh sang pemilik ilmu. Amin Ya Robbal Alamin.
Akhirnya sebagai seorang mahasiswa, penulis menyadari bahwa masih banyak terdapat kekurangan dalam menyelesaikan skripsi ini. Oleh karena itu, kritik dan saran yang membangun diharapkan demi perbaikan skripsi ini.
Medan, Juni 2011 Penulis,
(6)
ABSTRAK
Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.
(7)
LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL
BACKWARD AND FORWARD METHOD
ABSTRACT
Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.
(8)
DAFTAR ISI
Halaman
Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak v
Abstract vi
Daftar Isi vii-viii Daftar Tabel ix
Bab 1 Pendahuluan 1
1.1 Latar Belakang 1
1.2 Rumusan Masalah 3
1.3 Batasan Masalah 3
1.4 Tujuan Penelitian 4
1.5 Kontribusi Penelitian 4
1.6 Metodologi Penelitian 4
1.7 Tinjauan Pustaka 5
Bab 2 Landasan Teori 9
2.1 Analisis Model Loglinier 9
2.1.1 Distribusi Poisson 10
2.1.2 Model Loglinier Poisson 12
2.2 Asumsi Teorikal Untuk Model Loglinier 13
2.3 Tabel Kontingensi 15
2.3.1 Tabel Kontingensi Dua Faktor 15
2.3.2 Tabel Kontingensi Tiga Faktor 18
2.4 Pengujian Kecocokan Model 20
2.5 Seleksi Model 22
2.6 Metode Hirarkis Backward 23
2.7 Metode Forward 23
Bab 3 Pembahasan 24
3.1 Pendekatan Hirarkis untuk Pemodelan Loglinier 24
3.1.1 Model Lengkap 25
3.1.2 Model Non-lengkap 26
3.2 Konfigurasi Model Loglinier Tiga Faktor 27
3.3 Derajat Bebas 28
3.4 Algoritma Backward 28
3.5 Algoritma Forward 30
3.6 Analisis Residu 31
(9)
Bab 4 Kesimpulan dan Saran 47
4.1 Kesimpulan 47
4.2 Saran 48
Daftar Pustaka 49
Lampiran A: Output Nilai G2 dan Estimasi Parameter Untuk Model Lengkap 50 Lampiran B: Output Proses Eliminasi Hirarkis Backward 52 Lampiran C: Output Proses Penambahan Forward Secara Berurutan 54 Lampiran D: Nilai Kritis Distribusi Chi-Square
2 62(10)
DAFTAR TABEL
Halaman
Tabel 2.1 Tabel Kontingensi I × J 16
Tabel 2.2 Tabel Kontingensi I × J × K 18
Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor 27
Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor 28
Tabel 3.3 Tabel Hipotesis Data Untuk Analisis Frekuensi Multifaktor 32
Tabel 3.4 Tabel Proses Eliminasi Hirarkis Backward 35
Tabel 3.5 Tabel Untuk K-faktor dan Efek Order yang Lebih Tinggi 38
Tabel 3.6 Tabel Asosiasi Parsial 40
Tabel 3.7 Tabel Proses Penambahan Forward Secara Berurutan 42
Tabel 3.8 Tabel Residu Untuk Model Akhir 46
(11)
ABSTRAK
Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.
(12)
LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL
BACKWARD AND FORWARD METHOD
ABSTRACT
Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.
(13)
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Model Loglinier adalah salah satu kasus khusus dari general linier model untuk data yang berdistribusi poisson. Model loglinier juga disebut sebagai suatu model statistik yang berguna untuk menentukan depedensi (kecenderungan) antara beberapa variabel yang berskala kategorik. Variabel didefinisikan sebagai suatu yang beragam atau bervariasi dan skala kategorik merupakan transformasi fungsi nilai dari empat skala ukuran observasi yang ada yaitu skala nominal, ordinal, rasio dan interval. Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi. Tabel kontingensi digunakan jika terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam daftar baris dan kolom. Variabel kategorik yang ada dianalisis dengan mengambil nilai logaritma natural dari frekuensi untuk setiap sel dalam tabel kontingensi. Dari tabel kontingensi yang terbentuk, model loglinier akan menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Model loglinier tidak hanya dapat digunakan untuk menganalisis hubungan yang terjadi antar dua variabel kategorik, tetapi juga dapat digunakan untuk mengevaluasi tabel kontingensi multifaktor yang meliputi tiga variabel atau lebih.
Model loglinier sangat bergantung pada jumlah variabel yang akan dianalisis. Penggunaan variabel yang dibahas pada penulisan ini dikelompokkan pada dua jenis yaitu variabel dependen dan variabel independen. Variabel dependen adalah variabel yang keberadaannya dipengaruhi oleh variabel lainnya. Sedangkan variabel independen yaitu variabel yang bebas (tidak dipengaruhi oleh variabel lainnya).
(14)
Analisis loglinier digunakan untuk menganalisis pola hubungan antar sekelompok variabel kategorik yang mencakup mulai dari asosiasi satu variabel, asosiasi dua variabel, asosiasi tiga variabel atau lebih, baik secara simultan maupun secara parsial. Pola hubungan antar variabel dapat dilihat dari interaksi antar variabel itu sendiri, termasuk kemungkinan adanya hubungan sebab akibat atau hubungan kausal diantara variabel – variabel yang ada.
Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang diselidiki mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata lain, tidak ada pembedaan yang dibuat antara variabel dependen dan variabel independen karena model loglinier hanya menunjukkan depedensi (kecenderungan) antar variabel. Andaikan terdapat pembedaan yang dibuat antara satu atau lebih variabelnya yang diperlakukan sebagai variabel independen dan variabel lainnya sebagai variabel dependen, maka penggunaan analisis yang sesuai ialah dengan analisis Regresi Logistik. Analisis Regresi Logistik digunakan untuk memprediksi variabel yang bersifat kategorik (biasanya dikotomis) oleh seperangkat variabel independen (Jeansonne, 2002).
Analisis model loglinier bergantung pada jumlah variabel dependen yang termuat di dalamnya. Untuk penulisan ini akan diuraikan tentang model loglinier yang membahas analisis hubungan antara tiga variabel yang disebut dengan analisis trivariat. Model seperti ini disebut juga sebagai model loglinier tiga faktor. Model loglinier tiga faktor memuat semua parameter yang mungkin dan tidak dapat dimasuki oleh parameter – parameter lainnya. Model seperti ini disebut sebagai model lengkap. Secara umum model loglinier tiga faktor dapat ditulis sebagai berikut (Agresti, 1990):
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ Setelah jumlah variabel kategorik diselidiki, pembentukan model loglinier penting untuk diteliti yang berguna untuk menentukan kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Hal ini menjadi penting
(15)
karena tidak semua interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Tentunya akan menjadi suatu permasalahan jika semua interaksi dimasukkan secara sekaligus dalam model tanpa mengetahui terlebih dahulu kecocokan dari interaksi faktor model yang ada sebelum membentuk suatu model yang memang tepat dan signifikan setelah melalui uji kecocokan modelnya.
Dalam hal ini akan dilakukan teknik pemodelan loglinier yang akan digunakan sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk model permasalahan. Jenis prosedur yang penulis gunakan dalam penyelesaian pemodelan loglinier terbagi pada dua jenis, yaitu prosedur yang memakai metode Hirarkis Backward dan prosedur pemodelan yang menggunakan metode Forward.
Untuk keperluan analisis data yang memuat hubungan tiga variabel dengan menggunakan skala kategorik difokuskan pada bagaimana penentuan model dengan melakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun 3-faktor dengan menggunakan uji goodness of fit model G2 untuk menguji kecocokan modelnya. Pengolahan data dilakukan dengan software SPSS 15.0 for Windows.
1.2 Rumusan Masalah
Masalah yang akan dibahas dalam penulisan ini ialah melakukan prosedur pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward, kemudian membandingkan kedua metode dalam hal mendapatkan suatu model akhir yang menggambarkan hubungan antar variabel yang diselidiki.
1.3 Batasan Masalah
Ruang lingkup dari penulisan ini dibatasi pada melakukan suatu teknik pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward dengan uji rasio likelihood G2 untuk menguji kecocokan modelnya.
(16)
1.4 Tujuan Penelitian
Tujuan penulisan ini adalah melakukan prosedur pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang yang lebih baik dalam membentuk model.
1.5 Kontribusi Penelitian
Hasil penulisan ini adalah:
1. Dapat menerapkan analisis tabel kontingensi dan metode pemodelan loglinier yang ada untuk penyelesaian permasalahan yang berkaitan dengan berbagai bidang kehidupan agar lebih mudah diolah, sehingga jelas tujuannya.
2. Dengan penulisan ini penulis berharap dapat menambah referensi bagi pembaca yang dapat digunakan sebagai alat untuk mengklasifikasikan data yang ingin diteliti dalam memutuskan suatu masalah.
1.6 Metodologi Penelitian
Dalam penulisan ini penulis melakukan studi dengan meneliti buku-buku yang membahas mengenai model loglinier dan metode Hirarkis Backward dan Forward dalam hal pemodelannya, yaitu:
1. Mengumpulkan dan mempelajari buku-buku yang berkaitan dengan materi penulisan.
2. Menentukan jumlah variabel kategorik yang akan diselidiki sebelum dilakukan prosedur pemodelan.
3. Menguraikan perbedaan penyelesaian pemodelan loglinier menggunakan metode yang ada.
(17)
4. Pemodelan dilakukan melalui suatu proses seleksi sampai model akhir terbentuk yang mana setiap kali variabel dihapus maupun ditambahkan pada model, dilakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun 3-faktor menggunakan uji rasio likelihood 2
G dan melihat p-value yang dihasilkan untuk menguji kecocokan modelnya. 5. Menyelesaikan contoh permasalahan untuk memilih metode yang lebih baik dalam membentuk suatu model.
1.7 Tinjauan Pustaka
Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi 2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan jumlah independen sehingga model seperti ini sering disebut juga sebagai model lengkap (chass.ncsu.edu, 3 Oktober 2010).
Secara umum model lengkap untuk tiga variabel kategorik dapat ditulis sebagai berikut (Agresti, 1990):
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ (1) dengan:
logmˆijk = Logaritma dari frekuensi sel ijk
= konstanta atau rata – rata logaritma seluruh sel ijk X
i
= Parameter pengaruh variabel pertama yang ke-i terhadap model Yj = Parameter pengaruh variabel kedua yang ke-j terhadap model Z
k
= Parameter pengaruh variabel ketiga yang ke-k terhadap model ijXY = Parameter pengaruh interaksi variabel pertama yang ke-i dengan
(18)
variabel kedua yang ke-j terhadap model
ikXZ = Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model
YZjk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
ijkXYZ = Parameter pengaruh interaksi variabel pertama yang ke-i, variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi. Friendly (2000) menyatakan tabel kontingensi digunakan ketika terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam daftar baris dan kolom. Bentuk penyajian dalam daftar baris dan kolom ini biasanya disebut daftar kontingensi. Analisis tabel kontingensi ini merupakan teknik penyusunan data yang cukup sederhana untuk melihat hubungan antar variabel dalam satu tabel. Untuk menginterpretasikan data pada tabel kontingensi, salah satu yang dapat digunakan adalah dengan uji Chi-Square.
Uji Chi-Square dilambangkan dengan 2
, yang digunakan untuk mengetahui adanya hubungan antara variabel yang diukur signifikan atau tidak. Dalam hal ini analisis variabel yang diukur sebanyak tiga variabel atau yang disebut sebagai analisis trivariat. Hipotesis yang berlaku untuk ketiga variabel yang independen dengan asumsi tidak terdapat interaksi antar variabel, yaitu:
H0 :Pijk Pi..P.j.P..k H1:Pijk Pi..P.j.P..k
Statistik uji Chi-Square yang digunakan untuk menguji hubungan antar variabel dapat dirumuskan sebagai berikut:
i j k ijkijk ijk
m m Y
ˆ ˆ 2 2
(2)
(19)
i j k ijk
ijk ijk
m Y Y
G
ˆ ln 2
2
(3)
dengan: ijk
Y = Observasi pada variabel i, j, dan k
ijk
mˆ = Frekuensi yang diharapkan untuk Yijk
degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05 Kriteria uji:
Tolak H0 jika 2 atau G2 hitung 2df; dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆijk iX Yj Zk diterima.
Pencarian Solusi
Pencarian solusi permasalahan pemodelan loglinier dapat dilakukan dengan menentukan suatu model secara fleksibel dan mendalam serta memilih variabel independen secara inklusif dengan tepat. Hal ini memungkinkan untuk menemukan variabel independen yang terbaik yang dapat dipakai serta melihat pada kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Dalam hal ini dapat menggunakan beberapa metode yang akan digunakan sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk suatu model akhir. Metode – metode itu diantaranya adalah metode iteratif Hirarkis Backward, Forward dan lain – lain.
1) Metode Hirarkis Backward
Pemodelan loglinier dengan metode Hirarkis Backward akan membentuk model hirarkis yang menyatakan hubungan dalam kumpulan data dengan tepat. Dilakukan
(20)
dengan menyeleksi model lengkap dan mulai menghapus interaksi yang lebih tinggi sampai uji kecocokan dari model menjadi tidak dapat diterima lagi berdasarkan standar probabilitas atau p-value yang diadopsi oleh penyidik. Model lengkap mencakup semua kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun 3-faktor sesuai dengan jumlah variabel yang diselidiki dalam penelitian ini. Dimana setiap kali variabel dihapus dilakukan uji statistik untuk menentukan akurasi prediksinya dengan membandingkan uji rasio likelihood G2 dengan 2df; (Chapter 14, 2 November 2010).
2) Metode Forward
Penggunaan metode forward yang digunakan dalam penelitian ini menggunakan dua cara yang berbeda namun prinsipnya hampir sama. Agresti (1990) menjelaskan pengerjaan metode ini dimulai dengan dibentuknya model independen dan menambahkan istilah interaksi yang lebih kompleks sampai suatu hasil uji fit diterima yang tidak dapat ditingkatkan dengan menambahkan peraturan lebih lanjut. Dengan kata lain, metode ini memilih variabel terlemah hingga terkuat secara bertahap.
Friel (2005) menjelaskan pemodelan loglinier dengan metode forward dilakukan dengan dibentuknya model sederhana (model order nol) kemudian menambahkan efek order pertama, order kedua, dan order ketiga untuk diuji kecocokan datanya.
(21)
BAB 2
LANDASAN TEORI
2.1 Analisis Model Loglinier
Untuk data yang bersifat kategorik dan dapat dibentuk pada suatu tabel kontingensi, dapat dianalisis dengan analisis model loglinier. Model loglinier digunakan untuk menganalisis kemungkinan adanya hubungan yang signifikan dalam tabel kontingensi multifaktor yang memiliki tiga atau lebih variabel kategorik yang diterapkan pada kasus-kasus data kualitatif. Dalam hal ini pola hubungan atau asosiasi antar variabelnya dapat dilihat dari interaksi antar variabel itu sendiri.
Pada umumnya terdapat dua jenis data berdasarkan pengklasifikasiannya, yakni data kuantitatif dan data kualitatif. Data kuantitatif adalah data yang berbentuk angka atau data yang diukur dalam skala numerik yang diperoleh melalui suatu hasil perhitungan dan pengukuran. Sedangkan data kualitatif adalah data yang menunjukkan sifat atau keadaan objek berupa label atau nama-nama yang digunakan untuk mengidentifikasi atribut suatu elemen yang mana dalam hal pengumpulannya disajikan menurut kualitas atau kategorik yang digunakan. Dalam hal ini yang akan dipergunakan dalam model loglinier ialah data kualitatif karena variabel yang dianalisis merupakan variabel kategorik yang memiliki skala nominal atau ordinal.
Secara umum bentuk model loglinier dapat ditulis sebagai berikut (Von eye, 2002):
log ˆ ...,
int sec
int
0
eraction ondorder
ijk eraction
firstorder ij s
maineffect i ijk
m (2.1)
(22)
Adapun tujuan dari melakukan analisis model loglinier adalah:
1. Pada analisisnya difokuskan pada kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel.
2. Untuk menghitung atau memperkirakan banyaknya observasi yang diharapkan (expected counts) dalam tiap-tiap sel populasi dari tabel yang dibentuk oleh kelompok yang diperhatikan.
Pada analisis model loglinier, prosedur untuk pemasukan variabel - variabel ke dalam model dilakukan secara independen dan berguna untuk menjelaskan distribusi kasus dalam tabulasi silang untuk variabel kategorik. Dengan demikian, analisisnya meliputi distribusi yang diharapakan dari variabel kategorikal tersebut ialah distribusi Poisson yang akan membentuk suatu model Poisson.
2.1.1 Distribusi Poisson
Distribusi Poisson dibangun atas suatu percobaan yang menghasilkan jumlah sukses yang terjadi pada interval waktu ataupun pada daerah tertentu yang dikenal sebagai
percobaan Poisson. Percobaan Poisson adalah percobaan yang menghasilkan peubah
acak X yang bernilai numerik, yaitu jumlah sukses selama selang waktu tertentu atau dalam daerah tertentu. Selang waktu tertentu dapat berupa sedetik, semenit, sejam, sehari, seminggu maupun sebulan. Daerah tertentu dapat berupa satu meter, satu kilometer persegi dan lain-lain.
Distribusi Poisson adalah distribusi kemungkinan dari variabel acak Poisson x yang menjelaskan jumlah sukses yang terjadi pada interval waktu ataupun daerah tertentu. Dinotasikan sebagai:
! . ;x e x
p
x
(23)
dengan:
= jumlah rata-rata sukses terjadi e = bilangan natural = 2,71828...
Distribusi Poisson ini juga merupakan salah satu model distribusi probabilitas untuk variabel diskrit. Model ini merupakan model pendekatan untuk menghitung probabilitas timbulnya gejala yang diharapkan (gejala “sukses”) dari sejumlah n peristiwa atau sampel. Ciri distribusi seperti itu memiliki kemiripan yang hampir sama dengan distribusi Binomial. Tetapi, untuk kasus nilai n yang sangat besar (n ) dan peluangnya yang sangat kecil (p 0) sukar sekali menghitung nilai probabilitasnya dengan model distribusi Binomial. Oleh karena itu, nilai probabilitas dapat dihitung dengan pendekatan Distribusi Poisson.
Sekarang andaikan X adalah variabel acak binomial dengan distribusi probabilitas b(x;n, p). Jika n , p 0, dan np konstan, maka distribusi Binomial dapat didekati oleh distribusi Poisson, yakni:
b(x; n, p) p(x; )
b
x;n,p
Cxnpx
1 p nx n,p0
! . ;x e x
p
x
Ekspektasi Harapan Distribusi Poisson
Distribusi Poisson merupakan salah satu dari beberapa distribusi probabilitas diskrit. Variabel acak yang terdapat pada distribusi ini jelas bersifat diskrit (berdasarkan hasil hitungan). Nilai harapan variabel acak diskrit adalah rata-rata tertimbang dari seluruh kemungkinan.
Secara umum, rumus untuk nilai ekspektasi probabilitas diskrit adalah:
E(X)x
xi.p
xi (2.3)(24)
0 ! . . x x x e x X E
0( )( 1)! . . x x x x e
x
0( 1)! . x
x
x
e
1 1 1 1 )! 1 ( . )! 1 ( . x x x x x e x e jika x1 y, maka bentuk
1 1 )! 1 ( . x x x e =
0 ! . y y y e . karena
0 1 ! . y y y e
, maka diperoleh
1. ! . 0 y y y e. Jadi, ekspektasi harapan untuk distribusi Poisson adalah .
2.1.2 Model Loglinier Poisson
Seperti yang penulis sebutkan pada bab awal penulisan, model loglinier merupakan salah satu kasus khusus dari general linier model. Dalam hal ini komponen acak merupakan salah satu jenis dari tiga komponen utama untuk general linier model. Komponen acak berguna untuk mengidentifikasi distribusi probabilitas dari variabel dependen, dengan memisalkan yi = (y1, y2, . . . , yk). Sehingga bentuk fungsi peluangnya adalah:
f
yi;i
ai b yi exp
yi
i
(2.4) Kelompok ini memuat beberapa distribusi yang penting sebagai kasus khusus, misalnya distribusi Poisson. Nilai parameter i pada persamaan (2.4) untuk i =1, 2, 3, . . . , k tergantung pada nilai dari variabel peramalnya yaitu sebagai variabel independennya. Suku
i disebut sebagai parameter asli dari distribusinya.(25)
Kemudian dengan memisalkan y jumlah observasi di dalam sel i yang terdistribusi i
Poisson dengan rata-rata i, maka fungsi padat peluang Poisson untuk y adalah: i
! . ; i y i i i y e y f i i
! exp i y i y i i
i
i
ii y
y
exp log ! 1 exp
(2.5) Dengan yi adalah bilangan bulat positif.
Persamaan (2.5) sama saja dengan bentuk eksponensial sejati pada persamaan (2.4) yang mana a
i a i exp
i ,
! 1 i i y y
b , dan
i log
i dengan
i sebagai parameter sejati.Untuk distribusi Poisson dalam kaitannya dengan istilah struktur yang sistematis dari sebuah model, dapat dipertimbangkan tiga jenis model loglinier untuk menghitung frekuensi yang diharapkan, yaitu: model order nol, model penambahan, dan model lengkap. Inilah pembagian jenis model yang akan dipergunakan sebagai pemilihan dalam menentukan apakah salah satu dari ketiga jenis model di atas dapat digunakan untuk mewakili hubungan dari kumpulan data dalam pemodelan loglinier yang akan dilakukan.
2.2 Asumsi Terorikal Untuk Model Loglinier
Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang diselidiki mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata lain, tidak ada pembedaan yang dibuat antara variabel dependen dan variabel independen karena model loglinier hanya menunjukkan depedensi (kecenderungan) antar variabel. Namun apabila ternyata pada suatu penelitian diasumsikan bahwa variabel-variabel
(26)
tersebut terbagi menjadi variabel independen dan dependen, maka (Von eye, 2002) terdapat beberapa hal yang harus diperhatikan. Berikut ini akan dijelaskan beberapa contoh model loglinier yang biasa digunakan.
Jika tidak ada variabel yang mempengaruhi model (zero-order), model loglinier secara umum (Von eye, 2002) adalah sebagai berikut:
logE(Y) (2.6) dengan: E(Y) Frekuensi yang diharapkan dalam setiap sel
constant atau rata-rata umum
Jika semua variabel mempunyai status yang sama, dan hanya Main effect atau efek utama yang digunakan (first-order), model loglinier secara umum (Von eye, 2002) adalah sebagai berikut:
logE(Yij..)iX Yj ... (2.7)
dengan: E(Yij..) = Frekuensi yang diharapkan dalam setiap sel
= constant atau rata-rata umum
Xi = Parameter pengaruh tingkat ke-i faktor X Yj = Parameter pengaruh tingkat ke-j faktor Y
Jika variabel-variabel yang akan diteliti terbagi menjadi variabel independen dan variabel dependen, dimisalkan terdapat dua variabel independen A dan B dan dua variabel dependen C dan D, model loglinier yang dipergunakan adalah sebagai berikut (Von eye, 2002):
E
Yijkl Ai Bj ABij Ck Dl CDkl (2.8) dengan: E
Yijkl = Frekuensi yang diharapkan dalam setiap sel = constant atau rata-rata umum A = Pengaruh tingkat ke-i faktor A i
(27)
Bj = Pengaruh tingkat ke-j faktor B
ABij = Interaksi tingkat ke-i dan j faktor A dan B
C = Pengaruh tingkat ke-k faktor C k
D = Pengaruh tingkat ke-l faktor D l
CD = Interaksi tingkat ke-k dan l faktor C dan D kl
Model tersebut diasumsikan bahwa penelitian tidak menginginkan adanya interaksi antar variabel independen dan variabel dependen.
2.3 Tabel Kontingensi
Tabel kontingensi merupakan suatu analisis teknik penyusunan data yang cukup sederhana untuk melihat hubungan antar variabel dalam satu tabel (Friendly, 2000). Dalam hal ini, variabel yang dianalisis merupakan variabel kategorik yang memiliki skala nominal atau ordinal. Penggunaan tabel kontingensi yang akan dibahas pada penelitian ini penulis kelompokkan menjadi dua yaitu tabel kontingensi dua faktor dan tabel kontingensi tiga faktor.
2.3.1 Tabel Kontingensi Dua Faktor
Tabel kontingensi mulai digunakan ketika terdapat lebih dari satu variabel kategorik yang mana biasanya data disajikan dalam daftar baris dan kolom. Bentuk penyajian dalam daftar baris dan kolom ini biasanya disebut daftar kontingensi. Andaikan terdapat suatu percobaan yang terdiri dari n pengamatan yang diklasifikasikan
menurut 2 variabel kategorik, maka variabel 1 mempunyai i tingkat/kategorik: A1,
A2, A3, . . . , Ai dan variabel 2 mempunyai j tingkat/kategorik: B1, B2, B3, . . . , Bj .
Kemudian anggap Yij menyatakan banyak peristiwa variabel-1 ada pada
tingkat ke-i dan variabel-2 pada tingkat ke-j, dengan i = 1, 2, 3, . . . , I dan j = 1, 2, 3, . . . , J . Maka data tersebut dapat disusun dalam tabel kategorik I × J sebagai berikut:
(28)
Tabel 2.1 Tabel Kontingensi I × J
Variabel 2
B 1 B 2 B . . . 3 Bj Jumlah baris Variabel 1
A 1 Y 11 Y 12 Y . . . 13 Y1j n 1
A 2 Y 21 Y 22 Y . . . 23 Y2j n 2
A 3 Y 31 Y 32 Y . . . 33 Y3j n 3
. . . . . . . . . . . . . . . . . . A i Y b1 Y b2 Y . . . b3 Ybj n i
Jumlah kolom m 1 m 2 m . . . 3 mj nm1 ...mj n1...ni
Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk masing-masing sel dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk A dan i
j
B . Probabilitas untuk A = i P dan probabilitas untuk i. Bj = P.j. Kemudian, untuk menghitung besarnya P dan i. P.j dapat ditaksir dengan
N n Pˆi. i ,
N m
Pˆ.j j , sehingga taksiran nilai harapannya adalah
N m n P P N
mij i j i j
. ˆ . ˆ .
ˆ . . .
Dari tabel kontingensi dua faktor yang terbentuk, model loglinier akan menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Dengan demikian, bentuk model loglinier untuk dua faktor dapat ditulis sebagai berikut:
(29)
Model di atas disebut sebagai model lengkap karena memasukkan semua efek yang mungkin terbentuk, baik itu efek untuk 1-faktor dan juga efek 2-faktor. Sebagai contoh misalkan dalam tabel kontingensi 2X2, maka akan terdapat empat parameter yang terdiri dari ,iX,Yj,ijXY. Kemudian jika ingin mendapatkan sebuah model yang dapat menghilangkan salah satu efek di atas yang tidak memberikan kecocokan terbaik dengan model, maka model non-lengkap harus dibentuk.
Pembentukan model ini dapat dilakukan dengan membuat beberapa efek parameter menjadi bernilai nol. Misalkan dianggap ijXY 0 (diasumsikan bahwa variabel X tidak berasosiasi dengan variabel Y), maka model yang terbentuk akan menjadi model loglinier non-lengkap sebagai berikut:
logmˆij iX Yj (2.10) Bentuk model seperti ini disebut sebagai model independen karena hanya memuat efek utamanya saja yakni X dan Y tanpa interaksi.
Uji keindependenan model loglinier untuk dua faktor, yaitu:
j i ij PP
P
H0 : . .
j i ij P P
P
H1: . .
Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:
i j ij ij ij m m Y ˆ ˆ 2 2
(2.11) Sedangkan untuk uji kecocokan datanya dengan uji Rasio Likelihood dapat dirumuskan:
i j ij
ij ij m Y Y G ˆ ln 2 2 (2.12) dengan: ij
Y = Observasi pada variabel i dan j
ij
mˆ = Frekuensi yang diharapkan untuk Yij
(30)
Kriteria Uji:
Tolak H0 jika 2 atau G2 hitung 2df; dengan kata lain terdapat asosiasi antara dua variabel yang diselidiki dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆij iX Yj diterima.
2.3.2 Tabel Kontingensi Tiga Faktor
Seperti halnya pada tabel kontingensi I × J yang mempunyai i
tingkat/kategorik untuk variabel pertama dan mempunyai j tingkat/kategorik untuk variabel kedua, maka pada tabel kontingensi I × J × K juga berlaku sama. Misal Yijk
menyatakan banyak peristiwa variabel-1 ada pada tingkat ke-i, variabel-2 pada tingkat ke-j, dan variabel-3 pada tingkat ke-k, dengan i = 1, 2, 3, . . . , I , j = 1, 2, 3, . . . , J dan k = 1, 2, 3, . . . , K. Maka data tersebut dapat disusun dalam tabel kategorik
I × J × K sebagai berikut:
Tabel 2.2 Tabel Kontingensi I × J × K
Variabel 2
Jumlah
1 2 ... j
Variabel 3 1 2 ... k
V a r i a b e l 1
1 ... ..
2 ... ..
⋮ ⋮ ⋮ … ⋮ ⋮
i … ..
(31)
Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk tiap sel dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk Yi.., Y. j.,
dan Y..k. Probabilitas untuk Yi.. = P , probabilitas untuk i.. Y. j. = P. j. dan probabilitas untuk Y..k = P..k. Kemudian, untuk menghitung besarnya P , i.. P. j., dan P...k dapat
ditaksir dengan
N Y
P i
i .. ..
ˆ ,
N Y
Pˆ.j. .j., dan
N Y
P k
k .. ..
ˆ , sehingga taksiran nilai
harapannya adalah mˆijk N.Pi..P.j.P..k
..
.2.
..N Y Y
Yi j k
.
Dari tabel kontingensi tiga faktor yang terbentuk, model loglinier akan menggambarkan pola asosiasi atau hubungan yang terjadi antar tiga variabel. Dengan demikian, bentuk lengkap model loglinier untuk tiga faktor dapat ditulis sebagai berikut (Agresti, 1990):
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ (2.13) dengan:
logmˆijk = Logaritma dari frekuensi sel ijk = rata – rata logaritma seluruh sel ijk
Xi = Parameter pengaruh variabel pertama yang ke-i terhadap model Yj = Parameter pengaruh variabel kedua yang ke-j terhadap model Zk = Parameter pengaruh variabel ketiga yang ke-k terhadap model ijXY = Parameter pengaruh interaksi variabel pertama yang ke-i dengan variabel kedua yang ke-j terhadap model
XZ ik
= Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model
YZjk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
ijkXYZ = Parameter pengaruh interaksi variabel pertama yang ke-i, variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model
(32)
Kemudian, jika diasumsikan dari model di atas interaksi ijXY, ikXZ, ikXZ, YZjk , serta XYZ
ijk
bernilai 0, maka hal ini berarti X, Y,dan Z secara masing-masing tidak berasosiasi dan hanya main effects (efek utama) nya saja yang berhubungan secara independen. Model loglinier independen untuk tiga faktor dapat ditulis sebagai berikut:
logmˆijk iX Yj Zk (2.14) Uji keindependenan model loglinier untuk tiga faktor, yaitu:
H0 :Pijk Pi..P.j.P..k H1:Pijk Pi..P.j.P..k
Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:
i j k ijk ijk ijk
m m Y
ˆ ˆ 2 2
(2.15) dengan:
ijk
Y = Observasi pada variabel i, j, dan k
ijk
mˆ = Frekuensi yang diharapkan untuk Yijk
degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05
Kriteria Uji:
Tolak H0 jika 2 hitung 2df; dengan kata lain terdapat asosiasi antar ketiga variabel dan terima H0 jika 2 hitung < 2df; dengan kata lain model
Z k Y
j X i ijk
mˆ
log diterima.
2.4 Pengujian Kecocokan Model
Pengujian analisis model loglinier dapat dilakukan dengan dua pendekatan uji statistik yang ada, yaitu uji Chi-Square dan uji Rasio Likelihood G2.
(33)
1. Pendekatan Uji Chi-Square
Uji Chi-Square yang digunakan untuk mengetahui hubungan dari tiga variabel yang diselidiki dapat ditulis sebagai:
i j k ijkijk ijk
m m Y
ˆ ˆ 2 2
(2.16)
2. Pendekatan Uji Rasio likelihood G2
Pendekatan ini digunakan untuk menguji kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Dengan kata lain uji ini melihat seberapa cocok model dengan data. Untuk tabel tiga faktor dapat ditulis sebagai berikut:
i j k ijk
ijk ijk
m Y Y
G
ˆ ln 2
2
(2.17)
degree of freedom nya disesuaikan dengan model yang terbentuk selama proses
seleksi dan diambil 0,05
Kriteria uji:
Tolak H0 jika 2 atau G2 2df; atau p-value < yang berarti terdapat hubungan yang signifikan antar interaksi variabel ataupun komponen yang sedang diuji sehingga menyebabkan adanya depedensi dan terima H0 jika 2 atau G2
2df; yang berarti tidak terdapat hubungan yang signifikan.
Pengujian statistik rasio likelihood ini tidak hanya dapat digunakan untuk menguji satu model saja, tetapi juga dapat digunakan terhadap dua model untuk melihat perubahan nilai yang ada. Pada titik ini uji rasio likelihood dapat digunakan untuk membandingkan model secara keseluruhan dengan model yang lebih rendah (yaitu membandingkan model lengkap dengan satu interaksi atau pengaruh utama yang lebih rendah) untuk menilai hubungan diantara kedua model itu. Persamaannya dapat ditulis sebagai berikut (Jeansonne, 2002):
(34)
2
1 22 2
M G M G
G perbandingan (2.18)
2 2M
G = statistik likelihood G2 untuk model (2)
12
M
G = statistik likelihood G2 untuk model (1)
Derajat kebebasan (degree of freedom) = derajat kebebasan model (2) - derajat kebebasan model (1).
2.5 Seleksi Model
Bagian ini menjelaskan tentang strategi untuk memilih model loglinier setelah variabel kategorik diselidiki. Strategi dasar dalam pemodelan loglinier melibatkan model yang cocok untuk frekuensi yang diamati dalam tabulasi silang variabel kategorik. Model kemudian dapat diwakili oleh satu set frekuensi harapan yang mungkin. Setelah frekuensi harapan diperoleh, kemudian membandingkan model-model yang hirarkis satu sama lain dan menyeleksi model-model yang terbentuk yang merupakan model yang paling signifikan yang sesuai dengan data.
Dalam hal pengerjaannya proses seleksi untuk memilih model akan menjadi sulit bersamaan dengan meningkatnya jumlah variabel karena terjadinya peningkatan yang pesat dalam asosiasi yang mungkin dan interaksi yang ada. Pencocokan semua model yang mungkin menjadi tidak praktis ketika jumlah variabel kategorik melebihi tiga. Oleh karena itu, seleksi model bertujuan untuk menyeimbangkan dua tujuan yang membahas beberapa hal di bawah ini (Friel, 2005):
a. Permasalahan mengenai komponen manakah dari model yang signifikan. b. Manakah model yang paling cocok dengan data yang digunakan.
Maka dari itu, terdapat dua metode yang digunakan untuk menentukan signifikansi dari komponen-komponen dalam model yaitu dengan dengan Metode Hirarkis Backward dan Metode Forward.
(35)
2.6 Metode Hirarkis Backward
Metode Hirarkis Backward digunakan untuk menganalisis proses terbentuknya sebuah model loglinier hirarkis non-lengkap yang dilakukan dengan menyeleksi dari model lengkap hingga pada model yang sederhana. Model lengkap mencakup semua kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun 3-faktor sesuai dengan jumlah variabel yang digunakan dalam penelitian ini, yakni sebanyak tiga variabel kategorik. Dimana setiap kali variabel dihapus dilakukan uji statistik untuk menentukan akurasi prediksinya dengan membandingkan uji rasio likelihood 2
G
dengan 2df; (Chapter 14, hal: 144). Mengingat bahwa model lengkap ini memiliki jumlah yang sama sel-sel nya dalam tabel kontingensi, seperti halnya efek dan frekuensi sel yang diharapkan akan selalu bernilai sama dengan frekuensi yang diamati tanpa derajat kebebasan yang tersisa (Knoke dan Burke, 1980 dikutip dari Jeansonne).
Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat ditulis sebagai berikut:
logmˆijk iX Yj kZ ijXY ikXZ YZjk ijkXYZ
2.7 Metode Forward
Metode Forward digunakan untuk menganalisis proses penambahan komponen-komponen model menjadi signifikan untuk model akhir dengan dibentuknya sebuah model order nol kemudian menambahakan efek order pertama, order kedua, dan order ketiga. Setelah itu, pada setiap tahap dipilih efek order yang memberikan peningkatan signifikansi terbesar dalam kesesuaian datanya setelah dilakukan pengujian (Friel, 2005). Akan tetapi, (Agresti, 1990) menjelaskan metode ini lebih dikenal sebagai suatu metode yang digunakan untuk mengevaluasi sebuah model yang proses pemodelannya dilakukan dengan dibentuknya model independen sampai model lengkap. Nilai p-maksimum untuk model yang dihasilkan adalah kriteria yang mungkin karena akan menghasilkan nilai G2 yang kecil, yang berarti baik untuk model. Bentuk umum model loglinier order nol untuk tiga variabel kategorik, yaitu: logmˆijk (2.19)
(36)
BAB 3
PEMBAHASAN
3.1 Pendekatan Hirarkis Untuk Pemodelan Loglinier
Untuk menyelesaikan suatu masalah yang berhubungan dengan model yang akan terbentuk dari variabel kategorik yang diselidiki, maka pemodelan loglinier penting untuk dilakukan. Hal ini berguna untuk menentukan kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel karena ternyata tidak semua interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang ada pada model lengkap menjadi signifikan dalam suatu model yang akan terbentuk. Tentunya akan menjadi suatu permasalahan jika semua interaksi dimasukkan secara sekaligus dalam model tanpa mengetahui terlebih dahulu kecocokan dari interaksi faktor model yang ada sebelum membentuk suatu model yang memang tepat dan signifikan setelah melalui uji kecocokan datanya.
Dalam hal ini untuk mendapatkan model yang dapat mewakili kumpulan data secara tepat yang berkaitan dengan hal di atas, cara yang dapat dilakukan adalah dengan melakukan suatu teknik pemodelan loglinier dengan dua metode, yakni dengan metode Hirarkis Backward dan metode Forward. Metode-metode ini dapat diselesaikan dengan bantuan program komputer.
Metode Hirarkis Backward dapat digunakan untuk menguji satu per satu model yang memuat efek 1-faktor untuk setiap variabel serta semua efek interaksi 2-faktor dan interaksi 3-2-faktor. Apabila melalui hasil uji terdapat interaksi yang tidak memberikan kecocokan yang baik dengan data, maka harus dikeluarkan dan begitu seterusnya. Dengan demikian, metode ini lebih dikenal dengan mengeliminasi model lengkap menjadi model non-lengkap.
(37)
3.1.1 Model Lengkap
Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi 2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan jumlah independen sehingga model seperti ini sering disebut juga sebagai model lengkap (chass.ncsu.edu, 3 Oktober 2010).
Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat ditulis sebagai berikut:
logmˆijk iX Yj kZ ijXY XZik YZjk ijkXYZ
Perlu dicatat bahwa transformasi logaritma dari mˆijk bisa dilakukan karena hal
itu membatasi agar frekuensi yang diharapkan tetap dalam kisaran yang dapat diterima. Konsekuensi dari menentukan model loglinier untuk logmˆijk adalah
diperolehnya model multiplikatif untuk mˆijk, yaitu:
mˆijk exp
iX Yj kZ ijXY ikXZ YZjk ijkXYZ
iXYjkZijXYYZjkYZjkijkXYZ (3.1) Dari persamaan di atas dapat dilihat bahwa model lengkap berisi semua
variabel yang dianalisis dan semua interaksi yang mungkin antara variabel X, Y, dan Z yang tidak ada pembatasan yang dikenakan pada data sesuai dengan prinsip hirarkis yakni memasukkan semua order yang paling tinggi dengan order yang lebih rendah tetap ada didalam model. Namun, dari persamaan (2.13) dan (3.1) mengandung terlalu banyak parameter yang akan diidentifikasi. Mengingat nilai untuk frekuensi yang diharapkan mˆijk tidak ada solusi unik untuk parameter-parameter dan . Oleh karena itu, batasan-batasan harus dipaksakan pada parameter model loglinier untuk membuat parameter-parameter itu lebih mudah diidentifikasi. Salah satu pilihan adalah menggunakan batasan sebagai berikut, yaitu (Vermunt, 2005):
(38)
kZ k
i j
Y j X
i 0
,
i j i k j k
YZ jk YZ
jk XZ
ik XZ
ik XY
ij XY
ij 0
,
i j k
XYZ ijk XYZ
ijk XYZ
ijk 0
,
Parameterisasi seperti ini di mana setiap satuan jumlah parameter menjadi bernilai nol atas masing-masing tandanya disebut effect coding. Pada effect coding, dinotasikan sebagai rata-rata untuk logmˆijk.
3.1.2 Model Non-lengkap
Seperti disebutkan di atas, dalam model loglinier lengkap semua kemungkinan interaksi ada. Dengan kata lain, tidak ada pembatasan yang dikenakan pada parameter-parameter model selain dari pembatasan untuk mengidentifikasi. Namun, pembatasan parameter-parameter model menjadi penting dilakukan karena bertujuan untuk menentukan dan menguji model yang lebih pelit yaitu model di mana beberapa pembatasan dikenakan pada parameter. Model loglinier seperti ini di mana parameter dibatasi dalam beberapa cara disebut sebagai model non-lengkap.
Ada berbagai jenis pembatasan yang dapat dikenakan kepada parameter-parameter model loglinier. Salah satu jenis khusus pembatasan menyebabkan terbentuknya kumpulan model loglinier hirarkis. Ini adalah model dimana parameter-parameter loglinier secara tetap dibuat menjadi bernilai nol. Dengan demikian apabila interaksi tertentu bernilai 0, semua order interaksi yang lebih tinggi berisi semua indeks sebagai subset juga harus bernilai 0. Sebagai contoh jika asosiasi parsial antara
X dan Y dari persamaan (2.13) yaitu
ijXY diasumsikan tidak ikut dalam model, maka interaksi tiga variabel ijkXYZ harus bernilai 0.Menerapkan pembatasan ini untuk persamaan model loglinier lengkap di atas hasilnya akan menjadi model loglinier hirarkis yang non-lengkap sebagai berikut:
(39)
logmˆijk iX Yj kZ ikXZ YZjk (3.2) Contoh lain dari model loglinier hirarkis yang non-lengkap adalah model independen untuk trivariat sesuai persamaan (2.14), yaitu:
logmˆijk iX Yj Zk
Model loglinier hirarkis adalah model loglinier yang paling populer karena dalam sebagian besar aplikasi secara relatif lebih mudah untuk mengestimasi parameter karena keberadaan dari statistik minimum yang sederhana.
3.2 Konfigurasi Model Loglinier Tiga Faktor
Bentuk model loglinier tiga faktor dapat dibagi menjadi beberapa konfigurasi yang berguna untuk lebih mengetahui pembagian jenis-jenis model yang ada, yakni:
Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor
No. Model Konfigurasi 1. Model Independen
logmˆijk iX Yj Zk C1C2C3
2. Model Satu Interaksi Dua Faktor
2.1 logmˆijk iX Yj kZ ijXY C12 C3
2.2 logmˆijk iX Yj kZ ikXZ C13 C2
2.3 logmˆijk iX Yj kZ YZjk C1 C23
3. Model Dua Interaksi Dua Faktor
3.1 logmˆijk iX Yj kZ ijXY XZik C12 C13
3.2 logmˆijk iX Yj Zk ijXY YZjk C12 C23
3.3 logmˆijk iX Yj kZ ikXZ YZjk C13 C23
4. Model Tanpa Interaksi Tiga Faktor
logmˆijk iX Yj Zk ijXY ikXZ YZjk C12 C13 C23
5. Model Lengkap
(40)
Sebagai tambahan bahwa untuk model lengkap di atas terdapat tiga jenis efek order didalamnya, yakni efek order pertama, efek order kedua, dan efek order ketiga. Efek order pertama adalah X
i
, Yj, dan Z k
. Efek order kedua adalah ijXY, XZ ik
, dan YZjk . Efek order ketiga adalah ijkXYZ.
3.3 Derajat Bebas
Derajat bebas adalah banyaknya sel dalam tabel klasifikasi silang dikurangi banyaknya parameter yang ditaksir dalam model. Derajat bebas untuk tabel tiga faktor ditulis pada tabel berikut:
Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor
Bentuk Derajat Bebas
1
X
I 1 Y
J1 Z
K 1
XY
I1 J1 XZ
I1 K 1
YZ
J 1 K 1
XYZ
I1 J 1 K 1
(Sumber: Friel, 2005)
3.4 Algoritma Hirarkis Backward
Algoritma Hirarkis Backward dimulai dengan dibentuknya suatu model lengkap. Kemudian, komponen dari model itu dievaluasi untuk melihat apakah terdapat efek yang dapat dieliminasi dengan melihat hasil uji kecocokan modelnya. Proses ini terus berlangsung sampai tidak ada efek yang harus dikeluarkan dari model. Pemodelan loglinier Hirarkis Backward menggunakan eliminasi mundur yang digunakan untuk menemukan model terbaik, yaitu model yang memiliki interaksi yang signifikan didalamnya yang dilihat dari p-value yang lebih kecil dari sebesar 0,05.
(41)
Adapun algoritmanya secara lengkap sebagai berikut (Chapter 14 dan Agresti, 1990):
Langkah 1
Analisis dengan memasukkan semua variabel pada model lengkap, dengan asumsi bahwa interaksi tiga faktor terdapat dalam model. Kemudian anggap model lengkap dengan konfigurasi C123 sebagai model terbaik, dalam hal ini disebut sebagai model
(0).
Langkah 2
Keluarkan interaksi tiga fakor dari model sehingga menjadi model (1), yaitu model dengan konfigurasi C12 C13 C23. Pada model ini semua interaksi dua faktor ada atau
signifikan dalam model, tetapi tidak ada interaksi antara ketiga faktor.
Langkah 3
Lakukan pengujian dengan Conditional Test Statistic (CTS) G2 apakah model (1) masih merupakan model terbaik, dengan hipotesis sebagai berikut:
H0 : model (1) = model terbaik
H1 : model (0) = model terbaik
Conditional Test Statistic tersebut adalah : G2(1-0) = G2(1) - G2(0)
dimana : G2(1) = statistik likelihood G2 untuk model (1)
G2(0) = statistik likelihood G2 untuk model (0)
Langkah 4
Bandingkan G2(1-0) dengan 2df;, dengan kriteria penolakan G2 2df; dan untuk kriteria penerimaan jika G2 < 2df;.
Derajat kebebasan (degree of freedom) = derajat kebebasan model (0) - derajat kebebasan model (1)
(42)
Langkah 5
Jika H0 diterima maka model (1) merupakan model terbaik. Jika H0 diterima,
bandingkan model (1) dengan model (2), yaitu model yang diperoleh dari model (1) apabila salah satu dari interaksi dua faktor dikeluarkan dari model.
Langkah 6
Untuk menentukan interaksi mana yang dikeluarkan terlebih dahulu, dipilih nilai 2
G
terkecil, seandainya salah satu interaksi dua faktor dikeluarkan dari model. Hal ini dilakukan karena untuk interaksi dua faktor dengan nilai G2 terkecil akan menyebabkan p-value yang semakin besar sehingga tidak adanya hubungan yang signifikan terhadap interaksi itu untuk model yang terbentuk.
Langkah 7
Ulangi langkah 3 sampai dengan langkah 5 hingga tidak ada lagi faktor yang harus dikeluarkan dari model.
3.5 Algoritma Forward
Algoritma Forward ini dimulai dengan dibentuknya model independen sampai model akhir secara berurutan untuk melihat jenis konfigurasi model yang terbentuk dengan melihat hasil G2 yang kecil dan p-value maksimum yang dihasilkan dari model-model yang terbentuk selama proses penambahan berlangsung (Agresti, 1990). Namun (Friel, 2005) menjelaskan algoritmanya dimulai dengan sebuah model berorder nol kemudian menambahkan efek order pertama, kedua, dan ketiga untuk mengetahui penambahan efek order mana yang signifikan untuk melalui pengujian yang dilakukan dengan mengkombinasikan hasil uji untuk Interaksi K-faktor adalah nol dan uji Asosiasi Parsial Chi-Square untuk menghasilkan sebuah model yang seluruh komponen didalamnya signifikan dengan melihat nilai uji rasio likelihood G2
(43)
3.6 Analisis Residu
Analisis residu berguna untuk membantu menyoroti sel-sel yang memiliki kecocokan dengan baik. Residu adalah perbedaan dari frekuensi yang diharapkan dan frekuensi sel yang diamati. Nilai residu itu dapat dicari dengan:
residu Of Ef (3.4) Frekuensi residu dapat menjelaskan sel yang menunjukkan kekurangcocokan dengan data. Residu yang semakin kecil yang terdapat pada sel menunjukkan semakin baik model bekerja untuk sel itu. Kemudian jika suatu model telah diterima dari uji yang telah dilakukan, maka residu standar untuk yang diambil sebesar 0,05 harus terletak diantara -1,96 sampai dengan 1,96 untuk menunjukkan kecocokan yang baik dengan model (Dessens et al, 2005).
Dengan pendekatan normal, diperoleh rumusan residu standar sebagai berikut:
1,96 1,96
f f f
E E O
Z (3.5)
dengan : Of adalah nilai untuk frekuensi yang diamati
Ef adalah nilai untuk frekuensi yang diharapkan
Nilai Z 1,96 menunjukkan bahwa model mempunyai kecocokan yang buruk terhadap frekuensi yang diamati.
(44)
3.7 Penyelesaian Contoh
Dibentuk tabel kontingensi tiga faktor sebagai berikut dan ingin diketahui sebuah model yang dapat menyatakan hubungan dalam kumpulan data dengan tepat:
Tabel 3.3 Tabel Hipotesis Data Untuk Analisis Frekuensi Multifaktor
Profesi Jenis Kelamin Jenis Bacaan
Total
Fiksi Ilmiah Novel
Laki-laki 38 25 63 Politikus
Perempuan 20 15 35
Laki-laki 12 27 39
Penari
Perempuan 18 30 48
Total 88 97 185
Penyelesaian:
Langkah awal yang dilakukan sebelum melakukan pemodelan adalah dengan membagi ketiga variabel kategorik yang ada menurut jenis skalanya masing-masing, yakni:
a. Variabel pertama (I) : Profesi. Profesi diukur melalui skala pengukuran nominal dengan kategorik : 0 bila profesinya politikus
1 bila profesinya penari
b. Variabel kedua (J) : Jenis bacaan. Jenis bacaan diukur melalui skala pengukuran nominal dengan kategorik : 0 bila jenis bacaan yang dibaca adalah fiksi ilmiah 1 bila jenis bacaan yang dibaca adalah novel c. Variabel ketiga (K) : Jenis kelamin. Jenis kelamin diukur melalui skala
pengukuran nominal dengan kategorik : 0 bila jenis kelaminnya laki-laki 1 bila jenis kelaminnya perempuan
(45)
Selanjutnya berdasarkan tabel kontingensi di atas, dilakukan pengujian keindependenan untuk mengetahui apakah terdapat hubungan yang signifikan antara profesi, jenis bacaan yang dibaca dan jenis kelamin dengan hipotesis sebagai berikut: H0 : Tidak ada hubungan antara profesi, jenis bacaan yang dibaca dan jenis kelamin.
(Pijk Pi..P.j.P..k)
H1 : Ada hubungan antara profesi, jenis bacaan yang dibaca, dan jenis kelamin.
(Pijk Pi..P.j.P..k)
Seperti yang diketahui pada pembahasan bab 2 sebelumnya, taksiran nilai harapan masing-masing sel untuk model loglinier tiga faktor yang independen, yaitu:
.. .2. ..
N Y Y Y
Eijk i j k , untuk i = 1-2, j = 1-2, dan k = 1-2
sehingga diperoleh: 98 35 63 ..
1
Y dan Y2.. 394887 88 18 12 20 38 . 1 .
Y dan Y.2. 2515273097 102 27 12 25 38 1 ..
Y dan Y..2 2015183083
Dengan demikian dapat dicari frekuensi harapan tiap-tiap sel, yakni: 1. Y111 38
E111
25,702 185 102 88 98 2 2 1 .. . 1 . ..1
N Y Y Y
2. Y112 20
E112
20,914 185 83 88 98 2 2 2 .. . 1 . ..1
N Y Y Y
3. Y121 25
E121
28,331 185 102 97 98 2 2 1 .. . 2 . ..1
N Y Y Y
4. Y122 15
E122
23,053 185 83 97 98 2 2 2 .. . 2 . ..1
N Y Y Y
(46)
5. Y211 12
E211
22,817 185 102 88 87 2 2 1 .. . 1 . ..2
N Y Y Y
6. Y212 18
E212
18,567 185 83 88 87 2 2 2 .. . 1 . ..2
N Y Y Y
7. Y221 27
E221
25,151 185 102 97 87 2 2 1 .. . 2 . ..2
N Y Y Y
8. Y222 30
E222
20,466 185 83 97 87 2 2 2 .. . 2 . ..2
N Y Y Y
18,852466 , 20 466 , 20 30 ... 914 , 20 914 , 20 20 702 , 25 702 , 25
38 2 2 2
2
, 024 , 19 466 , 20 30 ln 30 ... 914 , 20 20 ln 20 702 , 25 38 ln 38 2 2 G
dengan 21;0,05 3,841.
Dari hasil perhitungan yang telah diperoleh, nilai 2 atau G2 hitung sebesar 18,852 atau 19,024 dibandingkan dengan 21;0,05 3,841. Oleh karena nilai 2 atau G2 hitung lebih besar dari 21;0,05 3,841, maka H0 ditolak sehingga dapat dikatakan
terdapat hubungan antara profesi, jenis bacaan yang dibaca, dan jenis kelamin. Setelah diketahui terdapat hubungan diantara ketiga variabel yang diselidiki, maka akan dilakukan prosedur pemodelan loglinier untuk melihat lebih jauh komponen model lainnya yang akan signifikan dengan model yang akan terbentuk karena hasil uji yang telah diperoleh di atas belum cukup memberikan informasi tentang hal itu.
Informasi yang belum diketahui itu adalah mengenai apakah terdapat interaksi antara profesi, jenis bacaan, dan jenis kelamin. Oleh karenanya, pemodelan loglinier pertama yang digunakan dalam penelitian ini untuk membentuk modelnya ialah menggunakan metode Hirarkis Backward. Dalam pemodelan ini, harus dibentuk
(1)
2. Y112 20
20,71498 35 58 .. 1 2 . 1 . 11
112
Y Y Y E
3. Y121 25
25,71498 63 40 .. 1 1 . 1 . 12
121
Y Y Y E
4. Y122 15
14,28698 35 40 .. 1 2 . 1 . 12
122
Y Y Y E
5. Y211 12
13,44887 39 30 .. 2 1 . 2 . 21
211
Y Y Y E
6. Y212 18
16,55287 48 30 .. 2 2 . 2 . 21
212
Y Y Y E
7. Y221 27
25,55287 39 57 .. 2 1 . 2 . 22
221
Y Y Y E
8. Y222 30
31,44887 48 57 .. 2 2 . 2 . 22
222
Y Y Y E 527 , 0 448 , 31 30 ln 30 ... 714 , 20 20 ln 20 286 , 37 38 ln 38 2 2 G
Berdasarkan hasil pemodelan dengan dua metode yang telah dilakukan untuk contoh di atas ternyata memberikan hasil yang sama untuk membentuk model permasalahannya, yaitu:
logmˆijk iX Yj kZ ijXY ikXZ dengan:
(2)
logmˆijk = Logaritma dari frekuensi sel ijk
= rata – rata logaritma seluruh sel ijk
Xi = Parameter pengaruh Profesi yang ke-i ( i = 1 (politikus) dan i =
2
(penari) ) terhadap model
Yj = Parameter pengaruh Jenis Bacaan yang ke-j ( j = 1 (fiksi Ilmiah)
dan j = 2 (novel) ) terhadap model
Zk = Parameter pengaruh Jenis Kelamin yang ke-k ( k = 1 (laki-laki)
dan k = 2 (perempuan) ) terhadap model
ijXY = Parameter pengaruh interaksi Profesi yang ke-i dengan Jenis
Bacaan yang ke-j terhadap model
ikXZ = Parameter pengaruh interaksi Profesi yang ke-i dengan Jenis
Kelamin yang ke-k terhadap model
Dengan kata lain model ini menyatakan adanya depedensi yang signifikan antara Profesi dengan Jenis bacaan dan Profesi dengan Jenis kelamin.
Hal terpenting dari penyelesaian contoh soal di atas adalah diketahui bahwa metode yang lebih baik dalam membentuk model permasalahannya adalah menggunakan metode Hirarkis Backward berdasarkan hasil simulasi untuk tahap ke-3,
dengan melihat perubahan nilai rasio likelihood G2 dan p-value untuk setiap interaksi
yang ada di dalam model yang terbentuk itu harus lebih kecil dari sebesar 0,05 agar
signifikan, dibandingkan dengan metode Forward berdasarkan hasil simulasi untuk
tahap ke-5 dengan melihat nilai G2 yang kecil dan p-value yang maksimum dari
(3)
Untuk melihat hasil yang lebih jelasnya dapat dilihat pada tabel berikut: Tabel 3.8 Tabel Residu Untuk Model Akhir
Nilai Z yang diperoleh itu menunjukkan residu standar yang masih bernilai
kecil dan berada didalam range -1,96 sampai 1,96 sehingga memiliki kecocokan yang baik untuk sel itu. Kemudian hal yang sama dilakukan untuk nilai pengamatan sel lainnya yang ternyata juga menunjukkan hasil residu standar yang cukup kecil dan berada didalam range -1,96 sampai 1,96. Jadi kesimpulannya model ini memang sudah memberikan kecocokan yang baik karena mempunyai residu yang cukup kecil.
Cell Counts and Residuals
38,000 20,5% 37,286 20,2% ,714 ,117 20,000 10,8% 20,714 11,2% -,714 -,157 25,000 13,5% 25,714 13,9% -,714 -,141 15,000 8,1% 14,286 7,7% ,714 ,189 12,000 6,5% 13,448 7,3% -1,448 -,395 18,000 9,7% 16,552 8,9% 1,448 ,356 27,000 14,6% 25,552 13,8% 1,448 ,287 30,000 16,2% 31,448 17,0% -1,448 -,258 Jenis_kelamin
Laki-laki Perempuan Laki-laki Perempuan Laki-laki Perempuan Laki-laki Perempuan Jenis_bacaan
Fiksi ilmiah
Novel
Fiksi ilmiah
Novel Profesi
Politikus
Penari
Count % Observed
Count % Expected
Residuals
Std. Residuals
(4)
BAB 4
KESIMPULAN DAN SARAN
4.1 Kesimpulan
Berdasarkan hasil penelitian dan pembahasan pada bab – bab sebelumnya, maka pada bab yang merupakan bab terakhir dari skripsi ini, penulis mencoba menarik beberapa kesimpulan sebagai berikut:
1. Pemodelan loglinier dapat dilakukan dengan dua metode yakni dengan metode
Hirarkis Backward dan metode Forward yang mana setiap metode mempunyai kelebihan dan kekurangan masing-masing, yakni:
a) Kelebihan metode Hirarkis Backward
Lebih cepat dalam mengeliminasi komponen model karena proses eliminasi dimulai dari model yang mempunyai asosiasi yang paling tinggi yang dikenal sebagai model lengkap menuju model yang memuat asosiasi yang lebih rendah.
b) Kekurangan metode Hirarkis Backward
Proses seleksi akan menjadi sulit jika meningkatnya jumlah variabel yang akan diselidiki karena akan terjadi peningkatan yang semakin pesat dalam hal untuk
(5)
d) Kekurangan metode Forward
Pada metode ini harus dibentuk terlebih dahulu model sederhana kemudian membentuk lagi model yang menambahkan interaksi atau order yang lebih tinggi dari model yang pertama sampai model akhir itu benar-benar terbentuk sehingga memerlukan waktu yang cukup lama dalam pengerjaannya.
2. Dari contoh permasalahan yang telah dikerjakan metode yang lebih baik dalam membentuk model permasalahan yang sesuai dengan data adalah menggunakan metode Hirarkis Backward berdasarkan hasil simulasi untuk tahap ke-3, dengan
melihat perubahan nilai rasio likelihood G2 dan p-value untuk tiap-tiap
interaksi yang ada di dalam model yang terbentuk itu harus lebih kecil dari
sebesar 0,05 agar signifikan, dibandingkan dengan metode Forward berdasarkan
hasil simulasi untuk tahap ke-5 dengan melihat nilai G2 yang kecil dan p-value
yang maksimum dari model. Model yang terbentuk itu adalah: logmˆijk iX Yj kZ ijXY XZik
4.2 Saran
Pada tulisan ini, penulis hanya membahas tentang pemodelan loglinier yang memuat analisis hubungan antara tiga variabel kategorik dengan metode Hirarkis Backward dan metode Forward. Bagi para pembaca yang berminat dapat melanjutkan penelitian ini untuk menyelesaikan pemodelan loglinier dengan variabel kategorik yang melebihi tiga.
(6)
DAFTAR PUSTAKA
Agresti, A. 1990. Categorical Data Analysis. Canada: John Wiley & Sons,Inc.
Dessens, J and Jansen, W. 2005. Loglinear Analysis An Introduction. American Review. hal: 7-23.
Friel, C. M. 2005. Hierarchical Loglinear Analysis: A Statistical Technique for the
Analysis Of Frequency Data in Multiway Cross-Tabulation Cross. Criminal
Justice Center. Amerika: Sam Houston State University. hal 31-43. Friendly, M. 2000. Visualizing Categorical Data. Cary, NC: SAS Press. Focus on expressing loglinier results in plots.
Jeansonne, A. 2002. A history Loglinier Models. Introductory Topics. New York: Amerika Serikat.
Maindonald, J. H. 2001. Statistical Computation. New Zealand: John Wiley & Sons. Noah, A. S. 2004. Log-Linear Models. Proposal Riset Tesis. Amerika: Department of Computer Science / Center for Language and Speech Processing Johns Hopkins University.
Supranto, J. 1981. Statistik Teori dan Aplikasi. Erlangga: Jakarta.
Vermunt, J.K. 2005. LEM: Log-Linear Modelling. User’s manual. The Netherlands: Department of Methodology and Statistics, Tilburg University Press.
Von Eye, A. 2002. Configural Frequency Analysis, Lawrence Erlbaum Associates, Inc., London.