Pemodelan Loglinier G2 Menggunakan Metode Hirarkis Backward Dan Metode Forward

(1)

PEMODELAN LOGLINIER G

2

MENGGUNAKAN METODE

HIRARKIS BACKWARD DAN METODE FORWARD

SKRIPSI

SITI FATIMAH S

070803063

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

2011


(2)

PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS

BACKWARD DAN METODE FORWARD

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains

SITI FATIMAH S 070803063

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA

MEDAN 2011


(3)

PERSETUJUAN

Judul : PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD

Kategori : SKRIPSI

Nama : SITI FATIMAH S Nomor Induk Mahasiswa : 070803063

Program Studi : SARJANA (S1) MATEMATIKA Departemen : MATEMATIKA

Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA

Diluluskan di Medan, Juni 2011 Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Drs. Pasukat Sembiring, M.Si Dr. Sutarman, M.Sc

NIP. 19531113 198503 1 002 NIP. 19631026 199103 1 001

Diketahui/Disetujui oleh

Departemen Matenatika FMIPA USU Ketua,

Prof. Dr. Tulus, M.Si

NIP. 19620901 198803 1 002


(4)

PERNYATAAN

PEMODELAN LOGLINIER G2 MENGGUNAKAN METODE HIRARKIS BACKWARD DAN METODE FORWARD

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing – masing disebutkan sumbernya.

Medan, Juni 2011

SITI FATIMAH S 070803063


(5)

PENGHARGAAN

Puji dan syukur penulis panjatkan kepada Allah SWT yang telah memberikan rahmat dan hidayah-Nya sehingga skripsi ini dapat diselesaikan dalam waktu yang telah ditetapkan.

Penulis mengucapkan terima kasih kepada Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU dan Bapak Drs. Pasukat Sembiring, M.Si selaku para dosen pembimbing penulis pada penyelesaian skripsi ini yang telah mengarahkan penulis serta telah meluangkan waktu, tenaga, pikiran, dan bantuannya sehingga skripsi ini dapat selesai dengan tepat waktu. Kemudian ucapan terima kasih juga kepada Bapak Prof. Dr. Tulus, M.Si selaku Ketua Departemen Matematika, Ibu Dra. Mardiningsih, M.Si selaku Sekretaris Departemen Matematika di FMIPA USU dan Bapak Drs. Faigiziduhu Bu’ulolo, M.Si dan Bapak Drs. Suwarno Ariswoyo, M.Si selaku penguji skripsi, serta semua staf pengajar beserta para pegawai pada Departemen Matematika FMIPA USU yang banyak membantu penulis.

Penulis juga mengucapkan terima kasih teristimewa kepada Ayahanda penulis Alm Ir. Zakaria Sihotang dan Ibunda tercinta Adek Palem yang senantiasa memberikan do’a, bantuan serta dorongan dalam penyelesaian skripsi ini. Akhirnya penulis mengucapkan terima kasih kepada Siti Hardianti, Rina, Novi, Dian S, Memel, Kesi, Warsini, Rizky dan teman-teman lain yang tidak dapat penulis sebutkan namanya satu per satu atas bantuannya dalam menyelesaikan skripsi ini serta tidak lupa penulis mengucapkan terima kasih kepada Ibu Nasrah yang juga banyak membantu.

Penulis hanya bisa memanjatkan do’a semoga Allah SWT akan membalas segala kebaikan dan bantuan yang diberikan kepada penulis. Semoga apa yang penulis perbuat akan selalu diridhoi oleh sang pemilik ilmu. Amin Ya Robbal Alamin.

Akhirnya sebagai seorang mahasiswa, penulis menyadari bahwa masih banyak terdapat kekurangan dalam menyelesaikan skripsi ini. Oleh karena itu, kritik dan saran yang membangun diharapkan demi perbaikan skripsi ini.

Medan, Juni 2011 Penulis,


(6)

ABSTRAK

Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.


(7)

LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL

BACKWARD AND FORWARD METHOD

ABSTRACT

Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.


(8)

DAFTAR ISI

Halaman

Persetujuan ii

Pernyataan iii

Penghargaan iv

Abstrak v

Abstract vi

Daftar Isi vii-viii Daftar Tabel ix

Bab 1 Pendahuluan 1

1.1 Latar Belakang 1

1.2 Rumusan Masalah 3

1.3 Batasan Masalah 3

1.4 Tujuan Penelitian 4

1.5 Kontribusi Penelitian 4

1.6 Metodologi Penelitian 4

1.7 Tinjauan Pustaka 5

Bab 2 Landasan Teori 9

2.1 Analisis Model Loglinier 9

2.1.1 Distribusi Poisson 10

2.1.2 Model Loglinier Poisson 12

2.2 Asumsi Teorikal Untuk Model Loglinier 13

2.3 Tabel Kontingensi 15

2.3.1 Tabel Kontingensi Dua Faktor 15

2.3.2 Tabel Kontingensi Tiga Faktor 18

2.4 Pengujian Kecocokan Model 20

2.5 Seleksi Model 22

2.6 Metode Hirarkis Backward 23

2.7 Metode Forward 23

Bab 3 Pembahasan 24

3.1 Pendekatan Hirarkis untuk Pemodelan Loglinier 24

3.1.1 Model Lengkap 25

3.1.2 Model Non-lengkap 26

3.2 Konfigurasi Model Loglinier Tiga Faktor 27

3.3 Derajat Bebas 28

3.4 Algoritma Backward 28

3.5 Algoritma Forward 30

3.6 Analisis Residu 31


(9)

Bab 4 Kesimpulan dan Saran 47

4.1 Kesimpulan 47

4.2 Saran 48

Daftar Pustaka 49

Lampiran A: Output Nilai G2 dan Estimasi Parameter Untuk Model Lengkap 50 Lampiran B: Output Proses Eliminasi Hirarkis Backward 52 Lampiran C: Output Proses Penambahan Forward Secara Berurutan 54 Lampiran D: Nilai Kritis Distribusi Chi-Square

 

2 62


(10)

DAFTAR TABEL

Halaman

Tabel 2.1 Tabel Kontingensi I × J 16

Tabel 2.2 Tabel Kontingensi I × J × K 18

Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor 27

Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor 28

Tabel 3.3 Tabel Hipotesis Data Untuk Analisis Frekuensi Multifaktor 32

Tabel 3.4 Tabel Proses Eliminasi Hirarkis Backward 35

Tabel 3.5 Tabel Untuk K-faktor dan Efek Order yang Lebih Tinggi 38

Tabel 3.6 Tabel Asosiasi Parsial 40

Tabel 3.7 Tabel Proses Penambahan Forward Secara Berurutan 42

Tabel 3.8 Tabel Residu Untuk Model Akhir 46


(11)

ABSTRAK

Model loglinier adalah model dalam statistika yang digunakan untuk menentukan depedensi atau kecenderungan antara beberapa variabel yang berskala kategorikal. Jumlah variabel yang dibahas dalam penelitian ini sebanyak tiga variabel. Setelah variabel diselidiki, pembentukan model loglinier menjadi penting karena tidak semua interaksi faktor model yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Skripsi ini bertujuan melakukan pemodelan loglinier untuk mendapatkan suatu model menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang lebih baik dalam membentuk model yang cocok dengan data. Dari contoh yang dikerjakan Metode Hirarkis Backward lebih baik dalam membentuk model dibandingkan dengan metode Forward.


(12)

LOGLINIER MODELLING G2 USING THE METHOD OF HIERARCHICAL

BACKWARD AND FORWARD METHOD

ABSTRACT

Loglinier model is models in statistical that used to determine depedensi or a tendency among some variables categorical scale. The number of variables discussed in this study as many as three variables. After the variables investigated, the formation loglinier model is important because not all existing models of interaction factors in a complete model to be significant in a model produced. This paper aims to do loglinier modelling to get a model using the method of Hierarchical Backward and Forward method and compares both the methods to be selected as better method in forming model is fitting in with data. From example done Hierarchical Backward method is better in forming the model compared with the Forward method.


(13)

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Model Loglinier adalah salah satu kasus khusus dari general linier model untuk data yang berdistribusi poisson. Model loglinier juga disebut sebagai suatu model statistik yang berguna untuk menentukan depedensi (kecenderungan) antara beberapa variabel yang berskala kategorik. Variabel didefinisikan sebagai suatu yang beragam atau bervariasi dan skala kategorik merupakan transformasi fungsi nilai dari empat skala ukuran observasi yang ada yaitu skala nominal, ordinal, rasio dan interval. Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi. Tabel kontingensi digunakan jika terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam daftar baris dan kolom. Variabel kategorik yang ada dianalisis dengan mengambil nilai logaritma natural dari frekuensi untuk setiap sel dalam tabel kontingensi. Dari tabel kontingensi yang terbentuk, model loglinier akan menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Model loglinier tidak hanya dapat digunakan untuk menganalisis hubungan yang terjadi antar dua variabel kategorik, tetapi juga dapat digunakan untuk mengevaluasi tabel kontingensi multifaktor yang meliputi tiga variabel atau lebih.

Model loglinier sangat bergantung pada jumlah variabel yang akan dianalisis. Penggunaan variabel yang dibahas pada penulisan ini dikelompokkan pada dua jenis yaitu variabel dependen dan variabel independen. Variabel dependen adalah variabel yang keberadaannya dipengaruhi oleh variabel lainnya. Sedangkan variabel independen yaitu variabel yang bebas (tidak dipengaruhi oleh variabel lainnya).


(14)

Analisis loglinier digunakan untuk menganalisis pola hubungan antar sekelompok variabel kategorik yang mencakup mulai dari asosiasi satu variabel, asosiasi dua variabel, asosiasi tiga variabel atau lebih, baik secara simultan maupun secara parsial. Pola hubungan antar variabel dapat dilihat dari interaksi antar variabel itu sendiri, termasuk kemungkinan adanya hubungan sebab akibat atau hubungan kausal diantara variabel – variabel yang ada.

Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang diselidiki mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata lain, tidak ada pembedaan yang dibuat antara variabel dependen dan variabel independen karena model loglinier hanya menunjukkan depedensi (kecenderungan) antar variabel. Andaikan terdapat pembedaan yang dibuat antara satu atau lebih variabelnya yang diperlakukan sebagai variabel independen dan variabel lainnya sebagai variabel dependen, maka penggunaan analisis yang sesuai ialah dengan analisis Regresi Logistik. Analisis Regresi Logistik digunakan untuk memprediksi variabel yang bersifat kategorik (biasanya dikotomis) oleh seperangkat variabel independen (Jeansonne, 2002).

Analisis model loglinier bergantung pada jumlah variabel dependen yang termuat di dalamnya. Untuk penulisan ini akan diuraikan tentang model loglinier yang membahas analisis hubungan antara tiga variabel yang disebut dengan analisis trivariat. Model seperti ini disebut juga sebagai model loglinier tiga faktor. Model loglinier tiga faktor memuat semua parameter yang mungkin dan tidak dapat dimasuki oleh parameter – parameter lainnya. Model seperti ini disebut sebagai model lengkap. Secara umum model loglinier tiga faktor dapat ditulis sebagai berikut (Agresti, 1990):

logmˆijkiXYjkZijXYikXZYZjkijkXYZ Setelah jumlah variabel kategorik diselidiki, pembentukan model loglinier penting untuk diteliti yang berguna untuk menentukan kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Hal ini menjadi penting


(15)

karena tidak semua interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang ada pada model lengkap menjadi signifikan dalam suatu model yang dihasilkan. Tentunya akan menjadi suatu permasalahan jika semua interaksi dimasukkan secara sekaligus dalam model tanpa mengetahui terlebih dahulu kecocokan dari interaksi faktor model yang ada sebelum membentuk suatu model yang memang tepat dan signifikan setelah melalui uji kecocokan modelnya.

Dalam hal ini akan dilakukan teknik pemodelan loglinier yang akan digunakan sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk model permasalahan. Jenis prosedur yang penulis gunakan dalam penyelesaian pemodelan loglinier terbagi pada dua jenis, yaitu prosedur yang memakai metode Hirarkis Backward dan prosedur pemodelan yang menggunakan metode Forward.

Untuk keperluan analisis data yang memuat hubungan tiga variabel dengan menggunakan skala kategorik difokuskan pada bagaimana penentuan model dengan melakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun 3-faktor dengan menggunakan uji goodness of fit model G2 untuk menguji kecocokan modelnya. Pengolahan data dilakukan dengan software SPSS 15.0 for Windows.

1.2 Rumusan Masalah

Masalah yang akan dibahas dalam penulisan ini ialah melakukan prosedur pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward, kemudian membandingkan kedua metode dalam hal mendapatkan suatu model akhir yang menggambarkan hubungan antar variabel yang diselidiki.

1.3 Batasan Masalah

Ruang lingkup dari penulisan ini dibatasi pada melakukan suatu teknik pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward dengan uji rasio likelihood G2 untuk menguji kecocokan modelnya.


(16)

1.4 Tujuan Penelitian

Tujuan penulisan ini adalah melakukan prosedur pemodelan loglinier menggunakan metode Hirarkis Backward dan metode Forward dan membandingkan kedua metode tersebut untuk dipilih sebagai metode yang yang lebih baik dalam membentuk model.

1.5 Kontribusi Penelitian

Hasil penulisan ini adalah:

1. Dapat menerapkan analisis tabel kontingensi dan metode pemodelan loglinier yang ada untuk penyelesaian permasalahan yang berkaitan dengan berbagai bidang kehidupan agar lebih mudah diolah, sehingga jelas tujuannya.

2. Dengan penulisan ini penulis berharap dapat menambah referensi bagi pembaca yang dapat digunakan sebagai alat untuk mengklasifikasikan data yang ingin diteliti dalam memutuskan suatu masalah.

1.6 Metodologi Penelitian

Dalam penulisan ini penulis melakukan studi dengan meneliti buku-buku yang membahas mengenai model loglinier dan metode Hirarkis Backward dan Forward dalam hal pemodelannya, yaitu:

1. Mengumpulkan dan mempelajari buku-buku yang berkaitan dengan materi penulisan.

2. Menentukan jumlah variabel kategorik yang akan diselidiki sebelum dilakukan prosedur pemodelan.

3. Menguraikan perbedaan penyelesaian pemodelan loglinier menggunakan metode yang ada.


(17)

4. Pemodelan dilakukan melalui suatu proses seleksi sampai model akhir terbentuk yang mana setiap kali variabel dihapus maupun ditambahkan pada model, dilakukan pengujian terhadap interaksi faktor model baik tingkat 2-faktor maupun 3-faktor menggunakan uji rasio likelihood 2

G dan melihat p-value yang dihasilkan untuk menguji kecocokan modelnya. 5. Menyelesaikan contoh permasalahan untuk memilih metode yang lebih baik dalam membentuk suatu model.

1.7 Tinjauan Pustaka

Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi 2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan jumlah independen sehingga model seperti ini sering disebut juga sebagai model lengkap (chass.ncsu.edu, 3 Oktober 2010).

Secara umum model lengkap untuk tiga variabel kategorik dapat ditulis sebagai berikut (Agresti, 1990):

logmˆijkiXYjkZijXYikXZYZjkijkXYZ (1) dengan:

logmˆijk = Logaritma dari frekuensi sel ijk

 = konstanta atau rata – rata logaritma seluruh sel ijk X

i

= Parameter pengaruh variabel pertama yang ke-i terhadap model Yj = Parameter pengaruh variabel kedua yang ke-j terhadap model Z

k

= Parameter pengaruh variabel ketiga yang ke-k terhadap model ijXY = Parameter pengaruh interaksi variabel pertama yang ke-i dengan


(18)

variabel kedua yang ke-j terhadap model

ikXZ = Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model

YZjk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model

ijkXYZ = Parameter pengaruh interaksi variabel pertama yang ke-i, variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model

Dengan pendekatan loglinier angka – angka dalam sel dapat disusun dalam tabel kontingensi. Friendly (2000) menyatakan tabel kontingensi digunakan ketika terdapat lebih dari satu variabel kategorik, yang mana biasanya data disajikan dalam daftar baris dan kolom. Bentuk penyajian dalam daftar baris dan kolom ini biasanya disebut daftar kontingensi. Analisis tabel kontingensi ini merupakan teknik penyusunan data yang cukup sederhana untuk melihat hubungan antar variabel dalam satu tabel. Untuk menginterpretasikan data pada tabel kontingensi, salah satu yang dapat digunakan adalah dengan uji Chi-Square.

Uji Chi-Square dilambangkan dengan 2

, yang digunakan untuk mengetahui adanya hubungan antara variabel yang diukur signifikan atau tidak. Dalam hal ini analisis variabel yang diukur sebanyak tiga variabel atau yang disebut sebagai analisis trivariat. Hipotesis yang berlaku untuk ketiga variabel yang independen dengan asumsi tidak terdapat interaksi antar variabel, yaitu:

H0 :PijkPi..P.j.P..k H1:PijkPi..P.j.P..k

Statistik uji Chi-Square yang digunakan untuk menguji hubungan antar variabel dapat dirumuskan sebagai berikut:



i j k ijk

ijk ijk

m m Y

ˆ ˆ 2 2

(2)


(19)



    

i j k ijk

ijk ijk

m Y Y

G

ˆ ln 2

2

(3)

dengan: ijk

Y = Observasi pada variabel i, j, dan k

ijk

mˆ = Frekuensi yang diharapkan untuk Yijk

degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05 Kriteria uji:

Tolak H0 jika 2 atau G2 hitung  2df; dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆijkiXYjZk diterima.

Pencarian Solusi

Pencarian solusi permasalahan pemodelan loglinier dapat dilakukan dengan menentukan suatu model secara fleksibel dan mendalam serta memilih variabel independen secara inklusif dengan tepat. Hal ini memungkinkan untuk menemukan variabel independen yang terbaik yang dapat dipakai serta melihat pada kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Dalam hal ini dapat menggunakan beberapa metode yang akan digunakan sebagai perbandingan dalam pemilihan metode yang lebih baik dalam membentuk suatu model akhir. Metode – metode itu diantaranya adalah metode iteratif Hirarkis Backward, Forward dan lain – lain.

1) Metode Hirarkis Backward

Pemodelan loglinier dengan metode Hirarkis Backward akan membentuk model hirarkis yang menyatakan hubungan dalam kumpulan data dengan tepat. Dilakukan


(20)

dengan menyeleksi model lengkap dan mulai menghapus interaksi yang lebih tinggi sampai uji kecocokan dari model menjadi tidak dapat diterima lagi berdasarkan standar probabilitas atau p-value yang diadopsi oleh penyidik. Model lengkap mencakup semua kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun 3-faktor sesuai dengan jumlah variabel yang diselidiki dalam penelitian ini. Dimana setiap kali variabel dihapus dilakukan uji statistik untuk menentukan akurasi prediksinya dengan membandingkan uji rasio likelihood G2 dengan 2df; (Chapter 14, 2 November 2010).

2) Metode Forward

Penggunaan metode forward yang digunakan dalam penelitian ini menggunakan dua cara yang berbeda namun prinsipnya hampir sama. Agresti (1990) menjelaskan pengerjaan metode ini dimulai dengan dibentuknya model independen dan menambahkan istilah interaksi yang lebih kompleks sampai suatu hasil uji fit diterima yang tidak dapat ditingkatkan dengan menambahkan peraturan lebih lanjut. Dengan kata lain, metode ini memilih variabel terlemah hingga terkuat secara bertahap.

Friel (2005) menjelaskan pemodelan loglinier dengan metode forward dilakukan dengan dibentuknya model sederhana (model order nol) kemudian menambahkan efek order pertama, order kedua, dan order ketiga untuk diuji kecocokan datanya.


(21)

BAB 2

LANDASAN TEORI

2.1 Analisis Model Loglinier

Untuk data yang bersifat kategorik dan dapat dibentuk pada suatu tabel kontingensi, dapat dianalisis dengan analisis model loglinier. Model loglinier digunakan untuk menganalisis kemungkinan adanya hubungan yang signifikan dalam tabel kontingensi multifaktor yang memiliki tiga atau lebih variabel kategorik yang diterapkan pada kasus-kasus data kualitatif. Dalam hal ini pola hubungan atau asosiasi antar variabelnya dapat dilihat dari interaksi antar variabel itu sendiri.

Pada umumnya terdapat dua jenis data berdasarkan pengklasifikasiannya, yakni data kuantitatif dan data kualitatif. Data kuantitatif adalah data yang berbentuk angka atau data yang diukur dalam skala numerik yang diperoleh melalui suatu hasil perhitungan dan pengukuran. Sedangkan data kualitatif adalah data yang menunjukkan sifat atau keadaan objek berupa label atau nama-nama yang digunakan untuk mengidentifikasi atribut suatu elemen yang mana dalam hal pengumpulannya disajikan menurut kualitas atau kategorik yang digunakan. Dalam hal ini yang akan dipergunakan dalam model loglinier ialah data kualitatif karena variabel yang dianalisis merupakan variabel kategorik yang memiliki skala nominal atau ordinal.

Secara umum bentuk model loglinier dapat ditulis sebagai berikut (Von eye, 2002):

log ˆ ...,

int sec

int

0    

eraction ondorder

ijk eraction

firstorder ij s

maineffect i ijk

m (2.1)


(22)

Adapun tujuan dari melakukan analisis model loglinier adalah:

1. Pada analisisnya difokuskan pada kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel.

2. Untuk menghitung atau memperkirakan banyaknya observasi yang diharapkan (expected counts) dalam tiap-tiap sel populasi dari tabel yang dibentuk oleh kelompok yang diperhatikan.

Pada analisis model loglinier, prosedur untuk pemasukan variabel - variabel ke dalam model dilakukan secara independen dan berguna untuk menjelaskan distribusi kasus dalam tabulasi silang untuk variabel kategorik. Dengan demikian, analisisnya meliputi distribusi yang diharapakan dari variabel kategorikal tersebut ialah distribusi Poisson yang akan membentuk suatu model Poisson.

2.1.1 Distribusi Poisson

Distribusi Poisson dibangun atas suatu percobaan yang menghasilkan jumlah sukses yang terjadi pada interval waktu ataupun pada daerah tertentu yang dikenal sebagai

percobaan Poisson. Percobaan Poisson adalah percobaan yang menghasilkan peubah

acak X yang bernilai numerik, yaitu jumlah sukses selama selang waktu tertentu atau dalam daerah tertentu. Selang waktu tertentu dapat berupa sedetik, semenit, sejam, sehari, seminggu maupun sebulan. Daerah tertentu dapat berupa satu meter, satu kilometer persegi dan lain-lain.

Distribusi Poisson adalah distribusi kemungkinan dari variabel acak Poisson x yang menjelaskan jumlah sukses yang terjadi pada interval waktu ataupun daerah tertentu. Dinotasikan sebagai:

 

! . ;

x e x

p

x


(23)

dengan:

= jumlah rata-rata sukses terjadi e = bilangan natural = 2,71828...

Distribusi Poisson ini juga merupakan salah satu model distribusi probabilitas untuk variabel diskrit. Model ini merupakan model pendekatan untuk menghitung probabilitas timbulnya gejala yang diharapkan (gejala “sukses”) dari sejumlah n peristiwa atau sampel. Ciri distribusi seperti itu memiliki kemiripan yang hampir sama dengan distribusi Binomial. Tetapi, untuk kasus nilai n yang sangat besar (n  ) dan peluangnya yang sangat kecil (p  0) sukar sekali menghitung nilai probabilitasnya dengan model distribusi Binomial. Oleh karena itu, nilai probabilitas dapat dihitung dengan pendekatan Distribusi Poisson.

Sekarang andaikan X adalah variabel acak binomial dengan distribusi probabilitas b(x;n, p). Jika n  , p  0, dan np konstan, maka distribusi Binomial dapat didekati oleh distribusi Poisson, yakni:

b(x; n, p) p(x; )

b

x;n,p

Cxnpx

 

1 p nx n,p0

 

! . ;

x e x

p

x

 

Ekspektasi Harapan Distribusi Poisson

Distribusi Poisson merupakan salah satu dari beberapa distribusi probabilitas diskrit. Variabel acak yang terdapat pada distribusi ini jelas bersifat diskrit (berdasarkan hasil hitungan). Nilai harapan variabel acak diskrit adalah rata-rata tertimbang dari seluruh kemungkinan.

Secara umum, rumus untuk nilai ekspektasi probabilitas diskrit adalah:

E(X)x

xi.p

 

xi (2.3)


(24)

 

    0 ! . . x x x e x X E

    

0( )( 1)! . . x x x x e

x

    

0( 1)! . x

x

x

e

            1 1 1 1 )! 1 ( . )! 1 ( . x x x x x e x e

jika x1 y, maka bentuk

     1 1 )! 1 ( . x x x e =

   0 ! . y y y e . karena

    0 1 ! . y y y e

, maka diperoleh

 

 1. ! . 0 y y y e

. Jadi, ekspektasi harapan untuk distribusi Poisson adalah .

2.1.2 Model Loglinier Poisson

Seperti yang penulis sebutkan pada bab awal penulisan, model loglinier merupakan salah satu kasus khusus dari general linier model. Dalam hal ini komponen acak merupakan salah satu jenis dari tiga komponen utama untuk general linier model. Komponen acak berguna untuk mengidentifikasi distribusi probabilitas dari variabel dependen, dengan memisalkan yi = (y1, y2, . . . , yk). Sehingga bentuk fungsi peluangnya adalah:

f

yi;i

    

ai b yi exp

yi

 

i

(2.4) Kelompok ini memuat beberapa distribusi yang penting sebagai kasus khusus, misalnya distribusi Poisson. Nilai parameter i pada persamaan (2.4) untuk i =1, 2, 3, . . . , k tergantung pada nilai dari variabel peramalnya yaitu sebagai variabel independennya. Suku

 

i disebut sebagai parameter asli dari distribusinya.


(25)

Kemudian dengan memisalkan y jumlah observasi di dalam sel i yang terdistribusi i

Poisson dengan rata-rata i, maka fungsi padat peluang Poisson untuk y adalah: i

! . ; i y i i i y e y f i i  

 

! exp i y i y i i

 

i

 

i

i

i y

y

exp log ! 1 exp    

 (2.5) Dengan yi adalah bilangan bulat positif.

Persamaan (2.5) sama saja dengan bentuk eksponensial sejati pada persamaan (2.4) yang mana a

   

ia i exp

 

i ,

 

! 1 i i y y

b  , dan

 

i log

 

i dengan

 

i sebagai parameter sejati.

Untuk distribusi Poisson dalam kaitannya dengan istilah struktur yang sistematis dari sebuah model, dapat dipertimbangkan tiga jenis model loglinier untuk menghitung frekuensi yang diharapkan, yaitu: model order nol, model penambahan, dan model lengkap. Inilah pembagian jenis model yang akan dipergunakan sebagai pemilihan dalam menentukan apakah salah satu dari ketiga jenis model di atas dapat digunakan untuk mewakili hubungan dari kumpulan data dalam pemodelan loglinier yang akan dilakukan.

2.2 Asumsi Terorikal Untuk Model Loglinier

Dalam model loglinier, terdapat suatu asumsi bahwa semua variabel yang diselidiki mempunyai status yang sama sebagai suatu variabel dependen. Dengan kata lain, tidak ada pembedaan yang dibuat antara variabel dependen dan variabel independen karena model loglinier hanya menunjukkan depedensi (kecenderungan) antar variabel. Namun apabila ternyata pada suatu penelitian diasumsikan bahwa variabel-variabel


(26)

tersebut terbagi menjadi variabel independen dan dependen, maka (Von eye, 2002) terdapat beberapa hal yang harus diperhatikan. Berikut ini akan dijelaskan beberapa contoh model loglinier yang biasa digunakan.

Jika tidak ada variabel yang mempengaruhi model (zero-order), model loglinier secara umum (Von eye, 2002) adalah sebagai berikut:

logE(Y) (2.6) dengan: E(Y) Frekuensi yang diharapkan dalam setiap sel

constant atau rata-rata umum

Jika semua variabel mempunyai status yang sama, dan hanya Main effect atau efek utama yang digunakan (first-order), model loglinier secara umum (Von eye, 2002) adalah sebagai berikut:

logE(Yij..)iXYj ... (2.7)

dengan: E(Yij..) = Frekuensi yang diharapkan dalam setiap sel

 = constant atau rata-rata umum

Xi = Parameter pengaruh tingkat ke-i faktor X Yj = Parameter pengaruh tingkat ke-j faktor Y

Jika variabel-variabel yang akan diteliti terbagi menjadi variabel independen dan variabel dependen, dimisalkan terdapat dua variabel independen A dan B dan dua variabel dependen C dan D, model loglinier yang dipergunakan adalah sebagai berikut (Von eye, 2002):

E

 

YijklAiBjABijCkDlCDkl (2.8) dengan: E

 

Yijkl = Frekuensi yang diharapkan dalam setiap sel

 = constant atau rata-rata umum A = Pengaruh tingkat ke-i faktor A i


(27)

Bj = Pengaruh tingkat ke-j faktor B

ABij = Interaksi tingkat ke-i dan j faktor A dan B

C = Pengaruh tingkat ke-k faktor C k

D = Pengaruh tingkat ke-l faktor D l

CD = Interaksi tingkat ke-k dan l faktor C dan D kl

Model tersebut diasumsikan bahwa penelitian tidak menginginkan adanya interaksi antar variabel independen dan variabel dependen.

2.3 Tabel Kontingensi

Tabel kontingensi merupakan suatu analisis teknik penyusunan data yang cukup sederhana untuk melihat hubungan antar variabel dalam satu tabel (Friendly, 2000). Dalam hal ini, variabel yang dianalisis merupakan variabel kategorik yang memiliki skala nominal atau ordinal. Penggunaan tabel kontingensi yang akan dibahas pada penelitian ini penulis kelompokkan menjadi dua yaitu tabel kontingensi dua faktor dan tabel kontingensi tiga faktor.

2.3.1 Tabel Kontingensi Dua Faktor

Tabel kontingensi mulai digunakan ketika terdapat lebih dari satu variabel kategorik yang mana biasanya data disajikan dalam daftar baris dan kolom. Bentuk penyajian dalam daftar baris dan kolom ini biasanya disebut daftar kontingensi. Andaikan terdapat suatu percobaan yang terdiri dari n pengamatan yang diklasifikasikan

menurut 2 variabel kategorik, maka variabel 1 mempunyai i tingkat/kategorik: A1,

A2, A3, . . . , Ai dan variabel 2 mempunyai j tingkat/kategorik: B1, B2, B3, . . . , Bj .

Kemudian anggap Yij menyatakan banyak peristiwa variabel-1 ada pada

tingkat ke-i dan variabel-2 pada tingkat ke-j, dengan i = 1, 2, 3, . . . , I dan j = 1, 2, 3, . . . , J . Maka data tersebut dapat disusun dalam tabel kategorik I × J sebagai berikut:


(28)

Tabel 2.1 Tabel Kontingensi I × J

Variabel 2

B 1 B 2 B . . . 3 Bj Jumlah baris Variabel 1

A 1 Y 11 Y 12 Y . . . 13 Y1j n 1

A 2 Y 21 Y 22 Y . . . 23 Y2j n 2

A 3 Y 31 Y 32 Y . . . 33 Y3j n 3

. . . . . . . . . . . . . . . . . . A i Y b1 Y b2 Y . . . b3 Ybj n i

Jumlah kolom m 1 m 2 m . . . 3 mj nm1 ...mjn1...ni

Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk masing-masing sel dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk A dan i

j

B . Probabilitas untuk A = i P dan probabilitas untuk i. Bj = P.j. Kemudian, untuk menghitung besarnya P dan i. P.j dapat ditaksir dengan

N n Pˆi.  i ,

N m

Pˆ.jj , sehingga taksiran nilai harapannya adalah

N m n P P N

mij i j i j

. ˆ . ˆ .

ˆ  . .  .

Dari tabel kontingensi dua faktor yang terbentuk, model loglinier akan menggambarkan pola asosiasi atau hubungan yang terjadi antar variabel. Dengan demikian, bentuk model loglinier untuk dua faktor dapat ditulis sebagai berikut:


(29)

Model di atas disebut sebagai model lengkap karena memasukkan semua efek yang mungkin terbentuk, baik itu efek untuk 1-faktor dan juga efek 2-faktor. Sebagai contoh misalkan dalam tabel kontingensi 2X2, maka akan terdapat empat parameter yang terdiri dari ,iX,Yj,ijXY. Kemudian jika ingin mendapatkan sebuah model yang dapat menghilangkan salah satu efek di atas yang tidak memberikan kecocokan terbaik dengan model, maka model non-lengkap harus dibentuk.

Pembentukan model ini dapat dilakukan dengan membuat beberapa efek parameter menjadi bernilai nol. Misalkan dianggap ijXY 0 (diasumsikan bahwa variabel X tidak berasosiasi dengan variabel Y), maka model yang terbentuk akan menjadi model loglinier non-lengkap sebagai berikut:

logmˆijiXYj (2.10) Bentuk model seperti ini disebut sebagai model independen karena hanya memuat efek utamanya saja yakni X dan Y tanpa interaksi.

Uji keindependenan model loglinier untuk dua faktor, yaitu:

j i ij PP

P

H0 :  . .

j i ij P P

P

H1:  . .

Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:



i j ij ij ij m m Y ˆ ˆ 2 2

(2.11) Sedangkan untuk uji kecocokan datanya dengan uji Rasio Likelihood dapat dirumuskan:



    

i j ij

ij ij m Y Y G ˆ ln 2 2 (2.12) dengan: ij

Y = Observasi pada variabel i dan j

ij

mˆ = Frekuensi yang diharapkan untuk Yij


(30)

Kriteria Uji:

Tolak H0 jika 2 atau G2 hitung  2df; dengan kata lain terdapat asosiasi antara dua variabel yang diselidiki dan terima H0 jika 2 hitung < 2df; dengan kata lain model logmˆijiXYj diterima.

2.3.2 Tabel Kontingensi Tiga Faktor

Seperti halnya pada tabel kontingensi I × J yang mempunyai i

tingkat/kategorik untuk variabel pertama dan mempunyai j tingkat/kategorik untuk variabel kedua, maka pada tabel kontingensi I × J × K juga berlaku sama. Misal Yijk

menyatakan banyak peristiwa variabel-1 ada pada tingkat ke-i, variabel-2 pada tingkat ke-j, dan variabel-3 pada tingkat ke-k, dengan i = 1, 2, 3, . . . , I , j = 1, 2, 3, . . . , J dan k = 1, 2, 3, . . . , K. Maka data tersebut dapat disusun dalam tabel kategorik

I × J × K sebagai berikut:

Tabel 2.2 Tabel Kontingensi I × J × K

Variabel 2

Jumlah

1 2 ... j

Variabel 3 1 2 ... k

V a r i a b e l 1

1 ... ..

2 ... ..

⋮ ⋮ ⋮ … ⋮ ⋮

i … ..


(31)

Berdasarkan tabel kontingensi di atas, taksiran nilai harapan untuk tiap sel dapat dicari dengan menghitung terlebih dahulu besarnya probabilitas untuk Yi.., Y. j.,

dan Y..k. Probabilitas untuk Yi.. = P , probabilitas untuk i.. Y. j. = P. j. dan probabilitas untuk Y..k = P..k. Kemudian, untuk menghitung besarnya P , i.. P. j., dan P...k dapat

ditaksir dengan

N Y

P i

i .. ..

ˆ ,

N Y

Pˆ.j.  .j., dan

N Y

P k

k .. ..

ˆ , sehingga taksiran nilai

harapannya adalah mˆijkN.Pi..P.j.P..k

 

..

 

.2.

 

..

N Y Y

Yi j k

 .

Dari tabel kontingensi tiga faktor yang terbentuk, model loglinier akan menggambarkan pola asosiasi atau hubungan yang terjadi antar tiga variabel. Dengan demikian, bentuk lengkap model loglinier untuk tiga faktor dapat ditulis sebagai berikut (Agresti, 1990):

logmˆijkiXYjkZijXYikXZYZjkijkXYZ (2.13) dengan:

logmˆijk = Logaritma dari frekuensi sel ijk  = rata – rata logaritma seluruh sel ijk

Xi = Parameter pengaruh variabel pertama yang ke-i terhadap model Yj = Parameter pengaruh variabel kedua yang ke-j terhadap model Zk = Parameter pengaruh variabel ketiga yang ke-k terhadap model ijXY = Parameter pengaruh interaksi variabel pertama yang ke-i dengan variabel kedua yang ke-j terhadap model

XZ ik

= Parameter pengaruh interaksi variabel pertama yang ke-i dan variabel ketiga yang ke-k terhadap model

YZjk = Parameter pengaruh interaksi variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model

ijkXYZ = Parameter pengaruh interaksi variabel pertama yang ke-i, variabel kedua yang ke-j dan variabel ketiga yang ke-k terhadap model


(32)

Kemudian, jika diasumsikan dari model di atas interaksi ijXY, ikXZ, ikXZ, YZjk , serta XYZ

ijk

bernilai 0, maka hal ini berarti X, Y,dan Z secara masing-masing tidak berasosiasi dan hanya main effects (efek utama) nya saja yang berhubungan secara independen. Model loglinier independen untuk tiga faktor dapat ditulis sebagai berikut:

logmˆijkiXYjZk (2.14) Uji keindependenan model loglinier untuk tiga faktor, yaitu:

H0 :PijkPi..P.j.P..k H1:PijkPi..P.j.P..k

Statistik uji yang digunakan adalah uji Chi-Square dengan rumusan sebagai berikut:



i j k ijk ijk ijk

m m Y

ˆ ˆ 2 2

(2.15) dengan:

ijk

Y = Observasi pada variabel i, j, dan k

ijk

mˆ = Frekuensi yang diharapkan untuk Yijk

degree of freedom adalah (I-1)(J-1)(K-1) dan diambil = 0,05

Kriteria Uji:

Tolak H0 jika 2 hitung  2df; dengan kata lain terdapat asosiasi antar ketiga variabel dan terima H0 jika 2 hitung < 2df; dengan kata lain model

Z k Y

j X i ijk

mˆ 

log diterima.

2.4 Pengujian Kecocokan Model

Pengujian analisis model loglinier dapat dilakukan dengan dua pendekatan uji statistik yang ada, yaitu uji Chi-Square dan uji Rasio Likelihood G2.


(33)

1. Pendekatan Uji Chi-Square

Uji Chi-Square yang digunakan untuk mengetahui hubungan dari tiga variabel yang diselidiki dapat ditulis sebagai:



i j k ijk

ijk ijk

m m Y

ˆ ˆ 2 2

(2.16)

2. Pendekatan Uji Rasio likelihood G2

Pendekatan ini digunakan untuk menguji kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel. Dengan kata lain uji ini melihat seberapa cocok model dengan data. Untuk tabel tiga faktor dapat ditulis sebagai berikut:



    

i j k ijk

ijk ijk

m Y Y

G

ˆ ln 2

2

(2.17)

degree of freedom nya disesuaikan dengan model yang terbentuk selama proses

seleksi dan diambil 0,05

Kriteria uji:

Tolak H0 jika 2 atau G2  2df; atau p-value < yang berarti terdapat hubungan yang signifikan antar interaksi variabel ataupun komponen yang sedang diuji sehingga menyebabkan adanya depedensi dan terima H0 jika 2 atau G2 

2df; yang berarti tidak terdapat hubungan yang signifikan.

Pengujian statistik rasio likelihood ini tidak hanya dapat digunakan untuk menguji satu model saja, tetapi juga dapat digunakan terhadap dua model untuk melihat perubahan nilai yang ada. Pada titik ini uji rasio likelihood dapat digunakan untuk membandingkan model secara keseluruhan dengan model yang lebih rendah (yaitu membandingkan model lengkap dengan satu interaksi atau pengaruh utama yang lebih rendah) untuk menilai hubungan diantara kedua model itu. Persamaannya dapat ditulis sebagai berikut (Jeansonne, 2002):


(34)

 

2

 

1 2

2 2

M G M G

G perbandingan   (2.18)

 

2 2

M

G = statistik likelihood G2 untuk model (2)

 

1

2

M

G = statistik likelihood G2 untuk model (1)

Derajat kebebasan (degree of freedom) = derajat kebebasan model (2) - derajat kebebasan model (1).

2.5 Seleksi Model

Bagian ini menjelaskan tentang strategi untuk memilih model loglinier setelah variabel kategorik diselidiki. Strategi dasar dalam pemodelan loglinier melibatkan model yang cocok untuk frekuensi yang diamati dalam tabulasi silang variabel kategorik. Model kemudian dapat diwakili oleh satu set frekuensi harapan yang mungkin. Setelah frekuensi harapan diperoleh, kemudian membandingkan model-model yang hirarkis satu sama lain dan menyeleksi model-model yang terbentuk yang merupakan model yang paling signifikan yang sesuai dengan data.

Dalam hal pengerjaannya proses seleksi untuk memilih model akan menjadi sulit bersamaan dengan meningkatnya jumlah variabel karena terjadinya peningkatan yang pesat dalam asosiasi yang mungkin dan interaksi yang ada. Pencocokan semua model yang mungkin menjadi tidak praktis ketika jumlah variabel kategorik melebihi tiga. Oleh karena itu, seleksi model bertujuan untuk menyeimbangkan dua tujuan yang membahas beberapa hal di bawah ini (Friel, 2005):

a. Permasalahan mengenai komponen manakah dari model yang signifikan. b. Manakah model yang paling cocok dengan data yang digunakan.

Maka dari itu, terdapat dua metode yang digunakan untuk menentukan signifikansi dari komponen-komponen dalam model yaitu dengan dengan Metode Hirarkis Backward dan Metode Forward.


(35)

2.6 Metode Hirarkis Backward

Metode Hirarkis Backward digunakan untuk menganalisis proses terbentuknya sebuah model loglinier hirarkis non-lengkap yang dilakukan dengan menyeleksi dari model lengkap hingga pada model yang sederhana. Model lengkap mencakup semua kemungkinan efek interaksi baik itu efek interaksi 2-faktor maupun 3-faktor sesuai dengan jumlah variabel yang digunakan dalam penelitian ini, yakni sebanyak tiga variabel kategorik. Dimana setiap kali variabel dihapus dilakukan uji statistik untuk menentukan akurasi prediksinya dengan membandingkan uji rasio likelihood 2

G

dengan 2df; (Chapter 14, hal: 144). Mengingat bahwa model lengkap ini memiliki jumlah yang sama sel-sel nya dalam tabel kontingensi, seperti halnya efek dan frekuensi sel yang diharapkan akan selalu bernilai sama dengan frekuensi yang diamati tanpa derajat kebebasan yang tersisa (Knoke dan Burke, 1980 dikutip dari Jeansonne).

Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat ditulis sebagai berikut:

logmˆijkiXYjkZijXYikXZYZjkijkXYZ

2.7 Metode Forward

Metode Forward digunakan untuk menganalisis proses penambahan komponen-komponen model menjadi signifikan untuk model akhir dengan dibentuknya sebuah model order nol kemudian menambahakan efek order pertama, order kedua, dan order ketiga. Setelah itu, pada setiap tahap dipilih efek order yang memberikan peningkatan signifikansi terbesar dalam kesesuaian datanya setelah dilakukan pengujian (Friel, 2005). Akan tetapi, (Agresti, 1990) menjelaskan metode ini lebih dikenal sebagai suatu metode yang digunakan untuk mengevaluasi sebuah model yang proses pemodelannya dilakukan dengan dibentuknya model independen sampai model lengkap. Nilai p-maksimum untuk model yang dihasilkan adalah kriteria yang mungkin karena akan menghasilkan nilai G2 yang kecil, yang berarti baik untuk model. Bentuk umum model loglinier order nol untuk tiga variabel kategorik, yaitu: logmˆijk (2.19)


(36)

BAB 3

PEMBAHASAN

3.1 Pendekatan Hirarkis Untuk Pemodelan Loglinier

Untuk menyelesaikan suatu masalah yang berhubungan dengan model yang akan terbentuk dari variabel kategorik yang diselidiki, maka pemodelan loglinier penting untuk dilakukan. Hal ini berguna untuk menentukan kecocokan model yang memperhatikan ada atau tidaknya interaksi antar variabel karena ternyata tidak semua interaksi faktor model baik tingkat 2-faktor maupun 3-faktor yang ada pada model lengkap menjadi signifikan dalam suatu model yang akan terbentuk. Tentunya akan menjadi suatu permasalahan jika semua interaksi dimasukkan secara sekaligus dalam model tanpa mengetahui terlebih dahulu kecocokan dari interaksi faktor model yang ada sebelum membentuk suatu model yang memang tepat dan signifikan setelah melalui uji kecocokan datanya.

Dalam hal ini untuk mendapatkan model yang dapat mewakili kumpulan data secara tepat yang berkaitan dengan hal di atas, cara yang dapat dilakukan adalah dengan melakukan suatu teknik pemodelan loglinier dengan dua metode, yakni dengan metode Hirarkis Backward dan metode Forward. Metode-metode ini dapat diselesaikan dengan bantuan program komputer.

Metode Hirarkis Backward dapat digunakan untuk menguji satu per satu model yang memuat efek 1-faktor untuk setiap variabel serta semua efek interaksi 2-faktor dan interaksi 3-2-faktor. Apabila melalui hasil uji terdapat interaksi yang tidak memberikan kecocokan yang baik dengan data, maka harus dikeluarkan dan begitu seterusnya. Dengan demikian, metode ini lebih dikenal dengan mengeliminasi model lengkap menjadi model non-lengkap.


(37)

3.1.1 Model Lengkap

Model loglinier merupakan perluasan bentuk logaritma natural dari frekuensi untuk setiap sel sama dengan mean (konstan, mu) ditambah parameter lambda untuk memperkirakan pengaruh independen pertama, ditambah dengan lambda untuk setiap independen lain, ditambah lambda untuk semua efek interaksi baik itu efek interaksi 2-faktor, 3-faktor ataupun efek interaksi untuk order yang lebih tinggi sesuai dengan jumlah independen sehingga model seperti ini sering disebut juga sebagai model lengkap (chass.ncsu.edu, 3 Oktober 2010).

Dari persamaan (2.13) model lengkap untuk tiga variabel kategorik dapat ditulis sebagai berikut:

logmˆijkiXYjkZijXYXZikYZjkijkXYZ

Perlu dicatat bahwa transformasi logaritma dari mˆijk bisa dilakukan karena hal

itu membatasi agar frekuensi yang diharapkan tetap dalam kisaran yang dapat diterima. Konsekuensi dari menentukan model loglinier untuk logmˆijk adalah

diperolehnya model multiplikatif untuk mˆijk, yaitu:

mˆijk exp

iXYjkZijXYikXZYZjkijkXYZ

iXYjkZijXYYZjkYZjkijkXYZ (3.1) Dari persamaan di atas dapat dilihat bahwa model lengkap berisi semua

variabel yang dianalisis dan semua interaksi yang mungkin antara variabel X, Y, dan Z yang tidak ada pembatasan yang dikenakan pada data sesuai dengan prinsip hirarkis yakni memasukkan semua order yang paling tinggi dengan order yang lebih rendah tetap ada didalam model. Namun, dari persamaan (2.13) dan (3.1) mengandung terlalu banyak parameter yang akan diidentifikasi. Mengingat nilai untuk frekuensi yang diharapkan mˆijk tidak ada solusi unik untuk parameter-parameter dan . Oleh karena itu, batasan-batasan harus dipaksakan pada parameter model loglinier untuk membuat parameter-parameter itu lebih mudah diidentifikasi. Salah satu pilihan adalah menggunakan batasan sebagai berikut, yaitu (Vermunt, 2005):


(38)

k

Z k

i j

Y j X

i 0

,

i j i k j k

YZ jk YZ

jk XZ

ik XZ

ik XY

ij XY

ij 0

,

i j k

XYZ ijk XYZ

ijk XYZ

ijk 0

,

Parameterisasi seperti ini di mana setiap satuan jumlah parameter menjadi bernilai nol atas masing-masing tandanya disebut effect coding. Pada effect coding,  dinotasikan sebagai rata-rata untuk logmˆijk.

3.1.2 Model Non-lengkap

Seperti disebutkan di atas, dalam model loglinier lengkap semua kemungkinan interaksi ada. Dengan kata lain, tidak ada pembatasan yang dikenakan pada parameter-parameter model selain dari pembatasan untuk mengidentifikasi. Namun, pembatasan parameter-parameter model menjadi penting dilakukan karena bertujuan untuk menentukan dan menguji model yang lebih pelit yaitu model di mana beberapa pembatasan dikenakan pada parameter. Model loglinier seperti ini di mana parameter dibatasi dalam beberapa cara disebut sebagai model non-lengkap.

Ada berbagai jenis pembatasan yang dapat dikenakan kepada parameter-parameter model loglinier. Salah satu jenis khusus pembatasan menyebabkan terbentuknya kumpulan model loglinier hirarkis. Ini adalah model dimana parameter-parameter loglinier secara tetap dibuat menjadi bernilai nol. Dengan demikian apabila interaksi tertentu bernilai 0, semua order interaksi yang lebih tinggi berisi semua indeks sebagai subset juga harus bernilai 0. Sebagai contoh jika asosiasi parsial antara

X dan Y dari persamaan (2.13) yaitu

 

ijXY diasumsikan tidak ikut dalam model, maka interaksi tiga variabel ijkXYZ harus bernilai 0.

Menerapkan pembatasan ini untuk persamaan model loglinier lengkap di atas hasilnya akan menjadi model loglinier hirarkis yang non-lengkap sebagai berikut:


(39)

logmˆijkiXYjkZikXZYZjk (3.2) Contoh lain dari model loglinier hirarkis yang non-lengkap adalah model independen untuk trivariat sesuai persamaan (2.14), yaitu:

logmˆijkiXYjZk

Model loglinier hirarkis adalah model loglinier yang paling populer karena dalam sebagian besar aplikasi secara relatif lebih mudah untuk mengestimasi parameter karena keberadaan dari statistik minimum yang sederhana.

3.2 Konfigurasi Model Loglinier Tiga Faktor

Bentuk model loglinier tiga faktor dapat dibagi menjadi beberapa konfigurasi yang berguna untuk lebih mengetahui pembagian jenis-jenis model yang ada, yakni:

Tabel 3.1 Tabel Konfigurasi Model Loglinier Tiga Faktor

No. Model Konfigurasi 1. Model Independen

logmˆijkiXYjZk C1C2C3

2. Model Satu Interaksi Dua Faktor

2.1 logmˆijkiXYjkZijXY C12 C3

2.2 logmˆijkiXYjkZikXZ C13 C2

2.3 logmˆijkiXYjkZYZjk C1 C23

3. Model Dua Interaksi Dua Faktor

3.1 logmˆijkiXYjkZijXYXZik C12 C13

3.2 logmˆijkiXYjZkijXYYZjk C12 C23

3.3 logmˆijkiXYjkZikXZYZjk C13 C23

4. Model Tanpa Interaksi Tiga Faktor

logmˆijkiXYjZkijXYikXZYZjk C12 C13 C23

5. Model Lengkap


(40)

Sebagai tambahan bahwa untuk model lengkap di atas terdapat tiga jenis efek order didalamnya, yakni efek order pertama, efek order kedua, dan efek order ketiga. Efek order pertama adalah X

i

, Yj, dan Z k

. Efek order kedua adalah ijXY, XZ ik

, dan YZjk . Efek order ketiga adalah ijkXYZ.

3.3 Derajat Bebas

Derajat bebas adalah banyaknya sel dalam tabel klasifikasi silang dikurangi banyaknya parameter yang ditaksir dalam model. Derajat bebas untuk tabel tiga faktor ditulis pada tabel berikut:

Tabel 3.2 Tabel Derajat Bebas Model Loglinier Tiga Faktor

Bentuk Derajat Bebas

1

X

 

I 1 Y

 

J1 Z

K 1

XY

  

I1 J1 XZ

 

I1 K 1

YZ

 

J 1 K 1

XYZ

  

I1 J 1 K 1

(Sumber: Friel, 2005)

3.4 Algoritma Hirarkis Backward

Algoritma Hirarkis Backward dimulai dengan dibentuknya suatu model lengkap. Kemudian, komponen dari model itu dievaluasi untuk melihat apakah terdapat efek yang dapat dieliminasi dengan melihat hasil uji kecocokan modelnya. Proses ini terus berlangsung sampai tidak ada efek yang harus dikeluarkan dari model. Pemodelan loglinier Hirarkis Backward menggunakan eliminasi mundur yang digunakan untuk menemukan model terbaik, yaitu model yang memiliki interaksi yang signifikan didalamnya yang dilihat dari p-value yang lebih kecil dari  sebesar 0,05.


(41)

Adapun algoritmanya secara lengkap sebagai berikut (Chapter 14 dan Agresti, 1990):

Langkah 1

Analisis dengan memasukkan semua variabel pada model lengkap, dengan asumsi bahwa interaksi tiga faktor terdapat dalam model. Kemudian anggap model lengkap dengan konfigurasi C123 sebagai model terbaik, dalam hal ini disebut sebagai model

(0).

Langkah 2

Keluarkan interaksi tiga fakor dari model sehingga menjadi model (1), yaitu model dengan konfigurasi C12 C13 C23. Pada model ini semua interaksi dua faktor ada atau

signifikan dalam model, tetapi tidak ada interaksi antara ketiga faktor.

Langkah 3

Lakukan pengujian dengan Conditional Test Statistic (CTS) G2 apakah model (1) masih merupakan model terbaik, dengan hipotesis sebagai berikut:

H0 : model (1) = model terbaik

H1 : model (0) = model terbaik

Conditional Test Statistic tersebut adalah : G2(1-0) = G2(1) - G2(0)

dimana : G2(1) = statistik likelihood G2 untuk model (1)

G2(0) = statistik likelihood G2 untuk model (0)

Langkah 4

Bandingkan G2(1-0) dengan 2df;, dengan kriteria penolakan G2  2df; dan untuk kriteria penerimaan jika G2 < 2df;.

Derajat kebebasan (degree of freedom) = derajat kebebasan model (0) - derajat kebebasan model (1)


(42)

Langkah 5

Jika H0 diterima maka model (1) merupakan model terbaik. Jika H0 diterima,

bandingkan model (1) dengan model (2), yaitu model yang diperoleh dari model (1) apabila salah satu dari interaksi dua faktor dikeluarkan dari model.

Langkah 6

Untuk menentukan interaksi mana yang dikeluarkan terlebih dahulu, dipilih nilai 2

G

terkecil, seandainya salah satu interaksi dua faktor dikeluarkan dari model. Hal ini dilakukan karena untuk interaksi dua faktor dengan nilai G2 terkecil akan menyebabkan p-value yang semakin besar sehingga tidak adanya hubungan yang signifikan terhadap interaksi itu untuk model yang terbentuk.

Langkah 7

Ulangi langkah 3 sampai dengan langkah 5 hingga tidak ada lagi faktor yang harus dikeluarkan dari model.

3.5 Algoritma Forward

Algoritma Forward ini dimulai dengan dibentuknya model independen sampai model akhir secara berurutan untuk melihat jenis konfigurasi model yang terbentuk dengan melihat hasil G2 yang kecil dan p-value maksimum yang dihasilkan dari model-model yang terbentuk selama proses penambahan berlangsung (Agresti, 1990). Namun (Friel, 2005) menjelaskan algoritmanya dimulai dengan sebuah model berorder nol kemudian menambahkan efek order pertama, kedua, dan ketiga untuk mengetahui penambahan efek order mana yang signifikan untuk melalui pengujian yang dilakukan dengan mengkombinasikan hasil uji untuk Interaksi K-faktor adalah nol dan uji Asosiasi Parsial Chi-Square untuk menghasilkan sebuah model yang seluruh komponen didalamnya signifikan dengan melihat nilai uji rasio likelihood G2


(43)

3.6 Analisis Residu

Analisis residu berguna untuk membantu menyoroti sel-sel yang memiliki kecocokan dengan baik. Residu adalah perbedaan dari frekuensi yang diharapkan dan frekuensi sel yang diamati. Nilai residu itu dapat dicari dengan:

residuOfEf (3.4) Frekuensi residu dapat menjelaskan sel yang menunjukkan kekurangcocokan dengan data. Residu yang semakin kecil yang terdapat pada sel menunjukkan semakin baik model bekerja untuk sel itu. Kemudian jika suatu model telah diterima dari uji yang telah dilakukan, maka residu standar untuk yang diambil sebesar 0,05 harus terletak diantara -1,96 sampai dengan 1,96 untuk menunjukkan kecocokan yang baik dengan model (Dessens et al, 2005).

Dengan pendekatan normal, diperoleh rumusan residu standar sebagai berikut:

1,96   1,96

f f f

E E O

Z (3.5)

dengan : Of adalah nilai untuk frekuensi yang diamati

Ef adalah nilai untuk frekuensi yang diharapkan

Nilai Z 1,96 menunjukkan bahwa model mempunyai kecocokan yang buruk terhadap frekuensi yang diamati.


(44)

3.7 Penyelesaian Contoh

Dibentuk tabel kontingensi tiga faktor sebagai berikut dan ingin diketahui sebuah model yang dapat menyatakan hubungan dalam kumpulan data dengan tepat:

Tabel 3.3 Tabel Hipotesis Data Untuk Analisis Frekuensi Multifaktor

Profesi Jenis Kelamin Jenis Bacaan

Total

Fiksi Ilmiah Novel

Laki-laki 38 25 63 Politikus

Perempuan 20 15 35

Laki-laki 12 27 39

Penari

Perempuan 18 30 48

Total 88 97 185

Penyelesaian:

Langkah awal yang dilakukan sebelum melakukan pemodelan adalah dengan membagi ketiga variabel kategorik yang ada menurut jenis skalanya masing-masing, yakni:

a. Variabel pertama (I) : Profesi. Profesi diukur melalui skala pengukuran nominal dengan kategorik : 0 bila profesinya politikus

1 bila profesinya penari

b. Variabel kedua (J) : Jenis bacaan. Jenis bacaan diukur melalui skala pengukuran nominal dengan kategorik : 0 bila jenis bacaan yang dibaca adalah fiksi ilmiah 1 bila jenis bacaan yang dibaca adalah novel c. Variabel ketiga (K) : Jenis kelamin. Jenis kelamin diukur melalui skala

pengukuran nominal dengan kategorik : 0 bila jenis kelaminnya laki-laki 1 bila jenis kelaminnya perempuan


(45)

Selanjutnya berdasarkan tabel kontingensi di atas, dilakukan pengujian keindependenan untuk mengetahui apakah terdapat hubungan yang signifikan antara profesi, jenis bacaan yang dibaca dan jenis kelamin dengan hipotesis sebagai berikut: H0 : Tidak ada hubungan antara profesi, jenis bacaan yang dibaca dan jenis kelamin.

(PijkPi..P.j.P..k)

H1 : Ada hubungan antara profesi, jenis bacaan yang dibaca, dan jenis kelamin.

(PijkPi..P.j.P..k)

Seperti yang diketahui pada pembahasan bab 2 sebelumnya, taksiran nilai harapan masing-masing sel untuk model loglinier tiga faktor yang independen, yaitu:

.. .2. ..

N Y Y Y

Eijki j k , untuk i = 1-2, j = 1-2, dan k = 1-2

sehingga diperoleh: 98 35 63 ..

1   

Y dan Y2.. 394887 88 18 12 20 38 . 1 .     

Y dan Y.2. 2515273097 102 27 12 25 38 1 ..     

Y dan Y..2 2015183083

Dengan demikian dapat dicari frekuensi harapan tiap-tiap sel, yakni: 1. Y111 38

E111

       

25,702 185 102 88 98 2 2 1 .. . 1 . ..

1  

N Y Y Y

2. Y112 20

E112

       

20,914 185 83 88 98 2 2 2 .. . 1 . ..

1  

N Y Y Y

3. Y121 25

E121

       

28,331 185 102 97 98 2 2 1 .. . 2 . ..

1  

N Y Y Y

4. Y122 15

E122

       

23,053 185 83 97 98 2 2 2 .. . 2 . ..

1  

N Y Y Y


(46)

5. Y211 12

E211

       

22,817 185 102 88 87 2 2 1 .. . 1 . ..

2  

N Y Y Y

6. Y212 18

E212

       

18,567 185 83 88 87 2 2 2 .. . 1 . ..

2  

N Y Y Y

7. Y221 27

E221

       

25,151 185 102 97 87 2 2 1 .. . 2 . ..

2  

N Y Y Y

8. Y222 30

E222

       

20,466 185 83 97 87 2 2 2 .. . 2 . ..

2  

N Y Y Y

 

18,852

466 , 20 466 , 20 30 ... 914 , 20 914 , 20 20 702 , 25 702 , 25

38 2 2 2

2        

, 024 , 19 466 , 20 30 ln 30 ... 914 , 20 20 ln 20 702 , 25 38 ln 38 2 2      G

dengan 21;0,05 3,841.

Dari hasil perhitungan yang telah diperoleh, nilai 2 atau G2 hitung sebesar 18,852 atau 19,024 dibandingkan dengan 21;0,05 3,841. Oleh karena nilai 2 atau G2 hitung lebih besar dari 21;0,05 3,841, maka H0 ditolak sehingga dapat dikatakan

terdapat hubungan antara profesi, jenis bacaan yang dibaca, dan jenis kelamin. Setelah diketahui terdapat hubungan diantara ketiga variabel yang diselidiki, maka akan dilakukan prosedur pemodelan loglinier untuk melihat lebih jauh komponen model lainnya yang akan signifikan dengan model yang akan terbentuk karena hasil uji yang telah diperoleh di atas belum cukup memberikan informasi tentang hal itu.

Informasi yang belum diketahui itu adalah mengenai apakah terdapat interaksi antara profesi, jenis bacaan, dan jenis kelamin. Oleh karenanya, pemodelan loglinier pertama yang digunakan dalam penelitian ini untuk membentuk modelnya ialah menggunakan metode Hirarkis Backward. Dalam pemodelan ini, harus dibentuk


(1)

2. Y112 20

     

20,714

98 35 58 .. 1 2 . 1 . 11

112   

Y Y Y E

3. Y121 25

     

25,714

98 63 40 .. 1 1 . 1 . 12

121   

Y Y Y E

4. Y122 15

     

14,286

98 35 40 .. 1 2 . 1 . 12

122   

Y Y Y E

5. Y211 12

     

13,448

87 39 30 .. 2 1 . 2 . 21

211   

Y Y Y E

6. Y212 18

     

16,552

87 48 30 .. 2 2 . 2 . 21

212   

Y Y Y E

7. Y221 27

     

25,552

87 39 57 .. 2 1 . 2 . 22

221   

Y Y Y E

8. Y222 30

     

31,448

87 48 57 .. 2 2 . 2 . 22

222   

Y Y Y E 527 , 0 448 , 31 30 ln 30 ... 714 , 20 20 ln 20 286 , 37 38 ln 38 2 2      G

Berdasarkan hasil pemodelan dengan dua metode yang telah dilakukan untuk contoh di atas ternyata memberikan hasil yang sama untuk membentuk model permasalahannya, yaitu:

logmˆijkiXYjkZijXYikXZ dengan:


(2)

logmˆijk = Logaritma dari frekuensi sel ijk

 = rata – rata logaritma seluruh sel ijk

Xi = Parameter pengaruh Profesi yang ke-i ( i = 1 (politikus) dan i =

2

(penari) ) terhadap model

Yj = Parameter pengaruh Jenis Bacaan yang ke-j ( j = 1 (fiksi Ilmiah)

dan j = 2 (novel) ) terhadap model

Zk = Parameter pengaruh Jenis Kelamin yang ke-k ( k = 1 (laki-laki)

dan k = 2 (perempuan) ) terhadap model

ijXY = Parameter pengaruh interaksi Profesi yang ke-i dengan Jenis

Bacaan yang ke-j terhadap model

ikXZ = Parameter pengaruh interaksi Profesi yang ke-i dengan Jenis

Kelamin yang ke-k terhadap model

Dengan kata lain model ini menyatakan adanya depedensi yang signifikan antara Profesi dengan Jenis bacaan dan Profesi dengan Jenis kelamin.

Hal terpenting dari penyelesaian contoh soal di atas adalah diketahui bahwa metode yang lebih baik dalam membentuk model permasalahannya adalah menggunakan metode Hirarkis Backward berdasarkan hasil simulasi untuk tahap ke-3,

dengan melihat perubahan nilai rasio likelihood G2 dan p-value untuk setiap interaksi

yang ada di dalam model yang terbentuk itu harus lebih kecil dari sebesar 0,05 agar

signifikan, dibandingkan dengan metode Forward berdasarkan hasil simulasi untuk

tahap ke-5 dengan melihat nilai G2 yang kecil dan p-value yang maksimum dari


(3)

Untuk melihat hasil yang lebih jelasnya dapat dilihat pada tabel berikut: Tabel 3.8 Tabel Residu Untuk Model Akhir

Nilai Z yang diperoleh itu menunjukkan residu standar yang masih bernilai

kecil dan berada didalam range -1,96 sampai 1,96 sehingga memiliki kecocokan yang baik untuk sel itu. Kemudian hal yang sama dilakukan untuk nilai pengamatan sel lainnya yang ternyata juga menunjukkan hasil residu standar yang cukup kecil dan berada didalam range -1,96 sampai 1,96. Jadi kesimpulannya model ini memang sudah memberikan kecocokan yang baik karena mempunyai residu yang cukup kecil.

Cell Counts and Residuals

38,000 20,5% 37,286 20,2% ,714 ,117 20,000 10,8% 20,714 11,2% -,714 -,157 25,000 13,5% 25,714 13,9% -,714 -,141 15,000 8,1% 14,286 7,7% ,714 ,189 12,000 6,5% 13,448 7,3% -1,448 -,395 18,000 9,7% 16,552 8,9% 1,448 ,356 27,000 14,6% 25,552 13,8% 1,448 ,287 30,000 16,2% 31,448 17,0% -1,448 -,258 Jenis_kelamin

Laki-laki Perempuan Laki-laki Perempuan Laki-laki Perempuan Laki-laki Perempuan Jenis_bacaan

Fiksi ilmiah

Novel

Fiksi ilmiah

Novel Profesi

Politikus

Penari

Count % Observed

Count % Expected

Residuals

Std. Residuals


(4)

BAB 4

KESIMPULAN DAN SARAN

4.1 Kesimpulan

Berdasarkan hasil penelitian dan pembahasan pada bab – bab sebelumnya, maka pada bab yang merupakan bab terakhir dari skripsi ini, penulis mencoba menarik beberapa kesimpulan sebagai berikut:

1. Pemodelan loglinier dapat dilakukan dengan dua metode yakni dengan metode

Hirarkis Backward dan metode Forward yang mana setiap metode mempunyai kelebihan dan kekurangan masing-masing, yakni:

a) Kelebihan metode Hirarkis Backward

Lebih cepat dalam mengeliminasi komponen model karena proses eliminasi dimulai dari model yang mempunyai asosiasi yang paling tinggi yang dikenal sebagai model lengkap menuju model yang memuat asosiasi yang lebih rendah.

b) Kekurangan metode Hirarkis Backward

Proses seleksi akan menjadi sulit jika meningkatnya jumlah variabel yang akan diselidiki karena akan terjadi peningkatan yang semakin pesat dalam hal untuk


(5)

d) Kekurangan metode Forward

Pada metode ini harus dibentuk terlebih dahulu model sederhana kemudian membentuk lagi model yang menambahkan interaksi atau order yang lebih tinggi dari model yang pertama sampai model akhir itu benar-benar terbentuk sehingga memerlukan waktu yang cukup lama dalam pengerjaannya.

2. Dari contoh permasalahan yang telah dikerjakan metode yang lebih baik dalam membentuk model permasalahan yang sesuai dengan data adalah menggunakan metode Hirarkis Backward berdasarkan hasil simulasi untuk tahap ke-3, dengan

melihat perubahan nilai rasio likelihood G2 dan p-value untuk tiap-tiap

interaksi yang ada di dalam model yang terbentuk itu harus lebih kecil dari

sebesar 0,05 agar signifikan, dibandingkan dengan metode Forward berdasarkan

hasil simulasi untuk tahap ke-5 dengan melihat nilai G2 yang kecil dan p-value

yang maksimum dari model. Model yang terbentuk itu adalah: logmˆijkiXYjkZijXYXZik

4.2 Saran

Pada tulisan ini, penulis hanya membahas tentang pemodelan loglinier yang memuat analisis hubungan antara tiga variabel kategorik dengan metode Hirarkis Backward dan metode Forward. Bagi para pembaca yang berminat dapat melanjutkan penelitian ini untuk menyelesaikan pemodelan loglinier dengan variabel kategorik yang melebihi tiga.


(6)

DAFTAR PUSTAKA

Agresti, A. 1990. Categorical Data Analysis. Canada: John Wiley & Sons,Inc.

Dessens, J and Jansen, W. 2005. Loglinear Analysis An Introduction. American Review. hal: 7-23.

Friel, C. M. 2005. Hierarchical Loglinear Analysis: A Statistical Technique for the

Analysis Of Frequency Data in Multiway Cross-Tabulation Cross. Criminal

Justice Center. Amerika: Sam Houston State University. hal 31-43. Friendly, M. 2000. Visualizing Categorical Data. Cary, NC: SAS Press. Focus on expressing loglinier results in plots.

Jeansonne, A. 2002. A history Loglinier Models. Introductory Topics. New York: Amerika Serikat.

Maindonald, J. H. 2001. Statistical Computation. New Zealand: John Wiley & Sons. Noah, A. S. 2004. Log-Linear Models. Proposal Riset Tesis. Amerika: Department of Computer Science / Center for Language and Speech Processing Johns Hopkins University.

Supranto, J. 1981. Statistik Teori dan Aplikasi. Erlangga: Jakarta.

Vermunt, J.K. 2005. LEM: Log-Linear Modelling. User’s manual. The Netherlands: Department of Methodology and Statistics, Tilburg University Press.

Von Eye, A. 2002. Configural Frequency Analysis, Lawrence Erlbaum Associates, Inc., London.