Model Loglinier Tiga Dimensi untuk Mengetahui Hubungan Jalur Masuk, Asal Sekolah, dan Nilai IPK pada Mahasiwa FMIPA Universitas Sumatera Utara

(1)

BAB 2

LANDASAN TEORI

2.1 Kawasan Metropolitan Mebidang

Kawasan Mebidang (Medan, Binjai dan Deli Serdang) saat ini menjadi pusat pertumbuhan ekonomi di wilayah Propinsi Sumatera Utara dan juga sebagai pintu gerbang keluar masuknya barang sebagai pusat pertumbuhan ekonomi, penyediaan fasilitas pendidikan tentunya lebih baik dibanding di daerah luar kawasan metropolitan. Secara resmi kawasan Mebidang telah ditetapkan oleh Gubenur Propinsi Sumatera Utara sebagai Mebidang Metropolitan Area (MMA) pada tahun 1985. Wilayah Mebidang terdiri dari 40 kecamatan yang meliputi 21 kecamatan di Kota Medan, 5 kecamatan di Kota Binjai dan 14 kecamatan (dari 33 kecamatan) di Kabupaten Deli Serdang.

Tabel 2.1 Wilayah Administrasi Mebidang

Kabupaten/Kota Kecamatan

Medan Medan Tuntungan, Medan Selayang, Medan Johor, Medan Amplas, Medan Denai, Medan Tembung, Medan Kota, Medan Area, Medan Baru, Medan Polonia, Medan Maimun, Medan Sunggal, Medan Helvetia, Medan Petisah, Medan Barat, Medan Timur, Medan Perjuangan, Medan Deli, Medan Labuhan, Medan Marelan, dan Medan Belawan.

Binjai Binjai Selatan,Binjai Kota, Binjai Timur, Binjai Utara, dan Binjai Barat

Deli Serdang Hamparan Perak, Labuhan Deli, Sunggal, Percut Sei Tuan, Batang Kuis, Tanjung Morawa, Lubuk Pakam, Pagar Merbau, Beringin, Pantai Labu, Patumbak, Deli Tua, Namo Rambe, dan Pancur Batu


(2)

Menggunakan definisi Mebidang, daerah asal bersekolah dikelompokkan menjadi dua yaitu dalam daerah dan luar daerah. Dalam daerah merupakan asal daerah mahasiswa bersekolah SMA atau sederajat yang berada pada kawasan Mebidang. Luar Daerah merupakan asal daerah mahasiswa bersekolah SMA atau sederajat yang berada pada kawasan di luar Mebidang. Konsep Mebidang penulis gunakan sebagai perbandingan potensi mahasiswa yang bersekolah SMA atau sederajat. Mebidang dipilih sebagai dasar pengelompokkan karena kawasan metropolitan memberikan gambaran kemajuan kota di dalam kawasan tersebut di berbagai bidang.

2.2 Skala Pengukuran

Kesesuaian antara macam data dengan metode analisis statistiknya didasarkan pada skala pengukuran datanya. Ada empat macam skala pengukuran yaitu:

1. Skala nominal

Angka yang berfungsi hanya untuk membedakan, merupakan identitas/lambang/simbol, urutan tidak berlaku, operasi matematika juga tidak berlaku, misalnya jenis kelamin.

2. Skala ordinal

Angka yang berfungsi sebagai nominal dan juga menunjukkan urutan, misalnya tingkat kualitas.

3. Skala interval

Angka yang selain berfungsi sebagai nominal dan ordinal juga menunjukkan jarak yang sama, titik nol letaknya sembarang dan dipergunakan untuk rating misalnya kenaikan suhu.

4. Skala rasio

Angka yang berfungsi sebagai nominal, ordinal dan interval. Skala rasio memiliki titik nol yang tidak sembarang misalnya tinggi badan.

Skala pengukuran variabel, menggambarkan pemahaman terhadap data yang dimiliki. Skala pengukuran variabel dibagi menjadi katagorik (nominal,ordinal) dan numerik (rasio,interval)


(3)

2.3 Klasifikasi Data

Data merupakan kumpulan angka atau huruf hasil dari penelitian terhadap sifat/karakteristik yang diteliti. Menurut Sudjana (2005) data menurut sumbernya

terbagi dua jenis yaitu:

a. Data intern adalah data yang diambil/diperoleh dari dalam suatu badan usaha atau dirinya sendiri, misalnya data hasil penjualan pegawai perusahaan A.

b. Data ekstern adalah data yang diperoleh di luar suatu badan atau dirinya sendiri, misalnya data hasil penjualan perusahaan A digunakan perusahaan B maka perusahaan B menggunakan data ekstern. Data ekstern dibagi menjadi dua yaitu ekstern primer (data primer) dan data ekstern sekunder (data sekunder). Jika data itu diperoleh/dikumpulkan dan diolah oleh badan yang sama atau dirinya sendiri maka disebut data primer misalnya data hasil wawancara. Jika data yang diperoleh dari badan atau instansi lain disebut data sekunder misalnya data BPS.

Menurut Sudjana (2005) berdasarkan bentuk/jenis data dibagi menjadi dua jenis yaitu:

a. Data yang berbentuk bilangan disebut data kuantitatif atau numerik. Menurut nilainya, dikenal dua golongan data kuantitatif ialah:

1. Data dengan variabel diskrit (data diskrit) merupakan data hasil menghitung dan mebilang misalnya Kabupaten B sudah membangun 85 gedung sekolah.

2. Data dengan variabel kontinu (data kontinu) merupakan data hasil pengukuran misalnya tinggi badan seseorang 155 cm.

b. Data yang berbentuk bukan bilangan disebut data kualitatif atau data katagorik, misalnya katagori mahasiswa berprestasi dan tidak berprestasi.

Data katagorik merupakan data dimana variabel-variabelnya dapat dikelompokkan menjadi beberapa kelompok atau katagori seperti jenis kelamin, agama yang dianut atau ras kulit dari responden. Menurut Bayo lawal (2003) data


(4)

katagorik muncul setiap kali variabel diukur pada skala yang hanya mengklasifikasikan responden ke dalam sejumlah kelompok. Dengan demikian, data katagorik dari hasil suatu pengamatan mengandung variabel-variabel yang berkatagorik. Dalam analisis statistik seringkali data numerik dirubah ke dalam data katagorik dengan cara dilakukan pengelompokan/pengklasifikasian.

2.4 Variabel (Peubah)

Isi data pada umumnya bervariasi sehingga muncul istilah variabel. Oleh karena itu, variabel merupakan karakteristik yang nilai datanya bervariasi dari satu pengukuran ke pengukuran berikutnya. Menurut Saefuddin, dkk (2009) variabel (peubah) menurut sifatnya dibedakan menjadi dua jenis yaitu:

1. Variabel (peubah) kuantitatif adalah peubah yang sifatnya kontinu dan hasil pengukuran merupakan nilai pendekatan yang tergantung kepada ketelitian alat ukur yang digunakan. Nilai sebenarnya dari peubah tersebut sulit dinyatakan oleh nilai tunggal tertentu tetapi dalam bentuk selang nilai. Misalnya tinggi badan seseorang 160 cm.

2. Variabel (peubah) kualitatif adalah peubah yang nilai-nilainya ditetapkan menurut katagori tertentu dinamakan variabel (peubah) katagorik. Variabel (peubah) katagorik sifatnya terputus atau diskrit. Atribut pengamatan dalam hal ini dikelaskan kedalam katagori-katagori tertentu yang tidak saling tumpang tindih. Misalnya jenis kelamin yaitu perempuan dan laki-laki.

Variabel kuantitatif dikenal sebagai variabel numerik sedangkan variabel kualitatif dikenal sebagai variabel katagorik. Variabel katagorik pada umumnya berisi variabel yang berskala nominal dan ordinal. Menurut Bayo lawal (2003) ada dua jenis variabel katagorik yaitu variabel nominal dan ordinal. Variabel nominal adalah sekumpulan katagori yang saling lepas dan tidak memiliki urutan. Variabel ordinal adalah sekumpulan kategori yang memiliki urutan. Variabel numerik berisi variabel yang berskala interval dan rasio.


(5)

2.5 Distribusi Poisson

Menurut Saefuddin, dkk (2009) apabilla rataan banyaknya sukses dalam selang pengamatan tersebut diketahui sebesar �, maka distribusi poisson yang menyatakan peluang diperolehnya sukses sebanyak � pada selang tertentu adalah:

�(�;�) =�−���

�! ,�= 0,1,2, … ,∞; �= 2,71828 (2.1) Keterangan:

�= rataan banyaknya sukses �= banyaknya kejadian sukses �= eksponensial

Menurut Sudjana (2005) distribusi Poisson sering digunakan untuk menetukan peluang sebuah peristiwa yang dalam area kesempatan tertentu diharapkan terjadinya sangat jarang. Distribusi Poisson dapat dianggap sebagai pendekatan terhadap distribusi Binomial. Jika dalam hal distribusi binom, jumlah observasi � cukup besar sedangkan peluang terjadinya peristiwa � adalah � sangat dekat kepada nol sedemikian sehingga �= �.� tetap, maka distribusi Binomial sangat baik didekati oleh distribusi Poisson. Pendekatan ini sering dilakukan jika � ≥50 sedangkan �.�< 5 atau �< 0,1

2.6 Model Pengambilan Sampel

Menurut Stephen E. Fienberg (2007) dalam membentuk suatu tabel kontingensi harus berdasarkan cara pengambilan sampel untuk tiap sel yang terkandung. Sebagai asumsi distribusi frekuensi pengamatan dalam tiap sel tabel kontingensi maka digunakan suatu model pengambilan sampel. Ada tiga jenis model pengambilan sampel yang sering digunakan pada data klasifikasi silang yaitu:


(6)

1. Poisson: Kumpulan observasi mengikuti proses poisson, tiap sel pada klasifikasi silang diamati pada suatu interval waktu tertentu. Pengamatan sampel yang dilakukan untuk setiap sel dalam tabel ini tanpa diketahui lebih dulu banyaknya jumlah observasi yang akan diambil.

2. Multinomial: Jumlah sampel sebanyak � telah ditentukan, kemudian setiap individu sampelnya diklasifikasikan ke dalam sel tabel kontingensi yang bersesuaian.

3. Product Multinomial: Setiap katagori pada variabel baris mengikuti pengambilan sampel multinomial dengan ukuran sampel �+ dan klasifikasi setiap anggota pada sampel menurut katagori variabel kolom (peran baris dan kolom bertukar tempat).

Pada penulisan skripsi ini data yang ada diperoleh melalui pengambilan sampel dengan model multinomial.

2.7 Tabel Kontingensi

Menurut Razia Azen dan Cindy M. Walker (2011) ketika subyek atau objek diklasifikasikan secara simultan oleh dua atau lebih atribut, hasil pada klasifikasi silang dapat disusun dengan baik sebagai tabel hitung yang disebut tabel kontingensi. Tabel kontingensi digunakan untuk melihat hubungan antara dua atau lebih variabel katagorik. Penggunaan tabel kontingensi yang akan dibahas pada penelitian ini penulis kelompokkan menjadi dua yaitu tabel kontingensi dua dimensi dan tabel kontingensi tiga dimensi.

1. Tabel Kontingensi Dua Dimensi

Menurut G. Tutz (2012), nilai sel ��� adalah nilai observasi dengan sel(�,�) dengan � = �,� =�. Tabel kontingensi dua dimensi merupakan klasifikasi antar variabel 1 misal variabel observasi A yaitu � sebagai baris dengan tingkat �= 1,2,⋯,� dan variabel 2 misal variabel observasi B yaitu


(7)

�� sebagai kolom dengan tingkat �= 1,2,⋯,�. Penyajian dalam daftar baris

dan kolom tersebut biasa dikenal dengan tabel kontingensi dua dimensi. Jika data disajikan dalam bentuk tabel frekuensi menurut variabel katagorik � dan � yang mempunyai dua baris dan dua kolom disebut tabel kontingensi 2 × 2. Data yang disusun dalam tabel katagorik � × � sebagai berikut:

Tabel 2.2 Tabel Kontingensi � × � �

1 2 ⋯ �

��

1 �11 �12 ⋯ �1� �1+

2 �21 ⋱ ⋮ ⋮

⋮ ⋮ ⋱ ⋮

� ��1 ⋯ ��� ��+

�+1 ⋯ �+�

Sumber: G. Tutz (2012)

Keterangan:

�+� = ∑�=1��� ,�+� = ∑�=1���

�+� = jumlah marginal pada variabel baris �+� = jumlah marginal pada variabel kolom

Subskrip “+” menyatakan penjumlahan pada indeks tersebut.

2. Tabel Kontingensi Tiga Dimensi

Menurut G Tutz (2012), nilai sel ���� adalah nilai observasi dengan sel (�,�,�) dengan � =�,� =�,� = �. Tabel kontingensi tiga dimensi merupakan klasifikasi antar variabel 1 misal variabel observasi A yaitu �� sebagai baris dengan tingkat �= 1,2,⋯,� dan variabel 2 misal variabel

observasi B yaitu � sebagai kolom dengan tingkat � = 1,2,⋯,� dan variabel 3 misal variabel observasi C yaitu � sebagai layer dengan tingkat �= 1,2,⋯,� maka data tersebut dapat disusun dalam tabel kontingensi I × J × K sebagai berikut:


(8)

Tabel 2.3 Tabel Kontingensi � × � × � ��

�� �� 1 2 ⋯ � Jumlah

1 1 �111112 ⋯ �1111+

2 �121122

⋮ ⋮

J �11 ⋯ �1��1+

2 1 �211212 ⋯ �2121+

2 �221 �222 ⋮

⋮ ⋮

� �2�1 ⋯ �2�� �2�� �2�+

⋮ ⋮ ⋮ ⋮ ⋮ ⋮

� 1 �1112 ⋯ �11+

2 �2122

⋮ ⋮

� ���1 ⋯ ���� ���+

Sumber: G Tutz (2012)

di mana

��++= � � ����

� �=1

� �=1

�+�+=� � ����

� �=1

� �=1

�++� =� � ����

� �=1

� �=1 Keterangan:

��++= jumlah marginal pada variabel baris �+�+= jumlah marginal pada variabel kolom �++� = jumlah marginal pada variabel layer


(9)

2.8 Model Loglinier

Menurut Razia Azen dan Cindy M. Walker (2011) model loglinier digunakan untuk memodelkan jumlah sel pada tabel kontingensi. Tujuan yang ingin dicapai pada model loglinier adalah mengestimasi parameter yang menjelaskan hubungan antar variabel kategori. Tidak adanya perbedaan antara variabel penjelas dengan variabel respon, sehingga model loglinier hanya dapat menggambarkan struktur interaksi antar variabelnya. Analisis log linier merupakan perluasan dari tabel kontingensi dua dimensi di mana hubungan bersyarat di antara dua atau lebih variabel kategori diskrit dianalisis dengan mengambil logaritma natural dari frekuensi sel pada tabel kontingensi. Model loglinier yang akan dibahas adalah model loglinier dua dimensi dan model loglinier tiga dimensi.

1. Model Loglinier Pada Tabel Kontingensi Dua Dimensi a. Model Loglinier Independen

Andaikan probabilitas sel pada tabel kontingensi dua dimensi adalah ��� dengan jumlah observasi � dan nilai harapan ��� =�.���. Berdasarkan sifat independen maka ��� =�.�+.�+� dimana ��+ adalah probabilitas dari variabel baris � dan �+ adalah probabilitas dari variabel kolom �. Ketika praktek, ��� tidak diketahui yang diamati adalah ���, sehingga probabilitas harus ditaksir untuk mencari frekuensi harapan. Besarnya probabilitas dapat dihitung dengan ��+= ��+

� ,��+� =

�+�

� , sehingga

estimasi nilai harapannya sebagai berikut:

���� = �.���+.��+� =

(�+)(�+)

� (2.2) Keterangan :

����� = nilai harapan

��+ =∑�=1��� = jumlah marginal pada variabel baris ke � �+� =∑�=1��� = jumlah marginal pada variabel kolom ke � � = �++=∑�=1∑�=1�� = jumlah seluruh nilai observasi ke ��


(10)

Setelah terbentuk tabel kontingensi dua dimensi, model loglinier akan menggambarkan pola hubungan antar variabel katagorik. Model independen logliniernya berdasarkan peluang yaitu:

��� = �+ ���+��� (2.3)

Keterangan:

� = 1,2,⋯,� dan � = 1,2,⋯,�

��� = ln���� = logaritma natural dari frekuensi harapan sel ke ��

� = parameter rataan umum

��� = parameter pengaruh utama variabel pertama (�) pada katagori ke �

��� = parameter pengaruh utama variabel kedua (�) pada katagori ke �

b. Model Loglinier Lengkap

Frekuensi harapan pada model loglinier lengkap sama dengan nilai observasinya ���� =���. Model umum disebut juga model saturated. Model lengkap pada dua dimensi sebagai berikut:

��� = �+ ���+��� +����� (2.4)

Keterangan:

� = 1,2,⋯,� dan �= 1,2,⋯,�

��� = ln���� = logaritma natural dari frekuensi harapan sel ke ��

� = parameter rataan umum

��� = parameter pengaruh utama variabel pertama (�) pada katagori ke �

= parameter pengaruh utama variabel kedua () pada katagori ke

����� = parameter pengaruh interaksi variabel pertama (�) katagori ke �

dengan variabel kedua (�) katagori ke � 2. Model Loglinier Pada Tabel Kontingensi Tiga Dimensi

Model loglinier tiga dimensi merupakan pengembangan model loglinier dua dimensi. Semakin banyak dimensi pada tabel kontingensi maka semakin


(11)

banyak model loglinier yang dianalisis. Pada tabel tiga dimensi, model-model loglinier tersebut sebagai berikut:

Tabel 2.4 Model-model Loglinier Tiga Dimensi

Modela Interpretasi Simbol

Model Tipe ���� = �+ ���+

�+�� Variabel saling

independen (�,�,�)

Mutually Independent ���� = �+ ���+

�+��+ �����

� independen terhadap � dan

� (��,�) Jointly Independent ���� = �+ ���+ ��+��+ ����� +�����

� dan � independen dengan syarat �

(��,��) Conditionally independent ���� = �+ ���+ �� +��+ ����� +����� +����� Setiap dua variabel berhubungan dengan variabel ketiga

(��,��,��) Homogeneous Association ���� = �+ ���+ �� +��+ ����� +����� +����� +������� Ketiga variabel

berhubungan (���) General Model

a

Formula untuk model yang tidak tertulis memiliki kemiripan, misalnya untuk (XZ, Y), ���� = �+ ��+�� +��+�����. Sumber: Agresti (2002)

Pada tabel 2.4 model umum loglinier tiga dimensi yaitu:

���� = �+ ��� +��� +���+����� +����� +����� +������� (2.5)

Keterangan:

� = 1,2,⋯,� ; � = 1,2,⋯,� dan �= 1,2,⋯,�

���� = ln����� = logaritma natural dari frekuensi harapan sel ke ���

� = parameter rataan umum

��� = parameter pengaruh utama variabel pertama (�) pada katagori ke �

= parameter pengaruh utama variabel kedua () pada katagori ke


(12)

����� = parameter pengaruh interaksi variabel pertama (�) katagori ke �

dengan variabel kedua (�) katagori ke �

���� = parameter pengaruh interaksi variabel pertama () katagori ke

dengan variabel ketiga (�) katagori ke �

����� = parameter pengaruh interaksi variabel kedua (�) katagori ke � dengan

variabel ketiga (�) katagori ke �

������ = parameter pengaruh interaksi variabel pertama () katagori ke-

variabel kedua (�) katagori ke- � dengan variabel ketiga (�) katagori ke �

2.9 Kendala Parameter

Menurut Agresti (2002) perbedaan software menggunakan perbedaaan kendala. Menurut Bayo lawal (2003) penggunaan software menggunakan PROC GENMOD pada SPSS sehingga identifikasi kendala yaitu untuk hanya parameter pada katagori terakhir dari setiap variabel dan hubungan interaksinya yang diatur bernilai nol. Ini disebut means model atau �-model. Identifikasi kendala penting dilakukan agar tidak overparameterized. Menurut A. W. Vogelesang (1996) Metode yang lain untuk membatasi jumlah parameter pada model adalah ANOVA-model, yang mana jumlah parameter pada setiap pengaruh adalah nol. Pada ANOVA-model, rata-rata umum merupakan intercept sedangkan pada �-model rata-rata umum ditambah parameter pada setiap tingkat terakhir variabel merupakan intercept, ini artinya bahwa pengurangan tingkat terakhir pada setiap tingkat variabel. Pada penelitian ini menggunakan kendala �-model.

Misalkan untuk model dua dimensi pada persamaan (2.4) maka estimasi adalah �̂= ln�����= ���

�̂�� =��� − ���

�̂�� =��� − ���

�̂���� = ��� − ��� − ��� +���


(13)

�̂�� =�̂�� = 0,0 dan �̂���� =�̂���� = �̂���� = 0,0

Dimana

��� = ln���; ��� = ln���

Menggunakan cara yang sama untuk ���,���,���.

Jika diketahui nilai harapan, model dapat ditaksir estimasinya dengan yaitu dengan substitusi ��� = ln���� dimana �= 1,2,⋯,� ; � = 1,2,⋯,�.

Model tiga dimensi pada persamaan (2.5) maka estimasi adalah �̂ = ln������=����

�̂�� =���� − ����

�̂ =

��� − ����

�̂���� =

��+− ���+− ���++���+ �̂���� =

�+� − ��+�− ��+� +��+� �̂������ = ���� − ���� − ���� +����

Estimasi yang serupa untuk parameter �̂� dan �̂����. Dengan kendala

�̂�� =�̂�� = �̂�� = 0,0

�̂���� =�̂���� =�̂���� = �̂���� = �̂���� =�̂���� = 0,0

�̂������ =�̂������ =�̂������ = 0,0

dimana

���� = ln���� ; ���� = ln����

���+=∑�=1ln����; ���+=∑�=1ln���� ; ���+=∑�=1ln����

Menggunakan cara yang sama untuk ����, ����,���+,���+,��+�,��+� dimana � = 1,2,⋯,� ; � = 1,2,⋯,�.

2.10 Prinsip Hirarki

Menurut Bayo lawal (2003) model loglinier menggunakan prinsip hierarki yaitu jika order pengaruh yang lebih tinggi ada dalam model maka order terendah juga ada dalam model. Menurut Razia Azen dan Cindy M.Walker (2011) pada tiga


(14)

variabel, jika ada interaksi dua arah yang masuk ke dalam model maka pengaruh utama pada variabel juga masuk ke dalam model. Misal mengikuti model loglinier secara hirarki jika ada mengandung dua interaksi yaitu satu untuk � dan � dan satu untuk � dan �, maka juga mengandung pengaruh utama semua tiga variabel:

���� = �+ ���+���+���+ ����� +����� (2.6)

Jika ada salah satu dari pengaruh utama yang tidak masuk ke dalam model maka model tidak hirarki.

2.11 Statistik Cukup Minimal dan Fungsi Likelihood

Setelah diperoleh model loglinier yang terbaik, maka selanjutnya melakukan estimasi parameter dari model loglinier tersebut. Estimasi suatu parameter dalam model loglinier berarti menaksir nilai harapan tiap sel pada tabel kontingensi. Misalkan terpilih model (��,��), maka untuk mendapatkan estimasi parameter �,��,��,��,�����,����� adalah dengan estimasi nilai ����. Metode penaksiran yang digunakan adalah metode maksimum likelihood adalah prosedur untuk menemukan nilai estimasi dari satu atau lebih parameter yang memaksimumkan fungsi likelihood. Sebelum mendapatkan estimasi nilai harapan dari model loglinier dengan metode maksimum likelihood, terlebih dahulu dicari statistik cukup dari model loglinier.

Menurut Agresti (2002), sebelum menentukan kecocokan model loglinier, hal pertama yang harus diperoleh adalah statistik cukup minimal. Statistik cukup adalah tabel marginal yang melambangkan model. Menurut Bayo lawal (2003), statistik cukup minimal adalah susunan penjumlahan yang berhubungan dengan pengaruh pada model loglinier. Peluang gabungan poisson pada {����} adalah

� � ��

−�����

��� ���� ����! �

� �

(2.7) dimana hasil kali menunjukkan seluruh sel pada tabel. log likelihood dari � yaitu:


(15)

�(�) =� � � ����

ln(����)

� � − � � � ���� � � � (2.8)

Model umum loglinier tiga dimensi (���) pada tabel 2.3, yaitu:

���� = �+ ���+���+���+����� +����� +����� +������� (2.9)

Diketahui ���� = ln���� pada persamaan (2.9), jika persamaan tersebut dirubah menjadi bentuk logaritma maka diperoleh

���� = exp��+ ���+��� +���+����� +�����+����� +�������� (2.10)

Persamaan (2.10) disubstitusi ke persamaan log likelihood, yaitu:

�(�) =� � � ���� � ��+ ��+�� +��+����� +����� +����� +�������� � �

− � � �exp⁡��+⋯+��������

� � � �(�) =��+� �++��� � +� �+�+��� +� �++���� � � +� � ���+����� � � +� � �+����+ � � � � �+�������+� � � ����������� − � � � � �

� � �exp��+⋯+��������. (2.11)

� � �

Notasi � merupakan parameter-parameter dalam model yang menjelaskan respon dari masing-masing variabel. Pada persamaan (2.11), {�++}, {�++} dan {�++�} merupakan koefisien dari masing-masing parameter dan jika {��++}, {�+�+} dan {�++�} berdiri sendiri tanpa diikuti oleh parameter-parameter maka {��++}, {�++} dan {�++} adalah statistik cukup. Beberapa statistik cukup sesuai model sebagai berikut:


(16)

Model Statistik Cukup Minimal (�,�,�) {�++}, {�+�+}, {�++�}

(��,�) {���+}, {�++�} (��,��) {���+}. {�+��}

(��,��,��) {���+}, {�+}, {�+��} Sumber: Agresti (2002)

Menurut Agresti (2002), nilai harapan pada suatu model merupakan penyelesaian menggunakan persamaan likelihood. Derivatif persamaan likelihood terhadap parameter-parameternya masing-masing disama dengankan nol sehingga diperoleh statistik cukup sama dengan nilai harapan. Misalkan untuk model (��,��). Log likehood persamaan (2.10) dengan ����� = ������� = 0. Derivatif persamaan log likelihood

1. Derifatif L(m) terhadap � ∂L(m)

∂� =� − � � � �����+ ��� +��� +���+����� +������ �

� �

Karena ln������=�+ �� +�� +��+�����+����� exp��+ �� +�� +��+�����+������= ���� diperoleh

∂L(m)

∂� =� − � � � � ��� 0 =� − � � � ����

� � �

�= � � � ����

� � �

� =��+++ (2.12) 2. Derifatif L(m)terhadap �

∂L(m)

∂�� =��++− � � �����+ ��� +��� +��� +�����+������

� �

Karena ln������=�+ �� +�� +��+�����+����� �� �� �� ��


(17)

diperoleh ∂L(m)

∂�� =��++− � � ����

� �

0 =�++− � � ����

� �

��++= � � ����

� �

��++= ���++ semua � (2.13) Menggunakan cara yang sama untuk ��.

3. Derifatif L(m)terhadap ����� ∂L(m)

∂����� =��+� − � �����+ �� +�� +��+�����+������

Karena ln������=�+ �� +�� +��+�����+����� exp��+ �� +�� +��+�����+������= ���� diperoleh

∂L(m)

∂����� =��+� − � ����

0 =�+� − � ����

��+� = � ����

��+� = ���+� semua � dan � (2.14) Menggunakan cara yang sama untuk �����.

Berdasarkan model (��,��) tersebut, terlihat nilai harapan mempunyai kesamaan dengan total marginal observasi data �� dan ��.


(18)

Menyelesaikan persamaan likelihood pada model (��,��) berdasarkan bentuk peluangnya yaitu:

���� = ��+��+��

++�

untuk semua �,� dan � (2.15) Bukti:

Diketahui �(��) =�(�)�(�|�) Jika � dan � bebas bersyarat � berlaku, �(���) =�(�)�(��|�)

=�(�)�(�|�)�(�|�) =�(�)�(��)

�(�)

�(��) �(�) =�(��)�(��)

�(�)

Dengan mengaitkan pada tabel kontingensi � × � × � diperoleh: ���� =��+��+��

++�

untuk semua �,� dan �

Nilai harapan multinomial pada � observasi yaitu ���� = �.���� atau ���� =

����

� dimana ����� =

��+��+��

�++� �. Persamaan likelihood pada (2.12) , (2.13) , dan (2.14) menspesifikasi bahwa estimasi maksimum likelihood yaitu ��+�=��+� ,

��+�� = �+�� dan ��++� = �++�. Oleh karena estimasi maksimum likelihood pada persamaan parameter adalah persamaan yang sama pada estimasi maksimum likelihood pada parameter tersebut,

����� =�����+���+��

++�

= ��+�.�+�� �++�

(2.16) Keterangan :

����� = frekuensi harapan

��+� =∑�=1���� = jumlah marginal pada variabel baris ke � dan layer ke � �+�� = ∑�=1���� = jumlah marginal pada variabel kolom ke � dan layer ke � �++� = ∑�=1���� = jumlah marginal pada variabel layer ke �


(19)

Nilai estimasi harapan disesuaikan dengan model masing-masing.

2.13 Uji Kebaikan Khi Kuadrat (Chi Squared Goodness of Fit Tests)

Menurut Saefuddin, dkk (2013) distribusi khi kuadrat digunakan sebagai uji kebaikan pengepasan (goodness of fit test). Statistik uji ini bertujuan menghitung jumlah kuadrat selisih antara nilai harapan dengan nilai observasi. Menurut S. Michael agar pengujian hipotesis dengan chi-kuadrat dapat digunakan dengan baik, maka hendaknya memenuhi asumsi sebagai berikut:

1. Random sampling tidak diperlukan, asalkan sampel tidak bias. Namun, yang terbaik cara untuk memastikan sampel tidak bias adalah pilihan acak.

2. Pengamatan bersifat independen. Asumsi penting untuk chi square adalah pengamatan yang independen.

3. Mutually exclusive baris dan kolom pada variabel katagorik yang termasuk dalam pengamatan.

4. Uji chi square tidak dapat dilakukan ketika katagori tumpang tindih atau tidak termasuk pada pengamatan.

5. Nilai harapan yang besar. Uji chi square untuk perkiraan yang terbaik ketika nilai harapan cukup besar dengan syarat tidak ada nilai harapan yang kurang dari 1 dan tidak lebih dari 20% dari nilai yang diharapkan kurang dari 5. Jika ditemukan data demikian maka dilakukan penggabungan katagori.

Pada pengujian chi square dengan banyak katagori, bila terdapat lebih dari satu nilai harapan kurang dari 5 maka nilai-nilai harapan tersebut dapat digabungkan dengan konsekuensi jumlah kategori akan berkurang dan informasi yang diperoleh juga berkurang.

Jika nilai observasi ���� dan nilai harapan ����� , statistik uji pearson chi square �2 untuk tabel kontingensi tiga dimensi yaitu:

�2 =� � �(���� − �����) 2 ����� �

�=1

� �=1

� �=1


(20)

Statistika alternatif untuk menguji kebaikan pengepasan adalah uji likelihood ratio square �2 yaitu:

�2 = 2� � � �

��� �� ������� ���� �

�=1

� �=1

� �=1

(2.18) Jika �ℎ�����2 > �2;�� atau �ℎ�����2 > �2;�� maka tolak �0. �0 adalah hipotesis nol model yang ingin diuji. Taraf signifikansi (� ) yang digunakan �= 0,05.

Nilai harapan dan derajat bebas disesuaikan dengan model yang diuji. Derajat bebas adalah banyaknya sel dalam tabel kontingensi dikurangi banyaknya parameter yang ditaksir dalam model.

Tabel 2.6 Derajat Kebebasan

Model Derajat Kebebasan (�,�,�) ��� − � − � − �+ 2

(��,�) (� −1)(�� −1)

(��,�) (� −1)(�� −1)

(��,�) (� −1)(�� −1)

(��,��) �(� −1)(� −1)

(��,��) �(� −1)(� −1)

(��,��) �(� −1)(� −1)

(��,��,��) (� −1)(� −1)(� −1)

(���) 0

Sumber: Agresti (2002)

Menurut Agresti (2002), nilai �2 atau �2 yang besar menunjukkan kesesuian yang rendah antara frekuensi pengamatan dengan frekuensi harapan atau model diuji kurang sesuai, dan sebaliknya. Menurut Saefuddin, dkk (2009) nilai �2 atau �2 yang kecil menunjukkan kesesuaian yang tinggi antara nilai observasi dengan nilai harapan, dan semakin besar nilai �2 atau �2 menunjukkan ketaksesuaian antara nilai observasi dengan nilai pengamatan yang berarti tertolaknya �0.


(21)

2.14 Uji Independensi

Uji independensi adalah uji untuk melihat ada tidaknya hubungan antar dua atau lebih variabel katagorik suatu hasil observasi. Pada tabel tiga dimensi dengan peluang gabungan ������ pada tiga variabel respon, hipotesis nol statistik independen adalah

�0:���� =��++�+�+�++� untuk semua �,� dan � ( tidak ada hubungan antara ketiga variabel)

Statistik uji independensi yang digunakan adalah uji pearson chi square �2 dan statistik alternatif yaitu uji likelihood ratio square �2.

Menurut Kazmier (2005) independensi mengimplikasikan bahwa pengetahuan terhadap katagori yang menjadi dasar penggolongan observasi dalam hal satu variabel tidak ada dampaknya pada probabilitas masuknya variabel yang lain ke dalam salah satu dari beberapa katagori. Ketika tiga variabel terlibat, frekuensi yang diamati dimasukkan ke dalam tabel klasifikasi tiga arah yaitu tabel kontingensi tiga dimensi � × � ×� , di mana � mengindikasi jumlah baris, � mengindikasi jumlah kolom, dan � mengindikasi jumlah layer.

Jika hipotesis nol tentang independensi ditolak untuk data-data tersebut, hal ini mengindikasikan bahwa dua variabel tersebut saling terikat atau dependen dan hal ini berarti terdapat hubungan antar keduanya. Berdasarkan hipotesis tentang independensi dari ketiga variabel, nilai yang diharapkan yang terkait dengan setiap sel dalam tabel kontingensi harus proporsional dengan nilai total yang diamati termasuk dalam kolom, baris dan layer yang memuat sel tersebut, yang terkait dengan ukuran sampel total. Andaikan �++ adalah nilai total marginal baris, �++ adalah nilai total marginal kolom, �++ adalah nilai total marginal layer, rumus nilai yang diharapkan adalah:

����� =

(�++)��++�(�++)


(22)

Uji independensi memiliki nilai yang sama dengan estimasi nilai harapan pada model loglinier mutually independent. Derajat kebebasan uji independen juga sama dengan model loglinier mutually independent ��� − � − � − �+ 2.

2.15 Uji Asosiasi Parsial

Uji asosiasi parsial bertujuan untuk menguji hubungan ketergantungan antara dua variabel dalam setiap level variabel (conditional association). Hubungan ketergantungan beberapa variabel yang merupakan parsial dari suatu model lengkap. Misalkan ingin menguji parameter ����� = 0 yang artinya menguji model hipotesisnya adalah sebagai berikut:

H0 : variabel satu dan variabel dua independen dalam setiap level variabel tiga (����� = 0)

H1 : ����� (0 ����� ≠0)

Parameter – parameter dalam model loglinier akan diuji signifikansinya dengan selisih statistik uji likelihood ratio square (deviance). Pengujian ini memerlukan selisih statistik uji likelihood ratio square (deviance) sebagai berikut:

a. Statisik likelihood ratio square berdasarkan model sederhana dinyatakan dengan simbol �2(�1), dengan derajat bebas ��1.

b. Statistik likelihood ratio berdasarkan model lengkap dinyatakan dengan simbol �2(�0), dengan derajat bebas ��0.

c. Selisih statistik likelihood ratio (deviance): �2[(�1)|(�0)] =�2(�1)− �2(

0), dengan derajat bebas �� =��1 − ��0.

d. Jika �2(�1|�0) ≥ �(2��,) maka model �1 ditolak. Kemudian analisis untuk model – model sederhana yang lain terhadap model lengkapnya. Model yang diterima adalah model terbaik.


(23)

Menurut Agresti (2002) interpretasi parameter model loglinier menggunakan efek order tertinggi. Interpretasi model yang menggunakan efek dua faktor di gambarkan dengan conditional odds ratio. Odds ratio pada tabel parsial sebagai conditional odds ratio. Misalkan untuk setiap tingkat � pada variabel �, conditional association antara � dan � menggunakan (� −1)(� −1) odds ratio, seperti

���(�) =

������+1,�+1,� ��,�+1,���+1,�,�

, 1≤ � ≤ � −1, 1≤ � ≤ � −1. (2.20) dengan cara yang sama, (� −1)(� −1) odds ratio {�()} yang menggambarkan conditional association �� dan (� −1)(� −1) odds ratio {�()��} yang menggambarkan conditional association ��. Model loglinier biasa menggunakan kendala pada conditional odds ratio, misalkan conditional association antara � dan � maka {���(�) = 1,� = 1, … ,� −1,� = 1, … ,� −1,�= 1, … ,�}.

Parameter dua faktor secara langsung berhubungan terhadap conditional odds ratio, yaitu

ln���(�) =��

������+1,�+1,� ��+1,���1,�+1,�

=����� +���+1,+1− ���,+1 − ���+1,

���() = exp������ +���+1,�+1 − ����,�+1 − ����+1,�� (2.21) Karena disisi kanan sama untuk semua � adalah sama, dengan tidak adanya faktor ketiga sehingga ekivalen

���(1) = ���(2) =⋯ =���(�) untuk semua � dan �.

Model loglinier menggunakan kendala sehingga jika tabel kontingensi 2 × 2 maka conditional odds ratio �� adalah exp⁡(�11��) karena �22�� = �12�� =�21�� = 0.

Jika � dan � independen pada setiap tabel parsial, maka � dan � dikatakan conditionally independent, dengan syarat �. Semua conditional odds ratio antara � dan � bernilai 1. Conditionally independent � dan �, syarat �, tidak berarti marginal independence � dan �. Hal tersebut berarti ketika odds ratio antara � dan � bernilai 1 untuk setiap tingkatan dari �, marginal odds ratio mungkin berbeda dari 1.


(24)

ln���(�) = ln

������+1,�+1,� ��+1,���1,�+1,�

ln���(�) = ln���� + ln��+1,�+1,� −ln��+1,�� −ln�1,�+1,� = 0

���(�) = exp(0) = 1 (2.22) Bernilai satu juga untuk hubungan conditionally independent lainnya. Menurut Razia Azen dan Cindy M. Walker (2011) misal � dan � dikatakan conditionally independent, dengan syarat �, marginal dan partial odds ratio pada � dan � akan sama dengan marginal dan partial odds ratio pada � dan �.


(1)

Nilai estimasi harapan disesuaikan dengan model masing-masing.

2.13 Uji Kebaikan Khi Kuadrat (Chi Squared Goodness of Fit Tests)

Menurut Saefuddin, dkk (2013) distribusi khi kuadrat digunakan sebagai uji kebaikan pengepasan (goodness of fit test). Statistik uji ini bertujuan menghitung jumlah kuadrat selisih antara nilai harapan dengan nilai observasi. Menurut S. Michael agar pengujian hipotesis dengan chi-kuadrat dapat digunakan dengan baik, maka hendaknya memenuhi asumsi sebagai berikut:

1. Random sampling tidak diperlukan, asalkan sampel tidak bias. Namun, yang terbaik cara untuk memastikan sampel tidak bias adalah pilihan acak.

2. Pengamatan bersifat independen. Asumsi penting untuk chi square adalah pengamatan yang independen.

3. Mutually exclusive baris dan kolom pada variabel katagorik yang termasuk dalam pengamatan.

4. Uji chi square tidak dapat dilakukan ketika katagori tumpang tindih atau tidak termasuk pada pengamatan.

5. Nilai harapan yang besar. Uji chi square untuk perkiraan yang terbaik ketika nilai harapan cukup besar dengan syarat tidak ada nilai harapan yang kurang dari 1 dan tidak lebih dari 20% dari nilai yang diharapkan kurang dari 5. Jika ditemukan data demikian maka dilakukan penggabungan katagori.

Pada pengujian chi square dengan banyak katagori, bila terdapat lebih dari satu nilai harapan kurang dari 5 maka nilai-nilai harapan tersebut dapat digabungkan dengan konsekuensi jumlah kategori akan berkurang dan informasi yang diperoleh juga berkurang.

Jika nilai observasi ���� dan nilai harapan ����� , statistik uji pearson chi square

�2 untuk tabel kontingensi tiga dimensi yaitu:

� � � �(���� − �����)2 �

� �


(2)

Statistika alternatif untuk menguji kebaikan pengepasan adalah uji likelihood ratio square �2 yaitu:

�2 = 2� � � �

��� �� ������� ���� �

�=1 � �=1 � �=1

(2.18) Jika �ℎ�����2 > �2;�� atau �ℎ�����2 > �2;�� maka tolak �0. �0 adalah hipotesis nol model yang ingin diuji. Taraf signifikansi (� ) yang digunakan �= 0,05.

Nilai harapan dan derajat bebas disesuaikan dengan model yang diuji. Derajat bebas adalah banyaknya sel dalam tabel kontingensi dikurangi banyaknya parameter yang ditaksir dalam model.

Tabel 2.6 Derajat Kebebasan

Model Derajat Kebebasan

(�,�,�) ��� − � − � − �+ 2

(��,�) (� −1)(�� −1)

(��,�) (� −1)(�� −1)

(��,�) (� −1)(�� −1)

(��,��) �(� −1)(� −1)

(��,��) �(� −1)(� −1)

(��,��) �(� −1)(� −1)

(��,��,��) (� −1)(� −1)(� −1)

(���) 0

Sumber: Agresti (2002)

Menurut Agresti (2002), nilai �2 atau �2 yang besar menunjukkan kesesuian yang rendah antara frekuensi pengamatan dengan frekuensi harapan atau model diuji kurang sesuai, dan sebaliknya. Menurut Saefuddin, dkk (2009) nilai �2 atau �2 yang kecil menunjukkan kesesuaian yang tinggi antara nilai observasi dengan nilai harapan, dan semakin besar nilai �2 atau �2 menunjukkan ketaksesuaian antara nilai observasi dengan nilai pengamatan yang berarti tertolaknya �0.


(3)

2.14 Uji Independensi

Uji independensi adalah uji untuk melihat ada tidaknya hubungan antar dua atau lebih variabel katagorik suatu hasil observasi. Pada tabel tiga dimensi dengan peluang gabungan ������ pada tiga variabel respon, hipotesis nol statistik independen adalah

�0:���� =��++�+�+�++� untuk semua �,�dan � ( tidak ada hubungan antara ketiga variabel)

Statistik uji independensi yang digunakan adalah uji pearson chi square �2 dan statistik alternatif yaitu uji likelihood ratio square �2.

Menurut Kazmier (2005) independensi mengimplikasikan bahwa pengetahuan terhadap katagori yang menjadi dasar penggolongan observasi dalam hal satu variabel tidak ada dampaknya pada probabilitas masuknya variabel yang lain ke dalam salah satu dari beberapa katagori. Ketika tiga variabel terlibat, frekuensi yang diamati dimasukkan ke dalam tabel klasifikasi tiga arah yaitu tabel kontingensi tiga dimensi � × � ×�, di mana � mengindikasi jumlah baris, � mengindikasi jumlah kolom, dan � mengindikasi jumlah layer.

Jika hipotesis nol tentang independensi ditolak untuk data-data tersebut, hal ini mengindikasikan bahwa dua variabel tersebut saling terikat atau dependen dan hal ini berarti terdapat hubungan antar keduanya. Berdasarkan hipotesis tentang independensi dari ketiga variabel, nilai yang diharapkan yang terkait dengan setiap sel dalam tabel kontingensi harus proporsional dengan nilai total yang diamati termasuk dalam kolom, baris dan layer yang memuat sel tersebut, yang terkait dengan ukuran sampel total. Andaikan ��++ adalah nilai total marginal baris, �++ adalah nilai total marginal kolom, �++ adalah nilai total marginal layer, rumus nilai yang diharapkan adalah:


(4)

Uji independensi memiliki nilai yang sama dengan estimasi nilai harapan pada model loglinier mutually independent. Derajat kebebasan uji independen juga sama dengan model loglinier mutually independent ��� − � − � − �+ 2.

2.15 Uji Asosiasi Parsial

Uji asosiasi parsial bertujuan untuk menguji hubungan ketergantungan antara dua variabel dalam setiap level variabel (conditional association). Hubungan ketergantungan beberapa variabel yang merupakan parsial dari suatu model lengkap. Misalkan ingin menguji parameter ����� = 0 yang artinya menguji model hipotesisnya adalah sebagai berikut:

H0 : variabel satu dan variabel dua independen dalam setiap level variabel tiga

(����� = 0)

H1 : ����� 0 (����� ≠0)

Parameter – parameter dalam model loglinier akan diuji signifikansinya dengan selisih statistik uji likelihood ratio square (deviance). Pengujian ini memerlukan selisih statistik uji likelihood ratio square (deviance) sebagai berikut:

a. Statisik likelihood ratio square berdasarkan model sederhana dinyatakan dengan simbol �2(�1), dengan derajat bebas ��1.

b. Statistik likelihood ratio berdasarkan model lengkap dinyatakan dengan simbol �2(�0), dengan derajat bebas ��0.

c. Selisih statistik likelihood ratio (deviance): �2[(�1)|(�0)] =�2(�1)− �2(

0), dengan derajat bebas �� =��1 − ��0.

d. Jika �2(�1|�0) ≥ �(2��,) maka model �1 ditolak. Kemudian analisis untuk model – model sederhana yang lain terhadap model lengkapnya. Model yang diterima adalah model terbaik.


(5)

Menurut Agresti (2002) interpretasi parameter model loglinier menggunakan efek order tertinggi. Interpretasi model yang menggunakan efek dua faktor di gambarkan dengan conditional odds ratio. Odds ratio pada tabel parsial sebagai conditional odds ratio. Misalkan untuk setiap tingkat � pada variabel �, conditional association

antara � dan � menggunakan (� −1)(� −1)odds ratio, seperti ���(�) =

������+1,�+1,� ��,�+1,���+1,�,�

, 1≤ � ≤ � −1, 1≤ � ≤ � −1. (2.20)

dengan cara yang sama, (� −1)(� −1) odds ratio {�()} yang menggambarkan

conditional association �� dan (� −1)(� −1) odds ratio {�()��} yang menggambarkan conditional association ��. Model loglinier biasa menggunakan kendala pada conditional odds ratio, misalkan conditional association antara � dan � maka {���(�) = 1,� = 1, … ,� −1,� = 1, … ,� −1,�= 1, … ,�}.

Parameter dua faktor secara langsung berhubungan terhadap conditional odds ratio, yaitu

ln���(�) =��

������+1,�+1,� ��+1,���1,�+1,�

=����� +���+1,+1− ���,+1 − ���+1,

���() = exp������ +���+1,�+1 − ����,�+1 − ����+1,�� (2.21) Karena disisi kanan sama untuk semua � adalah sama, dengan tidak adanya faktor ketiga sehingga ekivalen

���(1) = ���(2) =⋯ =���(�) untuk semua � dan �.

Model loglinier menggunakan kendala sehingga jika tabel kontingensi 2 × 2 maka

conditional odds ratio �� adalah exp⁡(�11��) karena �22�� = �12�� =�21�� = 0.

Jika � dan � independen pada setiap tabel parsial, maka � dan � dikatakan

conditionally independent, dengan syarat �. Semua conditional odds ratio antara � dan � bernilai 1. Conditionally independent � dan �, syarat �, tidak berarti

marginal independence � dan �. Hal tersebut berarti ketika odds ratio antara � dan � bernilai 1 untuk setiap tingkatan dari �, marginal odds ratio mungkin berbeda dari 1.


(6)

ln���(�) = ln

������+1,�+1,� ��+1,���1,�+1,�

ln���(�) = ln���� + ln��+1,�+1,� −ln��+1,�� −ln�1,�+1,� = 0

���(�) = exp(0) = 1 (2.22) Bernilai satu juga untuk hubungan conditionally independent lainnya. Menurut Razia Azen dan Cindy M. Walker (2011) misal � dan � dikatakan conditionally independent, dengan syarat �, marginal dan partial odds ratio pada � dan � akan sama dengan marginal dan partial odds ratio pada � dan �.