Data Kategorik Uji Homogenitas Marginal Dengan Model Log Linear Pada Tabel Kontingensi Tiga Dimensi Atau Lebih

BAB II LANDASAN TEORI

2.1 Data Kategorik

Data statistik yang diperhatikan dalam setiap analisis atau penelitian pada umumnya memuat banyak variabel numerik maupun variabel kategorik. Sehingga analisis data juga dapat dilakukan dengan memakai kedua macam ukuran variabel tersebut. Akan tetapi, dengan mentransformasikan semua variabel numerik menjadi variabel kategorik ordinal maka kita akan mempunyai suatu data baru dengan semua variabel kategorik, yang akan disebut data kategorik. Manfaat atau keuntungan yang dapat diperoleh dengan memakai data kategorik antara lain: a Ruang yang diperlukan untuk menyimpan data menjadi sangat sempitkecil dibandingkan dengan data aslinya atau data primernya b Waktu yang diperlukan untuk melakukan analisis data akan menjadi jauh lebih singkat daripada memakai data primer menjadi sangat kecil c Akhirnya, hasil analisis data kategorik dapat dilakukan atau dipertanggungjawabkan atas dasar pemikiran sebagai berikut 1. Pada dasarnya, analisis statistik dilakukan dengan tujuan untuk mempelajari perbedaan atau kesamaan kelompok-kelompok individu yang dibentuk berdasarkan kategori sebuah variabel atau lebih, antara lain perbedaan proporsi persentase, prevalensi atau insiden suatu peristiwa tertentu antara kelompok individu yang ditinjau. 2. mempelajari asosiasi ganda antar variabel kategorik dengan menerapkan model log linier, atau model regresi logistik yang meliputi penerapan statistik Rasio Kesamaan atau Rasio Kecenderungan RK 3. Model asosiasi korelasi antara variabel kategorik, seperti model regresi logistik t dinyatakan telah mempunyai pola yang standard atau baku. Sehingga lebih mudah dapat dipahami dan diulang kembali dengan memakai berbagai macam data kategorik sesuai dengan bidangnya masing-masing. Universitas Sumatera Utara 4. di pihak lain, kesimpulan yang diperoleh berdasarkan model asosiasi empiris antara variabel numerik kerap kali tidak dapat dipertanggungjawabkan, karena data yang dipakai pada umumnya bukanlah data yang sesuai. Data sering terdiri dari sejumlah objek yang terhitung dengan atribut tertentu yang dimiliki oleh kategori-kategori tertentu yang disusun dalam tabel satu dimensi, dua dimensi, tiga dimensi atau bahkan dalam tabel berdimensi lebih tinggi lagi, biasanya disebut tabel kontingensi satu arah, dua arah dan tiga arah. Masing-masing dimensi atau arah berhubungan dengan sebuah klasifikasi dalam kategori-kategori yang menyajikan satu atribut. Tabel satu arah, pengkategoriannya mungkin tidak relevan untuk setiap analisis statistik. Seseorang dapat memisalkan pernyataan yang dibuat-buat bahwa datanya merupakan sampel acak dan memperoleh sebuah perkiraan dari median atau rata-rata tetapi hasilnya tidak informatif atau sah karena datanya tidak dipilih secara acak, disini kurang pengacakan juga dapat menimbulkan pertanyaan bagaimana dalam arti statistik setiap kesimpulan populasi yang diterapkan. Pengujian ini sebenarnya bukan non parametrik jika pengujiannya mengenai sebuah parameter p yang merinci frekuensi terjadinya setiap angka. Ini adalah sebuah uji kecocokan dan goodness of fit test. Tabel dua arah, sama formatnya tetapi berbeda dalam status logikanya. Datanya terdiri dari dua sampel bebas. Namun demikian dalam dua kasus tersebut masih digambarkan bahwa pembedaannya dapat diabaikan untuk ukuran sampel yang cukup yang besar, dan dapat digunakan uji untuk sampel besar yang sama tanpa memandang apakah pemilihannya menetapkan hanya jumlah keseluruhan yang akan diambil sampelnya dan kemudian mencatat jumlah masing-masing kelas. Pada suatu keadaan, kita hanya menetapkan total keseluruhannya pada keadaan lain kita menetapkan tabel keseluruhan dan total baris. Hal ini juga mungkin untuk menetapkan total keseluruhan dan total kolom, dan sama dengan pertukaran baris dan kolom. Pendekatan uji sampel besar untuk kebebasan antara klasifikasi baris dan kolom adalah sama pada seluruh Universitas Sumatera Utara keadaan tersebut, dan merupakan uji terpenting yang tergantung pada total baris dan kolom pengamatan. Uji sampel besar yang cocok digunakan adalah uji Q Cochran Tabel multiarah, bila tabel dua arah dengan mudah disajikan pada kertas, tabel tiga arah atau lebih paling baik disajikan dengan subtabel-subtabel dan lebih dari satu penyajian selalu mungkin. Setelah data tersebut diberikan dalam tabel lebih baik untuk analisis selanjutnya dengan memasukkan tabel marginal yang ditunjukkan. Pembaca dapat menyusun data ini dengan susunan logika yang berbeda meskipun pengujian untuk kebebasan dapat diperluas dari tabel dua arah sampai multi arah, dan uji berpasangan mengenai kebebasan dapat digunakan, sehingga analisisnya biasanya tidak cukup tidak efisien dan kita sering tertarik dalam menguji dengan lebih mengembangkan hipotesis-hipotesis, atau bahkan serangkaian hipotesis. Banyak eksperimen secara simultan mempelajari lebih dari dua independen variabel atau lebih dari dua faktor. Misalnya eksperimen bias melibatkan dua kategori atau dua tingkatan dari satu faktor, tiga kategori dari faktor yang kedua, 5 kategori atau lima tingkat dari faktor yang ketiga, dengan sejumlah n subjek yang ditarik secara acak dari masing-masing 2x3x5 kelompok eksperimen tersebut. Ekperimen seperti itu dikenal dengan nama ‘2x3x5 faktorial eksperimen’. Data yang diperoleh dari eksperimen seperti itu dapat dikonseptualisasikan sebagai kubus bertiga dimensi, yang terdiri dari 2 baris, 3 kolom dan 5 lapis, dengan masing-masing n subjek dari 30 sel yang berbeda dalam eksperimen tersebut. Analisis dan interpretasi dari data yang dihasilkan dari eksperimen seperti itu adalah merupakan perluasan langsung dari analisis dan interpretasi dari klasifikasi dua arah. Dalam suatu eksperimen dua-faktor dengan n subjek dalam setiap sel, jumlah kuadrat total terbagi dalam empat bagian, yaitu: jumlah kuadrat antar baris, jumlah kuadrat antar kolom, jumlah kuadrat interaksi dan jumlah kuadrat sel dalam. Setiap jumlah kuadrat mempunyai sebuah angka yang menjadi angka derajat kebebasan. Jumlah kuadrat dibagi dengan angka derajat kebebasan untuk memperoleh taksiran variansi Universitas Sumatera Utara atau rata-rata kuadrat yang digunakan untuk menguji signifikansi pengaruh utama dan interaksi. Umpamakan sejumlah eksperimen yang melibatkan sejumlah R tingkatan dari faktor pertama, sejumlah C tingkatan dari faktor kedua, dan sejumlah L tingkatan dari faktor ketiga. Jumlah sel menjadi sebanyak RxCxL yang disingkat menjadi RCL. Misalkan khusus dalam kasus ini kita mempunyai satu alat pengukuran untuk setiap kombinasi RCL, jumlah total hasil pengukuran menjadi N. data untuk lapis pertama dari angka- angka hasil pengukuran itu dapat dituliskan sebagai berikut: Tabel 2.1 Tabel Data Untuk Lapis Pertama L A P I S 1 Variabel 2 Variabel 1 1 2 3 . . . C Rata-rata baris e 111 e 121 E 131 . . . e 1 1C _ e 1 . 1 e 211 e 221 E 231 . . . e 1 2C _ e 1 . 2 e 311 e 321 E 331 . . . e 1 3C _ e 1 . 3 . . . . . . . . . . . . . . . . . . e 11 R e 21 R E 31 R . . . e 1 RC … Jumlah _ e 11 . _ e 21 . _ e 31 . . . . _ e 1 .C _ e 1 .. Universitas Sumatera Utara Dalam subskrip di atas diidentifikasikan, yang pertama sebagai baris, yang kedua sebagai kolom dan yang ketiga sebagai lapis. Dengan demikian, misalnya e 321 menunjukkan observasi pada baris ketiga kolom kedua dari lapis pertama. _ e 11 . adalah rata-rata dari kolom pertama dari lapis petama, sedang _ e 1 .. rata-rata dari semua observasi yang ada pada lapis pertama. Adapun notasi pada lapis kedua adalah sebagai berikut: Tabel 2.2 Tabel Data Untuk Lapis Kedua L A P I S 2 Variabel 2 Variabel 1 1 2 3 . . . C Rata-rata baris e 112 e 122 E 132 . . . e 2 1C _ e 2 . 1 e 212 e 222 E 232 … e 2 2C _ e 2 . 2 e 312 e 322 E 332 . . . e 2 3C _ e 2 . 3 . . . . . . . . . . . . . . . . . . e 12 R e 22 R E 32 R . . . e 2 RC … Jumlah _ e 12 . _ e 22 . _ e 32 . ... _ e 2 .C _ e 2 .. Keterangan: C= Column kolom R=Row baris L= Layer lapis Universitas Sumatera Utara Demikian juga halnya dapat ditunjukkan lapis yang ketiga, keempat sampai lapis yang ke-L. secara umum 1 rc e menunjukkan yang menunjukkan hasil pengukuran baris yang ke-r, pada kolom yang ke-c dan pada baris yang ke-1.harus dipahami bahwa R menunjukkan angka dari baris, C merupakan angka dari kolom dan L merupakan angka dari lapis. Jumlah r menunjukkan baris yang ke-r, dimana r bias saja berupa angka 1, 2,…R. demikian juga dengan c dan 1 menunjukkan kolom yang ke c dan lapis yang ke-1. Rata-rata dari semua RCL= N adalah ... _ Χ jumlah kuadrat simpangan total dari rata- rata umum tadi dapat dituliskan: 2 1 1 1 ... X X rcl L l C c R r − ∑ ∑ ∑ = = =

2.2 Analisis Berdasarkan Tabel IxJxK