HIERARCHICAL LINIER MODELS (HLM) PADA DATA BERSTRUKTUR HIERARKI

HIERARCHICAL LINIER MODELS (HLM) PADA DATA
BERSTRUKTUR HIERARKI
Diana Kartikawati
Jurusan Matematika, F.MIPA, Universitas Brawijaya
Email : diana910331@gmail.com
Abstrak. HLM merupakan teknik analisis yang tepat untuk analisis data tersarang atau berstruktur hirarki di mana
pengamatan individu tersarang dalam kelompok. Menganalisis data yang bersifat hirarki dengan HLM dapat digunakan
untuk memperoleh informasi mengenai keragaman pada level kelompok yang tidak dapat diketahui jika analisis yang
digunakan adalah model regresi linier sederhana. Penerapan HLM dalam disiplin ilmu pendidikan misalnya mengenai
intelegensi dan masalah status sosial ekonomi siswa terhadap nilai ujian bahasa, di mana siswa tersarang di dalam sekolah.
Penelitian ini bertujuan membentuk beberapa model HLM 2 level dan menentukan model terbaik pada kasus pengaruh IQ
dan Status sosial ekonomi terhadap nilai ujian bahasa. HLM 2 level terdiri dari 2 submodel yaitu model level 1 dan model
level 2, gabungan 2 submodel tersebut menjadi bentuk model kombinasi yang terdiri dari efek tetap dan efek acak. Modelmodel HLM yang dibangun adalah model random intersept level 1, model random intersept level 2 dan model random
coefficient. Kumpulan data hirarki dibedakan dari level 1 yang tersarang dalam kelompok pada level 2, dalam hal ini siswa
dikelompokkan dalam sekolah. Data yang digunakan pada penelitian ini terdiri dari peubah respon hasil nilai ujian dengan
dua peubah prediktor level 1 yaitu IQ dan status sosial ekonomi siswa, satu peubah prediktor level 2 yaitu peubah rata-rata
status sosial ekonomi masing-masing sekolah. Hasil pengujian dengan deviance menunjukkan model terbaik untuk kasus
ini, adalah model random coefficient.
Kata Kunci :Hierarchical Linier Model, Data Berstruktur Hierarki .

1.


PENDAHULUAN

Data berkelompok yaitu kumpulan data dengan peubah respon diukur sekali untuk setiap subjek
(unit analisis) dan unit analisis dikelompokkan ke dalam, atau tersarang di dalam atau dikelompokkan
ke dalam kelompok unit (West dkk., 2007) sehingga unit analisis dan kelompok unit merupakan suatu
sistem hirarki atau merupakan suatu struktur tersarang. Data berstruktur hirarki merupakan kelompok
unit berkumpul yang sering dijumpai pada penelitian ilmu-ilmu sosial, karena pada penelitian sosial
terpusat pada masalah bagaimana hubungan antara individu dengan lingkungannya. (Hox, 2002).
Data hirarki melanggar asumsi kebebasan karena dalam struktur hirarki, individu di dalam
kelompok lebih homogen, sebab individu-individu di dalam kelompok cenderung untuk berbagi
karakteristik tertentu. Maka secara umum model regresi linier klasik kurang tepat digunakan untuk
menganalisis data dengan struktur hirarki (Osborne, 2000 ). Oleh karena itu perlu adanya strategi
pemodelan yang lebih baik. Salah satu pemodelan yang dapat digunakan untuk teknik analisis data
berstruktur hirarki yaitu Hierarchical Linear Model (HLM). Dengan menggunakan HLM dapat
mengetahui informasi mengenai keragaman pada level-2 yang tidak dapat diketahui jika analisis yang
digunakan adalah model regresi linier sederhana yang tanpa memperhatikan struktur hirarki.
2.

TINJAUAN PUSTAKA


Data berstruktur hirarki merupakan kelompok unit berkumpul. Kumpulan data hirarki
dibedakan dari level-1 yang tersarang dalam kelompok pada level lebih tinggi. Banyak penelitian
sosial melibatkan data berstruktur hirarki. Sebagai contoh pekerja dan perusahaan adalah unit analisis,
di mana peubah diukur pada kedua level (Heck dkk., 2010).
Hierarchical Linear Model (HLM) telah disebut sebagai model random coefficient, model linier
multilevel, model covariance component, dan model unbalanced dengan efek acak tersarang. istlah
HLM menangkap dua fitur dalam mendefinisikan model. Pertama, data yang sesuai untuk model
berstruktur hirarki, dengan unit level pertama tersarang dalam unit level kedua, unit level kedua
tersarang di dalam unit level ketiga, dan seterusnya. Kedua, parameter model tersebut terlihat seperti
memiliki struktur hirarki (Raudenbush dan Bryk, 1993).
Model dua level terdiri dari dua submodel yaitu pada level 1 dan level 2. Model linier hirarki
memungkinkan untuk penelitian secara simultan hubungan dalam level hirarki, serta hubungan di
seluruh level. Dua model yang dikembangkan agar mencapai hal ini: salah satu yang mencerminkan
hubungan dalam unit level yang lebih rendah, dan yang kedua bagaimana hubungan model dalam unit
level yang lebih rendah bervariasi antara unit (Woltman dkk., 2012). Gabungan model level 1 dan

369



level 2 merupakan model linier campuran (mixed linear model ) dengan koefisien regresi fixed (tetap)
dan random (acak) (Raudenbush and Bryk, 1993).
Model matematis berikut adalah model level 1 dengan satu peubah prediktor yaitu:
(1)
Dalam model level 2, koefisien regresi level 1 (
dan
digunakan sebagai peubah respon
dan dihubungkan pada setiap prediktor level 2. Setiap koefisien pada level-1, yaitu
dan
, yang
didefinisikan dalam model level-1 menjadi peubah respon pada model level-2 ,yaitu
(2)
(3)
Jika pada persamaan (2) dan (3) disubtitusikan pada persamaana (1) maka akan menjadi
model dalam bentuk kombinasi seperti berikut:
(4)

Pada persamaan (4) pada bagian [
] merupakan efek tetap
(fixed effect) dan pada bagian [

] disebut dengan efek random (efek acak),
merupakan interaksi yang menunjukan model sebagai akibat pemodelan
dari level 1 peubah
dengan level 2 peubah
(Raudenbush and Bryk, 2002). Pada data berstruktur hirarki, contohnya
pada struktur 2 level, model regresi linier tidak mencakup informasi level 2. Untuk mencakup
informasi level 2, maka semua peubah termasuk galat yang ada pada level 2 harus dimasukkan ke
dalam persamaan regresinya (Tantular dkk., 2009).
Pendugaan parameter (koefisien regresi dan komponen ragam) dalam pemodelan hirarki
dilakukan dengan menggunakan metode Maximum Likelohood (ML), yaitu prosedur pendugaan
umum, dengan memaksimalkan fungsi kemungkinan (Hox, 2010).
Menurut Goldstein (1989) prosedur ML menghasilkan penduga yang bias dari parameter acak.
Hal ini menjadi penting dalam contoh yang kecil, dan dapat menghasilkan penduga yang tak bias jika
digunakan Restricted Maximum Likelihood (REML) di mana modifikasi dilakukan pada fungsi profile
log-likelihood yang disebut dengan fungsi Restricted Log-Likelihood (Raudenbush and Bryk, 1993).


| |

∑(


̂)

(

̂)



|

̂

|

Metode maksimum likelihood memberikan suatu ukuran untuk menentukan seberapa baik
model cocok dengan data yang disebut dengan Deviance. Secara umum deviance didefinisikan
sebagai
, di mana
adalah nilai dari fungsi likelihood saat mencapai

konvergen. Semakin kecil nilai deviance model tersebut dikatakan semakin cocok (Hox, 2002).
3.

METODOLOGI

3.1

Sumber Data

Data yang digunakan pada penelitian ini merupakan data sekunder yaitu data hasil ujian bahasa
hasil survei sekolah mengenai tingkat intelegensi dan status sosial ekonomi terhadap nilai ujian bahasa
di
mana
siswa
tersarang
di
dalam
sekolah.
Data
tersebut

diperoleh
dari
http://www.statisticalinnovations.com.
3.2

Metode Analisis

Tahap pertama melakukan ekplorasi data secara grafis, kemudian membangun pemodelan HLM
yaitu pertama membangun model model null, model random intersept level 1, random intersept level
2, random coefficient dan model random coefficient dengan interaksi. Kedua menduga parameter dari
model yang telah dibangun dengan metode Maximum Likelihood. Metode ML yang digunakan adalah
metode REML. Perhitungan menggunakan software R 2.14 dan SPSS. Kemudian membandingkan
model-model tersebut menggunakan pengujian deviance untuk memperoleh model terbaik. Terakhir
menentukan keragaman yang dapat dijelaskan pada setiap level menggunakan koefisien determinasi.
4.

HASIL DAN PEMBAHASAN

Langkah pertama dalam analisis bertingkat biasanya adalah untuk mengembangkan model dasar
yaitu model unconditional means. Pengujian ini digunakan untuk melihat pengaruh kelompok (level-


ϰϮ

2). Model unconditional means digunakan untuk menghitung Interclass correlation (ICC).
Berdasarkan hasil perhitungan diperoleh nilai ICC sebesar 0.233, artinya proporsi keragaman pada
level sekolah sebesar 23.3%.
HLM model dibangun dalam 5 proses yaitu membangun model null, model random intersept
level 1, random intersept level 2, random coefficient, dengan model sebagai berikut:
Tabel 1. Hasil pendugaan parameter model-model HLM
Parameter
Model Random
Random Intersept
Intersept Level 1
Level 2
Efek tetap
Intersep
IQ
SSE
AGG_SSE
Efek acak

Intersep
Residual
IQ

Random
Coefficient

40.278**
2.195**
0.166**
-

40.536**
2.195**
0.166**
0.367**

40.526**
2.240**
0.164**

0.351**

22.399**
40.091
-

17.188**
40.058
-

17.110**
39.382
0.193**

** Parameter yang signifikan

Ketiga model yang telah dibangun akan dibandingkan untuk menentukan model yang terbaik
pada kasus pengaruh IQ dan status sosial ekonomi terhadap nilai ujian bahasa. Metode maksimum
likelihood memberikan suatu ukuran untuk menentukan seberapa baik model ukuran tersebut adalah
Deviance. Pemilihan model terbaik dapat dijelaskan melalui tabel sebagai berikut:

Tabel 2. Nilai deviance setiap model
Model
Model Random intersept level 1
Model Random intersept level 2
Model Random Coefficient

Deviance
15229.630
15196.472
15185.740

P-value