Pemodelan Kasus Ketidaklulusan Mahasiswa IPB pada Mata Kuliah Metode Statistika
PEMODELAN KASUS KETIDAKLULUSAN MAHASISWA IPB PADA
MATA KULIAH METODE STATISTIKA
ENDAH KURNIASARI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
RINGKASAN
ENDAH KURNIASARI. Pemodelan Kasus Ketidaklulusan Mahasiswa IPB pada Mata Kuliah
Metode Statistika. Dibimbing oleh INDAHWATI dan ITASIA DINA SULVIANTI.
Mata kuliah Metode Statistika merupakan salah satu mata kuliah yang penting karena berguna
dalam penelitian. Hampir semua departemen di IPB memasukkan mata kuliah ini sebagai mata
kuliah interdepartemen. Walaupun persentasinya tidak terlalu besar, di beberapa kelas masih ada
mahasiswa yang tidak lulus matakuliah ini. Penelitian ini bertujuan untuk mengetahui kaitan antara
banyaknya ketidaklulusan mahasiswa pada mata kuliah Metode Statistika terhadap karakteristik
kelas. Banyaknya mahasiswa yang tidak lulus merupakan data cacahan sehingga analisis yang
digunakan adalah regresi Poisson. Regresi ini memiliki asumsi keragamannya sama dengan nilai
rataannya (equidispersion), tetapi pada kenyataannya asumsi ini sering dilanggar. Apabila
keragamannya lebih besar dari nilai rataannya maka terjadi overdispersi. Dalam penelitian ini
digunakan regresi Binomial Negatif untuk menangani overdispersi pada regresi Poisson. Hasil
analisis dengan regresi Binomial Negatif menunjukkan bahwa banyaknya mahasiswa per kelas
berpengaruh terhadap banyaknya ketidaklulusan mahasiswa pada mata kuliah Metode Statistika
pada tahun ajaran 2008/2009 dan 2011/2012. Setiap perbedaan lima belas mahasiswa di suatu
kelas maka dugaan rata-rata banyaknya mahasiswa tidak lulus Metode Statistika sebesar 1.806 kali
dibanding kelas lain untuk tahun ajaran 2008/2009 dan 1.855 kali dibanding kelas lain untuk tahun
ajaran 2011/2012 dengan asumsi peubah lain dianggap tetap.
Kata kunci: regresi Poisson, overdispersi, regresi Binomial Negatif
PEMODELAN KASUS KETIDAKLULUSAN MAHASISWA IPB PADA
MATA KULIAH METODE STATISTIKA
ENDAH KURNIASARI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
Judul
Nama
NRP
: Pemodelan Kasus Ketidaklulusan Mahasiswa IPB pada Mata Kuliah Metode Statistika
: Endah Kurniasari
: G14080075
Menyetujui,
Pembimbing I
Pembimbing II
Dr. Ir. Indahwati, M.Si
NIP : 19650712 199003 2 002
Dra. Itasia Dina Sulvianti, M.Si
NIP : 19600508 198803 2 002
Mengetahui,
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si
NIP : 19650421 199002 1001
Tanggal Lulus :
KATA PENGANTAR
Alhamdulillahirobbil alamin, puji dan syukur penulis panjatkan kehadirat Allah SWT atas
limpahan nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini.
Shalawat serta salam semoga senantiasa tercurahkan kepada Rasulullah SAW beserta keluarga dan
sahabatnya. Karya ilmiah ini berjudul “Pemodelan Kasus Ketidaklulusan Mahasiswa IPB pada
Mata Kuliah Metode Statistika”. Karya ilmiah ini adalah salah satu syarat kelulusan yang harus
dipenuhi untuk mendapatkan gelar Sarjana Statistika pada Departemen Statistika, Fakultas
Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Terima kasih penulis ucapkan kepada semua pihak yang berperan serta dalam penyusunan
karya ilmiah ini, antara lain:
1. Ibu Dr. Ir. Indahwati, M.Si dan Ibu Dra. Itasia Dina Sulvianti, M.Si selaku dosen
pembimbing yang selalu memberikan saran, arahan, dan nasihat selama penyusunan
karya ilmiah ini.
2. Departemen Statistika dan Direktorat Tingkat Persiapan Bersama (TPB) atas data yang
diberikan sehingga penelitian ini dapat terlaksana.
3. Dr. Bagus Suhartono selaku penguji luar.
4. Seluruh Dosen Departemen Statistika yang telah memberikan ilmu dan wawasan selama
penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika
yang telah banyak membantu penulis.
5. Kedua orang tua, mas Tofa dan teh Sumi yang telah memberikan doa, kasih sayang,
dukungan serta semangat yang telah diberikan selama ini.
6. Rizki Fadhillah, Yulia Anggraeni, Opilianda, Arum Pusporini, Rifki Rizal, dan Aisyah
Noor Rafi’ah yang telah memberikan dukungan selama penulis menyelesaikan karya
ilmiah ini.
7. Aisyah Fitasari teman satu bimbingan yang telah berjuang bersama dalam menyelesaikan
karya ilmiah ini.
8. Teman-teman Statistika 45 atas semangat dan kebersamaannya selama ini.
9. Serta seluruh pihak yang telah membantu penulis dalam menyelesaikan penyelesaian
karya ilmiah ini.
Semoga karya ilmiah ini dapat memberikan manfaat bagi semua pihak. Amin.
Bogor, Januari 2013
Endah Kurniasari
RIWAYAT HIDUP
Penulis bernama Endah Kurniasari dilahirkan di Bogor tanggal 23 Juli 1990 sebagai anak
kedua dari dua bersaudara, dari pasangan H. Sajuri dan Hj. Nur Khasanah. Pendidikan dasar
diselesaikan penulis di SDN SINDANGKARSA I pada tahun 2002. Kemudian menyelesaikan
pendidikan menengah di SMPN 7 DEPOK pada tahun 2002 dan di SMAN 99 JAKARTA pada
tahun 2008. Pada tahun yang sama penulis lulus seleksi masuk di Institut Pertanian Bogor (IPB)
melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN), dan diterima sebagai
mahasiswa Departemen Statistika FMIPA IPB dengan pilihan minor Ekonomi dan Studi
Pembangunan.
Selama perkuliahan penulis aktif dalam kegiatan Himpunan Keprofesian Gamma Sigma Beta.
Pada tahun 2011 penulis menjadi staf Biro Kesektretariatan Himpunan Keprofesian Gamma Sigma
Beta. Selain itu penulis juga aktif dalam berbagai kegiatan kepanitiaan seperti IDEA 2010, Masa
Perkenalan Fakultas MIPA 2010, Statistika Ria 2010, Welcome Ceremony Statistics 2010, dan
Lomba Jajak Pendapat Statistika 2011. Penulis juga pernah berkesempatan menjadi Asisten Dosen
mata kuliah Analisis Regresi I tahun ajaran 2012/2013. Pada bulan Februari-April 2012, penulis
melaksanakan kegiatan Praktek Lapang di International Flavors and Fragrances – PT. Essence
Indonesia, Jakarta pada divisi Sensory Consumer Insight.
DAFTAR ISI
Halaman
DAFTAR TABEL ..................................................................................................................... viii
DAFTAR GAMBAR ................................................................................................................ viii
DAFTAR LAMPIRAN ............................................................................................................. viii
PENDAHULUAN .....................................................................................................................
Latar Belakang .....................................................................................................................
Tujuan ..................................................................................................................................
1
1
1
TINJAUAN PUSTAKA ............................................................................................................
Regresi Poisson ....................................................................................................................
Overdispersi .........................................................................................................................
Regresi Binomial Negatif ....................................................................................................
Pemilihan Model Terbaik .....................................................................................................
1
1
2
2
3
METODOLOGI ........................................................................................................................
Pengumpulan Data ...............................................................................................................
Metode Analisis ...................................................................................................................
3
3
3
HASIL DAN PEMBAHASAN .................................................................................................
Eksplorasi Data .....................................................................................................................
Model Regresi Poisson .........................................................................................................
Model Regresi Binomial Negatif ..........................................................................................
Pemilihan Model Terbaik .....................................................................................................
Interpretasi Model Terbaik ...................................................................................................
3
3
5
6
6
7
KESIMPULAN DAN SARAN ...................................................................................................
7
DAFTAR PUSTAKA ...............................................................................................................
8
LAMPIRAN ..............................................................................................................................
9
DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
Halaman
Tabulasi silang banyaknya ketidaklulusan dengan dosen pengajar 2008/2009
4
Tabulasi silang banyaknya ketidaklulusan dengan dosen pengajar 2011/2012
5
Nilai dugaan parameter regresi Poisson tahun ajaran 2008/2009
5
Nilai dugaan parameter regresi Poisson tahun ajaran 2011/2012
5
Nilai dugaan parameter regresi Binomial Negatif tahun ajaran 2008/2009
6
Nilai dugaan parameter regresi Binomial Negatif tahun ajaran 2011/2012
6
Perbandingan model regresi Poisson dengan regresi Binomial Negatif tahun ajaran
2008/2009
7
Perbandingan model regresi Poisson dengan regresi Binomial Negatif tahun ajaran
2011/2012
7
Rasio rata-rata ketidaklulusan setiap perbedaan banyaknya mahasiswa per kelas
7
tahun ajaran 2008/2009
Rasio rata-rata ketidaklulusan setiap perbedaan banyaknya mahasiswa per kelas
tahun ajaran 2011/2012
7
DAFTAR GAMBAR
1
2
Sebaran kelas yang memiliki mahasiswa tidak lulus Metode Statistika 2008/2009
Sebaran kelas yang memiliki mahasiswa tidak lulus Metode Statistika 2011/2012
Halaman
4
4
DAFTAR LAMPIRAN
1
2
Daftar peubah yang digunakan
Deskriptif peubah penjelas
Halaman
10
11
1
PENDAHULUAN
Latar Belakang
Metode Statistika (STK211) merupakan
salah satu mata kuliah yang berada dalam
koordinasi Departemen Statistika. Mata kuliah
ini menjelaskan prinsip-prinsip dasar metode
statistika dan beberapa metode analisis
sederhana yang dapat diterapkan pada
beberapa bidang terapan, seperti pertanian,
sosial, ekonomi, dan sebagainya. Metode
Statistika sangat diperlukan dalam penelitian,
karena itulah hampir semua departemen
memasukkan mata kuliah ini sebagai mata
kuliah interdepartemen. Selain itu, mata kuliah
Metode Statistika juga menjadi prasyarat bagi
mata kuliah statistika terapan lainnya.
Pada beberapa kelas masih ada mahasiswa
yang tidak lulus dalam mata kuliah ini.
Walaupun persentasenya tidak terlalu besar,
kasus ini menarik untuk dikaji dengan tujuan
untuk mengetahui kaitan antara banyaknya
mahasiswa yang tidak lulus mata kuliah
Metode
Statistika
dengan
beberapa
karakteristik kelas. Kelas besar dengan jumlah
mahasiswa yang banyak memiliki suasana
kelas yang kurang kondusif sehingga rata-rata
mahasiswa akan lebih sulit menangkap
pelajaran dibandingkan dengan mahasiswa
pada kelas yang banyaknya mahasiswa lebih
sedikit. Jenis kelamin antara perempuan dan
laki-laki juga memiliki kecenderungan yang
berbeda terhadap hasil dari proses belajar
mengajar di kelas. Selain itu kondisi awal
mahasiswa (IPK TPB) juga mempengaruhi
kelulusan pada suatu mata kuliah. Mahasiswa
dengan IPK TPB yang lebih tinggi cenderung
lebih cepat mengerti pelajaran dibandingkan
mahasiswa dengan IPK yang lebih rendah.
Berdasarkan hal tersebut, kelas dengan ratarata IPK TPB yang rendah diduga memiliki
tingkat ketidaklulusan yang lebih tinggi
dibandingkan kelas yang rata-rata IPK TPB
yang tinggi.
Banyaknya mahasiswa yang tidak lulus
pada mata kuliah Metode Statistika merupakan
data cacahan sehingga untuk menganalisisnya
digunakan regresi Poisson. Regresi Poisson ini
memiliki asumsi bahwa nilai rataan sama
dengan nilai ragamnya yaitu equidispersion.
Tetapi pada kenyataanya, asumsi ini seringkali
dilanggar. Apabila keragamannya lebih besar
dari nilai rataannya maka terjadi overdispersi.
Akibat overdispersi pada regresi Poisson akan
menghasilkan galat baku yang lebih kecil dari
yang sebenarnya (underestimate), sehingga
dapat mengakibatkan kesalahan inferensia
bagi parameternya. Ada beberapa metode yang
digunakan untuk menangani overdispersi,
salah satunya yang akan digunakan pada
penelitian ini yaitu regresi Binomial Negatif.
Penelitian ini menggunakan data tahun
ajaran 2008/2009 dan 2011/2012. Dua tahun
ajaran ini memiliki cara penilaian yang
berbeda. Sejak tahun ajaran 2011/2012 semua
kelas paralel diberikan soal Ujian Tengah
Semester (UTS) yang sama. Sedangkan pada
tahun-tahun sebelumnya soal ujian dibuat oleh
dosen yang mengajar di kelas yang
bersangkutan.
Tujuan
Penelitian ini bertujuan untuk
1. Memodelkan banyaknya mahasiswa
yang tidak lulus mata kuliah Metode
Statistika pada suatu kelas dengan
beberapa peubah karakteristik kelas.
2. Mengatasi overdispersi pada regresi
Poisson dengan regresi Binomial
Negatif
TINJAUAN PUSTAKA
Regresi Poisson
Menurut Cameron dan Trivedi (1998),
model yang digunakan untuk data cacahan
adalah regresi Poisson yang merupakan model
regresi non-linier. Regresi Poisson mengacu
pada sebaran Poisson dengan
sebagai
parameternya. Sebaran Poisson merupakan
salah satu sebaran peluang diskret dan
memiliki asumsi nilai rataan sama dengan nilai
ragamnya atau
. Fungsi
peluang sebaran Poisson sebagai berikut
Regresi Poisson memerlukan fungsi
penghubung dalam membangun model.
Menurut McCullagh dan Nelder (1989), fungsi
penghubung untuk regresi Poisson yaitu
dengan
dan
merupakan
banyaknya data. Sehingga model regresi
Poisson dengan X sebagai peubah penjelasnya
dapat ditulis sebagai berikut
keterangan:
= peubah penjelas ke-j, j=1,2,...,k
2
= konstanta
= koefisien regresi peubah penjelas ke-j
Parameter koefisien regresi Poisson dapat
diduga
dengan
menggunakan
metode
kemungkinan maksimum. Menurut Yesilova
et al. (2010), fungsi log kemungkinannya
adalah
Model regresi Poisson termasuk model
nonlinier,
sehingga
proses
pendugaan
parameter koefisien regresinya melalui iterasi.
Overdispersi
Overdispersi dapat terjadi jika nilai ragam
lebih besar dari rataan, Var(Y) > E(Y)
(McCullagh dan Nelder 1989). Overdispersi
dapat diidentifikasi melalui nilai deviance
yang dibagi dengan derajat bebasnya atau bisa
disebut rasio dispersi. Jika nilai rasio
dispersi
lebih besar dari satu maka terjadi
overdispersi pada data.
Persamaan deviance secara umum yaitu
dengan
dan
merupakan
fungsi log kemungkinan. Deviance untuk
model regresi Poisson memiliki persamaan
sabagai berikut (Hardin dan Hilbe 2007):
dimana yi merupakan nilai aktual amatan ke-i
dari peubah respon dan
merupakan nilai
dugaan peubah respon untuk amatan ke-i.
Selain dengan melihat rasio dispersi,
overdispersi juga dapat diidentifikasi dengan
uji formal dengan hipotesis sebagai berikut:
Hipotesis
ditolak jika nilai D >
(Halekoh et al. 2007).
Overdispersi terjadi karena adanya sumber
keragaman yang tidak teramati pada data atau
adanya pengaruh peubah lain yang
mengakibatkan peluang suatu kejadian
bergantung pada kejadian sebelumnya. Selain
itu overdispersi dapat juga terjadi karena
adanya pencilan pada data, peubah penjelas
perlu
ditransformasi,
atau
kesalahan
spesifikasi fungsi penghubung.
Regresi Binomial Negatif
Model regresi Binomial Negatif yang
merupakan model campuran Poisson-Gamma
adalah model yang digunakan ketika terjadi
overdispersi pada model regresi Poisson
(Hilbe 2011). Dalam membangun model
regresi Binomial Negatif, asumsikan peubah
respon
Y
merupakan
peubah
acak
dan
. Fungsi
peluang bersama bagi Y dan
dapat ditulis
sebagai berikut :
Selanjutnya diperoleh sebaran marginalnya,
yaitu
Integral
di
atas
dapat
diselesaikan
menggunakan fungsi Gamma, dengan
demikian sebaran marginalnya dapat ditulis
sebagai berikut :
sehingga diperoleh nilai rataan dan ragamnya :
Model regresi Binomial Negatif memiliki
parameter
dan , dengan
dan
, sehingga fungsi sebaran Binomial
Negatif menjadi:
dengan y = 0,1,2,... dan
merupakan parameter dispersi dan adalah
nilai harapan dari y. Sebaran Binomial Negatif
memiliki nilai rataan E(Y)=
dan ragam
Var(Y) =
. Parameter dispersi pada
regresi
Binomial
Negatif
mampu
mengakomodasi permasalahan overdispersi
pada model regresi Poisson (Hilbe 2011).
3
Sama seperti regresi Poisson, regresi
Binomial Negatif juga memerlukan fungsi
penghubung log, sehingga model regresi
Binomial Negatif dapat ditulis sebagai berikut:
keterangan:
= peubah penjelas ke-j, j=1,2,...,k
= konstanta
= koefisien regresi peubah penjelas ke-j
dengan adalah rataan dari sebaran Binomial
Negatif.
Pendugaan parameter
regresi
Binomial Negatif dapat dilakukan dengan
metode kemungkinan maksimum. Menurut
Hilbe (2011), fungsi log kemungkinan untuk
regresi Binomial Negatif yaitu
Pemilihan Model Terbaik
Pemilihan model terbaik antara regresi
Poisson dengan regresi Binomial Negatif
dapat dilihat dari nilai AIC (Akaike
Information Criterion), dan BIC (Bayesian
Information Criterion) (Ismail dan Jemain,
2007). Nilai AIC dan BIC yang lebih kecil
menunjukkan model yang lebih baik.
dan
dimana L adalah nilai log kemungkinan, p
adalah banyaknya parameter. Selain itu
menurut Famoye et al. (2004) uji kebaikan
model dapat dilihat pula dengan nilai log
kemungkinan. Nilai log kemungkinan semakin
besar menunjukkan model yang lebih baik.
METODOLOGI
Metode Pengumpulan Data
Penelitian ini menggunakan data nilai mata
kuliah Metode Statistika mahasiswa IPB tahun
ajaran 2008/2009 dan 2011/2012 yang
diperoleh dari Departemen Statistika, serta
data lain yang berasal dari Direktorat Tingkat
Persiapan Bersama (TPB) IPB. Peubah respon
yang diamati yaitu banyaknya mahasiswa
yang tidak lulus mata kuliah Metode Statistika
tahun ajaran 2008/2009 dan 2011/2012.
Peubah penjelas yang digunakan adalah
1. Banyaknya mahasiswa per kelas (X1)
2. Persentase jenis kelamin perempuan
(X2)
1 = Persentase jenis kelamin
perempuan ≤ 35%
2 = Persentase jenis kelamin
perempuan diantara 35-70%
3 = Persentase jenis kelamin
perempuan >70%
3. Rata-rata IPK TPB (X3)
4. Dosen pengajar Metode Statistika
(X4)
1 = Dosen Departemen Statistika
0 = Dosen luar Departemen Statistika
Untuk keterangan jenis peubah dapat dilihat
pada Lampiran 1.
Data yang diperoleh masih merupakan data
individu setiap mahasiswa. Data tersebut
dikelompokkan ke dalam masing-masing kelas
paralel. Kemudian setiap kelas paralel dihitung
banyaknya mahasiswa per kelas, persentase
jenis kelamin perempuan, rata-rata IPK TPB
dan banyaknya mahasiswa tidak lulus dalam
suatu kelas. Setelah itu data masing-masing
kelas
dikumpulkan
untuk
selanjutnya
dianalisis.
Metode Analisis Data
Tahapan analisis data yang digunakan
adalah sebagai berikut:
1. Melakukan eksplorasi data terhadap
peubah respon dan peubah penjelas
2. Melakukan analisis regresi Poisson
untuk tahun ajaran 2008/2009 dan
2011/2012
3. Menghitung nilai deviance pada
regresi Poisson
4. Mendeteksi overdispersi pada model
regresi
Poisson
dengan
membandingkan
nilai
deviance
dengan
. Jika Hipotesis nol
ditolak maka terjadi overdispersi.
5. Jika terjadi overdispersi maka akan
dilakukan analisis regresi Binomial
Negatif
6. Melakukan pemilihan model terbaik
7. Melakukan interpretasi hasil model
terpilih.
Penelitian ini menggunakan perangkat lunak
R.2.15.0 untuk tahapan analisis data.
HASIL DAN PEMBAHASAN
Eksplorasi data
Kelas paralel yang diamati pada penelitian
ini untuk tahun ajaran 2008/2009 sebanyak 30
4
kelas, sedangkan tahun 2011/2012 sebanyak
31 kelas. Umumnya setiap departemen
memiliki satu kelas paralel, kecuali pada tahun
ajaran 2011/2012 Departemen Agribisnis
memiliki dua kelas paralel, Komunikasi dan
Pengembangan Masyarakat dua kelas paralel,
dan Kedokteran Hewan tiga kelas paralel.
Banyaknya kelas paralel yang memiliki
mahasiswa tidak lulus mata kuliah Metode
Statistika untuk tahun ajaran 2008/2009 dan
2011/2012 masing-masing sebanyak delapan
kelas. Kelas Teknik Hasil Hutan (THH) dan
Ilmu Komputer (KOM) merupakan kelas yang
memiliki mahasiswa tidak lulus pada tahun
ajaran 2008/2009 maupun 2011/2012. Pada
kelas THH masing-masing tahun ajaran
memiliki lima mahasiswa yang tidak lulus,
sedangkan untuk kelas Ilmu Komputer terjadi
peningkatan ketidaklulusan sabanyak dua
mahasiswa pada tahun ajaran 2011/2012.
ESL
1 (1.1%)
16
(11.3%)
TIN
THH
5 (6.3%)
MNH
3 (2,6%)
PTP
1 (1%)
ITK
2 (1.5%)
PSP
1 (2.2%)
KOM
2 (1.8%)
0
5
10
15
20
Gambar 1 Sebaran kelas yang memiliki
mahasiswa tidak lulus Metode
Statistika 2008/2009
MAT
2 (2.3%)
13
(12.7%)
MAN
KOM
4 (4.2%)
KIM
5 (5.3%)
THH
5 (6,8%)
MSP
1 (1.5%)
AGB2
2 (3.4%)
AGB1
5 (6.7%)
0
Gambar 2
5
10
15
Sebaran kelas yang memiliki
mahasiswa tidak lulus Metode
Statistika 2011/2012
Kelas yang memiliki mahasiswa tidak lulus
mata kuliah Metode Statistika terbanyak pada
tahun ajaran 2008/2009 adalah kelas Teknik
Industri Pertanian (TIN) yaitu 16 mahasiswa,
sedangkan pada tahun ajaran 2011/2012
adalah kelas Manajemen (MAN) yaitu 13
mahasiswa. Secara keseluruhan, banyaknya
ketidaklulusan mahasiswa terhadap mata
kuliah Metode Statistika tahun ajaran
2008/2009 lebih rendah dibandingkan tahun
2011/2012. Hal ini dapat dilihat dari
persentase
banyaknya
ketidaklulusan
mahasiswa pada masing-masing kelas.
Deskripsi semua peubah penjelas dapat
dilihat pada Lampiran 2. Pada tahun ajaran
2008/2009, TIN merupakan kelas terbesar dan
memiliki mahasiswa tidak lulus Metode
Statistika terbanyak. Selain TIN, kelas-kelas
yang memiliki mahasiswa tidak lulus Metode
Statistika juga memiliki jumlah mahasiswa
lebih besar dari 70 orang. Sedangkan untuk
tahun ajaran 2011/2012, kelas yang memiliki
jumlah mahasiswa terbanyak yaitu kelas
MNH, tetapi kelas ini tidak memiliki
mahasiswa tidak lulus Metode Statistika.
Kelas MAN dengan mahasiswa tidak lulus
Metode Statistika terbanyak termasuk kelas
yang besar karena memiliki jumlah mahasiswa
102 orang. Kelas-kelas lain yang memiliki
mahasiswa tidak lulus Metode Statistika juga
merupakan kelas besar, kecuali untuk kelas
AGB2 dan MSP yang memiliki jumlah
mahasiswa kurang dari 70 orang.
Tabel 1 Tabulasi
silang
banyaknya
ketidaklulusan dengan dosen pengajar
2008/2009
Dosen pengajar
Kelas
Dosen
Dosen
luar
STK
Semua
mahasiswa
12
10
lulus Metode Statistika
Terdapat mahasiswa
tidak lulus Metode
7
1
Statistika
Total
19
11
Hasil eksplorasi data untuk peubah X4
(dosen pengajar) dapat dilihat pada Tabel 1
dan 2. Berdasarkan Tabel 1, kelas paralel yang
memiliki mahasiswa tidak lulus Metode
Statistika yaitu sebanyak tujuh kelas yang
dosen pengajarnya berasal dari luar
Departemen Statistika dan satu kelas yang
dosen pengajarnya berasal dari Departemen
Statistika.
Pada tahun ajaran 2011/2012, kelas paralel
yang memiliki mahasiswa tidak lulus Metode
Statistika sebanyak tiga kelas yang dosen
pengajarnya berasal dari luar Departemen
5
Statistika dan lima kelas yang dosen
pengajarnya
berasal
dari
Departemen
Statistika. Hasil tabulasi ini berbeda dengan
tahun ajaran 2008/2009 yaitu kelas yang dosen
pengajarnya
berasal
dari
Departemen
Statistika lebih sedikit terjadi ketidaklulusan.
Tabel 2 Tabulasi
silang
banyaknya
ketidaklulusan dengan dosen pengajar
2011/2012
Dosen pengajar
Kelas
Dosen
Dosen
luar
STK
Semua mahasiswa lulus
12
11
Metode Statistika
Terdapat
mahasiswa
tidak lulus Metode
3
5
Statistika
Total
15
16
Model Regresi Poisson
Pendugaan model regresi Poisson tahun
ajaran 2008/2009 dan 2011/2012 dapat dilihat
pada Tabel 3 dan 4. Persamaan model regresi
Poisson untuk semua peubah penjelas dapat
ditulis sebagai berikut:
Persamaan yang dihasilkan regresi Poisson
untuk tahun ajaran 2008/2009 yaitu
Berdasarkan Tabel 3 peubah penjelas yang
signifikan pada taraf nyata 10% adalah
banyaknya mahasiswa per kelas (X1),
persentase jenis kelamin perempuan (X2), ratarata IPK TPB (X3), dan dosen pengajar (X4).
Nilai rasio dispersi yang diperoleh yaitu
1.4986. Nilai ini lebih dari satu tetapi masih
mendekati satu, sehingga diperlukan uji formal
untuk mendeteksi overdispersi yaitu dengan
membandingkan nilai deviance dengan nilai
Khi-Kuadrat. Nilai deviance yang diperoleh
sebesar 35.966 lebih besar dari nilai
33.19624 sehingga tolak H0 maka
dapat dikatakan terjadi overdispersi pada data.
Analisis regresi Poisson untuk tahun
ajaran 2011/2012 menghasilkan persamaan
sabagai berikut:
Tabel 4
Nilai dugaan parameter regresi
Poisson tahun ajaran 2011/2012
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
2.6508
2.4964
1.062
0.2883
β1
0.0389
0.0086
4.521
0.0000*
β 21
0.0993
0.5536
0.179
0.8577
β 23
-0.3636
0.4876
-0.745
0.4560
β3
-2.5215
0.9389
-2.686
0.0073*
β4
2.3176
0.5141
4.508
0.0000*
Deviance = 82.336; derajat bebas = 25; nilai
AIC = 119.69 rasio dispersi= 3.2934; tanda
(*) menunjukkan peubah penjelas yang
signifikan pada taraf nyata 10%.
Tabel 3
Nilai dugaan parameter regresi
Poisson tahun ajaran 2008/2009
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
-11.1601
3.7061
-3.011
0.0026 *
β1
0.0362
0.0101
3.600
0.0003 *
β 21
2.4064
0.6012
4.003
0.0000 *
β 23
-17.7445
2083.1527
-0.009
0.9932
β3
2.7581
1.4813
1.862
0.0626 *
β4
-2.4303
0.9251
-2.627
0.0086 *
Deviance = 35.966; derajat bebas = 24; nilai
AIC = 70.286; rasio dispersi= 1.4986; tanda
(*) signifikan pada taraf nyata 10%.
Berdasarkan Tabel 4 peubah penjelas yang
signifikan pada taraf nyata 10% diantaranya
peubah banyaknya mahasiswa per kelas (X1),
rata-rata IPK TPB (X3), dan dosen pengajar
Metode Statistika (X4).
Nilai rasio dispersi yang diperoleh sebesar
3.2934. Nilai ini lebih dari satu, untuk lebih
memastikannya dilakukan uji formal. Nilai
deviance yang diperoleh sebesar 82.336 lebih
besar dari nilai
34.38159 sehingga
tolak H0 maka dapat dikatakan terjadi
overdispersi pada data. Hasil regresi Poisson
yang
melanggar
asumsi
equidispersi
menghasilkan regresi yang semu dan galat
baku yang dihasilkan lebih kecil dari yang
sebenarnya (underestimate). Untuk mengatasi
6
overdispersi diperlukan metode lain yaitu
regresi Binomial Negatif.
Regresi Binomial Negatif
Hasil pendugaan regresi Binomial Negatif
untuk tahun ajaran 2008/2009 dan 2011/2012
dapat dilihat dari Tabel 5 dan Tabel 6. Model
regresi Binomial Negatif untuk semua peubah
penjelas dapat ditulis sebagai berikut:
Persamaan yang dihasilkan
Binomial Negatif untuk tahun
2008/2009 yaitu
Tabel 5
regresi
ajaran
Nilai dugaan parameter regresi
Binomial Negatif tahun ajaran
2008/2009
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
-4.041
6.336
-0.638
0.5236
β1
0.0394
0.0163
2.455
0.0141 *
β 21
2.197
1.237
1.775
0.0758 *
β 23
-36.29
3.103e+07
0.000
1.0000
β3
0.1113
2.522
0.044
0.9648
β4
-1.1494
1.194
-1.251
0.2110
Deviance = 19.337; derajat bebas = 24; rasio
dispersi = 0.8057;
; AIC = 67.37;
tanda (*) menunjukkan peubah penjelas yang
signifikan pada taraf nyata 10%.
Berdasarkan Tabel 5 dari empat peubah ada
dua peubah yang nyata pada taraf nyata 10%
yaitu banyaknya mahasiswa per kelas (X1) dan
persentase jenis kelamin yang kurang dari
35% (X21).
Nilai rasio dispersi yang dihasilkan regresi
Binomial Negatif untuk tahun ajaran
2008/2009 sebesar 0.8057. Nilai ini mendekati
satu, untuk lebih memastikannnya dilakukan
uji formal. Nilai deviance yang dihasilkan
sebesar 19.337, nilai ini lebih kecil dari
33.19624 maka dapat dikatakan
pada hasil regresi Binomial Negatif untuk
tahun ajaran 2008/2009 tidak terjadi
overdispersi pada data.
Untuk tahun ajaran 2011/2012 persamaan
regresi Binomial Negatif yang dihasilkan yaitu
Tabel 6
Nilai dugaan parameter regresi
Binomial Negatif tahun ajaran
2011/2012
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
2.1283
6.7868
0.314
0.7538
β1
0.0412
0.0234
1.758
0.0787*
β 21
0.5795
2.5069
0.231
0.8172
β 23
0.1842
1.1936
0.154
0.8773
β3
-2.1502
2.6819
-0.802
0.4227
β4
1.0619
1.1689
0.908
0.3636
Deviance = 18.63 derajat bebas = 25; rasio
dispersi = 0.7452;
; AIC=86.817;
tanda (*) menunjukkan peubah penjelas yang
signifikan pada taraf nyata 10%.
Berdasarkan Tabel 6 peubah pejelas yang
signifikan pada taraf nyata 10% adalah
banyaknya mahasiswa per kelas (X1). Peubah
X1 ini juga signifikan pada tahun ajaran
2008/2009.
Nilai rasio dispersi yang dihasilkan regresi
Binomial Negatif untuk tahun ajaran
2011/2012 sebesar 0.7452. Sedangkan nilai
deviance yang dihasilkan yaitu sebesar 18.63.
Nilai ini lebih kecil dari nilai
maka dapat dikatakan tidak tolak
H0 artinya pada hasil regresi Binomial Negatif
untuk tahun ajaran 2011/2012 tidak terjadi
overdispersi pada data.
Pemilihan Model Terbaik
Pemilihan model terbaik untuk kasus
ketidaklulusan mahasiswa pada mata kuliah
Metode Statistika untuk tahun ajaran
2008/2009 dan tahun ajaran 2011/2012 dapat
dilihat pada Tabel 7 dan Tabel 8. Pemilihan
model terbaik antara regresi Poisson dan
regresi Binomial Negatif dapat dilihat dari
nilai AIC dan BIC yang paling kecil (Ismail
dan Jemain 2007). Selain itu dapat juga dilihat
dari nilai log kemungkinan yang besar
(Famoye et al. 2004).
Banyaknya mahasiswa tidak lulus Metode
Statistika pada kedua tahun ajaran jika
dianalisis dengan regresi Poisson akan terjadi
7
overdispersi. Model regresi Poisson tersebut
menghasilkan hampir semua peubah penjelas
signifikan pada taraf nyata 10%. Sedangkan
pada model regresi Binomial Negatif hanya
dua peubah penjelas yang signifikan pada taraf
nyata 10% untuk tahun ajaran 2008/2009 dan
satu peubah untuk tahun ajaran 2011/2012.
Tabel 7
Perbandingan
model
regresi
Poisson dengan regresi Binomial
Negatif tahun ajaran 2008/2009
Regresi
Regresi
Kriteria
Binomial
Poisson
Negatif
AIC
70.286
67.37
BIC
78.693
73.785
Log kemungkinan
-29.143
-26.689
Tabel 8
Perbandingan
model
regresi
Poisson dengan regresi Binomial
Negatif tahun ajaran 2011/2012
Regresi
Regresi
Kriteria
Binomial
Poisson
Negatif
AIC
119.69
86.817
BIC
128.290
93.422
Log kemungkinan
-53.843
-36.371
Pemilihan model terbaik pada kasus ini
cukup dilihat dari nilai log kemungkinannya.
Hal ini dikarenakan banyaknya pengamatan
dan banyaknya parameter masing-masing
metode memiliki jumlah yang sama, sehingga
nilai AIC dan BIC akan sejalan dengan nilai
log kemungkinannya. Regresi Binomial
Negatif memiliki nilai log kemungkinan yang
lebih besar dari pada regresi Poisson. Oleh
karenanya, model regresi Binomial Negatif
lebih baik dibandingkan regresi Poisson pada
data overdispersi.
Interpretasi Model Terbaik
Berdasarkan hasil pemilihan model, regresi
Binomial Negatif lebih baik dibandingkan
regresi Poisson pada data yang terdapat
overdispersi. Hasil dari regresi Binomial
Negatif untuk tahun ajaran 2008/2009
menunjukkan salah satu peubah yang
signifikan yaitu peubah persentase jenis
kelamin perempuan kurang dari 35% (X21).
Hal ini menunjukkan bahwa persentase jenis
kelamin perempuan kurang dari 35% memiliki
selisih dugaan nilai harapan banyaknya
mahasiswa tidak lulus Metode Statistika yang
positif terhadap persentase jenis kelamin
perempuan antara 35-70% yang dijadikan
acuan dalam model ini. Selain itu peubah
banyaknya mahasiswa per kelas (X1)
merupakan peubah yang signifikan pada
regresi Binomial Negatif untuk tahun ajaran
2008/2009 dan 2011/2012. Ini menunjukkan
bahwa jika suatu kelas memiliki banyaknya
mahasiswa lebih besar satu mahasiswa
dibandingkan kelas lain maka dugaan rata-rata
banyaknya mahasiswa yang tidak lulus mata
kuliah Metode Statistika sebesar exp(0.0394)
= 1.040 kali lebih besar dibanding kelas lain
untuk tahun ajaran 2008/2009 dan exp(0.0412)
= 1.042 kali lebih besar dibanding kelas lain
untuk tahun ajaran 2011/2012 dengan asumsi
peubah lain dianggap tetap.
Untuk setiap perbedaan banyaknya
mahasiswa per kelas dengan dugaan rata-rata
banyaknya mahasiswa tidak lulus Metode
Statistika dapat dilihat pada Tabel 9 dan Tabel
10.
Tabel 9 Rasio rata-rata ketidaklulusan setiap
perbedaan banyaknya mahasiswa per
kelas tahun ajaran 2008/2009
Rasio
5
10
15
20
25
1.218
1.483
1.806
2.199
2.678
Tabel 10 Rasio rata-rata ketidaklulusan setiap
perbedaan banyaknya mahasiswa
per kelas tahun ajaran 2011/2012
Rasio
5
10
15
20
25
1.229
1.510
1.855
2.280
2.801
Berdasarkan Tabel 9 dan 10, misalkan untuk
perbedaan 15 maka interpretasinya yaitu jika
suatu kelas memiliki 15 orang mahasiswa
lebih banyak dibandingkan kelas lain maka
dugaan rata-rata banyaknya mahasiswa tidak
lulus sebesar exp(15×0.0394) = 1.806 kali
lebih besar dibanding kelas lain untuk tahun
ajaran 2008/2009 dan exp(15×0.0412) = 1.855
dibanding kelas lain untuk tahun ajaran
2001/2012 dengan asumsi peubah lain
dianggap tetap.
KESIMPULAN DAN SARAN
Karakteristik kelas yang berpengaruh
terhadap banyaknya mahasiswa yang tidak
lulus pada mata kuliah Metode Statistika untuk
tahun ajaran 2008/2009 dan 2011/2012
8
dengan menggunakan regresi Binomial
Negatif yaitu banyaknya mahasiswa per kelas.
Oleh karena itu disarankan banyaknya
mahasiswa per kelas dibatasi agar kegiatan
belajar mengajar bisa lebih efektif, sehingga
nilai harapan ketidaklulusan mahasiswa bisa
berkurang.
DAFTAR PUSTAKA
Cameron AC, Trivedi PK. 1998. Regression
Analysis of Count Data. Cambridge :
Cambridge Univesity Press.
Famoye F, Wulu JT, Singh KP.2004. On the
Generalized Poisson Regression Model
with an Application to Accident Data.
Journal of Data Science 2 : 287-295.
Halekoh
U,
Hojsgaard
S.
2007.
Overdispersion. Denmark: Unit of
Statistics and Decision Analysis, The
Faculty
of
Agricultural
Sciences,
University of Aarhus.
Hardin JW, Hilbe JM. 2007. Generalized
Linear Models and Extentions. Texas: A
Stata Press Publication
Hilbe JM. 2011. Negative Binomial
Regression Second Edition. Cambridge :
Cambridge Univesity Press.
Ismail N, Jemain AA. 2007. Handling
Overdispersion with Negative Binomial
and Generalized Poisson Regression
Models. Casualty Actuarial Society
Forum: 103-158.
McCullagh P, Nelder JA. 1989. Generalized
Linear Models. London: Chapman & Hall.
Yesilova A, Kaydan MB, Kaya Y. 2010.
Modeling Insect-Egg Data with Excess
Zeros Using Zero-Inflated Regression
Models.
Hacettepe
Journal
of
Mathematics and Statistics 39 : 273-282.
LAMPIRAN
10
Lampiran 1 Peubah yang Digunakan
Nama Peubah
Jenis Peubah
D1
D2
ket
Y
Banyaknya
ketidaklulusan pada
Metode Statistika
Numerik
-
-
-
X1
Banyaknya
mahasiswa per kelas
Numerik
-
-
-
X2
Persentase jenis
kelamin perempuan
Kategorik
1
0
≤ 35%
0
1
-
diantara 35-70%
>70%
-
X3
Rata-rata IPK TPB
Numerik
0
0
-
X4
Dosen pengajar
Metode Statistika
Kategorik
1
0
Dosen Departemen
Statistika
0
0
Dosen luar Departemen
Statistika
11
Lampiran 2 Deskriptif Peubah Penjelas
Banyaknya
Persentase Jenis
Mahasiswa per
Kelamin
Kelas
Perempuan
Kelas
2008/
2011/
2008/
2011/
2009
2012
2009
2012
85
0.62
0.66
Rata-rata IPK
TPB
Dosen Pengajar
2008/
2009
2011/
2012
2008/
2009
2011/
2012
3.20
3.29
1
1
STK
66
MSL
69
GFM
49
66
0.51
0.48
2.76
2.88
1
1
MAT
79
87
0.58
2.98
0
108
94
0.38
3.00
3.00
2.91
0
KOM
0.60
0.33
1
1
FIS
38
62
0.42
0.44
2.89
3.00
1
1
BIK
79
78
0.53
0.68
2.95
3.02
1
1
KIM
78
95
0.62
0.62
2.99
3.04
1
1
AGH
68
0.51
2.81
0.49
1
3.05
0
ARL
50
35
0.70
0.57
2.98
3.14
1
1
FKH1
134
63
0.61
0.62
2.83
3.02
0
0
FKH2
54
0.52
2.76
1
FKH3
44
0.59
2.84
1
BDP
69
79
0.55
0.57
2.75
2.73
0
0
MSP
62
65
0.47
0.74
2.60
2.62
0
0
THP
68
PSP
46
60
0.39
0.47
2.57
2.59
0
0
0.76
2.80
0
ITK
64
54
0.42
0.48
2.74
2.58
0
0
PTP
100
72
0.67
0.44
2.73
2.68
0
0
NTP
80
80
0.53
0.69
2.70
2.59
0
0
MNH
113
127
0.51
0.50
2.71
2.58
0
0
THH
79
73
0.35
0.51
2.72
2.69
0
0
KSH
97
107
0.59
0.56
2.69
2.63
0
0
SVK
50
76
0.46
0.61
2.51
2.69
0
0
ITP
123
109
0.63
0.64
3.41
3.36
1
1
TIN
141
116
0.62
0.53
3.09
3.05
0
0
IE
92
MAN
98
0.73
ESL
87
GIZ
112
127
0.85
0.71
3.05
3.05
0
0
IKK
44
58
0.93
0.95
2.77
2.65
0
0
KPM
108
0.74
2.63
2.64
1
1
102
0.69
2.72
0.70
0.70
77
0.79
KPM2
53
0.85
AGB1
74
AGB2
58
EKOSYR
49
2.81
0
2.80
2.73
1
1
0
1
0.73
2.53
2.90
0.60
0.63
2.83
2.78
1
1
1
MATA KULIAH METODE STATISTIKA
ENDAH KURNIASARI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
RINGKASAN
ENDAH KURNIASARI. Pemodelan Kasus Ketidaklulusan Mahasiswa IPB pada Mata Kuliah
Metode Statistika. Dibimbing oleh INDAHWATI dan ITASIA DINA SULVIANTI.
Mata kuliah Metode Statistika merupakan salah satu mata kuliah yang penting karena berguna
dalam penelitian. Hampir semua departemen di IPB memasukkan mata kuliah ini sebagai mata
kuliah interdepartemen. Walaupun persentasinya tidak terlalu besar, di beberapa kelas masih ada
mahasiswa yang tidak lulus matakuliah ini. Penelitian ini bertujuan untuk mengetahui kaitan antara
banyaknya ketidaklulusan mahasiswa pada mata kuliah Metode Statistika terhadap karakteristik
kelas. Banyaknya mahasiswa yang tidak lulus merupakan data cacahan sehingga analisis yang
digunakan adalah regresi Poisson. Regresi ini memiliki asumsi keragamannya sama dengan nilai
rataannya (equidispersion), tetapi pada kenyataannya asumsi ini sering dilanggar. Apabila
keragamannya lebih besar dari nilai rataannya maka terjadi overdispersi. Dalam penelitian ini
digunakan regresi Binomial Negatif untuk menangani overdispersi pada regresi Poisson. Hasil
analisis dengan regresi Binomial Negatif menunjukkan bahwa banyaknya mahasiswa per kelas
berpengaruh terhadap banyaknya ketidaklulusan mahasiswa pada mata kuliah Metode Statistika
pada tahun ajaran 2008/2009 dan 2011/2012. Setiap perbedaan lima belas mahasiswa di suatu
kelas maka dugaan rata-rata banyaknya mahasiswa tidak lulus Metode Statistika sebesar 1.806 kali
dibanding kelas lain untuk tahun ajaran 2008/2009 dan 1.855 kali dibanding kelas lain untuk tahun
ajaran 2011/2012 dengan asumsi peubah lain dianggap tetap.
Kata kunci: regresi Poisson, overdispersi, regresi Binomial Negatif
PEMODELAN KASUS KETIDAKLULUSAN MAHASISWA IPB PADA
MATA KULIAH METODE STATISTIKA
ENDAH KURNIASARI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013
Judul
Nama
NRP
: Pemodelan Kasus Ketidaklulusan Mahasiswa IPB pada Mata Kuliah Metode Statistika
: Endah Kurniasari
: G14080075
Menyetujui,
Pembimbing I
Pembimbing II
Dr. Ir. Indahwati, M.Si
NIP : 19650712 199003 2 002
Dra. Itasia Dina Sulvianti, M.Si
NIP : 19600508 198803 2 002
Mengetahui,
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si
NIP : 19650421 199002 1001
Tanggal Lulus :
KATA PENGANTAR
Alhamdulillahirobbil alamin, puji dan syukur penulis panjatkan kehadirat Allah SWT atas
limpahan nikmat dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini.
Shalawat serta salam semoga senantiasa tercurahkan kepada Rasulullah SAW beserta keluarga dan
sahabatnya. Karya ilmiah ini berjudul “Pemodelan Kasus Ketidaklulusan Mahasiswa IPB pada
Mata Kuliah Metode Statistika”. Karya ilmiah ini adalah salah satu syarat kelulusan yang harus
dipenuhi untuk mendapatkan gelar Sarjana Statistika pada Departemen Statistika, Fakultas
Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Terima kasih penulis ucapkan kepada semua pihak yang berperan serta dalam penyusunan
karya ilmiah ini, antara lain:
1. Ibu Dr. Ir. Indahwati, M.Si dan Ibu Dra. Itasia Dina Sulvianti, M.Si selaku dosen
pembimbing yang selalu memberikan saran, arahan, dan nasihat selama penyusunan
karya ilmiah ini.
2. Departemen Statistika dan Direktorat Tingkat Persiapan Bersama (TPB) atas data yang
diberikan sehingga penelitian ini dapat terlaksana.
3. Dr. Bagus Suhartono selaku penguji luar.
4. Seluruh Dosen Departemen Statistika yang telah memberikan ilmu dan wawasan selama
penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika
yang telah banyak membantu penulis.
5. Kedua orang tua, mas Tofa dan teh Sumi yang telah memberikan doa, kasih sayang,
dukungan serta semangat yang telah diberikan selama ini.
6. Rizki Fadhillah, Yulia Anggraeni, Opilianda, Arum Pusporini, Rifki Rizal, dan Aisyah
Noor Rafi’ah yang telah memberikan dukungan selama penulis menyelesaikan karya
ilmiah ini.
7. Aisyah Fitasari teman satu bimbingan yang telah berjuang bersama dalam menyelesaikan
karya ilmiah ini.
8. Teman-teman Statistika 45 atas semangat dan kebersamaannya selama ini.
9. Serta seluruh pihak yang telah membantu penulis dalam menyelesaikan penyelesaian
karya ilmiah ini.
Semoga karya ilmiah ini dapat memberikan manfaat bagi semua pihak. Amin.
Bogor, Januari 2013
Endah Kurniasari
RIWAYAT HIDUP
Penulis bernama Endah Kurniasari dilahirkan di Bogor tanggal 23 Juli 1990 sebagai anak
kedua dari dua bersaudara, dari pasangan H. Sajuri dan Hj. Nur Khasanah. Pendidikan dasar
diselesaikan penulis di SDN SINDANGKARSA I pada tahun 2002. Kemudian menyelesaikan
pendidikan menengah di SMPN 7 DEPOK pada tahun 2002 dan di SMAN 99 JAKARTA pada
tahun 2008. Pada tahun yang sama penulis lulus seleksi masuk di Institut Pertanian Bogor (IPB)
melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN), dan diterima sebagai
mahasiswa Departemen Statistika FMIPA IPB dengan pilihan minor Ekonomi dan Studi
Pembangunan.
Selama perkuliahan penulis aktif dalam kegiatan Himpunan Keprofesian Gamma Sigma Beta.
Pada tahun 2011 penulis menjadi staf Biro Kesektretariatan Himpunan Keprofesian Gamma Sigma
Beta. Selain itu penulis juga aktif dalam berbagai kegiatan kepanitiaan seperti IDEA 2010, Masa
Perkenalan Fakultas MIPA 2010, Statistika Ria 2010, Welcome Ceremony Statistics 2010, dan
Lomba Jajak Pendapat Statistika 2011. Penulis juga pernah berkesempatan menjadi Asisten Dosen
mata kuliah Analisis Regresi I tahun ajaran 2012/2013. Pada bulan Februari-April 2012, penulis
melaksanakan kegiatan Praktek Lapang di International Flavors and Fragrances – PT. Essence
Indonesia, Jakarta pada divisi Sensory Consumer Insight.
DAFTAR ISI
Halaman
DAFTAR TABEL ..................................................................................................................... viii
DAFTAR GAMBAR ................................................................................................................ viii
DAFTAR LAMPIRAN ............................................................................................................. viii
PENDAHULUAN .....................................................................................................................
Latar Belakang .....................................................................................................................
Tujuan ..................................................................................................................................
1
1
1
TINJAUAN PUSTAKA ............................................................................................................
Regresi Poisson ....................................................................................................................
Overdispersi .........................................................................................................................
Regresi Binomial Negatif ....................................................................................................
Pemilihan Model Terbaik .....................................................................................................
1
1
2
2
3
METODOLOGI ........................................................................................................................
Pengumpulan Data ...............................................................................................................
Metode Analisis ...................................................................................................................
3
3
3
HASIL DAN PEMBAHASAN .................................................................................................
Eksplorasi Data .....................................................................................................................
Model Regresi Poisson .........................................................................................................
Model Regresi Binomial Negatif ..........................................................................................
Pemilihan Model Terbaik .....................................................................................................
Interpretasi Model Terbaik ...................................................................................................
3
3
5
6
6
7
KESIMPULAN DAN SARAN ...................................................................................................
7
DAFTAR PUSTAKA ...............................................................................................................
8
LAMPIRAN ..............................................................................................................................
9
DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
Halaman
Tabulasi silang banyaknya ketidaklulusan dengan dosen pengajar 2008/2009
4
Tabulasi silang banyaknya ketidaklulusan dengan dosen pengajar 2011/2012
5
Nilai dugaan parameter regresi Poisson tahun ajaran 2008/2009
5
Nilai dugaan parameter regresi Poisson tahun ajaran 2011/2012
5
Nilai dugaan parameter regresi Binomial Negatif tahun ajaran 2008/2009
6
Nilai dugaan parameter regresi Binomial Negatif tahun ajaran 2011/2012
6
Perbandingan model regresi Poisson dengan regresi Binomial Negatif tahun ajaran
2008/2009
7
Perbandingan model regresi Poisson dengan regresi Binomial Negatif tahun ajaran
2011/2012
7
Rasio rata-rata ketidaklulusan setiap perbedaan banyaknya mahasiswa per kelas
7
tahun ajaran 2008/2009
Rasio rata-rata ketidaklulusan setiap perbedaan banyaknya mahasiswa per kelas
tahun ajaran 2011/2012
7
DAFTAR GAMBAR
1
2
Sebaran kelas yang memiliki mahasiswa tidak lulus Metode Statistika 2008/2009
Sebaran kelas yang memiliki mahasiswa tidak lulus Metode Statistika 2011/2012
Halaman
4
4
DAFTAR LAMPIRAN
1
2
Daftar peubah yang digunakan
Deskriptif peubah penjelas
Halaman
10
11
1
PENDAHULUAN
Latar Belakang
Metode Statistika (STK211) merupakan
salah satu mata kuliah yang berada dalam
koordinasi Departemen Statistika. Mata kuliah
ini menjelaskan prinsip-prinsip dasar metode
statistika dan beberapa metode analisis
sederhana yang dapat diterapkan pada
beberapa bidang terapan, seperti pertanian,
sosial, ekonomi, dan sebagainya. Metode
Statistika sangat diperlukan dalam penelitian,
karena itulah hampir semua departemen
memasukkan mata kuliah ini sebagai mata
kuliah interdepartemen. Selain itu, mata kuliah
Metode Statistika juga menjadi prasyarat bagi
mata kuliah statistika terapan lainnya.
Pada beberapa kelas masih ada mahasiswa
yang tidak lulus dalam mata kuliah ini.
Walaupun persentasenya tidak terlalu besar,
kasus ini menarik untuk dikaji dengan tujuan
untuk mengetahui kaitan antara banyaknya
mahasiswa yang tidak lulus mata kuliah
Metode
Statistika
dengan
beberapa
karakteristik kelas. Kelas besar dengan jumlah
mahasiswa yang banyak memiliki suasana
kelas yang kurang kondusif sehingga rata-rata
mahasiswa akan lebih sulit menangkap
pelajaran dibandingkan dengan mahasiswa
pada kelas yang banyaknya mahasiswa lebih
sedikit. Jenis kelamin antara perempuan dan
laki-laki juga memiliki kecenderungan yang
berbeda terhadap hasil dari proses belajar
mengajar di kelas. Selain itu kondisi awal
mahasiswa (IPK TPB) juga mempengaruhi
kelulusan pada suatu mata kuliah. Mahasiswa
dengan IPK TPB yang lebih tinggi cenderung
lebih cepat mengerti pelajaran dibandingkan
mahasiswa dengan IPK yang lebih rendah.
Berdasarkan hal tersebut, kelas dengan ratarata IPK TPB yang rendah diduga memiliki
tingkat ketidaklulusan yang lebih tinggi
dibandingkan kelas yang rata-rata IPK TPB
yang tinggi.
Banyaknya mahasiswa yang tidak lulus
pada mata kuliah Metode Statistika merupakan
data cacahan sehingga untuk menganalisisnya
digunakan regresi Poisson. Regresi Poisson ini
memiliki asumsi bahwa nilai rataan sama
dengan nilai ragamnya yaitu equidispersion.
Tetapi pada kenyataanya, asumsi ini seringkali
dilanggar. Apabila keragamannya lebih besar
dari nilai rataannya maka terjadi overdispersi.
Akibat overdispersi pada regresi Poisson akan
menghasilkan galat baku yang lebih kecil dari
yang sebenarnya (underestimate), sehingga
dapat mengakibatkan kesalahan inferensia
bagi parameternya. Ada beberapa metode yang
digunakan untuk menangani overdispersi,
salah satunya yang akan digunakan pada
penelitian ini yaitu regresi Binomial Negatif.
Penelitian ini menggunakan data tahun
ajaran 2008/2009 dan 2011/2012. Dua tahun
ajaran ini memiliki cara penilaian yang
berbeda. Sejak tahun ajaran 2011/2012 semua
kelas paralel diberikan soal Ujian Tengah
Semester (UTS) yang sama. Sedangkan pada
tahun-tahun sebelumnya soal ujian dibuat oleh
dosen yang mengajar di kelas yang
bersangkutan.
Tujuan
Penelitian ini bertujuan untuk
1. Memodelkan banyaknya mahasiswa
yang tidak lulus mata kuliah Metode
Statistika pada suatu kelas dengan
beberapa peubah karakteristik kelas.
2. Mengatasi overdispersi pada regresi
Poisson dengan regresi Binomial
Negatif
TINJAUAN PUSTAKA
Regresi Poisson
Menurut Cameron dan Trivedi (1998),
model yang digunakan untuk data cacahan
adalah regresi Poisson yang merupakan model
regresi non-linier. Regresi Poisson mengacu
pada sebaran Poisson dengan
sebagai
parameternya. Sebaran Poisson merupakan
salah satu sebaran peluang diskret dan
memiliki asumsi nilai rataan sama dengan nilai
ragamnya atau
. Fungsi
peluang sebaran Poisson sebagai berikut
Regresi Poisson memerlukan fungsi
penghubung dalam membangun model.
Menurut McCullagh dan Nelder (1989), fungsi
penghubung untuk regresi Poisson yaitu
dengan
dan
merupakan
banyaknya data. Sehingga model regresi
Poisson dengan X sebagai peubah penjelasnya
dapat ditulis sebagai berikut
keterangan:
= peubah penjelas ke-j, j=1,2,...,k
2
= konstanta
= koefisien regresi peubah penjelas ke-j
Parameter koefisien regresi Poisson dapat
diduga
dengan
menggunakan
metode
kemungkinan maksimum. Menurut Yesilova
et al. (2010), fungsi log kemungkinannya
adalah
Model regresi Poisson termasuk model
nonlinier,
sehingga
proses
pendugaan
parameter koefisien regresinya melalui iterasi.
Overdispersi
Overdispersi dapat terjadi jika nilai ragam
lebih besar dari rataan, Var(Y) > E(Y)
(McCullagh dan Nelder 1989). Overdispersi
dapat diidentifikasi melalui nilai deviance
yang dibagi dengan derajat bebasnya atau bisa
disebut rasio dispersi. Jika nilai rasio
dispersi
lebih besar dari satu maka terjadi
overdispersi pada data.
Persamaan deviance secara umum yaitu
dengan
dan
merupakan
fungsi log kemungkinan. Deviance untuk
model regresi Poisson memiliki persamaan
sabagai berikut (Hardin dan Hilbe 2007):
dimana yi merupakan nilai aktual amatan ke-i
dari peubah respon dan
merupakan nilai
dugaan peubah respon untuk amatan ke-i.
Selain dengan melihat rasio dispersi,
overdispersi juga dapat diidentifikasi dengan
uji formal dengan hipotesis sebagai berikut:
Hipotesis
ditolak jika nilai D >
(Halekoh et al. 2007).
Overdispersi terjadi karena adanya sumber
keragaman yang tidak teramati pada data atau
adanya pengaruh peubah lain yang
mengakibatkan peluang suatu kejadian
bergantung pada kejadian sebelumnya. Selain
itu overdispersi dapat juga terjadi karena
adanya pencilan pada data, peubah penjelas
perlu
ditransformasi,
atau
kesalahan
spesifikasi fungsi penghubung.
Regresi Binomial Negatif
Model regresi Binomial Negatif yang
merupakan model campuran Poisson-Gamma
adalah model yang digunakan ketika terjadi
overdispersi pada model regresi Poisson
(Hilbe 2011). Dalam membangun model
regresi Binomial Negatif, asumsikan peubah
respon
Y
merupakan
peubah
acak
dan
. Fungsi
peluang bersama bagi Y dan
dapat ditulis
sebagai berikut :
Selanjutnya diperoleh sebaran marginalnya,
yaitu
Integral
di
atas
dapat
diselesaikan
menggunakan fungsi Gamma, dengan
demikian sebaran marginalnya dapat ditulis
sebagai berikut :
sehingga diperoleh nilai rataan dan ragamnya :
Model regresi Binomial Negatif memiliki
parameter
dan , dengan
dan
, sehingga fungsi sebaran Binomial
Negatif menjadi:
dengan y = 0,1,2,... dan
merupakan parameter dispersi dan adalah
nilai harapan dari y. Sebaran Binomial Negatif
memiliki nilai rataan E(Y)=
dan ragam
Var(Y) =
. Parameter dispersi pada
regresi
Binomial
Negatif
mampu
mengakomodasi permasalahan overdispersi
pada model regresi Poisson (Hilbe 2011).
3
Sama seperti regresi Poisson, regresi
Binomial Negatif juga memerlukan fungsi
penghubung log, sehingga model regresi
Binomial Negatif dapat ditulis sebagai berikut:
keterangan:
= peubah penjelas ke-j, j=1,2,...,k
= konstanta
= koefisien regresi peubah penjelas ke-j
dengan adalah rataan dari sebaran Binomial
Negatif.
Pendugaan parameter
regresi
Binomial Negatif dapat dilakukan dengan
metode kemungkinan maksimum. Menurut
Hilbe (2011), fungsi log kemungkinan untuk
regresi Binomial Negatif yaitu
Pemilihan Model Terbaik
Pemilihan model terbaik antara regresi
Poisson dengan regresi Binomial Negatif
dapat dilihat dari nilai AIC (Akaike
Information Criterion), dan BIC (Bayesian
Information Criterion) (Ismail dan Jemain,
2007). Nilai AIC dan BIC yang lebih kecil
menunjukkan model yang lebih baik.
dan
dimana L adalah nilai log kemungkinan, p
adalah banyaknya parameter. Selain itu
menurut Famoye et al. (2004) uji kebaikan
model dapat dilihat pula dengan nilai log
kemungkinan. Nilai log kemungkinan semakin
besar menunjukkan model yang lebih baik.
METODOLOGI
Metode Pengumpulan Data
Penelitian ini menggunakan data nilai mata
kuliah Metode Statistika mahasiswa IPB tahun
ajaran 2008/2009 dan 2011/2012 yang
diperoleh dari Departemen Statistika, serta
data lain yang berasal dari Direktorat Tingkat
Persiapan Bersama (TPB) IPB. Peubah respon
yang diamati yaitu banyaknya mahasiswa
yang tidak lulus mata kuliah Metode Statistika
tahun ajaran 2008/2009 dan 2011/2012.
Peubah penjelas yang digunakan adalah
1. Banyaknya mahasiswa per kelas (X1)
2. Persentase jenis kelamin perempuan
(X2)
1 = Persentase jenis kelamin
perempuan ≤ 35%
2 = Persentase jenis kelamin
perempuan diantara 35-70%
3 = Persentase jenis kelamin
perempuan >70%
3. Rata-rata IPK TPB (X3)
4. Dosen pengajar Metode Statistika
(X4)
1 = Dosen Departemen Statistika
0 = Dosen luar Departemen Statistika
Untuk keterangan jenis peubah dapat dilihat
pada Lampiran 1.
Data yang diperoleh masih merupakan data
individu setiap mahasiswa. Data tersebut
dikelompokkan ke dalam masing-masing kelas
paralel. Kemudian setiap kelas paralel dihitung
banyaknya mahasiswa per kelas, persentase
jenis kelamin perempuan, rata-rata IPK TPB
dan banyaknya mahasiswa tidak lulus dalam
suatu kelas. Setelah itu data masing-masing
kelas
dikumpulkan
untuk
selanjutnya
dianalisis.
Metode Analisis Data
Tahapan analisis data yang digunakan
adalah sebagai berikut:
1. Melakukan eksplorasi data terhadap
peubah respon dan peubah penjelas
2. Melakukan analisis regresi Poisson
untuk tahun ajaran 2008/2009 dan
2011/2012
3. Menghitung nilai deviance pada
regresi Poisson
4. Mendeteksi overdispersi pada model
regresi
Poisson
dengan
membandingkan
nilai
deviance
dengan
. Jika Hipotesis nol
ditolak maka terjadi overdispersi.
5. Jika terjadi overdispersi maka akan
dilakukan analisis regresi Binomial
Negatif
6. Melakukan pemilihan model terbaik
7. Melakukan interpretasi hasil model
terpilih.
Penelitian ini menggunakan perangkat lunak
R.2.15.0 untuk tahapan analisis data.
HASIL DAN PEMBAHASAN
Eksplorasi data
Kelas paralel yang diamati pada penelitian
ini untuk tahun ajaran 2008/2009 sebanyak 30
4
kelas, sedangkan tahun 2011/2012 sebanyak
31 kelas. Umumnya setiap departemen
memiliki satu kelas paralel, kecuali pada tahun
ajaran 2011/2012 Departemen Agribisnis
memiliki dua kelas paralel, Komunikasi dan
Pengembangan Masyarakat dua kelas paralel,
dan Kedokteran Hewan tiga kelas paralel.
Banyaknya kelas paralel yang memiliki
mahasiswa tidak lulus mata kuliah Metode
Statistika untuk tahun ajaran 2008/2009 dan
2011/2012 masing-masing sebanyak delapan
kelas. Kelas Teknik Hasil Hutan (THH) dan
Ilmu Komputer (KOM) merupakan kelas yang
memiliki mahasiswa tidak lulus pada tahun
ajaran 2008/2009 maupun 2011/2012. Pada
kelas THH masing-masing tahun ajaran
memiliki lima mahasiswa yang tidak lulus,
sedangkan untuk kelas Ilmu Komputer terjadi
peningkatan ketidaklulusan sabanyak dua
mahasiswa pada tahun ajaran 2011/2012.
ESL
1 (1.1%)
16
(11.3%)
TIN
THH
5 (6.3%)
MNH
3 (2,6%)
PTP
1 (1%)
ITK
2 (1.5%)
PSP
1 (2.2%)
KOM
2 (1.8%)
0
5
10
15
20
Gambar 1 Sebaran kelas yang memiliki
mahasiswa tidak lulus Metode
Statistika 2008/2009
MAT
2 (2.3%)
13
(12.7%)
MAN
KOM
4 (4.2%)
KIM
5 (5.3%)
THH
5 (6,8%)
MSP
1 (1.5%)
AGB2
2 (3.4%)
AGB1
5 (6.7%)
0
Gambar 2
5
10
15
Sebaran kelas yang memiliki
mahasiswa tidak lulus Metode
Statistika 2011/2012
Kelas yang memiliki mahasiswa tidak lulus
mata kuliah Metode Statistika terbanyak pada
tahun ajaran 2008/2009 adalah kelas Teknik
Industri Pertanian (TIN) yaitu 16 mahasiswa,
sedangkan pada tahun ajaran 2011/2012
adalah kelas Manajemen (MAN) yaitu 13
mahasiswa. Secara keseluruhan, banyaknya
ketidaklulusan mahasiswa terhadap mata
kuliah Metode Statistika tahun ajaran
2008/2009 lebih rendah dibandingkan tahun
2011/2012. Hal ini dapat dilihat dari
persentase
banyaknya
ketidaklulusan
mahasiswa pada masing-masing kelas.
Deskripsi semua peubah penjelas dapat
dilihat pada Lampiran 2. Pada tahun ajaran
2008/2009, TIN merupakan kelas terbesar dan
memiliki mahasiswa tidak lulus Metode
Statistika terbanyak. Selain TIN, kelas-kelas
yang memiliki mahasiswa tidak lulus Metode
Statistika juga memiliki jumlah mahasiswa
lebih besar dari 70 orang. Sedangkan untuk
tahun ajaran 2011/2012, kelas yang memiliki
jumlah mahasiswa terbanyak yaitu kelas
MNH, tetapi kelas ini tidak memiliki
mahasiswa tidak lulus Metode Statistika.
Kelas MAN dengan mahasiswa tidak lulus
Metode Statistika terbanyak termasuk kelas
yang besar karena memiliki jumlah mahasiswa
102 orang. Kelas-kelas lain yang memiliki
mahasiswa tidak lulus Metode Statistika juga
merupakan kelas besar, kecuali untuk kelas
AGB2 dan MSP yang memiliki jumlah
mahasiswa kurang dari 70 orang.
Tabel 1 Tabulasi
silang
banyaknya
ketidaklulusan dengan dosen pengajar
2008/2009
Dosen pengajar
Kelas
Dosen
Dosen
luar
STK
Semua
mahasiswa
12
10
lulus Metode Statistika
Terdapat mahasiswa
tidak lulus Metode
7
1
Statistika
Total
19
11
Hasil eksplorasi data untuk peubah X4
(dosen pengajar) dapat dilihat pada Tabel 1
dan 2. Berdasarkan Tabel 1, kelas paralel yang
memiliki mahasiswa tidak lulus Metode
Statistika yaitu sebanyak tujuh kelas yang
dosen pengajarnya berasal dari luar
Departemen Statistika dan satu kelas yang
dosen pengajarnya berasal dari Departemen
Statistika.
Pada tahun ajaran 2011/2012, kelas paralel
yang memiliki mahasiswa tidak lulus Metode
Statistika sebanyak tiga kelas yang dosen
pengajarnya berasal dari luar Departemen
5
Statistika dan lima kelas yang dosen
pengajarnya
berasal
dari
Departemen
Statistika. Hasil tabulasi ini berbeda dengan
tahun ajaran 2008/2009 yaitu kelas yang dosen
pengajarnya
berasal
dari
Departemen
Statistika lebih sedikit terjadi ketidaklulusan.
Tabel 2 Tabulasi
silang
banyaknya
ketidaklulusan dengan dosen pengajar
2011/2012
Dosen pengajar
Kelas
Dosen
Dosen
luar
STK
Semua mahasiswa lulus
12
11
Metode Statistika
Terdapat
mahasiswa
tidak lulus Metode
3
5
Statistika
Total
15
16
Model Regresi Poisson
Pendugaan model regresi Poisson tahun
ajaran 2008/2009 dan 2011/2012 dapat dilihat
pada Tabel 3 dan 4. Persamaan model regresi
Poisson untuk semua peubah penjelas dapat
ditulis sebagai berikut:
Persamaan yang dihasilkan regresi Poisson
untuk tahun ajaran 2008/2009 yaitu
Berdasarkan Tabel 3 peubah penjelas yang
signifikan pada taraf nyata 10% adalah
banyaknya mahasiswa per kelas (X1),
persentase jenis kelamin perempuan (X2), ratarata IPK TPB (X3), dan dosen pengajar (X4).
Nilai rasio dispersi yang diperoleh yaitu
1.4986. Nilai ini lebih dari satu tetapi masih
mendekati satu, sehingga diperlukan uji formal
untuk mendeteksi overdispersi yaitu dengan
membandingkan nilai deviance dengan nilai
Khi-Kuadrat. Nilai deviance yang diperoleh
sebesar 35.966 lebih besar dari nilai
33.19624 sehingga tolak H0 maka
dapat dikatakan terjadi overdispersi pada data.
Analisis regresi Poisson untuk tahun
ajaran 2011/2012 menghasilkan persamaan
sabagai berikut:
Tabel 4
Nilai dugaan parameter regresi
Poisson tahun ajaran 2011/2012
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
2.6508
2.4964
1.062
0.2883
β1
0.0389
0.0086
4.521
0.0000*
β 21
0.0993
0.5536
0.179
0.8577
β 23
-0.3636
0.4876
-0.745
0.4560
β3
-2.5215
0.9389
-2.686
0.0073*
β4
2.3176
0.5141
4.508
0.0000*
Deviance = 82.336; derajat bebas = 25; nilai
AIC = 119.69 rasio dispersi= 3.2934; tanda
(*) menunjukkan peubah penjelas yang
signifikan pada taraf nyata 10%.
Tabel 3
Nilai dugaan parameter regresi
Poisson tahun ajaran 2008/2009
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
-11.1601
3.7061
-3.011
0.0026 *
β1
0.0362
0.0101
3.600
0.0003 *
β 21
2.4064
0.6012
4.003
0.0000 *
β 23
-17.7445
2083.1527
-0.009
0.9932
β3
2.7581
1.4813
1.862
0.0626 *
β4
-2.4303
0.9251
-2.627
0.0086 *
Deviance = 35.966; derajat bebas = 24; nilai
AIC = 70.286; rasio dispersi= 1.4986; tanda
(*) signifikan pada taraf nyata 10%.
Berdasarkan Tabel 4 peubah penjelas yang
signifikan pada taraf nyata 10% diantaranya
peubah banyaknya mahasiswa per kelas (X1),
rata-rata IPK TPB (X3), dan dosen pengajar
Metode Statistika (X4).
Nilai rasio dispersi yang diperoleh sebesar
3.2934. Nilai ini lebih dari satu, untuk lebih
memastikannya dilakukan uji formal. Nilai
deviance yang diperoleh sebesar 82.336 lebih
besar dari nilai
34.38159 sehingga
tolak H0 maka dapat dikatakan terjadi
overdispersi pada data. Hasil regresi Poisson
yang
melanggar
asumsi
equidispersi
menghasilkan regresi yang semu dan galat
baku yang dihasilkan lebih kecil dari yang
sebenarnya (underestimate). Untuk mengatasi
6
overdispersi diperlukan metode lain yaitu
regresi Binomial Negatif.
Regresi Binomial Negatif
Hasil pendugaan regresi Binomial Negatif
untuk tahun ajaran 2008/2009 dan 2011/2012
dapat dilihat dari Tabel 5 dan Tabel 6. Model
regresi Binomial Negatif untuk semua peubah
penjelas dapat ditulis sebagai berikut:
Persamaan yang dihasilkan
Binomial Negatif untuk tahun
2008/2009 yaitu
Tabel 5
regresi
ajaran
Nilai dugaan parameter regresi
Binomial Negatif tahun ajaran
2008/2009
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
-4.041
6.336
-0.638
0.5236
β1
0.0394
0.0163
2.455
0.0141 *
β 21
2.197
1.237
1.775
0.0758 *
β 23
-36.29
3.103e+07
0.000
1.0000
β3
0.1113
2.522
0.044
0.9648
β4
-1.1494
1.194
-1.251
0.2110
Deviance = 19.337; derajat bebas = 24; rasio
dispersi = 0.8057;
; AIC = 67.37;
tanda (*) menunjukkan peubah penjelas yang
signifikan pada taraf nyata 10%.
Berdasarkan Tabel 5 dari empat peubah ada
dua peubah yang nyata pada taraf nyata 10%
yaitu banyaknya mahasiswa per kelas (X1) dan
persentase jenis kelamin yang kurang dari
35% (X21).
Nilai rasio dispersi yang dihasilkan regresi
Binomial Negatif untuk tahun ajaran
2008/2009 sebesar 0.8057. Nilai ini mendekati
satu, untuk lebih memastikannnya dilakukan
uji formal. Nilai deviance yang dihasilkan
sebesar 19.337, nilai ini lebih kecil dari
33.19624 maka dapat dikatakan
pada hasil regresi Binomial Negatif untuk
tahun ajaran 2008/2009 tidak terjadi
overdispersi pada data.
Untuk tahun ajaran 2011/2012 persamaan
regresi Binomial Negatif yang dihasilkan yaitu
Tabel 6
Nilai dugaan parameter regresi
Binomial Negatif tahun ajaran
2011/2012
Nilai
Dugaan
Galat
Baku
Nilai z
Pr(>|z|)
β0
2.1283
6.7868
0.314
0.7538
β1
0.0412
0.0234
1.758
0.0787*
β 21
0.5795
2.5069
0.231
0.8172
β 23
0.1842
1.1936
0.154
0.8773
β3
-2.1502
2.6819
-0.802
0.4227
β4
1.0619
1.1689
0.908
0.3636
Deviance = 18.63 derajat bebas = 25; rasio
dispersi = 0.7452;
; AIC=86.817;
tanda (*) menunjukkan peubah penjelas yang
signifikan pada taraf nyata 10%.
Berdasarkan Tabel 6 peubah pejelas yang
signifikan pada taraf nyata 10% adalah
banyaknya mahasiswa per kelas (X1). Peubah
X1 ini juga signifikan pada tahun ajaran
2008/2009.
Nilai rasio dispersi yang dihasilkan regresi
Binomial Negatif untuk tahun ajaran
2011/2012 sebesar 0.7452. Sedangkan nilai
deviance yang dihasilkan yaitu sebesar 18.63.
Nilai ini lebih kecil dari nilai
maka dapat dikatakan tidak tolak
H0 artinya pada hasil regresi Binomial Negatif
untuk tahun ajaran 2011/2012 tidak terjadi
overdispersi pada data.
Pemilihan Model Terbaik
Pemilihan model terbaik untuk kasus
ketidaklulusan mahasiswa pada mata kuliah
Metode Statistika untuk tahun ajaran
2008/2009 dan tahun ajaran 2011/2012 dapat
dilihat pada Tabel 7 dan Tabel 8. Pemilihan
model terbaik antara regresi Poisson dan
regresi Binomial Negatif dapat dilihat dari
nilai AIC dan BIC yang paling kecil (Ismail
dan Jemain 2007). Selain itu dapat juga dilihat
dari nilai log kemungkinan yang besar
(Famoye et al. 2004).
Banyaknya mahasiswa tidak lulus Metode
Statistika pada kedua tahun ajaran jika
dianalisis dengan regresi Poisson akan terjadi
7
overdispersi. Model regresi Poisson tersebut
menghasilkan hampir semua peubah penjelas
signifikan pada taraf nyata 10%. Sedangkan
pada model regresi Binomial Negatif hanya
dua peubah penjelas yang signifikan pada taraf
nyata 10% untuk tahun ajaran 2008/2009 dan
satu peubah untuk tahun ajaran 2011/2012.
Tabel 7
Perbandingan
model
regresi
Poisson dengan regresi Binomial
Negatif tahun ajaran 2008/2009
Regresi
Regresi
Kriteria
Binomial
Poisson
Negatif
AIC
70.286
67.37
BIC
78.693
73.785
Log kemungkinan
-29.143
-26.689
Tabel 8
Perbandingan
model
regresi
Poisson dengan regresi Binomial
Negatif tahun ajaran 2011/2012
Regresi
Regresi
Kriteria
Binomial
Poisson
Negatif
AIC
119.69
86.817
BIC
128.290
93.422
Log kemungkinan
-53.843
-36.371
Pemilihan model terbaik pada kasus ini
cukup dilihat dari nilai log kemungkinannya.
Hal ini dikarenakan banyaknya pengamatan
dan banyaknya parameter masing-masing
metode memiliki jumlah yang sama, sehingga
nilai AIC dan BIC akan sejalan dengan nilai
log kemungkinannya. Regresi Binomial
Negatif memiliki nilai log kemungkinan yang
lebih besar dari pada regresi Poisson. Oleh
karenanya, model regresi Binomial Negatif
lebih baik dibandingkan regresi Poisson pada
data overdispersi.
Interpretasi Model Terbaik
Berdasarkan hasil pemilihan model, regresi
Binomial Negatif lebih baik dibandingkan
regresi Poisson pada data yang terdapat
overdispersi. Hasil dari regresi Binomial
Negatif untuk tahun ajaran 2008/2009
menunjukkan salah satu peubah yang
signifikan yaitu peubah persentase jenis
kelamin perempuan kurang dari 35% (X21).
Hal ini menunjukkan bahwa persentase jenis
kelamin perempuan kurang dari 35% memiliki
selisih dugaan nilai harapan banyaknya
mahasiswa tidak lulus Metode Statistika yang
positif terhadap persentase jenis kelamin
perempuan antara 35-70% yang dijadikan
acuan dalam model ini. Selain itu peubah
banyaknya mahasiswa per kelas (X1)
merupakan peubah yang signifikan pada
regresi Binomial Negatif untuk tahun ajaran
2008/2009 dan 2011/2012. Ini menunjukkan
bahwa jika suatu kelas memiliki banyaknya
mahasiswa lebih besar satu mahasiswa
dibandingkan kelas lain maka dugaan rata-rata
banyaknya mahasiswa yang tidak lulus mata
kuliah Metode Statistika sebesar exp(0.0394)
= 1.040 kali lebih besar dibanding kelas lain
untuk tahun ajaran 2008/2009 dan exp(0.0412)
= 1.042 kali lebih besar dibanding kelas lain
untuk tahun ajaran 2011/2012 dengan asumsi
peubah lain dianggap tetap.
Untuk setiap perbedaan banyaknya
mahasiswa per kelas dengan dugaan rata-rata
banyaknya mahasiswa tidak lulus Metode
Statistika dapat dilihat pada Tabel 9 dan Tabel
10.
Tabel 9 Rasio rata-rata ketidaklulusan setiap
perbedaan banyaknya mahasiswa per
kelas tahun ajaran 2008/2009
Rasio
5
10
15
20
25
1.218
1.483
1.806
2.199
2.678
Tabel 10 Rasio rata-rata ketidaklulusan setiap
perbedaan banyaknya mahasiswa
per kelas tahun ajaran 2011/2012
Rasio
5
10
15
20
25
1.229
1.510
1.855
2.280
2.801
Berdasarkan Tabel 9 dan 10, misalkan untuk
perbedaan 15 maka interpretasinya yaitu jika
suatu kelas memiliki 15 orang mahasiswa
lebih banyak dibandingkan kelas lain maka
dugaan rata-rata banyaknya mahasiswa tidak
lulus sebesar exp(15×0.0394) = 1.806 kali
lebih besar dibanding kelas lain untuk tahun
ajaran 2008/2009 dan exp(15×0.0412) = 1.855
dibanding kelas lain untuk tahun ajaran
2001/2012 dengan asumsi peubah lain
dianggap tetap.
KESIMPULAN DAN SARAN
Karakteristik kelas yang berpengaruh
terhadap banyaknya mahasiswa yang tidak
lulus pada mata kuliah Metode Statistika untuk
tahun ajaran 2008/2009 dan 2011/2012
8
dengan menggunakan regresi Binomial
Negatif yaitu banyaknya mahasiswa per kelas.
Oleh karena itu disarankan banyaknya
mahasiswa per kelas dibatasi agar kegiatan
belajar mengajar bisa lebih efektif, sehingga
nilai harapan ketidaklulusan mahasiswa bisa
berkurang.
DAFTAR PUSTAKA
Cameron AC, Trivedi PK. 1998. Regression
Analysis of Count Data. Cambridge :
Cambridge Univesity Press.
Famoye F, Wulu JT, Singh KP.2004. On the
Generalized Poisson Regression Model
with an Application to Accident Data.
Journal of Data Science 2 : 287-295.
Halekoh
U,
Hojsgaard
S.
2007.
Overdispersion. Denmark: Unit of
Statistics and Decision Analysis, The
Faculty
of
Agricultural
Sciences,
University of Aarhus.
Hardin JW, Hilbe JM. 2007. Generalized
Linear Models and Extentions. Texas: A
Stata Press Publication
Hilbe JM. 2011. Negative Binomial
Regression Second Edition. Cambridge :
Cambridge Univesity Press.
Ismail N, Jemain AA. 2007. Handling
Overdispersion with Negative Binomial
and Generalized Poisson Regression
Models. Casualty Actuarial Society
Forum: 103-158.
McCullagh P, Nelder JA. 1989. Generalized
Linear Models. London: Chapman & Hall.
Yesilova A, Kaydan MB, Kaya Y. 2010.
Modeling Insect-Egg Data with Excess
Zeros Using Zero-Inflated Regression
Models.
Hacettepe
Journal
of
Mathematics and Statistics 39 : 273-282.
LAMPIRAN
10
Lampiran 1 Peubah yang Digunakan
Nama Peubah
Jenis Peubah
D1
D2
ket
Y
Banyaknya
ketidaklulusan pada
Metode Statistika
Numerik
-
-
-
X1
Banyaknya
mahasiswa per kelas
Numerik
-
-
-
X2
Persentase jenis
kelamin perempuan
Kategorik
1
0
≤ 35%
0
1
-
diantara 35-70%
>70%
-
X3
Rata-rata IPK TPB
Numerik
0
0
-
X4
Dosen pengajar
Metode Statistika
Kategorik
1
0
Dosen Departemen
Statistika
0
0
Dosen luar Departemen
Statistika
11
Lampiran 2 Deskriptif Peubah Penjelas
Banyaknya
Persentase Jenis
Mahasiswa per
Kelamin
Kelas
Perempuan
Kelas
2008/
2011/
2008/
2011/
2009
2012
2009
2012
85
0.62
0.66
Rata-rata IPK
TPB
Dosen Pengajar
2008/
2009
2011/
2012
2008/
2009
2011/
2012
3.20
3.29
1
1
STK
66
MSL
69
GFM
49
66
0.51
0.48
2.76
2.88
1
1
MAT
79
87
0.58
2.98
0
108
94
0.38
3.00
3.00
2.91
0
KOM
0.60
0.33
1
1
FIS
38
62
0.42
0.44
2.89
3.00
1
1
BIK
79
78
0.53
0.68
2.95
3.02
1
1
KIM
78
95
0.62
0.62
2.99
3.04
1
1
AGH
68
0.51
2.81
0.49
1
3.05
0
ARL
50
35
0.70
0.57
2.98
3.14
1
1
FKH1
134
63
0.61
0.62
2.83
3.02
0
0
FKH2
54
0.52
2.76
1
FKH3
44
0.59
2.84
1
BDP
69
79
0.55
0.57
2.75
2.73
0
0
MSP
62
65
0.47
0.74
2.60
2.62
0
0
THP
68
PSP
46
60
0.39
0.47
2.57
2.59
0
0
0.76
2.80
0
ITK
64
54
0.42
0.48
2.74
2.58
0
0
PTP
100
72
0.67
0.44
2.73
2.68
0
0
NTP
80
80
0.53
0.69
2.70
2.59
0
0
MNH
113
127
0.51
0.50
2.71
2.58
0
0
THH
79
73
0.35
0.51
2.72
2.69
0
0
KSH
97
107
0.59
0.56
2.69
2.63
0
0
SVK
50
76
0.46
0.61
2.51
2.69
0
0
ITP
123
109
0.63
0.64
3.41
3.36
1
1
TIN
141
116
0.62
0.53
3.09
3.05
0
0
IE
92
MAN
98
0.73
ESL
87
GIZ
112
127
0.85
0.71
3.05
3.05
0
0
IKK
44
58
0.93
0.95
2.77
2.65
0
0
KPM
108
0.74
2.63
2.64
1
1
102
0.69
2.72
0.70
0.70
77
0.79
KPM2
53
0.85
AGB1
74
AGB2
58
EKOSYR
49
2.81
0
2.80
2.73
1
1
0
1
0.73
2.53
2.90
0.60
0.63
2.83
2.78
1
1
1