Estimasi parameter model regresi com-poisson untuk data tersensor kanan menggunakan metode maksimum likelihood

  

commit to user

  ESTIMASI PARAMETER MODEL REGRESI COM-POISSON UNTUK DATA TERSENSOR KANAN MENGGUNAKAN METODE MAKSIMUM

  LIKELIHOOD

  Oleh DIAN ANGGRAENI NIM. M0107028 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

  JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA 2012 commit to user

  

ABSTRAK

Dian Anggraeni, 2012. ESTIMASI PARAMETER MODEL REGRESI COM-

POISSON UNTUK DATA TERSENSOR KANAN MENGGUNAKAN METODE

  MAKSIMUM LIKELIHOOD. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret.

  Model regresi Poisson digunakan untuk menganalisis hubungan antara variabel independen dan variabel dependen berupa data cacah yang mengasumsikan equidispersi. Seringkali data cacah memperlihatkan overdispersi atau underdispersi, untuk mengatasi permasalahan tersebut dibentuk model regresi COM-Poisson. Model regresi COM-Poisson yang merupakan perluasaan dari model regresi Poisson memiliki dua parameter yaitu parameter regresi ( ) dan dispersi ( . Pada beberapa kasus untuk tujuan tertentu, nilai variabel dependen perlu pembatasan batas bawah atau tersensor kanan.

  Penelitian ini bertujuan untuk mengkaji ulang estimasi parameter model regresi COM-Poisson pada data tersensor kanan menggunakan metode maksimum

  

likelihood . Dalam memaksimumkan fungsi likelihood diperoleh sistem persamaan

  yang nonlinear, sehingga untuk menyelesaikannya digunakan metode Newton dengan prosedur iterasi . Selanjutnya, estimasi parameter model regresi COM-Poisson untuk data tersensor kanan diterapkan pada faktor-faktor yang mempengaruhi banyaknya komplikasi penyakit dari suatu penderita diabetes mellitus di Rumah Sakit Panti Waluyo dan Rumah Sakit Umum Daerah Dr. Moewardi Surakarta dengan menggunakan Software R 2.15.0.

  

Kata Kunci : variabel dependen tersensor kanan, overdispersi, underdispersi,

  model regresi COM-Poisson, maksimum likelihood

  

commit to user

  

ABSTRACT

Dian Anggraeni, 2012. ESTIMATION PARAMETERS OF COM-POISSON

REGRESSION MODEL FOR RIGHT CENSORED DATA USING MAXIMUM

  

LIKELIHOOD METHOD. Mathematics and Natural Sciences Faculty, Sebelas Maret

University.

  Poisson regression model is used to analyze relationship between independent variable and dependent variable equidispersion. The count data often showed overdipersion and underdispersion, to overcome the problems created COM-Poisson regression model. COM-Poisson regression model is an expansion of Poisson regression model. COM-Poisson regression model has two parameters, they are the regression parameter and dispersion . In some cases for a particular purpose, the value of the dependent variable should lower limit restriction or right censored.

  This study aims to review the estimated parameters COM-Poisson regression model to the data right censored maximum likelihood method. In maximizing the likelihood function of a nonlinear system of equations is obtained, so that the Newton method is used to solve the iterative procedure

  . Furthermore, the estimated parameters of the COM- Poisson regression models for right-censored the data applied to the factors that influence the number of complications from the disease of diabetes mellitus in Panti Waluyo Hospital and District General Hospital Dr. Moewardi Surakarta using software R 2.15.0.

  , COM- Keyword : right censored dependent variable, overdispersi, underdispersi Poisson regression model, maximum likelihood

commit to user

  • Q.S. Al-Insyrah:1-8- “
  • Hitam Putih- “
  • Penulis-

  

commit to user

MOTO

  “

  Sesungguhnya sesudah kesulitan itu ada kemudahan

  ”

  Kesabaran memang pahit, tetapi kesabaran akan berbuah segar dan manis

  ”

  Hidup jangan mengalir, melainkan kita membuat aliran itu sendiri

  ” commit to user PERSEMBAHAN

  Karya ini saya persembahkan untuk Bapak, Ibu, Kakak dan adikku tercinta atas doa, cinta dan dukungan yang diberikan dalam menyusun skripsi ini

KATA PENGANTAR

  Segala puji bagi Allah SWT, yang telah melimpahkan rahmat dan karunia- Nya, sehingga dapat menyelesaikan skripsi ini. Penyusunan skripsi ini tidak lepas dari bimbingan dan motivasi dari berbagai pihak. Oleh karena itu, penulis menyampaikan ucapan terima kasih kepada semua pihak yang telah membantu dalam penulisan skripsi ini, khususnya kepada

  1. Ibu Dra. Sri Sulistijowati H, M.Si. selaku Dosen Pembimbing I atas kesediaan dan kesabaran yang diberikan dalam membimbing penulis,

  2. Bapak Nughthoh Arfawi Kurdhi, M.Sc. selaku Dosen Pembimbing II atas kesediaan dan kesabaran yang diberikan dalam membimbing penulis,

  3. Tia, Nurindah, dan seluruh teman-teman matematika angkatan 2007 atas kerjasama dan motivasi yang diberikan saat penulis menghadapi kendala dalam penyusunan skripsi ini, 4. Semua pihak yang turut membantu kelancaran penulisan skripsi ini. Semoga penulisan skripsi ini dapat bermanfaat bagi pembaca.

  Surakarta, Juli 2012 Penulis

  

commit to user

  

DAFTAR ISI

  JUDUL .......................................................................................................... i PENGESAHAN ............................................................................................. ii ABSTRAK .................................................................................................... iii ABSTRACT .................................................................................................. iv MOTTO ........................................................................................................ v PERSEMBAHAN ......................................................................................... vi KATA PENGANTAR .................................................................................. vii DAFTAR ISI ................................................................................................. ix DAFTAR TABEL ......................................................................................... x I.

  1 PENDAHULUAN

  1.1 Latar Belakang Masalah ........................................................................ 1

  1.2 Rumusan Masalah .................................................................................. 3

  1.3 Tujuan Penelitian ................................................................................... 3

  1.4 Manfaat Penelitian ................................................................................. 3 II.

  4 LANDASAN TEORI

  2.1 Tinjauan Pustaka ..................................................................................... 4

  2.1.1 Konsep Dasar Statistik ............................................................... 5

  2.1.2 Keluarga Distribusi Eksponensial .............................................. 6

  2.1.3 Distribusi Poisson ....................................................................... 8

  2.1.4 Model Regresi Poisson ............................................................... 9

  2.1.5 Variabel Tersensor Kanan .......................................................... 10

  2.1.6 Metode Maksimum Likelihood .................................................. 11

  2.1.7 Metode Newton .......................................................................... 12

  2.1.8 Pendekteksian Overdispersi dan Underdispersi ......................... 12

  2.1.9 Uji Signifikansi Parameter ......................................................... 13

  2.2 Kerangka Pemikiran................................................................................ 14 III.

  15 METODE PENELITIAN IV.

  17 PEMBAHASAN

commit to user

  4.1 Model Regresi COM-Poisson ................................................................. 17

  

commit to user

  4.3.4 Uji Signifikansi Parameter .......................................................... 35

  41 LAMPIRAN

  DAFTAR PUSTAKA

  5.2 Saran ....................................................................................................... 40

  5.1 Kesimpulan ............................................................................................. 40

  40

  V. PENUTUP

  4.3.5 Model Regresi COM-Poisson untuk Data Tersensor Kanan dengan Variabel Independen Berpengaruh ................................ 38

  4.3.3 Model Regresi COM-Poisson untuk Variabel Dependen Tersensor Kanan dengan Seluruh Variabel Independen ............. 34

  4.1.1 Distribusi COM-Poisson ............................................................... 17

  4.3.2 Pendeteksian Overdispersi atau Underdispersi ......................... 33

  Diabetes Mellitus ........................................................................ 30

  4.3.1 Model Regresi Poisson untuk Tersensor Kanan pada Data Pasien

  4.3 Contoh Kasus ......................................................................................... 28

  4.2.2 Estimasi Parameter Model Regresi COM-Pisson untuk Data Tersensor Kanan ............................................................................ 23

  4.2.1 Distribusi COM-Poisson untuk Data Tersensor Kanan................. 22

  4.2 Estimasi Parameter Model Regresi COM-Poisson untuk Data Tersensor Kanan ..................................................................................................... 22

  4.1.2 Model Regresi COM-Poisson........................................................ 20

  43

  commit to user DAFTAR TABEL

  4.1 Pengkodean Kategori Variabel Dummy ...................................................... 30

  4.2 Nilai Estimasi Parameter Regresi Poisson ................................................... 31

  4.3 Nilai Estimasi Parameter Model Regresi Poisson dengan Uji Wald ........... 32

  4.4 Estimasi Parameter Model Regresi Poisson dengan Variabel Independen yang Berpengaruh ........................................................................................ 33

  4.5 Nilai Mean dan Variansi Data Diabetes Mellitus di Surakarta.................... 33

  4.6 Nilai Statistik Deviansi ................................................................................ 34

  4.7 Nilai Estimasi Parameter Model Regresi COM-Poisson ............................ 35

  4.8 Estimasi Parameter Model Regresi COM-Poisson dengan Uji Wald .......... 36

  4.9 Nilai Estimasi Parameter Regresi COM-Poisson untuk Data Tersensor Kanan dengan Variabel Independen yang Berpengaruh ............................. 38

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

  Analisis regresi menyatakan hubungan antara variabel dependen dan variabel independen. Variabel independen merupakan variabel yang nilainya tidak dipengaruhi oleh variabel lain, sedangkan variabel dependen merupakan variabel yang nilainya dipengaruhi oleh variabel independen. Variabel dependen dapat berupa data cacah maupun data kontinu.

  Dalam aplikasinya banyak penelitian menggunakan variabel dependen yang berupa data cacah, termasuk pada pembahasan skripsi ini. Salah satu model regresi yang dapat digunakan untuk menganalisis variabel dependen berupa data cacah adalah model regresi Poisson. Model regresi Poisson menjelaskan hubungan antara variabel independen dengan variabel dependen dari suatu data cacah. Model regresi memiliki asumsi mean sampel dan variansi sampel sama (equidispersi). Menurut Shmueli et al. (2005), pada kasus nyata seringkali data cacah memperlihatkan variansi sampel lebih besar dari mean sampel (overdispersi) atau variansi sampel lebih kecil dari mean sampel (underdispersi). Untuk mengatasi masalah overdispersi atau underdispersi, Sellers dan Shmueli (2010a) memberikan alternatif model yaitu dengan model regresi COM-Poisson.

  Model regresi COM-Poisson merupakan perluasan dari model regresi Poisson. Sellers dan Shmueli (2010a) menyatakan bahwa proses pembentukan dari model regresi COM-Poisson berdasarkan pada distribusi COM-Poisson.

  Model regresi COM-Poisson memiliki dua parameter yaitu parameter regresi ( ) dan parameter dispersi ( . Parameter dari model tersebut belum diketahui sehingga harus diestimasi.

  Berbagai kajian mengenai model regresi COM-Poisson telah dilakukan. Dwicahyono (2012) telah mengkaji estimasi parameter model regresi COM- Poisson menggunakan metode maksimum likelihood. Estimasi parameter model regresi COM-Poisson menggunakan metode quasi likelihood juga telah dikaji

  

commit to user

  oleh Mardina (2012), dan estimasi parameter distribusi COM-Poisson menggunakan metode Bayesian sedang dikaji oleh Sari (2012). Pada kajian yang dilakukan kadang-kadang untuk mencapai tujuan yang diinginkan dibutuhkan asumsi data dependen tersensor. Pada model regresi COM-Poisson yang dikaji oleh Dwicahyono (2012), Mardina (2012) dan Sari (2012), variabel dependennya tidak disensor. Sedangkan asumsi untuk mencapai tujuan skripsi adalah variabel dependen dibatasi nilainya atau disebut variabel dependen tersensor. Penyensoran dapat dibedakan menjadi tiga macam yaitu tersensor kanan, tersensor kiri dan tersensor dalam selang interval. Jenis sensor yang dikaji dalam penelitian ini ialah sensor kanan (right censoring) karena hanya ingin mengkaji batas bawah dari data variabel dependen. Lee dan Wang (1992) mengatakan bahwa observasi dikatakan tersensor kanan jika objek masih hidup atau masih beroperasi ketika masa observasi telah selesai. Misalnya, jumlah pasien yang telah datang di klinik, jumlah pelanggan yang datang ke restoran selama periode waktu tertentu, atau jumlah mobil yang diparkir. Meskipun jumlah kedatangan untuk masing-masing kasus dapat melebihi kapasitas tempat yang tersedia dalam waktu tertentu, namun obyek meninggalkan fasilitas karena keterbatasan kapasitas.

  Sellers dan Shmueli (2010b) memperkenalkan metode estimasi maksimum

  

likelihood untuk mengestimasi parameter model regresi COM-Poisson pada data

  tersensor kanan. Pada skripsi ini akan dikaji ulang estimasi parameter model regresi COM-Poisson pada data tersensor kanan menggunakan estimasi maksimum likelihood. Metode maksimum likelihood diperoleh dengan memaksimalkan fungsi likelihood dari fungsi densitas probabilitasnya.

1.2 Rumusan Masalah

  Berdasarkan uraian latar belakang masalah, dapat dirumuskan permasalahan sebagai berikut.

  1. Bagaimana kajian ulang estimasi parameter model regresi COM-Poisson untuk data tersensor kanan dengan metode maksimum likelihood?

  

commit to user

  2. Bagaimana penerapan model regresi COM-Poisson untuk data tersensor kanan pada faktor-faktor yang mempengaruhi banyaknya komplikasi penderita ?

  diabetes mellitus

1.3 Tujuan Penelitian

  Berdasarkan rumusan masalah, maka tujuan dari penelitian ini adalah sebagai berikut.

1. Mengkaji ulang estimasi parameter model regresi COM-Poisson untuk data tersensor kanan dengan metode maksimum likelihood.

  2. Menerapkan model regresi COM-Poisson untuk data tersensor kanan pada faktor-faktor yang mempengaruhi banyaknya komplikasi penderita diabetes

  mellitus .

1.4 Manfaat Penelitian

  Manfaat dari penulisan skripsi ini adalah 1. Secara teoritis dapat menambah wawasan dan pengetahuan para statistikawan tentang model regresi khususnya model regresi COM-Poisson untuk data tersensor kanan.

2. Secara praktis pembahasan ini dapat menganalisa data yang mengalami overdispersi , underdispersi maupun equidispersi.

  

commit to user

BAB II LANDASAN TEORI

2.1 Tinjauan Pustaka Pada bagian ini terdiri dari tinjauan pustaka dan kerangka pemikiran.

  Tinjauan pustaka berisi penelitian terdahulu dan teori penunjang. Teori penunjang dalam kajian ini antara lain keluarga distribusi eksponensial, distribusi Poisson, model regresi Poisson, variabel tersensor kanan, metode maksimum likelihood, metode Newton, dan uji signifikansi parameter. Sedangkan kerangka pemikiran berupa alur pikir untuk menjawab perumusan masalah pada kajian ini.

  Model regresi Poisson digunakan untuk menganalisis hubungan antara variabel dependen dan variabel independen dari suatu data cacah. Seringkali data cacah memperlihatkan overdispersi atau underdispersi, sehingga penggunaan model regresi Poisson tidak sesuai. Untuk mengatasi permasalahan tersebut dapat dilakukan pendekatan model regresi Binomial Negatif yang dikaji oleh Yuniarti (2006) dan model regresi ZIP yang dikaji oleh Putri (2007). Salah satu alternatif model regresi lain yang dapat digunakan ialah model regresi yang didasarkan pada distribusi COM-Poisson.

  Shmueli et al. (2005) menyatakan distribusi COM-Poisson yang diusulkan pertama kali oleh Conway dan Maxwell pada tahun 1962 untuk mengatasi sistem antrian. Kemudian Shmueli et al. (2005) memperkenalkan metode estimasi parameter pada distribusi ini dengan maksimum likelihood, weighted least

  

squares (WLS), dan metode Bayesian. Jowaheer dan Khan (2009) menggunakan

  metode estimasi maksimum likelihood dan quasi likelihood dengan iterasi metode Newton untuk mengestimasi parameter model regresi COM-Poisson. Sellers dan Shmueli (2010a) dalam papernya memperkenalkan model regresi yang berdasarkan distribusi COM-Poisson untuk mengatasi masalah overdispersi dan underdispers dengan metode Bayesian. Selain itu, Sellers dan Shmueli (2010b) juga memaparkan model regresi COM-Poisson untuk data tersensor kanan.

  Sehingga pada skripsi ini akan dikaji ulang model regresi COM-Poisson untuk

  

commit to user data tersensor kanan dan estimasi parameternya menggunakan metode maksimum likelihood .

2.1.1 Konsep Dasar Statisik

  Definisi konsep dasar statistik yang digunakan sebagai pendukung dalam penulisan skripsi diambil dari Bain & Engelhardt (1992).

  

Definisi 2.1. Ruang sampel adalah himpunan dari semua kejadian yang mungkin

dari suatu percobaan dan dinotasikan S .

  

Definisi 2.2. Variabel random X adalah suatu fungsi yang memetakan setiap hasil

  , sedemikian sehingga

  yang mungkin pada ruang sampel S ke bilangan real .

  

Definisi 2.3. Jika himpunan semua nilai yang mungkin dari variabel random X

  atau

  

adalah himpunan berhingga dengan bilangan

  X disebut variabel random diskrit. Fungsi

  positif maka dengan yang menyatakan probabilitas dari masing-masing nilai yang mungkin disebut fungsi densitas probabilitas untuk variabel random diskrit.

  Definisi 2.4. Suatu fungsi distribusi kumulatif dari suatu variabel random untuk setiap bilangan real . diskrit didefinisikan

Definisi 2.5. Jika adalah suatu variabel random diskrit dengan fungsi densitas

probabilitas , maka harga harapan dari X dinyatakan sebagai

Definisi 2.6. Jika adalah suatu variabel random berukuran , maka variansi

dinyatakan sebagai .

commit to user

2.1.2 Keluarga Distribusi Eksponensial

  Menurut Mc Cullagh dan Nelder (1983), suatu fungsi probabilitas dengan parameter dari suatu variabel random dikatakan anggota distribusi keluarga eksponensial apabila dapat dituliskan sebagai dengan adalah parameter kanonik dan adalah parameter dispersi serta dan merupakan suatu fungsi yang diketahui. Mean sampel dan variansi sampel dari distribusi keluarga eksponensial dapat diperoleh dengan mendefinisikan fungsi sebagai dimana . Dari persamaan (2.2) diperoleh sehingga, Pada persamaan (2.1), diperoleh persamaan dan terhadap adalah

  

commit to user Oleh karena itu, dari persamaan (2.3) dan (2.4) diperoleh mean sebagai berikut, Serta dari persamaan (2.3), (2.4) dan (2.5) dapat dicari variansi sebagai berikut,

  

commit to user Jadi diperoleh mean sampel dan variansi sampel dari distribusi keluarga eksponensial ialah, dan dengan dan merupakan turunan dari .

2.1.3 Distribusi Poisson

  Distribusi Poisson merupakan distribusi probabilitas diskrit yang menyatakan jumlah kemunculan dari suatu kejadian, seperti jumlah bencana alam pada suatu daerah setiap tahun. Menurut Bain and Engelhardt (1992), variabel random dikatakan berdistribusi Poisson dengan parameter jika mempunyai fungsi densitas sebagai berikut

  , untuk . (2.8) Distribusi Poisson termasuk dalam keluarga distribusi eksponensial, hal ini dapat ditunjukkan dengan menyatakan bentuk fungsi dalam persamaan ke persamaan dengan , , dan .

  Karena distribusi Poisson termasuk dalam keluarga distribusi eksponensial, maka sesuai dengan persamaan dan dapat ditentukan mean dan variansinya yaitu, Oleh karena itu, pada distribusi Poisson berlaku yaitu mean dan variansi sampel sama.

  

commit to user

2.1.4 Model Regresi Poisson

  Model regresi Poisson digunakan untuk memodelkan jumlah kemunculan dari suatu kejadian dalam interval waktu tertentu, seperti jumlah korban bunuh diri pada suatu daerah dalam setahun. Model regresi Poisson diturunkan dari distribusi Poisson dengan parameter yang bergantung pada variabel dependen.

  Misalkan merupakan variabel dependen yang menyatakan banyaknya kejadian yang berupa data cacah berdasarkan distribusi Poisson dan dipengaruhi variabel independen yang saling linier. Menurut Fahrmeir & Tuts (1994) hubungan kedua variabel dapat dituliskan atau dalam bentuk sederhana dengan Secara matriks persamaan dapat dinyatakan sebagai dimana adalah parameter yang tidak diketahui.

  Mean dari variabel random pada model regresi Poisson yang merupakan kombinasi linear dapat diasumsikan dengan sembarang nilai sehingga akan menghasilkan nilai real, sedangkan mean yang merupakan ekspektasi data cacah dari distribusi Poisson harus bernilai positif. Oleh karena itu, untuk mengatasinya perlu dilakukan transformasi sehingga hubungan dan sesuai, yaitu dengan menggunakan mean dengan model linear sebagai

  

commit to user Model regresi Poisson merupakan perluasan dari model linier. Menurut Fahrmeir dan Tuts (1994) perluasan tersebut terbentuk melalui asumsi sebagai berikut.

  1. observasi yang independen untuk setiap i dan berdistribusi Poisson

  i

  Y dengan fungsi densitas probabilitas dengan

  2. dihubungkan pada model linier (2.3) oleh fungsi link logaritma natural sehingga diperoleh model regresi Poisson

2.1.5 Variabel Tersensor Kanan

  Pengamatan untuk beberapa kumpulan data variabel dependen terkadang tidak ada pembatasan atau penyensoran, tetapi nilai dapat disensor untuk asumsi dalam tujuan tertentu. Variabel penyensoran yang digunakan dalam penelitian ini ialah sensor kanan.

  Sensor kanan merupakan batas bawah dari data variabel yang akan disensor. Jika ada penyensoran untuk pengamatan ke , maka . Variabel indikator sensor dapat didefinisikan sebagai Menurut Famoye dan Wang (2004) fungsi densitas untuk data tersensor adalah

  

commit to user

2.1.6 Metode Maksimum Likelihood

  Variabel random memiliki distribusi dengan fungsi densitas probabilitas . dimana Parameter merupakan parameter yang tidak diketahui dengan adalah ruang parameter. Karena sampel random, maka fungsi densitas probabilitas bersama dari adalah .

  Menurut Bain dan Engelhardt (1992), fungsi likelihood didefinisikan sebagai fungsi densitas probabilitas bersama dari yang saling independen. Fungsi likelihood dianggap sebagai fungsi dari yang dituliskan

  Pada metode maksimum likelihood, estimasi parameter dari diperoleh dengan menentukan nilai yaitu dengan memaksimumkan fungsi likelihoodnya. Nilai yang diperoleh disebut estimasi maksimum likelihood (MLE) dari . Memaksimumkan akan memberikan hasil yang sama dengan memaksimumkan , yang dituliskan sebagai

  Estimasi maksimum likelihood dari dapat diperoleh dengan menyelesaikan persamaan Jika pada proses estimasi parameter didapatkan persamaan yang non- linear, maka tidak mudah untuk memperoleh estimasi tersebut. Sehingga diperlukan metode Newton untuk menyelesaikan persamaan non-linear tersebut.

  

commit to user

2.1.7 Metode Newton

  Misalkan terdapat system persamaan dari dua persamaan non-linear Jain et al. (2004) menyatakan untuk mencari penyelesaian sistem non-linear dua variabel pada persamaan digunakan iterasi Newton sebagai berikut dimana merupakan matrik Jacobian dari dan .

  Langkah-langkah dari metode Newton sebagai berikut, 1. menentukan estimasi awal yaitu dan , 2.

  , melakukan proses iterasi seperti pada persamaan 3. dan maka iterasi dihentikan. jika

2.1.8 Pendekteksian Overdispersi dan Underdispersi

  Pengujian yang digunakan untuk mendeteksi adanya overdispersi dan

  

underdispersi adalah nilai deviansi atau Pearson chi-square yang dibagi dengan

  derajat bebasnya. Bentuk statistik deviansi adalah dan bentuk dari statistik Pearson chi-square adalah Jika hasil bagi antara nilai statistik terhadap derajat bebasnya atau statistik terhadap derajat bebasnya lebih besar dari 1, maka terdapat indikasi

  

commit to user

  

commit to user

  bahwa telah terjadi overdispersi pada model regresi Poisson. Sedangkan nilai hasil bagi yang lebih kecil dari 1 mengindikasikan adanya underdispersi.

2.1.9 Uji Signifikansi Parameter

  Uji signifikansi parameter dilakukan setelah diperoleh estimasi model regresi, yang bertujuan untuk mengetahui variabel-variabel independen yang memiliki pengaruh signifikan terhadap model. Agresti (1990), menggunakan uji Wald untuk menguji signifikansi dari masing-masing variabel independen. Langkah-langkah untuk menguji signifikansi dari setiap parameter terhadap model adalah sebagai berikut,

  1. menentukan hipotesis

  (tidak terdapat pengaruh yang signifikan dari variabel independen terhadap model) (terdapat pengaruh yang signifikan dari variabel independen terhadap model) dengan , 2. menentukan tingkat signifikansi , 3. daerah kritis: ditolak jika

  , 4. menghitung nilai statistik uji.

  Statistik uji yang digunakan adalah uji Wald yang diperoleh dari hasil kuadrat taksiran parameter dibagi dengan taksiran sesatan standar, yang dituliskan dengan

  , dan , 5. mengambil kesimpulan.

2.2 KERANGKA PEMIKIRAN

  Kerangka pemikiran dalam pemikiran ini adalah berawal dari konsep dasar model regresi COM-Poisson. Model regresi COM-Poisson merupakan salah satu alternatif untuk mengatasi hubungan antara variabel independen dengan variabel dependen yang bersifat overdispersi maupun underdispersi. Model regresi COM- Poisson didasarkan pada distribusi COM-Poisson. Distribusi COM-Poisson memiliki parameter dispersi yang tidak dimiliki oleh distribusi Poisson. Variabel dependen berupa data cacah sering tidak menggunakan pembatasan. Tetapi pada kenyataanya, variabel dependen dapat mengalami pembatasan nilai atau sering disebut sebagai variabel dependen tersensor.

  Jurnal dari Sellers & Shmueli (2010a), Sellers & Shmueli (2010b) dan Shmueli et al. (2005) yang membahas tentang distribusi COM-Poisson dan model regresi COM-Poisson menjadi ketertarikan penulis untuk melakukan kajian dalam penulisan skripsi ini. Distribusi COM-Poisson dapat digunakan dalam mengatasi masalah overdispersi, underdispersi maupun equidispersi pada data cacah.

  Variabel dependen berupa data cacah sering tidak menggunakan pembatasan atau tersensor. Tetapi banyak kasus nyata yang menunjukkan variabel dependen tersensor. Estimasi parameter model regresi COM-Poisson dilakukan dengan menggunakan metode makimum likelihood (MLE) untuk data tersensor kanan. Selanjutnya model regresi COM-Poisson untuk data tersensor kanan diterapkan pada faktor-faktor yang mempengaruhi banyaknya komplikasi penderita diabetes

  mellitus .

commit to user

BAB III METODE PENELITIAN Metode yang digunakan dalam penelitian ini adalah studi literatur dengan

  • –buku referensi dan karya ilmiah yang meliputi hasil-hasil penelitian dan jurnal yang berkaitan dengan model regresi COM-Poisson dan metode maksimum likelihood.

  

commit to user

  mempelajari buku

  Adapun langkah-langkah dalam penulisan skripsi ini sebagai berikut.

  1. Menurunkan ulang model regresi berdasarkan distribusi COM-Poisson, dengan langkah-langkah sebagai berikut (a) menunjukkan bahwa distribusi COM-Poisson termasuk dalam keluarga distribusi eksponensial,

  (b) menentukan nilai mean dan variansi dari distribusi COM-Poisson, (c) membentuk model regresi COM-Poisson berdasarkan mean distribusi

  COM-Poisson.

  2. Mengestimasi parameter model regresi COM-Poisson untuk data tersensor kanan dengan menggunakan metode maksimum likelihood, dengan langkah- langkah sebagai berikut,

  (a) menentukan probabilitas fungsi distribusi COM-Poisson untuk data tersensor kanan,

  (b) menentukan fungsi likelihood dari model regresi COM-Poisson untuk data tersensor kanan,

  (c) menentukan fungsi log-likelihood dari model regresi COM-Poisson untuk data tersensor kanan,

  (d) mencari turunan pertama dari fungsi log-likelihoodnya, yaitu diturunkan terhadap dan kemudian disamadengankan dengan nol,

  (e) mengestimasi parameter dan dengan menggunakan metode Newton apabila hasil dari persamaan (d) diperoleh non-linier.

  3. Menerapkan model regresi COM-Poisson pada faktor-faktor yang mempengaruhi banyaknya komplikasi penyakit pada penderita diabetes .

  mellitus commit to user

BAB IV PEMBAHASAN Pada bab ini dibahas tentang model regresi COM-Poisson yang meliputi

  distribusi Poisson, model regresi COM-Poisson, estimasi parameter model regresi COM-Poisson untuk data tersensor serta contoh kasus untuk data penyakit Diabetes Mellitus di Surakarta.

4.1 Model Regresi COM-Poisson

4.1.1 Distribusi COM-Poisson

  Distribusi COM-Poisson (Conway Maxwell Poisson) merupakan perluasan dari distribusi Poisson. Variabel random berdistribusi COM-Poisson memiliki fungsi densitas probabilitas dengan . Parameter merupakan nilai mean dari distribusi COM-Poisson, sedangkan merupakan parameter dispersi. Oleh Shmueli et al. (2005) fungsi didekati dengan

  Distribusi COM-Poisson termasuk dalam distribusi keluarga Eksponensial sehingga untuk memperoleh nilai mean dan variansi ditunjukkan dengan menggunakan sifat distribusi keluarga Eksponensial (Shmueli et al., 2005). Untuk menunjukkan dalam keluarga distribusi eksponensial yaitu menyatakan bentuk fungsi persamaan ke persamaan , diperoleh

  

commit to user sehingga dapat disimpulkan .

  Dengan demikian terbukti bahwa distribusi COM-Poisson termasuk dalam keluarga eksponensial sehingga dapat ditentukan mean distribusi COM-Poisson seperti pada persamaan , yaitu

  

commit to user

  

commit to user

,

  dan variansi distribusi COM-Poisson seperti pada (2.7), yaitu

  Jadi, mean dan variansi distribusi COM-Poisson ialah .

4.1.2 Model Regresi COM-Poisson

  Sellers & Shmueli (2010) memperkenalkan model regresi COM-Poisson sebagai analisis hubungan antara variabel random dependen yang berupa data cacah dengan satu atau lebih variabel independen .

  Pada distribusi COM-Poisson telah dijelaskan bahwa parameter merupakan harga harapan dalam distribusi Poisson yang bernilai positif. Sedangkan bernilai real, artinya dapat bernilai positif atau negatif, sehingga diperlukan fungsi link untuk menghubungkan nilai dengan . Hubungan harga harapan dapat dituliskan sebagai berikut, sehingga diperoleh

  Sellers dan Shmueli (2010a) memaparkan bahwa hubungan antara variabel dependen dan variabel independen dalam regresi COM-Poisson dapat dinyatakan melalui harga harapan dari variabel dependennya. Model regresi COM-Poisson dapat dituliskan dimana parameter merupakan parameter yang mengkondisikan keadaan disperse data, menurut Jowaheer dan Khan (2009),

  1. , model regresi COM-Poisson mempresentasikan sifat jika nilai

  

equidispersi sehingga model regresi COM-Poisson sama dengan model

commit to user

  regresi Poisson

  2. , model regresi COM-Poisson mempresentasikan sifat jika nilai

  overdispersi

  3. , model regresi COM-Poisson mempresentasikan sifat jika nilai

  underdispersi .

  Pada model regresi COM-Poisson diasumsikan bahwa variabel dependen menyatakan jumlah (cacah) kejadian berdistribusi COM-Poisson. Diberikan sejumlah variabel independen . Fungsi densitas distribusi COM- Poisson adalah dengan dan

  Dengan mensubtitusikan persamaan dan ke dalam persamaan diperoleh dengan dan merupakan parameter yang tidak diketahui dalam model sehingga harus diestimasi.

  

commit to user

4.2 Estimasi Parameter Model Regresi COM-Poisson untuk Data Tersensor Kanan

4.2.1 Distribusi COM-Poisson untuk Data Tersensor Kanan

  Sensor kanan terjadi apabila individu diketahui masih hidup sampai hilang dari pengamatan atau sampai penelitian berakhir. Jadi hanya diketahui batas atas (waktu awal) dari suatu kejadian.

  Fungsi densitas probabilitas untuk data tersensor kanan seperti pada persamaan ), dengan persamaan ke dalam persamaan diperoleh Persamaan telah diketahui bahwa , sehingga diperoleh

  Persamaan dan persamaan disubtitusikan ke dalam persamaan , maka diperoleh fungsi densitas probabilitas untuk data tersensor kanan ialah

  

commit to user

4.2.2 Estimasi Parameter Model Regresi COM-Pisson untuk Data Tersensor Kanan

  Parameter dan yang tidak diketahui dapat diestimasi menggunakan metode maksimum likelihood. Metode maksimum likelihood merupakan suatu metode estimasi parameter yang memaksimumkan fungsi likelihood, . Fungsi

  likelihood dari model regresi COM-Poisson untuk data tersensor kanan adalah

  sehingga fungsi log-likelihoodnya adalah

  

commit to user

  

commit to user

dengan , maka diperoleh

  (4.7) Persamaan (4.7) diturunkan terhadap dan , sehingga diperoleh

  (4.8) (4.9)

  Kemudian persamaan (4.8) dan (4.9) disamadengankan nol, sehingga diperoleh persamaan

  

commit to user Persamaan dan merupakan persamaan non-linear. Pada persamaan merupakan hasil dari turunan fungsi log-likelihood terhadap dimana turunannya masih menggandung parameter lain yang belum diketahui yaitu dan perlu diestimasi, begitu juga dengan persaman yang masih menggandung parameter . Oleh karena itu, sulit untuk dicari penyelesaian estimasi kedua persamaan tersebut. Untuk mengestimasi kedua parameter ini dilakukan secara bersamaan dengan menggunakan suatu metode iterasi yang disebut metode Newton.

  Metode Newton membutuhkan turunan pertama dan kedua dari fungsi log-

  likelihood nya. Misalkan didefinisikan

  (4.12) dimana fungsi dan dinyatakan sebagai matriks . Matriks adalah matriks gradien, sehingga

  Turunan pertama dari fungsi log-likelihood yang dinyatakan dalam matriks diperoleh sebagai berikut,

  

commit to user commit to user

  Turunan kedua dari fungsi log-likelihood diperoleh sebagai berikut,

  (4.13) iterasi Newton pada persamaan ( ) terdapat matriks Jacobian. Oleh karena itu dibentuk matriks Jacobian sebagai berikut Karena fungsi dan dinyatakan pada persamaan (4.12) serta dan

  , sehingga diperoleh Matriks merupakan matriks Hessian. Estimasi parameter dan menggunakan metode iterasi Newton sesuai persamaan (2.10) ialah, Proses persamaan berulang hingga diperoleh nilai parameter dan yang konvergen, yaitu jika nilai mendekati nilai , begitu juga dengan nilai mendekati . Apabila tidak dipenuhi konvergen, sehingga nilai parameter dapat diperoleh jika nilai dan bernilai sangat kecil.

4.3 Contoh Kasus

  Pada contoh kasus ini akan dimodelkan pola hubungan antara banyaknya komplikasi penyakit yang diderita oleh seorang pasien diabetes mellitus terhadap faktor-faktor yang diduga berpengaruh terhadap timbulnya komplikasi penyakit tersebut. Data yang digunakan adalah data sekunder dari pasien diabetes mellitus di RS Dr Moewardi dan RS Panti Waluyo Surakarta dari tahun 2006-2011 yang disajikan dalam Lampiran 1. Variabel dependen yang akan digunakan mengalami

  

commit to user sensor kanan, dengan variabel dependennya adalah banyaknya komplikasi penyakit (BK). Sedangkan faktor-faktor yang berpengaruh terhadap timbulnya komplikasi penyakit adalah variabel independen, variabel independen yang diduga berpengaruh adalah

1. Usia pasien (USIA) 2.

  Jenis kelamin pasien (JK) 3. Obesitas (OBES) 4. Riwayat penyakit diabetes mellitus dari pasien (RDM) 5. Tipe diabetes mellitus yang diderita pasien (TPDM) 6. Gula darah (GD) Variabel independen dibagi menjadi beberapa kategori karena variabel ini berupa data kualitatif. Pada penyakit diabetes mellitus, pasien sering disertai obesitas. Oleh karena itu variabel obesitas (OBES) dibagi menjadi 2 kategori yaitu pasien yang mengalami obesitas (ya) dan pasien yang tidak mengalami obesitas (tidak). Variabel riwayat diabetes mellitus (RDM) juga dibagi 2 kategori yaitu pasien yang sebelumnya pernah dinyatakan positif terkena diabetes mellitus (ya) dan pasien yang belum pernah positif terkena diabetes mellitus. Sedangkan variabel tipe penyakit diabetes mellitus (TPDM) dibagi menjadi 2 kategori yaitu tipe 1 dan tipe 2.

  Menurut Watts (1984), penyakit diabetes mellitus dibedakan menjadi 2 golongan yaitu tipe 1 yang tergantung pada insulin dan tipe 2 yang tidak tergantung pada insulin. Pembagian kategori pada variabel bebas disajikan pada Tabel 4.1.

  

commit to user

  

commit to user

Tabel 4.1. Pengkodean Kategori Variabel Dummy

  Variabel Keterangan Variabel dummy Jenis kelamin

  Perempuan Laki-laki

  Obesitas Ya Tidak

  Riwayat diabetes mellitus Ya Tidak

  Tipe penyakit diabetes

  mellitus

  Tipe 1 Tipe 2

  Jenis penyensoran yang digunakan ialah sensor kanan pada variabel dependennya dengan pembatasan variabel dependen . Variabel dependen tersensor berarti banyaknya komplikasi (BK) dalam variabel dependen menggunakan nilai pembatasan dengan asumsi banyaknya komplikasi penyakit yang diderita oleh seorang pasien sebanyak 1 dapat memperburuk kondisi pasien tersebut. Analisis dalam penerapan kasus ini menggunakan

  Software R 2.15.0 .

4.3.1 Model Regresi Poisson untuk Tersensor Kanan pada Data Pasien

  

Diabetes Mellitus

  Sebelum dilakukan estimasi parameter model regresi COM-Poisson, terlebih dahulu dicari estimasi parameter model regresi Poisson yang akan digunakan sebagai nilai awal untuk estimasi parameter model regresi COM- Poisson. Model regresi Poisson adalah Pada contoh kasus ini variabel independennya adalah USIA, JK, OBES, RDM, TPDM, dan GD. Sehingga model regresi Poissonnya adalah

  (4.21)

Tabel 4.2. Nilai Estimasi Parameter Regresi Poisson

  Variabel Estimasi Intercept 0.67663 USIA D.JK D.OBES D.RDM D.TPDM GD

  Estimasi parameter model regresi Poisson untuk data tersensor kanan dengan metode maksimum likelihood tersajikan pada Tabel 4.2. Hasil estimasi pada Tabel 4.2 dimasukkan ke persamaan (4.21), diperoleh model regresi Poisson untuk data tersensor kanan adalah

  Setelah diperoleh estimasi model regresi Poisson dengan seluruh variabel independen, selanjutnya dilakukan uji signifikansi setiap parameter untuk mengetahui variabel-variabel independen yang berpengaruh signifikan terhadap model digunakan uji Wald. Tingkat signifikansi yang digunakan adalah 5%, sehingga akan ditolak jika nilai statistik

  

commit to user Estimasi variabel yang berpengaruh pada data komplikasi banyaknya penyakit dari seorang pasien diabetes mellitus dengan variabel dependen tersensor kanan disajikan dalam Tabel 4.3.

Tabel 4.3. Nilai Estimasi Parameter Model Regresi Poisson dengan Uji Wald

  Variabel Estimasi Std. Error uji Wald chi-kuadrat keputusan Intercept USIA tidak ditolak

  D.JK tidak ditolak

  D.OBES tidak ditolak

  D.RDM ditolak

  D.TPDM ditolak

  GD tidak ditolak

  Dari Tabel 4.3 terlihat jelas bahwa hanya variabel dan yang memiliki pengaruh signifikan terhadap model. Sehingga, variabel yang masuk ke dalam model regresi Poisson untuk data tersensor kanan hanya dan . Selanjutnya akan dilakukan estimasi parameter model regresi Poisson untuk variabel independen yang berpengaruh saja. Hasil estimasi parameter model regresi Poisson untuk data tersensor kanan dengan variabel independen yang berpengaruh pada Lampiran disajikan pada Tabel 4.4.

  

commit to user

Tabel 4.4. Estimasi Parameter Model Regresi Poisson dengan Variabel Independen yang Berpengaruh.

  Variabel Estimasi Parameter Intercept D.RDM D.TPDM

  Nilai estimasi yang ditunjukkan pada Tabel 4.4 dapat dibentuk model regresi Poissonnya sebagai berikut,

4.3.2 Pendekteksian Overdispersi atau Underdispersi

  Tahap awal dalam menentukan model regresi COM-Poisson adalah dengan mendeteksi adanya overdispersi atau underdispersi. Nilai mean dan variansi dari data diabetes mellitus di Surakarta yang disajikan pada Tabel 4.5.

Tabel 4.5. Nilai Mean dan Variansi Data Diabetes Mellitus di Surakarta

  Mean Variansi

  Berdasarkan Tabel 4.5 diperoleh bahwa nilai variansi lebih besar dari mean sampel. Oleh karena itu data banyaknya komplikasi penyakit diabetes

  

mellitus untuk data tersensor kanan bersifat overdispersi. Untuk memperkuat