ESTIMASI PARAMETER DISTRIBUSI LOGLOGISTIK PADA DATA TERSENSOR PROGRESSIVE TIPE II DENGAN MENGGUNAKAN ALGORITMA EM SKRIPSI

ESTIMASI PARAMETER DISTRIBUSI LOGLOGISTIK PADA DATA TERSENSOR PROGRESSIVE TIPE II DENGAN MENGGUNAKAN ALGORITMA EM SKRIPSI

   ANNAS RIEZKI ROMADHONI PROGRAM STUDI S-1 MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA 2012 ii

  ESTIMASI PARAMETER DISTRIBUSI LOGLOGISTIK PADA DATA TERSENSOR PROGRESSIVE TIPE II DENGAN MENGGUNAKAN ALGORITMA EM SKRIPSI Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains Bidang Matematika Pada Fakultas Sains dan Teknologi Universitas Airlangga Disetujui Oleh : Pembimbing I, Toha Saifudin, S.Si, M.Si NIP. 19750106 199903 1 002 Pembimbing II, Drs. Eko Tjahjono, M.Si NIP . 19600706 198601 1 001

  LEMBAR PENGESAHAN NASKAH SKRIPSI Judul : Estimasi Parameter Distribusi Loglogistik Pada Data Tersensor Progressive Tipe II Dengan Menggunakan Algoritma EM Penyusun : Annas Riezki Romadhoni NIM : 080810165 Tanggal Ujian : 10 Agustus 2012 Disetujui oleh : Pembimbing I, Pembimbing II, Toha Saifudin, S.Si, M.Si Drs. Eko Tjahjono, M.Si NIP. 19750106 199903 1 002 NIP . 19600706 198601 1 001 Mengetahui : Ketua Program Studi S-1 Matematika Departemen Matematika Fakultas Sains dan Teknologi Universitas Airlangga Dr. Miswanto, M.Si NIP. 19680204 199303 1 002

  iii

PEDOMAN PENGGUNAAN SKRIPSI

  Skripsi ini tidak dipublikasikan, namun tersedia di perpustakaan dalam lingkungan Universitas Airlangga, diperkenankan untuk dipakai sebagai referensi kepustakaan, tetapi pengutipan harus seizin penyusun dan harus menyebutkan sumbernya sesuai kebiasaan ilmiah. Dokumen skripsi ini merupakan hak milik Universitas Airlangga. iv

KATA PENGANTAR

  Alhamdulillah, puji syukur senantiasa penulis panjatkan kepada Allah SWT yang telah melimpahkan rahmat, karunia, dan hidayahnya-Nya sehingga penulis dapat menyelesaikan skripsi yang berjudul “Estimasi Parameter Distribusi

  Loglogistik Pada Data Tersensor Progressive Tipe II Dengan Menggunakan Algoritma EM”.

  Pada kesempatan yang telah diberikan ini, penulis ingin menyampaikan terima kasih yang sebesar-besarnya kepada :

  1. Kedua orang tua dan adik penulis yang telah memberikan dukungan, kasih sayang, dan kepercayaan yang begitu besar.

  2. Dr. Miswanto, M.Si., selaku Ketua Prodi S-1 Matematika yang telah memberikan arahan dan bimbingan kepada penulis.

  3. Toha Saifudin, S.Si, M.Si dan Drs Eko Tjahjono, M.Si selaku dosen pembimbing I dan II yang telah memberikan arahan, masukan, perhatian, rasa sabar yang begitu besar dan pengetahuan yang tidak ternilai.

  4. Ahmadin, S.Si, M.Si. selaku dosen wali yang telah banyak memberikan nasehat dan saran demi mencapai kesuksesan di dunia dan akhirat.

  5. Seluruh dosen Universitas Airlangga, terima kasih untuk segala ilmu yang diberikan.

  6. Teman-teman Matematika 2008, kakak-kakak 2007, adik-adik 2009 dan 2010 terima kasih untuk semua bantuan dan rasa kekeluargaan yang telah terjalin selama ini.

  7. Rekan-rekan seperjuangan HMI (Himpunan Mahasiswa Islam) yang telah memberikan pembelajaran yang sangat luar biasa. YAKUSA!!!

  8. Serta pihak-pihak lain yang tidak dapat disebutkan satu persatu, terima kasih atas segala bantuannya selama ini.

  Penulis menyadari skripsi ini masih jauh dari kesempurnaan. Untuk itu penulis mengharapkan kritik dan saran yang bersifat membangun dari pembaca. Semoga skripsi ini dapat bermanfaat bagi semua pembaca.

  Surabaya, Agustus 2012 Penyusun

  Annas Riezki Romadhoni v Annas Riezki Romadhoni, 2012. Estimasi Parameter Distribusi Loglogistik pada Data Tersensor Progressive Tipe II dengan Menggunakan Algoritma EM. Skripsi ini dibawah bimbingan Toha Saifuddin, S.Si, M.Si. dan Drs. Eko Tjahjono, M.Si, Departeman Matematika, Fakultas Sains dan Teknologi, Unversitas Airlangga.

  ABSTRAK

  Distribusi Loglogistik adalah distribusi yang biasa digunakan dalam analisis data tahan hidup karena logaritma natural dari variabel-variabel tahan hidupnya terdistribusi secara logistik. Distribusi Loglogistik mempunyai dua parameter yaitu parameter skala dan parameter bentuk . Penulisan ini bertujuan untuk memperoleh estimator parameter distribusi Loglogistik pada data tersensor progressive tipe II. Metode yang digunakan dalam penulisan ini adalah metode Maximum Likelihood dengan algoritma EM. Algoritma EM terdiri dari dua tahap yaitu tahap E dan M. Pada tahap E dilakukan perhitungan ekspektasi bersyarat dari fungsi ln likelihood dan pada tahap M dilakukan perhitungan untuk memaksimalkan ekspektasi bersyarat dari fungsi ln likelihood hingga mendapatkan nilai yang konvergen. Software yang digunakan untuk mempermudah mendapatkan nilai estimator parameter distribusi Loglogistik adalah Mathematica. Pada kasus logaritma natural dari waktu terurainya Isolator Zat Cair pada voltase 34 KV dengan sampel pengamatan dan kegagalan yang diamati masing-masing sebesar 19 dan 8, sedangkan skema penyensorannya adalah diperoleh nilai estimator parameter untuk sebesar 6,526 dan sebesar 1,108.

  Kata Kunci: Distribusi Loglogistik, Data Tersensor Progressive Tipe II,

Maximum Likelihood Estimator, Algoritma EM.

vi

  Annas Riezki Romadhoni, 2012. Estimation of Parameter of The Loglogistic Distribution based on Progressive Type-II Censoring Using The EM Algorithm. This Skripsi is supervised by Toha Saifuddin, S.Si, M.Si. and Drs. Eko Tjahjono, M.Si, Mathematics Department, Faculty of Sains and Technology, Airlangga University

  ABSTRACT

  The Loglogistic distribution is a commonly used distribution in lifetime data analysis because natural logarithm of the lifetime variables are logistically distributed. Loglogistic distribution has two parameters, that are the scale parameter and shape parameter . The main objective of this paper is to get parameter estimator of the Loglogistic distribution based on Progressive type-II censoring. The method that used in this paper is Maximum Likelihood method with EM Algorithm. EM algorithm is consist of two steps, that are E-step and M- step. E-step requires the algorithm to calculate conditional expectation of log- likelihood function and M-step calculation to maximize the conditional expectation of log-likelihood function until get a convergen value. Software that used to get the parameter estimator of the Loglogistic distribution easily is Mathematica. On natural logarithm case from the time of disintregation of the isolator fluid at 34 KV voltage with sample observations and observed failure are given respectively by 19 and 8, then the censored scheme is then obtained the estimator value of parameter for is 6,526 and for is 1,108.

  Keywords : Loglogistic distribution, Progressive Type II Censored, Maximum

  Likelihood Estimator, EM Algorithm

  vii

  DAFTAR ISI

  Halaman LEMBAR JUDUL ............................................................................................... i LEMBAR PERNYATAAN ................................................................................ ii LEMBAR PENGESAHAN ............................................................................... iii LEMBAR PEDOMAN PENGGUNAAN SKRIPSI .......................................... iv KATA PENGANTAR ........................................................................................ v ABSTRAK ......................................................................................................... vi ABSTRACT ...................................................................................................... vii DAFTAR ISI ................................................................................................... viii DAFTAR GAMBAR ......................................................................................... x DAFTAR LAMPIRAN ...................................................................................... xi

  BAB I PENDAHULUAN ................................................................................... 1

  1.1 Latar Belakang Masalah ................................................................. 1

  1.2 Rumusan Masalah .......................................................................... 4

  1.3 Tujuan ............................................................................................ 4

  1.4 Manfaat .......................................................................................... 5

  BAB II TINJAUAN PUSTAKA ........................................................................ 6

  2.1 Analisis Data Uji Hidup ................................................................. 6

  2.2 Distribusi Probabilitas .................................................................... 6

  2.3 Distribusi Loglogistik .................................................................... 8

  2.4 Distribusi Logistik .......................................................................... 8

  2.5 Sampel Lengkap ............................................................................. 9

  2.6 Sampel Tersensor Progressive Tipe II ........................................... 9

  2.7 Nilai Ekspektasi ........................................................................... 10

  2.8 Estimasi ........................................................................................ 11

  2.9 Least Squares Estimation ............................................................. 14

  2.10 Estimasi Kaplan Meier ................................................................. 15

  2.11 Newton-Raphson .......................................................................... 15 viii

  2.12 MINITAB 14 ................................................................................ 16

  2.13 Mathematica ................................................................................. 16

  BAB III METODE PENELITIAN.................................................................... 17 BAB IV HASIL DAN PEMBAHASAN .......................................................... 21

  4.1 Estimasi Parameter Distribusi Loglogistik Pada Data Tersensor

  Progressive Tipe II dengan Menggunakan Algoritma EM ................... 21

  4.2 Algoritma Program ...................................................................... 47

  Progressive Tipe II ....................... 49

  4.3 Penerapan Pada Data Tersensor

  BAB V KESIMPULAN DAN SARAN ............................................................ 56

  5.1 Kesimpulan ..................................................................................... 56

  5.2 Saran . .............................................................................................. 58 DAFTAR PUSTAKA ....................................................................................... 59 LAMPIRAN ix

  DAFTAR GAMBAR Nomor Judul Halaman

  2.1 Skema Penyensoran Progressive Tipe II

  9

  4.1 Plot data waktu terurainya isolator zat cair pada tegangan 34 KV 50

  4.2 Plot data waktu terurainya isolator zat cair pada tegangan 34 KV tersensor progressive tipe II

  51

  4.3 Plot data log natural waktu terurainya isolator zat cair pada Tegangan 34 KV tersensor progressive tipe II

  52

  54

4.4 Grafik estimasi fungsi survival

  55

  4.5 Tabel estimasi fungsi survival x

  DAFTAR LAMPIRAN Nomor Judul

  1. Data Sampel Lengkap Waktu Terurainya Isolator Zat Cair Pada Tegangan 34kV.

  2. Data Sampel Tersensor Progressive Tipe II Waktu Terurainya Isolator Zat Cair Pada Tegangan 34kV.

  3. Program Untuk Menentukan Estimasi Parameter Distribusi Loglogistik Pada Data Tersensor Progressive Tipe II. xi

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

  Globalisasi ekonomi merupakan suatu keadaan ekonomi dimana kegiatan perekonomian bersifat terbuka tanpa adanya batas-batas wilayah antara daerah yang satu dengan daerah yang lainnya. Hal ini menyebabkan persaingan produk yang diproduksi oleh setiap perusahaan semakin berat. Salah satu yang menjadi tolak ukur keberhasilan persaingan ini adalah kualitas suatu produk. Untuk mengetahui kualitas suatu produk sebelum dipasarkan kepada konsumen, perlu diadakan suatu penelitian yang berkaitan dengan pengamatan suatu keandalan atau daya tahan hidup komponen. Hal ini dikarenakan sangat berguna dalam pengujian tentang bagaimana suatu komponen dapat berfungsi sebagaimana mestinya dalam waktu yang ditentukan.

  Analisa data tahan hidup (survival analysis) adalah suatu metode untuk menganalisis data yang berhubungan dengan waktu, mulai dari time origin atau

  start-point sampai dengan terjadinya suatu kejadian khusus atau end-point

  (Collet, 1994). Bentuk pengujian data tahan hidup adalah pengujian waktu tahan hidup suatu komponen pada saat digunakan hingga mati atau ketika pasien terjangkit penyakit hingga meninggal. Jika semua benda atau individu diuji sampai terjadinya kematian atau kegagalan maka disebut sampel lengkap. Metode tersebut mempunyai keuntungan yaitu semua komponen dapat teramati. Tetapi metode tersebut juga mempunyai kelemahan diantaranya yaitu waktu yang

  1 diperlukan untuk melakukan penelitian sangat lama dan biaya yang diperlukan sangat besar. Hal ini sangat merugikan bagi suatu instansi dalam pengadaan penelitian. Untuk itu, perlu dilakukan penyensoran data agar lebih efisien dari segi waktu dan biaya.

  Dalam statistika, ada banyak jenis penyensoran yang dapat digunakan untuk mempercepat suatu penelitian. Pada kesempatan ini penulis menggunakan penyensoran progressive tipe II yang merupakan pengembangan dari penyensoran tipe II. Alasan menggunakan jenis penyensoran ini adalah waktu yang dibutuhkan untuk melakukan penelitian relatif lebih cepat, karena dengan cara mengambil sebagaian data untuk tidak diamati. Hal ini menyebabkan biaya yang dikeluarkan relatif sedikit. Menurut Wu (2002), penyensoran progressive tipe II adalah pengamatan terhadap sampel dengan kegagalan yang diamati dengan syarat bilangan bulat, sedemikian sehingga pada saat terjadi kegagalan yang pertama, dari unit yang survive secara acak dikeluarkan dari pengamatan, sedangkan pada pengamatan kegagalan yang kedua, unit penelitian yang

  survive secara acak dikeluarkan lagi. Penelitian ini berhenti pada saat

  kegagalan diamati dan ini berarti unit yang survive semua dikeluarkan.

  Untuk menganalisis dan mempresentasikan data uji hidup maka diperlukan suatu distribusi. Sehingga analisis terhadap data uji hidup dapat dilakukan secara parametrik. Data yang digunakan dalam penelitian berupa waktu yang bertipe kontinu, sehingga distribusi probabilitas yang digunakan adalah bertipe kontinu.

  Menurut Kus dan Kaya (2006), distribusi Loglogistik adalah distribusi yang biasa digunakan dalam analisis data tahan hidup karena logaritma natural dari variabel- variabel tahan hidupnya terdistribusi secara logistik. Adapun fungsi kepadatan peluang (fkp) distribusi Loglogistik sebagai berikut:

  Berdasarkan uraian di atas, diperlukan suatu metode yang digunakan dalam penarikan kesimpulan mengenai suatu populasi yang biasa disebut inferensi statistik. Salah satu metode yang sering digunakan adalah Maximum Likelihood. Penyelesaian akhir metode ini umumnya membutuhkan iterasi numerik. Salah satu Algoritma yang dapat dipakai adalah algoritma EM. Algoritma EM adalah metode optimisasi iteratif untuk estimasi Maksimum Likelihood yang berguna dalam permasalahan data yang tidak lengkap. Dalam algoritma EM ini terdapat 2 tahap, yaitu tahap Ekspektasi (tahap E) dan tahap Maksimasi (tahap M).

  Berdasarkan permasalahan diatas, maka penulis tertarik untuk melakukan studi jurnal estimasi parameter distribusi Loglogistik pada data tersensor

  progressive tipe II dengan menggunakan algoritma EM yang diambil dari jurnal

  yang berjudul “Estimation of Parameter of The Loglogistic Distribution Based on

  Progressive Censoring Using The EM Algorithm” yang ditulis oleh Kus dan Kaya

  (2006). Pada penulisan skripsi ini juga disertakan program untuk mencari estimasi parameter distribusi Loglogistik menggunakan software Matematica. Selanjutnya dilakukan penerapan pada data waktu terurainya isolator zat cair pada tegangan 34 KV yang didapatkan dari jurnal yang sama.

  1.2 Rumusan Masalah

  Berdasarkan latar belakang permasalahan diatas, maka rumusan masalah yang dibahas adalah:

  1. Bagaimana mengestimasi parameter distribusi Loglogistik pada data tersensor progressive tipe II dengan menggunakan algoritma EM?

  2. Bagaimana membuat program pada software Matematica untuk mengestimasi parameter distribusi Loglogistik pada data tersensor

  progressive tipe II dengan menggunakan algoritma EM?

  3. Bagaimanakah aplikasi estimasi parameter distribusi Loglogistik pada data tahan hidup tersensor Progressive Tipe II dengan menggunakan algoritma EM?

  1.3 Tujuan

  1. Mengestimasi parameter distribusi Loglogistik pada data tersensor progressive tipe II dengan menggunakan algoritma EM.

  2. Membuat program pada software Mathematica untuk mengestimasi parameter distribusi Loglogistik pada data tersensor progressive tipe II dengan menggunakan algoritma EM.

  3. Menerapkan hasil yang diperoleh dari estimasi parameter distribusi Loglogistik pada data tahan hidup tersensor progressive tipe II dengan menggunakan algoritma EM.

1.4 Manfaat

  1. Menambah wawasan mengenai estimasi parameter dari distribusi Loglogistik pada data tersensor progressive tipe II menggunakan metode algoritma EM.

  2. Hasil kajian dapat diterapkan pada bidang ilmu kesehatan, industri, pendidikan dan sebagainya.

  3. Informasi yang di dapat dari skripsi ini akan membuka peluang untuk diadakan penelitian selanjutnya.

BAB II TINJAUAN PUSTAKA

  2.1 Analisa Data Tahan Hidup

  Menurut Collet (1994), analisa data tahan hidup (survival analysis) adalah suatu metode untuk menganalisis data yang berhubungan dengan waktu, mulai dari time origin atau start-point sampai dengan terjadinya suatu kejadian khusus atau end-point. Di dalam riset medis, time origin sering digunakan sebagai awal perekrutan suatu individu dalam suatu studi yang bersifat percobaan, sedangkan

  end-point merupakan kematian suatu individu atau pasien, sehingga data yang dihasilkan secara harfiah dinamakan waktu survival.

  2.2 Distribusi Probabilitas

2.2.1 Fungsi Kepadatan Probabilitas (FKP)

  Menurut Bain dan Engelhardt (1992), fungsi kepadatan probabilitas (fkp) merupakan nilai peluang dari setiap kejadian .

  Terdapat 2 jenis fungsi kepadatan probabilitas yaitu, fungsi kepadatan probabilitas (fkp) diskrit dan fungsi kepadatan probabilitas (fkp) kontinu. suatu variabel random dengan distribusi probabilitas disebut fungsi kepadatan probabilitas (fkp) diskrit apabila :

  1) 2)

  6 Sedangkan disebut fungsi kepadatan probabilitas (fkp) kontinu apabila : 1) 2)

  2.2.2 Cumulative Distribution Function (CDF)

  Menurut Bain dan Engelhardt (1992), Cumulative Distribution Function

  (CDF) dari suatu variabel acak didefinisikan untuk setiap bilangan real

  sebagai : Menurut Walpole dan Myers (1995), terdapat 2 jenis distribusi kumulatif yaitu:

  1. Distribusi kumulatif suatu peubah acak diskrit dengan distribusi peluang dinyatakan oleh

  2. Distribusi kumulatif suatu peubah acak kontinu dengan distribusi peluang dinyatakan oleh

  2.2.3 Fungsi Survival

  Menurut Lawless (1982), fungsi survival adalah probabilitas bahwa suatu individu akan bertahan sampai waktu dengan diasumsikan kontinu, dirumuskan sebagai berikut :

  2.3 Distribusi LogLogistik

  Menurut Kus dan Kaya (2006), distribusi Loglogistik adalah distribusi yang biasa digunakan dalam analisis data tahan hidup karena logaritma natural dari variabel-variabel tahan hidupnya berdistribusi Logistik. Adapun fungsi kepadatan probabilitas (fkp) distribusi Loglogistik dengan parameter skala dan parameter bentuk sebagai berikut:

  2.4 Distribusi Logistik

  Menurut Kus dan Kaya (2006), jika mempunyai distribusi logistik dengan parameter lokasi dan parameter skala , maka fungsi kepadatan probabilitas dan fungsi distribusi dari diberikan masing-masing yaitu: dengan

  2.5 Sampel Lengkap

  Menurut Lawless (1982), pada sampel lengkap percobaan uji hidup dilakukan sampai semua individu atau benda mengalami kematian atau kegagalan. adalah :

  Adapun fungsi likelihood dari

  2.6 Sampel Tersensor Progressive Tipe II

  Menurut Wu (2002), penyensoran progressive tipe II adalah pengamatan terhadap sampel dengan kegagalan yang diamati dengan syarat bilangan bulat, sedemikian sehingga pada saat terjadi kegagalan yang pertama, dari unit yang survive secara acak dikeluarkan dari pengamatan, sedangkan pada unit penelitian yang survive secara acak pengamatan kegagalan yang kedua, dikeluarkan lagi. Penelitian ini berhenti pada saat kegagalan diamati dan ini unit yang survive semua dikeluarkan. berarti Skema penyensoran progressive tipe II adalah ) dengan

  . Dengan keterangan : dan : jumlah sampel pengamatan. : banyaknya kegagalan yang diamati.

  : banyaknya unit sampel yang masih survive yang dipindahkan dari pengamatan (tidak diamati lagi) pada saat terjadinya kegagalan yang ke – . Hal ini dapat digambarkan sebagai berikut :

  Dipindahkan Dipindahkan Dipindahkan (tidak (tidak (tidak

  diamati) diamati) diamati) …

  Pengamatan Pengamatan

  • n-1- n-m-1- n-1- dimulai

  berakhir

  Pada penyensoran progressive tipe II, secara umum bentuk fungsi likelihood yang didasarkan pada cara pengamatan terhadap sampel dapat dirumuskan sebagai berikut: dengan dan . Pada skema penyensoran progressive tipe II, terdapat beberapa sedemikian sehingga keadaan khusus yaitu jika

  , maka akan diperoleh teknik penyensoran sampel secara tersensor tipe II, namun jika skema penyensorannya adalah , maka diperoleh sampel lengkap.

2.7 Nilai Ekspektasi

  peubah acak Menurut Bain dan Engelhardt (1992), nilai ekspektasi dari kontinu adalah : yang kontinu, maka nilai ekspektasi Misalkan adalah fungsi acak adalah : untuk

  Menurut Graybill et al. (1963), jika adalah dua peubah acak dan merupakan fungsi dengan domain dan kodomain bilangan real.

  Ekspektasi bersyarat dari dimana yang dinotasikan dengan adalah sebagai berikut:

  1. bila masing-masing diskrit.

  2. bila masing-masing kontinu.

2.8 Estimasi

  Menurut Lawlees (1982), inferensi statistik didefinisikan sebagai metode untuk menarik kesimpulan mengenai populasi. Penarikan kesimpulan dari serangkaian observasi pada umumnya dilakukan berdasarkan data sampel dengan menganggap bahwa karakteristik sampel (statistik sampel) kemungkinan besar mendekati karakteristik populasi (parameter populasi). Dengan kata lain parameter populasi yang merupakan konstanta yang tidak diketahui, umumnya diestimasi dengan menggunakan statistik sampel . Masalah dalam pengestimasian adalah bahwa fungsi kepadatan probabilitas dari sampel yang diobservasi memuat parameter populasi yang tidak diketahui. Nilai sampel yang diobservasi digunakan sebagai dasar untuk mengestimasi nilai .

  Estimator yang diinginkan adalah estimator yang dekat dengan . Pengestimasian parameter dapat dilakukan secara Klasik maupun Bayes. Dalam metode Klasik, inferensi didasarkan sepenuhnya pada sampel yang diambil secara random dari populasi. Sedangkan pada metode Bayes selain informasi sampel random juga dipergunakan informasi tambahan mengenai nilai parameter yang tidak diketahui.

2.8.1 Maximum Likelihood Estimator

  merupakan peubah Menurut Hogg dan Craig (1995), misalkan acak yang saling bebas dan berdistribusi identik dengan fungsi kepadatan peluang

  , untuk . Fungsi kepadatan peluang bersama antara adalah Jika fungsi kepadatan peluang bersama tersebut dinyatakan sebagai fungsi terhadap maka dinamakan fungsi likelihood yang dinotasikan atau ditulis sebagai berikut dengan .

  Statistik dinamakan Maximum Likelihood Estimator (MLE) dari bila statistik memaksimumkan , .

2.8.2 Algoritma EM

  Menurut Kus dan Kaya (2006), algoritma EM merupakan metode yang sangat tepat digunakan dalam menangani masalah mengenai data yang hilang atau data tersensor. Misalkan adalah vektor acak data lengkap. Pada data lengkap memuat data yang teramati yang merupakan suatu vektor yang memuat nilai waktu hidup saat terjadinya kegagalan dari pengamatan terhadap sampel dengan kegagalan yang diamati, dan data yang tidak teramati yang merupakan suatu vektor dengan komponen data yang survive atau dianggap sebagai data tersensor, dimana adalah vektor dengan untuk Vektor merupakan skema penyensoran progressive tipe II. Fungsi log likelihood untuk data lengkap dinotasikan .

  Algoritma EM terdiri dari dua tahap yaitu tahap E (Ekspektasi) dan tahap M (Maksimasi). Pada tahap Ekspektasi dilakukan perhitungan ekspektasi bersyarat

  . Tahap Maksimasi dilakukan untuk mendapatkan dengan cara memaksimumkan ekspektasi log likelihood yang sudah dihitung pada tahap E atau memaksimumkan ekspektasi berikutnya diperoleh bersyarat . Parameter secara iteratif mengulangi tahap E dan M sampai proses konvergen, dengan menyatakan suatu iterasi.

2.9 Least Squares Estimation

  Menurut Lawless (1982), estimasi Least Squares digunakan lebih umum untuk memperoleh estimasi parameter dalam kasus tertentu. Dengan mempertimbangkan model memuat parameter yang tidak diketahui dapat berhubungan linier terhadap beberapa transformasi dari fungsi survival. Agar lebih spesifik, dimisalkan sebagai adalah telah diketahui dan merupakan bentuk dari himpunan independen adalah parameter yang tidak diketahui. linear dari fungsi dan

  Berdasarkan model dari persamaan (2.11) bentuk dari Least Squares dapat digunakan untuk mengestimasi . Misalkan adalah waktu sebagai estimasi tahan hidup yang teramati pada sampel tersensor. Anggap dapat yang sesuai untuk dan anggap [ ]. Maka diestimasi dengan cara meminimumkan dengan syarat . Langkah-langkah ini bersifat sederhana tetapi sering kali berguna sebagai cara yang mudah untuk memperoleh estimasi . Sebagai contoh, digunakan sebagai estimasi awal dalam prosedur untuk mendapatkan MLE.

  2.10 Estimasi Kaplan Meier

  Menurut Lawless (1982), misalkan terdapat pengamatan pada individu dan menyatakan waktu kematian yang berbeda dengan .

  Akan ada kemungkinan terjadinya lebih dari satu kematian di , dan . Selain itu, pada waktu tahan hidup menunjukkan banyaknya kematian saat untuk individu yang waktu akan ada waktu yang tersensor tahan hidupnya tidak teramati. Estimasi dari didefinisikan sebagai :

  , yaitu jumlah individu yang menyatakan jumlah individu yang beresiko saat . hidup dan tidak tersensor sesaat sebelum

  2.11 Newton-Raphson

  adalah nilai awal yang mendekati Menurut Faires dan Burden, misalkan berada dalam interval yang berisi nilai akar dari persamaan dan semua nilai yang mendekati . Gradien dari garis singgung pada grafik di titik ( ) adalah , sehingga persamaan garis singgungnya adalah Karena garis ini melewati sumbu ketika nilai dari titik pada garis tersebut nol, maka nilai yang mendekati berikutnya adalah

  2.12 MINITAB 14

  Irawan dan Astuti (2006), menjelaskan bahwa Minitab 14 merupakan salah satu program aplikasi statistika yang banyak digunakan untuk mempermudah pengolahan data statistik. Keunggulan Minitab adalah dapat digunakan dalam pengolahan data statistika untuk tujuan sosial maupun teknik. Minitab juga memungkinkan sebagai fasilitas dalam analisis time series dan peramalannya.

  2.13 Mathematica

  Ardana (2003) , menjelaskan bahwa Mathematica merupakan suatu sistem aljabar komputer (CAS, Computer Algebra System) yang mengintegrasikan kemampuan komputasi (simbolik, numerik), visualisasi (grafik), bahasa pemograman, dan pengolahan kata (word processing) ke dalam suatu lingkungan yang sudah digunakan. Pertama kali diperkenalkan pada tahun 1988, Mathematica kini tersedia pada lebih dari 20 platform komputer. Mathematica merupakan salah satu alat pilihan dalam pendidikan, penelitian bisnis, dan sebagainya. Khususnya untuk melakukan komputasi matematik, baik simbolik maupun numerik, pengembangan algoritma dan aplikasi, pemodelan dan simulasi, eksplorasi, analisis, dan visualisasi data.

  Sistem Mathematica terdiri dari dua bagian utama, yaitu front end dan kernel. Front end berupa interface dengan lingkungan kerjanya yang disebut

  notebook. User memasukkan perintah – perintah atau melakukan pengolahan kata (word processing) pada notebook, sedangkan komputasi matematik dilakukan

  pada bagian kernel.

BAB III METODE PENELITIAN Metode penelitian yang digunakan dalam penulisan skripsi ini adalah

  sebagai berikut :

  1. Menentukan estimasi parameter distribusi Loglogistik pada data tersensor

  Progressive Tipe II menggunakan metode Algoritma EM dengan langkah-

  langkah sebagai berikut :

  a. Mengasumsikan sampel waktu daya tahan hidup berasal dari distribusi Loglogistik.

  b. Mentransformasikan distribusi Loglogistik dengan agar diperoleh distribusi Logistik.

  c. Menentukan fkp dari distribusi Logistik.

  d. Menentukan fungsi likelihood pada data lengkap dari fkp distribusi Logistik yaitu :

  e. Mengubah fungsi likelihood menjadi bentuk logaritma natural, yaitu

  f. Mempartisi ln likelihood data lengkap menjadi data yang teramati dan data yang tidak teramati.

  17 g. Menentukan nilai maksimum dari fungsi ln likelihood dengan cara mendiferensialkan secara parsial terhadap parameter distribusi Loglogistik yaitu

  h. Tahap Ekspektasi Menghitung ekspekasi bersyarat dari ln likelihood pada fungsi yaitu fungsi data yang tidak teramati atau tersensor progressive tipe II. i. Tahap Maksimasi

  1) Mendapatkan fungsi ekspektasi bersyarat dari ln-likelihood dengan ke cara mensubstitusikan hasil ekspektasi bersyarat dari fungsi ekspektasi awal.

2) Mendapatkan estimator dan dengan cara iterasi menggunakan metode Newton-Raphson.

  j. Mendapatkan estimator distribusi Loglogistik dengan .

  2. Membuat algoritma dan program untuk estimasi parameter dari distribusi Loglogistik pada data tersensor progressive tipe II dengan langkah-langkah sebagai berikut: a. Menginputkan data lengkap sampel tersensor progressive tipe II dengan struktur yang dinotasikan fungsi , dimana sebagai inputan data yang teramati.

b. Menginputkan nilai estimator awal dan untuk Nilai estimasi awal didapatkan dari Metode Least Squares.

  1) Mendapatkan fungsi survival distribusi Logistik dari persamaan (2.1) 2) Mencari 3) Mendapatkan 4) Menggunakan Jumlah Kuadrat Galat (JKG) sehingga diperoleh dan diperoleh dari perhitungan dengan menggunakan

  5) Nilai metode Kaplan-Meier.

  c. Tahap Ekspektasi Menghitung ekspektasi dengan menggunakan estimator awal dan dimana menyatakan iterasi.

  d. Tahap Maksimasi dengan iterasi Mencari dan menghitung estimator dan Newton-Raphson dari persamaan yang didapatkan dari langkah c.

  e. Jika dan maka iterasi dihentikan dan lanjut ke langkah f, tapi jika nilai tersebut tidak terpenuhi maka kembali ke langkah c dengan mengganti .

f. Mendapatkan dan sebagai estimator parameter distribusi Logistik.

  .

  g. Mendapatkan

  h. Tampilkan dan sebagai estimator dari parameter distribusi Loglogistik pada data tersensor progressive tipe II.

  3. Penerapan estimasi parameter distribusi Loglogistik pada data dengan langkah-langkah sebagai berikut : a. Menguji data ilustrasi yang digunakan berdistribusi Loglogistik.

  b. Mengestimasi parameter menggunakan program komputer (dengan bantuan software Mathematica) berdasarkan algoritma tersebut.

  c. Menghitung estimasi fungsi survival.

BAB IV HASIL DAN PEMBAHASAN Dalam bab ini akan diuraikan hasil dan pembahasan estimasi parameter

  distribusi Loglogistik pada data tersensor progressive tipe II dengan menggunakan algoritma EM.

4.1 Estimasi Parameter Distribusi Loglogistik Pada Data Tersensor

  Progressive Tipe II Dengan Menggunakan Algoritma EM.

  Algoritma EM adalah metode optimisasi iteratif untuk estimasi Maksimum Likelihood yang berguna dalam permasalahan data yang tidak lengkap. Dalam algoritma EM ini terdapat 2 tahap, yaitu tahap Ekspektasi (tahap E) dan tahap Maksimasi (tahap M). Adapun langkah-langkah untuk mendapatkan nilai estimator adalah sebagai berikut:

4.1.1 Mengasumsikan sampel waktu tahan hidup berasal dari distribusi Loglogistik

  Misalkan adalah waktu tahan hidup dari sampel berukuran yang identik dan independen dari distribusi Loglogistik dengan parameter dan dapat ditulis sebagai berikut:

  , sehingga

  21

  4.1.2 Fkp dari Distribusi Loglogistik

  Bentuk fkp dari distribusi Loglogistik adalah:

  4.1.3 Transformasi Distribusi Loglogistik

  Untuk mempermudah proses estimasi, maka pada langkah ini distribusi Loglogistik akan ditransformasikan menjadi distribusi Logistik dengan dan . merupakan Jacobian dari . Berdasarkan (4.1) maka diperoleh transformasi sebagai berikut: maka diperoleh bentuk fkp dari distribusi Logistik yaitu:

4.1.4 Fungsi Likelihood Data Lengkap dari Fkp Distribusi Logistik

  Misalkan adalah waktu tahan hidup dari sampel berukuran yang identik dan independen dari distribusi Loglogistik dengan parameter dan , maka merupakan log natural dari waktu tahan hidup yang identik dan independen berdistribusi Logistik dengan parameter dan . Berdasarkan (2.10) dan fkp distribusi Logistik (4.2) maka fungsi likelihood dari distribusi Logistik adalah

  Dari fungsi likelihood (4.3), maka fungsi ln likelihoodnya adalah sebagai berikut:

  Pada langkah ini komponen fungsi ln likelihood pada data lengkap dipartisi menjadi data yang teramati yaitu dan tidak teramati yaitu .

  Untuk mengestimasi parameter dan dengan Maksimum Likelihood, maka fungsi ln likelihood didiferensialkan secara parsial terhadap parameter dan . Hasilnya dapat diuraikan sebagai berikut:

  Langkah berikutnya untuk mendapatkan estimator dan adalah dengan membuat kedua fungsi diferensial tersebut sama dengan nol. Hasilnya adalah sebagai berikut:

4.1.5 Tahap Ekspektasi

  Tahap Ekspektasi bertujuan untuk menemukan ekspektasi bersyarat dari ) dengan syarat data yang diketahui nilainya atau data data tidak teramati (

  ) pada persamaan (4.5) dan (4.6). Sebelum mencari ekspektasi teramati ( bersyarat dari persamaan (4.5) dan (4.6), maka terlebih dahulu mencari distribusi diketahui. Distribusi bersyarat bersyarat dari dengan syarat dapat diperoleh dengan cara sebagai berikut:

  Untuk mendapatkan ekspektasi bersyarat dari persamaan (4.5) dan (4.6) diketahui maka dapat digunakan distribusi bersyarat dari untuk yang didapatkan dari persamaan (4.7). Langkah-langkah untuk memperoleh ekspektasi bersyarat sebagai berikut: Lemma 4.1

  (1) Ekspektasi bersyarat yang pertama Misal: maka:

  Berdasarkan lemma 4.1 maka hasilnya sebagai berikut:

  (2) Ekspektasi bersyarat yang kedua Misal: maka

  Lemma 4.2

  (3) Ekspektasi bersyarat yang ketiga

  Misal: maka:

  Berdasarkan lemma 4.2 maka hasilnya sebagai berikut: Setelah mendapatkan ekspektasi bersyarat dari data yang tidak teramati

  ( ) maka langkah selanjutnya yaitu mensubstitusi nilai ekspektasi bersyarat yang diperoleh yaitu persamaan (4.8), (4.9), (4.10) ke dalam fungsi ln likelihood yaitu persamaan (4.5) dan (4.6). Jadi didapatkan persamaan sebagai berikut: dan

4.1.6 Tahap Maksimasi

  Tahap Maksimasi yaitu menghitung nilai estimasi dari parameter dengan memaksimalkan nilai ekspektasi dari fungsi ln likelihood yang didapatkan pada tahap ekspektasi. Pada tahap ini akan dilakukan iterasi dengan nilai awal hingga berulang kali sampai didapatkan nilai parameter yang didapatkan dari Metode Least Squares. Nilai konvergen. Nilai awal diperoleh berdasarkan persamaan berikut: diperoleh berdasarkan persamaan berikut:

  Sedangkan Nilai estimator dan tidak dapat diperoleh secara langsung. Untuk mempermudah memperoleh nilai estimator dan maka dibuatlah program dengan bantuan software Mathematica. Setelah mendapatkan nilai estimator dan selanjutnya diubah menjadi estimator dari distribusi Loglogistik yaitu

  . dengan

4.1.7 Nilai Awal Estimasi

  Nilai awal estimasi yang diperlukan untuk mencari nilai estimator dan diperoleh dari Metode Least Squares. Langkah pertama yang diperlukan adalah mendapatkan fungsi survival dari distribusi Logistik dari persamaan (2.1).

  Setelah mendapatkan fungsi survival maka nilai awal estimasi dapat diperoleh dengan langkah-langkah sebagai berikut: maka Misal maka didapatkan persamaan: Selanjutnya dengan menggunakan Jumlah Kuadrat Galat (JKG) diperoleh:

  Untuk mendapatkan nilai dan pada persamaan dan diperlukan langkah-langkah sebagai berikut: Selanjutnya, persamaan (4.18) dikurangi dengan persamaan (4.19) sehingga diperoleh hasil sebagai berikut: Berdasarkan model (4.15) jika dicari ekspektasi (rata2) dari kedua ruas maka diperoleh Sehingga didapatkan nilai yaitu maka: Nilai estimasi awal yang diperlukan untuk proses iteratif dalam mencari adalah nilai estimator dan yang dinotasikan dan Nilai diperoleh dari perhitungan dengan menggunakan metode Kaplan- Meier.

4.2 Algoritma Program

  Untuk memperoleh nilai estimator dari distribusi Loglogistik, maka digunakan algoritma yang dibuat berdasarkan pembahasan teori-teori yang sudah diperoleh sebelumnya. Berikut ini adalah algoritma yang digunakan untuk membuat program dalam Mathematica :

  1. Menginputkan data sebanyak yang dinotasikan dengan dan skema penyensoran .

  2. Menghitung nilai estimator awal distribusi Logistik berdasarkan OLS menggunakan rumus pada persamaan (4.20) dan (4.21) sehingga diperoleh untuk dan .

  3. Mendefinisikan fungsi dari persamaan (4.11).

  4. Mendefinisikan fungsi dari persamaan (4.12). dengan cara menyelesaikan persamaan

  5. Mendapatkan estimator menggunakan Newton-Raphson. dengan cara menyelesaikan persamaan

  6. Mendapatkan estimator menggunakan Newton-Raphson. dan maka iterasi dihentikan

  7. Jika dan lanjut ke langkah 8, tapi jika nilai tersebut tidak terpenuhi maka kembali ke langkah 5 dengan mengganti .

  8. Menampilkan nilai estimator distribusi Logistik yaitu dan .

  9. Mengubah nilai estimator distribusi Logistik menjadi distribusi .

  Loglogistik dengan 10. Menampilkan nilai estimator distribusi Loglogistik.

4.3 Penerapan Pada Data Tersensor Progressive Tipe II

  Berdasarkan tujuan penyusunan skripsi ini, telah disusun program menggunakan software Mathematica. Berikut ini akan dibahas mengenai penerapan program pada data ilustrasi tersensor progressive Tipe II dengan software Mathematica. berupa waktu yang diperlukan untuk menguraikan isolator zat

  Misalkan cair yang dilakukan pada voltase sebesar 34 KV (Kus dan Kaya, 2006). Data berasal dari pengamatan yang dilakukan terhadap sampel. Pengamatan terhadap sampel dimulai dari start point yaitu ketika zat cair dialiri listrik sebesar

  34 KV. Sehingga zat cair dapat menghantarkan listrik ke zat lain. Pengamatan berhenti pada waktu end point yaitu zat cair tidak dapat menghantarkan listrik lagi. Hal ini disebabkan partikel-partikel yang dapat menghantar listrik pada zat cair tersebut telah habis (berubah bentuk). Jadi data yang diperolehkan dari hasil pengamatan berupa ketahanan zat cair dalam menghantarkan listrik ke zat lain. Karena pada pengamatan semua benda diuji sampai terjadinya kegagalan maka pengamatan tersebut disebut sampel lengkap. Data selengkapnya dapat dilihat pada Lampiran 1.

  Selanjutnya data tersebut diuji dengan menggunakan Probability Plot of

  data pada software Minitab. Hal ini bertujuan untuk mengetahui distribusi dari ke-

  19 data tersebut. Hasil dari uji dengan Probability Plot of data yaitu sebagai berikut

  95 99 Data Waktu Terurainya Isolator Zat Cair pada Tegangan 34 KV Loglogistic - 95% CI AD 0,275 N Scale 0,8522 Loc 1,833 19 P e rc e n t 90 40 50 60 70 80 30 P-Value > 0,250 10

  20 1 5 0,01 0,10 1,00 10,00 100,00 1000,00

data

Gambar 4.1 Plot data waktu terurainya isolator zat cair pada tegangan 34 KV

  Berdasarkan Gambar 4.1, dapat diketahui bahwa nilai p-value dari uji tersebut lebih besar dari 0,250. Oleh karena nilai p-value tersebut lebih besar dari tingkat signifikansi 0,05 maka dapat disimpulkan bahwa data tersebut berdistribusi Loglogistik.

  Pada data ilustrasi akan diadakan penyensoran data menggunakan sampel tersensor progressive tipe II dengan skema penyensoran berdasarkan Kus dan Kaya (2006). Dari skema penyensoran yang telah digunakan maka dapat dijelaskan bahwa

  1. Pada saat terjadi kegagalan yang pertama maka sebanyak dari unit yang survive secara acak dikeluarkan dari pengamatan, begitu juga pada saat kegagalan yang kedua dengan .

2. Pada saat terjadi kegagalan yang ketiga maka sebanyak dari unit yang survive secara acak dikeluarkan dari pengamatan.

  Penelitian ini berlangsung hingga terjadinya kegagalan yang terakhir yaitu pada kegagalan yang kedelapan maka sebanyak dari unit yang survive secara acak dikeluarkan dari pengamatan.

  Sehingga diperoleh data dari penyensoran sebanyak data. Data selengkapnya dapat dilihat pada Lampiran 2.

  Selanjutnya data tersensor progressive tipe II diuji dengan menggunakan

  Probability Plot of data pada software Minitab. Hal ini bertujuan untuk

  mengetahui distribusi dari data tersensor progressive tipe II tersebut. Hasil dari uji dengan Probability Plot of data dengan data yaitu sebagai berikut

  

Data Tersensor

P e rc e n t

1000,00 100,00 10,00 1,00 0,10 0,01