Rumusan Masalah Batasan Masalah Tujuan dan Manfaat Penulisan Tinjauan Pustaka

commit to user 2 Proses Markov dikatakan sebagai rantai Markov jika ruang statenya diskrit. Probabilitas bersyarat ] [ 1 i X j X P n n = = - biasa disebut dengan probabilitas transisi rantai Markov. Jika probabilitas transisi tidak diketahui atau probabilitas transisi tersebut merupakan fungsi dari parameter yang tidak diketahui maka perlu untuk membuat inferensi tentang probabilitas transisi dari data empiris. Dalam statistik, inferensi adalah proses penarikan kesimpulan tentang distribusi populasi berdasarkan distribusi sampel yang diambil dari populasi tersebut. Salah satu cabang penting dari inferensi statistik adalah estimasi pendugaan yang terdiri dari dua macam yaitu estimasi titik dan estimasi interval. Tujuan estimasi titik adalah menduga nilai parameter yang tidak diketahui. Estimasi titik sendiri tidak memberikan informasi akurasinya. Estimasi interval diperlukan untuk mengetahui seberapa dekat atau seberapa besar harapan estimasi titik itu mendekati nilai yang sebenarnya. Selain itu, estimasi interval sendiri bisa digunakan dalam proses pengambilan kesimpulan. Dalam banyak literatur, kebanyakan para peneliti mengunakan metode maksimum likelihood untuk mengestimasi probabilitas transisi rantai markov sebagaimana dalam Spring 2009. Sulistyowati 2003 telah membahas tentang estimasi titik dan uji hipotesis dalam rantai Markov. Oleh karena itu, dalam skripsi ini akan dibahas mengenai interval konfidensi untuk probabilitas transisi rantai Markov dan dikaji ulang tentang pendugaan probabilitas transisi rantai Markov dengan metode maksimum likelihood.

1.2 Rumusan Masalah

Permasalahan yang dibahas dalam penulisan skripsi ini adalah bagaimana menentukan interval konfidensi untuk probabilitas transisi rantai Markov diskrit. commit to user 3

1.3 Batasan Masalah

Berdasarkan pada rumusan masalah di atas, pembahasan dalam skripsi ini dibatasi pada penerapan metode maksimum likelihood dalam mengestimasi probabilitas transisi rantai Markov orde satu dengan ruang state berhingga diskrit.

1.4 Tujuan dan Manfaat Penulisan

Tujuan dari penulisan skripsi ini adalah mampu menyajikan interval konfidensi untuk probabilitas transisi rantai Markov diskrit. Dengan tercapainya tujuan ini, penulisan skripsi ini diharapkan dapat menambah pengetahuan tentang inferensi statistik pada rantai Markov khususnya pada estimasi interval konfidensi probabilitas transisinya. commit to user 4

BAB II LANDASAN TEORI

2.1 Tinjauan Pustaka

Untuk mendukung pembahasan dalam skripsi ini dibutuhkan teori-teori dasar berikut. 2.1.1. Ruang Sampel, Kejadian, Probabilitas dan Variabel Random Beberapa definisi yang berkaitan dengan ruang sampel, kejadian, probabilitas dan variabel random berikut diambil dari Bain dan Engelhardt 1992. Definisi 2.1.1 Ruang sampel S dari suatu percobaan adalah himpunan semua hasil outcome yang mungkin dari percobaan tersebut. Definisi 2.1.2 Suatu kejadian event adalah sembarang subset dari hasil yang termuat dalam ruang sampel. Definisi 2.1.3 Probabilitas adalah kemungkinan terjadinya suatu peristiwa diantara keseluruhan peristiwa yang mungkin terjadi. Definisi 2.1.4 Variabel random X adalah suatu fungsi yang memetakan setiap hasil yang mungkin e dalam ruang sampel S dengan bilangan real sedemikian sehingga Xe = x, x Î R. Definisi 2.1.5 Jika himpunan semua nilai yang mungkin dari variabel random X merupakan himpunan terhitung , , … , atau , , … maka variabel random X disebut variabel random diskrit. Fungsi = [ = ] untuk x = , , … disebut fungsi kepadatan probabilitas diskrit. Definisi 2.1.6 Fungsi distribusi kumulatif dari variabel random X didefinisikan untuk sembarang bilangan real dengan = [ ≤ ]. Definisi 2.1.7 Variabel random X disebut variabel random kontinu jika fungsi distribusi kumulatifnya bisa dinyatakan sebagai = . Definisi 2.1.8 Fungsi kepadatan probabilitas bersama dari variabel random diskrit X = , … , didefinisikan sebagai , , … , = [ = , = , … , = ]. commit to user 5 Definisi 2.1.9 Jika 1 X dan 2 X merupakan variabel random diskrit atau kontinu dengan fungsi kepadatan probabilitas bersama , maka fungsi kepadatan probabilitas bersyarat dari 2 x diberikan 1 X = 1 x didefinisikan sebagai | = , untuk nilai-nilai 1 x sedemikian sehingga 0 dan nol untuk nilai yang lain. Definisi 2.1.10 Jika X variabel random dengan fungsi kepadatan probabilitas x f maka harga harapan expected value dari X didefinisikan sebagai = ∑ jika X diskrit = jika X kontinu Definisi 2.1.11 Variansi dari variabel random X diberikan oleh l = [ − ] Definisi 2.1.12 Kovariansi dari pasangan variabel random X dan Y didefinisikan dengan ] [ , y x Y X E Y X Cov m m - - = Definisi 2.1.13 Jika X variabel random maka tX X e E t M = Disebut fungsi pembangkit momen dari X jika harga harapan ini ada untuk semua nilai t dalam suatu interval h t h - , untuk suatu h 0. 2.1.2. Distribusi Multinomial Definisi 2.1.10 Lebanon, 2006 Variabel random k X X X ,..., , 2 1 mempunyai distribusi multinomial dengan parameter n dan k p p p ,..., , 2 1 dengan ³ i p , 1 1 = å = k i i p jika mempunyai fungsi kepadatan probabilitas k x k x x k k p p p x x x n x x f ... ... ,..., 2 1 2 1 2 1 1 ÷÷ ø ö çç è æ = jika ³ i x dan n x k i i = å =1 dan nol untuk yang lain, commit to user 6 dengan … = … . Distribusi multinomial digunakan ketika dipunyai sebuah percobaan dengan k kemungkinan hasil, yang masing-masing terjadi dengan probabilitas i p . Percobaaan diulang sebanyak n kali dan k X X X ,..., , 2 1 mengukur jumlah kejadian masing-masing kelas hasil. Karena terdapat n percobaan, maka jumlah keseluruhan hasil adalah n x k i i = å =1 , dan karena probabilitas memperoleh hasil i sebesar i p , maka 1 1 = å = k i i p . 2.1.3. Distribusi Normal, Gamma dan Chi Kuadrat Definisi berikut diambil dari Bain dan Engelhardt 1992. Definisi 2.1.11 Suatu variabel random X mengikuti distribusi normal dengan mean m dan variansi 2 s jika mempunyai fungsi kepadatan probabilitas 2 ] [ 2 2 1 , ; s m s p s m - = x e x f untuk ¥ ¥ - x dengan ¥ ¥ - m dan ¥ s . Notasi yang menyatakan X berdistribusi normal adalah X ~ , 2 s m N . Definisi 2.1.12 Fungsi gamma dinotasikan dengan k G untuk semua k 0, didefinisikan sebagai ò ¥ - - = G 1 dt e t k t k . Definisi 2.1.13 Variabel random X dikatakan berdistribusi gamma dengan parameter k 0 dan q , jika mempunyai fungsi kepadatan probabilitas ïî ï í ì G = - - 1 , ; 1 q q q x k k e x k k x f untuk x 0 untuk x yang lain. Notasi khusus yang menunjukkan X berdistribusi gamma yaitu X ~ GAM k , q . commit to user 7 Definisi 2.1.14 Jika X ~ GAM 2 , 2 v maka variabel X dikatakan berdistribusi 2 c dengan derajat bebas v dinotasikan dengan X ~ 2 c v. Teorema 2.1.1 Jika X ~ 2 c v maka v X Var v X E t t M v x 2 2 1 2 = = - = - Teorema 2.1.2 Jika ~ 2 i i v X c , i = 1,..., n, maka ~ 1 2 1 å å = = = n i i n i i v X Y c . Teorema 2.1.3 Jika 1 , ~ N Z maka 1 ~ 2 2 c Z . Teorema 2.1.4 Teorema Limit Pusat Jika n X X ,.., 1 adalah sampel random dari sebuah distribusi dengan mean m dan variansi 2 s , maka distribusi limit dari s m n n X Z n i i n - = å =1 adalah distribusi normal standar, 1 , ~ N Z Z d n ¾® ¾ untuk ¥ ® n . Definisi 2.1.15 Misalkan ,... , 2 1 Y Y adalah deretan variabel random dengan fungsi distribusi kumulatif ,... , 2 1 y G y G sedemikian sehingga untuk tiap n = 1, 2, ... berlaku ] [ y Y P y G n n £ = . Jika untuk suatu fungsi distribusi kumulatif y G berlaku lim y G y G n n = ¥ ® untuk semua nilai y dan y G kontinu maka ,... , 2 1 Y Y dikatakan konvergen dalam distribusi ke ~ y G Y yang dinotasikan dengan Y Y d n ¾® ¾ . 2.1.4. Metode Maksimum Likelihood Metode maksimum likelihood adalah metode yang cukup sering digunakan untuk menduga nilai parameter. Ide dasar metode ini adalah menggunakan sebuah commit to user 8 nilai dari ruang parameter yang menghasilkan peluang terbesar untuk menduga nilai parameter yang tidak diketahui. Berikut ini adalah beberapa definisi tentang fungsi likelihood dan penduga maksimum likelihood yang dinyatakan oleh Bain dan Engelhardt 1992. Definisi 2.1.16 Fungsi kepadatan probabilitas bersama dari n variabel random n X X ,.., 1 yang diberi nilai n x x ,.., 1 adalah ; ,.., 1 q n x x f dan disebut sebagai fungsi likelihood. Untuk n x x ,.., 1 tetap, fungsi likelihood adalah fungsi dari q yang dinotasikan dengan L q . Jika n X X ,.., 1 adalah sampel random dari ; q x f maka L q = ; ... ; 1 q q n x f x f . Definisi 2.1.17 Misalkan L q = ; ,.., 1 q n x x f , W Î q , merupakan fungsi likelihood. Untuk suatu himpunan pengamatan { n x x ,.., 1 }, nilai qˆ di dalam W yang memaksimumkan L q disebut penduga maksimum likelihood dari q . Jadi, qˆ adalah nilai dari q yang memenuhi ; ,.., 1 q n x x f = ; ,..., 1 q q n x x f maks W Î . 2.1.5. Metode Pengali Lagrange Metode Pengali Lagrange digunakan untuk mencari nilai maksimum atau nilai minimum fungsi fx, y, z terhadap kendala gx, y, z = k. Langkahnya adalah a. Menyelesaikan persamaan Lagrange , , , , z y x g z y x f Ñ = Ñ l konstanta l disebut pengali Lagrange. b. Menghitung f di semua titik x, y, z yang dihasilkan dari langkah a. Nilai yang terbesar adalah nilai maksimum f, sedangkan nilai yang terkecil adalah nilai minimum f. Dawkins, 2007 . commit to user 9 2.1.6. Statistik Cukup Definisi 2.1.18 Bain dan Engelhardt, 1992 Suatu fungsi variabel random yang tidak bergantung pada parameter yang tidak diketahui disebut statistik. Definisi 2.1.19 Bain dan Engelhardt, 1992 Misalkan X = ,.., 1 n X X mempunyai fungsi kepadatan probabilitas bersama ; ,.., 1 q n x x f dan T = ,.., 1 k T T adalah sebuah vektor statistik. T adalah statistik cukup bersama untuk q jika fungsi kepadatan probabilitas bersyarat v f t V tidak bergantung pada q , dengan V merupakan vektor statistik yang lain. Dalam kasus satu dimensi cukup dikatakan bahwa T adalah statistik cukup untuk q . Definisi 2.1.20 Kriteria Faktorisasi Bain dan Engelhardt, 1992 Jika X mempunyai fungsi kepadatan probabilitas bersama ; ,.., 1 q n x x f dan T = ,.., 1 k T T maka k T T ,.., 1 merupakan statistik cukup bersama untuk q jika dan hanya jika ,..., ; ; ,.., 1 1 n n x x h t g x x f q q = dengan gt; q tidak bergantung pada n x x ,.., 1 dan h n x x ,.., 1 tidak mengandung q. Menurut Laurence dan Chein-I Chang 1993, dalam model rantai Markov bisa ditunjukkan bahwa state awal dan jumlah transisi membentuk suatu statistik cukup dengan kriteria faktorisasi. 2.1.7. Interval Konfidensi untuk q Definisi 2.1.21 Bain dan Engelhardt, 1992 Misalkan n X X ,.., 1 mempunyai fungsi kepadatan probabilitas bersama ; ,.., 1 q n x x f . Sedangkan L dan U adalah statistik dengan ,.., 1 n X X l L = dan ,.., 1 n X X u U = . Jika diketahui suatu data percobaan n x x ,.., 1 , maka dipunyai nilai pengamatan ,.., 1 n x x l dan ,.., 1 n x x u . Interval ,.., 1 n x x l , ,.., 1 n x x u dikatakan sebagai interval konfidensi 100 a - 1 untuk q jika commit to user 10 a q - = 1 ] ,.., ,.., [ 1 1 n n X X u X X l P . Nilai pengamatan ,.., 1 n x x l dan ,.., 1 n x x u disebut batas konfidensi bawah dan atas. Untuk menentukan interval konfidensi yang memperhitungkan semua parameter digunakan interval konfidensi simultan. Dalam menentukan interval konfidensi simultan, digunakan pertidaksamaan Bonferroni untuk mempertimbangkan semua parameter secara simultan. Teknik perhitungan interval konfidensi ini diperkenalkan oleh Goodman Petrie, 1998. 2.1.8. Rantai Markov Diskrit Menurut Taylor dan Karlin 1994, proses Markov adalah proses stokastik yang mempunyai sifat jika diberikan nilai n X , nilai 1 + n X tidak dipengaruhi oleh nilai m X , untuk m n. Secara formal, suatu proses dikatakan proses Markov jika memenuhi sifat Markov yaitu ] , ,..., [ 1 1 1 1 1 i X i X i X j X P n n n n = = = = - - + = } { 1 i X j X P n n = = + . Rantai Markov waktu diskrit adalah proses Markov yang mempunyai ruang state berhingga atau terhitung dan himpunan indeks T = {0, 1, 2,…}. Probabilitas 1 + n X akan berada pada state j dengan syarat n X berada pada state i disebut probabilitas transisi satu langkah yang dinotasikan dengan 1 , + n n ij p . } { 1 1 , i X j X P p n n n n ij = = = + + . Notasi ini menyatakan bahwa secara umum, probabilitas transisi selain merupakan fungsi state awal dan akhir, juga merupakan fungsi selang waktu. Jika probabilitas transisi satu langkah independen terhadap variabel waktu n, maka dikatakan rantai Markov mempunyai probabilitas transisi stasioner, sehingga 1 , + n n ij p = ij p , dengan ij p adalah probabilitas bersyarat proses akan bergerak dari state i ke state j. Untuk selanjutnya probabilitas transisi ini dinyatakan dengan bentuk matriks berikut. commit to user 11 P = ú ú ú ú û ù ê ê ê ê ë é rr r r r r p p p p p p p p p 2 1 2 22 21 1 12 11 dengan ³ ij p , 1 1 = å = r j ij p i, j = 1,2,…,r. Selain probabilitas transisi, rantai Markov juga ditentukan dengan distribusi probabilitasnya distribusi awal. Misalkan i p i X P = = ] [ . Dengan definisi probabilitas bersyarat diperoleh ] ,..., , [ 1 1 n n i X i X i X P = = = = ] ,..., , [ 1 1 1 1 - - = = = n n i X i X i X P ´ ] ,..., , [ 1 1 1 1 - - = = = = n n n n i X i X i X i X P . Dari definisi proses Markov, ] ,..., [ 1 1 - - = = = t n n n i X i X i X P = } { 1 1 - - = = n n n n i X i X P . = n n i i P 1 - . Sehingga diperoleh ] ,..., , [ 1 1 n n i X i X i X P = = = = ] [ i X P = ´ } { 1 1 - - = = n n n n i X i X P ´ … ´ } { 1 1 i X i X P = = = i p 1 i i p ... n n i i p 1 - . Ini menunjukkan bahwa rantai Markov ditentukan oleh probabilitas di awal proses dan probabilitas transisinya. Suatu matriks probabilitas transisi P dikatakan regular jika matriks tersebut dipangkatkan oleh suatu konstanta positif k maka matriks P k seluruh elemennya bernilai positif. Matriks peluang transisi yang demikian serta rantai Markov yang berkaitan dengannya disebut regular. Hal yang penting dalam rantai Markov regular adalah adanya limiting probability distribution p = r p p p ,..., , 2 1 dimana j p 0 untuk j = 1, 2,…, r. dan 1 = å j j p . Secara formal, untuk matriks probabilitas transisi regular terdapat konvergensi, commit to user 12 ] [ lim = = = ¥ ® j n n i X j X P p , untuk j = 1, 2,…, r . Konvergensi di atas menyatakan bahwa dalam jangka waktu yang lama ⟶ ∞, probabilitas proses berada di state j adalah j p , tanpa memperhatikan dimana rantai tersebut berawal. Beberapa definisi tentang sifat state rantai Markov berikut dinyatakan oleh Ross 1983. Definisi 2.1.22 State j dikatakan dapat dicapai dari state i , j i ® , jika terdapat ³ n sedemikian sehingga n ij p . Jika j i ® dan i j ® maka i dan j dikatakan saling berkomunikasi, ditulis j i « . Suatu rantai Markov dikatakan irreducible jika semua state-nya saling berkomunikasi satu sama lain. Definisi 2.1.23 Untuk sebarang i dan j, n ij f menyatakan probabilitas dari state i pertama kali tiba di j dalam n langkah, yang dinyatakan sebagai } 1 ,..., 2 , 1 , , Pr{ i X n k j X j X f k n n ij = - = ¹ = = . Definisi 2.1.24 Suatu state i dikatakan recurrent jika 1 = ii f probabilitas bahwa i akan kembali ke i adalah 1 sedangkan state i dikatakan non-recurrent atau transient jika 1 ii f .

2.2 Kerangka Pemikiran