Jurnal Konvergensi Vol. 4, No. 1, April, 2014
Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti
31
b. Bentuk diatas dapat juga dituliskan sebagai :
; = exp[ + + ]
dengan
= exp[ ]
dan
= exp[ ]
c. Jika
=
maka dikatakan distribusi tersebut berbentuk kanonik dan disebut parameter natural
Jika terdapat parameter lain selain , maka parameter tersebut dianggap sebagai parameter pengganggu nuissance parameter dan nilainya dianggap telah diketahui.
Dalam keluarga eksponensial, proporsinal secara langsung ke N dan terdapat
hubungan satu-satu antara parameter dengan statistik cukup, sehingga penghitungan ukuran sampel eksak tersebut mudah untuk keluarga ini. Berdasarkan teorema 1,
bentuk umum fungsi Negative log normed likelihood untuk satu observasi adalah :
; =
−
+
− Dimana adalah parameter kanonik, circumflex mengindikasikan maksimum
likelihood estimation MLE. Bagaimanapun, lebih sederhana untuk bekerja dengan parameter nilai mean
, yang mempunyai y sebagai estimasi maksimum likelihoodnya.
Parameter kanonik adalah fungsi dari mean, katakan . Selanjutnya, untuk N
observasi, Negative log normed likelihood adalah :
=
− ̂
+ +
̂ ̂
− ̂
Dengan : ̂
= =
Pada keadaan dimana kedua model sama buruknya kasus kedua dengan Negative log normed likelihood lebih besar daripada
untuk kedua model sehingga kedua model tersebut tidak dapat diterima, maka dapat ditetapkan
sama dengan dan
. Lebih lanjut dengan menyamakan persamaan untuk model
dan untuk
model diperoleh nilai :
̂
=
sehingga dapat dihitung nilai :
=
{ }
4.1. Penentuan Ukuran Sampel Eksak pada Distribusi Normal
Definisi 4. [Lungan, 2006]
Jika Y merupakan variabel random normal dengan mean dan variansi maka
fungsi densitas probabilitas Y adalah :
; = 1
√
2
− ∞ ∞
bentuk diatas dapat ditulis dalam bentuk kanonik :
; = exp
−
2 +
−
2
−
1 2
log[ 2 ]
dengan parameter natural .
Jurnal Konvergensi Vol. 4, No. 1, April, 2014
Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti
32
Lebih lanjut, Misalkan kasus klasik distribusi normal dengan variansi σ tak
diketahui. Penentuan ukuran sampel eksak pada distribusi ini digunakan untuk dapat membandingkan dua model dengan mean yang berbeda. Misalkan model dengan
mean µ dan µ . Karena fungsi likelihood untuk mean dari distribusi normal simetris maka :
=
̂
=
sehingga diperoleh
=
4.2. Penentuan Ukuran Sampel Eksak pada Distribusi Poisson
Definisi 5. [Montgomery, 2003]
Variabel random Y dikatakan berdistribusi Poisson jika fungsi probabilitas massa variabel random tersebut adalah :
; = = 0, 1, 2, …..
bentuk ini dapat ditulis dalam bentuk kanonik sebagai berikut :
; = exp[ log
− −
log ]
dengan
log
sebagai parameter natural. Tujuan menentukan ukuran sampel eksak pada distribusi poisson adalah agar
diperoleh ukuran sampel yang menjadikan interval konfidensi sekitar mean dari distribusi poisson mempunyai panjang
∆. Karena interval tersebut tidak akan simetrik, maka definisikan interval tersebut sebagai
̂ −
,
̂ −
+
∆ , dimana
̂ akan tergantung pada sampel,
∆ adalah lebar interval yang diinginkan dan c adalah konstanta yang tidak diketahui untuk ketidaksimetrisan dan tergantung pada nilai
̂. Telah diketahui rumus umum Negatif log normed likelihood adalah :
=
− ̂
+ +
̂ ̂ −
̂ dan distribusi Poisson bentuk kanonik :
; = exp[ log
− −
log ]
diperoleh ukuran sampel
=
̂
log
̂ −
log
∆
∆
−
1 +
∆
∆
Persamaan ini dapat diplot untuk beragam nilai-nilai yang mungkin dari ̂.
4.3.
Penentuan Ukuran Sampel Eksak pada Dua Distribusi Binomial
Definisi 6. [Montgomery, 2003]
Suatu eksperimen random dengan n percobaan Bernoulli dimana a.
Percobaan tersebut independen b.
Hasil percobaan hanya dua yaitu sukses atau gagal
Jurnal Konvergensi Vol. 4, No. 1, April, 2014
Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti
33
c. Probabilitas sukses dinotasikan
, sama untuk semua percobaan
Variabel random Y yaitu jumlah sukses dalam n percobaan mempunyai distribusi binomial dengan fungsi probabilitas massa adalah
; =
1
− dengan y = 0,1,2,...,n dan
1
bentuk ini dapat ditulis dalam bentuk kanonik sebagai berikut :
; = exp
log
−
log 1
−
+ log 1
−
+ log
dengan parameter natural
log
. Penentuan ukuran sampel eksak pada dua distribusi binomial ini dilakukan untuk
dapat menguji perbedaan antara dua distribusi binomial dan ingin dideteksi sehubungan dengan log odds ratio kedua model. Misalkan perbedaan antara dua
distribusi binomial, sebagaimana digambarkan dengan suatu tabel kontingensi 2 x 2. Anggap sampel tersebut akan dipilih sedemikian hingga variabel penjelasnya
berjumlah sama yaitu N2 dalam masing-masing kategori. Misalkan fungsi distribusi binomial bentuk kanonik sebagai berikut :
; = exp
log 1
−
+ log 1
−
+ log
i = 1, 2 diperoleh
= log 1
−
maka = log
1
− sehingga
{ } =
−
log 1
− dan
{ } =
−
log 1
− dengan tabel kontingensi 2 x 2 sebagai berikut :
Tabel 1. Tabel Kontingensi 2 x 2 untuk sel frekuensi B
A A1
A2 Total
B1 Y1
N2-Y1 N2
B2 Y2
N2-Y2 N2
Tabel 2. Tabel Kontingensi 2 x 2 untuk sel probabilitas B
A A1
A2 Total
Jurnal Konvergensi Vol. 4, No. 1, April, 2014
Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti
34
B1 1 -
1 B2
1 - 1
dengan
~ , ; = 1, 2
. Jika dapat ditemukan perbedaan dalam distribusi responsi yang sesuai dengan nilai log odds ratio misalkan sebesar
2
, yang kemudian dibandingkan dengan model tanpa perbedaan dengan nilai log dds ratio 0.
Karenanya, model yang akan digunakan adalah model logistik biner yang merupakan model yang multiplikatif dalam rasio atau odds probabilitas tetapi linear
dalam log odds. Modelnya adalah sebagai berikut :
log 1
−
= +
dengan
= 2
dimana adalah jumlah sukses dalam kategori i, sebagai
nilai yang ditentukan sama untuk kedua kategori dan adalah nilai yang
ditentukan khusus untuk masing-masing kategori. Persamaan diatas dapat diselesaikan untuk memperoleh probabilitas sebagai berikut :
= exp +
1 + exp + ; = 1, 2
Diasumsikan adalah mean diperoleh :
= log
+ log 2
= +
+ + 2
diperoleh :
=
− , dari yang diketahui, log odds rasio sama dengan
2
, karenanya diperoleh :
log 1
−
1
−
= 2 log
1
− −
log 1
−
= 2 +
−
+ = 2
diperoleh
=
, sehingga dapat dinyatakan
=
dan
=
− . Negatif log normed likelihood untuk suatu model dengan selisih
2
adalah :
=
−
2 +
−
2 +
+ 2
log[ {1 + exp +
}{1 + exp
−
}] +
2 log
2 +
2 1
−
log 2
1
−
+ 2
log 2
+ 2
1
−
log 2
1
− −
log 2
Persamaani dari sisi lain, karena yang ingin diselidiki adalah perbedaan dalam dua distribusi
binomial, maka untuk kasus dimana tidak terdapat perbedaan model-modelnya dapat dinyatakan bahwa
Jurnal Konvergensi Vol. 4, No. 1, April, 2014
Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti
35
log =
dan
log = +
hal ini sama dengan menyatakan bahwa
= 0
dan
=
, sehingga dengan asumsi-asumsi sebelumnya untuk model yang tidak mempunyai perbedaan diperoleh
= = 0
sehingga
=
−
2 +
+ 2
log[ {1 + exp + }{1 + exp }]
+ 2
log 2
+ 2
1
−
log 2
1
−
+ 2
log 2
+ 2
1
−
log 2
1
− −
log 2
Persamaanii karena Negatif log normed likelihood untuk model dengan perbedaan dan untuk
model tanpa perbedaan diasumsikan sama, persamaan i dan ii dapat disamakan sehingga diperoleh :
2
−
=
−
= 2
log {1 + exp +
}{1 + exp
−
} {1 + exp }
Persamaan iii lebih lanjut, dari penguraian persamaan ii diperoleh:
= 2
log 1 + exp
{1 + exp + }{1 + exp +
} + [
+ ]
= 2
log
{ }{
}
+ [ +
]
Suatu aproksimasi sederhana yang baik diperoleh dengan pengasumsian pada kasus terburuk yaitu
α ditentukan sebagai setengah dari nilai α, sehingga diperoleh ukuran sampel sebagai berikut :
= 2
log + [
+ ]
= 2
log +
−
Jurnal Konvergensi Vol. 4, No. 1, April, 2014
Algoritma Penentuan Ukuran Sampel Eksak Untuk Distribusi … Dian Eka Wijayanti
36
5. Algoritma Penentuan Ukuran Sampel Eksak untuk Pemilihan Model