PERBANDINGAN UJI KENORMALAN PADA KATEGORI FUNGSI DISTRIBUSI EMPIRIS MENGGUNAKAN METODE SIMULASI MONTE CARLO

PADA KATEGORI FUNGSI DISTRIBUSI EMPIRIS MENGGUNAKAN METODE SIMULASI MONTE CARLO

oleh ANNA ZAMMADUITA M0109010

SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA

2013

commit to user

commit to user

ABSTRAK

Anna Zammaduita, 2013. PERBANDINGAN UJI KENORMALAN PADA KATEGORI FUNGSI DISTRIBUSI EMPIRIS MENGGUNAKAN METODE SIMULASI MONTE CARLO. Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Sebelas Maret.

Uji kenormalan berdasarkan pada fungsi distribusi empiris ada empat yai- tu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling. Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu un- tuk dibandingkan. Perbandingan uji-uji tersebut didasarkan pada kekuatan uji

masing-masing. Kekuatan uji merupakan besarnya probabilitas menolak H 0 ke- tika H 0 salah. Dengan melakukan simulasi Monte Carlo terhadap distribusi yang

tidak normal, dapat diperoleh banyaknya H 0 yang ditolak.

Tujuan penelitian ini adalah memperoleh perbandingan uji kenormalan pa-

da ketegori fungsi distribusi empiris. Berdasarkan hasil simulasi Monte Car- lo, urutan kepekaan uji kenormalan pada kategori fungsi distribusi empiris da- ri yang tertinggi adalah uji Anderson-Darling, Cramer-von Mises, Kuiper, dan Kolmogorov-Smirnov. Ini berarti uji Anderson-Darling paling peka dalam men- deteksi ketidaknormalan.

Kata kunci : uji Kolmogorov-Smirnov, uji Kuiper, uji Cramer-von Mises, uji Anderson-Darling, fungsi distribusi empiris.

commit to user

Anna Zammaduita, 2013. A COMPARISON OF NORMALITY TEST ON EMPIRICAL DISTRIBUTION FUNCTION CATEGORIES USING MONTE CARLO SIMULATION METHOD. Faculty of Mathematics and Natural Scien- ces, Sebelas Maret University.

There are four normality tests based on empirical distribution function. These are Kolmogorov Smirnov test, Kuiper test, Cramer-von Mises test, and Anderson-Darling test which have different test statistics. Thus, some tests have different conclusions. Therefore, in this research, the four tests are compared. The comparison of the tests is based on the power of each test. The power of

the test is the probability for rejecting H 0 when H 0 is false. Using Monte Carlo

simulation to the non-normal distribution, it can be acquired the number of H 0 which is rejected.

The objective of this research is to obtain the comparison of normality test on the empirical distribution function categories. Based on the results of Monte Carlo simulations, the order of the sensitivity tests of normality on the empiri- cal distribution function categories from the most sensitive is Anderson-Darling, Cramer-von Mises, Kuiper, and the Kolmogorov-Smirnov. It can be concluded that Anderson-Darling test is the most sensitive normality test in detecting the non-normality.

Key words : Kolmogorov-Smirnov test, Kuiper test, Cramer-von Mises test, Anderson-Darling test, empirical distribution function.

commit to user

MOTO

Sesungguhnya sesudah kesulitan itu ada kemudahan (Q.S. Al Insyirah : 6)

Selalu ada jalan keluar dari setiap masalah selama ada usaha dan doa

commit to user

PERSEMBAHAN

Sebuah karya sederhana ini saya persembahkan untuk Ibu, Bapak, dan Kakak sebagai wujud atas doa, semangat, keringat, dan pengorbanan yang diberikan.

commit to user

KATA PENGANTAR

Segala puji dan syukur penulis panjatkan kepada Allah SWT yang telah me- limpahkan rahmat dan karunia-Nya sehingga penulis dapat menyelesaikan skripsi ini. Selain itu, penulis juga mengucapkan terima kasih kepada Bapak Drs. Sugi- yanto, M.Si. selaku Dosen Pembimbing I dan Ibu Dra. Purnami Widyaningsih, M.App.Sc. selaku Dosen Pembimbing II atas bimbingannya dalam penyusunan skripsi ini.

Semoga skripsi ini dapat bermanfaat. Surakarta, Maret 2013

Penulis

commit to user

Daftar Isi

ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii ABSTRACT ................................ iv MOTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

v PERSEMBAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . . vii DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ix DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi DAFTAR GAMBAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii

I PENDAHULUAN

1.1 Latar Belakang Masalah . . . . . . . . . . . . . . . . . . . . . . .

1.2 Perumusan Masalah .........................

1.3 Batasan Masalah . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.4 Tujuan Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.5 Manfaat Penelitian . . . . . . . . . . . . . . . . . . . . . . . . . .

II LANDASAN TEORI

2.1 Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2 Teori-Teori Penunjang . . . . . . . . . . . . . . . . . . . . . . . .

2.2.1 Konsep Dasar Statistika . . . . . . . . . . . . . . . . . . .

2.2.2 Distribusi Probabilitas Kontinu Khusus . . . . . . . . . . .

2.2.3 Fungsi Distribusi Empiris . . . . . . . . . . . . . . . . . . 11

2.2.4 Uji Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2.5 Uji Kenormalan . . . . . . . . . . . . . . . . . . . . . . . . 12

commit to user

2.2.6 Uji Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . 14

2.2.7 Uji Kuiper . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.8 Uji Cramer-von Mises . . . . . . . . . . . . . . . . . . . . 15

2.2.9 Uji Anderson-Darling . . . . . . . . . . . . . . . . . . . . . 16

2.2.10 Simulasi Monte Carlo . . . . . . . . . . . . . . . . . . . . . 17

2.3 Kerangka Pemikiran . . . . . . . . . . . . . . . . . . . . . . . . . 18

III METODE PENELITIAN

19

IV PEMBAHASAN

22

4.1 Prosedur Pengujian . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4.2 Perbedaan Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . 26

4.3 Simulasi Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.3.1 Sampel Berdistribusi Eksponensial . . . . . . . . . . . . . 35

4.3.2 Sampel Berdistribusi Chi-Kuadrat . . . . . . . . . . . . . . 35

4.3.3 Sampel Berdistribusi Gamma . . . . . . . . . . . . . . . . 39

4.3.4 Sampel Berdistribusi Beta . . . . . . . . . . . . . . . . . . 42

4.3.5 Sampel Berdistribusi Uniform . . . . . . . . . . . . . . . . 42

V PENUTUP

48

5.1 Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.2 Saran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 DAFTAR PUSTAKA

49 LAMPIRAN

52

commit to user

Daftar Tabel

2.1 Persentase dari sampel yang dapat ditolak untuk masing-masing uji kenormalan dengan ukuran sampel berbeda ..........

2.2 Nilai kritis D ∗ ............................. 14

2.3 Nilai kritis V ∗ ............................. 15

2.4 Nilai kritis W 2 ∗ ............................ 16

2.5 Nilai kritis A 2 ∗ ............................ 17

4.1 Data bangkitan pertama . . . . . . . . . . . . . . . . . . . . . . . 27

4.2 Data terurut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.3 Perhitungan D ∗ ............................ 28

4.4 Perhitungan W 2 ∗ ........................... 30

4.5 Perhitungan A 2 ∗ ............................ 31

4.6 Data bangkitan kedua . . . . . . . . . . . . . . . . . . . . . . . . 31

4.7 Banyaknya menolak H 0 untuk masing-masing uji kenormalan de- ngan ukuran sampel berbeda beserta persentasenya dari sampel berdistribusi eksponensial . . . . . . . . . . . . . . . . . . . . . . 36

4.8 Banyaknya menolak H 0 untuk masing-masing uji kenormalan de- ngan ukuran sampel berbeda beserta persentasenya dari sampel berdistribusi chi-kuadrat . . . . . . . . . . . . . . . . . . . . . . . 38

4.9 Banyaknya menolak H 0 untuk masing-masing uji kenormalan de- ngan ukuran sampel berbeda beserta persentasenya dari sampel berdistribusi gamma . . . . . . . . . . . . . . . . . . . . . . . . . 40

commit to user

4.10 Banyaknya menolak H 0 untuk masing-masing uji kenormalan de- ngan ukuran sampel berbeda beserta persentasenya dari sampel berdistribusi beta .......................... 43

4.11 Banyaknya menolak H 0 untuk masing-masing uji kenormalan de- ngan ukuran sampel berbeda beserta persentasenya dari sampel berdistribusi uniform . . . . . . . . . . . . . . . . . . . . . . . . . 46

commit to user

Daftar Gambar

2.1 Kurva normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2 Fungsi distribusi empiris dan fungsi distribusi kumulatif normal . 13

3.1 Diagram alir simulasi ........................ 21

4.1 Persentase menolak H 0 dari sampel berdistribusi eksponensial de- ngan parameter θ = 7 untuk n = 10, 20, ..., 100 .......... 37

4.2 Persentase menolak H 0 dari sampel berdistribusi chi-kuadrat de- ngan derajat bebas ν = 3 untuk n = 10, 20, ..., 100 ........ 39

4.3 Persentase menolak H 0 dari sampel berdistribusi gamma dengan parameter θ = 3 dan κ = 5 untuk n = 10, 20, ..., 100 . . . . . . . . 41

4.4 Persentase menolak H 0 dari sampel berdistribusi beta dengan pa- rameter a = 3 dan b = 1 untuk n = 10, 20, ..., 100 . . . . . . . . . 44

4.5 Persentase menolak H 0 dari sampel berdistribusi uniform dengan parameter interval a = 3 dan b = −3 untuk n = 10, 20, ..., 100 . . 45

commit to user

Bab I PENDAHULUAN

1.1 Latar Belakang Masalah

Menurut Supranto [22], statistika adalah ilmu yang mempelajari cara pe- ngumpulan, pengolahan, penyajian, dan analisis data agar menghasilkan suatu informasi yang berguna dan mudah dipahami. McClave [14] mengemukakan ada dua macam statistika yaitu statistika deskriptif dan statistika inferensi. Statistika deskriptif membahas metode pengumpulan, penyajian, dan pengukuran pemusat- an serta penyebaran suatu data. Sementara itu, statistika inferensi membahas mengenai cara menganalisis data serta mengambil kesimpulan yang berkaitan dengan estimasi parameter dan pengujian hipotesis.

Statistika inferensi dibagi dalam dua kelompok yaitu statistika parametrik dan statistika nonparametrik. Statistika parametrik bergantung pada asumsi- asumsi tertentu. Dalam berbagai permasalahan, terdapat satu asumsi yang tetap yaitu sampel acak berasal dari populasi berdistribusi normal (kenormalan data). Misal pada uji t dan analisis variansi yang menggunakan asumsi kenormalan data. Sebaliknya, statistika nonparametrik tidak bergantung pada asumsi-asumsi tertentu (Daniel [8]).

Razali dan Wah [15] menunjukkan ada dua cara untuk melihat kenormalan data yaitu secara visual dan uji statistik. Kenormalan data secara visual dapat ditampilkan dengan histogram dan plot probabilitas normal tetapi hasilnya ber- sifat subjektif sehingga diberikan cara dengan uji statistik yang bersifat objektif dalam memberikan kesimpulan. Uji statistik ini disebut uji kenormalan.

Uji kenormalan menurut Arshad dkk. [4] ada empat kategori yaitu uji chi-kuadrat, teknik momen rasio, uji berdasarkan korelasi, dan uji berdasarkan fungsi distribusi empiris. Dalam software statistika seperti Minitab, SPSS, dan R,

commit to user

beberapa uji kenormalan termasuk dalam kategori fungsi distribusi empiris. Uji berdasarkan fungsi distribusi empiris melibatkan data empiris (data yang berasal dari pengamatan).

Uji kenormalan pada kategori fungsi distribusi empiris menurut Stephens [18] merupakan uji yang didasarkan pada perbandingan antara fungsi distribusi empiris dan yang dihipotesiskan. Thode [24] menyatakan uji kenormalan pa-

da kategori fungsi distribusi empiris ada empat macam yaitu uji Kolmogorov- Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling. Statistik uji dari uji Kolmogorov-Smirnov dan Kuiper menggunakan jarak maksimum antara fungsi distribusi empiris dan yang dihipotesiskan. Sementara itu, statistik uji Cramer- von Mises dan Anderson-Darling menggunakan kuadrat selisih antara fungsi dis- tribusi empiris dan yang dihipotesiskan dengan pembobotan uji masing-masing.

Dengan demikian, keempat uji tersebut memiliki perumusan statistik uji yang berbeda. Perumusan statistik uji yang berbeda ini memungkinkan adanya perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk diban- dingkan. Pernyataan tersebut dikuatkan oleh Razali dan Wah [15] yang meng- atakan bahwa antara uji kenormalan yang satu dengan yang lain menghasilkan

kesimpulan yang berbeda. Beberapa uji menolak hipotesis nol (H 0 ) sedangkan uji yang lain gagal menolak H 0 dengan H 0 adalah sampel acak berasal dari populasi berdistribusi normal. Conover [7] menyatakan bahwa uji-uji statistik dapat dibandingkan berdasar- kan kekuatan uji masing-masing. Kekuatan uji merupakan besarnya probabilitas

menolak H 0 ketika H 0 salah. Selain berdasarkan kekuatan uji, beberapa uji sta-

tistik juga dapat dibandingkan dengan melihat kepekaan dari masing-masing uji

dalam menolak H 0 ketika H 0 salah. Untuk mengetahui kepekaan uji masing- masing dalam menolak H 0 ketika H 0 salah, dilakukan metode simulasi. Apabila

simulasi melibatkan bilangan acak yang berasal dari distribusi tertentu, maka dapat digunakan simulasi Monte Carlo.

Stephens [18] pada tahun 1974 melakukan penelitian mengenai perbanding- an uji kenormalan pada kategori fungsi distribusi empiris menggunakan metode

commit to user

simulasi Monte Carlo sebanyak 1.000 kali pengulangan dengan ukuran sampel yaitu 10, 20, dan 30. Hasil perbandingan uji-uji tersebut disajikan dalam ben-

tuk tabel persentase menolak H 0 . Penelitian Stephens menyimpulkan bahwa uji

Cramer-von Mises dan Anderson-Darling sama kuat dalam menguji kenormalan data.

Selanjutnya, dalam penelitian ini dilakukan pengembangan terhadap hasil penelitian Stephens yaitu perbandingan uji kenormalan pada ketegori fungsi dis- tribusi empiris menggunakan metode simulasi Monte Carlo dengan 10.000 kali pengulangan dan ukuran sampel 10, 20,...,100. Hasil perbandingan keempat uji

tersebut disajikan dalam bentuk grafik persentase menolak H 0 .

1.2 Perumusan Masalah

Berdasarkan latar belakang masalah, dapat dibuat perumusan masalah yaitu

1. bagaimana perbandingan uji kenormalan pada ketegori fungsi distribusi empiris untuk uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling menggunakan metode simulasi Monte Carlo?

2. dari keempat uji tersebut, uji manakah yang paling peka menolak hipotesis nol ketika hipotesis nol salah?

1.3 Batasan Masalah

Untuk mempermudah dalam pembahasan mengenai uji kenormalan pada kategori fungsi distribusi empiris, penulis membatasi permasalahan yaitu tidak ada nilai pengamatan yang sama dan dikhususkan untuk satu variabel (univariat).

1.4 Tujuan Penelitian

Berdasarkan perumusan masalah, maka tujuan yang ingin dicapai dalam penelitian ini adalah

commit to user

1. memperoleh perbandingan uji kenormalan pada ketegori fungsi distribusi empiris untuk uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling menggunakan metode simulasi Monte Carlo,

2. mendapatkan uji yang paling peka menolak hipotesis nol ketika hipotesis nol salah dari keempat uji tersebut.

1.5 Manfaat Penelitian

Manfaat yang diharapkan dari penelitian ini yaitu apabila para statistika- wan ingin mengetahui data berasal dari populasi yang berdistribusi normal, maka dapat digunakan uji yang paling kuat dari keempat uji tersebut.

commit to user

Bab II LANDASAN TEORI

Pada bagian pertama bab ini diberikan tinjauan pustaka yang berisi kajian- kajian yang pernah dilakukan dan digunakan sebagai dasar dilaksanakannya pe- nelitian. Pada bagian kedua bab ini diberikan teori penunjang yang berisi definisi- definisi dan teorema sebagai dasar untuk memperoleh pembahasan selanjutnya. Pada bagian ketiga dari bab ini disusun kerangka pemikiran yang menjelaskan alur pemikiran penulisan skripsi.

2.1 Tinjauan Pustaka

Stephens [18] pada tahun 1974 melakukan perbandingan uji kenormalan pa-

da kategori fungsi distribusi empiris. Hasil penelitian Stephens disajikan dalam Tabel 2.1. Dalam Tabel 2.1, notasi KS merupakan uji kenormalan mengguna- kan uji Kolmogorov-Smirnov, Ku menggunakan uji Kuiper, CV menggunakan uji Cramer-von Mises, dan AD adalah menggunakan uji Anderson-Darling. Dari tabel tersebut tampak bahwa uji Cramer-von Mises dan Anderson-Darling me- rupakan pasangan terbaik dari uji kenormalan kategori fungsi distribusi empiris yang berarti sama-sama peka dalam mendeteksi ketidaknormalan sedangkan uji Kolmogorov-Smirnov adalah uji yang paling tidak peka.

Razali dan Wah [15] pada tahun 2011 melakukan perbandingan antara uji Kolmogorov-Smirnov, Liliefors, Shapiro-Wilk, dan Anderson-Darling untuk men-

dapatkan uji yang paling peka menolak H 0 ketika H 0 salah. Perbandingan dari

uji tersebut menggunakan metode simulasi Monte Carlo terhadap sampel yang dibangkitkan dari distribusi yang tidak normal. Hasil perbandingan menunjuk-

kan uji Shapiro-Wilk adalah uji yang paling peka menolak H 0 ketika H 0 salah,

kemudian diikuti oleh uji Anderson-Darling, Lilliefors, dan Kolmogorov-Smirnov.

commit to user

Tabel 2.1. Persentase dari sampel yang dapat ditolak untuk masing-masing uji

kenormalan dengan ukuran sampel berbeda Distribusi

n KS V CV AD Distribusi

n KS V CV AD Probabilitas

Probabilitas

Chi-kuadrat 10 51 65 64 67 Lognormal 10 45 53 56 59

Eksponensial 10 30 36 38 41 Laplace

10 13 14 16 16

20 59 71 74 82 20 22 22 26 26

30 76 88 90 95 30 29 31 35 - Uniform

Sebagaimana yang telah dinyatakan oleh Ahad dkk. [1] pada tahun 2011, ke- pekaan uji kenormalan seperti uji Kolmogorov-Smirnov, Anderson-Darling, Cra- mer-von Mises, dan Shapiro-Wilk dapat dievaluasi dalam berbagai distribusi ti- dak normal dan ukuran sampel yang berbeda. Hasil yang diperlihatkan dalam

penelitian Ahad dkk. dari uji yang paling peka menolak H 0 ketika H 0 salah seca-

ra berturut-turut adalah uji Shapiro-Wilk, Anderson-Darling, Cramer-von Mises, dan Kolmogorov-Smirnov.

2.2 Teori-Teori Penunjang

Pada bagian ini dijelaskan definisi, teorema, dan teori yang mendukung dalam mencapai tujuan penelitian.

2.2.1 Konsep Dasar Statistika

Berikut konsep dasar statistika yang berguna dalam menunjang materi dalam pembahasan. Definisi 2.2.1, 2.2.2, 2.2.4, dan 2.2.5 mengacu dari Bain dan Engelhardt [5] sedangkan definisi 2.2.3 dari Conover [7].

commit to user

Definisi 2.2.1. Variabel acak X adalah suatu fungsi yang memetakan setiap hasil

e yang mungkin pada ruang sampel S dengan suatu bilangan real x, sedemikian hingga X(e)=x.

Definisi 2.2.2. Sampel acak berukuran n dari variabel acak X adalah himpunan

variabel acak X 1 ,X 2 , ..., X n yang mempunyai fungsi densitas probabilitas f (x).

Definisi 2.2.3. Fungsi densitas probabilitas dari variabel acak X merupakan fung- si yang memberikan probabilitas X pada suatu nilai x (x suatu bilangan real), yang dinyatakan sebagai

f (x) = P (X = x), x = x 1 ,x 2 , ....

Fungsi densitas probabilitas untuk variabel acak kontinu lebih sering disebut fungsi kepadatan.

Definisi 2.2.4. Fungsi distribusi kumulatif (CDF) dari variabel acak X untuk setiap bilangan real x didefinisikan sebagai

F (x) = P (X ≤ x). Definisi 2.2.5. Variabel acak X disebut variabel acak kontinu jika terdapat fungsi

f(x) yang merupakan fungsi kepadatan dari X maka fungsi distribusi kumulatifnya dapat dinyatakan

F (x) =

−∞

f (u)du.

2.2.2 Distribusi Probabilitas Kontinu Khusus

Menurut Supranto [23], distribusi probabilitas merupakan suatu gambar- an bagaimana nilai-nilai probabilitas didistribusikan terhadap nilai-nilai variabel acaknya. Apabila variabel acak X adalah kontinu, maka distribusi probabilitas- nya disebut distribusi probabilitas kontinu. Berikut ini diberikan lima distribusi probabilitas kontinu yang dipakai dalam simulasi. Teori-teori distribusi probabi- litas berikut mengacu dari Bain dan Engelhardt [5].

1. Distribusi Uniform

commit to user

Apabila variabel acak X kontinu yang mengasumsikan nilai hanya pada suatu interval terbatas, yaitu interval (a, b), dengan fungsi kepadatan kon- stan, maka distribusinya disebut distribusi uniform. Variabel acak X yang berdistribusi uniform memiliki fungsi kepadatan

f (x; a, b) =

1 b−a

,a<x<b

0 , x yang lain

dan dapat dinotasikan dengan X ∼ UNIF (a, b).

2. Distribusi Gamma Variabel acak X kontinu dikatakan mempunyai distribusi gamma dengan

parameter θ > 0 dan κ > 0 jika mempunyai bentuk fungsi kepadatan

f (x; θ, κ) =

θ κ Γ(κ) x κ−1 e − x/θ ,x>0

0 , x yang lain dan dinotasikan sebagai X ∼ GAM(θ, κ).

3. Distribusi Eksponensial Distribusi eksponensial diperoleh dari distribusi gamma dengan θ dan κ = 1

sehingga mempunyai bentuk fungsi kepadatan

f (x; θ) =

θ e − x/θ ,x>0

0 , x yang lain

Variabel acak X yang berdistribusi eksponensial dengan parameter θ dapat dinotasikan sebagai X ∼ EXP (θ).

4. Distribusi Chi-Kuadrat Distribusi chi-kuadrat diperoleh dari distribusi gamma dengan θ = 2 dan

κ= ν 2 sehingga mempunyai bentuk fungsi kepadatan

commit to user

f (x; ν) =

2 ν 2 Γ( ν 2 ) x ν

2 − 1 e −x 2 ,x>0

0 , x yang lain. Variabel acak X yang berdistribusi chi-kuadrat dengan derajat bebas ν

dapat dinotasikan sebagai X ∼ χ 2 (ν).

5. Distribusi Beta Variabel acak X kontinu dikatakan berdistribusi beta dengan parameter

a > 0 dan b > 0 jika mempunyai fungsi kepadatan

f (x; a, b) =

Γ(a+b)

Γ(a)Γ(b) x (a−1) (1 − x) (b−1) ,0<x<1

0 , x yang lain dan dapat dinotasikan sebagai X ∼ BET A(a, b).

Selain kelima distribusi tersebut, terdapat distribusi probabilitas kontinu yang lain yaitu distribusi normal. Variabel acak X yang berdistribusi normal

dengan parameter µ dan σ 2 dapat dinotasikan sebagai X ∼ N(µ, σ 2 ). Menurut Supranto [23], ciri-ciri dari distribusi normal adalah

1. bentuk kurva normal seperti lonceng dan simetris

2. parameter σ menunjukkan lebar dari kurva

3. titik tertinggi dari kurva normal terletak pada nilai rata-rata, median dan modus yang sama

4. kedua ekor kurva memanjang tak terbatas dan tidak pernah memotong sumbu horizontal

5. luas total area di bawah kurva normal sama dengan satu. Fungsi kepadatan dari distribusi normal diberikan dalam rumus matematik

sebagai

f (x) =

2πσ 2

e − 1 2 ( x−µ σ ) 2 , −∞ < x < ∞

commit to user

dengan µ dan σ menunjukkan mean dan deviasi standar (Bain dan Engelhardt [5]). Kurva dari fungsi kepadatan tersebut biasanya disebut kurva normal. Kurva normal ditunjukkan pada Gambar 2.1. Gambar tersebut mengindikasikan bahwa luas area di bawah kurva normal diantara nilai µ ± σ, µ ± 2σ, dan µ ± 3σ secara berturut-turut sebesar 68, 26%, 95, 44%, dan 99,74%.

Gambar 2.1. Kurva normal

Menurut Soejoeti [16], fungsi distribusi kumulatif untuk distribusi normal adalah

Apabila variabel acak X berdistribusi normal dengan mean µ dan deviasi standar σ, maka X dapat ditransformasikan menjadi variabel terstandarisasi

Z=

X−µ σ

yang mempunyai distribusi normal standar (Johnson dan Bhattacharyya [11]). Berikut ini diberikan teorema yang mengacu dari Strait [21].

Teorema 2.2.1. (Teorema Limit Pusat) Misalkan X 1 ,X 2 , ..., X n adalah variabel acak yang independen dan berdistribusi identik dengan mean µ dan variansi σ 2 . Misalkan variabel acak didefinisikan dengan X = (X 1 +X 2 +...+X n )/n. Distribusi dari

X−µ

σ/

mendekati distribusi normal standar untuk n → ∞.

commit to user

2.2.3 Fungsi Distribusi Empiris

Menurut Thode [24], fungsi distribusi empiris diperoleh dari sampel dan disimbolkan dengan F n (x). Definisi berikut mengacu dari Gibbons [10].

Definisi 2.2.6. Misalkan X 1 ,X 2 , ..., X n merupakan sampel acak berukuran n yang

diambil dari sebuah populasi dengan fungsi distribusi kumulatif F (x) bertipe kon- tinu dan X (1) <X (2) < ... < X (n) disusun dalam urutan naik dari X i , maka

susunan inilah yang disebut statistik terurut dari sampel acak X 1 ,X 2 , ..., X n . Misalkan X (1) ,X (2) , ..., X (n) adalah statistik terurut, fungsi distribusi empi- ris didefinisikan sebagai

X (i) ≤x<X (i+1)

1,

X (n) ≤x

dengan i = 1, 2, ..., n − 1.

2.2.4 Uji Hipotesis

Menurut Bain dan Engelhardt [5], uji hipotesis dilakukan untuk menentu- kan kebenaran atau kesalahan dari suatu hipotesis berdasarkan bukti pengamat-

an. Hipotesis ada dua macam yaitu hipotesis nol (H 0 ) dan hipotesis alternatif (H 1 ). Berikut ini diberikan definisi yang berhubungan dengan uji hipotesis, yaitu daerah kritis, statistik uji, tingkat signifikansi dan kekuatan uji. Definisi daerah kritis, tingkat signifikansi, dan kekuatan uji mengacu dari Bain dan Engelhardt [5] sedangkan definisi statistik uji dari Conover [7].

Definisi 2.2.7. Daerah kritis suatu uji merupakan himpunan nilai-nilai statistik uji yang membawa ke penolakan hipotesis nol.

Definisi 2.2.8. Statistik uji adalah statistik yang digunakan untuk membantu membuat kesimpulan dalam suatu uji hipotesis.

Keputusan yang dibuat dalam menolak atau menerima hipotesis mengan- dung ketidakpastian. Ini artinya keputusan yang diperoleh bisa salah dan juga

commit to user

bisa benar. Adanya unsur ketidakpastian ini menyebabkan risiko bagi pembuat keputusan. Besar kecilnya risiko dinyatakan dalam nilai probabilitas.

Tipe kesalahan yang mungkin terjadi dalam uji hipotesis ada dua macam.

1. Kesalahan tipe I Kesalahan tipe I merupakan kesalahan menolak H 0 padahal H 0 benar. Pro-

babilitas kesalahan tipe I dinotasikan sebagai α sehingga dapat dituliskan

P (Kesalahan tipe I)=α.

2. Kesalahan tipe II Kesalahan tipe II adalah kesalahan gagal menolak H 0 padahal H 0 salah.

Probabilitas kesalahan tipe II dinotasikan β sehingga dapat dituliskan

P (Kesalahan tipe II)=β. Definisi 2.2.9. Tingkat signifikansi dari uji hipotesis yang dinotasikan dengan

α adalah probabilitas maksimum menolak H 0 padahal H 0 benar.

Definisi 2.2.10. Kekuatan suatu uji merupakan besarnya probabilitas menolak

H 0 ketika H 0 salah dan dinotasikan sebagai Kekuatan uji = 1-P (Kesalahan tipe II)=1-β.

2.2.5 Uji Kenormalan

Berikut hipotesis dari pengujian kenormalan suatu variabel acak X.

H 0 : Sampel acak berasal dari populasi dengan fungsi distribusi F (x), dimana untuk kasus kenormalan F (x) berdistribusi normal.

H 1 : Sampel acak tidak berasal dari populasi berdistribusi normal.

Distribusi F (x) adalah normal dengan µ dan σ 2 yang tidak diketahui. Oleh

karena itu, µ dan σ 2 diestimasi oleh ¯ x=

dan s 2 =

i (x i − ¯ x) 2 n−1

. Variabel X

commit to user

ditransformasikan menjadi variabel terstandarisasi Z. Karena µ dan σ 2 diestimasi oleh ¯ x dan s 2 , maka variabel terstandarisasi Z dapat dihitung dengan rumus z i = (x i −¯ x)/s dan F (z i ) diperoleh dari tabel normal standar. Menurut Thode [24], uji kenormalan pada kategori fungsi distribusi em- piris didasarkan pada perbandingan antara fungsi distribusi empiris F n (x) dan yang dihipotesiskan F (x). Razali dan Wah [15] menyatakan uji kenormalan pada kategori fungsi distribusi empiris dibagi menjadi 2 kelas.

1. Uji yang didasarkan pada jarak maksimum antara F n (x) dan F (x), yang

termasuk dalam kelas ini adalah uji Kolmogorov-Smirnov dan Kuiper.

2. Uji Kuadratik. Pada kelas ini didasarkan pada kuadrat selisih antara F n (x) dan F (x). Uji

Anderson-Darling dan Cramer-von Mises termasuk dalam uji kuadratik. Gambar 2.2 memberikan ilustrasi umum mengenai grafik fungsi distribusi

empiris F n (x) dengan fungsi distribusi kumulatif normal F (x). Apabila F n (x) sangat berbeda dengan F (x), maka hipotesis nol akan ditolak. Ini berarti sampel acak tidak berasal dari populasi yang berdistribusi normal.

Gambar 2.2. Fungsi distribusi empiris dan fungsi distribusi kumulatif normal

commit to user

2.2.6 Uji Kolmogorov-Smirnov

Uji Kolmogorov-Smirnov digunakan untuk mengetahui apakah suatu sam- pel acak dari populasi kontinu yang tidak diketahui mengikuti suatu distribusi tertentu. Statistik Kolmogorov-Smirnov D didefinisikan sebagai

D = max(D + ,D − )

dimana

D + = max i=1,2,...,n [ i n − F (z i )]

D − = max i=1,2,...,n [F (z i )− i−1 n ]. Selanjutnya, Stephens [18] mendefinisikan modifikasi statistik Kolmogorov-

Smirnov D ∗ sebagai

Pengambilan keputusan dari uji Kolmogorov-Smirnov dapat dilihat dari daerah kritisnya. Daerah kritis untuk uji ini yaitu jika nilai modifikasi Kolmogorov-

Smirnov D ∗ lebih besar dari nilai kritisnya, maka H 0 akan ditolak. Beberapa nilai

kritis untuk modifikasi Kolmogorov-Smirnov D ∗ dengan masing-masing tingkat signifikansi α (Thode [24]) dapat dilihat pada Tabel 2.2.

Tabel 2.2. Nilai kritis D ∗

Nilai Kritis

2.2.7 Uji Kuiper

Kuiper [13] pada tahun 1960 mengusulkan suatu uji kenormalan pada kate- gori fungsi distribusi empiris dengan mengkombinasikan statistik Kolmogorov- Smirnov, yaitu D + dan D − . Uji kenormalan ini dikenal sebagai uji Kuiper.

commit to user

Statistik Kuiper V didefinisikan sebagai

V=D + +D −

dan modifikasi statistik Kuiper V ∗ untuk semua ukuran sampel (Stephens [18]) dinyatakan dengan

Selanjutnya, dalam mengambil keputusan pada pengujian hipotesis kenor- malan data dengan uji ini diberikan suatu daerah kritis yaitu jika nilai modifikasi

statistik Kuiper V ∗ lebih besar dari nilai kritisnya, maka H 0 akan ditolak. Be-

sarnya nilai kritis untuk modifikasi statistik Kuiper V ∗ tampak dalam Tabel 2.3 dengan masing-masing tingkat signifikansi α (Thode [24]).

Tabel 2.3. Nilai kritis V ∗

Nilai Kritis

2.2.8 Uji Cramer-von Mises

Conover [7] menyatakan bahwa uji Cramer-von Mises dikembangkan oleh Cramer dan von Mises. Uji Cramer-von Mises termasuk dalam uji kuadratik. Uji kudratik didefinisikan oleh Anderson dan Darling [2] sebagai

−∞

[F n (x) − F (x)] 2 ψ(F (x))dF (x).

(2.1)

dengan ψ(F (x)) fungsi pembobot. Uji cramer-von mises mempunyai fungsi pem- bobot ψ(F (x)) = 1 sehingga menjadi

−∞

[F n (x) − F (x)] 2 dF (x).

commit to user

Sebagaimana yang telah dinyatakan oleh Anderson dan Darling [3], dibe-

rikan statistik Cramer-von Mises W 2 sebagai

Modifikasi statistik Cramer-von Mises W 2 ∗ yang diusulkan oleh Stephens [18] didefinisikan dengan

Uji Cramer-von Mises memberikan daerah kritis dalam pengujian hipotesis yai- tu dengan membandingkan nilai modifikasi statistik Cramer-von Mises W 2∗ dan nilai kritisnya. Jika nilai modifikasi statistik Cramer-von Mises W 2∗ lebih besar daripada nilai kritis, maka hipotesis nol ditolak. Tabel 2.4 memberikan nilai kri- tis untuk modifikasi statistik Cramer-von Mises W 2∗ pada masing-masing tingkat signifikansi α (Stephens [18]).

Tabel 2.4. Nilai kritis W 2 ∗

Nilai Kritis

2.2.9 Uji Anderson-Darling

Uji Anderson-Darling merupakan suatu uji kenormalan yang termasuk dalam kategori fungsi distribusi empiris. Menurut Razali dan Wah [15], uji Anderson-Darling adalah modifikasi dari uji Cramer-von Mises sehingga juga termasuk dalam kelas kuadratik. Anderson dan Darling [3] menyatakan bahwa pembobot untuk uji ini adalah

ψ(F (x)) =

F (x)[1 − F (x)]

(2.2)

commit to user

Oleh karena itu, dengan mensubstitusikan persamaan (2.2) ke (2.1) diperoleh

−∞

[F n (x) − F (x)] 2

F (x)[1 − F (x)]

dF (x).

Dalam rangka mempermudah perhitungan, diberikan formula untuk statis-

tik Anderson-Darling A 2 (Stephens [19]) dengan

A 2 = −n −

i=1

(2i − 1) [ ln (F (z i ) ) + ln(1 − F (z n+1−i ) ) ] .

Selanjutnya Stephens [20] mendefinisikan modifikasi statistik Anderson-Darling

A 2 ∗ sebagai

Daerah kritis untuk uji Anderson-Darling dalam menentukan H 0 ditolak

atau diterima dengan membandingkan nilai modifikasi statistik Anderson-Darling

A 2 ∗ dan nilai kritisnya. Apabila nilai modifikasi statistik Anderson-Darling A 2 ∗

lebih besar dari nilai kritisnya, maka H 0 akan ditolak. Tabel 2.5 menyajikan ni- lai kritis untuk modifikasi statistik Anderson-Darling A 2 ∗ dengan masing-masing tingkat signifikansi α (Thode [24]).

Tabel 2.5. Nilai kritis A 2 ∗

Nilai Kritis

2.2.10 Simulasi Monte Carlo

Simulasi menurut Banks [6] adalah tiruan dari proses dunia nyata atau sistem. Simulasi menyangkut pembangkitan proses serta pengamatan dari pro- ses untuk menarik kesimpulan dari sistem yang diwakili. Menurut Efron [9], simulasi dilakukan sebanyak 10.000 kali agar meyakinkan bahwa simulasi mampu

commit to user

menjelaskan gambaran yang sebenarnya. Steelee dan Chaseling [17] mengata- kan bahwa probabilitas penolakan hipotesis nol apabila hipotesis nol salah untuk masing-masing uji statistik dapat diestimasi dengan 10.000 sampel acak yang disimulasi.

Salah satu metode yang berperan dalam simulasi adalah metode Monte Car- lo. Menurut Kakiay [12], prinsip kerja dari metode Monte Carlo adalah membang- kitkan bilangan-bilangan acak atau sampel dari suatu variabel acak yang telah diketahui distribusinya. Oleh karena itu, apabila menghendaki model simulasi yang mengikutsertakan bilangan acak dengan distribusi probabilitas yang diketa- hui dan ditentukan, maka menggunakan metode simulasi Monte Carlo. Simulasi Monte Carlo dapat diaplikasikan untuk mengestimasi nilai kritis atau memban- dingkan kepekaan uji (Steelee dan Chaseling [17]).

2.3 Kerangka Pemikiran

Berdasarkan tinjauan pustaka, dapat disusun suatu kerangka pemikiran yang mungkin dalam pembahasan penelitian ini. Dalam menguji kenormalan da- ta, uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling memiliki perbedaan dalam perhitungan statistik uji. Hal ini menyebabkan ada- nya perbedaan kesimpulan diantara keempat uji tersebut. Mengingat pentingnya menguji kenormalan guna menentukan metode yang akan digunakan oleh sta- tistikawan, maka diperlukan suatu uji yang kuat dalam mendeteksi kenormalan data.

Penelitian ini membandingkan keempat uji tersebut berdasarkan kepekaan- nya untuk menolak H 0 ketika H 0 salah. Untuk memperoleh kepekaan uji masing- masing dalam menolak H 0 ketika H 0 salah, dilakukan simulasi sampel acak dari

distribusi yang tidak normal sebanyak 10.000 kali pengulangan. Karena peneliti- an ini menghendaki model simulasi yang melibatkan bilangan acak dari distribusi tertentu, maka menggunakan metode simulasi Monte Carlo. Hasil simulasi terse- but dapat menghasilkan uji yang paling kuat dalam menguji kenormalan data.

commit to user

Bab III METODE PENELITIAN

Metode yang digunakan dalam penelitian ini adalah studi literatur, yaitu dengan cara mempelajari materi karya-karya ilmiah pada jurnal maupun buku referensi. Adapun langkah-langkah yang dilakukan dalam penelitian ini sebagai berikut.

1. Mengidentifikasi pengujian kenormalan dengan uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.

2. Memberikan contoh adanya perbedaan kesimpulan diantara uji Kolmogorov-

Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.

3. Mengkonstruksi metode simulasi Monte Carlo dengan software Matlab 7.1. (a) Membangkitkan bilangan acak yang berdistribusi eksponensial dengan

ukuran sampel sebesar 10 sebanyak 10.000 kali. (b) Setiap data bangkitan pada langkah (a) dihitung statistik ujinya dari

keempat uji tersebut. (c) Jika statistik uji masing-masing lebih besar daripada nilai kritisnya,

maka H 0 ditolak.

(d) Menghitung jumlah H 0 yang ditolak dari 10.000 pengulangan untuk masing-masing uji.

(e) Menghitung persentase menolak H 0 untuk masing-masing uji. Persentase menolak H 0 = jumlah H 0 10000 yang ditolak x100% (f) Mengulangi langkah (a) sampai (e) untuk ukuran sampel yang berva-

riasi yaitu 20, 30,...,100.

commit to user

(g) Membuat grafik antara ukuran sampel yang bervariasi dan persentase

menolak H 0 dari keempat uji tersebut.

(h) Mengulangi langkah (a) sampai (g) untuk distribusi gamma, chi-kuadrat, beta, dan uniform.

4. Membandingkan uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling berdasarkan hasil simulasi. Uji yang memiliki kepekaan tertinggi dalam menolak H 0 ketika H 0 salah merupakan uji yang paling kuat dalam menguji kenormalan data.

Diagram alir dalam mengkonstruksi program simulasi disajikan selengkapnya da- lam Gambar 3.1.

commit to user

Gambar 3.1. Diagram alir simulasi

commit to user

Bab IV PEMBAHASAN

Dalam bagian ini yang dilakukan pertama kali adalah mengidentifikasi pengujian kenormalan menggunakan uji kenormalan berdasarkan kategori fungsi distribusi empiris yaitu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling. Selanjutnya diberikan contoh ketika hasil kesimpulan berbeda antara uji yang satu dengan yang lainnya. Untuk mengatasinya, dilakukan simu- lasi Monte Carlo guna memperoleh kepekaan uji masing-masing dalam menolak

H 0 ketika H 0 salah sehingga diperoleh uji yang kuat dalam menguji kenormalan data.

4.1 Prosedur Pengujian

Pada bagian ini, diberikan langkah-langkah pengujian hipotesis untuk menge- tahui sampel acak berasal dari populasi berdistribusi normal atau tidak.

1. Uji Kolmogorov Smirnov Berikut langkah-langkah pengujian hipotesis untuk kenormalan data meng-

gunakan uji Kolmogorov-Smirnov. (a) Hipotesis

H 0 : sampel acak berasal dari populasi berdistribusi normal

H 1 : sampel acak tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α)

(c) Daerah kritis

H 0 ditolak jika D ∗ > nilai kritis, dimana nilai kritis diperoleh dari Tabel 2.2

commit to user

(d) Statistik uji Statistik uji dari uji Kolmogorov-Smirnov menggunakan jarak

maksimum antara F n (x) dan F (x), yaitu [F n (x)-F (x)] dan [F (x)-

F n (x)]. Untuk F n (x)>F (x), perumusan statistik uji Kolomogorov- Smirnov adalah [F n (x)-F (x)] dan dinotasikan dengan D − . Sebaliknya untuk F n (x)<F (x), statistik uji Kolomogorov-Smirnov dinotasikan de- ngan D − dan dirumuskan dengan [F (x)-F n (x)]. Dari dua hal terse- but diambil nilai yang maksimum. Nilai ini merupakan statistik uji dari uji Kolomogorov-Smirnov yang dinotasikan dengan D. Statistik uji Kolomogorov-Smirnov D tersebut kemudian dimodifikasi oleh Ste- phens [18] dengan metode simulasi Monte Carlo. Berikut perumusan statistik uji Kolomogorov-Smirnov yang dimodifikasi.

D + = max i=1,2,...,n [ i n − F (z i )]

D − = max i=1,2,...,n [F (z i )− i−1 n ]

D = max(D + ,D − ) dimana D ∗ adalah modifikasi statistik Kolmogorov-Smirnov, D adalah

statistik Kolmogorov-Smirnov, n adalah banyaknya sampel acak dan

F (z i ) adalah distribusi probabilitas kumulatif normal standar untuk z i = (x i −¯ x)/s yang diperoleh dari tabel normal standar dengan x i merupakan statistik terurut.

(e) Kesimpulan

2. Uji Kuiper Uji Kuiper mengkombinasikan statistik Kolmogorov-Smirnov, yaitu D + dan

D − . Berikut ini adalah uji hipotesis untuk kenormalan data menggunakan uji Kuiper.

commit to user

(a) Hipotesis

H 0 : sampel acak berasal dari populasi berdistribusi normal

H 1 : sampel acak tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α)

(c) Daerah kritis

H 0 ditolak jika V ∗ > nilai kritis, dimana nilai kritis diperoleh dari Tabel 2.3

(d) Statistik uji Statistik uji Kuiper merupakan kombinasi statistik Kolmogorov- Smirnov, yaitu D + dan D − sehingga uji ini juga menggunakan jarak maksimum antara F n (x) dan F (x). Sama halnya uji Kolmogorov-

Smirnov, statistik uji Kuiper juga dimodifikasi dan dinotasikan dengan

V ∗ . Berikut ini perumusan dari modifikasi statistik Kuiper V ∗ .

(4.2) dengan V = D + +D − . Notasi V menunjukkan statistik Kuiper, V ∗

adalah modifikasi statistik Kuiper dan n adalah banyaknya sampel acak

(e) Kesimpulan

3. Uji Cramer-von Mises Langkah-langkah pengujian hipotesis untuk kenormalan data dengan uji

Cramer-von Mises sebagai berikut. (a) hipotesis

H 0 : sampel acak berasal dari populasi berdistribusi normal

H 1 : sampel acak tidak berasal dari populasi berdistribusi normal (b) tingkat signifikansi (α)

(c) daerah kritis

H 0 ditolak jika W 2 ∗ > nilai kritis, dimana nilai kritis diperoleh dari Tabel 2.4

commit to user

(d) statistik uji Statistik uji Cramer-von Mises menggunakan kuadrat selisih an- tara F n (x) dan F (x) dengan fungsi pembobot ψ(F (x)) = 1, yaitu

n ∫ ∞ −∞ [F n (x) − F (x)] 2 dF (x). Sebagaimana yang telah dinyatakan oleh Anderson dan Darling [?], didefinisikan statistik Cramer-von Mises agar mempermudah dalam perhitungan, yaitu 1 12n + ∑ n i=1 [F (z i )−

2i−1

2n ] 2 . Rumus 2i−1 2n merupakan rata-rata dari i n dan i−1 n . Seperti uji- uji yang sebelumnya, statistik Cramer-von Mises juga dimodifikasi.

Perumusan modifikasi statistik Cramer-von Mises adalah

W 2 ∗ = (1 +

0, 5 n

)W 2 (4.3) dengan

W 2 = 1 12n + ∑ n i=1 [F (z i )− 2i−1 2n ] 2

dimana W 2 ∗ adalah modifikasi statistik Cramer-von Mises, W 2 ada- lah statistik Cramer-von Mises, n adalah banyaknya sampel acak dan

F (z i ) adalah distribusi probabilitas kumulatif normal standar untuk z i = (x i −¯ x)/s yang diperoleh dari tabel normal standar dengan x i merupakan statistik terurut.

(e) kesimpulan

4. Uji Anderson-Darling Berikut ini adalah pengujian hipotesis untuk kenormalan data yang meng-

gunakan uji Anderson-Darling. (a) Hipotesis

H 0 : sampel acak berasal dari populasi berdistribusi normal

H 1 : sampel acak tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α)

(c) Daerah kritis

H 0 ditolak jika A 2 ∗ > nilai kritis, dimana nilai kritis diperoleh dari Tabel 2.5

commit to user

(d) Statistik uji Statistik uji Anderson-Darling didefinisikan dengan

−∞

[F n (x) − F (x)] 2

F (x)[1 − F (x)]

dF (x)

dimana

F (x)[1−F (x)] merupakan fungsi pembobot. Berdasarkan rumus- an tersebut, dapat diketahui bahwa statistik uji Anderson-Darling juga

menggunakan kuadrat selisih antara F n (x) dan F (x). Menurut Ste- phens [19], dalam rangka mempermudah perhitungan diberikan formu-

la untuk statistik Anderson-Darling, yaitu −n − 1 n ∑ n i=1 [ ln (F (z i ) )+ ln (1 − F (z n+1−i ) ) ] . Formula 2i−1 n dalam perumusan tersebut meru- pakan penambahan antara i n dan i−1 n . Stephens juga memodifikasi

statistik Anderson-Darling melalui simulasi Monte Carlo. Berikut mo- difikasi statistik Anderson-Darling.

)A 2 (4.4) dengan

A 2 = −n − 1 n ∑ n i=1 (2i − 1) [ ln (F (z i ) ) + ln(1 − F (z n+1−i ) ) ]

dimana A 2 ∗ adalah modifikasi statistik Anderson-Darling, A 2 ada- lah statistik Anderson-Darling, n adalah banyaknya sampel acak dan

F (z i ) adalah distribusi probabilitas kumulatif normal standar untuk z i = (x i −¯ x)/s yang diperoleh dari tabel normal standar dengan x i merupakan statistik terurut.

(e) Kesimpulan

4.2 Perbedaan Kesimpulan

Di sini diberikan dua contoh adanya perbedaan kesimpulan diantara uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.

Contoh 4.2.1. Perbedaan kesimpulan antara uji Kolmogorov-Smirnov dengan uji Kuiper, Cramer-von Mises, dan Anderson-Darling.

commit to user

Diberikan data X yang memuat sampel acak yang dibangkitkan dengan n = 10. Data ditampilkan pada Tabel 4.1 dan diperoleh ¯ x = −0, 59707 dan s = 1, 13316.

Tabel 4.1. Data bangkitan pertama -0,84864 0,23104 1,46901 -0,80387 -1,09376 -0,86493 0,99714 -1,46741 -1,72315 -1,86610

Langkah awal dalam pengujian kenormalan untuk keempat uji tersebut ada- lah mengurutkan data dari kecil ke besar. Data terurut tersebut selengkapnya tampak dalam Tabel 4.2.

Tabel 4.2. Data terurut -1,86610 -1,72315 -1,46741 -1,09376 -0,86493

-0,84864 -0,80387 0,23104 0,99714 1,46901

Berikut ini dilakukan pengujian kenormalan terhadap data Tabel 4.2 untuk masing-masing uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises dan Anderson- Darling dengan tingkat signifikansi 5%.

1. Menggunakan Uji Kolmogorov-Smirnov (a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika D ∗ > 0,895 (d) Statistik uji Statistik uji ini, yaitu D ∗ , ditentukan dengan (4.1). Agar lebih mudah,

ditentukan dahulu nilai D + dan D − . Perhitungan kedua nilai tersebut terlihat dalam Tabel 4.3. Dari Tabel 4.3, khususnya kolom 7 dan 8 di- peroleh D + = max[ i n −F (z i )] = 0, 27241 dan D − = max[F (z i )− i−1 n ]=

commit to user

0, 13138. Berdasarkan nilai D + dan D − , diperoleh nilai yang maksi- mum dari keduanya sebesar 0,27241 sehingga D = 0, 27241. Dengan demikian, D ∗ = 0, 93193.

Tabel 4.3. Perhitungan D ∗

in

i−1

z i = (x i −¯ x)/s

F (z i )

i n − F (z i ) F (z i )− i−1 n

1 -1,86610 1 10 0 -1,11990

0,13138 -0,03138 0,13138

2 -1,72315 2 10 10 1 -0,99375

0,16017

0,03983 0,06017

3 -1,46741 3 10 10 2 -0,76806

0,22123

0,07877 0,02123

4 -1,09376 4 10 10 3 -0,43832

0,33058

0,06942 0,03058

5 -0,86493 5 10 10 4 -0,23638

0,40657

0,09343 0,00657

6 -0,84864 6 10 10 5 -0,22201

0,41215

0,18785 -0,08785

7 -0,80387 7 10 10 6 -0,18250

(e) Kesimpulan Karena D ∗ = 0, 93193 >0,895 maka H 0 ditolak. Ini berarti data yang

dibangkitkan dan yang disajikan dalam Tabel 4.2 tidak berasal dari populasi yang berdistribusi normal.

2. Menggunakan Uji Kuiper (a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika V ∗ > 1,489

commit to user

(d) Statistik uji Dari perhitungan sebelumnya, D + = 0, 27241 dan D − = 0, 13138 se- hingga nilai V = 0, 40379. Dengan (4.2), diperoleh V ∗ = 1, 40179.

(e) Kesimpulan Karena V ∗ = 1, 40179 <1,489 maka H 0 diterima. Artinya data hasil

bangkitan yang ditampilkan dalam Tabel 4.2 berasal dari populasi yang berdistribusi normal.

3. Menggunakan Uji Cramer-von Mises (a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika W 2 ∗ > 0,126

(d) Statistik uji Statistik uji ini, yaitu W 2 ∗ , dirumuskan dalam persamaan (4.3). Da-

ri (4.3), terlihat bahwa terlebih dahulu ditentukan nilai W 2 . Nilai W 2 bergantung pada nilai [F (z i )− 2i−1 2n ] 2 . Oleh karena itu, nilai [F (z i )− 2i−1 2n ] 2 harus dihitung terlebih dahulu. Perhitungan nilai ter- sebut tampak dalam Tabel 4.4. Dari Tabel 4.4, khususnya kolom 7 baris 12 dapat diperoleh ∑ 10 i=1 [F (z i )− 2i−1 2n ] 2 = 0, 08379 sehingga nilai W 2 = 0, 09212. Dengan demikian, W 2 ∗ = 0, 09673.

(e) Kesimpulan Karena W 2 ∗ = 0, 09673 < 0,126 maka H 0 diterima. Ini artinya data yang disajikan dalam Tabel 4.2 dan merupakan data hasil bangkitan

berasal dari populasi yang berdistribusi normal.

4. Menggunakan Uji Anderson Darling

commit to user

Tabel 4.4. Perhitungan W 2 ∗

z i = (x i −¯ x)/s

F (z i )− 2i−1 2n [F (z i )− 2i−1 2n ] 2

i=1 [F (z i )− 2i−1 2n ] 2 = 0,0837

(a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika A 2 ∗ > 0,787

(d) Statistik uji Statistik uji Anderson-Darling, yaitu A 2 ∗ , dihitung dengan persamaan

(4.4). Untuk memperoleh A 2 ∗ , terlebih dahulu dihitung nilai A 2 . Nilai

A 2 bergantung pada nilai (2i − 1) [ ln (F (z i ) ) + ln(1 − F (z n+1−i ) ) ] . Perhitungan nilai tersebut disajikan dalam Tabel 4.5. Dari tabel ini,

∑ 10 i=1 (2i − 1) [ ln (F (z i ) ) + ln(1 − F (z n+1−i ) ) ] = −105, 04973 sehingga

A 2 = 0, 50497. Berdasarkan nilai tersebut, dapat diperoleh A 2 ∗ =

0, 55420. (e) Kesimpulan

commit to user

Tabel 4.5. Perhitungan A 2 ∗

i F (z )

ln (F (z i ) ) ln (1 − F (z n +1−i ) ) (2i − 1) [ln(F (z i ) )+

(x i −¯ x)/s

ln (1 − F (z n +1−i ) )]

i =1 (2i − 1) [ln(F (z i ) ) + ln(1 − F (z n +1−i ) )] = -105,04973

Karena A 2 ∗ = 0, 55420 < 0,787 maka H 0 diterima. Artinya data hasil bangkitan yang terdapat dalam Tabel 4.2 berasal dari populasi yang berdistribusi normal.

Sampai di sini, dengan uji Kolmogorov-Smirnov data yang dibangkitkan ketika n = 10 merupakan data yang tidak berasal dari populasi berdistribusi normal. Sebaliknya, jika dengan uji Kuiper, Cramer-von Mises, dan Anderson- Darling maka data tersebut berasal dari populasi yang berdistribusi normal.

Contoh 4.2.2. Perbedaan kesimpulan antara uji Kolmogorov-Smirnov dan Kui- per dengan uji Cramer-von Mises dan Anderson-Darling.

Disini dibangkitkan lagi (kedua), data juga dengan n = 10. Data tersebut selengkapnya tampak dalam Tabel 4.6.

Tabel 4.6. Data bangkitan kedua -0,61924 -0,02983 0,08655 -0,34530 -0,13145

0,31483 -1,79078 -0,04687 0,54153

-0,2037

Berikut ini dilakukan pengujian kenormalan terhadap data yang disaji- kan dalam Tabel 4.6 untuk masing-masing uji Kolmogorov-Smirnov, Kuiper’s,

commit to user

Cramer-von Mises, dan Anderson-Darling dengan tingkat signifikansi 5%.

1. Menggunakan Uji Kolmogorov-Smirnov (a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika D ∗ > 0,895 (d) Statistik uji

Berdasarkan perhitungan diperoleh D ∗ = 0, 878968 (e) Kesimpulan

Karena D ∗ = 0, 878968 <0,895 maka H 0 diterima. Artinya data yang dibangkitkan dan yang disajikan dalam Tabel 4.6 berasal dari populasi yang berdistribusi normal.

2. Menggunakan Uji Kuiper (a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika V ∗ > 1,489 (d) Statistik uji Dari perhitungan diperoleh nilai V ∗ =1,38841 (e) Kesimpulan Karena V ∗ = 1, 38841 <1,489 maka H 0 diterima. Ini berarti data hasil

bangkitan yang ditampilkan dalam Tabel 4.6 berasal dari populasi yang berdistribusi normal.

commit to user

3. Menggunakan Uji Cramer-von Mises (a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika W 2 ∗ > 0,126

(d) Statistik uji Berdasarkan perhitungan diperoleh nilai W 2 ∗ =0,129361

(e) Kesimpulan Karena W 2 ∗ = 0, 129361 > 0,126 maka H 0 ditolak. Hal ini berarti data yang disajikan dalam Tabel 4.6 yang merupakan hasil bangkitan

tidak berasal dari populasi yang berdistribusi normal.

4. Menggunakan Uji Anderson Darling (a) Hipotesis

H 0 : data berasal dari populasi berdistribusi normal

H 1 : data tidak berasal dari populasi berdistribusi normal (b) Tingkat signifikansi (α) = 5%

(c) Daerah kritis

H 0 ditolak jika A 2 ∗ > 0,787

(d) Statistik uji