STATISTIKA_THEORY WEEK 11 Uji Kenormalan & Transformasi Data

  

Hanung N. Prasetyo Hanung N. Prasetyo

WEEK 10

  1. RASIO SKEWNESS DAN RASIO KURTOSIS Rasio Skewnwss = Nilai Skewnwss / S.E. Skewness Rasio Kurtosis = Nilai Kurtosis / S.E. Kurtosis Jika Nilai Rasio Diantara - 2 s/d + 2 Sebarannya Bersifat Normal

  2. UJI KOLMOGOROV SMIRNOV = UJI LILLIEFOR Jika Nilai Prob. / Sig F > 5 % Sebaran Bersifat Normal Jika Nilai Prob. / Sig F < 5 % Sebaran Bersifat Tidak Normal

  3. UJI SHAPIRO WILK Jika Nilai Prob. / Sig F > 5 % Jika Nilai Prob. / Sig F > 5 % Sebaran Bersifat Normal Sebaran Bersifat Normal Jika Nilai Prob. / Sig F < 5 % Sebaran Bersifat Tidak Normal

  4. UJI Anderson-Darling

  5. GAMBAR / PLOT Histogram dengan Normal Curve Q-Q Plot Pembentukan Garis Berdasarkan Nilai Z.

  

Jika Data Tersebar Di sekeliling Garis Berdistribusi Normal Untuk mengetahui apakah sebuah distribusi Normal atau mendekati Normal atau bisa dianggap Normal, bisa dilakukan beberapa prosedur:

  1. Melakukan metode statistik tertentu, seperti Uji Kolmogorv-Smirnov, Uji Shapiro-Wilk dan sebagainya.

  2. Membuat Grafik dengan prosedur tertentu dan mengamati pola plot atau grafik tersebut.

  2. Membuat Grafik dengan prosedur tertentu dan

  Pada kasus berikut dan hanya akan dijelaskan kedua metode tersebut.

  

Uji Normalitas Distribusi

Kolmogorov Smirnov

  Metode Kolmogorov-Smirnov, yang merupakan uji kenormalan paling populer, didasarkan pada nilai D yang didefinisikan sebagai berikut: nilai D yang didefinisikan sebagai berikut:

  

D = sup [Fn (x) – F (x)} x Pada hakekatnya D adalah nilai deviasi absolut maksimum antara Fn (x) dan F0 (x) Nilai D ini selanjutnya dibandingkan dengan nilai D kritis untuk ukuran tes α.

  Stephens memberikan

  nilai kritis tersebut untuk berbagai kondisi pengujian nilai kritis tersebut untuk berbagai kondisi pengujian Untuk α = 1%, nilai D kritis adalah 1.035*(√n – 0.01 + 0.85/√n).

  Sedangkan untuk α = 5% dan α = 10%, nilai D kritis

  berturut-turut

  sebesar 0.895*(√n – 0.01 + 0.85/√n) dan Terdapat beberapa cara pengujian normalitas distribusi yaitu menggunakan formula/prosedur Kolmogorov-

  2 Smirnov, Liliefors, dan Chi Square (X )

  Untuk perhitungan normalitas distribusi, dimisalkan terdapat sekelompok data dengan skala pengukuran terdapat sekelompok data dengan skala pengukuran interval dengan dua variabel bebas dan satu variabel terikat sebagai berikut :

  Tabel skor Variabel bebas (X) dan variabel terikat (Y)

  Dari tabel tersebut misalkan kita ingin menguji normalitas variabel Y , maka untuk memudahkan diperlukan tabel bantu sebagai berikut : Tabel bantu Perhitungan Normalitas

  Langkah-langkah perhitungan : Setelah data dimasukan dalam kolom pertama dan dihitung frekuensinya, kemudian dilakukan perhitungan sebagai berikut :

  1. Cari prosentasi (p) dengan cara frekuensi (f) dibagi dengan jumlah data. Dalam contoh baris pertama di atas adalah 1 : 5 = 0.2, demikian seterusnya sampai selesai untuk setiap frekuensi.

  2. Cari Kp (prosesntase kumulatif) dengan cara menjumlahkan prosen tase kumulatif dengan prosentase di bawahnya, khusus untuk baris pertama nilai p langsung dipindahkan, untuk baris ke dua adalah 0,2 + 0.2 = 0.4, baris ke tiga 0.4 + 0.2 = 0.6, dan seterusnya.

  3. Cari nilai Z dengan cara Skor Y dikurangi dengan Mean/nilai rata- x rata dibagi nilai Standar Deviasi, sebagai contoh untuk baris pertama adalah (7 – 15.4)/5.86 = - 1.43. untuk baris selanjutnya dihitung dengan cara yang sama.

  

4. Cari nilai Z tabel (Z ) dengan melihat Tabel Kurva Normal baku

t (Tabel Z ) berdasarkan nilai Z –nya, contoh untuk baris pertama.

x

Nilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai Z Nilai Z tabel dilihat dalam baris 1,4 dan kolom 3, diperoleh nilai Z sebesar 0.4236, karena nilai Z – nya bernilai minus maka nilai Z x tabel yang diisikan adalah 0.5 - 0.4236 = 0.0764 (0.08). bila Z x bernilai positif maka nilai Z tabel yang diisikan adalah ditambah 0.5.

  1 t bawahnya, sedang untuk baris pertama nilai Z langsung diisikan, t contoh untuk baris kedua nilai 0.08 diperoleh dengan cara 0.2 – 0.28 =

  • 0.08 (yang dipakai nilai mutlaknya). 6. nilai a diperoleh dengan menyelisihkan nilai Kp dengan nilai Z yang
  • 2 t sejajar, contoh untuk baris pertama 0.2 – 0.08 = 0.12.

      7. setelah selesai cari nilai a maksimum, diperoleh nilai 0.21, kemudian bandingankan dengan nilai tabel pada baris N = 5, pada tingkat signifikansi 0.05 diperoleh nilai 0.565, karena a maksimum lebih kecil dari nilai D maksimum berarti distribusi normal.

    Uji Kenormalan Shapiro-Wilk

      Pengujian Shapiro-Wilk, yang diusulkan 1965, mengkalkulasi suatu W statistik yang menguji apakah suatu sampel acak, x1, x2,..., xn mengikuti distribusi normal atau tidak. Nilai W yang kecil menunjukkan normal atau tidak. Nilai W yang kecil menunjukkan kenormalan dan persentase untuk W statistik, formula ini ditemukanoleh Simulasi Monte Carlo , telah direproduksi oleh Pearson Dan Hartley. Pengujian Shapiro-Wilk lebih baik dibandingkan dengan test yang lain. W statistik dihitung sebagai berikut: di mana x(i) adalah nilai-nilai sampel ( x(1) adalah yang paling kecil) dan ai adalah nilai konstanta tetap yang diturunkan dari nilai rata-rata, perbedaan dan

      Algoritma Shapiro Wilk

      Procedure Order the observations from low to high.

      Compute S² = (n-1)s² where s² is the sample variance.

      If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then If n is even, k = n/2. If n is odd, k = (n – 1)/2. Then where a(n+i+1) for i = 1 to k, are found in tables.

      Compute the test statistic. W = b² / S²

      Dalam ilmu statistika seringkali digunakan asumsi dari bentuk data yang akan di analisis. Aasumsi yang lazim digunakan adalah data berdistribusi normal, dengan mean dapat digambarkan sebagai berikut: dengan mean dapat digambarkan sebagai berikut: Dalam kenyataannya seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan atau menjulur kekiri, seperti gambar berikut:

      Transformasi Data Diperbolehkan untuk koreksi dari ketidak- normalan yang disebabkan oleh skewness,

    kurtosis, atau problem lainnya (kurang linearitas)

    Tidak harus dilakukan jika nilai mengandung Tidak harus dilakukan jika nilai mengandung meaningful scale Jenis transformasi :

      Square root – moderate violations LOG – severe, dan Agar asumsi bahwa data berdistribusi normal tetap dipenuhi maka perlu dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk satu angkatan data bila data yang akan ditransformasi hanya satu angkatan data. Untuk memilih fungsi transformasi yang tepat dapat digunakan tangga transformasi Tukey yang digambarkan sebagai berikut:

      − − ! " " ! Tangga transformasi dapat dijelaskan sebagai berikut:

      x

      Transformasi 10 akan membuat bentuk distribusi data menjadi menjulur kekanan secara kuat, sedangkan transformasi akan membuat bentuk distribusi data menjadi menjulur kekiri secara kuat.

      Sebagai contoh jika kita memiliki data yang menjulur Sebagai contoh jika kita memiliki data yang menjulur kekanan secara lemah maka kita dapat tranformasi agar data menjadi normal Transformasi Untuk data yang skewnessnya positif ( pelajari apakah

    artinya condong ke kiri atau ke kanan ) square root dan log

    akan membuat data tetap pada susunan aslinya tetapi membawanya dalam sebaran, akan tetapi inverse akan membalik susunan data membalik susunan data Untuk data yang skewnessnya negatif ( pelajari apakah artinya condong ke kiri atau ke kanan ) berlaku

    kebalikannya; tanpa penyesuaian, square root dan log akan

    membalik susunan sedangkan inverse membuatnya tetap

      Original Data

      Square Root Transform

      Log Transform

      Inverse Transform