2.7.3 Uji Multivariat Normal
Tujuan dari uji normalitas adalah untuk mengetahui apakah distribusi sebuah data mengikuti atau mendekati distribusi normal, yakni distribusi data dengan bentuk
lonceng. Data yang baik adalah data yang mempunyai pola seperti distribusi normal.
Pada dasarnya, distribusi utama dan permasalahan yang muncul dalam analisis multivariat adalah distribusi normal multivariat. Distribusi normal multivariat
digunakan karena dua alasan, pertama, banyak kasus penelitian multivariat kurang lebih mendekati distribusi normal, karena rata-rata sampel dan matriks kovarian
digunakan dalam prosedur inferensial, mewajibkan efek teorema central limit. Ini juga disebabkan, ketika penelitian dapat dianggap sebagai jumlah dari vektor acak
independen, model yang layak dalam berbagai situasi. Kedua, distribusi multivariat normal dan distribuai sampling untuk memberi kemudahan.
Beberapa teknik analisis multivariat yang digunakan mengasumsikan bahwa data dihasilkan dari distribusi multivariat normal. Meski pun pada dasarnya data yang
digunakan tidak selalu berdistribusi normal, distribusi normal digunakan sebagai pendekatan untuk mencapai distribusi populasi yang mendekati benar.
Multivariat normal adalah perluasan dari univariat normal. Sebuah variabel kontinu
x
dikatakan mengikuti distribusi normal dengan parameter lokasi pemusatan
dan parameter penyebaran variansi jika mengikuti fungsi
kemungkinan berikut :
Dengan dan bilangan natural.
Universitas Sumatera Utara
Tepat untuk menentukan fungsi kepadatan normal dengan rata-rata dan varians
oleh .
Dalam eksponen dari fungsi kepadatan normal univariat ukuran kuadrat jarak dari
x
ke adalah deviasi standard. Ini dapat diperluas untuk vektor
x p x 1
dari penelitian pada beberapa variabel sebagai
Vektor
p x 1
menunujukkan nilai ekspektasi dari vektor acak X, dan matriks S
p x p
adalah matriks varians-covarians dari X.
Kepadatan multivariat normal diperoleh dari menukarkan jarak univariat pada persamaan 2.4 dengan persamaan 2.5 dalam fungsi kepadatan dari 2.3. ketika
dilakukan pertukaran, nilai konstant univariat normal ditukar kebentuk
konstanta yang lebih luas, yang memperlihatkan fungsi kepdatan multivariat untuk
p
. Ini diperlukan karena, dalam kasus multivariat, probabilitas digambarkan oleh volume
yang berada dibawah daerah batas ketentuan yang didefinisikan oleh interval dari nilai . Ini dapat ditunjukkan probabilitas standard normal yang konstant adalah
, sebagai akibat,
p
-dimensi kepadatan normal untuk vektor acak berdistribusi normal multivariat dengan parameter dan ∑
mempunyai bentuk
Dimana .
Sifat khusus dari distribusi normal akan membutuhkan penjelasan secara berulang kali dari model dan metode statiostika. Sifat ini memungkinkan untuk
memanipulasi distribusi normal menjadi lebih mudah.
Universitas Sumatera Utara
Pernyataan dibawah ini benar untuk vektor acak berdistribusi normal multivariat :
1.
Kombinasi linear dari komponen-komponen X adalah distribusi normal
multivariat. 2.
Semua himpunan bagian dari komponen-komponen dari X memiliki distribusi normal multivariat.
3. Kovarians nol menakibatkan komponen-komponen yang bersangkutan
independen 4.
Distribusi bersyarat dari komponen-komponen adalah multivariat normal
Untuk melakukan pemeriksaan data normal multivariat, dapat dilakukan dengan cara mengkonstruksikan plot chi-kuadrat dengan langkah-langkah sebagai
berikut : a.
Menghitung jarak tergeneralisasi :
b. Mengurutkan
c. Membuat plot
dimana adalah
persentil untuk distribusi Chi-kuadrat dengan derajat
kebebasan
p
. d.
Plot ini merupakan garis lurus bila data berdistribusi normal multivariat.
Kelengkungan menunjukkan
penyimpangan dari
normalitas.
Kriteria Pengujian : Angka signifikansi , maka data berdistribusi normal
Angka signifikansi , maka data tidak berdistribusi normal
Universitas Sumatera Utara
Jika sebuah variabel mempunyai sebaran data yang tidak normal, maka perlakuan yang memungkinkan agar menjadi normal :
1. Menambah jumlah data
2. Menghilangkan data yang menjadi penyebab tidak normalnya data
3. Dilakukan transformasi data
2.7.4 Uji Homoskedastisitas data