Ukuran Pemusatan dan Penyebaran

Nanang Pradipta : Metode Regresi Ridge Untuk Mengatasi Model Regresi Linier Berganda Yang Mengandung Multikolinieritas, 2009. USU Repository © 2009 BAB 2 LANDASAN TEORI

2.1 Ukuran Pemusatan dan Penyebaran

Hasil penelitian riset maupun pengamatan baik yang dilakukan khusus ataupun dalam bentuk laporan, sering diinginkan suatu uraian dan kesimpulan tentang persoalan yang diteliti. Sebelum kesimpulan dibuat, keterangan atau data yang telah terkumpul itu terlebih dahulu dipelajari, dianalisis atau diolah, serta berdasarkan pengolahan inilah baru kesimpulan dibuat. Statistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan data, pengolahan atau penganalisisan dan penarikan kesimpulan berdasarkan kumpulan data dan penganalisisan yang dilakukan. Kumpulan data yang lengkap dan jelas yang ingin dipelajari sifat-sifatnya dinamakan populasi sedangkan sebagian data yang diambil dari populasi dinamakan sampel, dimana sampel diharapkan dapat mewakili populasi. Jika 1 ≥ k dari satu populasi maka akan ada k buah data sampel, akan digunakan notasi X ji untuk mengenali setiap observasi ke-j pada sampel atau variabel-variabel ke-i. Misalkan n observasi pada k variabel dapat dibentuk sebagai berikut : Tabel 2.1 Kumpulan data untuk n observasi pada k variabel No. Observasi Variabel 1 2 3 ... k 1 X 11 X 12 X 13 ... X 1k 2 X 21 X 22 X 23 ... X 2k 3 X 31 X 32 X 33 ... X 3k Nanang Pradipta : Metode Regresi Ridge Untuk Mengatasi Model Regresi Linier Berganda Yang Mengandung Multikolinieritas, 2009. USU Repository © 2009 . . . . . . . . . . . . ... ... ... . . . n X n1 X n2 X n3 ... X nk Kalau dalam bentuk matriks X didefinisikan sebagai berikut :             = nk n n k k X X X X X X X X X X     2 1 2 22 21 1 12 11 Jika observasi sebuah sampel sebesar n, maka rata-rata sampel ke-j yang merupakan ukuran pemusatan didefinisikan sebagai berikut : ∑ = ji j X n X 1 ; j = 1,2,3, ... , k dan i = 1,2,3, ... , n 2.1 dengan n k Variansi sampel merupakan ukuran penyebaran didefinisikan sebagai berikut : ; 1 1 2 2 ∑ − − = j ji j X X n S j = 1,2,3, ... , k 2.2 = = jj j S S 2 variansi sampel ke-j Variansi sampel yang menunjukkan tingkat hubungan antara dua sampel yang didefinisikan sebagai berikut: h hi n i j ji h j jh X X X X n X X Cov S − − − = = ∑ =1 1 1 2.3 dengan j = 1,2,3, ... , k dan h = 1,2,3, ... , k S jh = kovariansi antara X j dan X h Koefisien korelasi merupakan ukuran variansi khusus antara dua variabel yang tidak bergantung pada suatu unit pengukuran antara dua variabel di definisikan sebagai berikut : hh jj jh xjxh S S S r = Nanang Pradipta : Metode Regresi Ridge Untuk Mengatasi Model Regresi Linier Berganda Yang Mengandung Multikolinieritas, 2009. USU Repository © 2009 ∑ ∑ ∑ = = = − − − − = n i h hi n i j ji h hi n i j ji X X X X X X X X 1 2 2 1 1 2.4 dengan h j X X r = koefisien korelasi antara X j dan X h Kumpulan dasar pemusatan dan penyebaran dalam bentuk matriks adalah : Rata-rata sampel             = k x x x X  2 1 Variansi dan Kovariansi = S k =             kk k k k k S S S S S S S S S     2 1 2 22 21 1 12 11 Korelasi sampel C =             1 1 1 2 1 2 21 1 12    k k k k r r r r r r

2.2 Matriks