Algoritma dan model matematis

2. Matriks varians-kovarians variabel penjelas berukuran P xP pada kedua kelompok harus sama.

2.4.2 Algoritma dan model matematis

Secara ringkas, langkah-langkah dalam analisis diskriminan adalah sebagai berikut: 1. Pengecekan adanya kemungkinan hubungan linier antara variabel penjelas. Untuk point ini, dilakukan dengan bantuan matriks korelasi pembentukan matriks korelasi sudah difasilitasi pada analisis diskriminan. Pada output SPSS, matriks korelasi bisa dilihat pada pooled Within-Groups Matrices. 2. Uji vektor rata-rata kedua kelompok Pengujian terhadap vektor nilai rataan antar kelompok dilakukan dengan hipotesa: H :  =  1 =  2 = ...=  k H 1 : Sedikitnya ada dua kelompok yang berbeda Statistik uji yang digunakan dalam pengujian hipotesis tersebut adalah statistik V-Bartlett yang menyebar mengikuti sebaran Chi-kuadrat  2 dengan derajat bebas p k - 1, apabila H diterima. Statistik V-Bartlett diperoleh melalui:   ln 2 1       k p n V dimana: n = banyaknya pengamatan p = banyaknya peubah dalam fungsi diskriminan k = banyaknya kelompok     B W W Wilk’s lambda dalam hal ini: W = matrik jumlah kuadrat dan hasil kali data dalam kelompok =      k i n j i ij i ij i X X X X 1 1 Universitas Sumatera Utara B = matrik jumlah kuadrat dan hasil kali data antar kelompok. =     k i i i i X X X X n 1 X ij = pengamatan ke-j kelompok ke-i i X = vektor rataan kelompok ke-i n i = jumlah pengamatan pada kelompok ke-i, X = vektor rataan total Titik Keputusan: H : Ada perbedaan vektor nilai rataan antarkelompok. H 1 : Tidak ada perbedaan vektor nilai rataan antarkelompok Jika V  2 1 , 1     k p maka H diterima. Jika V 2 1 , 1     k p maka H ditolak. Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok serta berguna untuk mengelompokkan suatu objek ke salah satu kelompok tersebut. Diharapkan dalam uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua kelompok. Pada SPSS, uji ini dilakukan secara univariate jadi yang diuji bukan berupa vektor, dengan bantuan table Tests of Equality of Group Means. 3. Dilanjutkan pemeriksaan asumsi homoskedastisitas dengan uji Box‟s M. Untuk menguji kesamaan matriks peragam  antar kelompok digunakan hipotesis: H :  =  1 =  2 = ....  k = . H 1 : Sedikitnya ada dua kelompok yang berbeda. Statistik uji yang digunakan adalah statistik Box’s M, yaitu: -2 ln  =     j k j j S n k n W k n ln 1 ln 1       Universitas Sumatera Utara  = 2 1 2 1 k n k j n j k n W S j      dimana: k = banyaknya kelompok. W n-k = matrik ragam-peragam dalam kelompok gabungan. S j = matrik ragam-peragam kelompok ke-j. Bila H diterima, maka -2 ln  b akan mengikuti sebaran F dengan derajat bebas v 1 dan v 2 pada taraf signifikansi , dimana: v 1 = 12 k –1 p p + 1 v 2 = v 1 + 2 a 2 – a 1 2 b = v 1 1 – a 1 - v 1 v 2 a 1 =                  k j j k n n p k p p 1 3 1 1 1 1 1 6 1 3 2 a 2 =                 k j j k n n k p p 1 2 2 1 1 1 1 6 2 1 p = jumlah peubah pembeda dalam fungsi diskriminan. Asumsikan dalam uji ini hipotesis nol tidak ditolak 1 2 : H    . Hipotesis: H : matriks kovarians grup adalah sama H 1 : matriks kovarians grup adalah berbeda secara nyata Jika -2 ln  b Fv 1 ,v 2 ,  berarti H diterima Jika -2 ln  b  Fv 1 ,v 2 , berarti H 1 ditolak Sama tidaknya grup kovarians matriks juga bisa dilihat dari tabel output Log Determinant. Jika dalam pengujian ini H ditolak maka proses lanjutan seharusnya tidak bisa dilakukan. Universitas Sumatera Utara 4. Pembentukan model diskriminan a. Fungsi Diskriminan Fungsi diskriminan merupakan fungsi atau kombinasi linier peubah-peubah asal yang akan menghasilkan cara terbaik dalam pemisahan kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai yang sedekat mungkin dalam kelompok dan sejauh mungkin antar kelompo. Banyaknya fungsi diskriminan yang terbentuk secara umum tergantung dari min p,k -1, dengan p adalah banyaknya peubah pembeda dan k adalah banyaknya kelompok yang telah ditetapkan. Fungsi diskriminan ini diartikan sebagai keragaman peubah yang terpilih sebagai kekuatan pembeda. Apabila fungsi diskriminan yang terbentuk sebanyak lebih dari satu fungsi, maka dapat dikatakan bahwa fungsi diskriminan pertama akan menjadi kekuatan pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya. Fungsi diskriminan yang terbentuk mempunyai bentuk umum berupa persamaan linier Fisher’s Sample Linear Discriminant Function yaitu: p p j j x x x x y 1 1 2 12 1 11 1 ˆ ˆ ˆ ˆ             p p j j x x x x y 2 2 2 22 1 21 2 ˆ ˆ ˆ ˆ             ……………………………………………. p ip j ij i i i x x x x y       ˆ ˆ ˆ ˆ 2 2 1 1       …………………………………………… p qp j qj q q q x x x x y       ˆ ˆ ˆ ˆ 2 2 1 1       dengan i =1,2,…, q min p,k -1; j =1,2,…, p atau dapat ditulis sebagai: x y ˆ  dimana: ˆ = a = Vektor koefisien pembobot fungsi diskriminan. y = skor diskriminan. X = Vektor variabel acak yang dimasukkan ke dalam fungsi diskriminan. = Vektor nilai rata-rata variabel acak dari kelompok pertama. Universitas Sumatera Utara = Vektor nilai rata-rata variabel acak dari kelompok kedua. = Invers matriks gabungan. Sehingga, Nilai ˆ dipilih sedemikian sehingga fungsi diskriminan berbeda sebesar mungkin antara kelompok, atau sehingga rasio antara jumlah kuadrat antar kelompok dengan jumlah kuadrat dalam kelompok maksimum. b. Pembentukan Fungsi Linier dengan bantuan SPSS Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel Canonical Discriminant Function Coefficient . Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagian Unstanda rdized diaktifkan. c. Menghitung discriminant score Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya. d. Menghitung Cutting Score Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan optimum cutting score. Memang dari computer informasi ini sudah diperoleh. Sedangkan cara mengerjakan secara manual Cutting Score m dapat dihitung dengan rumus sebagai berikut dengan ketentuan untuk dua grup yang mempunyai ukuran yang sama cutting score dinyatakan dengan rumus Simamora, 2005: Universitas Sumatera Utara 2 A B ce Z Z Z   dengan : Z ce = cutting score untuk grup yang sama ukuran Z A = centroid grup A Z B = Centroid grup B Apabila dua grup berbeda ukuran, rumus cutting score yang digunakan adalah: B A B A CU A B N Z N Z Z N N    dengan : Z CU = Cutting score untuk grup tak sama ukuran N A = Jumlah anggota grup A N B = Jumlah anggota grup B Z A = Centroid grup A Z B = Centroid grup B Kemudian nilai-nilai discriminant score tiap obsservasi akan dibandingkan dengan cutting score , sehingga dapat diklasifikasikan suatu obsevasi akan termasuk kedalam kelompok yang mana. e. Penggolongan objek atau individu Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota suatu kelompok, misalnya kelompok 1 atau kelompok 2. Untuk penggolongan tersebut ada dua macam cara yang dapat dilakukan yaitu: 1. Menggunakan titik tengah m Titik tengah m dari diantara dua rata-rata contoh kelompok 1 dan kelompok 2 ditentukan melalui: Dengan aturan penggolongan sebagai berikut: a. Jika y m atau y – m 0 maka masukkan objek ke dalam kelompok 1. Universitas Sumatera Utara b. Jika y ≤ m atau y – m ≤ 0 maka masukkan objek ke dalam kelompok 2. Keterangan : y = skor diskriminan dari objek tersebut. 2. Menggunakan statistika Wald-Anderson W Statistik Wald-Anderson W dapat dirumuskan sebagai berikut: Kriteria penggolongan berdasarkan statistik W adalah: a. Jika W 0 maka masukkan objek ke dalam kelompok 1. b. Jika W 0 maka masukkan objek ke dalam kelompok 2. f. Perhitungan Hit Ratio Setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio, yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi. Misalkan ada sebanyak n observasi, akan dibentuk fungsi linier dengan observasi sebanyak n-1. Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi keanggotaannya dengan fungsi yang sudah dibentuk tadi. Proses ini akan diulang dengan kombinasi observasi yang berbeda-beda, sehingga fungsi linier yang dibentuk ada sebanyak n . Inilah yang disebut dengan metode Leave One Out . Hit Ratio 100 1 1       k i i k i ic n n Keterangan: n i = jumlah observasi dari  i yang tepat dikelompokkan pada  i n ij = jumlah observasi dari  i yang salah dikelompokkan pada  ij dengan i =1,2,…, k dan j =1,2,…, k g. Kriteria posterior probability Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu x berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability dan bisa ditampilkan Universitas Sumatera Utara pada sheet SPSS dengan mengaktifkan option probabilities of group membership pada bagian Save di kotak dialog utama.       k k k k k p f x p k x p f x   dimana : p k = prior probability kelompok ke- k dan           1 1 2 1 exp 1 2 2 k k p z fi x f x x x            Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok 0 jika     1 p k x p k x    . Nilai-nilai posterior probability inilah yang mengisi kolom di 1_1 dan kolom di 1_2 pada sheet SPSS. h. Akurasi statisik, dapat di uji secara statistik apakah klasifikasi yang dilakukan dengan menggunakan fungsi diskriminan akurat atau tidak. Uji statistik tersebut adalah prees-Q Statistik. Ukuran sederhana ini membandingkan jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari perhitunngan kemudian dibandingkan dengan nilai kritis critical velue yang diambil dari tabel Chi-Square dan tingkat keyakinan sesuai yang diinginkan. Statistik Q ditulis dengan rumus:     2 Pr 1 N nK ees Q N k         dengan : N = ukuran total sampel n = jumlah kasus yang diklasifikasi secara tepat K = jumlah grup

2.5 Pengujian Hipotesis