Model Analisis Diskriminan Analisis Diskriminan

4. Melakukan interpretasi terhadap fungsi diskriminan tersebut. 5. Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui ketepatan klasifikasi secara individual dengan casewise diagnostics.

2.7.3 Asumsi dalam Analisis Diskriminan

Berikut ini asumsi yang harus dipenuhi agar model diskriminan dapat digunakan: 1. Multivariat Normality, atau variabel independen yang seharusnya berdistribusi normal. Jika data tidak berdistribusi normal, hal ini akan menyebabkan masalah pada ketepatan fungsi model diskriminan. Regresi logistik bisa dijadikan alternatif metode jika memang data tidak berdistribusi normal. Tujuan uji normal adalah ingin mengetahui, apakah distribusi dengan berbentuk lonceng bell shapped. Data yang baik adalah data yang mempunyai pola seperti distribusi normal, yaitu distribusi data tersebut tidak menceng ke kiri atau menceng ke kanan. Uji normalitas pada multivariat sebenarnya kompleks, karena harus dilakukan pada seluruh variabel secara bersama-sama. Namun, uji ini bisa juga dilakukan pada setiap variabel dengan logika bahwa jika secara individual masing-masing variabel memenuhi asumsi normalitas, maka secara bersama-sama multivariat variabel-variabel tersebut juga dianggap memenuhi asumsi normalitas. Adapun kriteria pengujiannya adalah: a. Angka signifikansi Sig. 0,05, maka data tersebut berdistribusi normal. b. Angka signifikansi Sig. 0,05, maka data tersebut tidak berdistribusi normal. 2. Matriks Kovarian dari semua variabel independen seharusnya sama atau equal. 3. Tidak ada korelasi antara dua variabel independen. 4. Tidak adanya data yang sangat ekstrim pada variabel independen.

2.7.4 Model Analisis Diskriminan

Model analisis diskriminan mirip regresi berganda. Perbedaannya adalah kalau variabel dependen regresi berganda dilambangkan dengan “Y” maka Universitas Sumatera Utara dalam analisis diskriminan dilambangkan dengan “D”. Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linier dari berbagai variabel independen, Supranto,2004 yaitu: = + 1 1 + 2 2 + 3 3 + + keterangan : = Nilai skor diskriminan dari responden objek ke – i . i = 1,2,...,n. D merupakan variabel tak bebas. = Intercep atau konstanta = Variabel atribut ke – j dari responden ke – i. = Koefisien atau timbangan diskriminan dari variabel atau atribut ke j. Yang diestimasi adalah koefisien b j , koefisien fungsi diskriminan b j diperkirakan sedemikian rupa sehingga nilai D kelompok mempunyai nilai fungsi diskriminan yang sangat berbeda. Ini terjadi kalau rasio jumlah kuadrat antar- kelompok between group sum of squares dengan jumlah kuadrat dalam kelompok within group sum of squares untuk skor fungsi diskriminan menacapai maksimum atau rasio varian antar-kelompok dengan varian dalam kelompok sebesar mungkin maksimum. Objek dalam kelompok homogen atau relatif homogen, sedangkan antar-kelompok sangat heterogen. Berdasarkan nilai D itulah keanggotaan seseorang diprediksi. Fungsi diskriminan adalah persamaan regresi dengan sebuah variabel tidak bebas yang mencerminkan keanggotaan kelompok. Apabila kelompoknya hanya ada dua, maka fungsi diskriminan melibatkan regresi ganda dengan sebuah variabel tak bebas atau responden dengan harga-harga 0 dan 1 Sudjana, 1996. Tujuan fungsi diskriminan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis ataupun secara aljabar dengan membentuk fungsi diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih. Universitas Sumatera Utara Suatu fungsi diskriminan layak untuk dibentuk bila terdapat perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena itu sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan vektor nilai rataan dari kelompok-kelompok tersebut. Pada data pengamatan ke-i yang berukuran n i = 1,2,3…,n yang terdiri atas j buah variabel yaitu 1 , 2 , 3 ,…, . Data pengamatan tersebut dapat disajikan dalam bentuk matriks-matriks berikut: Tabel 2.1 Matriks Pengamatan Variabel 1 2 3 ... Pengamatan 11 12 . . . 1 21 22 . . . 2 31 32 . . . 3 ... ... . . . ... 1 2 . . . Untuk variabel j = 1, 2, 3, ..., p yang dihitung adalah variansinya, diberi lambang � dengan rumus: � = 2 − 2 =1 =1 − 1 Apabila semua ada j buah varians, yaitu � 11 , � 22 , � 33 … S ij yang masing- masing merupakan varians untuk variabel. 1 , 2 , 3 . . . Untuk variabel 1 dan 2 dimana i ≠ j terdapat kovarians, diberi lambang � yang dapat dihitung dengan rumus berikut: Universitas Sumatera Utara � = − =1 =1 =1 − 1 Apabila semua ada  j 2  1  buah kovarians, dimana i = j maka � = � diberi lambang � . Varians dan kovarians ini disusun dalam sebuah matriks yang disebut dengan matriks varians-kovarians � dengan bentuk sebagai berikut : � = � 11 � 12 � 13 … � 1 � 21 � 22 � 23 … � 2 � 31 .. . � 1 � 32 .. . � 2 � 33 .. . � 3 … .. . … � 3 .. . � Di mana matriks varians-kovarians gabungan dapat dihitung dengan menggunakan rumus: S = 1 −1 � 1 + 2 −1 � 2 + … + 2 −1 � 1 + 2 + … + − Keterangan : � = Matriks varians-kovarians gabungan � 1,2, …, = Matriks varians-kovarians tiap kelompok 1,2, …, = Jumlah sampel tiap kelompok = Jumlah kelompok Misalkan ada dua kelompok yang memiliki variabel masing-masing j buah yaitu 11 , 12 ,…, dalam kelompok I dan 21 , 22 , … , 2 dalam kelompok II. Perhatikan bahwa menyatakan kelompok I, dengan I sama dengan kelompok I dan kelompok II, variabel ke-j dan kelompok ke-k. Variabel dalam setiap kelompok dapat pula dituliskan dalam bentuk vektor kolom sebagai berikut: Universitas Sumatera Utara 1 = 11 12 13 . . . 1 dan 2 = 21 22 23 . . . 2 Keterangan: 1 = menyatakan variabel X ke-j dalam kelompok ke-1 2 = menyatakan variabel X ke-j dalam kelompok ke-2 Dari setiap kelompok berukuran 1 dari kelompok ke-I dan berukuran 2 dari kelompok ke-2. Data pengamatan akan berbentuk matriks yang bentuknya seperti di bawah ini : Tabel 2.2 Matriks Data Pengamatan dari Kelompok I Variabel 11 12 13 ... 1 Pengamatan 111 112 113 . 11 1 121 122 123 . 12 1 131 132 133 . 13 1 ... ... ... . ... 1 1 1 2 1 3 . 1 1 Rata-rata 11 12 13 ... 1 Keterangan : 11 = Kelompok ke-1, variabel X ke-1 111 = Kelompok ke-1, variabel X ke-1 yang berukuran 1 1 1 = Kelompok ke-1, variabel X ke-j yang berukuran 1 11 = Rata-rata variabel ke-1 dalam kelompok ke-1 Universitas Sumatera Utara Tabel 2.3 Matriks Data Pengamatan dari Kelompok II Variabel 21 22 23 ... 2 Pengamatan 211 212 213 . 21 2 221 222 223 . 22 2 231 232 233 . 23 2 ... ... ... . ... 2 1 2 2 2 3 . 2 2 Rata-rata 21 22 23 ... 2 Keterangan : 21 = Kelompok ke-2, variabel X ke-1 211 = Kelompok ke-2, variabel X ke-1 yang berukuran 1 2 2 = Kelompok ke-2, variabel X ke-j yang berukuran 2 21 = Rata-rata variabel ke-1 dalam kelompok ke-2 Hasil pengamatan ini akan menghasilkan rata-rata untuk tiap variabel yang dalam bentuk vektor dapat ditulis sebagai berikut: 1 = 11 12 13 . . . 1 dan 2 = 21 22 23 . . . 2 Keterangan : 1 1 = Kelompok ke-1, variabel X ke-j yang berukuran 1 2 1 = Kelompok ke-1, variabel X ke-j yang berukuran 2 1 = Rata-rata variabel ke-j dalam kelompok ke-1 2 = Rata-rata variabel ke-j dalam kelompok ke-2 Universitas Sumatera Utara Dari masing-masing rata-rata dari kelompok I dan rata-rata dari kelompok II, selanjutnya akan dihitung varian dan kovariannya tersebut dalam matriks � 1 dan � 2 , masing-masing dari kelompok ke-1 dan kelompok ke-2 yaitu : � 1 = � 11 � 12 � 13 … � 1 � 21 � 22 � 23 … � 2 � 31 .. . � 1 � 32 .. . � 2 � 33 .. . � 3 … .. . … � 3 .. . � dan � 2 = � 11 � 12 � 13 … � 1 � 21 � 22 � 23 … � 2 � 31 .. . � 1 � 32 .. . � 2 � 33 .. . � 3 … .. . … � 3 .. . � Keterangan : � 1 = matriks varians kovarians dari kelompok ke-1 � 2 = matriks varians kovarians dari kelompok ke-2 Meskipun dalam � 1 dan � 2 digunakan � yang sama namun jelas besarnya berlainan antar � dalam � 1 dan � dalam � 2 . Kedua datanya juga berlainan yaitu � dalam � 1 diambil dari kelompok 1 dan � dalam � 2 diambil dari kelompok II. Kedua buah matriks varians-kovarians gabungan yang diberi lambang S dengan rumus : � = 1 − 1 � 1 + 2 − 1 � 2 1 + 2 − 2 Keterangan : S = Matriks varian-kovarian gabungan � 1 , � 2 = Matriks varians kovarians dari kelompok ke-1 dan kelompok ke-2 1 , 2 = Jumlah sampel kelompok ke-1 dan ke-2 2.7.5 Algoritma dan Model Matematis Universitas Sumatera Utara Secara ringkas, langkah-langkah dari analisis diskriminan adalah: 1. Pengecekan adanya kemungkinan hubungan linier antara variabel bebas. Pengecekan dilakukan dengan bantuan matriks korelasi pembentukan matriks korelasi sudah difasilitasi pada analisis diskriminan. Pada hasil output SPSS, matriks korelasi dapat dilihat pada Pooled Within-Groups Matrices. 2. Uji vektor rata-rata kedua kelompok Pengujian terhadap vektor nilai rataan antar kelompok dilakukan dengan hipotesis: H : µ 1 = µ 2 Tidak ada perbedaan antar kelompok H 1 : µ 1 ≠ µ 2 Ada perbedaan antar kelompok Angka signifikan: Jika angka Sig 0,05, tidak ada perbedaan antar kelompok Jika angka Sig ≤ 0,05, ada perbedaan antar kelompok Jika dari hasil pengujian diperoleh adanya perbedaan vektor nilai rataan, fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok serta berguna untuk mengelompokkan objek ke salah satu kelompok tersebut. Pada SPSS, uji ini dilakukan secara univariate yang diuji bukan berupa vektor, dengan bantuan tabel Tests of Equality of Group Means. 3. Pemeriksaan asumsi homoskedastisitas dengan uji Box’s M Pengujian terhadap kesamaan matriks kovarians ∑ antar kelompok dilakukan dengan hipotesis: H : Matriks kovarians kelompok adalah sama H 1 : Matriks kovarians kelompok adalah berbeda secara nyata Keputusan dengan dasar signifikansi bias dilihat dari angka signifikannya Jika Sig 0,05 berarti H diterima Jika Sig ≤ 0,05 berarti H ditolak Universitas Sumatera Utara Sama tidaknya grup kovarian matriks juga dapat dilihat dari tabel output Log Determinant. Jika dalam pengujian ini H ditolak maka proses selanjutnya seharusnya tidak bisa dilakukan. 4. Pembentukan Model Diskriminan a. Pembentukan Fungsi Linier Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel Canonical Discriminant Function Coefficient. Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagia Unstandardized diaktifkan. b. Menghitung Discriminant Score Setelah fungsi liniernya dibentuk, maka dapat dihitung skor diskriminan untuk tiap observasi dengan cara memasukkan nilai-nilai variabel penjelasnya. c. Menghitung Cutting Score Untuk memprediksi responden masuk ke dalam kelompok yang mana, maka dapat menggunakan Optimum Cutting Score. Memang dari komputer informasi ini sudah diperoleh. Untuk cara mengerjakan secara manual Cutting Score dapat dihitung dengan rumus sebagai berikut dengan ketentuan: 1. Untuk dua kelompok yang mempunyai ukuran yang sama cutting score dinyatakan dengan rumus Simamora, 2005: � = + 2 Keterangan: � = Cutting score untuk kelompok yang mempunyai ukuran yang sama = Centroid kelompok A � = Centroid kelompok B Universitas Sumatera Utara 2. Untuk dua kelompok yang mempunyai ukuran yang berbeda, rumus cutting score yang digunakan adalah: = + + Keterangan: = Cutting score untuk kelompok yang mempunyai ukuran yang berbeda = Jumlah sampel kelompok A = Jumlah sampel kelompok B = Centroid kelompok A � = Centroid kelompok B Centroid adalah nilai rata-rata skor diskriminan untuk kelompok tertentu. Kemudian nilai-nilai discriminant score tiap observasi akan dibandingkan dengan nilai cutting score, sehingga dapat diklasifikasikan suatu obsevasi akan termasuk kedalam kelompok yang mana. Dapat dihitung dengan bantuan tabel Function at Group Centroids dari output SPSS. d. Perhitungan Hit Ratio Setelah semua observasi diprediksi keanggotaannya, dapat dihitung Hit ratio, yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi. Seberapa valid model diskriminan yang telah dihasilkan?. Jawaban pertanyaan ini terkait dengan validasi model. SPSS menggunakan validasi dengan metode Leave One Out. Misalkan ada sebanyak n observasi, akan dibentuk fungsi linier dengan observasi sebanyak n - 1. Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi keanggotaannya dengan fungsi yang sudah dibentuk tadi. Proses ini akan diulang dengan kombinasi observasi yang berbeda-beda, sehingga fungsi linier yang dibentuk ada sebanyak n. Inilah yang disebut dengan metode Leave One Out. Universitas Sumatera Utara

2.7.6 Pengujian Hipotesis