4. Melakukan interpretasi terhadap fungsi diskriminan tersebut. 5. Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui
ketepatan klasifikasi secara individual dengan casewise diagnostics.
2.7.3 Asumsi dalam Analisis Diskriminan
Berikut ini asumsi yang harus dipenuhi agar model diskriminan dapat digunakan:
1. Multivariat Normality, atau variabel independen yang seharusnya berdistribusi normal. Jika data tidak berdistribusi normal, hal ini akan
menyebabkan masalah pada ketepatan fungsi model diskriminan. Regresi logistik bisa dijadikan alternatif metode jika memang data tidak berdistribusi
normal. Tujuan uji normal adalah ingin mengetahui, apakah distribusi dengan berbentuk lonceng bell shapped. Data yang baik adalah data yang
mempunyai pola seperti distribusi normal, yaitu distribusi data tersebut tidak menceng ke kiri atau menceng ke kanan. Uji normalitas pada multivariat
sebenarnya kompleks, karena harus dilakukan pada seluruh variabel secara bersama-sama. Namun, uji ini bisa juga dilakukan pada setiap variabel
dengan logika bahwa jika secara individual masing-masing variabel memenuhi asumsi normalitas, maka secara bersama-sama multivariat variabel-variabel
tersebut juga dianggap memenuhi asumsi normalitas. Adapun kriteria pengujiannya adalah:
a. Angka signifikansi Sig. 0,05, maka data tersebut berdistribusi normal.
b. Angka signifikansi Sig. 0,05, maka data tersebut tidak berdistribusi
normal. 2. Matriks Kovarian dari semua variabel independen seharusnya sama atau equal.
3. Tidak ada korelasi antara dua variabel independen. 4. Tidak adanya data yang sangat ekstrim pada variabel independen.
2.7.4 Model Analisis Diskriminan
Model analisis diskriminan mirip regresi berganda. Perbedaannya adalah kalau variabel dependen regresi berganda dilambangkan dengan
“Y” maka
Universitas Sumatera Utara
dalam analisis diskriminan dilambangkan dengan “D”. Model analisis
diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linier dari berbagai variabel independen, Supranto,2004 yaitu:
= +
1 1
+
2 2
+
3 3
+ +
keterangan : = Nilai skor diskriminan dari responden objek ke
– i . i = 1,2,...,n. D merupakan variabel tak bebas.
= Intercep atau konstanta = Variabel atribut ke
– j dari responden ke – i. = Koefisien atau timbangan diskriminan dari variabel atau atribut ke j.
Yang diestimasi adalah koefisien b
j
, koefisien fungsi diskriminan b
j
diperkirakan sedemikian rupa sehingga nilai D kelompok mempunyai nilai fungsi diskriminan yang sangat berbeda. Ini terjadi kalau rasio jumlah kuadrat antar-
kelompok between group sum of squares dengan jumlah kuadrat dalam kelompok within group sum of squares untuk skor fungsi diskriminan menacapai
maksimum atau rasio varian antar-kelompok dengan varian dalam kelompok sebesar mungkin maksimum. Objek dalam kelompok homogen atau relatif
homogen, sedangkan antar-kelompok sangat heterogen. Berdasarkan nilai D itulah keanggotaan seseorang diprediksi.
Fungsi diskriminan adalah persamaan regresi dengan sebuah variabel tidak bebas yang mencerminkan keanggotaan kelompok. Apabila kelompoknya hanya
ada dua, maka fungsi diskriminan melibatkan regresi ganda dengan sebuah variabel tak bebas atau responden dengan harga-harga 0 dan 1 Sudjana, 1996.
Tujuan fungsi diskriminan adalah untuk menggambarkan ciri-ciri suatu pengamatan dari bermacam-macam populasi yang diketahui, baik secara grafis
ataupun secara aljabar dengan membentuk fungsi diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah
satu dari dua kelompok atau lebih.
Universitas Sumatera Utara
Suatu fungsi diskriminan layak untuk dibentuk bila terdapat perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena itu sebelum
fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan vektor nilai rataan dari kelompok-kelompok tersebut. Pada data pengamatan ke-i yang
berukuran n i = 1,2,3…,n yang terdiri atas j buah variabel yaitu
1
,
2
,
3
,…, . Data pengamatan tersebut dapat disajikan dalam bentuk matriks-matriks berikut:
Tabel 2.1 Matriks Pengamatan
Variabel
1 2
3
...
Pengamatan
11 12
. .
.
1 21
22
. .
.
2 31
32
. .
.
3
... ...
. .
. ...
1 2
. .
.
Untuk variabel j = 1, 2, 3, ..., p yang dihitung adalah variansinya, diberi
lambang � dengan rumus:
� =
2
−
2 =1
=1
− 1 Apabila semua ada j buah varians, yaitu �
11
, �
22
, �
33
… S ij yang masing- masing merupakan varians untuk variabel.
1
,
2
,
3
. . . Untuk variabel
1
dan
2
dimana i ≠ j terdapat kovarians, diberi lambang � yang dapat dihitung
dengan rumus berikut:
Universitas Sumatera Utara
� = −
=1 =1
=1
− 1 Apabila semua ada
j
2
1
buah kovarians, dimana i = j maka � = �
diberi lambang � . Varians dan kovarians ini disusun dalam sebuah matriks
yang disebut dengan matriks varians-kovarians � dengan bentuk sebagai
berikut :
� = �
11
�
12
�
13
… �
1
�
21
�
22
�
23
… �
2
�
31
.. .
�
1
�
32
.. .
�
2
�
33
.. .
�
3
… ..
. …
�
3
.. .
�
Di mana matriks varians-kovarians gabungan dapat dihitung dengan menggunakan rumus:
S =
1
−1 �
1
+
2
−1 �
2
+ … +
2
−1 �
1
+
2
+ … + −
Keterangan : �
= Matriks varians-kovarians gabungan �
1,2, …,
= Matriks varians-kovarians tiap kelompok
1,2, …,
= Jumlah sampel tiap kelompok = Jumlah kelompok
Misalkan ada dua kelompok yang memiliki variabel masing-masing j buah yaitu
11
,
12
,…, dalam kelompok I dan
21
,
22
, … ,
2
dalam kelompok II. Perhatikan bahwa
menyatakan kelompok I, dengan I sama dengan kelompok I dan kelompok II, variabel ke-j dan kelompok ke-k. Variabel
dalam setiap kelompok dapat pula dituliskan dalam bentuk vektor kolom sebagai berikut:
Universitas Sumatera Utara
1
=
11 12
13
. .
.
1
dan
2
=
21 22
23
. .
.
2
Keterangan:
1
= menyatakan variabel X ke-j dalam kelompok ke-1
2
= menyatakan variabel X ke-j dalam kelompok ke-2
Dari setiap kelompok berukuran
1
dari kelompok ke-I dan berukuran
2
dari kelompok ke-2. Data pengamatan akan berbentuk matriks yang bentuknya seperti di bawah ini :
Tabel 2.2 Matriks Data Pengamatan dari Kelompok I Variabel
11 12
13
...
1
Pengamatan
111 112
113
.
11
1
121 122
123
.
12
1
131 132
133
.
13
1
... ...
... .
...
1 1 1 2
1 3
.
1
1
Rata-rata
11 12
13
...
1
Keterangan :
11
= Kelompok ke-1, variabel X ke-1
111
= Kelompok ke-1, variabel X ke-1 yang berukuran 1
1
1
= Kelompok ke-1, variabel X ke-j yang berukuran
1 11
= Rata-rata variabel ke-1 dalam kelompok ke-1
Universitas Sumatera Utara
Tabel 2.3 Matriks Data Pengamatan dari Kelompok II Variabel
21 22
23
...
2
Pengamatan
211 212
213
.
21
2
221 222
223
.
22
2
231 232
233
.
23
2
... ...
... .
...
2 1 2 2
2 3
.
2
2
Rata-rata
21 22
23
...
2
Keterangan :
21
= Kelompok ke-2, variabel X ke-1
211
= Kelompok ke-2, variabel X ke-1 yang berukuran 1
2
2
= Kelompok ke-2, variabel X ke-j yang berukuran
2 21
= Rata-rata variabel ke-1 dalam kelompok ke-2
Hasil pengamatan ini akan menghasilkan rata-rata untuk tiap variabel yang dalam bentuk vektor dapat ditulis sebagai berikut:
1
=
11 12
13
. .
.
1
dan
2
=
21 22
23
. .
.
2
Keterangan :
1 1
= Kelompok ke-1, variabel X ke-j yang berukuran
1 2
1
= Kelompok ke-1, variabel X ke-j yang berukuran
2 1
= Rata-rata variabel ke-j dalam kelompok ke-1
2
= Rata-rata variabel ke-j dalam kelompok ke-2
Universitas Sumatera Utara
Dari masing-masing rata-rata dari kelompok I dan rata-rata dari kelompok II, selanjutnya akan dihitung varian dan kovariannya tersebut
dalam matriks �
1
dan �
2
, masing-masing dari kelompok ke-1 dan kelompok ke-2 yaitu :
�
1
= �
11
�
12
�
13
… �
1
�
21
�
22
�
23
… �
2
�
31
.. .
�
1
�
32
.. .
�
2
�
33
.. .
�
3
… ..
. …
�
3
.. .
� dan
�
2
= �
11
�
12
�
13
… �
1
�
21
�
22
�
23
… �
2
�
31
.. .
�
1
�
32
.. .
�
2
�
33
.. .
�
3
… ..
. …
�
3
.. .
�
Keterangan : �
1
= matriks varians kovarians dari kelompok ke-1 �
2
= matriks varians kovarians dari kelompok ke-2
Meskipun dalam �
1
dan �
2
digunakan � yang sama namun jelas
besarnya berlainan antar � dalam �
1
dan � dalam �
2
. Kedua datanya juga berlainan yaitu
� dalam �
1
diambil dari kelompok 1 dan � dalam �
2
diambil dari kelompok II. Kedua buah matriks varians-kovarians gabungan yang diberi
lambang S dengan rumus :
� =
1
− 1 �
1
+
2
− 1 �
2 1
+
2
− 2
Keterangan : S
= Matriks varian-kovarian gabungan �
1
, �
2
= Matriks varians kovarians dari kelompok ke-1 dan kelompok ke-2
1
,
2
= Jumlah sampel kelompok ke-1 dan ke-2
2.7.5 Algoritma dan Model Matematis
Universitas Sumatera Utara
Secara ringkas, langkah-langkah dari analisis diskriminan adalah: 1.
Pengecekan adanya kemungkinan hubungan linier antara variabel bebas. Pengecekan dilakukan dengan bantuan matriks korelasi pembentukan matriks
korelasi sudah difasilitasi pada analisis diskriminan. Pada hasil output SPSS, matriks korelasi dapat dilihat pada Pooled Within-Groups Matrices.
2. Uji vektor rata-rata kedua kelompok
Pengujian terhadap vektor nilai rataan antar kelompok dilakukan dengan hipotesis:
H : µ
1
= µ
2
Tidak ada perbedaan antar kelompok H
1
: µ
1
≠ µ
2
Ada perbedaan antar kelompok Angka signifikan:
Jika angka Sig 0,05, tidak ada perbedaan antar kelompok Jika angka Sig ≤ 0,05, ada perbedaan antar kelompok
Jika dari hasil pengujian diperoleh adanya perbedaan vektor nilai rataan, fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok
serta berguna untuk mengelompokkan objek ke salah satu kelompok tersebut. Pada SPSS, uji ini dilakukan secara univariate yang diuji bukan berupa vektor,
dengan bantuan tabel Tests of Equality of Group Means.
3. Pemeriksaan asumsi homoskedastisitas dengan uji Box’s M
Pengujian terhadap kesamaan matriks kovarians ∑ antar kelompok dilakukan
dengan hipotesis: H
: Matriks kovarians kelompok adalah sama H
1
: Matriks kovarians kelompok adalah berbeda secara nyata Keputusan dengan dasar signifikansi bias dilihat dari angka signifikannya
Jika Sig 0,05 berarti H diterima
Jika Sig ≤ 0,05 berarti H ditolak
Universitas Sumatera Utara
Sama tidaknya grup kovarian matriks juga dapat dilihat dari tabel output Log Determinant. Jika dalam pengujian ini H
ditolak maka proses selanjutnya seharusnya tidak bisa dilakukan.
4. Pembentukan Model Diskriminan
a. Pembentukan Fungsi Linier
Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel Canonical Discriminant Function Coefficient.
Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagia Unstandardized diaktifkan.
b. Menghitung Discriminant Score
Setelah fungsi liniernya dibentuk, maka dapat dihitung skor diskriminan untuk tiap observasi dengan cara memasukkan nilai-nilai variabel
penjelasnya. c.
Menghitung Cutting Score Untuk memprediksi responden masuk ke dalam kelompok yang mana,
maka dapat menggunakan Optimum Cutting Score. Memang dari komputer informasi ini sudah diperoleh. Untuk cara mengerjakan secara
manual Cutting Score dapat dihitung dengan rumus sebagai berikut dengan ketentuan:
1. Untuk dua kelompok yang mempunyai ukuran yang sama cutting score
dinyatakan dengan rumus Simamora, 2005:
�
= +
2
Keterangan:
�
= Cutting score untuk kelompok yang mempunyai ukuran yang sama
= Centroid kelompok A
�
= Centroid kelompok B
Universitas Sumatera Utara
2. Untuk dua kelompok yang mempunyai ukuran yang berbeda, rumus
cutting score yang digunakan adalah:
= +
+ Keterangan:
= Cutting score untuk kelompok yang mempunyai ukuran yang berbeda
= Jumlah sampel kelompok A = Jumlah sampel kelompok B
= Centroid kelompok A
�
= Centroid kelompok B
Centroid adalah nilai rata-rata skor diskriminan untuk kelompok tertentu. Kemudian nilai-nilai discriminant score tiap observasi akan dibandingkan
dengan nilai cutting score, sehingga dapat diklasifikasikan suatu obsevasi akan termasuk kedalam kelompok yang mana. Dapat dihitung dengan
bantuan tabel Function at Group Centroids dari output SPSS.
d. Perhitungan Hit Ratio
Setelah semua observasi diprediksi keanggotaannya, dapat dihitung Hit ratio, yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan
total seluruh observasi. Seberapa valid model diskriminan yang telah dihasilkan?. Jawaban pertanyaan ini terkait dengan validasi model. SPSS
menggunakan validasi dengan metode Leave One Out. Misalkan ada sebanyak n observasi, akan dibentuk fungsi linier dengan observasi
sebanyak n - 1. Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi keanggotaannya dengan fungsi yang sudah
dibentuk tadi. Proses ini akan diulang dengan kombinasi observasi yang berbeda-beda, sehingga fungsi linier yang dibentuk ada sebanyak n. Inilah
yang disebut dengan metode Leave One Out.
Universitas Sumatera Utara
2.7.6 Pengujian Hipotesis