2. Matriks varians-kovarians variabel penjelas berukuran
P xP
pada kedua kelompok harus sama.
2.4.2 Algoritma dan model matematis
Secara ringkas, langkah-langkah dalam analisis diskriminan adalah sebagai berikut: 1.
Pengecekan adanya kemungkinan hubungan linier antara variabel penjelas. Untuk point ini, dilakukan dengan bantuan matriks korelasi pembentukan matriks
korelasi sudah difasilitasi pada analisis diskriminan. Pada output SPSS, matriks korelasi bisa dilihat pada
pooled Within-Groups Matrices.
2. Uji vektor rata-rata kedua kelompok
Pengujian terhadap vektor nilai rataan antar kelompok dilakukan dengan hipotesa:
H
:
=
1
=
2
= ...=
k
H
1
: Sedikitnya ada dua kelompok yang berbeda
Statistik uji yang digunakan dalam pengujian hipotesis tersebut adalah statistik
V-Bartlett
yang menyebar mengikuti sebaran
Chi-kuadrat
2
dengan derajat bebas
p k
- 1, apabila H diterima. Statistik
V-Bartlett
diperoleh melalui:
ln 2
1
k p
n V
dimana:
n
= banyaknya pengamatan
p
= banyaknya peubah dalam fungsi diskriminan
k
= banyaknya kelompok
B W
W
Wilk’s lambda dalam hal ini:
W
= matrik jumlah kuadrat dan hasil kali data dalam kelompok =
k i
n j
i ij
i ij
i
X X
X X
1 1
Universitas Sumatera Utara
B
= matrik jumlah kuadrat dan hasil kali data antar kelompok. =
k i
i i
i
X X
X X
n
1
X
ij
= pengamatan ke-j kelompok ke-i
i
X
= vektor rataan kelompok ke-i n
i
= jumlah pengamatan pada kelompok ke-i,
X
= vektor rataan total
Titik Keputusan:
H
: Ada perbedaan vektor nilai rataan antarkelompok.
H
1
: Tidak ada perbedaan vektor nilai rataan antarkelompok
Jika
V
2 1
, 1
k p
maka
H
diterima. Jika
V
2 1
, 1
k p
maka
H
ditolak. Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka fungsi
diskriminan layak disusun untuk mengkaji hubungan antar kelompok serta berguna untuk mengelompokkan suatu objek ke salah satu kelompok tersebut.
Diharapkan dalam uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai informasi awal
bahwa variabel yang sedang diteliti memang membedakan kedua kelompok. Pada SPSS, uji ini dilakukan secara univariate jadi yang diuji bukan berupa vektor,
dengan bantuan table
Tests of Equality of Group Means.
3. Dilanjutkan pemeriksaan asumsi homoskedastisitas dengan uji Box‟s M. Untuk
menguji kesamaan matriks peragam
antar kelompok digunakan hipotesis:
H
:
=
1
=
2
= ....
k
= .
H
1
: Sedikitnya ada dua kelompok yang berbeda.
Statistik uji yang digunakan adalah statistik Box’s M, yaitu:
-2
ln
=
j k
j j
S n
k n
W k
n
ln 1
ln
1
Universitas Sumatera Utara
=
2 1
2 1
k n
k j
n j
k n
W S
j
dimana:
k
= banyaknya kelompok.
W n-k
= matrik ragam-peragam dalam kelompok gabungan.
S
j
= matrik ragam-peragam kelompok ke-j.
Bila
H
diterima, maka -2
ln
b
akan mengikuti sebaran
F
dengan derajat bebas
v
1
dan
v
2
pada taraf signifikansi , dimana:
v
1
=
12
k
–1
p p
+ 1
v
2
=
v
1
+ 2
a
2
–
a
1 2
b = v
1
1 –
a
1
-
v
1
v
2
a
1
=
k
j j
k n
n p
k p
p
1 3
1 1
1 1
1 6
1 3
2
a
2
=
k j
j
k n
n k
p p
1 2
2
1 1
1 1
6 2
1
p
= jumlah peubah pembeda dalam fungsi diskriminan.
Asumsikan dalam uji ini hipotesis nol tidak ditolak
1 2
:
H
. Hipotesis:
H
: matriks kovarians grup adalah sama
H
1
: matriks kovarians grup adalah berbeda secara nyata
Jika -2
ln
b Fv
1
,v
2
,
berarti
H
diterima Jika -2
ln
b
Fv
1
,v
2
,
berarti
H
1
ditolak
Sama tidaknya grup kovarians matriks juga bisa dilihat dari tabel output
Log Determinant.
Jika dalam pengujian ini
H
ditolak maka proses lanjutan seharusnya tidak bisa dilakukan.
Universitas Sumatera Utara
4. Pembentukan model diskriminan a.
Fungsi Diskriminan Fungsi diskriminan merupakan fungsi atau kombinasi linier peubah-peubah asal yang
akan menghasilkan cara terbaik dalam pemisahan kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai yang sedekat mungkin dalam kelompok dan sejauh
mungkin antar kelompo. Banyaknya fungsi diskriminan yang terbentuk secara umum tergantung dari
min p,k
-1, dengan
p
adalah banyaknya peubah pembeda dan
k
adalah banyaknya kelompok yang telah ditetapkan. Fungsi diskriminan ini diartikan sebagai
keragaman peubah yang terpilih sebagai kekuatan pembeda. Apabila fungsi diskriminan yang terbentuk sebanyak lebih dari satu fungsi, maka dapat dikatakan
bahwa fungsi diskriminan pertama akan menjadi kekuatan pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya. Fungsi diskriminan yang
terbentuk mempunyai bentuk umum berupa persamaan linier Fisher’s Sample Linear
Discriminant Function
yaitu:
p p
j j
x x
x x
y
1 1
2 12
1 11
1
ˆ ˆ
ˆ ˆ
p p
j j
x x
x x
y
2 2
2 22
1 21
2
ˆ ˆ
ˆ ˆ
…………………………………………….
p ip
j ij
i i
i
x x
x x
y
ˆ ˆ
ˆ ˆ
2 2
1 1
……………………………………………
p qp
j qj
q q
q
x x
x x
y
ˆ ˆ
ˆ ˆ
2 2
1 1
dengan
i
=1,2,…,
q
min
p,k
-1;
j
=1,2,…,
p
atau dapat ditulis sebagai:
x y
ˆ
dimana: ˆ =
a =
Vektor koefisien pembobot fungsi diskriminan.
y
= skor diskriminan.
X
= Vektor variabel acak yang dimasukkan ke dalam fungsi diskriminan.
= Vektor nilai rata-rata variabel acak dari kelompok pertama.
Universitas Sumatera Utara
= Vektor nilai rata-rata variabel acak dari kelompok kedua.
= Invers matriks gabungan.
Sehingga,
Nilai ˆ dipilih sedemikian sehingga fungsi diskriminan berbeda sebesar mungkin
antara kelompok, atau sehingga rasio antara jumlah kuadrat antar kelompok dengan jumlah kuadrat dalam kelompok maksimum.
b. Pembentukan Fungsi Linier dengan bantuan SPSS
Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel
Canonical Discriminant Function Coefficient
. Tabel ini akan dihasilkan pada output apabila pilihan
Function Coefficient
bagian
Unstanda rdized
diaktifkan.
c.
Menghitung
discriminant score
Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya.
d.
Menghitung
Cutting Score
Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan
optimum cutting score.
Memang dari computer informasi ini sudah diperoleh. Sedangkan cara mengerjakan secara manual
Cutting Score m
dapat dihitung dengan rumus sebagai berikut dengan ketentuan untuk dua grup yang mempunyai ukuran
yang sama
cutting score
dinyatakan dengan rumus Simamora, 2005:
Universitas Sumatera Utara
2
A B
ce
Z Z
Z
dengan :
Z
ce
=
cutting score
untuk grup yang sama ukuran
Z
A
=
centroid
grup A
Z
B
=
Centroid
grup B
Apabila dua grup berbeda ukuran, rumus
cutting score
yang digunakan adalah:
B
A B
A CU
A B
N Z N Z
Z N
N
dengan :
Z
CU
=
Cutting score
untuk grup tak sama ukuran
N
A
= Jumlah anggota grup A
N
B
= Jumlah anggota grup B
Z
A
=
Centroid
grup A
Z
B
=
Centroid
grup B
Kemudian nilai-nilai
discriminant score
tiap obsservasi akan dibandingkan dengan
cutting score
, sehingga dapat diklasifikasikan suatu obsevasi akan termasuk kedalam kelompok yang mana.
e.
Penggolongan objek atau individu Suatu observasi dengan karakteristik
x
akan diklasifikasikan sebagai anggota suatu kelompok, misalnya kelompok 1 atau kelompok 2. Untuk penggolongan tersebut ada
dua macam cara yang dapat dilakukan yaitu: 1.
Menggunakan titik tengah
m
Titik tengah m dari diantara dua rata-rata contoh kelompok 1 dan kelompok 2 ditentukan melalui:
Dengan aturan penggolongan sebagai berikut: a. Jika
y m
atau
y
–
m
0 maka masukkan objek ke dalam kelompok 1.
Universitas Sumatera Utara
b. Jika
y
≤ m atau
y
–
m
≤ 0 maka masukkan objek ke dalam kelompok 2. Keterangan :
y
= skor diskriminan dari objek tersebut.
2.
Menggunakan statistika Wald-Anderson
W
Statistik Wald-Anderson
W
dapat dirumuskan sebagai berikut:
Kriteria penggolongan berdasarkan statistik W adalah: a. Jika
W 0
maka masukkan objek ke dalam kelompok 1. b. Jika
W
0 maka masukkan objek ke dalam kelompok 2.
f.
Perhitungan
Hit Ratio
Setelah semua observasi diprediksi keanggotaannya, dapat dihitung
hit ratio,
yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi.
Misalkan ada sebanyak
n
observasi, akan dibentuk fungsi linier dengan observasi sebanyak
n-1.
Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi keanggotaannya dengan fungsi yang sudah dibentuk tadi. Proses ini
akan diulang dengan kombinasi observasi yang berbeda-beda, sehingga fungsi linier yang dibentuk ada sebanyak
n
. Inilah yang disebut dengan metode
Leave One Out
.
Hit Ratio
100
1 1
k i
i k
i ic
n n
Keterangan:
n
i
= jumlah observasi dari
i
yang tepat dikelompokkan pada
i
n
ij
= jumlah observasi dari
i
yang salah dikelompokkan pada
ij
dengan
i
=1,2,…,
k
dan
j
=1,2,…,
k
g.
Kriteria
posterior probability
Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu
x
berasal dari suatu kelompok. Nilai peluang ini disebut
posterior probability
dan bisa ditampilkan
Universitas Sumatera Utara
pada sheet SPSS dengan mengaktifkan option
probabilities of group membership
pada bagian
Save
di kotak dialog utama.
k k
k k
k
p f x
p k x p f
x
dimana :
p
k
=
prior probability
kelompok ke-
k
dan
1 1 2
1 exp 1 2
2
k k
p z
fi x f x
x x
Suatu observasi dengan karakteristik
x
akan diklasifikasikan sebagai anggota kelompok 0 jika
1
p k x
p k x
. Nilai-nilai
posterior probability
inilah yang mengisi kolom di
1_1
dan kolom di
1_2
pada sheet SPSS.
h. Akurasi statisik, dapat di uji secara statistik apakah klasifikasi yang dilakukan dengan
menggunakan fungsi diskriminan akurat atau tidak. Uji statistik tersebut adalah prees-Q Statistik. Ukuran sederhana ini membandingkan jumlah kasus yang
diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari perhitunngan kemudian dibandingkan dengan nilai kritis
critical velue
yang diambil dari tabel
Chi-Square
dan tingkat keyakinan sesuai yang diinginkan. Statistik Q ditulis dengan rumus:
2
Pr 1
N nK
ees Q
N k
dengan :
N
= ukuran total sampel
n
= jumlah kasus yang diklasifikasi secara tepat
K
= jumlah grup
2.5 Pengujian Hipotesis