i = 1,2, ..., n. D merupakan variabel dependen. �
= Intersep �
�
= koefisien atau timbangan diskriminan dari variabel independen ke- j.
�
��
= Variabel independen ke-j dari responden ke-i.
2.8.2 Tujuan Analisis Diskriminan
1. Membuat suatu fungsi diskriminan atau kombinasi linier dari prediktor atau
variabel bebas yang bisa mendiskriminasi atau membedakan kategori variabel tak bebas atau criterion atau kelompok, artinya mampu
membedakan suatu objek masuk kelompok kategori yang mana.
2. Menguji apakah ada perbedaan signifikan antara kategorikelompok,
dikaitkan dengan variabel bebas atau prediktor.
3. Menentukan prediktorvariabel bebas yang mana yang memberikan
sumbangan terbesar terhadap terjadinya perbedaan antar kelompok.
4. Mengklarifikasimengelompokkan objekkasus kedalam suatu
kelompokkategori didasarkan pada nilai variabel bebas.
5. Mengevaluasi keakuratan klasifikasi.
2.8.3 Asumsi Analisis Diskriminan
Asumsi-asumsi yang harus dipenuhi untuk analisis diskriminan adalah: 1.
Variabel independen seharusnya berdistribusi normal multivariat MultivariateNormality, jika data tidak berdistribusi normal,akan
menyebabkan masalah pada ketepatan fungsi model diskriminan. 2.
Matriks varians kovarians grup dari semua variabel independen seharusnya sama.
Universitas Sumatera Utara
3. Tidak ada data yang sangat ekstrim outlier pada variabel independen, jika
ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan
4. Tidak ada korelasi yang kuat antar-variabel independen , jika dua variabel
independen mempunyai korelasi yang kuat,dikatakan terjadi multikolinieritas, untuk mengetahui adanya multikolinieritas dapat
dilakukan dengan melihat korelasi antar variabel independen r yaitu jika nilai r 0.6 menunjukkan adanya multikolinieritas.
2.8.4 Langkah-langkah Analisis Diskriminan
1. Pemilihan variabel dependen dan independen Variabel dependen merupakan variabel kategorik sedangkan variabel independen
merupakan variabel numerik. Analisis diskriminan dibedakan menjadi dua yaitu :
a Analisis diskriminan dua kategorikelompok, dimana variabel dependen dikelompokkan menjadi 2 dikotomi, diperlukan satu fungsi diskriminan.
b Analisis diskriminan berganda Multiple Discriminant AnalysisMDA, dimana variabel dependen dikelompokkan menjadi 1. lebih dari 2 kelompok
multikotomi, diperlukan fungsi diskriminan sebanyak k-1 kalau ada k kategori.
2. Melakukan uji equality Untuk memenuhi asumsi bahwa semua variabel independen harus equal
dilihat pada significancy dari Wilk’s Lambda jika nilai p 0,05 menunjukkan bahwa variabel equal. Untuk melihat bahwa variabel
tersebut equal, juga dilihat dari group covariance adalah relative sama
3. Pembentukan fungsi diskriminan
a Pembentukan Fungsi Linier teoritis
Universitas Sumatera Utara
Fungsi diskriminan merupakan fungsi atau kombinasi linier peubah- peubah asal yang akan menghasilkan cara terbaik dalam pemisahan
kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai yang sedekat mungkin dalam kelompok dan sejauh mungkin antar kelompok. Apabila
fungsi diskriminan yang terbentuk sebanyak lebih dari satu fungsi, maka dapat dikatakan bahwa fungsi diskriminan pertama akan menjadi kekuatan
pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya. Misalnya ada kelompokkategori sebanyak G, dimana masing-
masing kelompok terdapat sebanyak n objek elemen atau responden sebagai sampel maka:
�̅
�
= 1
�
�
� �
�� �
� =1
2.11
Dengan: �̅
�
= vektor rata-rata sampel dalam kelompok ke-i �
�
= banyaknya elemen objek ke-i �
��
= menyatakan variabel x ke-j dalam kelompok ke-i
Kemudian dengan mendefinisikan vektor rata-rata keseluruhan. � =
1 � � �̅
� �
�=1
2.12
Dengan: � = vektor rata-rata keseluruhan
� = banyaknya kelompok �̅
�
= vektor rata-rata sampel dalam kelompok ke-i Maka didapat:
� = ��̅
�
− ��̅
�
− �
� �=1
′2.14
Universitas Sumatera Utara
Dengan:
� = metrik jumlah kuadrat dan jumlah cross products antar kelompok �̅
�
= vektor rata-rata sampel dalam kelompok ke-i � = vektor rata-rata keseluruhan
�̅
�
− �′ = transpos dari �̅
�
− �
Sehingga:
� = ��
�
− 1�
� �
�=1
= � ���
��
− �̅
�
���
��
− �̅
�
�
�
�
�=1 �
�=1
2.14 Dengan:
� = matriks sampel dalam grup �
�
= matriks varians kovarians kelompok ke-i
Matriks varians kovarians untuk sebuah sampel ukuran n yang terdiri atas p buah variabel
�
1
, �
2
, �
3
, … , �
�
disusun dalam sebuah matriks yang disebut dengan matriks varians-kovarians S dengan bentuk sebagai
berikut:
� = ⎝
⎜ ⎜
⎛ �
11
�
12
�
13
… �
1 �
�
21
�
22
�
23
… �
2 �
�
31
.. .
�
�1
�
32
.. .
�
�2
�
33
.. .
�
�3
… ..
. …
�
3 �
.. .
�
��
⎠ ⎟
⎟ ⎞
2.15
Dimana �
��
= 1
� − 1 ���
��
− �̅
�
���
��
− �̅
�
�
� � =1
2.16 Matriks varians-kovarians
gabungannya dapat dihitung dengan menggunakan rumus sebagai berikut:
Universitas Sumatera Utara
�
������
=
�
1
− 1�
1
+ �
2
− 1�
2
+ �
3
− 1�
3
+ ⋯+�
�
− 1�
�
�
1
+ �
2
+ �
3
+ ⋯+�
�
−�
2.17 Atau
�
������
=
� �
1
+ �
2
+ ⋯+�
�
−�
2.18
Fungsi diskriminan yang terbentuk mempunyai bentuk umum berupa Fisher’s Sample Linear Discriminant Function persamaan linier yaitu:
� = ��
′
� 2.19
Dengan: a = Vektor koefisien pembobot fungsi diskriminan
��′= tranpose �� Y = Variabel terikat skor diskriminan
X = Variabel bebas Vektor variabel acak yang dimasukkan ke dalam fungsi diskriminan.
Agar dapat mendiskriminasi kelompok secara maksimal, fungsi diskriminan Y harus diestimasi untuk memaksimumkan variabel antar
kelompok. Koefisien � dihitung dengan membuat
� maksimum, yaitu:
��′��� ��′���
=
��
′
�∑ �̅
�
−��̅
�
−�
� �=1
′��� ��
′
∑ ∑
��
��
− �̅
�
���
��
− �̅
�
���
�� � =1
� �=1
2.20
Biarkan
�̂
1
+ �̂
2
+ ⋯ + �̂
�
menunjukkan
� ≤ min� − 1, �
eigenvalue dari matriks
�
−1
B
dan �̂
1
, ⋯ , �̂
�
menjadi eigen vektor. Untuk menyelesaikan
� ≤ min� − 1, �
eigenvalue dari matriks
�
−1
B
, dengan menggunakan rumus:
�
−1
� −
�
��� = 0 2.21
Nilai
�
maksimum merupakan nilai eigen value terbesar dari matriks
�
−1
B
dan ��′ adalah associated eigenvektors. Elemen a, seperti �
1
sampai dengan
Universitas Sumatera Utara
�
�
merupakan koefisien fungsi diskriminan, berasosiasi dengan fungsi diskriminan pertama. Pada umumnya, dimungkinkan untuk mengestimasi
sampai eigen value terkecil yaitu yang ke G-1 atau k fungsi diskriminan masing-masing dengan eigenvaluenya. Maksudnya, setiap fungsi
diskriminan mempunyai nilai eigenvalue dan nilai eigen value ini semakin mengecil dari fungsi ke fungsi.
b Fungsi Linier dengan bantuan SPSS Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model
dapat dilihat pada tabel Canonical Discriminant Function Coefficient. Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient
bagian Unstandardized diaktifkan.
c Menghitung Discriminant Score nilai diskriminan Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan
untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya.
d Perhitungan Hit Ratio Setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit
ratio yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi. Misalkan ada sebanyak n observasi, akan dibentuk
fungsi linier dengan observasi sebanyak n-1. Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi
keanggotaannya dengan fungsi yang sudah dibentuk tadi. Proses ini akan diulang dengan kombinasi observasi yang berbedabeda, sehingga fungsi
linier yang dibentuk ada sebanyak n. Inilah yang disebut dengan metode Leave One Out.
e Kriteria Posterior Probability Aturan pengklasifikasian yang ekivalen dengan model linier Fisher ialah
berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu x
Universitas Sumatera Utara
berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan
option probabilities of group membership pada bagian Save di kotak dialog utama.
f Akurasi Statistik Dapat di uji secara statistik apakah klasifikasi yang dilakukan dengan
menggunakan fungsi diskriminan akurat atau tidak. Uji statistik tersebut ialah prees-Q Statistik. Ukuran sederhana ini membandingkan jumlah
kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari perhitunngan kemudian dibandingkan
dengan nilai kritis critical velue yang diambil dari tabel Chi-Square dan tingkat keyakinan sesuai yang diinginkan. Statistik Q ditulis dengan
rumus:
����� − � =
[ �−�� ]
2
��−1
2.22 Dengan:
N= jumlah populasi n = jumlah sampel
k = jumlah grup
Universitas Sumatera Utara
1
BAB1
PENDAHULUAN
1.1 LATAR BELAKANG