2.4 Analisis Diskriminan Analisis Fungsi Pembeda
Analisis Diskriminan merupakan suatu analisis multivariat yang digunakan untuk mengelompokkan suatu individu atau objek ke dalam suatu kelompok yang telah
ditentukan sebelumnya berdasarkan variabel-variabel tertentu. Analisis diskriminan dapat digunakan jika variabel dependen terdiri dari dua kelompok atau lebih
kelompok. Pengelompokkan pada analisis bersifat apriori, artinya seorang peneliti sudah mengetahui sebelumnya individu atau objek mana saja yang masuk ke dalam
kelompok 1, 2, dan 3. Analisis diskriminan memiliki kemiripan dengan regresi linier berganda
multivariable regression
. Perbedaannya adalah analisis diskriminan dipakai jika variabel dependennya kategori menggunakan skala ordinal ataupun
nominal dan variabel independennya menggunakan skala metrik interval dan rasio. Sedangkan dalam regresi berganda variabel dependennnya harus metrik dan
variabelnya independen dapat berupa metrik maupun nonmetrik. Sama halnya dengan regresi berganda, dalam analisis diskriminan pun variabel dependen hanya satu
sedangkan variabel independen banyak
multiple
. Ada dua hal dalam analisis diskriminan, yaitu pengelompokan dan identifikasi sifat khas suatu kelompok yang
dapat dilakukan sekaligus dengan analisis tersebut, dimana kelompok dikenal sebagai
group
dan sifat khas dikenal sebagai variabel pembeda
discriminating variables
. Antara kelompok dan variabel pembeda tersebut kemudian dibuat suatu hubungan
fungsional yang disebut dengan fungsi diskriminan.
2.4.1 Hal-hal pokok tentang analisis diskriminan
Bentuk multivariat dari analisis diskriminan adalah dependen sehingga variabel dependen adalah variabel yang menjadi dasar pada analisis diskriminan. Variabel
dependen bisa berupa kode grup 1 atau grup 2 atau lainnya.
Tujuan diskriminan secara umum adalah:
1. Ingin mengetahui apakah ada perbedaan yang jelas antar-grup pada variabel
dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota kelompok
1 dengan anggota kelompok 2?
Universitas Sumatera Utara
2. Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan
yang membuat perbedaan tersebut? 3.
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.
4. Melakukan klasifikasi terhadap objek dalam terminology SPSS disebut baris,
Apakah suatu objek bisa nama orang, nama tumbuhan, benda atau lainnya termasuk pada kelompok 1 atau kelompok lainnya.
Proses dasar dari analisis diskriminan ialah: a.
Memisah variabel-variabel menjadi variabel dependen dan variabel independen. b.
Menentukan metode untuk membuat Fungsi Diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yakni :
Simultaneous Estimation,
dimana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses analisis diskriminan.
Step-Wise Estimation,
dimana variabel dimasukkan satu persatu kedalam model diskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada
model dan ada kemungkinan satu atau lebih variabel independen yang „dibuang‟ dari model.
c. Menguji signifikansi dari fungsi diskriminan yang telah terbentuk,
menggunakan Wilk‟s lambda,
F
test dan lainnya. d.
Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui ketepatan klasifikasi secara individual dengan
Casewise Diagnostics.
e. Melakukan interpretasi terhadap fungsi diskriminan tersebut.
f. Melakukan uji validitas fungsi diskriminan.
Berikut ini beberapa asumsi yang harus dipenuhi agar model diskriminan dapat digunakan:
1.
Multivariate Normality,
atau variabel independen seharusnya berdistribusi normal, hal ini akan menyebabkan masalah pada ketepatan fungsi model
diskriminan. Regresi logistik
Logistic Regression
bisa dijadikan alternatif metode jika memang data tidak berdistribusi normal. Tujuan uji normal adalah
ingin mengetahui apakah distribusi data dengan bentuk lonceng
bell shaped
. Data yang
„baik‟ adalah data yang mempunyai pola seperti distribusi normal,
Universitas Sumatera Utara
yakni distribusi data tersebut tidak menceng ke kiri atau menceng ke kanan. Uji normalitas pada statistika multivariat sebenarnya sangat kompleks, karena harus
dilakukan pada seluruh variabel secara bersama-sama. Namun, uji ini bisa juga dilakukan pada setiap variabel dengan logika bahwa jika secara individual
masing-masing variabel memenuhi asumsi normalitas, maka secara bersama sama multivariat variable-variabel tersebut juga bisa dianggap memenuhi
asumsi normalitas. Hipotesis pengujiannya adalah sebagai berikut:
H
: Data berdistribusi normal.
H
1
: Data tidak berdistribusi normal Titik keputusan:
Bila
P 0,05
maka
H
diterima yang berarti data berdistribusi normal. Bila
P≤0,05 maka
H
ditolak yang berarti data tidak berdistribusi normal.
Jika sebuah variabel mempunyai sebaran data yang tidak normal, maka perlakuan yang dimungkinkan agar menjadi normal, Santoso, 2010:
a. Menambah jumlah data. Seperti pada kasus, bisa dicari 20 atau 30 atau
sejumlah data baru untuk menambah ke-75 data berat badan konsumen yang sudah ada. Kemudian dengan jumlah data yang baru, dilakukan pengujian
sekali lagi. b.
Menghilangkan data yang dianggap penyebab tidak normalnya data. Seperti pada variabel berat, jika dua data yang outlier dibuang, yakni berat 100 dan
120, kemudian diulang proses pengujian, mungkin data bisa menjadi normal. Jika belum normal, ulangi pengurangan data yang dianggap penyebab
ketidaknormalan data.
Namun demikian,
pengurangan data
harus dipertimbangkan apakah tidak mengaburkan tujuan penelitian karena hilangnya
data-data yang seharusnya ada. c.
Dilakukan transformasi data, misal mengubah data ke logaritma atau kebentuk natural ln atau bentuk lainnya, kemudian dilakukan pengujian ulang.
d. Data diterima apa adanya, memang dianggap tidak normal dan tidak perlu
dilakukan berbagai
treatment.
Untuk itu, alat analisis yang dipilih harus diperhatikan, seperti untuk multivariate mungkin faktor analisis tidak begitu
mementingkan asumsi kenormalan. Atau pada kasus statistik univariat, bias dilakukan alat analisis nonparametrik, Santoso, 2010.
Universitas Sumatera Utara
2. Matriks varians-kovarians variabel penjelas berukuran
P xP
pada kedua kelompok harus sama.
2.4.2 Algoritma dan model matematis