Hal-hal pokok tentang analisis diskriminan

2.4 Analisis Diskriminan Analisis Fungsi Pembeda

Analisis Diskriminan merupakan suatu analisis multivariat yang digunakan untuk mengelompokkan suatu individu atau objek ke dalam suatu kelompok yang telah ditentukan sebelumnya berdasarkan variabel-variabel tertentu. Analisis diskriminan dapat digunakan jika variabel dependen terdiri dari dua kelompok atau lebih kelompok. Pengelompokkan pada analisis bersifat apriori, artinya seorang peneliti sudah mengetahui sebelumnya individu atau objek mana saja yang masuk ke dalam kelompok 1, 2, dan 3. Analisis diskriminan memiliki kemiripan dengan regresi linier berganda multivariable regression . Perbedaannya adalah analisis diskriminan dipakai jika variabel dependennya kategori menggunakan skala ordinal ataupun nominal dan variabel independennya menggunakan skala metrik interval dan rasio. Sedangkan dalam regresi berganda variabel dependennnya harus metrik dan variabelnya independen dapat berupa metrik maupun nonmetrik. Sama halnya dengan regresi berganda, dalam analisis diskriminan pun variabel dependen hanya satu sedangkan variabel independen banyak multiple . Ada dua hal dalam analisis diskriminan, yaitu pengelompokan dan identifikasi sifat khas suatu kelompok yang dapat dilakukan sekaligus dengan analisis tersebut, dimana kelompok dikenal sebagai group dan sifat khas dikenal sebagai variabel pembeda discriminating variables . Antara kelompok dan variabel pembeda tersebut kemudian dibuat suatu hubungan fungsional yang disebut dengan fungsi diskriminan.

2.4.1 Hal-hal pokok tentang analisis diskriminan

Bentuk multivariat dari analisis diskriminan adalah dependen sehingga variabel dependen adalah variabel yang menjadi dasar pada analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau grup 2 atau lainnya. Tujuan diskriminan secara umum adalah: 1. Ingin mengetahui apakah ada perbedaan yang jelas antar-grup pada variabel dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota kelompok 1 dengan anggota kelompok 2? Universitas Sumatera Utara 2. Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan tersebut? 3. Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi. 4. Melakukan klasifikasi terhadap objek dalam terminology SPSS disebut baris, Apakah suatu objek bisa nama orang, nama tumbuhan, benda atau lainnya termasuk pada kelompok 1 atau kelompok lainnya. Proses dasar dari analisis diskriminan ialah: a. Memisah variabel-variabel menjadi variabel dependen dan variabel independen. b. Menentukan metode untuk membuat Fungsi Diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yakni :  Simultaneous Estimation, dimana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses analisis diskriminan.  Step-Wise Estimation, dimana variabel dimasukkan satu persatu kedalam model diskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model dan ada kemungkinan satu atau lebih variabel independen yang „dibuang‟ dari model. c. Menguji signifikansi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk‟s lambda, F test dan lainnya. d. Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui ketepatan klasifikasi secara individual dengan Casewise Diagnostics. e. Melakukan interpretasi terhadap fungsi diskriminan tersebut. f. Melakukan uji validitas fungsi diskriminan. Berikut ini beberapa asumsi yang harus dipenuhi agar model diskriminan dapat digunakan: 1. Multivariate Normality, atau variabel independen seharusnya berdistribusi normal, hal ini akan menyebabkan masalah pada ketepatan fungsi model diskriminan. Regresi logistik Logistic Regression bisa dijadikan alternatif metode jika memang data tidak berdistribusi normal. Tujuan uji normal adalah ingin mengetahui apakah distribusi data dengan bentuk lonceng bell shaped . Data yang „baik‟ adalah data yang mempunyai pola seperti distribusi normal, Universitas Sumatera Utara yakni distribusi data tersebut tidak menceng ke kiri atau menceng ke kanan. Uji normalitas pada statistika multivariat sebenarnya sangat kompleks, karena harus dilakukan pada seluruh variabel secara bersama-sama. Namun, uji ini bisa juga dilakukan pada setiap variabel dengan logika bahwa jika secara individual masing-masing variabel memenuhi asumsi normalitas, maka secara bersama sama multivariat variable-variabel tersebut juga bisa dianggap memenuhi asumsi normalitas. Hipotesis pengujiannya adalah sebagai berikut: H : Data berdistribusi normal. H 1 : Data tidak berdistribusi normal Titik keputusan: Bila P 0,05 maka H diterima yang berarti data berdistribusi normal. Bila P≤0,05 maka H ditolak yang berarti data tidak berdistribusi normal. Jika sebuah variabel mempunyai sebaran data yang tidak normal, maka perlakuan yang dimungkinkan agar menjadi normal, Santoso, 2010: a. Menambah jumlah data. Seperti pada kasus, bisa dicari 20 atau 30 atau sejumlah data baru untuk menambah ke-75 data berat badan konsumen yang sudah ada. Kemudian dengan jumlah data yang baru, dilakukan pengujian sekali lagi. b. Menghilangkan data yang dianggap penyebab tidak normalnya data. Seperti pada variabel berat, jika dua data yang outlier dibuang, yakni berat 100 dan 120, kemudian diulang proses pengujian, mungkin data bisa menjadi normal. Jika belum normal, ulangi pengurangan data yang dianggap penyebab ketidaknormalan data. Namun demikian, pengurangan data harus dipertimbangkan apakah tidak mengaburkan tujuan penelitian karena hilangnya data-data yang seharusnya ada. c. Dilakukan transformasi data, misal mengubah data ke logaritma atau kebentuk natural ln atau bentuk lainnya, kemudian dilakukan pengujian ulang. d. Data diterima apa adanya, memang dianggap tidak normal dan tidak perlu dilakukan berbagai treatment. Untuk itu, alat analisis yang dipilih harus diperhatikan, seperti untuk multivariate mungkin faktor analisis tidak begitu mementingkan asumsi kenormalan. Atau pada kasus statistik univariat, bias dilakukan alat analisis nonparametrik, Santoso, 2010. Universitas Sumatera Utara 2. Matriks varians-kovarians variabel penjelas berukuran P xP pada kedua kelompok harus sama.

2.4.2 Algoritma dan model matematis