Aplikasi Analisis Diskriminan dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil
APLIKASI ANALISIS DISKRIMINAN DALAM PENENTUAN
FAKTOR-FAKTOR YANG MEMPENGARUHI KELULUSAN
SISWA SMPN 1 GUNUNG MERIAH KABUPATEN
ACEH SINGKIL
SKRIPSI
ASTRIA PUJI ASTUTI
060803053
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2010
(2)
APLIKASI ANALISIS DISKRIMINAN DALAM PENENTUAN
FAKTOR-FAKTOR YANG MEMPENGARUHI KELULUSAN
SISWA SMPN 1 GUNUNG MERIAH KABUPATEN
ACEH SINGKIL
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
ASTRIA PUJI ASTUTI
060803053
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2010
(3)
PERSETUJUAN
Judul : APLIKASI ANALISIS DISKRIMINAN DALAM
PENENTUAN FAKTOR-FAKTOR YANG
MEMPENGARUHI KELULUSAN SISWA SMPN 1 GUNUNG MERIAH KABUPATEN ACEH
SINGKIL
Kategori : SKRIPSI
Nama : ASTRIA PUJI ASTUTI
Nomor Induk Mahasiswa : 060803053
Program Studi : SARJANA (SI) MATEMATIKA
Departemen : MATEMATIKA
Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA
Diluluskan di
Medan, November 2010
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Drs. Suwarno Ariswoyo, M.Si. Dr. Sutarman, M.Sc
NIP. 195003211980031001 NIP. 196310261991031001
Diketahui/Disetujui oleh
Departemen Matematika FMIPA USU Ketua,
Dr. Saib Suwilo, M.Sc. NIP: 194601091988031004
(4)
PERNYATAAN
APLIKASI ANALISIS DISKRIMINAN DALAM PENENTUAN
FAKTOR-FAKTOR YANG MEMPENGARUHI KELULUSAN
SISWA SMPN 1 GUNUNG MERIAH KABUPATEN
ACEH SINGKIL
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, Desember2010
Astria Puji Astuti 060803053
(5)
Puji dan syukur penulis panjatkan ke hadirat Allah SWT Yang Maha Esa dan Kuasa atas limpahan rahmat dan karunia-Nya sehingga skripsi ini dapat diselesaikan.
Skripsi ini merupakan salah satu syarat yang harus dipenuhi dan diselesaikan oleh seluruh mahasiswa Fakultas FMIPA Departemen Matematika. Pada skripsi ini penulis mengambil judul skripsi tentang Aplikasi Analisis Diskriminan dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil.
Dalam penyusunan skripsi ini banyak pihak yang membantu, sehingga dengan segala rasa hormat penulis mengucapkan terima kasih kepada:
1.
Bapak Dr. Sutarman, M.Sc. selaku Dekan FMIPA USU.2.
Bapak Dr. Saib Suwilo M.Sc dan Bapak Drs. Henry Rani Sitepu, M.si selaku ketua dan sekretaris Departemen Matematika FMIPA USU.3. Dr. Sutarman, M.Sc. selaku dosen dan pembimbing I yang berkenan dan rela mengorbankan waktu, tenaga dan pikiran guna memberikan petunjuk dan bimbingannya dalam penulisan skripsi ini.
4. Drs. Suwarno Ariswoyo, M.Si. selaku dosen dan pembimbing II yang juga berkenan dan rela mengorbankan waktu, tenaga dan pikiran guna memberikan petunjuk dan bimbingannya dalam penulisan skripsi ini.
5. Bapak Prof . Dr. Herman Mawengkang dan Drs. H. Haluddin Panjaitan selaku komisi penguji atas masukan dan saran yang telah diberikan demi perbaikan skripsi ini.
6.
Ibu Dra. Ester Sorta M. Nababan, M.Sc selaku Penasehat Akademik.7. Teristimewa kepada Ayahanda Asmuddin dan Ibunda tercinta Sutia, yang telah memberikan kasih sayang semangat dan doa yang tiada pernah berhenti buat saya, serta adik-adikku tersayang Dwi Rizky Septriadi dan Tiastri Marshanda Ridha dan juga saudara-saudaraku tercinta yang telah memberikan perhatian dan dorongan serta bantuan kepada penulis sehingga penulis bisa menyelesaikan pendidikan S-1 di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara. 8. Sahabatku Mahater, Linda, Zuanda, Aghni, Fikoh, Rina, Agung, Afrida wati,
Annisa, Edy, Azwar, Yudha, Iqbal, Daniel, Ali, Novi, yessy, Andri dan masih banyak lagi yang tak tersebutkan namanya yang telah banyak membantu penulis dengan memberikan semangat dan doa dalam menyelesaikan tulisan ini.
9. Buat sahabat hatiku Khairul Hadi,SP yang selalu memberikan semangat dan motivasi kepada penulis dalam menyelesaikan tulisan ini.
10.Buat senior-seniorku kholizha, Rini, Amin, Radi, Toni, Dika, Santri dan masih banyak lagi yang tak tersebutkan namanya yang telah banyak membantu penulis dengan memberikan semangat dan doa dalam menyelesaikan tulisan ini.
11.Buat junior-juniorku Risky, Nelly, Kessy, Memel, Zulham, Dian, Warsini dan masih banyak lagi yang tak tersebutkan namanya yang telah banyak membantu penulis dengan memberikan semangat dan doa dalam menyelesaikan tulisan ini.
(6)
Penulis juga menyadari masih banyak kekurangan dalam skripsi ini, baik dalam teori maupun penulisannya. Oleh karena itu, penulis mengharapkan saran dari pembaca demi perbaikan bagi penulis, semoga segala kebaikan dalam bentuk bantuan yang telah diberikan mendapat balasan dari Allah SWT.
Akhirnya penulis berharap agar kiranya tulisan ini bermanfaat bagi para pembaca.
Medan, Desember 2010 Penulis
Astria Puji Astuti
(7)
ABSTRAK
Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah dapat dibedakan mana variabel respon dan mana variabel penjelas ). Dalam Analisis Diskriminan dibutuhkan asumsi data harus berdistribusi normal multivariate. Penggunaan Analisis Diskriminan dalam penelitian ini bertujuan untuk menentukan variabel-variabel yang menentukan kelulusan siswa di SMPN 1 Gunung Meriah. Data yang digunakan dalam penelitian ini diperoleh dari SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Kemudian pengujian klasifikasinya dengan menggunakan uji Press’s Q. Dengan menggunakan analisis diskriminan diperoleh hasil penelitian yang menunjukkan bahwa ada 4 (empat) variabel yang berpengaruh terhadap kelulusan siswa SMPN 1 Gunung Meriah diantaranya X1 (nilai UNAS SD), X2 (nilai UAS SD), X4 (nilai Tryout) dan X5 (nilai UAS SMP). Dari keempat faktor tersebut yang sangat dominan mempengaruhi kelulusan siswa di SMPN 1 Gunung Meriah adalah X4 (nilai Tryout). Dan model yang dihasilkan dengan menggunakan Analisis Diskriminan mempunyai tingkat accuracy
klasifikasi sebesar 78,6%.
(8)
ABSTRACT
Discriminant analysis is one of statistical technique that can be used on the dependency relationship (intervariable relationship which can be distinguished where the response variable and where the explanatory variables). Discriminant analysis of the assumptions required in the data must be multivariate normal distribution. Use of Discriminant Analysis in this study aims to determine the variables that determine students' graduation at SMPN 1 Gunung Meriah. Used data in this study obtained from SMPN 1 Gunung Meriah Aceh Singkil. Then classification test using Press's Q test. By using discriminant analysis of the research project shows that there are 4 (four) variables influencing the students' graduation SMPN 1 Gunung Meriah including X1 (value UNAS SD), X2 (UAS value SD), X4 (the tryout) and X5 (UAS value SMP). The four most dominant factors affecting students' graduation at SMPN 1 Gunung Meriah is X4 (the tryout). And the model generated by using Discriminant Analysis has a classification accuracy rate of 78.6%.
(9)
DAFTAR ISI
Halaman
Persetujuan i
Pernyataan ii
Penghargaan iii
Abstrak v
Abstract vi
Daftar Isi vii
Daftar Tabel ix
Daftar Lampiran x
Bab 1 PENDAHULUAN 1
1.1Latar Belakang 1
1.2Perumusan Masalah 3
1.3Pembatasan Masalah 3
1.4Tinjauan Pustaka 3
1.5Tujuan Penelitian 6
1.6Kontribusi Penelitian 6
1.7Metodologi Penelitian 7
Bab 2 LANDASAN TEORI 9
2.1 Variabel 9
2.2 Data 10
2.2.1 Data ditinjau dari Aspek Sifatnya 10
2.2.2 Data ditinjau dari Aspek Waktu 10
2.3 Analisis Korelasi 11
2.3.1 Macam-macam Analisis Korelasi 12
(10)
2.4 Analisis Regresi 15
2.5 Regresi Linier Ganda 17
2.6 Analisis Diskriminan 18
2.6.1 Hal-hal Pokok Tentang Analisis Diskriminan 19 2.6.2 Klasifikasi dengan Dua Populasi Multivariat Normal 21 2.6.3 Format Data Dasar dan Program Komputer yang digunakan 25 2.6.4 Algoritma Pokok Analisis dan Model Matematis 25
2.7 Pengujian Hipotesis 31
Bab 3 METODE PENELITIAN 33
3.1 Pengumpulan Data 33
3.1.1 Sumber Data 33
3.1.2 Populasi 33
3.2 Analisis Data 34
3.2.1 Interpretasi Output 46
3.2.2 Akurasi Statistik 52
Bab 4 KESIMPULAN DAN SARAN 55
4.1 Kesimpulan 55
4.2 Saran 56
DAFTAR PUSTAKA 57
LAMPIRAN 59
(11)
DAFTAR TABEL
Halaman
Tabel 2.1 Tabel Format Data untuk Analisis Diskriminan 25 Tabel 3.1 Jumlah kelas III SMPN 1 Gunung Meriah Kab. Aceh Singkil 34
Tabel 3.2 Jumlah Sampel Penelitian 34 Tabel 3.3 Korelasi antara Variabel dalam Populasi 36
Tabel 3.4 Interpretasi Koefisien Korelasi 36
Tabel 3.5 Uji Kesamaan Rata-rata 39
Tabel 3.6 Hasil Output Uji Kesamaan Matriks Covarians 39
Tabel 3.7 Hasil Uji Box’s M 39
Tabel 3.8 Grup StatistiK 46
Tabel 3.9 Variables Entered/ 47
Tabel 3.10 Variabel dalam Analisis 47
Tabel 3.11 Variabel yang Tidak Masuk dalam Analisis 48
Tabel 3.12 Nilai Eigen 48
Tabel 3.13 Wilk’s Lambda 49
Tabel 3.14 Struktur Matriks 49
Tabel 3.15 Koefisien Fungsi Diskriminan Kanonik 50
Tabel 3.16 Fungsi pada Grup Terpusat 50
Tabel 3.17 Peluang Utama untuk Grup 51
Tabel 3.18 Hasil Klasifikasi 52
(12)
DAFTAR LAMPIRAN
Halaman
Lampiran A : Data variabel siswa 59
Lampiran B : Data Nilai UNAS SD 61
Lampiran C : Data Nilai UAS SD 63
Lampiran D : Data Nilai Raport Siswa 65
Lampiran E : Data Nilai Tryout SMP 67
Lampiran F : Data Nilai UAS SMP 69
Lampiran G : Hasil Outpot SPSS 71
Lampiran H : Angket Penelitian 85
Lampiran I : Tabel Distribusi F untuk = 0,05 87
Lampiran J : Tabel Distribusi Student’s (t) 88
(13)
ABSTRAK
Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah dapat dibedakan mana variabel respon dan mana variabel penjelas ). Dalam Analisis Diskriminan dibutuhkan asumsi data harus berdistribusi normal multivariate. Penggunaan Analisis Diskriminan dalam penelitian ini bertujuan untuk menentukan variabel-variabel yang menentukan kelulusan siswa di SMPN 1 Gunung Meriah. Data yang digunakan dalam penelitian ini diperoleh dari SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Kemudian pengujian klasifikasinya dengan menggunakan uji Press’s Q. Dengan menggunakan analisis diskriminan diperoleh hasil penelitian yang menunjukkan bahwa ada 4 (empat) variabel yang berpengaruh terhadap kelulusan siswa SMPN 1 Gunung Meriah diantaranya X1 (nilai UNAS SD), X2 (nilai UAS SD), X4 (nilai Tryout) dan X5 (nilai UAS SMP). Dari keempat faktor tersebut yang sangat dominan mempengaruhi kelulusan siswa di SMPN 1 Gunung Meriah adalah X4 (nilai Tryout). Dan model yang dihasilkan dengan menggunakan Analisis Diskriminan mempunyai tingkat accuracy
klasifikasi sebesar 78,6%.
(14)
ABSTRACT
Discriminant analysis is one of statistical technique that can be used on the dependency relationship (intervariable relationship which can be distinguished where the response variable and where the explanatory variables). Discriminant analysis of the assumptions required in the data must be multivariate normal distribution. Use of Discriminant Analysis in this study aims to determine the variables that determine students' graduation at SMPN 1 Gunung Meriah. Used data in this study obtained from SMPN 1 Gunung Meriah Aceh Singkil. Then classification test using Press's Q test. By using discriminant analysis of the research project shows that there are 4 (four) variables influencing the students' graduation SMPN 1 Gunung Meriah including X1 (value UNAS SD), X2 (UAS value SD), X4 (the tryout) and X5 (UAS value SMP). The four most dominant factors affecting students' graduation at SMPN 1 Gunung Meriah is X4 (the tryout). And the model generated by using Discriminant Analysis has a classification accuracy rate of 78.6%.
(15)
Bab 1
PENDAHULUAN
1.1 Latar Belakang
Dalam upaya meningkatkan Sumber Daya Manusia (SDM) yang bermutu, bidang pendidikan memegang peranan penting. Dengan pendidikan diharapkan kemampuan mutu pendidikan dan martabat manusia Indonesia dapat ditingkatkan. Upaya meningkatkan SDM dilakukan melalui jalur pendidikan dasar, pendidikan menengah, dan pendidikan tinggi. Perkembangan ilmu pengetahuan dan teknologi menuntut peningkatan mutu pendidikan. Peningkatan mutu pendidikan dapat dilakukan dengan melakukan perbaikan, perubahan dan pembaharuan terhadap faktor-faktor yang mempengaruhi keberhasilan pendidikan. Salah satu parameter yang digunakan untuk mengukur tingkat keberhasilan pendidikan adalah prestasi belajar siswa. Prestasi belajar dipengaruhi oleh dua faktor yaitu faktor intern dan faktor eksteren. Faktor intern yaitu faktor yang berasal dari dalam manusia yang terdiri dari: faktor biologis (karena sakit, karena kurang sehat, karena cacat tubuh) dan faktor psikologis (intelegensi, bakat, minat, motivasi, dan faktor kesehatan mental). Faktor ekstern yaitu faktor yang berasal dari luar diri manusia yang terdiri dari lingkungan keluarga, lingkungan sekolah dan lingkungan masyarakat dan media massa. Prestasi belajar adalah hasil suatu penilaian dibidang pengetahuan, keterampilan dan sikap sebagai hasil belajar yang dinyatakan dalam bentuk nilai.
Untuk mengevaluasi prestasi belajar pemerintah melaksanakan ujian nasional, yang merupakan kegiatan pengukuran dan penilaian kompetensi peserta didik secara nasional pada jenjang pendidikan. Pendidikan merupakan investasi jangka panjang yang memerlukan usaha dan dana yang cukup besar. Hal ini diakui oleh semua orang atau suatu bangsa demi kelangsungan masa depan. Demikian halnya dengan Indonesia menaruh harapan besar terhadap pendidikan dalam perkembangan masa depan bangsa ini, karena dari pendidikan pemuda menjadi harapan bangsa sebagai generasi penerus Universitas Sumatera Utara
(16)
dibentuk. Faktor utama untuk menilai kualitas pembelajaran dan kelulusan siswa dari suatu lembaga pendidikan, sering didasarkan pada hasil belajar siswa yang tertera pada nilai tes hasil belajar. Adapun faktor-faktor yang mempengaruhi kelulusan siswa diantaranya yaitu nilai UNAS SD, nilai UAS SD, nilai rapor, nilai tryout, nilai UAS SMP, lingkungan sekolah, pendidikan orang tua, penghasilan orang tua dan lain-lain. Dari faktor-faktor tersebut dapat kita ketahui faktor apa saja yang menjadi faktor utama dalam penentuan kelulusan siswa dengan menggunakan metode analisis diskriminan.
Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antar faktor dimana sudah bisa dibedakan mana faktor respon dan mana faktor penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana faktor respon berupa data kualitatif dan faktor penjelas berupa data kuantitatif. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive) berdasarkan sejumlah faktor penjelas. Fungsi diskriminan ini dibentuk dengan memaksimumkan jarak antar kelompok, sehingga memiliki kemampuan untuk membedakan antar kelompok. Selain analisis diskriminan, analisis regresi logistik juga dapat digunakan untuk mengklasifikasikan suatu individu atau observasi kedalam kelompok yang saling bebas dan menyeluruh berdasarkan sejumlah faktor penjelas. Dalam penelitian ini menggunakan analisis diskriminan karena tujuan dalam penelitian ini adalah untuk melihat perbedaan antar kelompok beserta faktor-faktor apa saja yang paling membedakan antar kelompok tersebut, meskipun analisis regresi logistik juga dapat digunakan dalam hal ini, tetapi analisis diskriminan lebih sesuai untuk digunakan. Sedangkan jika tujuan analisis lebih bertujuan untuk melihat probabilitas suatu subjek diklasifikasikan ke kelompok tertentu sebaiknya menggunakan analisis regresi logistik. Analisis diskriminan dapat digunakan untuk menganalisis faktor-faktor yang mempengaruhi kelulusan siswa karena analisis diskriminan dapat memisahkan faktor lulus dengan faktor tidak lulus sehingga dapat dikatakan faktor-faktor tersebut mempengaruhi kelulusan siswa. Berdasarkan penjelasan tersebut penulis memilih judul “Aplikasi Analisis Diskriminan dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil “. Universitas Sumatera Utara
(17)
1.2 PERUMUSAN MASALAH
Berdasarkan uraian diatas, penulis merumuskan masalah sebagai berikut:
1. Faktor-faktor apa saja yang mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.
2. Bagaimana mengklasifikasikan nilai kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010 sesuai dengan faktor-faktor yang mempengaruhinya.
1.3 PEMBATASAN MASALAH
Penelitian ini dibatasi dalam beberapa hal, yaitu:
1. Penelitian ini hanya dilakukan di kelas 3 SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.
2. Hanya untuk mengkategorikan faktor-faktor yang mempengaruhi kelulusan siswa kelas 3 SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010 dengan menggunakan Analisis Diskriminan.
1.4 TINJAUAN PUSTAKA
Suryatmojo (2006), melakukan penelitian terhadap perilaku PNS Administrasi UNS berbelanja di toko KPRI UNS Surakarta dengan Analisis Diskriminan dan didapatkan hasil bahwa terdapat perbedaan perilaku belanja yang signifikan antara perilaku PNS Administrasi UNS yang sering berbelanja dengan yang jarang berbelanja ditoko KPRI UNS Surakarta.
Pengklasifikasian adalah salah satu analisis statistika yang diperlukan jika ada beberapa kelompok kemudian ingin diketahui apakah kelompok-kelompok tersebut memang berbeda secara statistika. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih faktor lain yang merupakan faktor independen. Kombinasi
(18)
linier dari faktor-faktor ini akan membentuk suatu fungsi diskriminan (Tatham et.al, 1998).
Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu: 1. Sejumlah p faktor penjelas harus berdistribusi normal.
2. Matriks varians-covarians faktor penjelas berukuran pada kedua kelompok harus sama.
Analisis diskriminan mirip dengan regresi linear berganda (multivariabel regression). Perbedaannya, analisis diskriminan dipakai kalau faktor dependennya kategoris (maksudnya kalau menggunakan sklala ordinal ataupun skala nominal) dan faktor independennya menggunakan skala metrik (interval dan rasio). Sedangkan dalam regresi independen, bisa metrik maupun nonmetrik. Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linier dari berbagai variabel independen, Simamora (2005).
Model analisis diskriminan berkenaan dengan kombinasi linear yang bentuknya sebagia berikut :
Di =b0 +b1Xi1+b2Xi2 +b3Xi3 + +bjXij + +bkXik
Dengan :
Di = nilai (skor) diskriminan dari responden (objek) ke-i. Dimana i = 1, 2, . . . , n. D merupakan variabel tak bebas.
ij
X = faktor (atribut) ke-j dari responden ke-i
j
b = koefisien atau timbangan diskriminan dari faktor atau atribut ke-j
ij
X = faktor bebas/prediktor ke-j dari responden ke-i, juga disebut atribut, seperti disebutkan diatas.
Koefisien atau timbangan (weigh) fungsi diskriminan bj diperkirakan sedemikian rupa sehingga kelompok (katagori) mempunyai nilai fungsi diskriminan (skor) yang sangat berbeda. Kalau ada dua katagori A dan B, nilai/skor fungsi diskriminan dari kelompok Universitas Sumatera Utara
(19)
yang satu (A) sangat berbeda dengan kelompok ke dua (B). kalau ada tiga kelompok A, B, dan C. Nilai fungsi diskriminan kelompok A sanngat berbeda dengan kelompok B dan sangat berbeda dengan kelompok C. Ini terjadi kalau rasio sum of squares
antara kelompok dengan sum of squares dalam kelompok untuk nilai/skor fungsi diskriminan maksimum atau rasio varian antar-kelompok dengan varian dalam kelompok sebesar mungkin (maksimum). Objek dalam kelompok homogen atau relatif homogen, sedangkan antar-kelompok sangat heterogen. Setiap kombinasi linear prediktor lainnya akan memberikan nilai rasio yang lebih kecil, Supranto (2004).
Menurut Maholtra (1999), analisis diskriminan terdiri dari lima tahap, yaitu :
1. Merumuskan masalah, tahap ini mencakup jawaban atas pertanyaan kenapa analisis diskriminan dilakukan (latar belakang masalah) dan apa tujuan analisis diskriminan, termasuk variabel-variabel apa yang dilibatkan.
2. Mengestimasi fungsi diskriminan, estimasi dapat dilakukan setelah sampel analisis diperoleh. Ada dua pendekatan umum yang diperoleh. Pertama, metode langsung (direct method), yaitu suatu cara mengestimasi fungsi diskriminan dengan melibatkan faktor-faktor prediktor sekaligus. Setiap faktor di masukkan tanpa memperhatikan kekuatan diskriminan masing-masing faktor. Metode ini baik kalau faktor-faktor prediktor dapat di terima secara teoritis. Kedua,
stepwise method dalam metode ini faktor prediktor di masukkan secara bertahap, tergantung pada kemampuannya melakukan diskriminan grup. Metode ini cocok kalau peneliti ingin memilih sejumlah faktor prediktor untuk membentuk fungsi diskriminan.
3. Memastikan signifikansi determinan. 4. Interpretasi output.
5. Uji signifikansi, tak ada gunanya mengintepretasi hasil analisis diskriminan kalau fungsinya tidak signifikan.
Suranto dan Riza (2005), melakukan penentuan strategi pemasaran berdasarkan perilaku konsumen dengan metode diskriminan, di dapat hasil bahwa model diskriminan yang ada ternyata valid dan dapat digunakan, karena mempunyai tingkat ketepatan prediksi dari model adalah 60,7%, yaitu lebih besar dari 50% dan juga mempunyai grup validasi silang yang terklasifikasi dengan baik sebesar 60,7% Universitas Sumatera Utara
(20)
sehingga terdapat perbedaan perilaku yang nyata antara konsumen yang sering berbelanja dengan mereka yang jarang berbelanja di PT. Gudang Rabat Alfa Retailindo. Untuk model diskriminan dengan tiga kelompok, pembagian faktor bebas tidak seperti kasus dua kelompok, yakni ‘langsung’ faktor A ke kelompok 1, faktor B ke kelompok 2 dan seterusnya. Pada kasus tiga kelompok, seluruh faktor bebas dilakukan proses reduksi faktor dahulu, yakni menjadi satu atau beberapa faktor. Setelah itu, setiap kelompok (sering, cukup dan jarang) akan ditentukan lebih cenderung masuk ke faktor yang mana. Jadi dasar pembagian adalah faktor dan bukan faktor bebas yang semula.
1.5 TUJUAN PENELITIAN
Adapun yang menjadi tujuan penelitian ini adalah :
1. Untuk mendiskriminan (mengelompokkan) faktor-faktor yang mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.
2. Untuk mengetahui faktor-faktor apa saja yang lebih dominan mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.
1.6 KONTRIBUSI PENELITIAN
Dapat memberikan manfaat bagi pembaca untuk lebih mengetahui dan memahami tentang analisis diskriminan. Selain itu tulisan ini diharapkan dapat di manfaatkan oleh sekolah sebagai bahan acuan dan pendukung untuk mengetahui faktor-faktor yang mempengaruhi kelulusan siswa.
(21)
1.7 METODOLOGI PENELITIAN
Penelitian ini di lakukan dengan beberapa langkah yaitu:
1. Pengumpulan Data
Data yang digunakan dalam penelitian ini adalah data primer dan data skunder. Data primer bersumber dari hasil wawancara terhadap responden dengan menggunakan angket (kuesioner) yang diberikan kepada responden. Sedangkan data skunder diperoleh dari hasil penilaian belajar siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil Tahun Ajaran 2009/2010. Populasi dalam penelitian ini adalah seluruh siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Dan populasi telah diketahui homogen dan diasumsikan bahwa populasi berdistribusi normal.
2. Pengolahan Data
Metode analisis data yang digunakan adalah teknik analisis diskriminan dengan bantuan SPSS dengan tahapan sebagai berikut:
1. Memisahkan faktor ke dalam faktor dependent dan faktor independent. 2. Analysis Case Processing Summary, tabel yang menyatakan bahwa
responden (jumlah kasus atau baris SPSS) semuanya valid (sah) untuk di proses, dapatmengetahui data yang hilang(missing).
3. Group Statistics, tabel yang menunjukkan jumlah responden yang mempunyai pengaruh terhadap kelulusan siswa yaitu lulus atau tidak lulus. 4. Test of Equality Group Means, tabel yang menunjukkan apakah terdapat
perbedaan yang signifikan untuk dua grupdiskriminan dengan berdasarkan uji F.
5. Variable Entered/Removed, tabel yang menyajikan dari tujuh faktor yang dapat dimasukkan (entered) dalam persamaan diskriminan.
6. Variable in The Analysis, tabel yang berisi rangkaian proses tahap sebelumnya, mengenai pemilihan faktor satu persatu yang dimasukkan ke dalam model.
(22)
7. Variable Not in The Analysis, tabel ini berisi ‘kebalikan’ dari tabel sebelumnya, yang memuat faktor yang akan dikeluarkan satu per-satu dari model.
8. Eigenvalues, interpretasi dari pengelompokkan faktor ke dalam satu atau lebih faktor yang dianalis.
9. Wilk’s Lambda, mengindikasi perbedaan yang signifikan (nyata) antara kedua grup dalam k model diskriminan berdasarkan angka Chi-Square. 10. Standardized Canonical Discriminant Function Coefficient, menentukan
faktor mana yang akan masuk ke faktor mana, dasar pemasukan faktor dilihat pada besar korelasi kanonikal, dengan korelasi terbesar masuk ke faktor yangbersangkutan.
11. Structure Matrix, menunjukkan faktor yang paling membedakan perilaku terhadap kelulusan siswa.
12. Functions At Group Centroid, tabel ini mengelompokkan ke dua grup dalam fungsi 1ataufungsi 2.
13. Casewise Statistics, tabel yang berisi rincian tiap kasus, penempatannya dalam model diskriminan serta perbandingan apakah penempatan (predicted) telah sesuai dengan kenyataan.
14.Classification Result, menunjukkan angka ketepatan prediksi dari model diskriminan. Pada umumnya ketepatan di atas 50% di anggap memadai atau valid.
d) Menarik kesimpulan, yaitu menyimpulkan hasil dari SPSS 17
(23)
Bab 2
LANDASAN TEORI
2.1 Variabel
Variabel adalah suatu sebutan yang dapat diberi nilai angka (kuantitatif) atau nilai mutu (kualitatif). Variabel merupakan pengelompokan secara logis dari dua atau lebih atribut dari objek yang diteliti. Misalnya: tidak sekolah, tidak tamat SD, tidak tamat SMP. Maka variabelnya adalah tingkat pendidikan dari objek penelitian itu. Variabel tingkat pendidikan merangkum semua atribut tadi.
Variabel merupakan suatu istilah yang berasal dari kata vary dan able yang berarti “berubah” dan “dapat”. Jadi kata variabel berarti dapat berubah. Oleh sebab itu setiap variabel dapat diberi nilai dan nilai itu berubah-ubah. Nilai itu berupa nilai kuntitatif maupun kualitatif. Dilihat dari segi nilainya, variabel dibedakan menjadi dua, yaitu variabel diskrit dan variabel kontinu. Variabel diskrit nilai kuantitatifnya selalu berupa bilangan bulat. Variabel kontinu nilai kuantitatifnya bisa berupa pecahan. (http://rakim-ypk.blogspot.com).
Variabel penelitian pada dasarnya adalah segala sesuatu yang berbentuk apa saja yang ditetapkan oleh peneliti untuk dipelajari sehingga diperoleh informasi tentang hal tersebut, kemudian ditarik kesimpulannya, (Sugiyono, 2007).
Menurut hubungan antara suatu variabel dengan variabel lainnya, variabel terbagi atas beberapa yaitu :
a. Variabel independent (independent variable) atau variabel bebas yaitu variabel yang menjadi sebab terjadinya (terpengaruhnya) variabel dependent (variabel tak bebas).
b. Variabel dependent (dependent variable) atau variabel tak bebas yaitu variabel yang nilainya dipengaruhi oleh variabel independent.
(24)
c. Variabel moderator yaitu variabel yang memperkuat atau memperlemah hubungan antara suatu variabel dependent dengan independent.
d. Variabel intervening, seperti variabel moderator, tetapi nilainya tidak dapat diukur, seperti kecewa, gembira, sakit hati, dsb.
e. Variabel kontrol, yaitu variabel yang dapat dikendalikan oleh peneliti.
2.2 DATA
Data merupakan kumpulan fakta atau angka atau segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai dasar penarikan kesimpulan. Data dapat dikelompokkan dalam beberapa golongan antara lain berdasarkan aspek sifat, dimensi waktu, cara memperoleh dan pengukurannya, muhidin (2009).
2.2.1 Data ditinjau dari Aspek sifat angka
Ditinjau dari aspek sifat angka, data digolongkan menjadi dua, yaitu:
1. Data diskrit, yaitu data yang satuannya merupakan bilangan bulat dan tidak berbentuk pecahan. Contohnya data mengenai jumlah pada sebuah PTN di Kota Bandung.
2. Data kontinu adalah data yang satuannya merupakan bilangan pecahan. Contohnya data mengenai rata-rata berat badan mahasiswa pada sebuah PTN di Kota Bandung.
2.2.2 Data ditinjau dari Aspek waktu
Ditinjau dari aspek waktu, data digolongkan menjadi dua yaitu:
1. Data time series, yaitu data yang dikumpulkan pada waktu tertentu yang dapat menggambarkan keadaan/karakteristik objek pada saat penelitian dilakukan, contoh: data jumlah mahasiswa PTN di Indonesia tahun 2006.
(25)
2. Data cross section adalah data yang dikumpulkan dari waktu ke waktu yang dapat digambarkan tentang perkembangan suatu kejadian atau kegiatan tertentu, contoh: data perkembangan jumlah mahasiswa sebuah PTN di Indonesia selama 5 tahun terakhir.
2.3 Analisis Korelasi
Analisis korelasi adalah metode yang digunakan untuk mengukur kekuatan atau derajat hubungan antara dua variabel atau lebih. Perhitungan derajat keeratan didasarkan pada persamaan regresi. Dalam ilmu statistika, istilah korelasi diberi pengertian sebagai hubungan linier antara dua variabel atau lebih. Hubungan antara dua variabel dikenal dengan istilah bivariate correlation, sedangkan hubungan antar lebih dari dua variabel disebut multivariate correlation. Contoh bivariate correlation: hubungan antara motivasi kerja dengan kerja. Sedangkan contoh multivariate correlation: hubungan antara motivasi kerja dan disiplin kerja dengan kinerja, Mann (2004). Tujuan dilakukan analisis korelasi antara lain adalah:
1. Untuk mencari bukti terdapat tidaknya hubungan (korelasi) antarvariabel 2. Bila sudah ada hubungan, untuk melihat tingkat keeratan hubungan
antarvariabel
3. Dan untuk memperoleh kejelassan dan kepastian apakah hubungan tersebut berari (meyakinkan/siignifikan) atau tidak berarti.
Tinggi-rendah, kuat-lemah atau besar-kecilnya suatu korelasi dapat diketahui dengan melihat besar kecilnya suatu angka (koefisien) yang disebut angka indeks korelasi atau coefficient of correlation, yang disimbolkan dengan atau r. Koefisien korelasi untuk data populasi disimbolkan dengan , sedangkan korelasi untuk data sampel disimbolkan dengan r. Angka korelasi berkisar antara 0 sampai dengan ± 1,00. Perhatikan tanda plus minus (±) pada angka indeks korelasi. Tanda plus minus pada angka indeks korelasi ini fungsinya hanya untuk menunjukkan arah korelasi jadi bukan sebagai tanda aljabar. Apabila angka indeks korelasi bertanda plus (+) maka korelasi tersebut positif dan arah korelasi satu arah, sedangkan apabila angka indeks korelasi bertanda minus (-), maka korelasi tersebut negatif dan arah korelasi Universitas Sumatera Utara
(26)
berlawanan arah; serta apabila angka indeks korelasi sama dengan 0, maka hal ini menunjukkan tidak ada korelasi. Dengan demikian, arah korelasi dapat dibedakan menjadi dua, yaitu yang bersifat satu arah dan yang sifatnya berlawanan arah, Mann (2009).
2.3.1 Macam-macam Analisis Korelasi
1. Korelasi untuk skala pengukuran ordinal
Apabila kita kita punya dua buah variabel X dan Y yang kedua-duanya memiliki tingkat pengukuran ordinal maka koefisien korelasii yang dapat dipergunakan adalah koefisien korelasi Spearman atau Spearman’s coefficient of (Rank)
correlation dan koefisien korelasi Kendal atau Kendall’s coefficient of (Rank)
correlation.
a. Spearman’scoefficient of (Rank) correlation
Angka indek korelasi Spearman dapat dihitung dengan menggunakan rumus berikut:
(Siegel and Castellan 1988) dimana:
= koefisien korelasi rank spearman n = banyaknya ukuran sampel
= jumlah koadrat dari selisih rank variabel x dengan rank variabel y
Penggunaan rumus untuk mencari koefisien korelasi Spearman diatas, berlaku bila kurang dari 20% skor-skor pada sebuah kelompok peringkatnya sama. Bila lebih dari 20%, maka rumus koreksian harus digunakan (Siegel and Castellan, 1988). Rumus koreksian tersebut adalah:
! "#
(27)
dimana:
$%$&'()
(
*%*&'()
( $%$&'()
(
*%*&'()
(
d = Selisih dari rank variabel x dengan rank variabel y
t = Banyak anggota kembar pada suatu perkembaran
selain rumus koreksian dari Spearman, ada rumus lain yang dapat digunakan bila terdapat data kembar, yaitu rumusnya adalah (Conover, 1999):
( ) ( )
( )
− +( )
− + + − = = = n i i n i i n i i i n n Y R n n X R n n Y R X R 1 2 2 1 2 2 1 2 2 1 2 1 2 1 . dimana:= Koefisien korelasi rank spearman
( ) ( )
xi R yiR . = Jumlah dari hasil kali rank variabel x denngan rank variabel y
( )
2i x
R = Jumlah dari rank kuadrat variabel x
( )
2i y R
= Jumlah dari rank kuadrat variabel y
( )
xiR = Rank variabel x
( )
yiR = Rank variabel y
n = Banyaknya ukuran sampel
b. Kendall’s Coefficient of (Rank) Correlation
Rumus lain yang dapat digunakan untuk menghitung koefisien korelasi dengan dua buah variabel x dan y, yang kedua-duanya memiliki tingkat pengukuran ordinal adalah koefisien korelasi dari kendall atau Kendall’s Coefficient of (Rank) Correlation.
Dengan demikian rumus koefisien korelasi kendall ini, sama dengan spearman, yaitu digunakan untuk jenis data peringkat (ordinal). Bedanya koefisien kendall memperhitung posisi wajar peringkat yang satu terhadap yang lainnya dari
(28)
peringkat di kelompok keduanya. Rumus yang digunakan untuk koefisien korelasi dari kendall adalah (Conover, 1998):
2 / ) 1 ( −
− =
n n
N
Nc d
τ
dimana:
c
N = Jumlah pasangan yang sesuai dari pengamatan
d
N = Jumlah pasangan yang tidak sesuai dari pengamatan
n = Banyaknya pengamatan
2. Korelasi untuk skala pengukuran Interval
Koefisien korelasi untuk dua buah variabel x dan y yang kedua-duanya memiliki tingkat pengukuran interval, dapat dihitung dengan menggunakan korelasi product moment atau product moment Coefficient (pearson’s Coefficien of Correlation) yang dikembangkan oleh Karl Pearson. Perbedaan dengan korelasi Spearman adalah, pada korelasi Spearman yang dikorelasikan adalah data peringkatnya (rangking), sementara pada korelasi product moment data observasinya yang dikorelasikan, (Conover, 1999). Koefisien korelasi product moment dapat diperoleh dengan rumus:
(
) (
)
(
)
[
−]
[
−(
)
]
⋅ −
=
2 2
2 2
Y Y
N X X
N
Y X
XY N rxy
2.3.2 Korelasi Parsial dan Ganda
Korelasi parsial (Partial Correlation) adalah suatu nilai yang memberikan kuatnya hubungan dua atau lebih variabel X dengan variabel Y, yang salah satu bagian variabel bebasnya dianggap konstan atau dibuat tetap. Koefisien korelasi parsial dirumuskan sebagai berikut (Conover, 1999):
• Hubungan antara variabel bebas-X1 dengan variabel tak bebas-y, apabila variabel-X2 tetap.
(29)
( )
(
2)(
1 2)
2 1 2 12 , 2 2
1 1 . x x y x x x y x y x y x x r r r r r r − − − =
• Hubungan antara variabel bebas-X2 dengan variabel tak bebas-Y, apabila variabel bebas-X1tetap.
( )
(
1)(
1 2)
2 1 1 2 21 2 2
1 1 . x x y x x x y x y x y x x r r r r r r − − − =
• Hubungan antara variabel bebas-X1 dengan variabel tak bebas-X2, apabila variabel tak bebas-Y tetap.
( )
(
xy)(
x y)
y x y x x x x x y r r r r r r 2 1 2 1 2 1 2
1 2 2
1 1 . − − − =
• Korelasi ganda (Multiple Correlation) adalah suatu nilai yang memberikan kuatnya hubungan dua atau lebih variabel bebas X secara bersama-sama dengan variabel tak bebas- Y. koefisien korelasi ganda dirumuskan sebagai berikut: 2 1 2 1 2 1 2 1 2 1 2 2 2 1 . . . 2 x x x x y x y x y x y x y x x r r r r r r R − − + =
(Kapur and Saxena, 2007)
2.4 Analisis Regresi
Analisis regresi adalah teknik statistika yang berguna untuk memeriksa dan memodelkan hubungan diantara variabel-variabel. Secara umum ada dua macam hubungan antara dua variabel atau lebih, yaitu bentuk hubungan dan keeratan hubungan. Untuk keeratan hubungan dapat diketahui dengan analisis korelasi. Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui denngan sempurna, atau untuk mengetahui bagaimana variasi dari beberapa variabel independen mempengaruhi variabel dependen dalam suatu fenomena yang kompleks. Jika X1, X2, …, Xi adalah variabel-variabel independen dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara X dan Y, dimana variasi dari X
(30)
akan diiringi pula oleh variasi dari Y. Secara matematika hubungan diatas dapat dijabarkan sebagai berikut:
(
x x x e)
f
Y = 1, 2, , i, dimana:
Y = variabel dependen
x = variabel independen
e = variabel residu (disturbance term)
Berkaitan dengan analisis regresi ini, setidaknya ada 4 yang dilakukan dalam analisis regresi ini diantaranya: mengadakan estimasi terhadap parameter berdasarkan data empiris, menguji berapa besar variasi variabel dependen dapat diterangkan oleh variasi variabel independen, menguji apakah estimasi parameter tersebut signifikan atau tidak dan melihat apakah tanda dan magnitud dari estimasi parameter cocok dengan teori (Nazir, 1983).
Regresi sederhana bertujuan untuk mempelajari hubungan antara dua variabel. Model regresi sederhana adalah + = a + bx dimana, + adalah variabel tak bebas (terikat), x adalah variabel bebas, a adalah penduga bagi intersap ( ), b adalah penduga bagi koefisien regresi ( ), dan , adalah parameter yang nilainya tidak diketahui sehingga diduga menggunakan statistic sampel, (Triola, 2005). Rumus yang dapat digunakan untuk mencari a dan b adalah:
X b Y N
x b y
a= − = −
(
)
(
)
− −
= 2
2 .
X X
N
Y X XY
N b
dimana:
i
X = Rata-rata skor variabel X
i
Y = Rata-rata skor variabel Y
(31)
2.5 Regresi Linier Ganda
Dalam regresi linier ganda variabel terikat y bergantung pada dua atau lebih varibel bebas. Mungkin terdiri dari beberapa variabel bebas, misalnya: X1,X2, ,Xn
Hubungan seperti ini dapat dicari dengan menggunakan analisis regresi berganda dengan bentuk umum sebagai berikut :
Yi = 0 + 1X1 + 2X2 + …+ nXn + i
dengan :
Yi = Variabel terikat (Variabel respon) 0 , 1, 2, … , n = Parameter regresi
X1 X2, …, Xn = Variabel bebas
1 = Kesalahan/galat
Estimasi parameter-parameter menggunakan metode kuadrat terkecil, misalnya: ,-I= Nilai penafsir (ramalan) Y
./0 = Penaksir .0 ./1 = Penaksir .( 1
./n = penaksir ./n
Dengan prosedur metode kuadrat terkecil menghasilkan :
,-I = ./0 + ./1X1 + ./2X2 + … + ./nXn + i
Untuk menentukan koefisien-koefisien variabel ./0,./1,./2, …, ./n diperlukan n buah pasangan data (X1,X2, ,Xn,YI) yang diperoleh dari pengamatan (Johnson and Bhattacharyya, 1987).
(32)
2.6 Analisis Diskriminan
Analisis diskriminan mirip regresi linier berganda (multivariable regression). Perbedaannya, analisis diskriminan dipakai kalau variabel dependennya kategori (maksudnya kalau menggunakan skala ordinal ataupun nominal) dan variabel independennya menggunakan skala metrik (interval dan rasio). Sedangkan dalam regresi berganda variabel dependentnya harus metrik, dan jika variabelnya independen, bisa metrik maupun nonmetrik. Sama seperti regresi berganda, dalam analisis diskriminan variabel independen hanya satu, sedangkan variabel independen banyak (multiple). Misalnya, variabel dependen adalah pilihan merek mobil: Kijang, Kuda, dan Panther. Variabel independen adalah rating setiap merek pada sejumlah atribut yang memakai skala 1 sampai 7, (Simamora, 2005).
Analisis diskriminan adalah metode statistik untuk mengelompokkan atau mengklasifikasi sejumlah obyek ke dalam beberapa kelompok, berdasarkan beberapa variabel, sedemikian hingga setiap obyek yang menjadi anggota lebih dari pada satu kelompok. Pada prinsipnya analisis diskriminan bertujuan untuk mengelompokkan setiap obyek ke dalam dua atau lebih kelompok berdasarkan pada kriteria sejumlah variabel bebas. Pengelompokkan ini bersifat mutually exclusive, dalam artian jika obyek A sudah masuk kelompok 1, maka ia tidak mungkin juga dapat menjadi anggota kelompok 2. Analisis kemudian dapat dikembangkan pada ‘variabel mana saja yang membuat kelompok 1 berbeda dengan kelompok 2, berapa persen yang masuk ke kelompok 1, berapa persen yang masuk ke kelompok 2. Oleh karena ada sejumlah variabel independen, maka akan terdapat satu variabel dependen (tergantung), ciri analisis diskriminan adalah jenis data dari variabel dependent bertipe nominal (kategori), seperti kode 0 dan 1, atau kode 1, 2 dan 3 serta kombinasi lainnya (Overall and Klett, 1972).
(33)
2.6.1 Hal-hal Pokok Tentang Analisis Diskriminan
Bentuk multivariat dari analisis diskriminan adalah dependen sehingga variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau grup 2 atau lainnya, (Santoso, 2010).
Tujuan diskriminan secara umum adalah:
1. Ingin mengetahui apakah ada perbedaan yang jelas antar-grup pada variabel dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota Grup 1 dengan anggota Grup 2?
2. Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan tersebut?
3. Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.
4. Melakukan klasifikasi terhadap objek (dalam terminology SPSS disebut baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk pada grup 2, atau lainnya.
Proses dasar dari analisis diskriminan ialah:
• Memisah variabel-variabel menjadi Variabel Dependen dan Variabel Independen.
• Menentukan metode untuk membuat Fungsi Diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yakni :
1. Simultaneous Estimation, dimana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses analisis diskriminan.
2. Step-Wise Estimation, dimana variabel dimasukkan satu persatu kedalam model diskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih variabel independen yang ‘dibuang’ dari model.
• Menguji signifikansi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s lambda, pilai, F test dan lainnya.
• Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui ketepatan klasifikasi secara individual dengan Casewise Diagnostics.
(34)
• Melakukan interpretasi terhadap fungsi diskriminan tersebut.
• Melakukan uji validitas fungsi diskriminan.
Berikut ini beberapa asumsi yang harus dipenuhi agar model diskriminan dapat digunakan:
1. Multivariate Normality, atau variabel independen seharusnya berdistribusi normal, hal ini akan menyebabkan masalah pada ketepatan fungsi (model) diskriminan. Regresi logistic (Logistic Regression ) bisa dijadikan alternative metode jika memang data tidak berdistribusi normal. Tujuan uji normal adalah ingin mengetahui apakah distribusi data dengan bentuk lonceng (bell shaped). Data yang ‘baik’ adalah data yang mempunyai pola seperti distribusi normal, yakni distribusi data tersebut tidak menceng ke kiri atau menceng ke kanan. Uji normalitas pada multivariat sebenarnya sangat kompleks, karena harus dilakukan pada seluruh variabel secara bersama-sama. Namun, uji ini bisa juga dilakukan pada setiap variabel dengan logika bahwa jika secara individual masing-masing variabel memenuhi asumsi normalitas, maka secara bersama-sama (multivariat) variabel-variabel tersebut juga bisa dianggap memenuhi asumsi normalitas. Adapun criteria pengujiannya adalah:
• Angka signifikansi (Sig) > 0,05, maka data tersebut berdistribusi normal.
• Angka signifikansi (Sig) < 0,05, maka data tidak berdistribusi normal.
Jika sebuah variabel mempunyai sebaran data yang tidak normal, maka perlakuan yang dimungkinkan agar menjadi normal, (Santoso, 2010):
Menambah jumlah data. Seperti pada kasus, bisa dicari 20 atau 30 atau sejumlah data baru untuk menambah ke-75 data berat badan konsumen yang sudah ada. Kemudian dengan jumlah data yang baru, dilakukan pengujian sekali lagi.
Menghilangkan data yang dianggap penyebab tidak normalnya data. Seperti pada variabel berat, jika dua data yang outlier dibuang, yakni berat 100 dan 120, kemudian diulang proses pengujian, mungkuin data bisa menjadi normal. Jika belum normal, ulangi pengurangan data yang dianggap penyebab ketidaknormalan data. Namun demikian, pengurangan data harus
(35)
dipertimbangkan apakah tidak mengaburkan tujuan penelitian karena hilangnya data-data yang seharusnya ada.
Dilakukan transformasi data, misal mengubah data ke logaritma atau kebentuk natural (ln) atau bentuk lainnya, kemudian dilakukan pengujian ulang.
Data diterima apa adanya, memang dianggap tidak normal dan tidak perlu dilakukan berbagai treatment. Untuk itu, alat analisis yang dipilih harus diperhatikan, seperti untuk multivariate mungkin faktor analisis tidak begitu mementingkan asumsi kenormalan. Atau pada kasus statistik univariat, bisa dilakukan alat analisis nonparametrik, (Santoso, 2010).
2.6.2 Klasifikasi dengan Dua Populasi Multivariat Normal
Dalam buku Johnson and Wichern (2007), dijelaskan bahwa fungsi diskriminan pertama kali diperkenalkan oleh Ronald A. Fisher (1936) dengan menggunakan beberapa kombinasi linier dari pengamatan yang cukup mewakili populasi. Menurut Fisher, untuk mencari kombinasi linier dari p variabel bebas tersebut dapat dilakukan dengan pemilihan koefisien-koefisiennya yang menghasilkan hasil bagi maksimum antara matrik peragam antar kelompok (between-group) dan matrik peragam dalam kelompok (within-group).
Adapun asumsi-asumsi yang harus dipenuhi sebelum melakukan analisis diskriminan, antara lain yaitu:
• Variabel independen berdistribusi normal multivariat (multivariates normal distribution)
• Varians dalam setiap kelompok adalah sama (equal variances)
Prosedur–prosedur klasifikasi yang didasarkan pada populasi normal lebih unggul dalam statistik karena tidak rumit dan tingkat efisiensi yang tinggi yang melibatkan banyak model variasi populasi. Sekarang asumsikan bahwa f1(x)dan f2(x)
kepadatan multivariat normal, pertama dengan vektor rata-rata 1 dan matriks
kovarian 1dan yang kedua dengan vector rata-rata 2 dan matriks kovarian 2.
(36)
Klasifikasi populasi normal ketika 1= 2= anggap bahwa kepadatan bersama dari X’ = [X1, ,X2, . . , .XP]untuk populasi 1 dan 2 diberikan oleh:
fi(x) = (
3 4 &5 6 67 & 5
exp8 ( 9 : ; '( 9 : < untuk i = 1,2 (2.1)
Anggap juga bahwa parameter-parameter populasi 1, 2, dan diketahui. Kemudian, setelah cancelasi dari istilah "= >5 ? ?( 5 daerah Expected Cost of Misclassification (ECM) minimum pada region R1 dan R2 yang meminimalisir ECM didefenisikan oleh nilai x untuk ketidaksamaan yang berlaku sebagai berikut:
R1 = @@7 9 & 9 A B
C D(E
C D E(F B>>7&F
R2 = @@7 9 & 9 G B
C D(E
C D E(F B>>7&F
menjadi :
(
−)
(
−)
+(
−)
(
−)
≥− 1 ' −1 1 2 ' −1 2
1
2 1 2
1 exp
: x x x x
R BC D(E
C D E(F B
>7
>&F
(
−)
(
−)
+(
−)
(
−)
<− 1 ' −1 1 2 ' −1 2
2
2 1 2
1 exp
: x x x x
R BC D(E
C D E(F B
>7
>&F (2.2)
Diberikan daerah R1 dan R2, sehingga dapat membentuk aturan klasifikasi yang diberikan pada hasil berikut:
Anggap populasi 1 dan 2 dideskripsikan oleh idensitas multivariate normal dengan
bentuk pada persamaan (2.1). Kemudian aturan alokasi yang meminimalisir ECM
sebagai berikut :
Alokasikan x0 ke 1 jika
:( : ; '(90 ( :( : ; '( :( : A L 8BC D(EC D E( F B>>&7F< (2.3)
Dengan cara lain alokasikan x0 ke 2.
Bukti: karena quantitas pada persamaan (2.2) tidak negatif untuk semua x, maka dapat
(37)
( 9 :
( ; '( 9 :( ( 9 : ; '( 9 :
= :( : ; '(9 ( :( : ; '( :( : (2.4) dan akibatnya
R1 :
(
)
(
)
(
1 2)
1 ' 2 1 1 ' 2
1 − − − +
− −
2 1
x A L 8BC D(E
C D E(F B >&
>7F<
R2 :
(
)
(
)
(
1 2)
1 ' 2 1 1 ' 2
1 − − − +
− −
2 1
x G L 8BC D(E
C D E(F B >&
>7F< (2.5)
Pada kebanyakan situasi, quantitas populasi 1, 2, dan tidak diketahui, sehingga
aturan (2.3) harus dimodifikasi. Wald dan Anderson menyarankan mengganti parameter-parameter populasi dengan sampel mereka.
Kemudian, anggap kita memiliki n1 observasi dari variabel acak multivariat X’ = [X1,
X2, …, Xp] dari 1 dan n2 pengukuran quantitas ini dari 2, dengan n1+ n2– 2 p.
Kemudian matriks data respektif sebagai berikut:
( ) = × ' ' ' x x x
X
1 1 1 12 11 1 n p n ; ( ) = × ' ' ' x x xX
2 2 1 22 21 2 n p n (2.6)Dari data matriks tersebut, vektor sampel rata-rata dan matriks kovarians adalah:
( ×) = = 1 1 1 1 1 1 1 n j j p n x
X
; ( )(
)(
)
= × − − − = 1 1 1 ' 1 1 1 1 1 1 1 n j j j p p n x x x xS
( ×) = = 2 1 2 2 1 1 2 n j j p n xX
; ( )(
)(
)
= × − − − = 2 2 1 ' 2 2 2 2 1 1 2 n j j j p p n x x x xS
(2.7)Karena diasumsikan bahwa populasi memiliki matriks kovarian yang sama , sampel matriks kovarian S1 dan S2 dikombinasikan untuk diturunkan menjadi perkiraan objektif tunggal dari . Secara umum, berat rata-rata
(
) (
)
1(
) (
)
22 S S S − + − − + − + − − = 1 1 1 1 1 1 2 1 2 1 1 n n n n n n
pooled (2.8)
(38)
Adalah suatu estimasi unbias dari jika matriks data X1 dan X2 memuat sampel-sampel acak dari populasi 1 dan 2 berturut-turut. Substitusikan 9M1 untuk 1, 9M2 untuk
2, dan Spooled untuk pada persamaan (2.3) menjadi “sampel” aturan klasifikasi. Estimasi aturan Expected Cost of Misclassification (ECM) minimum untuk dua populasi normal:
Alokasikan x0 ke 1 jika
(9M1-9M2)NO>PPQRS '( 90 ((9M1- 9M2)NO>PPQRS '( (9M1 + 9M2) A L 8BC D(EC D E(F B>>&
7F< (2.9)
Alokasikan x0 ke 2, jika pada (2.9), BC D(EC D E(F B>>&
7F = 1
Kemudian ln (1) = 0, dan estimasi aturan ECM minimum untuk 2 populasi normal ditotalkan untuk membandingkan variabel scalar:
T = (9M1-9M2)NO>PPQRS '( 9 UTN9 Dievaluasi pada 0, dengan jumlah :
VT = ( (9M1-9M2)NO>PPQRS '( (9M1 + 9M2)
= ( W( W
dimana :
W(= (9M1-9M2)NO>PPQRS '( 9M( UTN9M( dan
W = (9M1-9M2)NO>PPQRS '( 9M UTN9M
Oleh karena itu, estimasi aturan ECM minimum untuk dua populasi normal sama dengan membentuk dua populasi univariat untuk nilai y dengan mengambil suatu kombinasi linier yang sesuai dari observasi-observasi populasi 1 dan 2 dan kemudian menandai suatu observasi baru x0 ke 1 atau 2, bergantung pada apakah T = UTN9M0
jatuh kekanan atau kekiri titik tengah VT antara dua rata-rata univariat W(dan W . Sekali estimasi parameter disisipkan pada kuantitas populasi tak diketahui yang bersesuaian, tidak ada jaminan bahwa aturan hasil akan meminimalisir biaya ekspektasi kesalahan klasifikasi pada klasifikassi yang umum. Hal ini karena aturan optimal di (2.3) telah diturunkan menghasilkan bahwa kepadatan multivariat normal Universitas Sumatera Utara
(39)
f1(x) dan f2(x) diketahui secara lengkap. Persamaan (2.9) adalah satu estimasi
sederhana dari aturan optimal. Akan tetapi, kelihatannya beralasan untuk mengekspektasi bahwa hal tersebut harusnya ada dengan baik jika ukuran sampel besar. Sebagai hasilnya, jika data muncul menjadi multivariat normal, statistik klasifikasi bergeser kekiri dari pertidaksamaan di (2.9) dapat dihitung untuk setiap observasi baru x0. Observasi-observasi ini diklasifikasikan dengan membandingkan
nilai-nilai statistik dengan nilai-nilai dari ln X%Y D E" ZY D"E ) Z ( [.
2.6.3 Format Data Dasar dan Program Komputer yang Digunakan
Data dasar yang digunakan otomatis adalah data yang kontinu (karena adanya asumsi kenormalan) untuk variabel penjelas (Xj) dan data kategorik/kualitatif/nonmetrik untuk
variabel respon (Y).
Tabel 2.1 Tabel Format Data untuk Analisis Diskriminan
X1 X2 . . . Xp Y
… … … …
… … … …
Beberapa software yang bisa digunakan adalah SPSS, SAS, dan Minitab.
2.6.4 Algoritma dan Model Matematis
Secara ringkas, langkah-langkah dalam analisis diskriminan adalah sebagai berikut : 1) Pengecekan adanya kemungkinan hubungan linier antara variabel penjelas. Untuk
point ini, dilakukan dengan bantuan matriks korelasi (pembentukan matriks korelasi sudah difasilitasi pada analisis diskriminan). Pada output SPSS, matriks korelasi bisa dilihat pada pooled Within-Groups Matrices.
(40)
2) Uji vektor rata-rata kedua kelompok
2 1 :
2 1 :
≠ =
1 0 H H
Angka signifikan :
Jika Sig. > 0,05 berarti tidak ada perbedaan antar-grup Jika Sig. < 0,05 berarti ada perbedaan antar-grup
Diharapkan dalam uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua kelompok. Pada SPSS, uji ini dilakukan secara univariate (jadi yang diuji bukan berupa vektor), dengan bantuan table Tests of Equality of Group Means.
3) Dilanjutkan pemeriksaan asumsi homoskedastisitas dengan uji Box’s M. Diharapkan dalam uji ini hipotesis nol tidak ditolak (H0: 1 = 2). Hipotesis:
H0: matriks kovarians grupadalah sama
H1: matriks kovarians grup adalah berbeda secara nyata
Keputusan dengan dasar signifikansi (lihat angka signifikan) Jika Sig. > 0,05 berarti H0 diterima
Jika Sig. < 0,05 berarti H0 ditolak
Sama tidaknya grup kovarians matriks juga bisa dilihat dari tabel output Log Determinant. Jika dalam pengujian ini H0 ditolak maka proses lanjutan seharusnya
tidak bisa dilakukan.
4) Pembentukan model diskriminan
Kriteria Fungsi Linier Fisher
a. Pembentukan fungsi Linier (teoritis)
Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang dihitung dari suatu fungsi linier Y = 'X dimana ' menyatakan vektor yang berisi koefisien-koefisien variabel penjelas yang membentuk persamaan linier terhadap variabel respon, Universitas Sumatera Utara
(41)
' = [ 1, 2, …, p]
X = 8 (<
Xk menyatakan matriks data pada kelompok ke-k
Xk= .
2 1 2 21 21 1 12 11 npk k n k n pk k k pk k k x x x x x x x x x
i = 1, 2, …, n j = 1, 2,…, p k = 1 dan 2
xijkk menyatakan observasi ke-i variabel ke-j pada kelompok ke-k.
Dibawah asumsi Xk\N
(
µk, k)
maka] ^__`a(
a bc 8] <]( dan k _ ad ]d ad ]d N ;
1= 2=
]d =
pk pk µ µ . . . ;
]d adalah vekor rata-rata tiap variabel X pada kelompok ke-k.
e pp p p σ σ σ σ σ σ 0 0 0 0 0 . . . 0 0 0 . . . . 0 0 . . . 0 . . . . 2 22 1 12 11
(42)
j1j2=
{
mnfg hg i fg hgjkL lfg hg i fg hgjkL l g gjhLg l( l( !g l g gjhLgl( o l
Fisher mentransformasikan observasi-observasi x yang multivariate menjadi observasi y yang univariate. Dari persamaan Y = ’X diperoleh:
]dp E(Yk) = E( ’X) = ’ k ;
qr = var( ’X) = ’
]dpadalah rata-rata Y yang diperoleh dari X yang termasuk dalam kelompok ke-k.
qr = adalah varians Y dan diasumsikan sama untuk kedua kelompok.
Kombinasi linier yang menarik menurut Fisher adalah yang dapat memaksimumkan rasio antara jarak kuadrat rata-rata Y yang diperoleh dari X
kelompok 1 dan 2 dengan varians Y, atau dirumuskan sebagai berikut:
](r ] r
qr s
; ]( ] ]( ] ;s
s; s
Jika ]( ] ) = maka persamaan diatas menjadi %tuv)
&
tu t karena adalah
matriks definit positif maka menurut teori pertidaksamaan Cauchy-Schwartz,
rasio %tuv)
&
tu t dapat dimaksimumkan jika s
; Y '( = Y '( ]( ] dengan
memilih c = 1, menghasilkan kombinasi linier yang disebut kombinasi linier Fisher sebagai berikut :
(
)
XX
Y= ' = 1 − 2 ' −1
b. Pembentukan Fungsi Linier (dengan bantuan SPSS)
Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel Canonical Discriminant Function Coefficient. Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagian
Unstandardized diaktifkan.
(43)
c. Menghitung discriminant score
Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya. d. Menghitung Cutting Score
Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan optimum cutting score. Memang dari computer informasi ini sudah diperoleh. Sedangkan cara mengerjakan secara manual Cutting Score
(m) dapat dihitung dengan rumus sebagai berikut dengan ketentuan untuk dua grup yang mempunyai ukuran yang sama cutting score dinyatakan dengan rumus, (Simamora, 2005):
Zce= wxywz
dengan :
Zce = cutting score untuk grup yang sama ukuran
ZA = centroid grup A
ZB = Centroid grup B
Apabila dua grup berbeda ukuran, rumus cutting score yang digunakan adalah :
ZCU = $x$wzy$zwx
xy$z
dengan :
ZCU = Cutting score untuk grup tak sama ukuran
NA = Jumlah anggota grup A
NB = Jumlah anggota grup B
ZA = Centroid grup A
ZB = Centroid grup B
Kemudian nilai-nilai discriminant score tiap obsservasi akan dibandingkan dengan cutting score, sehingga dapat diklasifikasikan suatu obsevasi akan termasuk kedalam kelompok yang mana. Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok kode 1 jika
(
)
x ,Y= 1 − 2 ' −1 ≥m selain itu dimasukkan dalam kelompok 2 (kode Universitas Sumatera Utara
(44)
nol) perhitungan m dilakukan secara manual, karena SPSS tidak mengeluarkan output m. Namun, dapat di hitung nilai m dengan bantuan tabel Function at Group Centroids dari output SPSS.
e. Perhitungan Hit Ratio setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio, yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi. Misalkan ada sebanyak
n observasi, akan dibentuk fungsi linier dengan observasi sebanyak n-1. Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi keanggotaannya dengan fungsi yang sudah dibentuk tadi. Proses ini akan diulang dengan kombinasi observasi yang berbeda-beda, sehingga fungsi linier yang dibentuk ada sebanyak n. Inilah yang disebut dengan metode Leave One Out.
f. Kriteria posterior probability
Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x) berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability
dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option probabilities of group membership pada bagian Save di kotak dialog utama.
p DmE
( )
( )
kk k
k k
x f p
x f p
,
dimana :
pk adalah prior probability kelompok ke-k dan
fk(x) = (
3 4{&6 67 &{
exp ( 9 :d ; '( 9 :d | m }
suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok 0 jika p m }E D ~ m E D . Nilai-nilai posterior probability
inilah yang mengisi kolom dis1_1 dan kolom di 1_2 pada sheet SPSS.
g. Akurasi statisik, dapat di uji secara statistik apakah klasifikasi yang di lakukan (dengan menggunakan fungsi diskriminan) akurat atau tidak. Uji statistik tersebut adalah prees-Q Statistik. Ukuran sederhana ini
(45)
membandingkan jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari perhitunngan kemudian dibandingkan dengan nilai kritis (critical velue) yang diambil dari tabel Chi-Square dan tingkat keyakinan sesuai yang diinginkan. Statistik Q ditulis dengan rumus:
Prees-Q = •$' €• ‚ 2 $ •'(
dengan :
N = ukuran total sampel
n = jumlah kasus yang diklasifikasi secara tepat
K = jumlah grup
2.7 Pengujian Hipotesis
Intepretasi hasil analisis diskriminan tidak berguna jika fungsinya tidak signifikan. Hipotesis yang akan diuji adalah H0yang menyatakan bahwa rata-rata semua variabel
dalam semua grup adalah sama. Dalam SPSS, uji dilakukan dengan menggunakan Wilks’ . Jika dilakukan pengujian sekaligus beberapa fungsi sebagaimana dilakukan pada analisis diskriminan, statistik Wilks’ adalah hasil univariat untuk setiap fungsi. Kemudian, tingkat signifikansi diestimasi berdasarkan chi-square yang telah ditransformasi secara statistik. Setelah hasil analisis diketahui, kemudian dilihat apakah Wilks’ berasosiasi dengan fungsi diskriminan. Selanjutnya, angka ini ditransformasi menjadi chi-quare dengan derajat kebebasan (df) yang akan digunakan dalam pengambilan kesimpulan dengan uji kriteria hipotesis berikut:
Jika F hitung > F tabel maka H0ditolak dan H1 diterima
Jika F hitung F tabel maka H0diterima dan H1ditolak
(46)
Selanjutnya dengan menggunakan nilai F, dapat di ambil keputusan untuk menerima atau menolak H0. Jika H0 diterima, akan memberikan kesimpulan bahwa tidak ada
perbedaan antara siswa yang lulus dan siswa yang tidak lulus. Sebaliknya jika H0
ditolak maka terdapat perbedaan antara siswa yang lulus dan siswa yang tidak lulus, dengan nilai signifikan < , H0 ditolak. Sehingga proses analisis diskriminan dapat digunakan.
(47)
BAB 3
METODE PENELITIAN
Pada bab ini peneliti ingin menunjukkan metode penelitian dari analisis diskriminan untuk mengelompokkan faktor yang mempengaruhi kelulusan siswa dan faktor-faktor apa saja yang lebih dominan mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.
3.1 Pengumpulan Data
3.1.1 Sumber data
Dalam penelitian ini data yang digunakan adalah data primer dan data sekunder. Data primer bersumber dari hasil wawancara terstruktur terhadap responden dengan menggunakan kuesioner. Responden dalam penelitian ini adalah siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Sedangkan data sekunder berupa laporan hasil penilaian belajar (nilai UNAS SD, nilai UAS SD, nilai rapor, nilai tryout
SMP, dan nilai UAS SMP) siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil.
3.1.2 Populasi
Populasi adalah sekelompok individu atau subjek yang memiliki satu atau lebih karakteristik, (Williams dan Highiter, 1978). Populasi dalam penelitian ini adalah siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil dengan jumlah siswa/i kelas III SMPN 1 Gunung Meriah adalah 237 siswa. Populasi diketahui bersifat homogen dan tersebar secara proporsional merata ke setiap kelas dan juga diasumsikan bahwa
(48)
populasi berdistribusi normal, sehingga jumlah sampel yang diambil dalam penelitian ini adalah 70 siswa. Lebih jelasnya dapat dilihat pada tabel dibawah ini:
Tabel 3.1 Jumlah Siswa III SMPN 1 Gunung Meriah Kab. Aceh Singkil
No Kelas Jumlah Siswa
1 III.1 40
2 III.2 40
3 III.3 40
4 III.4 40
5 III.5 39
6 III.6 38
Jumlah 237 siswa
Tabel 3.2 Jumlah Sampel Penelitian
No Kelas Jumlah Siswa Teknik
pengambilan sampel
Jumlah Sampel
1 III.1 40 40/237 x 70 = 11,81 12 siswa
2 III.2 40 40/237 x 70 = 11,81 12 siswa
3 III.3 40 40/237 x 70 = 11,81 12 siswa
4 III.4 40 40/237 x 70 = 11,81 12 siswa
5 III.5 39 39/237 x 70 = 11,52 11 siswa
6 III.6 38 38/237 x 70 = 11,22 11 siswa
Jumlah populasi 237 Jumlah Sampel 70 siswa
3.2 Analisis Data
Analisis diskriminan dimulai dengan hal-hal ringan. Pertama, pemilihan variabel dependen dan independen, dimana variabel dependen harus merupakan variabel kategorik sedangkan variabel independen merupakan variabel numerik. Kemudian melakukan analisis univariat untuk mengetahui kenormalan data. Klasifikasi normal ketika 1= 2= anggap bahwa kepadatan bersamadariX’=[X1, X2, …, .XP] untuk
populasi 1 dan 2 diberikan oleh:
( )
( )
(
)
(
)
− −
−
= 1 ' −1 1
2 1 2 p
i x x
2 1 exp 2
1 x
f
(49)
untuk i =1,2 Anggap juga bahwa parameter-parameter populasi 1, 2, dan diketahui. Hal ini dilihat dari uji Kolmogorov Smirnov. Jika p value Kolmogorov Smirnov > 0,05 maka data berdistribusi normal. Dari hasil test Kolmogorov Smirnov (KS) terlihat bahwa ada tiga faktor yang tidak berdistribusi normal yaitu nilai rapor SMP, pendidikan orang tua dan penghasilan orang tua. Karena mempunyai nilai p
Kolmogorov Smirnov < 0,05. Oleh sebab itu dilakukan usaha untuk menormalkan distribusi data dengan proses transformasi data. Dari hasil test kolmogorov smirnov terlihat bahwa ketiga nilai tersebut masih < 0,05 (0,000), (0,000), (0,007) yang memperlihatkan bahwa faktor ini tidak berdistribusi normal. Dengan demikian faktor tersebut tidak diikut sertakan dalam analisis selanjutnya.
Setelah diketahui data-data yang berdistribusi normal selanjutnya dilakukan uji Kolinearitas yaitu untuk mendeteksi korelasi antara faktor independen (kolinearitas). Kemudian lakukan pengujian pearson correlation terhadap semua faktor independen yang termasuk dalam distribusi normal, dimana bila r > 0,8 terjadi masalah kolinearitas. Dari tabel 3.1 terlihat bahwa nilai r < 0,8 artinya tidak ada masalah kolinearitas pada pengujian kolinearitas ini. Dalam tabel 3.3 dibawah ini akan diketahui seberapa kuat hubungan antar faktor dan apakah data sampel yang ada menyediakan bukti cukup bahwa ada kaitan antara faktor-faktor dalam populasi asal sampel. Adapun tabel tesebut adalah sebagai berikut:
(50)
Korelasi Pearson Product momen dilambangkan dengan r dengan ketentuan nilai r
tidak lebih dari harga (-1 r 1). Apabila nilai r = -1 artinya korelasi negative sempurna ; r = 0 artinya tidak ada korelasi ; r = 1 berarti korelasinya sangat kuat. Tingkat hubungan nilai indeks korelasi dinyatakan sebagai berikut:
Tabel 3.4 Interpretasi Koefisien Korelasi
Interval koefisien Tingkat Hubungan
0,800 – 1,000 Sangat Kuat
0,600 – 0,799 Kuat
0,400 – 0,599 Cukup Kuat
0,200 – 0,399 Lemah
0,000 – 0,199 Sangat Lemah
Dari Tabel 3.1 dapat diketahui korelasi antara X1dengan X2, X1dengan X4, X1dengan
X5, X2 dengan X4, X2 dengan X5, dan X4 dengan X5. Adapun penjelasannya adalah sebagai berikut:
Tabel 3.3 Korelasi Antara Variabel dalam Populasi
X1 X2 X4 X5
X1 Pearson Correlation 1 -.060 .063 .009
Sig. (2-tailed) .625 .605 .941
N 70 70 70 70
X2 Pearson Correlation -.060 1 .117 .192
Sig. (2-tailed) .625 .334 .111
N 70 70 70 70
X4 Pearson Correlation .063 .117 1 .738**
Sig. (2-tailed) .605 .334 .000
N 70 70 70 70
X5 Pearson Correlation .009 .192 .738** 1 Sig. (2-tailed) .941 .111 .000
N 70 70 70 70
**. Korelasi signifikan pada tingkat 0,01 (2-tailed).
(1)
20 0 0 .898 1 .690 .016 1 .310 1.619
21 0 0 .848 1 .611 .037 1 .389 .939
22 1 1 .105 1 .924 2.629 0 .076 7.628
23 1 0** .626 1 .528 .237 1 .472 .464
24 1 1 .636 1 .531 .224 0 .469 .474
25 1 1 .382 1 .838 .763 0 .162 4.054
26 0 0 .983 1 .665 .000 1 .335 1.371
27 1 1 .506 1 .804 .442 0 .196 3.261
28 1 1 .004 1 .982 8.340 0 .018 1.639E1
29 1 0** .392 1 .859 .731 1 .141 4.342
30 1 1 .648 1 .764 .209 0 .236 2.561
31 1 0** .520 1 .821 .413 1 .179 3.457
32 1 1 .803 1 .720 .062 0 .280 1.949
33 1 0** .742 1 .753 .108 1 .247 2.341
34 1 0** .626 1 .528 .237 1 .472 .464
35 0 0 .898 1 .690 .016 1 .310 1.619
36 0 0 .983 1 .665 .000 1 .335 1.371
37 0 0 .983 1 .665 .000 1 .335 1.371
38 1 1 .790 1 .589 .071 0 .411 .793
39 1 1 .648 1 .764 .209 0 .236 2.561
40 1 1 .870 1 .617 .027 0 .383 .983
41 0 0 .654 1 .759 .200 1 .241 2.489
42 1 1 .790 1 .589 .071 0 .411 .793
43 0 0 .898 1 .690 .016 1 .310 1.619
44 1 1 .870 1 .617 .027 0 .383 .983
45 1 0** .626 1 .528 .237 1 .472 .464
46 1 1 .952 1 .644 .004 0 .356 1.193
(2)
54 1 1 .712 1 .561 .137 0 .439 .623
55 1 1 .965 1 .671 .002 0 .329 1.424
56 0 0 .442 1 .815 .592 1 .185 3.560
57 0 0 .848 1 .611 .037 1 .389 .939
58 1 1 .883 1 .696 .021 0 .304 1.676
59 1 1 .636 1 .531 .224 0 .469 .474
60 1 0** .776 1 .588 .081 1 .412 .793
61 1 1 .712 1 .561 .137 0 .439 .623
62 1 1 .883 1 .696 .021 0 .304 1.676
63 1 1 .648 1 .764 .209 0 .236 2.561
64 1 0** .626 1 .528 .237 1 .472 .464
65 0 0 .848 1 .611 .037 1 .389 .939
66 1 0** .699 1 .558 .149 1 .442 .617
67 0 0 .508 1 .798 .438 1 .202 3.180
68 1 0** .699 1 .558 .149 1 .442 .617
69 1 0** .776 1 .588 .081 1 .412 .793 .000
70 1 1 .564 1 .502 .333 0 .498 .346
For the original data, squared Mahalanobis distance is based on canonical functions. For the cross-validated data, squared Mahalanobis distance is based on observations. **. Misclassified case
a. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case.
(3)
LAMPIRAN H : ANGKET PENELITIAN
ANGKET PENELITIAN
Nama : ... Kelas : ... Usia saat ini : ... tahun
Jenis kelamin a. Laki-laki b. Perempuan
“ Aplikasi Analisis Diskriminan Dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil”
Dalam rangka penulisan skripsi di Universitas Sumatera Utara, Skripsi ini sebagai salah satu syarat untuk ujian kesarjanaan Strata I , maka saya memohon dengan sangat kepada adik-adik untuk mengisi angket yang telah disediakan.
Angket ini bukan tes psikologi dari pihak sekolah atau dari manapun, maka dari itu adik-adik tidak perlu takut atau ragu-ragu dalam memberikan jawaban yang sejujurnya. Artinya semua jawaban yang adik-adik berikan adalah benar, dan jawaban yang diminta adalah sesuai dengan pengalaman dan kondisi yang adik-adik rasakan selama ini. Atas perhatian dan bantuannya saya mengucapkan terima kasih.
Petunjuk Pengisian :
Mohon bantuan dan kesedian adik-adik untuk menjawab seluruh pertanyaan yang ada. Berilah tanda (x) pada jawaban (a, b, c, d) yang adik-adik pilih sesuai dengan
keadaan sebenarnya.
(4)
1. Bagaimanakah tingkat pendidikan orang tua anda? a. SD
b. SMP c. SMA
d. D3 dan D3 keatas
2. Berapakah penghasilan orang tua anda / bulan ? a. < Rp 500.000
b. Rp 500.000 - Rp 1.499.999 c. Rp 1.500.000 - Rp 2.500.000 d. > Rp 2.500.000
(5)
LAMPIRAN I : Tabel Nilai Distribusi F untuk = 0,05
V2 V1
1 2 3 4 5 6 7 8 9 10
1 161 200 216 225 230 234 237 239 241 242
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 88,50 8,81 8,79
4 7,71 6,94 6,59 6,59 6,26 6,16 6,09 6,04 6,00 5,96
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,00
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,89 2,75
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,81 2,67
14 4,6 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03
55 4,02 3,17 2,78 2,51 2,38 2,27 2,18 2,11 2,05 2,00
60 4,00 3,15 2,76 2,53 2,37 2,25 1,17 2,10 2,04 1,99
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91
150 3,9 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94 1,89
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88
400 3,86 3,02 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85
Inf 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83
(6)
LAMPIRAN J: TABEL DISTRIBUSI STUDENT'S [t]
V
0,1 0,05 0,025 0,01 0,005
1 3,08 6,31 12,71 31,82 63,66
2 1,89 2,92 4,30 6,96 9,92
3 1,64 2,35 3,18 5,54 9,84
4 1,53 2,13 2,78 3,75 4,60
5 1,48 2,02 2,57 3,37 4,53
6 1,44 1,94 2,45 3,14 3,71
7 1,42 1,90 2,37 3,00 3,50
8 1,40 1,86 2,31 2,90 3,36
9 1,38 1,83 2,26 2,82 3,25
10 1,37 1,81 2,23 2,76 3,17
11 1,36 1,80 2,20 2,72 3,11
12 1,36 1,78 2,18 2,68 3,06
13 1,35 1,77 2,16 2,65 3,01
14 1,35 1,76 2,14 2,62 2,98
15 1,34 1,75 2,13 2,60 2,95
16 1,34 1,75 2,12 2,58 2,92
17 1,33 1,74 2,11 2,57 2,90
18 1,33 1,73 2,10 2,55 2,88
19 1,33 1,73 2,09 2,54 2,86
20 1,33 1,72 2,09 2,53 2,85
21 1,32 1,72 2,08 2,52 2,83
22 1,32 1,72 2,07 2,51 2,82
23 1,32 1,71 2,07 2,50 2,80
24 1,32 1,71 2,06 2,49 2,80
25 1,32 1,71 2,06 2,48 2,79
26 1,32 1,71 2,06 2,48 2,78
27 1,31 1,70 2,05 2,47 2,77
28 1,31 1,70 2,05 2,47 2,76
29 1,31 1,70 2,04 2,46 2,76
30 1,31 1,70 2,04 2,46 2,75
40 1,30 1,68 2,02 2,42 2,77
60 1,30 1,67 2,00 2,39 2,66
120 1,29 1,66 1,98 2,36 2,62
Inf 1,28 1,65 1,96 2,33 2,58
Sumber : Sudjana. Metoda Statistik