Aplikasi Analisis Diskriminan dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil

(1)

APLIKASI ANALISIS DISKRIMINAN DALAM PENENTUAN

FAKTOR-FAKTOR YANG MEMPENGARUHI KELULUSAN

SISWA SMPN 1 GUNUNG MERIAH KABUPATEN

ACEH SINGKIL

SKRIPSI

ASTRIA PUJI ASTUTI

060803053

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

2010


(2)

APLIKASI ANALISIS DISKRIMINAN DALAM PENENTUAN

FAKTOR-FAKTOR YANG MEMPENGARUHI KELULUSAN

SISWA SMPN 1 GUNUNG MERIAH KABUPATEN

ACEH SINGKIL

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains

ASTRIA PUJI ASTUTI

060803053

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SUMATERA UTARA

MEDAN

2010


(3)

PERSETUJUAN

Judul : APLIKASI ANALISIS DISKRIMINAN DALAM

PENENTUAN FAKTOR-FAKTOR YANG

MEMPENGARUHI KELULUSAN SISWA SMPN 1 GUNUNG MERIAH KABUPATEN ACEH

SINGKIL

Kategori : SKRIPSI

Nama : ASTRIA PUJI ASTUTI

Nomor Induk Mahasiswa : 060803053

Program Studi : SARJANA (SI) MATEMATIKA

Departemen : MATEMATIKA

Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN ALAM (FMIPA) UNIVERSITAS SUMATERA UTARA

Diluluskan di

Medan, November 2010

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Drs. Suwarno Ariswoyo, M.Si. Dr. Sutarman, M.Sc

NIP. 195003211980031001 NIP. 196310261991031001

Diketahui/Disetujui oleh

Departemen Matematika FMIPA USU Ketua,

Dr. Saib Suwilo, M.Sc. NIP: 194601091988031004


(4)

PERNYATAAN

APLIKASI ANALISIS DISKRIMINAN DALAM PENENTUAN

FAKTOR-FAKTOR YANG MEMPENGARUHI KELULUSAN

SISWA SMPN 1 GUNUNG MERIAH KABUPATEN

ACEH SINGKIL

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, Desember2010

Astria Puji Astuti 060803053


(5)

Puji dan syukur penulis panjatkan ke hadirat Allah SWT Yang Maha Esa dan Kuasa atas limpahan rahmat dan karunia-Nya sehingga skripsi ini dapat diselesaikan.

Skripsi ini merupakan salah satu syarat yang harus dipenuhi dan diselesaikan oleh seluruh mahasiswa Fakultas FMIPA Departemen Matematika. Pada skripsi ini penulis mengambil judul skripsi tentang Aplikasi Analisis Diskriminan dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil.

Dalam penyusunan skripsi ini banyak pihak yang membantu, sehingga dengan segala rasa hormat penulis mengucapkan terima kasih kepada:

1.

Bapak Dr. Sutarman, M.Sc. selaku Dekan FMIPA USU.

2.

Bapak Dr. Saib Suwilo M.Sc dan Bapak Drs. Henry Rani Sitepu, M.si selaku ketua dan sekretaris Departemen Matematika FMIPA USU.

3. Dr. Sutarman, M.Sc. selaku dosen dan pembimbing I yang berkenan dan rela mengorbankan waktu, tenaga dan pikiran guna memberikan petunjuk dan bimbingannya dalam penulisan skripsi ini.

4. Drs. Suwarno Ariswoyo, M.Si. selaku dosen dan pembimbing II yang juga berkenan dan rela mengorbankan waktu, tenaga dan pikiran guna memberikan petunjuk dan bimbingannya dalam penulisan skripsi ini.

5. Bapak Prof . Dr. Herman Mawengkang dan Drs. H. Haluddin Panjaitan selaku komisi penguji atas masukan dan saran yang telah diberikan demi perbaikan skripsi ini.

6.

Ibu Dra. Ester Sorta M. Nababan, M.Sc selaku Penasehat Akademik.

7. Teristimewa kepada Ayahanda Asmuddin dan Ibunda tercinta Sutia, yang telah memberikan kasih sayang semangat dan doa yang tiada pernah berhenti buat saya, serta adik-adikku tersayang Dwi Rizky Septriadi dan Tiastri Marshanda Ridha dan juga saudara-saudaraku tercinta yang telah memberikan perhatian dan dorongan serta bantuan kepada penulis sehingga penulis bisa menyelesaikan pendidikan S-1 di Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sumatera Utara. 8. Sahabatku Mahater, Linda, Zuanda, Aghni, Fikoh, Rina, Agung, Afrida wati,

Annisa, Edy, Azwar, Yudha, Iqbal, Daniel, Ali, Novi, yessy, Andri dan masih banyak lagi yang tak tersebutkan namanya yang telah banyak membantu penulis dengan memberikan semangat dan doa dalam menyelesaikan tulisan ini.

9. Buat sahabat hatiku Khairul Hadi,SP yang selalu memberikan semangat dan motivasi kepada penulis dalam menyelesaikan tulisan ini.

10.Buat senior-seniorku kholizha, Rini, Amin, Radi, Toni, Dika, Santri dan masih banyak lagi yang tak tersebutkan namanya yang telah banyak membantu penulis dengan memberikan semangat dan doa dalam menyelesaikan tulisan ini.

11.Buat junior-juniorku Risky, Nelly, Kessy, Memel, Zulham, Dian, Warsini dan masih banyak lagi yang tak tersebutkan namanya yang telah banyak membantu penulis dengan memberikan semangat dan doa dalam menyelesaikan tulisan ini.


(6)

Penulis juga menyadari masih banyak kekurangan dalam skripsi ini, baik dalam teori maupun penulisannya. Oleh karena itu, penulis mengharapkan saran dari pembaca demi perbaikan bagi penulis, semoga segala kebaikan dalam bentuk bantuan yang telah diberikan mendapat balasan dari Allah SWT.

Akhirnya penulis berharap agar kiranya tulisan ini bermanfaat bagi para pembaca.

Medan, Desember 2010 Penulis

Astria Puji Astuti


(7)

ABSTRAK

Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah dapat dibedakan mana variabel respon dan mana variabel penjelas ). Dalam Analisis Diskriminan dibutuhkan asumsi data harus berdistribusi normal multivariate. Penggunaan Analisis Diskriminan dalam penelitian ini bertujuan untuk menentukan variabel-variabel yang menentukan kelulusan siswa di SMPN 1 Gunung Meriah. Data yang digunakan dalam penelitian ini diperoleh dari SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Kemudian pengujian klasifikasinya dengan menggunakan uji Press’s Q. Dengan menggunakan analisis diskriminan diperoleh hasil penelitian yang menunjukkan bahwa ada 4 (empat) variabel yang berpengaruh terhadap kelulusan siswa SMPN 1 Gunung Meriah diantaranya X1 (nilai UNAS SD), X2 (nilai UAS SD), X4 (nilai Tryout) dan X5 (nilai UAS SMP). Dari keempat faktor tersebut yang sangat dominan mempengaruhi kelulusan siswa di SMPN 1 Gunung Meriah adalah X4 (nilai Tryout). Dan model yang dihasilkan dengan menggunakan Analisis Diskriminan mempunyai tingkat accuracy

klasifikasi sebesar 78,6%.


(8)

ABSTRACT

Discriminant analysis is one of statistical technique that can be used on the dependency relationship (intervariable relationship which can be distinguished where the response variable and where the explanatory variables). Discriminant analysis of the assumptions required in the data must be multivariate normal distribution. Use of Discriminant Analysis in this study aims to determine the variables that determine students' graduation at SMPN 1 Gunung Meriah. Used data in this study obtained from SMPN 1 Gunung Meriah Aceh Singkil. Then classification test using Press's Q test. By using discriminant analysis of the research project shows that there are 4 (four) variables influencing the students' graduation SMPN 1 Gunung Meriah including X1 (value UNAS SD), X2 (UAS value SD), X4 (the tryout) and X5 (UAS value SMP). The four most dominant factors affecting students' graduation at SMPN 1 Gunung Meriah is X4 (the tryout). And the model generated by using Discriminant Analysis has a classification accuracy rate of 78.6%.


(9)

DAFTAR ISI

Halaman

Persetujuan i

Pernyataan ii

Penghargaan iii

Abstrak v

Abstract vi

Daftar Isi vii

Daftar Tabel ix

Daftar Lampiran x

Bab 1 PENDAHULUAN 1

1.1Latar Belakang 1

1.2Perumusan Masalah 3

1.3Pembatasan Masalah 3

1.4Tinjauan Pustaka 3

1.5Tujuan Penelitian 6

1.6Kontribusi Penelitian 6

1.7Metodologi Penelitian 7

Bab 2 LANDASAN TEORI 9

2.1 Variabel 9

2.2 Data 10

2.2.1 Data ditinjau dari Aspek Sifatnya 10

2.2.2 Data ditinjau dari Aspek Waktu 10

2.3 Analisis Korelasi 11

2.3.1 Macam-macam Analisis Korelasi 12


(10)

2.4 Analisis Regresi 15

2.5 Regresi Linier Ganda 17

2.6 Analisis Diskriminan 18

2.6.1 Hal-hal Pokok Tentang Analisis Diskriminan 19 2.6.2 Klasifikasi dengan Dua Populasi Multivariat Normal 21 2.6.3 Format Data Dasar dan Program Komputer yang digunakan 25 2.6.4 Algoritma Pokok Analisis dan Model Matematis 25

2.7 Pengujian Hipotesis 31

Bab 3 METODE PENELITIAN 33

3.1 Pengumpulan Data 33

3.1.1 Sumber Data 33

3.1.2 Populasi 33

3.2 Analisis Data 34

3.2.1 Interpretasi Output 46

3.2.2 Akurasi Statistik 52

Bab 4 KESIMPULAN DAN SARAN 55

4.1 Kesimpulan 55

4.2 Saran 56

DAFTAR PUSTAKA 57

LAMPIRAN 59


(11)

DAFTAR TABEL

Halaman

Tabel 2.1 Tabel Format Data untuk Analisis Diskriminan 25 Tabel 3.1 Jumlah kelas III SMPN 1 Gunung Meriah Kab. Aceh Singkil 34

Tabel 3.2 Jumlah Sampel Penelitian 34 Tabel 3.3 Korelasi antara Variabel dalam Populasi 36

Tabel 3.4 Interpretasi Koefisien Korelasi 36

Tabel 3.5 Uji Kesamaan Rata-rata 39

Tabel 3.6 Hasil Output Uji Kesamaan Matriks Covarians 39

Tabel 3.7 Hasil Uji Box’s M 39

Tabel 3.8 Grup StatistiK 46

Tabel 3.9 Variables Entered/ 47

Tabel 3.10 Variabel dalam Analisis 47

Tabel 3.11 Variabel yang Tidak Masuk dalam Analisis 48

Tabel 3.12 Nilai Eigen 48

Tabel 3.13 Wilk’s Lambda 49

Tabel 3.14 Struktur Matriks 49

Tabel 3.15 Koefisien Fungsi Diskriminan Kanonik 50

Tabel 3.16 Fungsi pada Grup Terpusat 50

Tabel 3.17 Peluang Utama untuk Grup 51

Tabel 3.18 Hasil Klasifikasi 52


(12)

DAFTAR LAMPIRAN

Halaman

Lampiran A : Data variabel siswa 59

Lampiran B : Data Nilai UNAS SD 61

Lampiran C : Data Nilai UAS SD 63

Lampiran D : Data Nilai Raport Siswa 65

Lampiran E : Data Nilai Tryout SMP 67

Lampiran F : Data Nilai UAS SMP 69

Lampiran G : Hasil Outpot SPSS 71

Lampiran H : Angket Penelitian 85

Lampiran I : Tabel Distribusi F untuk = 0,05 87

Lampiran J : Tabel Distribusi Student’s (t) 88


(13)

ABSTRAK

Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antarvariabel dimana sudah dapat dibedakan mana variabel respon dan mana variabel penjelas ). Dalam Analisis Diskriminan dibutuhkan asumsi data harus berdistribusi normal multivariate. Penggunaan Analisis Diskriminan dalam penelitian ini bertujuan untuk menentukan variabel-variabel yang menentukan kelulusan siswa di SMPN 1 Gunung Meriah. Data yang digunakan dalam penelitian ini diperoleh dari SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Kemudian pengujian klasifikasinya dengan menggunakan uji Press’s Q. Dengan menggunakan analisis diskriminan diperoleh hasil penelitian yang menunjukkan bahwa ada 4 (empat) variabel yang berpengaruh terhadap kelulusan siswa SMPN 1 Gunung Meriah diantaranya X1 (nilai UNAS SD), X2 (nilai UAS SD), X4 (nilai Tryout) dan X5 (nilai UAS SMP). Dari keempat faktor tersebut yang sangat dominan mempengaruhi kelulusan siswa di SMPN 1 Gunung Meriah adalah X4 (nilai Tryout). Dan model yang dihasilkan dengan menggunakan Analisis Diskriminan mempunyai tingkat accuracy

klasifikasi sebesar 78,6%.


(14)

ABSTRACT

Discriminant analysis is one of statistical technique that can be used on the dependency relationship (intervariable relationship which can be distinguished where the response variable and where the explanatory variables). Discriminant analysis of the assumptions required in the data must be multivariate normal distribution. Use of Discriminant Analysis in this study aims to determine the variables that determine students' graduation at SMPN 1 Gunung Meriah. Used data in this study obtained from SMPN 1 Gunung Meriah Aceh Singkil. Then classification test using Press's Q test. By using discriminant analysis of the research project shows that there are 4 (four) variables influencing the students' graduation SMPN 1 Gunung Meriah including X1 (value UNAS SD), X2 (UAS value SD), X4 (the tryout) and X5 (UAS value SMP). The four most dominant factors affecting students' graduation at SMPN 1 Gunung Meriah is X4 (the tryout). And the model generated by using Discriminant Analysis has a classification accuracy rate of 78.6%.


(15)

Bab 1

PENDAHULUAN

1.1 Latar Belakang

Dalam upaya meningkatkan Sumber Daya Manusia (SDM) yang bermutu, bidang pendidikan memegang peranan penting. Dengan pendidikan diharapkan kemampuan mutu pendidikan dan martabat manusia Indonesia dapat ditingkatkan. Upaya meningkatkan SDM dilakukan melalui jalur pendidikan dasar, pendidikan menengah, dan pendidikan tinggi. Perkembangan ilmu pengetahuan dan teknologi menuntut peningkatan mutu pendidikan. Peningkatan mutu pendidikan dapat dilakukan dengan melakukan perbaikan, perubahan dan pembaharuan terhadap faktor-faktor yang mempengaruhi keberhasilan pendidikan. Salah satu parameter yang digunakan untuk mengukur tingkat keberhasilan pendidikan adalah prestasi belajar siswa. Prestasi belajar dipengaruhi oleh dua faktor yaitu faktor intern dan faktor eksteren. Faktor intern yaitu faktor yang berasal dari dalam manusia yang terdiri dari: faktor biologis (karena sakit, karena kurang sehat, karena cacat tubuh) dan faktor psikologis (intelegensi, bakat, minat, motivasi, dan faktor kesehatan mental). Faktor ekstern yaitu faktor yang berasal dari luar diri manusia yang terdiri dari lingkungan keluarga, lingkungan sekolah dan lingkungan masyarakat dan media massa. Prestasi belajar adalah hasil suatu penilaian dibidang pengetahuan, keterampilan dan sikap sebagai hasil belajar yang dinyatakan dalam bentuk nilai.

Untuk mengevaluasi prestasi belajar pemerintah melaksanakan ujian nasional, yang merupakan kegiatan pengukuran dan penilaian kompetensi peserta didik secara nasional pada jenjang pendidikan. Pendidikan merupakan investasi jangka panjang yang memerlukan usaha dan dana yang cukup besar. Hal ini diakui oleh semua orang atau suatu bangsa demi kelangsungan masa depan. Demikian halnya dengan Indonesia menaruh harapan besar terhadap pendidikan dalam perkembangan masa depan bangsa ini, karena dari pendidikan pemuda menjadi harapan bangsa sebagai generasi penerus Universitas Sumatera Utara


(16)

dibentuk. Faktor utama untuk menilai kualitas pembelajaran dan kelulusan siswa dari suatu lembaga pendidikan, sering didasarkan pada hasil belajar siswa yang tertera pada nilai tes hasil belajar. Adapun faktor-faktor yang mempengaruhi kelulusan siswa diantaranya yaitu nilai UNAS SD, nilai UAS SD, nilai rapor, nilai tryout, nilai UAS SMP, lingkungan sekolah, pendidikan orang tua, penghasilan orang tua dan lain-lain. Dari faktor-faktor tersebut dapat kita ketahui faktor apa saja yang menjadi faktor utama dalam penentuan kelulusan siswa dengan menggunakan metode analisis diskriminan.

Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada hubungan dependensi (hubungan antar faktor dimana sudah bisa dibedakan mana faktor respon dan mana faktor penjelas). Lebih spesifik lagi, analisis diskriminan digunakan pada kasus dimana faktor respon berupa data kualitatif dan faktor penjelas berupa data kuantitatif. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive) berdasarkan sejumlah faktor penjelas. Fungsi diskriminan ini dibentuk dengan memaksimumkan jarak antar kelompok, sehingga memiliki kemampuan untuk membedakan antar kelompok. Selain analisis diskriminan, analisis regresi logistik juga dapat digunakan untuk mengklasifikasikan suatu individu atau observasi kedalam kelompok yang saling bebas dan menyeluruh berdasarkan sejumlah faktor penjelas. Dalam penelitian ini menggunakan analisis diskriminan karena tujuan dalam penelitian ini adalah untuk melihat perbedaan antar kelompok beserta faktor-faktor apa saja yang paling membedakan antar kelompok tersebut, meskipun analisis regresi logistik juga dapat digunakan dalam hal ini, tetapi analisis diskriminan lebih sesuai untuk digunakan. Sedangkan jika tujuan analisis lebih bertujuan untuk melihat probabilitas suatu subjek diklasifikasikan ke kelompok tertentu sebaiknya menggunakan analisis regresi logistik. Analisis diskriminan dapat digunakan untuk menganalisis faktor-faktor yang mempengaruhi kelulusan siswa karena analisis diskriminan dapat memisahkan faktor lulus dengan faktor tidak lulus sehingga dapat dikatakan faktor-faktor tersebut mempengaruhi kelulusan siswa. Berdasarkan penjelasan tersebut penulis memilih judul “Aplikasi Analisis Diskriminan dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil “. Universitas Sumatera Utara


(17)

1.2 PERUMUSAN MASALAH

Berdasarkan uraian diatas, penulis merumuskan masalah sebagai berikut:

1. Faktor-faktor apa saja yang mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.

2. Bagaimana mengklasifikasikan nilai kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010 sesuai dengan faktor-faktor yang mempengaruhinya.

1.3 PEMBATASAN MASALAH

Penelitian ini dibatasi dalam beberapa hal, yaitu:

1. Penelitian ini hanya dilakukan di kelas 3 SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.

2. Hanya untuk mengkategorikan faktor-faktor yang mempengaruhi kelulusan siswa kelas 3 SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010 dengan menggunakan Analisis Diskriminan.

1.4 TINJAUAN PUSTAKA

Suryatmojo (2006), melakukan penelitian terhadap perilaku PNS Administrasi UNS berbelanja di toko KPRI UNS Surakarta dengan Analisis Diskriminan dan didapatkan hasil bahwa terdapat perbedaan perilaku belanja yang signifikan antara perilaku PNS Administrasi UNS yang sering berbelanja dengan yang jarang berbelanja ditoko KPRI UNS Surakarta.

Pengklasifikasian adalah salah satu analisis statistika yang diperlukan jika ada beberapa kelompok kemudian ingin diketahui apakah kelompok-kelompok tersebut memang berbeda secara statistika. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih faktor lain yang merupakan faktor independen. Kombinasi


(18)

linier dari faktor-faktor ini akan membentuk suatu fungsi diskriminan (Tatham et.al, 1998).

Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu: 1. Sejumlah p faktor penjelas harus berdistribusi normal.

2. Matriks varians-covarians faktor penjelas berukuran pada kedua kelompok harus sama.

Analisis diskriminan mirip dengan regresi linear berganda (multivariabel regression). Perbedaannya, analisis diskriminan dipakai kalau faktor dependennya kategoris (maksudnya kalau menggunakan sklala ordinal ataupun skala nominal) dan faktor independennya menggunakan skala metrik (interval dan rasio). Sedangkan dalam regresi independen, bisa metrik maupun nonmetrik. Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi linier dari berbagai variabel independen, Simamora (2005).

Model analisis diskriminan berkenaan dengan kombinasi linear yang bentuknya sebagia berikut :

Di =b0 +b1Xi1+b2Xi2 +b3Xi3 + +bjXij + +bkXik

Dengan :

Di = nilai (skor) diskriminan dari responden (objek) ke-i. Dimana i = 1, 2, . . . , n. D merupakan variabel tak bebas.

ij

X = faktor (atribut) ke-j dari responden ke-i

j

b = koefisien atau timbangan diskriminan dari faktor atau atribut ke-j

ij

X = faktor bebas/prediktor ke-j dari responden ke-i, juga disebut atribut, seperti disebutkan diatas.

Koefisien atau timbangan (weigh) fungsi diskriminan bj diperkirakan sedemikian rupa sehingga kelompok (katagori) mempunyai nilai fungsi diskriminan (skor) yang sangat berbeda. Kalau ada dua katagori A dan B, nilai/skor fungsi diskriminan dari kelompok Universitas Sumatera Utara


(19)

yang satu (A) sangat berbeda dengan kelompok ke dua (B). kalau ada tiga kelompok A, B, dan C. Nilai fungsi diskriminan kelompok A sanngat berbeda dengan kelompok B dan sangat berbeda dengan kelompok C. Ini terjadi kalau rasio sum of squares

antara kelompok dengan sum of squares dalam kelompok untuk nilai/skor fungsi diskriminan maksimum atau rasio varian antar-kelompok dengan varian dalam kelompok sebesar mungkin (maksimum). Objek dalam kelompok homogen atau relatif homogen, sedangkan antar-kelompok sangat heterogen. Setiap kombinasi linear prediktor lainnya akan memberikan nilai rasio yang lebih kecil, Supranto (2004).

Menurut Maholtra (1999), analisis diskriminan terdiri dari lima tahap, yaitu :

1. Merumuskan masalah, tahap ini mencakup jawaban atas pertanyaan kenapa analisis diskriminan dilakukan (latar belakang masalah) dan apa tujuan analisis diskriminan, termasuk variabel-variabel apa yang dilibatkan.

2. Mengestimasi fungsi diskriminan, estimasi dapat dilakukan setelah sampel analisis diperoleh. Ada dua pendekatan umum yang diperoleh. Pertama, metode langsung (direct method), yaitu suatu cara mengestimasi fungsi diskriminan dengan melibatkan faktor-faktor prediktor sekaligus. Setiap faktor di masukkan tanpa memperhatikan kekuatan diskriminan masing-masing faktor. Metode ini baik kalau faktor-faktor prediktor dapat di terima secara teoritis. Kedua,

stepwise method dalam metode ini faktor prediktor di masukkan secara bertahap, tergantung pada kemampuannya melakukan diskriminan grup. Metode ini cocok kalau peneliti ingin memilih sejumlah faktor prediktor untuk membentuk fungsi diskriminan.

3. Memastikan signifikansi determinan. 4. Interpretasi output.

5. Uji signifikansi, tak ada gunanya mengintepretasi hasil analisis diskriminan kalau fungsinya tidak signifikan.

Suranto dan Riza (2005), melakukan penentuan strategi pemasaran berdasarkan perilaku konsumen dengan metode diskriminan, di dapat hasil bahwa model diskriminan yang ada ternyata valid dan dapat digunakan, karena mempunyai tingkat ketepatan prediksi dari model adalah 60,7%, yaitu lebih besar dari 50% dan juga mempunyai grup validasi silang yang terklasifikasi dengan baik sebesar 60,7% Universitas Sumatera Utara


(20)

sehingga terdapat perbedaan perilaku yang nyata antara konsumen yang sering berbelanja dengan mereka yang jarang berbelanja di PT. Gudang Rabat Alfa Retailindo. Untuk model diskriminan dengan tiga kelompok, pembagian faktor bebas tidak seperti kasus dua kelompok, yakni ‘langsung’ faktor A ke kelompok 1, faktor B ke kelompok 2 dan seterusnya. Pada kasus tiga kelompok, seluruh faktor bebas dilakukan proses reduksi faktor dahulu, yakni menjadi satu atau beberapa faktor. Setelah itu, setiap kelompok (sering, cukup dan jarang) akan ditentukan lebih cenderung masuk ke faktor yang mana. Jadi dasar pembagian adalah faktor dan bukan faktor bebas yang semula.

1.5 TUJUAN PENELITIAN

Adapun yang menjadi tujuan penelitian ini adalah :

1. Untuk mendiskriminan (mengelompokkan) faktor-faktor yang mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.

2. Untuk mengetahui faktor-faktor apa saja yang lebih dominan mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.

1.6 KONTRIBUSI PENELITIAN

Dapat memberikan manfaat bagi pembaca untuk lebih mengetahui dan memahami tentang analisis diskriminan. Selain itu tulisan ini diharapkan dapat di manfaatkan oleh sekolah sebagai bahan acuan dan pendukung untuk mengetahui faktor-faktor yang mempengaruhi kelulusan siswa.


(21)

1.7 METODOLOGI PENELITIAN

Penelitian ini di lakukan dengan beberapa langkah yaitu:

1. Pengumpulan Data

Data yang digunakan dalam penelitian ini adalah data primer dan data skunder. Data primer bersumber dari hasil wawancara terhadap responden dengan menggunakan angket (kuesioner) yang diberikan kepada responden. Sedangkan data skunder diperoleh dari hasil penilaian belajar siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil Tahun Ajaran 2009/2010. Populasi dalam penelitian ini adalah seluruh siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Dan populasi telah diketahui homogen dan diasumsikan bahwa populasi berdistribusi normal.

2. Pengolahan Data

Metode analisis data yang digunakan adalah teknik analisis diskriminan dengan bantuan SPSS dengan tahapan sebagai berikut:

1. Memisahkan faktor ke dalam faktor dependent dan faktor independent. 2. Analysis Case Processing Summary, tabel yang menyatakan bahwa

responden (jumlah kasus atau baris SPSS) semuanya valid (sah) untuk di proses, dapatmengetahui data yang hilang(missing).

3. Group Statistics, tabel yang menunjukkan jumlah responden yang mempunyai pengaruh terhadap kelulusan siswa yaitu lulus atau tidak lulus. 4. Test of Equality Group Means, tabel yang menunjukkan apakah terdapat

perbedaan yang signifikan untuk dua grupdiskriminan dengan berdasarkan uji F.

5. Variable Entered/Removed, tabel yang menyajikan dari tujuh faktor yang dapat dimasukkan (entered) dalam persamaan diskriminan.

6. Variable in The Analysis, tabel yang berisi rangkaian proses tahap sebelumnya, mengenai pemilihan faktor satu persatu yang dimasukkan ke dalam model.


(22)

7. Variable Not in The Analysis, tabel ini berisi ‘kebalikan’ dari tabel sebelumnya, yang memuat faktor yang akan dikeluarkan satu per-satu dari model.

8. Eigenvalues, interpretasi dari pengelompokkan faktor ke dalam satu atau lebih faktor yang dianalis.

9. Wilk’s Lambda, mengindikasi perbedaan yang signifikan (nyata) antara kedua grup dalam k model diskriminan berdasarkan angka Chi-Square. 10. Standardized Canonical Discriminant Function Coefficient, menentukan

faktor mana yang akan masuk ke faktor mana, dasar pemasukan faktor dilihat pada besar korelasi kanonikal, dengan korelasi terbesar masuk ke faktor yangbersangkutan.

11. Structure Matrix, menunjukkan faktor yang paling membedakan perilaku terhadap kelulusan siswa.

12. Functions At Group Centroid, tabel ini mengelompokkan ke dua grup dalam fungsi 1ataufungsi 2.

13. Casewise Statistics, tabel yang berisi rincian tiap kasus, penempatannya dalam model diskriminan serta perbandingan apakah penempatan (predicted) telah sesuai dengan kenyataan.

14.Classification Result, menunjukkan angka ketepatan prediksi dari model diskriminan. Pada umumnya ketepatan di atas 50% di anggap memadai atau valid.

d) Menarik kesimpulan, yaitu menyimpulkan hasil dari SPSS 17


(23)

Bab 2

LANDASAN TEORI

2.1 Variabel

Variabel adalah suatu sebutan yang dapat diberi nilai angka (kuantitatif) atau nilai mutu (kualitatif). Variabel merupakan pengelompokan secara logis dari dua atau lebih atribut dari objek yang diteliti. Misalnya: tidak sekolah, tidak tamat SD, tidak tamat SMP. Maka variabelnya adalah tingkat pendidikan dari objek penelitian itu. Variabel tingkat pendidikan merangkum semua atribut tadi.

Variabel merupakan suatu istilah yang berasal dari kata vary dan able yang berarti “berubah” dan “dapat”. Jadi kata variabel berarti dapat berubah. Oleh sebab itu setiap variabel dapat diberi nilai dan nilai itu berubah-ubah. Nilai itu berupa nilai kuntitatif maupun kualitatif. Dilihat dari segi nilainya, variabel dibedakan menjadi dua, yaitu variabel diskrit dan variabel kontinu. Variabel diskrit nilai kuantitatifnya selalu berupa bilangan bulat. Variabel kontinu nilai kuantitatifnya bisa berupa pecahan. (http://rakim-ypk.blogspot.com).

Variabel penelitian pada dasarnya adalah segala sesuatu yang berbentuk apa saja yang ditetapkan oleh peneliti untuk dipelajari sehingga diperoleh informasi tentang hal tersebut, kemudian ditarik kesimpulannya, (Sugiyono, 2007).

Menurut hubungan antara suatu variabel dengan variabel lainnya, variabel terbagi atas beberapa yaitu :

a. Variabel independent (independent variable) atau variabel bebas yaitu variabel yang menjadi sebab terjadinya (terpengaruhnya) variabel dependent (variabel tak bebas).

b. Variabel dependent (dependent variable) atau variabel tak bebas yaitu variabel yang nilainya dipengaruhi oleh variabel independent.


(24)

c. Variabel moderator yaitu variabel yang memperkuat atau memperlemah hubungan antara suatu variabel dependent dengan independent.

d. Variabel intervening, seperti variabel moderator, tetapi nilainya tidak dapat diukur, seperti kecewa, gembira, sakit hati, dsb.

e. Variabel kontrol, yaitu variabel yang dapat dikendalikan oleh peneliti.

2.2 DATA

Data merupakan kumpulan fakta atau angka atau segala sesuatu yang dapat dipercaya kebenarannya sehingga dapat digunakan sebagai dasar penarikan kesimpulan. Data dapat dikelompokkan dalam beberapa golongan antara lain berdasarkan aspek sifat, dimensi waktu, cara memperoleh dan pengukurannya, muhidin (2009).

2.2.1 Data ditinjau dari Aspek sifat angka

Ditinjau dari aspek sifat angka, data digolongkan menjadi dua, yaitu:

1. Data diskrit, yaitu data yang satuannya merupakan bilangan bulat dan tidak berbentuk pecahan. Contohnya data mengenai jumlah pada sebuah PTN di Kota Bandung.

2. Data kontinu adalah data yang satuannya merupakan bilangan pecahan. Contohnya data mengenai rata-rata berat badan mahasiswa pada sebuah PTN di Kota Bandung.

2.2.2 Data ditinjau dari Aspek waktu

Ditinjau dari aspek waktu, data digolongkan menjadi dua yaitu:

1. Data time series, yaitu data yang dikumpulkan pada waktu tertentu yang dapat menggambarkan keadaan/karakteristik objek pada saat penelitian dilakukan, contoh: data jumlah mahasiswa PTN di Indonesia tahun 2006.


(25)

2. Data cross section adalah data yang dikumpulkan dari waktu ke waktu yang dapat digambarkan tentang perkembangan suatu kejadian atau kegiatan tertentu, contoh: data perkembangan jumlah mahasiswa sebuah PTN di Indonesia selama 5 tahun terakhir.

2.3 Analisis Korelasi

Analisis korelasi adalah metode yang digunakan untuk mengukur kekuatan atau derajat hubungan antara dua variabel atau lebih. Perhitungan derajat keeratan didasarkan pada persamaan regresi. Dalam ilmu statistika, istilah korelasi diberi pengertian sebagai hubungan linier antara dua variabel atau lebih. Hubungan antara dua variabel dikenal dengan istilah bivariate correlation, sedangkan hubungan antar lebih dari dua variabel disebut multivariate correlation. Contoh bivariate correlation: hubungan antara motivasi kerja dengan kerja. Sedangkan contoh multivariate correlation: hubungan antara motivasi kerja dan disiplin kerja dengan kinerja, Mann (2004). Tujuan dilakukan analisis korelasi antara lain adalah:

1. Untuk mencari bukti terdapat tidaknya hubungan (korelasi) antarvariabel 2. Bila sudah ada hubungan, untuk melihat tingkat keeratan hubungan

antarvariabel

3. Dan untuk memperoleh kejelassan dan kepastian apakah hubungan tersebut berari (meyakinkan/siignifikan) atau tidak berarti.

Tinggi-rendah, kuat-lemah atau besar-kecilnya suatu korelasi dapat diketahui dengan melihat besar kecilnya suatu angka (koefisien) yang disebut angka indeks korelasi atau coefficient of correlation, yang disimbolkan dengan atau r. Koefisien korelasi untuk data populasi disimbolkan dengan , sedangkan korelasi untuk data sampel disimbolkan dengan r. Angka korelasi berkisar antara 0 sampai dengan ± 1,00. Perhatikan tanda plus minus (±) pada angka indeks korelasi. Tanda plus minus pada angka indeks korelasi ini fungsinya hanya untuk menunjukkan arah korelasi jadi bukan sebagai tanda aljabar. Apabila angka indeks korelasi bertanda plus (+) maka korelasi tersebut positif dan arah korelasi satu arah, sedangkan apabila angka indeks korelasi bertanda minus (-), maka korelasi tersebut negatif dan arah korelasi Universitas Sumatera Utara


(26)

berlawanan arah; serta apabila angka indeks korelasi sama dengan 0, maka hal ini menunjukkan tidak ada korelasi. Dengan demikian, arah korelasi dapat dibedakan menjadi dua, yaitu yang bersifat satu arah dan yang sifatnya berlawanan arah, Mann (2009).

2.3.1 Macam-macam Analisis Korelasi

1. Korelasi untuk skala pengukuran ordinal

Apabila kita kita punya dua buah variabel X dan Y yang kedua-duanya memiliki tingkat pengukuran ordinal maka koefisien korelasii yang dapat dipergunakan adalah koefisien korelasi Spearman atau Spearman’s coefficient of (Rank)

correlation dan koefisien korelasi Kendal atau Kendall’s coefficient of (Rank)

correlation.

a. Spearman’scoefficient of (Rank) correlation

Angka indek korelasi Spearman dapat dihitung dengan menggunakan rumus berikut:

(Siegel and Castellan 1988) dimana:

= koefisien korelasi rank spearman n = banyaknya ukuran sampel

= jumlah koadrat dari selisih rank variabel x dengan rank variabel y

Penggunaan rumus untuk mencari koefisien korelasi Spearman diatas, berlaku bila kurang dari 20% skor-skor pada sebuah kelompok peringkatnya sama. Bila lebih dari 20%, maka rumus koreksian harus digunakan (Siegel and Castellan, 1988). Rumus koreksian tersebut adalah:

! "#


(27)

dimana:

$%$&'()

(

*%*&'()

( $%$&'()

(

*%*&'()

(

d = Selisih dari rank variabel x dengan rank variabel y

t = Banyak anggota kembar pada suatu perkembaran

selain rumus koreksian dari Spearman, ada rumus lain yang dapat digunakan bila terdapat data kembar, yaitu rumusnya adalah (Conover, 1999):

( ) ( )

( )

− +

( )

− + + − = = = n i i n i i n i i i n n Y R n n X R n n Y R X R 1 2 2 1 2 2 1 2 2 1 2 1 2 1 . dimana:

= Koefisien korelasi rank spearman

( ) ( )

xi R yi

R . = Jumlah dari hasil kali rank variabel x denngan rank variabel y

( )

2

i x

R = Jumlah dari rank kuadrat variabel x

( )

2

i y R

= Jumlah dari rank kuadrat variabel y

( )

xi

R = Rank variabel x

( )

yi

R = Rank variabel y

n = Banyaknya ukuran sampel

b. Kendall’s Coefficient of (Rank) Correlation

Rumus lain yang dapat digunakan untuk menghitung koefisien korelasi dengan dua buah variabel x dan y, yang kedua-duanya memiliki tingkat pengukuran ordinal adalah koefisien korelasi dari kendall atau Kendall’s Coefficient of (Rank) Correlation.

Dengan demikian rumus koefisien korelasi kendall ini, sama dengan spearman, yaitu digunakan untuk jenis data peringkat (ordinal). Bedanya koefisien kendall memperhitung posisi wajar peringkat yang satu terhadap yang lainnya dari


(28)

peringkat di kelompok keduanya. Rumus yang digunakan untuk koefisien korelasi dari kendall adalah (Conover, 1998):

2 / ) 1 ( −

− =

n n

N

Nc d

τ

dimana:

c

N = Jumlah pasangan yang sesuai dari pengamatan

d

N = Jumlah pasangan yang tidak sesuai dari pengamatan

n = Banyaknya pengamatan

2. Korelasi untuk skala pengukuran Interval

Koefisien korelasi untuk dua buah variabel x dan y yang kedua-duanya memiliki tingkat pengukuran interval, dapat dihitung dengan menggunakan korelasi product moment atau product moment Coefficient (pearson’s Coefficien of Correlation) yang dikembangkan oleh Karl Pearson. Perbedaan dengan korelasi Spearman adalah, pada korelasi Spearman yang dikorelasikan adalah data peringkatnya (rangking), sementara pada korelasi product moment data observasinya yang dikorelasikan, (Conover, 1999). Koefisien korelasi product moment dapat diperoleh dengan rumus:

(

) (

)

(

)

[

]

[

(

)

]

⋅ −

=

2 2

2 2

Y Y

N X X

N

Y X

XY N rxy

2.3.2 Korelasi Parsial dan Ganda

Korelasi parsial (Partial Correlation) adalah suatu nilai yang memberikan kuatnya hubungan dua atau lebih variabel X dengan variabel Y, yang salah satu bagian variabel bebasnya dianggap konstan atau dibuat tetap. Koefisien korelasi parsial dirumuskan sebagai berikut (Conover, 1999):

• Hubungan antara variabel bebas-X1 dengan variabel tak bebas-y, apabila variabel-X2 tetap.


(29)

( )

(

2

)(

1 2

)

2 1 2 1

2 , 2 2

1 1 . x x y x x x y x y x y x x r r r r r r − − − =

• Hubungan antara variabel bebas-X2 dengan variabel tak bebas-Y, apabila variabel bebas-X1tetap.

( )

(

1

)(

1 2

)

2 1 1 2 2

1 2 2

1 1 . x x y x x x y x y x y x x r r r r r r − − − =

• Hubungan antara variabel bebas-X1 dengan variabel tak bebas-X2, apabila variabel tak bebas-Y tetap.

( )

(

xy

)(

x y

)

y x y x x x x x y r r r r r r 2 1 2 1 2 1 2

1 2 2

1 1 . − − − =

• Korelasi ganda (Multiple Correlation) adalah suatu nilai yang memberikan kuatnya hubungan dua atau lebih variabel bebas X secara bersama-sama dengan variabel tak bebas- Y. koefisien korelasi ganda dirumuskan sebagai berikut: 2 1 2 1 2 1 2 1 2 1 2 2 2 1 . . . 2 x x x x y x y x y x y x y x x r r r r r r R − − + =

(Kapur and Saxena, 2007)

2.4 Analisis Regresi

Analisis regresi adalah teknik statistika yang berguna untuk memeriksa dan memodelkan hubungan diantara variabel-variabel. Secara umum ada dua macam hubungan antara dua variabel atau lebih, yaitu bentuk hubungan dan keeratan hubungan. Untuk keeratan hubungan dapat diketahui dengan analisis korelasi. Analisis regresi dipergunakan untuk menelaah hubungan antara dua variabel atau lebih, terutama untuk menelusuri pola hubungan yang modelnya belum diketahui denngan sempurna, atau untuk mengetahui bagaimana variasi dari beberapa variabel independen mempengaruhi variabel dependen dalam suatu fenomena yang kompleks. Jika X1, X2, …, Xi adalah variabel-variabel independen dan Y adalah variabel dependen, maka terdapat hubungan fungsional antara X dan Y, dimana variasi dari X


(30)

akan diiringi pula oleh variasi dari Y. Secara matematika hubungan diatas dapat dijabarkan sebagai berikut:

(

x x x e

)

f

Y = 1, 2, , i, dimana:

Y = variabel dependen

x = variabel independen

e = variabel residu (disturbance term)

Berkaitan dengan analisis regresi ini, setidaknya ada 4 yang dilakukan dalam analisis regresi ini diantaranya: mengadakan estimasi terhadap parameter berdasarkan data empiris, menguji berapa besar variasi variabel dependen dapat diterangkan oleh variasi variabel independen, menguji apakah estimasi parameter tersebut signifikan atau tidak dan melihat apakah tanda dan magnitud dari estimasi parameter cocok dengan teori (Nazir, 1983).

Regresi sederhana bertujuan untuk mempelajari hubungan antara dua variabel. Model regresi sederhana adalah + = a + bx dimana, + adalah variabel tak bebas (terikat), x adalah variabel bebas, a adalah penduga bagi intersap ( ), b adalah penduga bagi koefisien regresi ( ), dan , adalah parameter yang nilainya tidak diketahui sehingga diduga menggunakan statistic sampel, (Triola, 2005). Rumus yang dapat digunakan untuk mencari a dan b adalah:

X b Y N

x b y

a= − = −

(

)

(

)

− −

= 2

2 .

X X

N

Y X XY

N b

dimana:

i

X = Rata-rata skor variabel X

i

Y = Rata-rata skor variabel Y


(31)

2.5 Regresi Linier Ganda

Dalam regresi linier ganda variabel terikat y bergantung pada dua atau lebih varibel bebas. Mungkin terdiri dari beberapa variabel bebas, misalnya: X1,X2, ,Xn

Hubungan seperti ini dapat dicari dengan menggunakan analisis regresi berganda dengan bentuk umum sebagai berikut :

Yi = 0 + 1X1 + 2X2 + …+ nXn + i

dengan :

Yi = Variabel terikat (Variabel respon) 0 , 1, 2, … , n = Parameter regresi

X1 X2, …, Xn = Variabel bebas

1 = Kesalahan/galat

Estimasi parameter-parameter menggunakan metode kuadrat terkecil, misalnya: ,-I= Nilai penafsir (ramalan) Y

./0 = Penaksir .0 ./1 = Penaksir .( 1

./n = penaksir ./n

Dengan prosedur metode kuadrat terkecil menghasilkan :

,-I = ./0 + ./1X1 + ./2X2 + … + ./nXn + i

Untuk menentukan koefisien-koefisien variabel ./0,./1,./2, …, ./n diperlukan n buah pasangan data (X1,X2, ,Xn,YI) yang diperoleh dari pengamatan (Johnson and Bhattacharyya, 1987).


(32)

2.6 Analisis Diskriminan

Analisis diskriminan mirip regresi linier berganda (multivariable regression). Perbedaannya, analisis diskriminan dipakai kalau variabel dependennya kategori (maksudnya kalau menggunakan skala ordinal ataupun nominal) dan variabel independennya menggunakan skala metrik (interval dan rasio). Sedangkan dalam regresi berganda variabel dependentnya harus metrik, dan jika variabelnya independen, bisa metrik maupun nonmetrik. Sama seperti regresi berganda, dalam analisis diskriminan variabel independen hanya satu, sedangkan variabel independen banyak (multiple). Misalnya, variabel dependen adalah pilihan merek mobil: Kijang, Kuda, dan Panther. Variabel independen adalah rating setiap merek pada sejumlah atribut yang memakai skala 1 sampai 7, (Simamora, 2005).

Analisis diskriminan adalah metode statistik untuk mengelompokkan atau mengklasifikasi sejumlah obyek ke dalam beberapa kelompok, berdasarkan beberapa variabel, sedemikian hingga setiap obyek yang menjadi anggota lebih dari pada satu kelompok. Pada prinsipnya analisis diskriminan bertujuan untuk mengelompokkan setiap obyek ke dalam dua atau lebih kelompok berdasarkan pada kriteria sejumlah variabel bebas. Pengelompokkan ini bersifat mutually exclusive, dalam artian jika obyek A sudah masuk kelompok 1, maka ia tidak mungkin juga dapat menjadi anggota kelompok 2. Analisis kemudian dapat dikembangkan pada ‘variabel mana saja yang membuat kelompok 1 berbeda dengan kelompok 2, berapa persen yang masuk ke kelompok 1, berapa persen yang masuk ke kelompok 2. Oleh karena ada sejumlah variabel independen, maka akan terdapat satu variabel dependen (tergantung), ciri analisis diskriminan adalah jenis data dari variabel dependent bertipe nominal (kategori), seperti kode 0 dan 1, atau kode 1, 2 dan 3 serta kombinasi lainnya (Overall and Klett, 1972).


(33)

2.6.1 Hal-hal Pokok Tentang Analisis Diskriminan

Bentuk multivariat dari analisis diskriminan adalah dependen sehingga variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau grup 2 atau lainnya, (Santoso, 2010).

Tujuan diskriminan secara umum adalah:

1. Ingin mengetahui apakah ada perbedaan yang jelas antar-grup pada variabel dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota Grup 1 dengan anggota Grup 2?

2. Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan tersebut?

3. Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.

4. Melakukan klasifikasi terhadap objek (dalam terminology SPSS disebut baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk pada grup 2, atau lainnya.

Proses dasar dari analisis diskriminan ialah:

• Memisah variabel-variabel menjadi Variabel Dependen dan Variabel Independen.

• Menentukan metode untuk membuat Fungsi Diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yakni :

1. Simultaneous Estimation, dimana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses analisis diskriminan.

2. Step-Wise Estimation, dimana variabel dimasukkan satu persatu kedalam model diskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih variabel independen yang ‘dibuang’ dari model.

• Menguji signifikansi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s lambda, pilai, F test dan lainnya.

• Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui ketepatan klasifikasi secara individual dengan Casewise Diagnostics.


(34)

• Melakukan interpretasi terhadap fungsi diskriminan tersebut.

• Melakukan uji validitas fungsi diskriminan.

Berikut ini beberapa asumsi yang harus dipenuhi agar model diskriminan dapat digunakan:

1. Multivariate Normality, atau variabel independen seharusnya berdistribusi normal, hal ini akan menyebabkan masalah pada ketepatan fungsi (model) diskriminan. Regresi logistic (Logistic Regression ) bisa dijadikan alternative metode jika memang data tidak berdistribusi normal. Tujuan uji normal adalah ingin mengetahui apakah distribusi data dengan bentuk lonceng (bell shaped). Data yang ‘baik’ adalah data yang mempunyai pola seperti distribusi normal, yakni distribusi data tersebut tidak menceng ke kiri atau menceng ke kanan. Uji normalitas pada multivariat sebenarnya sangat kompleks, karena harus dilakukan pada seluruh variabel secara bersama-sama. Namun, uji ini bisa juga dilakukan pada setiap variabel dengan logika bahwa jika secara individual masing-masing variabel memenuhi asumsi normalitas, maka secara bersama-sama (multivariat) variabel-variabel tersebut juga bisa dianggap memenuhi asumsi normalitas. Adapun criteria pengujiannya adalah:

• Angka signifikansi (Sig) > 0,05, maka data tersebut berdistribusi normal.

• Angka signifikansi (Sig) < 0,05, maka data tidak berdistribusi normal.

Jika sebuah variabel mempunyai sebaran data yang tidak normal, maka perlakuan yang dimungkinkan agar menjadi normal, (Santoso, 2010):

Menambah jumlah data. Seperti pada kasus, bisa dicari 20 atau 30 atau sejumlah data baru untuk menambah ke-75 data berat badan konsumen yang sudah ada. Kemudian dengan jumlah data yang baru, dilakukan pengujian sekali lagi.

Menghilangkan data yang dianggap penyebab tidak normalnya data. Seperti pada variabel berat, jika dua data yang outlier dibuang, yakni berat 100 dan 120, kemudian diulang proses pengujian, mungkuin data bisa menjadi normal. Jika belum normal, ulangi pengurangan data yang dianggap penyebab ketidaknormalan data. Namun demikian, pengurangan data harus


(35)

dipertimbangkan apakah tidak mengaburkan tujuan penelitian karena hilangnya data-data yang seharusnya ada.

Dilakukan transformasi data, misal mengubah data ke logaritma atau kebentuk natural (ln) atau bentuk lainnya, kemudian dilakukan pengujian ulang.

Data diterima apa adanya, memang dianggap tidak normal dan tidak perlu dilakukan berbagai treatment. Untuk itu, alat analisis yang dipilih harus diperhatikan, seperti untuk multivariate mungkin faktor analisis tidak begitu mementingkan asumsi kenormalan. Atau pada kasus statistik univariat, bisa dilakukan alat analisis nonparametrik, (Santoso, 2010).

2.6.2 Klasifikasi dengan Dua Populasi Multivariat Normal

Dalam buku Johnson and Wichern (2007), dijelaskan bahwa fungsi diskriminan pertama kali diperkenalkan oleh Ronald A. Fisher (1936) dengan menggunakan beberapa kombinasi linier dari pengamatan yang cukup mewakili populasi. Menurut Fisher, untuk mencari kombinasi linier dari p variabel bebas tersebut dapat dilakukan dengan pemilihan koefisien-koefisiennya yang menghasilkan hasil bagi maksimum antara matrik peragam antar kelompok (between-group) dan matrik peragam dalam kelompok (within-group).

Adapun asumsi-asumsi yang harus dipenuhi sebelum melakukan analisis diskriminan, antara lain yaitu:

• Variabel independen berdistribusi normal multivariat (multivariates normal distribution)

• Varians dalam setiap kelompok adalah sama (equal variances)

Prosedur–prosedur klasifikasi yang didasarkan pada populasi normal lebih unggul dalam statistik karena tidak rumit dan tingkat efisiensi yang tinggi yang melibatkan banyak model variasi populasi. Sekarang asumsikan bahwa f1(x)dan f2(x)

kepadatan multivariat normal, pertama dengan vektor rata-rata 1 dan matriks

kovarian 1dan yang kedua dengan vector rata-rata 2 dan matriks kovarian 2.


(36)

Klasifikasi populasi normal ketika 1= 2= anggap bahwa kepadatan bersama dari X’ = [X1, ,X2, . . , .XP]untuk populasi 1 dan 2 diberikan oleh:

fi(x) = (

3 4 &5 6 67 & 5

exp8 ( 9 : ; '( 9 : < untuk i = 1,2 (2.1)

Anggap juga bahwa parameter-parameter populasi 1, 2, dan diketahui. Kemudian, setelah cancelasi dari istilah "= >5 ? ?( 5 daerah Expected Cost of Misclassification (ECM) minimum pada region R1 dan R2 yang meminimalisir ECM didefenisikan oleh nilai x untuk ketidaksamaan yang berlaku sebagai berikut:

R1 = @@7 9 & 9 A B

C D(E

C D E(F B>>7&F

R2 = @@7 9 & 9 G B

C D(E

C D E(F B>>7&F

menjadi :

(

)

(

)

+

(

)

(

)

1 ' −1 1 2 ' −1 2

1

2 1 2

1 exp

: x x x x

R BC D(E

C D E(F B

>7

>&F

(

)

(

)

+

(

)

(

)

<

1 ' −1 1 2 ' −1 2

2

2 1 2

1 exp

: x x x x

R BC D(E

C D E(F B

>7

>&F (2.2)

Diberikan daerah R1 dan R2, sehingga dapat membentuk aturan klasifikasi yang diberikan pada hasil berikut:

Anggap populasi 1 dan 2 dideskripsikan oleh idensitas multivariate normal dengan

bentuk pada persamaan (2.1). Kemudian aturan alokasi yang meminimalisir ECM

sebagai berikut :

Alokasikan x0 ke 1 jika

:( : ; '(90 ( :( : ; '( :( : A L 8BC D(EC D E( F B>>&7F< (2.3)

Dengan cara lain alokasikan x0 ke 2.

Bukti: karena quantitas pada persamaan (2.2) tidak negatif untuk semua x, maka dapat


(37)

( 9 :

( ; '( 9 :( ( 9 : ; '( 9 :

= :( : ; '(9 ( :( : ; '( :( : (2.4) dan akibatnya

R1 :

(

)

(

)

(

1 2

)

1 ' 2 1 1 ' 2

1 − − − +

− −

2 1

x A L 8BC D(E

C D E(F B >&

>7F<

R2 :

(

)

(

)

(

1 2

)

1 ' 2 1 1 ' 2

1 − − − +

− −

2 1

x G L 8BC D(E

C D E(F B >&

>7F< (2.5)

Pada kebanyakan situasi, quantitas populasi 1, 2, dan tidak diketahui, sehingga

aturan (2.3) harus dimodifikasi. Wald dan Anderson menyarankan mengganti parameter-parameter populasi dengan sampel mereka.

Kemudian, anggap kita memiliki n1 observasi dari variabel acak multivariat X’ = [X1,

X2, …, Xp] dari 1 dan n2 pengukuran quantitas ini dari 2, dengan n1+ n22 p.

Kemudian matriks data respektif sebagai berikut:

( ) = × ' ' ' x x x

X

1 1 1 12 11 1 n p n ; ( ) = × ' ' ' x x x

X

2 2 1 22 21 2 n p n (2.6)

Dari data matriks tersebut, vektor sampel rata-rata dan matriks kovarians adalah:

( ×) = = 1 1 1 1 1 1 1 n j j p n x

X

; ( )

(

)(

)

= × − − − = 1 1 1 ' 1 1 1 1 1 1 1 n j j j p p n x x x x

S

( ×) = = 2 1 2 2 1 1 2 n j j p n x

X

; ( )

(

)(

)

= × − − − = 2 2 1 ' 2 2 2 2 1 1 2 n j j j p p n x x x x

S

(2.7)

Karena diasumsikan bahwa populasi memiliki matriks kovarian yang sama , sampel matriks kovarian S1 dan S2 dikombinasikan untuk diturunkan menjadi perkiraan objektif tunggal dari . Secara umum, berat rata-rata

(

) (

)

1

(

) (

)

2

2 S S S − + − − + − + − − = 1 1 1 1 1 1 2 1 2 1 1 n n n n n n

pooled (2.8)


(38)

Adalah suatu estimasi unbias dari jika matriks data X1 dan X2 memuat sampel-sampel acak dari populasi 1 dan 2 berturut-turut. Substitusikan 9M1 untuk 1, 9M2 untuk

2, dan Spooled untuk pada persamaan (2.3) menjadi “sampel” aturan klasifikasi. Estimasi aturan Expected Cost of Misclassification (ECM) minimum untuk dua populasi normal:

Alokasikan x0 ke 1 jika

(9M1-9M2)NO>PPQRS '( 90 ((9M1- 9M2)NO>PPQRS '( (9M1 + 9M2) A L 8BC D(EC D E(F B>>&

7F< (2.9)

Alokasikan x0 ke 2, jika pada (2.9), BC D(EC D E(F B>>&

7F = 1

Kemudian ln (1) = 0, dan estimasi aturan ECM minimum untuk 2 populasi normal ditotalkan untuk membandingkan variabel scalar:

T = (9M1-9M2)NO>PPQRS '( 9 UTN9 Dievaluasi pada 0, dengan jumlah :

VT = ( (9M1-9M2)NO>PPQRS '( (9M1 + 9M2)

= ( W( W

dimana :

W(= (9M1-9M2)NO>PPQRS '( 9M( UTN9M( dan

W = (9M1-9M2)NO>PPQRS '( 9M UTN9M

Oleh karena itu, estimasi aturan ECM minimum untuk dua populasi normal sama dengan membentuk dua populasi univariat untuk nilai y dengan mengambil suatu kombinasi linier yang sesuai dari observasi-observasi populasi 1 dan 2 dan kemudian menandai suatu observasi baru x0 ke 1 atau 2, bergantung pada apakah T = UTN9M0

jatuh kekanan atau kekiri titik tengah VT antara dua rata-rata univariat W(dan W . Sekali estimasi parameter disisipkan pada kuantitas populasi tak diketahui yang bersesuaian, tidak ada jaminan bahwa aturan hasil akan meminimalisir biaya ekspektasi kesalahan klasifikasi pada klasifikassi yang umum. Hal ini karena aturan optimal di (2.3) telah diturunkan menghasilkan bahwa kepadatan multivariat normal Universitas Sumatera Utara


(39)

f1(x) dan f2(x) diketahui secara lengkap. Persamaan (2.9) adalah satu estimasi

sederhana dari aturan optimal. Akan tetapi, kelihatannya beralasan untuk mengekspektasi bahwa hal tersebut harusnya ada dengan baik jika ukuran sampel besar. Sebagai hasilnya, jika data muncul menjadi multivariat normal, statistik klasifikasi bergeser kekiri dari pertidaksamaan di (2.9) dapat dihitung untuk setiap observasi baru x0. Observasi-observasi ini diklasifikasikan dengan membandingkan

nilai-nilai statistik dengan nilai-nilai dari ln X%Y D E" ZY D"E ) Z ( [.

2.6.3 Format Data Dasar dan Program Komputer yang Digunakan

Data dasar yang digunakan otomatis adalah data yang kontinu (karena adanya asumsi kenormalan) untuk variabel penjelas (Xj) dan data kategorik/kualitatif/nonmetrik untuk

variabel respon (Y).

Tabel 2.1 Tabel Format Data untuk Analisis Diskriminan

X1 X2 . . . Xp Y

… … … …

… … … …

Beberapa software yang bisa digunakan adalah SPSS, SAS, dan Minitab.

2.6.4 Algoritma dan Model Matematis

Secara ringkas, langkah-langkah dalam analisis diskriminan adalah sebagai berikut : 1) Pengecekan adanya kemungkinan hubungan linier antara variabel penjelas. Untuk

point ini, dilakukan dengan bantuan matriks korelasi (pembentukan matriks korelasi sudah difasilitasi pada analisis diskriminan). Pada output SPSS, matriks korelasi bisa dilihat pada pooled Within-Groups Matrices.


(40)

2) Uji vektor rata-rata kedua kelompok

2 1 :

2 1 :

≠ =

1 0 H H

Angka signifikan :

Jika Sig. > 0,05 berarti tidak ada perbedaan antar-grup Jika Sig. < 0,05 berarti ada perbedaan antar-grup

Diharapkan dalam uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua kelompok. Pada SPSS, uji ini dilakukan secara univariate (jadi yang diuji bukan berupa vektor), dengan bantuan table Tests of Equality of Group Means.

3) Dilanjutkan pemeriksaan asumsi homoskedastisitas dengan uji Box’s M. Diharapkan dalam uji ini hipotesis nol tidak ditolak (H0: 1 = 2). Hipotesis:

H0: matriks kovarians grupadalah sama

H1: matriks kovarians grup adalah berbeda secara nyata

Keputusan dengan dasar signifikansi (lihat angka signifikan) Jika Sig. > 0,05 berarti H0 diterima

Jika Sig. < 0,05 berarti H0 ditolak

Sama tidaknya grup kovarians matriks juga bisa dilihat dari tabel output Log Determinant. Jika dalam pengujian ini H0 ditolak maka proses lanjutan seharusnya

tidak bisa dilakukan.

4) Pembentukan model diskriminan

Kriteria Fungsi Linier Fisher

a. Pembentukan fungsi Linier (teoritis)

Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang dihitung dari suatu fungsi linier Y = 'X dimana ' menyatakan vektor yang berisi koefisien-koefisien variabel penjelas yang membentuk persamaan linier terhadap variabel respon, Universitas Sumatera Utara


(41)

' = [ 1, 2, …, p]

X = 8 (<

Xk menyatakan matriks data pada kelompok ke-k

Xk= .

2 1 2 21 21 1 12 11 npk k n k n pk k k pk k k x x x x x x x x x

i = 1, 2, …, n j = 1, 2,…, p k = 1 dan 2

xijkk menyatakan observasi ke-i variabel ke-j pada kelompok ke-k.

Dibawah asumsi Xk\N

(

µk, k

)

maka

] ^__`a(

a bc 8] <]( dan k _ ad ]d ad ]d N ;

1= 2=

]d =

pk pk µ µ . . . ;

]d adalah vekor rata-rata tiap variabel X pada kelompok ke-k.

e pp p p σ σ σ σ σ σ 0 0 0 0 0 . . . 0 0 0 . . . . 0 0 . . . 0 . . . . 2 22 1 12 11


(42)

j1j2=

{

mnfg hg i fg hgjkL lfg hg i fg hgjkL l g gjhLg l( l

( !g l g gjhLgl( o l

Fisher mentransformasikan observasi-observasi x yang multivariate menjadi observasi y yang univariate. Dari persamaan Y = ’X diperoleh:

]dp E(Yk) = E( ’X) = ’ k ;

qr = var( ’X) = ’

]dpadalah rata-rata Y yang diperoleh dari X yang termasuk dalam kelompok ke-k.

qr = adalah varians Y dan diasumsikan sama untuk kedua kelompok.

Kombinasi linier yang menarik menurut Fisher adalah yang dapat memaksimumkan rasio antara jarak kuadrat rata-rata Y yang diperoleh dari X

kelompok 1 dan 2 dengan varians Y, atau dirumuskan sebagai berikut:

](r ] r

qr s

; ]( ] ]( ] ;s

s; s

Jika ]( ] ) = maka persamaan diatas menjadi %tuv)

&

tu t karena adalah

matriks definit positif maka menurut teori pertidaksamaan Cauchy-Schwartz,

rasio %tuv)

&

tu t dapat dimaksimumkan jika s

; Y '( = Y '( ]( ] dengan

memilih c = 1, menghasilkan kombinasi linier yang disebut kombinasi linier Fisher sebagai berikut :

(

)

X

X

Y= ' = 12 ' −1

b. Pembentukan Fungsi Linier (dengan bantuan SPSS)

Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel Canonical Discriminant Function Coefficient. Tabel ini akan dihasilkan pada output apabila pilihan Function Coefficient bagian

Unstandardized diaktifkan.


(43)

c. Menghitung discriminant score

Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya. d. Menghitung Cutting Score

Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan optimum cutting score. Memang dari computer informasi ini sudah diperoleh. Sedangkan cara mengerjakan secara manual Cutting Score

(m) dapat dihitung dengan rumus sebagai berikut dengan ketentuan untuk dua grup yang mempunyai ukuran yang sama cutting score dinyatakan dengan rumus, (Simamora, 2005):

Zce= wxywz

dengan :

Zce = cutting score untuk grup yang sama ukuran

ZA = centroid grup A

ZB = Centroid grup B

Apabila dua grup berbeda ukuran, rumus cutting score yang digunakan adalah :

ZCU = $x$wzy$zwx

xy$z

dengan :

ZCU = Cutting score untuk grup tak sama ukuran

NA = Jumlah anggota grup A

NB = Jumlah anggota grup B

ZA = Centroid grup A

ZB = Centroid grup B

Kemudian nilai-nilai discriminant score tiap obsservasi akan dibandingkan dengan cutting score, sehingga dapat diklasifikasikan suatu obsevasi akan termasuk kedalam kelompok yang mana. Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok kode 1 jika

(

)

x ,

Y= 1 − 2 ' −1 ≥m selain itu dimasukkan dalam kelompok 2 (kode Universitas Sumatera Utara


(44)

nol) perhitungan m dilakukan secara manual, karena SPSS tidak mengeluarkan output m. Namun, dapat di hitung nilai m dengan bantuan tabel Function at Group Centroids dari output SPSS.

e. Perhitungan Hit Ratio setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio, yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh observasi. Misalkan ada sebanyak

n observasi, akan dibentuk fungsi linier dengan observasi sebanyak n-1. Observasi yang tidak disertakan dalam pembentukan fungsi linier ini akan diprediksi keanggotaannya dengan fungsi yang sudah dibentuk tadi. Proses ini akan diulang dengan kombinasi observasi yang berbeda-beda, sehingga fungsi linier yang dibentuk ada sebanyak n. Inilah yang disebut dengan metode Leave One Out.

f. Kriteria posterior probability

Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x) berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability

dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option probabilities of group membership pada bagian Save di kotak dialog utama.

p DmE

( )

( )

k

k k

k k

x f p

x f p

,

dimana :

pk adalah prior probability kelompok ke-k dan

fk(x) = (

3 4{&6 67 &{

exp ( 9 :d ; '( 9 :d | m }

suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok 0 jika p m }E D ~ m E D . Nilai-nilai posterior probability

inilah yang mengisi kolom dis1_1 dan kolom di 1_2 pada sheet SPSS.

g. Akurasi statisik, dapat di uji secara statistik apakah klasifikasi yang di lakukan (dengan menggunakan fungsi diskriminan) akurat atau tidak. Uji statistik tersebut adalah prees-Q Statistik. Ukuran sederhana ini


(45)

membandingkan jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah grup. Nilai yang diperoleh dari perhitunngan kemudian dibandingkan dengan nilai kritis (critical velue) yang diambil dari tabel Chi-Square dan tingkat keyakinan sesuai yang diinginkan. Statistik Q ditulis dengan rumus:

Prees-Q = •$' €• ‚ 2 $ •'(

dengan :

N = ukuran total sampel

n = jumlah kasus yang diklasifikasi secara tepat

K = jumlah grup

2.7 Pengujian Hipotesis

Intepretasi hasil analisis diskriminan tidak berguna jika fungsinya tidak signifikan. Hipotesis yang akan diuji adalah H0yang menyatakan bahwa rata-rata semua variabel

dalam semua grup adalah sama. Dalam SPSS, uji dilakukan dengan menggunakan Wilks’ . Jika dilakukan pengujian sekaligus beberapa fungsi sebagaimana dilakukan pada analisis diskriminan, statistik Wilks’ adalah hasil univariat untuk setiap fungsi. Kemudian, tingkat signifikansi diestimasi berdasarkan chi-square yang telah ditransformasi secara statistik. Setelah hasil analisis diketahui, kemudian dilihat apakah Wilks’ berasosiasi dengan fungsi diskriminan. Selanjutnya, angka ini ditransformasi menjadi chi-quare dengan derajat kebebasan (df) yang akan digunakan dalam pengambilan kesimpulan dengan uji kriteria hipotesis berikut:

Jika F hitung > F tabel maka H0ditolak dan H1 diterima

Jika F hitung F tabel maka H0diterima dan H1ditolak


(46)

Selanjutnya dengan menggunakan nilai F, dapat di ambil keputusan untuk menerima atau menolak H0. Jika H0 diterima, akan memberikan kesimpulan bahwa tidak ada

perbedaan antara siswa yang lulus dan siswa yang tidak lulus. Sebaliknya jika H0

ditolak maka terdapat perbedaan antara siswa yang lulus dan siswa yang tidak lulus, dengan nilai signifikan < , H0 ditolak. Sehingga proses analisis diskriminan dapat digunakan.


(47)

BAB 3

METODE PENELITIAN

Pada bab ini peneliti ingin menunjukkan metode penelitian dari analisis diskriminan untuk mengelompokkan faktor yang mempengaruhi kelulusan siswa dan faktor-faktor apa saja yang lebih dominan mempengaruhi kelulusan siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil tahun ajaran 2009/2010.

3.1 Pengumpulan Data

3.1.1 Sumber data

Dalam penelitian ini data yang digunakan adalah data primer dan data sekunder. Data primer bersumber dari hasil wawancara terstruktur terhadap responden dengan menggunakan kuesioner. Responden dalam penelitian ini adalah siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil. Sedangkan data sekunder berupa laporan hasil penilaian belajar (nilai UNAS SD, nilai UAS SD, nilai rapor, nilai tryout

SMP, dan nilai UAS SMP) siswa/i kelas III SMPN 1 Gunung Meriah Kabupaten Aceh Singkil.

3.1.2 Populasi

Populasi adalah sekelompok individu atau subjek yang memiliki satu atau lebih karakteristik, (Williams dan Highiter, 1978). Populasi dalam penelitian ini adalah siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil dengan jumlah siswa/i kelas III SMPN 1 Gunung Meriah adalah 237 siswa. Populasi diketahui bersifat homogen dan tersebar secara proporsional merata ke setiap kelas dan juga diasumsikan bahwa


(48)

populasi berdistribusi normal, sehingga jumlah sampel yang diambil dalam penelitian ini adalah 70 siswa. Lebih jelasnya dapat dilihat pada tabel dibawah ini:

Tabel 3.1 Jumlah Siswa III SMPN 1 Gunung Meriah Kab. Aceh Singkil

No Kelas Jumlah Siswa

1 III.1 40

2 III.2 40

3 III.3 40

4 III.4 40

5 III.5 39

6 III.6 38

Jumlah 237 siswa

Tabel 3.2 Jumlah Sampel Penelitian

No Kelas Jumlah Siswa Teknik

pengambilan sampel

Jumlah Sampel

1 III.1 40 40/237 x 70 = 11,81 12 siswa

2 III.2 40 40/237 x 70 = 11,81 12 siswa

3 III.3 40 40/237 x 70 = 11,81 12 siswa

4 III.4 40 40/237 x 70 = 11,81 12 siswa

5 III.5 39 39/237 x 70 = 11,52 11 siswa

6 III.6 38 38/237 x 70 = 11,22 11 siswa

Jumlah populasi 237 Jumlah Sampel 70 siswa

3.2 Analisis Data

Analisis diskriminan dimulai dengan hal-hal ringan. Pertama, pemilihan variabel dependen dan independen, dimana variabel dependen harus merupakan variabel kategorik sedangkan variabel independen merupakan variabel numerik. Kemudian melakukan analisis univariat untuk mengetahui kenormalan data. Klasifikasi normal ketika 1= 2= anggap bahwa kepadatan bersamadariX’=[X1, X2, …, .XP] untuk

populasi 1 dan 2 diberikan oleh:

( )

( )

(

)

(

)

− −

= 1 '1 1

2 1 2 p

i x x

2 1 exp 2

1 x

f


(49)

untuk i =1,2 Anggap juga bahwa parameter-parameter populasi 1, 2, dan diketahui. Hal ini dilihat dari uji Kolmogorov Smirnov. Jika p value Kolmogorov Smirnov > 0,05 maka data berdistribusi normal. Dari hasil test Kolmogorov Smirnov (KS) terlihat bahwa ada tiga faktor yang tidak berdistribusi normal yaitu nilai rapor SMP, pendidikan orang tua dan penghasilan orang tua. Karena mempunyai nilai p

Kolmogorov Smirnov < 0,05. Oleh sebab itu dilakukan usaha untuk menormalkan distribusi data dengan proses transformasi data. Dari hasil test kolmogorov smirnov terlihat bahwa ketiga nilai tersebut masih < 0,05 (0,000), (0,000), (0,007) yang memperlihatkan bahwa faktor ini tidak berdistribusi normal. Dengan demikian faktor tersebut tidak diikut sertakan dalam analisis selanjutnya.

Setelah diketahui data-data yang berdistribusi normal selanjutnya dilakukan uji Kolinearitas yaitu untuk mendeteksi korelasi antara faktor independen (kolinearitas). Kemudian lakukan pengujian pearson correlation terhadap semua faktor independen yang termasuk dalam distribusi normal, dimana bila r > 0,8 terjadi masalah kolinearitas. Dari tabel 3.1 terlihat bahwa nilai r < 0,8 artinya tidak ada masalah kolinearitas pada pengujian kolinearitas ini. Dalam tabel 3.3 dibawah ini akan diketahui seberapa kuat hubungan antar faktor dan apakah data sampel yang ada menyediakan bukti cukup bahwa ada kaitan antara faktor-faktor dalam populasi asal sampel. Adapun tabel tesebut adalah sebagai berikut:


(50)

Korelasi Pearson Product momen dilambangkan dengan r dengan ketentuan nilai r

tidak lebih dari harga (-1 r 1). Apabila nilai r = -1 artinya korelasi negative sempurna ; r = 0 artinya tidak ada korelasi ; r = 1 berarti korelasinya sangat kuat. Tingkat hubungan nilai indeks korelasi dinyatakan sebagai berikut:

Tabel 3.4 Interpretasi Koefisien Korelasi

Interval koefisien Tingkat Hubungan

0,800 – 1,000 Sangat Kuat

0,600 – 0,799 Kuat

0,400 – 0,599 Cukup Kuat

0,200 – 0,399 Lemah

0,000 – 0,199 Sangat Lemah

Dari Tabel 3.1 dapat diketahui korelasi antara X1dengan X2, X1dengan X4, X1dengan

X5, X2 dengan X4, X2 dengan X5, dan X4 dengan X5. Adapun penjelasannya adalah sebagai berikut:

Tabel 3.3 Korelasi Antara Variabel dalam Populasi

X1 X2 X4 X5

X1 Pearson Correlation 1 -.060 .063 .009

Sig. (2-tailed) .625 .605 .941

N 70 70 70 70

X2 Pearson Correlation -.060 1 .117 .192

Sig. (2-tailed) .625 .334 .111

N 70 70 70 70

X4 Pearson Correlation .063 .117 1 .738**

Sig. (2-tailed) .605 .334 .000

N 70 70 70 70

X5 Pearson Correlation .009 .192 .738** 1 Sig. (2-tailed) .941 .111 .000

N 70 70 70 70

**. Korelasi signifikan pada tingkat 0,01 (2-tailed).


(1)

20 0 0 .898 1 .690 .016 1 .310 1.619

21 0 0 .848 1 .611 .037 1 .389 .939

22 1 1 .105 1 .924 2.629 0 .076 7.628

23 1 0** .626 1 .528 .237 1 .472 .464

24 1 1 .636 1 .531 .224 0 .469 .474

25 1 1 .382 1 .838 .763 0 .162 4.054

26 0 0 .983 1 .665 .000 1 .335 1.371

27 1 1 .506 1 .804 .442 0 .196 3.261

28 1 1 .004 1 .982 8.340 0 .018 1.639E1

29 1 0** .392 1 .859 .731 1 .141 4.342

30 1 1 .648 1 .764 .209 0 .236 2.561

31 1 0** .520 1 .821 .413 1 .179 3.457

32 1 1 .803 1 .720 .062 0 .280 1.949

33 1 0** .742 1 .753 .108 1 .247 2.341

34 1 0** .626 1 .528 .237 1 .472 .464

35 0 0 .898 1 .690 .016 1 .310 1.619

36 0 0 .983 1 .665 .000 1 .335 1.371

37 0 0 .983 1 .665 .000 1 .335 1.371

38 1 1 .790 1 .589 .071 0 .411 .793

39 1 1 .648 1 .764 .209 0 .236 2.561

40 1 1 .870 1 .617 .027 0 .383 .983

41 0 0 .654 1 .759 .200 1 .241 2.489

42 1 1 .790 1 .589 .071 0 .411 .793

43 0 0 .898 1 .690 .016 1 .310 1.619

44 1 1 .870 1 .617 .027 0 .383 .983

45 1 0** .626 1 .528 .237 1 .472 .464

46 1 1 .952 1 .644 .004 0 .356 1.193


(2)

54 1 1 .712 1 .561 .137 0 .439 .623

55 1 1 .965 1 .671 .002 0 .329 1.424

56 0 0 .442 1 .815 .592 1 .185 3.560

57 0 0 .848 1 .611 .037 1 .389 .939

58 1 1 .883 1 .696 .021 0 .304 1.676

59 1 1 .636 1 .531 .224 0 .469 .474

60 1 0** .776 1 .588 .081 1 .412 .793

61 1 1 .712 1 .561 .137 0 .439 .623

62 1 1 .883 1 .696 .021 0 .304 1.676

63 1 1 .648 1 .764 .209 0 .236 2.561

64 1 0** .626 1 .528 .237 1 .472 .464

65 0 0 .848 1 .611 .037 1 .389 .939

66 1 0** .699 1 .558 .149 1 .442 .617

67 0 0 .508 1 .798 .438 1 .202 3.180

68 1 0** .699 1 .558 .149 1 .442 .617

69 1 0** .776 1 .588 .081 1 .412 .793 .000

70 1 1 .564 1 .502 .333 0 .498 .346

For the original data, squared Mahalanobis distance is based on canonical functions. For the cross-validated data, squared Mahalanobis distance is based on observations. **. Misclassified case

a. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case.


(3)

LAMPIRAN H : ANGKET PENELITIAN

ANGKET PENELITIAN

Nama : ... Kelas : ... Usia saat ini : ... tahun

Jenis kelamin a. Laki-laki b. Perempuan

“ Aplikasi Analisis Diskriminan Dalam Penentuan Faktor-faktor yang Mempengaruhi Kelulusan Siswa SMPN 1 Gunung Meriah Kabupaten Aceh Singkil”

Dalam rangka penulisan skripsi di Universitas Sumatera Utara, Skripsi ini sebagai salah satu syarat untuk ujian kesarjanaan Strata I , maka saya memohon dengan sangat kepada adik-adik untuk mengisi angket yang telah disediakan.

Angket ini bukan tes psikologi dari pihak sekolah atau dari manapun, maka dari itu adik-adik tidak perlu takut atau ragu-ragu dalam memberikan jawaban yang sejujurnya. Artinya semua jawaban yang adik-adik berikan adalah benar, dan jawaban yang diminta adalah sesuai dengan pengalaman dan kondisi yang adik-adik rasakan selama ini. Atas perhatian dan bantuannya saya mengucapkan terima kasih.

Petunjuk Pengisian :

Mohon bantuan dan kesedian adik-adik untuk menjawab seluruh pertanyaan yang ada. Berilah tanda (x) pada jawaban (a, b, c, d) yang adik-adik pilih sesuai dengan

keadaan sebenarnya.


(4)

1. Bagaimanakah tingkat pendidikan orang tua anda? a. SD

b. SMP c. SMA

d. D3 dan D3 keatas

2. Berapakah penghasilan orang tua anda / bulan ? a. < Rp 500.000

b. Rp 500.000 - Rp 1.499.999 c. Rp 1.500.000 - Rp 2.500.000 d. > Rp 2.500.000


(5)

LAMPIRAN I : Tabel Nilai Distribusi F untuk = 0,05

V2 V1

1 2 3 4 5 6 7 8 9 10

1 161 200 216 225 230 234 237 239 241 242

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 88,50 8,81 8,79

4 7,71 6,94 6,59 6,59 6,26 6,16 6,09 6,04 6,00 5,96

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,00

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,89 2,75

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,81 2,67

14 4,6 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24

50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03

55 4,02 3,17 2,78 2,51 2,38 2,27 2,18 2,11 2,05 2,00

60 4,00 3,15 2,76 2,53 2,37 2,25 1,17 2,10 2,04 1,99

120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91

150 3,9 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94 1,89

200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88

400 3,86 3,02 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85

Inf 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83


(6)

LAMPIRAN J: TABEL DISTRIBUSI STUDENT'S [t]

V

0,1 0,05 0,025 0,01 0,005

1 3,08 6,31 12,71 31,82 63,66

2 1,89 2,92 4,30 6,96 9,92

3 1,64 2,35 3,18 5,54 9,84

4 1,53 2,13 2,78 3,75 4,60

5 1,48 2,02 2,57 3,37 4,53

6 1,44 1,94 2,45 3,14 3,71

7 1,42 1,90 2,37 3,00 3,50

8 1,40 1,86 2,31 2,90 3,36

9 1,38 1,83 2,26 2,82 3,25

10 1,37 1,81 2,23 2,76 3,17

11 1,36 1,80 2,20 2,72 3,11

12 1,36 1,78 2,18 2,68 3,06

13 1,35 1,77 2,16 2,65 3,01

14 1,35 1,76 2,14 2,62 2,98

15 1,34 1,75 2,13 2,60 2,95

16 1,34 1,75 2,12 2,58 2,92

17 1,33 1,74 2,11 2,57 2,90

18 1,33 1,73 2,10 2,55 2,88

19 1,33 1,73 2,09 2,54 2,86

20 1,33 1,72 2,09 2,53 2,85

21 1,32 1,72 2,08 2,52 2,83

22 1,32 1,72 2,07 2,51 2,82

23 1,32 1,71 2,07 2,50 2,80

24 1,32 1,71 2,06 2,49 2,80

25 1,32 1,71 2,06 2,48 2,79

26 1,32 1,71 2,06 2,48 2,78

27 1,31 1,70 2,05 2,47 2,77

28 1,31 1,70 2,05 2,47 2,76

29 1,31 1,70 2,04 2,46 2,76

30 1,31 1,70 2,04 2,46 2,75

40 1,30 1,68 2,02 2,42 2,77

60 1,30 1,67 2,00 2,39 2,66

120 1,29 1,66 1,98 2,36 2,62

Inf 1,28 1,65 1,96 2,33 2,58

Sumber : Sudjana. Metoda Statistik