Multicollinearity Implementasi ID3 Hasil Percobaan

Tabel 4.4. Signifikan Dari Tiga Variabel Prediktor Predikat Change Statistics Model R Std. Error R Sig. F Squar of the Adjusted Durbin- Square Chang F R e R Square Estimate Watson Change Change e df1 df2 ,915 a 1 ,838 ,838 ,331 ,838 2062,768 3 1196 ,000 1,828 dimension0 a. Predictors: Constant, DUKUNGAN KELUARGA, FASILITAS KAMPUS, DUKUNGAN SEKOLAH b. Dependent Variable: MINAT

4.2.4. Multicollinearity

Multikolinearitas adalah masalah umum dalam analisis korelasi banyak, terjadi ketika variabel yang berlebihan dan dapat mengganggu penafsiran yang tepat dari hasil regresi berganda. Cara sederhana untuk mengidentifikasi collinearity adalah Toleransi dan Varian Inflation Factor VIF. Toleransi adalah jumlah variabilitas variabel independen yang dipilih. Toleransi nilai mendekati 0.00 menunjukkan variabel sangat collinear dengan variabel prediktor lainnya. Faktor inflasi varian berbanding terbalik dengan nilai toleransi. Sebuah nilai VIF yang besar, biasanya ambang 10,0 menunjukkan tingkat tinggi collinearity atau multikolinieritas antar variabel independent, seperti pada tabel 4.5. Collinearity Statistics Model Beta In t Sig. Partial Correlation Tabel 4.5. Multikolinearity Diagnostik Tolerance VIF Minimum Tolerance DUKUNGAN SEKOLAH ,762 a 14,057 ,000 ,376 ,047 21,212 ,047 1 DUKUNGAN KELUARGA ,756 a 14,801 ,000 ,393 ,052 19,107 ,052 2 DUKUNGAN KELUARGA ,501 b 5,458 ,000 ,156 ,016 62,131 ,014 a. Predictors in the Model: Constant, FASILITAS KAMPUS b. Predictors in the Model: Constant, FASILITAS KAMPUS, DUKUNGAN SEKOLAH c. Dependent Variable: MINAT Universitas Sumatera Utara

4.2.5. Implementasi ID3

Contoh dari manual implementasi ID3 terhadap pengukuran minat adalah sebagai berikut: Tabel 4.6. Pengukuran Terhadap Minat Calon Mahasiswa Fasilitas Kampus Dukungan Sekolah Dukungan Keluarga Dukungan Minat C1 Baik Tinggi Tinggi Minat C2 Baik Sedang Tinggi Minat C3 Baik Sedang Rendah Minat C4 Baik Rendah Rendah Tidak Minat C5 Cukup Tinggi Tinggi Minat C6 Cukup Sedang Tinggi Minat C7 Cukup Sedang Rendah Minat C8 Cukup Rendah Rendah Tidak Minat C9 Buruk Tinggi Tinggi Minat C10 Buruk Sedang Rendah Tidak Minat C11 Buruk Rendah Tinggi Minat Dari data diatas disimpulkan: a. Jumlah class target apakah minat? = 2 “Minat” dan “Tidak” b. Jumlah sampel untuk kelas 1 “minat” = 8  P1 c. Jumlah sampel untuk kelas 2 “tidak minat” = 3  P2 Entropy S = - log 2 – log 2 = 0.8454 8 11 8 11 3 11 3 11 Information Gain berdasarkan Fasilitas Kampus FK: Values FK = “Baik”, “Cukup”, “Buruk” S = [8+, 3-]; |S| = 11 S baik = [3+, 1-]; |S baik | = 4 S cukup = [3+, 1-]; |S cukup | = 4 S buruk = [2+, 1-]; |S buruk | = 3 EntropyS = EntropyS = - log 2 – log 2 = 0.8454 EntropyS baik = - 34 log 2 34 – 14 log 2 14 = 0.8113 8 11 8 11 3 11 3 11 EntropyS cukup = - 34 log 2 34 – 14 log 2 14 = 0.8113 EntropyS buruk = - 23 log 2 23 – 13 log 2 13 = 0.9183 Universitas Sumatera Utara Gain S,FK=EntropyS- EntropyS v =  | S v | | S | v {Baik,Cukup,buruk} EntropyS – 411 Entropy-S baik – 411EntropyS cukup -311EntropyS buruk = 0.8454 - 4110.8113 - 4110.8113 – 3110.9183 = 0.0049 Begitu juga dengan perhitungan gain untuk Dukungan Sekolah dan Dukungan Keluarga, sehingga diperoleh hasil sebagai berikut: Gain S,FK = 0.0049 Gain S,DS = 0.2668 Gain S,DK = 0.4040 Dari perolehan information gain diperoleh tree sebagai berikut: tinggi rendah minat tinggi rendah Dukungan Sekolah Dukungan Keluarga tidak minat sedang tidak minat Fasilitas Kampus baik buruk minat cukup tidak minat minat Gambar 4.11. Manual Decision Tree Terhadap Minat DK=tinggi V DK=rendahDS=sedangFK=baik V DK=rendahDS=sedangFK=cukup  dukungan minat = minat Berdasarkan implementasi manual dari algoritma ID3 tersebut diatas diperoleh rule sebagai berikut: Jika DK ’tinggi’ atau Jika DK ‘rendah’ dan DS ‘sedang’ dan FK ‘baik’ atau Jika DK ‘rendah’ dan DS ’sedang’ dan FK ‘cukup’ maka dukungan minat adalah Minat. Universitas Sumatera Utara

4.2.6. Hasil Percobaan Decision Tree