Evaluasi Pola ANALISIS HASIL

14 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Sleman AND bi= D AND pm= A SISIP_PROGRAM 1 15 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Yapen_Waropen AND tahun=2009 SISIP_PROGRAM 1 16 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Yogyakarta SISIP_PROGRAM 1 17 IF asalSma= SMA_KRISTEN_1_MAGELANG AND pm= D AND jenisKelamin = Laki-laki SISIP_PROGRAM 3 18 IF asalSma= SMA_N_1_JOGONALAN AND pv= D AND tahun=2007 AND programStudi= PSIKOLOGI SISIP_PROGRAM 1 19 IF asalSma=SMA_N_1_JOGONALAN AND pv= D AND tahun=2009 SISIP_PROGRAM 2 20 IF asalSma= SMA_PANGUDI_LUHUR_YOGYAKARTA AND programStudi= PEND._BAHASA_INGGRIS AND bi= B SISIP_PROGRAM 1 21 IF asalSma= SMA_PANGUDI_LUHUR_YOGYAKARTA AND programStudi= AKUNTANSI AND tahun=2008 SISIP_PROGRAM 1 22 IF asalSma= SMA_PANGUDI_LUHUR_YOGYAKARTA AND programStudi= TEKNIK_MESIN SISIP_PROGRAM 1 23 IF asalSma= SMA_PANGUDI_LUHUR_YOGYAKARTA AND programStudi= TEKNIK_INFORMATIKA AND tahun=2008 SISIP_PROGRAM 1 24 IF asalSma= SMA_STELLA_DUCE_1_YOGYAKARTA AND programStudi= BIMBINGAN_DAN_KONSELING SISIP_PROGRAM 1 25 IF asalSma= SMA_STELLA_DUCE_1_YOGYAKARTA AND programStudi=AKUNTANSI AND asalKabupaten= Yogyakarta SISIP_PROGRAM 1 26 IF asalSma= SMA_STELLA_DUCE_1_YOGYAKARTA AND programStudi=PSIKOLOGI AND gelombang= Gelombang_1 AND tahun=2009 SISIP_PROGRAM 1 27 IF asalSma= SMA_STELLA_DUCE_1_YOGYAKARTA AND programStudi=PSIKOLOGI AND gelombang= Gelombang_3 SISIP_PROGRAM 1 Dari tabel 5.1 komposisi data asal SMA mahasiswa dan tabel 5.2 detail pola klasifikasi mahasiswa sisip program yang disajikan tersebut terdapat pola menarik, untuk mahasiswa yang berasal dari SMA_K_SANTO_MIKAEL_WARAK memiliki populasi jumlah kejadian sisip program paling banyak yaitu 10 mahasiswa. Berdasarkan pola klasifikasi yang terbentuk setelah dilakukan penelusuran untuk atribut program studi terhadap data input dalam penelitian ini data PMB mahasiswa Universitas Sanata Dharma periode 2007 – 2009 adalah sebagai berikut : Tabel 5.3 Hasil Penelusuran Atribut Program Studi Terhadap Data Input. no Aturan rule Status Hasil Penulusuran Atribut Program Studi 1 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten=Aceh_Barat SISIP_PROGRAM PEND._ MATEMATIKA 2 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Banjarmasin SISIP_PROGRAM ILMU_SEJARAH 3 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Bekasi SISIP_PROGRAM PEND._AKUNTANSI 4 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Cirebon SISIP_PROGRAM PEND._BAHASA_ INGGRIS 5 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Cirebon SISIP_PROGRAM AKUNTANSI 6 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Palembang SISIP_PROGRAM MANAJEMEN 7 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Sleman AND bi= B SISIP_PROGRAM MANAJEMEN 8 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Sleman AND bi= D AND pm= A SISIP_PROGRAM AKUNTANSI Setelah dilakukan penelusuran atribut program studi terhadap data input untuk pola klasifikasi mahasiswa yang berasal dari SMA_K_SANTO_MIKAEL_ WARAK dan terkena sisip program ternyata berasal dari bergai prodi yang beragam. Dalam penelitian ini untuk mengukur akurasi dalam pembentukan pola klasifikasi, penulis menggunakan metode cross-validation. Dalam k-fold cross- validation , data akan dipartisi secara acak ke dalam k partisi, D1, D2, …Dk, masing-masing D mempunyai jumlah yang sama. Pada iterasi ke – i partisi Di digunakan sebagai data uji, sedangkan sisa partisi digunakan sebagai data pelatihan. Pada penelitian ini pengujian menggunakan metode k-fold cross- validation ini juga dilakukan dengan mengganti nilai k yang bervariasi. Berikut ini diberikan hasil pengujian menggunakan metode k-fold cross-validation : Tabel 5.4 Tabel pengujian cross-validation dengan bervariasi nilai fold Pada tabel 5.2 terlihat bahwa dari percoban yang dilakukan dengan mengganti nilai k yang bervariasi terlihat bahwa percobaan dengan nila k = 10 9 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Yapen_Waropen AND tahun=2009 SISIP_PROGRAM TEKNIK_ELEKTRO 10 IF asalSma= SMA_K_SANTO_MIKAEL_WARAK AND asalKabupaten= Yogyakarta SISIP_PROGRAM PEND._AKUNTANSI No Nilai fold k Akurasi 1 3 54.88506 2 5 56.11659 3 10 56.527096 4 15 56.22496 5 20 56.291296 memiliki tingkat akurasi paling tinggi dari seluruh percobaan, sehingga dalam penelitian ini pendekatan yang dilakukan untuk mengukur kinerja akrurasi pola klasifikasi menggunakan metode tenfold cross-validation. Data yang digunakan untuk mengevaluasi dan mengukur akrurasi pola klasifikasi adalah data data PMB jalur reguler seluruh prodi tahun 2007 – 2009 dengan jumlah data 2436 record. Pendekatan tenfold cross-validation akan membagi jumlah data 10 bagian. Berikut ini disajikan pembagian data untuk setiap fold : Tabel 5.5 Pembagian data untuk setiap fold Fold Pembagian Data Fold 1 244 Fold 2 244 Fold 3 244 Fold 4 244 Fold 5 244 Fold 6 244 Fold 7 244 Fold 8 243 Fold 9 243 Fold 10 243 Dalam penelitian ini untuk membuktikan hasil pengukuran tingkat akurasi dan menganalisis pola klasifikasi dalam bentuk pohon keputusan digunakan tenfold cross-validation dengan metode Confusion Matrix. Berikut ini merupakan analisis hasil program dengan menggunakan tenfold cross-validation : Pada iterasi 1, fold 1 menjadi data data uji sedangkan fold 2- 10 menjadi data pelatihan Tabel 5.6 Tabel Confusion Matrix untuk Pengujian pada Fold 1 Berdasarkan confusion matrix untuk data uji pada fold 1, dapat dihitung : a. Jumlah total record adalah 244. b. Record yang dapat diklasifikasikan dengan benar berjumlah 141, didapat dari jumlah nilai diagonal tabel. a. Record yang gagal diklasifikasikan dengan benar berjumlah 103, didapat dari jumlah total record dikurangi jumlah record yang dapat diklasifikasikan dengan benar. Dalam penelitian ini untuk iterasi 2, 3 ,4 ,5 ,6 ,7 ,8 ,9 dan 10 terlampir pada lampiran 7. Dari 10 iterasi dengan menggunakan cross-validation, terdapat 1377 record yang dapat diklasifikasikan dengan benar, dan 1059 record yang gagal diklasifikasikan dengan benar. Berikut ini adalah tabel setiap pengujian pada setiap fold . Kelas Hasil Prediksi total SISIP_ PROGRAM TIDAK_ SISIP_ PROGRAM NULL Kelas sebenarnya SISIP_ PROGRAM 7 9 10 26 TIDAK_SISIP_ PROGRAM 13 134 71 218 NULL Total 20 143 81 244 Tabel 5.7 Pengukuran Akurasi Menggunakan 10-fold Cross Validation Dari tabel 5.15, dapat diketahui tingkat akurasi dari seluruh pengujian menggunakan metode cross-validation merupakan jumlah record yang dapat diklasifikasikan dengan benar dari semua iterasi dibagi dengan jumlah data keseluruhan kemudian dikali 100 . Peng ujian Data Uji Fold Data Pelatihan Fold Total Data Pelati han Fold Jumlah Data Yang Diklasifika sikan Benar Jumlah Data Yang Diklasifi kasikan Salah Akurasi 1 1 2, 3, 4, 5, 6 ,7 , 8, 9, 10 244 141 103 57.78689 2 2 1, 3, 4, 5, 6 ,7 , 8, 9, 10 244 146 98 59.836067 3 3 1, 2, 4, 5, 6 ,7 , 8, 9, 10 244 131 113 53.688526 4 4 1, 2, 3, 5, 6 ,7 , 8, 9, 10 244 139 105 56.96721 5 5 1, 2, 3, 4, 6 ,7 , 8, 9, 10 244 133 111 54.508198 6 6 1, 2, 3, 4, 5 ,7 , 8, 9, 10 244 138 106 56.557377 7 7 1, 2, 3, 4, 5 ,6 , 8, 9, 10 244 135 108 55.555557 8 8 1, 2, 3, 4, 5 ,6 , 7, 9, 10 243 140 103 57.61317 9 9 1, 2, 3, 4, 5 ,6 , 7, 8, 10 243 139 104 57.20165 10 10 1, 2, 3, 4, 5 ,6 , 7, 8, 9 243 135 108 55.555557 Total 1377 1059 Rata -rata Akur asi 56,527096

V.2 Presentasi Pengetahuan

Hasil dari evaluasi pola didapat bahwa mahasiswa Universitas Sanata Dharma USD dari Penerimaan Mahasiswa Baru PMB jalur reguler periode 2007 - 2009 yang berasal dari daerah Mimika memiliki presentase sisip program sebesar 75 . Dimana presentase sisip program tersebut paling besar diantara presentase sisip program mahasiswa yang berasal dari daerah lainya. Selain itu terdapat juga data mahasiswa yang memiliki presentase sisip program cukup besar yaitu 70 , dimana mahasiswa tersebut berasal dari daerah Okbibab. Sehingga dapat disimpulkan bahwa mahasiswa yang berasal dari propinsi Papua memiliki tingkat kecenderungan sisip program lebih tinggi. 109

BAB VI PENUTUP

VI.1. Kesimpulan

Kesimpulan yang diperoleh dari penyelesaian penelitian tugas akhir ini adalah sebagai berikut : 1. Algoritma RDT berhasil diimplementasikan untuk mengenali pola klasifikasi mahasiswa yang terkena sisip program. 2. Dalam penelitian ini hasil keluaran yang dihasilkan dari proses RCA berupa atribut-atribut yang menjadi pembeda diantara atribut yang lainya. Atribut- atribut tersebut meliputi tahun, programStudi, jenisKelamin, asalKabupaten, penalaran verbal pv, penalaran mekanik pm, hubungan ruang hr, bahasa inggris bi, gelombang, asal SMA dan status. 3. Dalam penelitian ini hasil keluaran dari proses pembentukan aturan berupa pola klasifikasi dalam bentuk pohon keputusan yang dapat digunakan untuk mengklasifikasikan mahasiswa yang terkena sisip program. Dari pohon keputusan yang terbentuk menghasilkan 1258 pola dari 2192 record data, dimana 227 pola memiliki nilai atribut keputusan SISIP_PROGRAM dan 1031 pola memiliki nilai atribut keputusan TIDAK_SISIP_PROGRAM. 4. Dari pohon keputusan yang terbentuk Atribut asal SMA menjadi simpul akar karena memiliki gain ratio paling besar diantara atribut lainya. 5. Tingkat Akurasi yang didapat dari proses pengukuran menggunakan 10- fold Cross Validation adalah 56,527096 . 6. Dari hasil pola klasifikasi, diperoleh pola yang menarik dimana terdapat tujuh SMA yang memiliki presentase sisip program = 10 , dari tujuh SMA tersebut bahkan terdapat dua SMA yang memiliki presentase sisip program =50 dan keduanya berasal dari propinsi Papua.

VI.2. Saran

Saran yang diberikan untuk peneliti selanjutnya adalah sebagai berikut : 1. Sistem mampu menerima masukan tidak hanya file yang berekstensi .csv saja, tetapi juga diharapkan dapat menerima masukan file seperti .xls. 2. Sistem dapat bersifat dinamis dalam menerima masukan dengan jumlah atribut yang bervariasi dan terdapat fitur untuk memilih atribut yang digunakan sebagai atribut kondisional maupun atribut keputusan. 3. Untuk meningkatkan akurasi dari sistem dapat dicoba dilakukan proses pruning pada pohon keputusan. 111 DAFTAR PUSTAKA Han, Jiawei dan Kamber, Micheline. 2006. Data Mining Concept and Techniquies Second Edition. San Francisco: Morgan Kaufmann Publishers. Hvidsten, Torgeir R. 2006. A tutorial-based guide to the ROSETTA system : A Rough Set Toolkit for Analysis of Data. Kuatra, Kristianingsih. 2011. Pencarian Pola Klasifikasi Mahasiswa yang Tidak Memenuhi Sisip Program Berdasarkan Nilai Tes Masuk Penerimaan Mahasiswa Baru dan Latar Belakang Mahasiswa Universitas Sanata Dharma dengan menggunakan Algoritma C4.5. Naskah Skripsi yang tidak diterbitkan, Yogyakarta : Universitas Sanata Dharma. Kusrini dan luthfi, EmhaTaufiq, 2009, Algoritma Data Mining,Penerbit Andi, Yogyakarta. Lee S, Finn dan Santana, Juan. 2010. Data Mining: Meramalkan Bisnis Perusahaan, Jakarta: PT Elex Media Komputindo. Mitra, Sushmita dan Acharya, Tinku. 2003. Data Mining: Multimedia, Soft Computing, and Bioinformatics. Canada: Wiley- Interscience. Pawlak, Z. 1982 . “Rough Sets.” Int J. of Computer and Information Sciences, 11 5 : 341. Said, Fairuz. El. 2009. Data Mining – Konsep Pohon Keputusan. http:fairuzelsaid.wordpress.com20091124data-mining-konsep-pohon- keputusan, diunduh tanggal 21 juli 2011. Sucahyo, Yudho Giri. 2003. Data Mining Menggali Informasi yang Terpendam.http:ilmukomputer.compopuleryudhodatamining.php, diakses tanggal 19 juli 2011. Supranto, Johanes. 1992, Sampling Untuk Pemeriksaan. Jakarta: Universitas Indonesia UI-Press. Susilo Frans. 2006. Himpunan Kasar, Makalah disajikan dalam seminar Rumpun MIPA Universitas Sanata Dharma 29 Maret 2006. Suwardiyana . .2009. . Perencanaan Pembelajaran. . http: . suwardiyanaprofesi. wordpress. com, diakses tanggal 18 Juli 2011. Trihendradi, C. 2005. Step by Step SPSS 13: Analisis Data Statistik. Andi, Yogyakarta. Turban Efraim . , R. Kelly Rainer, JR., Richard E.Potter. 2005, Introduction to Information Technology Pengantar Teknologi Informasi,Jakarta: Salemba Infotek. Yellasiri, Ramadevi. et al. 2008 . “Reduct Based Decision Tree RDT.” IJCSES International Jurnal of Computer Sciences and Engineering System.