Diagram Alir Penelitian METODE PENELITIAN

informasi mahasiswa berupa nilai mutu mata kuliah, lama studi dan IPK. Mata kuliah yang dipilih sebagai data input dalam penelitian ini berjumlah 16 enam belas buah mata kuliah dasar yang wajib diprogramkan pada 2 dua semester tahun pertama program perkuliahan sebelum mengambil program peminatan. Pada penelitian ini, data mata kuliah digunakan sebagai data input. Sedangkan data lama studi dan IPK digunakan sebagai data target. Data nilai mata kuliah yang diperoleh berupa Huruf Mutu HM dan dikonversi ke Angka Mutu AM dengan kisaran nilai 0 hingga 4. Data target lama studi dikategorikan menjadi 2 dua, yaitu kategori mahasiwa yang lulus dengan melewati masa studi program diploma 3 tahun dan kategori mahasiswa yang lulus tepat waktu 3 tahun. Data target IPK dikategorikan menjadi 3 tiga, yaitu kategori mahasiswa yang lulus dengan predikat terpuji IPK 3.5, kategori predikat sangat memuaskan IPK ≥ 2.75 hingga IPK ≤3.5 dan kategori predikat memuaskan IPK2.75. Data mahasiswa yang digunakan dalam penelitian ini adalah data mahasiswa D3 Diploma Tiga Manajemen Informatika UNG angkatan 2005 hingga 2010. Pembelajaran dan pengujian JST menggunakan data mahasiwa angkatan 2005, 2006 dan 2007 Lampiran 1, yang dibagi ke dalam 3 tiga komposisi data dan dibedakan ke dalam 2 dua kelompok data. Total jumlah data pada kelompok data pertama dan kelompok data kedua adalah sama, yakni 216 data. Pengelompokkan data dibedakan berdasarkan cara pembagian komposisi data dimana pada kelompok data pertama, setelah data mahasiswa angkatan 2005, 2006 dan 2007 diurutkan, kemudian dibagi ke dalam 3 tiga komposisi data. Sedangkan pada kelompok data kedua, komposisi data dibagi berdasarkan angkatan, sehingga data mahasiswa pada masing-masing angkatan dibagi ke dalam 3 tiga komposisi data. Komposisi data terbagi menjadi data pelatihan, data validasi dan data pengujian. Data pelatihan digunakan oleh jaringan untuk membentuk model melalui proses pembelajaran JST. Data validasi untuk melihat apakah jaringan telah memiliki kemampuan yang baik dalam mengenali data baru yang diberikan kepadanya. Data validasi digunakan juga untuk menghentikan iterasi jika error yang terjadi tidak rasional. Data pengujian digunakan untuk menguji ketepatan klasifikasi dari model yang terbentuk. Penelitian ini menetapkan besarnya komposisi data adalah 70 data pelatihan, 15 data validasi dan 15 data pengujian. Prediksi tingkat kelulusan menggunakan data mahasiswa angkatan 2008, 2009 dan 2010 9 Lampiran 2. Pembagian data mahasiswa untuk pembelajaran JST dan prediksi ditunjukkan oleh Tabel 3. Tabel 3 Pengelompokkan dan Komposisi Data Penelitian DATA PEMBELAJARAN PENGUJIAN Komposisi Data Data Pelatihan 70 Data Validasi 15 Data Testing 15 Total Kelompok Data Pertama 150 33 33 216 Kelompok Data Kedua 2005 60 13 12 8 13 12 8 86 79 51 2006 55 2007 35 Total 150 33 33 216 DATA PREDIKSI Angkatan 2008 2009 2010 Total Jumlah 41 52 37 130 Praproses Data Sebelum data digunakan dilakukan praproses untuk meningkatkan efisiensi dan skalabilitas dari sebuah sistem prediksi. Pada penelitian ini, dilakukan beberapa praproses data, yakni pembersihan data, analisa relevansi dan tranformasi data Han Kember 2001. Proses transformasi data dilakukan untuk data target yang bersifat kategorikal, dengan menggunakan metode Unary Encoding, dimana data target dipresentasikan dengan kombinasi angka 0 dan 1 numerical binary variable. Berdasarkan data kategori targetnya maka dalam penelitian ini, seluruh proses pembelajaran, pengujian hingga prediksi akan dibedakan ke dalam 2 dua model, yaitu Model Prediksi Lama Studi MPLS dan Model Prediksi Indeks Prestasi Kumulatif MPIPK. Praproses ini dilakukan dengan menggunakan perangkat lunak Microsoft Excel 2007, sedangkan untuk proses transformasi dilakukan dengan menggunakan perangkat lunak Matlab versi 6.5. Pembentukan Model JST Pembentukan model prekdiksi dimaksudkan untuk menentukan parameter dari arsitektur jaringan yang akan digunakan untuk pembelajaran. Pembentukan model prediksi dilakukan dengan menggunakan JST Propagasi Balik Backpropagation dengan 1 satu lapisan tersembunyi. Jumlah variabel input yang digunakan dalam penelitian ini sebanyak 16 buah variabel. Jumlah node untuk lapisan input sama dengan jumlah variabel input, karena data input sudah berbentuk data numerik sehingga tidak mengalami praproses data. Jumlah node pada lapisan output sama dengan jumlah kategori yang akan diklasifikasi dan hal ini berbeda untuk setiap model prediksi. Model prediksi lama studi MPLS memiliki 2 dua kategori output, sehingga jumlah node pada model prediksi ini sebanyak 2 dua node dan Model prediksi IPK MPIPK memiliki 3 tiga kategori output, sehingga jumlah node pada model prediksi ini menjadi 3 tiga node. Adapun untuk jumlah node pada lapisan tersembunyi hidden-node, pada penelitian ini akan divariasikan untuk mendapatkan hasil yang lebih optimal. Karena diduga jumlah node pada lapisan tersembunyi berpengaruh terhadap tingkat generalisasi atau pengenalan pola. Variasi jumlah hidden-node yang digunakan adalah 5, 10 dan 15. Selain jumlah node pada tiap lapisan arsitektur JST, ditetapkan beberapa parameter yang akan diberikan pada proses pembelajaran dan diuji untuk membentuk model prediksi, antara lain adalah fungsi aktivasi, toleransi galat, jumlah epoch maksimal, laju pembelajaran learning rate dan fungsi pelatihan training function. Untuk inisialisasi bobot awal digunakan inisialisasi secara random. Fungsi aktivasi yang digunakan pada lapisan tersembunyi adalah tansigmoid, sedangkan pada lapisan output menggunakan fungsi aktivasi pure linear. Toleransi kesalahan minimum galat ditentukan pada 0.001. Toleransi galat yang cukup kecil diharapkan akan memberikan hasil yang cukup baik. Jumlah epoch maksimal yang ditetapkan dalam penelitian ini adalah 1000. Hal ini diperlukan sebagai kriteria henti jaringan disamping tolerasin galat untuk membatasi waktu yang disediakan bagi jaringan dalam melakukan pembelajaran. Adapun parameter yang divariasikan dalam proses pembelajaran adalah laju pembelajaran learning rate dan fungsi pelatihan training function. Variasi nilai laju pembelajaran yang digunakan adalah 0.01, 0.05, 0.1 dan 0.5. Laju pembelajaran dapat mempengaruhi konvergensi kecepatan pada proses pembelajaran, sehingga perlu dilakukan percobaan pada laju pembelajaran yang berbeda untuk mendapatkan nilai rentang data yang sesuai. Hasil penelitian Purnomo 2001 menyatakan bahwa semakin kecil nilai laju pembelajarannya maka semakin kecil pula nilai dan rentang data matriks vektor hasil pelatihan, dan sebaliknya. Fungsi pelatihan yang divariasikan adalah algoritma pelatihan dengan perbaikan teknik heuristik resilent backpropagation dan perbaikan dengan teknik optimasi scaled conjugate gradient dan levenberg-marquardt. Tabel 4 Karakteristik dan Struktur JST yang digunakan KARAKTERISTIK SPESIFIKASI Arsitektur jaringan Algoritma Pembelajaran Multi-layer dengan 1 lapisan tersembunyi Propagasi balik Jumlah node input 16 Jumlah node lapisan tersembunyi 5, 10, 15 Fungsi aktivasi lapisan tersembunyi Sigmoid bipolar Jumlah node lapisan ouput : Model Prediksi Lama Studi MPLS 2 Model Prediksi IPK MPIPK 3 Fungsi aktivasi lapisan output Fungsi linier Toleransi galat 0.001 Laju Pembelajaran 0.01, 0.05, 0.1, 0.5 Maksimum epoch 1000 Pembelajaran Model Setelah model terbentuk selanjutnya dilakukan proses pembelajaran atau pelatihan, dimana pada proses ini menggunakan data pelatihan, data validasi dan data testing. Pembelajaran atau pelatihan dilakukan bertujuan untuk mengenali pola-pola dari data masukan pada data pelatihan untuk dilatih pada jaringan yang akan menghasilkan keluaran untuk dibandingan dengan data target. Selama proses pelatihan dilakukan pula proses validasi untuk menguji apakah jaringan sudah memiliki kemampuan yang baik dalam mengenali data baru yang diberikan kepadanya, yang ditunjukkan dengan nilai Mean Square Error MSE. Pembelajaran model JST propagasi balik bersifat iterative dan didesain untuk meminimalkan MSE antara output yang dihasilkan dan output yang diinginkan target. Algoritma pembelajaran propagasi balik meliputi 3 tiga tahap, yaitu : prosedur umpan maju feedforward, perhitungan serta perambatan balik kesalahan backpropagation dan penyesuaian bobot. Sebelum proses pelatihan terlebih dahulu ditentukan bobot-bobot awal secara random dan toleransi kesalahan minimum. Bobot-bobot awal ini nantinya akan diinisialisasi dan digunakan pada proses umpan maju awal, sedangkan proses umpan maju selanjutnya menggunakan bobot-bobot yang telah mengalami perbaikan. Toleransi kesalahan minimum berfungsi sebagai pembatas berulangnya proses iterasi dalam suatu pelatihan. Proses pelatihan akan terus berulang hingga diperoleh koreksi kesalahan yang sama atau lebih kecil dari tolerasi kesalahan minimum. Pengujian dan Generalisasi Pengujian jaringan bertujuan untuk mengetahui apakah jaringan dapat melakukan generalisasi terhadap data baru yang dimasukkan ke dalamnya yaitu ditunjukkan dengan persentase akurasi jaringan dalam mengenali data pengujian, sehingga arsitektur jaringan yang digunakan untuk pengujian adalah arsitektur terbaik yang diperoleh dari hasil pelatihan jaringan. Dalam penelitian ini digunakan parameter yang disebut generalisasi untuk mengukur tingkat pengenalan jaringan pada pola yang diberikan. Dimana pola yang diberikan adalah data validasi maupun data testing. Generalisasi yang digunakan dalam Agustini 2006 adalah sebagai berikut : 100 _ _ _ x pola jum test numkenal test si Generalisa 6 dengan numkel_test adalah jumlah pola yang dikenal dan jum_pola adalah jumlah pola keseluruhan. Jumlah numkel_test dan jum_pola yang ditunjukkan akan berbeda pada setiap model prediksi. Analisis Sensitivitas Analisis sensitivitas bertujuan untuk mengetahui variabel yang lebih atau paling berpengaruh diantara variabel-variabel masukan. Metode analisa sensitivitas yang digunakan adalah metode yang digunakan oleh Engelbrecht 2001. Analisis sensitivitas ini dilakukan pada percobaan dengan arsitektur dan parameter terbaik yang diperoleh setelah proses pelatihan dan pengujian. Hasil analisis sensitivitas dibedakan berdasarkan model prediksi.

3.2 Alat Bantu Penelitian

Alat-alat Bantu yang digunakan dalam penelitian ini adalah sebagai berikut : 1 Notebook Notebook dengan spesifikasi prosesor Intel® Pentium TM2 Duo CPU T5070, 2.00 GHz, Memory RAM 1.87 GB. 2 Sistem Operasi Windows XP Home Edition, Version 2002, Service Pack 2. 3 Aplikasi Microsoft Excel 2007 untuk melakukan praproses terhadap data sebelum digunakan sebagai input model yang dikembangkan karena tampilan data dalam bentuk data sheet unuk mempermudah dalam pengolahan data. 4 Aplikasi Matlab versi 6.5 digunakan dalam penelitian ini untuk transformasi data numerik, pengolahan data dan visualisasi hasil.

3.3 Waktu dan Tempat Penelitian

Penelitian dilaksanakan mulai Februari hingga April 2011 bertempat di Laboratorium Pascasarjana Departemen Ilmu Komputer FMIPA-IPB.

4. HASIL DAN PEMBAHASAN

4.1 Praproses Data

Praproses data yang dilakukan pada penelitian ini adalah pembersihan data, analisa relevansi dan tranformasi data Han Kember 2001. Pembersihan data dilakukan untuk menghilangkan noise akibat data yang hilang atau tidak lengkap, dengan menggantinya dengan nilai yang paling umum muncul untuk data tersebut atau dengan nilai yang paling mungkin muncul secara statistik. Analisa relevansi dilakukan untuk menghilangkan atribut yang redundant dan tidak relevan dengan penelitian. Transformasi data yang dilakukan pada penelitian ini adalah untuk data target yang bersifat kategorikal, dengan menggunakan metode Unary Encoding, dimana data target dipresentasikan dengan kombinasi angka 0 dan 1 numerical binary variable. Berdasarkan data kategori targetnya maka dalam penelitian ini, seluruh proses pembelajaran, pengujian hingga prediksi akan dibedakan ke dalam 2 dua model, yaitu Model Prediksi Lama Studi MPLS dan Model Prediksi Indeks Prestasi Kumulatif MPIPK. Berikut adalah praproses transformasi unary encoding yang dibedakan ke dalam 2 dua model prediksi : 1. Model Prediksi Lama Studi MPLS, variabel target memiliki 2 dua kategori yaitu kategori „Melebihi Batas Studi‟ dan „Tepat Waktu‟. Praproses unary encoding atau numerical binary variable dikenakan pada variabel ini dengan kategori „10‟ untuk „Melebihi Batas Studi‟ dan kategori „01‟ untuk „Tepat Waktu ‟. 2. Model Prediksi IPK MPIPK, variabel output memiliki 3 tiga kategori yaitu kategori „Terpuji‟, „Sangat Memuaskan dan „Memuaskan. Praproses unary encoding atau numerical binary variable dikenakan pada variabel ini dengan kategori „100‟ untuk „Terpuji‟, kategori „010‟ untuk „Sangat Memuaskan‟ dan kategori „001‟ untuk „Memuaskan‟.