Pengunduran Diri Mahasiswa Pengertian

BAB II TINJAUAN PUSTAKA

2.1 Pengunduran Diri Mahasiswa

Hampir tidak ada perguruan tinggi baik negeri maupun swasta PTNPTS yang tidak pernah mahasiswanya mengundurkan diri sebagai mahasiswa di PTNPTS tersebut. Hal ini dibuktikan dengan adanya peraturan pengunduran diri mahasiswa. Sebagai contoh, Universitas Indonesia UI sendiri memiliki peraturan tersebut dan khusus program studi computer science dapat diakses secara online, dan pada ketentuan pengunduran mahasiswa Institut Pertanian Bogor IPB dicantumkan ketentuan pengunduran diri mahasiswa baru dan reguler. Peraturan Akademik STMIK Mikroskil Pasal 37 tentang drop out putus studi diberlakukan apabila: telah melewati batas masa studi untuk program sarjana paling lama 14 semester atau program diploma paling lama 10 semester, tidak memenuhi persyaratan minimal akademik, mendapat sanksi akibat melanggar tata tertib yang berlaku sumber : peraturan Akademik Mikroskil 2011-2015 Pengunduran diri mahasiswa termasuk drop out di PTS bahkan cukup banyak, seperti pada STMIK Mikroskil mencapai 88 orang rata-rata per tahun mahasiswa yang mengundurkan diri dalam periode tahun 2007 hingga 2010 sumber : SIPT Mikroskil. Alasan pengunduran diri sangat beragam, seperti orangtua pindah tugas, mahasiswa pindah kerja, berhenti kuliah, tidak sanggup mengikuti pelajaran, dan lain sebagainya. Banyak diantara alasan tersebut ternyata hanya karangan belaka setelah dibuktikan melalui beberapa penelusuran. Sehingga dibutuhkan lebih banyak penelitian lagi tentang pola tersembunyi, kecenderungan pengunduran diri mahasiswa. Berbeda dengan pengunduran diri, dropout diakibatkan oleh ketidakmampuan mahasiswa dalam mencapai sejumlah SKS hingga semester tertentu. Kecenderungan yang mempengaruhi drop out hampir sama dengan faktor pengunduran diri.

2.2 Pengertian

Data Mining Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata. Informasi yang Universitas Sumatera Utara dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basisdata. Data mining adalah suatu istilah yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan potensial dan berguna yang bermanfaat yang tersimpan di dalam database besar. Turban et al, 2005 . Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika Larose, 2006. Data mining adalah sebuah proses secara berulang dimana kemajuan ditentukan oleh penemuan, baik melalui metode otomatis atau manual. Data mining sangat berguna dalam sebuah analisis skenario eksplorasi dimana tidak adanya gagasan tentang suatu hasil yang “menarik”. Data mining menemukan informasi yang baru, berharga dalam volume data yang besar yang merupakan upaya kerjasama manusia dan komputer. Hasil terbaik dicapai dengan menyeimbangkan pengetahuan para ahli dalam menggambarkan masalah dan tujuan dengan kemampuan pencarian komputer Kantardzic, 2003. “Data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data.” Larose, 2006. “Data mining merupakan bidang dari beberapa keilmuan yang menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik, database, dan visualisasi untuk penanganan permasalahan pengambilan informasi dari database yang besar.” Larose, 2006. Kemajuan luar biasa yang terus berlanjut dalam bidang data mining didorong oleh beberapa faktor, antara lain Larose, 2006. 1. Pertumbuhan yang cepat dalam kumpulan data. 2. Penyimpanan data dalam data warehouse, sehingga seluruh perusahaan memiliki akses ke dalam database yang baik. Universitas Sumatera Utara 3. Adanya peningkatan akses data melalui navigasi web dan intranet. 4. Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar dalam globalisasi ekonomi. 5. Perkembangan teknologi perangkat lunak untuk data mining ketersediaan teknologi. 6. Perkembangan yang hebat dalam kemampuan komputasi dan pengembangan kapasitas media penyimpanan. Dari definisi-definisi yang telah disampaikan, hal penting yang terkait dengan data mining adalah: 1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada. 2. Data yang akan diproses berupa data yang sangat besar. 3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat. Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih dalam satu dimensi. Misalnya dalam dimensi produk, kita dapat melihat keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat dilihat antara dua atau lebih atribut dan dua atau lebih objek. Ponniah, 2001. Gambar 2.1 Bidang Ilmu Data Mining Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi Pencarian Informasi Database Artificial Intelligent Statistik Data Mining Ekstraksi data bahasa alami, web Penstrukturan Dasar Seleksi, presentase Hasil Data yang besar Normalisasi data Transformasi, OLAP Pembelajaran Neural Network, pohon keputusan, fuzzy Universitas Sumatera Utara banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dahulu. Gambar 2.1 menunjukkan bahwa data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan artificial intelligent, machine learning, statistik, database, dan juga information retrieval Pramudiono, 2006. Metode data mining secara garis besar dapat dibagi dalam dua kelompok: verifikasi dan discover. Metode verifikasi umumnya meliputi teknik-teknik statistic seperti goodness of fit, Uji-T rata-rata dan analisis variansi. Metode discovery lebih lanjut dapat dibagi atas model prediktif dan model deskriptif. Model prediktif melakukan prediksi terhadap data dengan menggunakan hasil-hasil yang telah diketahui dari data yang berbeda. Model ini dapat dibuat berdasarkan penggunaan data historis lain. Sementara itu, model deskriptif bertujuan mengidentifikasi pola-pola atau hubungan dalam data dan memberikan cara untuk mengeksplorasi sifat sifat data yang diselidiki Dunham 2003. Taksonomi metode-metode data mining dapat dilihat pada gambar 2.2. Gambar 2.2 Taksonomi data mining Maimon Last 2000, Dunham 2003 Data mining terutama digunakan untuk mencari pengetahuan yang terdapat dalam basis data yang besar sehingga sering disebut Knowledge Discovery in Database KDD. Proses pencarian pengetahuan ini menggunakan berbagai teknik- teknik pembelajaran komputer machine learning untuk menganalisis dan mengekstraksikannya. Proses pencarian bersifat iteratif dan interaktif untuk -Neural network - Bayesian network - Decision tree - Support vector machine - Instance based -Clustering - Peringkasan - Aturan asosiasi - Pengungkapan sekuen - Goodness of Fit - Uji-T Rata-rata - Analisis Variansi Data Mining Verifikasi Discovery Prediktif Deskriptif Klasifikasi Prediksi Analisis waktu Berkala Regresi Universitas Sumatera Utara menemukan pola atau model yang sahih, baru, bermanfaat dan dimengerti. Dalam penerapannya data mining memerlukan berbagai perangkat lunak analisis data untuk menemukan pola dan relasi data agar dapat digunakan untuk membuat prediksi dengan akurat. Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap yang diilustrasikan di gambar 2.3. Tahap-tahap tersebut bersifat iterative dan interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base. Gambar 2.3 Tahap-tahap data mining Han dan Kamber, 2006 Tahap-tahap data mining ada 6 enam yaitu: 1. Pembersihan data data cleaning Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. Pada umumnya data yang diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa data mining yang dimiliki. Data-data yang tidak relevan itu juga lebih baik dibuang. Pembersihan data juga akan Universitas Sumatera Utara mempengaruhi performasi dari teknik data mining karena data yang ditangani akan berkurang jumlah dan kompleksitasnya. 2. Integrasi data data integration Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. Tidak jarang data yang diperlukan untuk data mining tidak hanya berasal dari satu database tetapi juga berasal dari beberapa database atau file teks. Integrasi data dilakukan pada atribut-aribut yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jenis produk, nomor pelanggan dan lainnya. Integrasi data perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa menghasilkan hasil yang menyimpang dan bahkan menyesatkan pengambilan aksi nantinya. Sebagai contoh bila integrasi data berdasarkan jenis produk ternyata menggabungkan produk dari kategori yang berbeda maka akan didapatkan korelasi antar produk yang sebenarnya tidak ada. 3. Seleksi Data Data Selection Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. Sebagai contoh, sebuah kasus yang meneliti faktor kecenderungan orang membeli dalam kasus market basket analysis, tidak perlu mengambil nama pelanggan, cukup dengan id pelanggan saja. 4. Transformasi data Data Transformation Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. Beberapa metode data mining membutuhkan format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa menerima input data kategorikal. Karenanya data berupa angka numerik yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini sering disebut transformasi data. 5. Data mining Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. 6. Evaluasi pola pattern evaluation Universitas Sumatera Utara Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat diambil seperti menjadikannya umpan balik untuk memperbaiki proses data mining, mencoba metode data mining lain yang lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar dugaan yang mungkin bermanfaat . 7. Presentasi pengetahuan knowledge presentation Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. Tahap terakhir dari proses data mining adalah bagaimana memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Ada kalanya hal ini harus melibatkan orang-orang yang tidak memahami data mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang diperlukan dalam proses data mining. Dalam presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil data mining Han dan Kamber, 2006.

2.3 Pengelompokan Data Mining