Data Mining Penerapan Metode Clustering Data Dengan C-Means Untuk Rekomendasi Penerima Beasiswa Pada Universitas Sumatera Utara

2.2.3 Prosedur Untuk Mendapatkan Beasiswa 1. Mahasiswa harus mengajukan permohonan kepada Rektor Universitas Sumatera Utara melalui Pembantu Dekan III masing-masing, dan dilampiri dengan: 2. Rekomendasi dari Pembantu Dekan III. 3. Transkip Nilai dan fotokopi Kartu Hasil Ujian KHS yang di legalisir untuk mahasiswa lama atau STTB SMU sederajat yang dilegalisir untuk mahasiswa baru. 4. Fotokopi Kartu Keluarga KK yang dilegalisir. 5. Surat Keterangan Penghasilan Orang tua yang disahkan oleh pejabat yang berwenang. 6. Surat pernyataan yang berisi: o Belum memproleh beasiswa lain dan tidak sedang dalam proses pengajuan beasiswa lain. o Belum bekerja dan berkeluarga. o Tidak akan mengambil penundaan kegiatan akademik. 7. Fotokopi NO. Rekening yang bersangkutan pada PT. Bank BNI Persero Tbk cabang USU. 8. Fotokopi Kartu Tanda Mahasiswa KTM. 9. Fotokopi pembayaran SPP yang terakhir. 10. Surat keterangan berkelakuan baik dari pimpinan FakultasProdi.

2.3 Data Mining

Data mining adalah proses yang mempekerjakan suatu atau lebih teknik pembelajaran computer machine learning untuk menganalisis dan mengekstraksi pengetahuan knowledge secara otomatis. Knowledge Discoveri in Database KDD adalah penerapan metode saintifik pada data mining. Operasi data mining menurut sifatnya dibedakan menjadi dua yaitu bersifat prediksi prediction driven untuk menjawab pertanyaan “apa ?” dan sesuatu yang bersifat remang-remang atau transparan. Penemuan discovery driven bersipat transparan dan untuk menjawab pertanyaan “mengapa ?”. Universitas Sumatera Utara Tahapan proses dalam penggunaan data mining yang merupakan proses knowledge Discovery in Database KDD seperti yang terllihat pada gambar 2.1 dapat di uraikan sebagai berikut Hermawati, 2009 : 1. Memahami domain aplikasi untuk mengetahui dan menggali pengetahuan awal serta apa sasaran pengguna. 2. Membuat target data-set yang meliputi pemililhan data dan fokus pada sub-set data. 3. Pembersihan dan transformasi data meliputi eliminasi derau, outliers, missing value serta pemilihan fitur dan reduksi dimensi. 4. Penggunaan algoritma data mining yang terdiri dari asosiasi, sekuensial, klasifikasi, klasterisasi, danlainnya. 5. Interpretasi, evaluasi dan visualisasi pola untuk melihatapakah ada sesuatu yang baru dan menarik dan dilakukan iterasi jika diperlukan. Data Gambar 2.1 Proses Knowledge Discovery in Database KDD Sumber : Hermawati, 2009 Data mining berpotensi tinggi jika data yang tepat di kumpulkan dan disimpan dalam sebuah gudang data data warehouse. Data warehouse baik untuk mengintegrasikan keseluruhan data sebuah perusahaan, tanpa memperhatikan lokasi, format atau kebutuhan komunikasi yang memungkinkan untuk memasukkan informasi tambahan atau ahli. Menghubungkan secara logis antara apa yang dilihat oleh manajer dalam aplikasi sistem informasi pendukung keputusan dan aktifitas operasional Knowledge … … … .. … … … .. selection Preprocessing Transformation Data Mining Interpretation Evaluation Target Data Preprocessed Data Transformed Data Patterns Universitas Sumatera Utara perusahaan. Data warehouse menyediakan data yang siap di transformasi yang disimpulkan sedemikian hingga membuat sesuai untuk aplikasi DSS dan SIM yang efisien Hermawati, 2009. 2.3.1 Teknik Data Mining Beberapa teknik dan sifat data mining adalah Classification yaitu menentukan sebuah record data baru ke salah satu dari beberapa kategori atau klas. Regresi yang memprediksi nilai dari suatu variable kontinu yang diberikan berdasarkan nilai dari variable yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau non linier. Clustering mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemet-element dari suatu kelompok tertentu memuliki set property yang di share bersama, dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah. Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan menggunakan satu ukuran similaritas, dapat ditemukan klaster-klaster hingga titik- titik data dalam satu klaster mempunyai similaritas yang lebih besar dan titik-titik data dalam klaster yang berbeda mempunyai similaritas yang kecil. Ukuran similaritas yang digunakan adalah Euclidean Distance jika atributnya kontinu dalam permasalahan lain dengan ukuran tertentu. Kaidah asosiasi Association Rules mendeteksi kumpulan atribut-atribut yang muncul bersamaan co-occur dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut. Pencarian pola sekuensial sequence mining mencari sejumlah event yang secara umum terjadi bersama-sama. Jika diberikan sekumpulan objek, dengan masing-masing objek dihubungkan dengan waktu kejadiannya maka didapatkan pola yang akan memprediksi ketergantungan sekuensial sequential dependencis yang kuat di antara kejadian-kejadian yang beerbeda Hermawati, 2009. A B C D E Pola-pola sekuensial pertama, pada dasarnya dibentuk dengan cara mencari semua kemungkinan pola yang ada. Nilai-nilai kejadian dalam pola diatur berdasarkan urutan waktu kejadian. A B C D E Universitas Sumatera Utara

2.4 Metode Clustering