Pendahuluan Rancangan Penelitian METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

3.1. Pendahuluan

Tujuan dari penulisan tesis ini adalah untuk membuat pengelompokkan data dari tugas akhir mahasiswa dengan membandingkan kedua algoritma Support Vector Clustering dan algoritma K-Medoids untuk mengetahui algoritma mana yang lebih cepat dalam hal pengelompokkan data tugas akhir mahasiswa tersebut, dengan menggunakan software Rapidminer sebagai pedoman dalam pembuatan keputusan. Pada bagian ini kita mulai dengan menggambarkan studi kasus data mining untuk jumlah mahasiswa Diploma III di AMIK Tunas Bangsa Pematangsiantar dalam hal ini judul Tugas Akhir mahasiswa tersebut untuk diolah datanya. Data yang telah dikumpulkan dari database bagian pendidikan di AMIK Tunas Bangsa Pematangsiantar dan mensurvei data tugas akhir tersebut diambil dari tahun 2007 sampai 2012. Instrumen penelitian yang digunakan harus mempunyai ukuran yang akurat, terperinci, bagaimana mendapatkan yang lebih baik dalam proses data mining yang digambarkan pada bagian sebelum pemrosesan data.

3.2. Lokasi dan Waktu Penelitian

Penelitian ini dilakukan di Akademi Manajemen Informatika Komputer AMIK Tunas Bangsa Pematangsiantar Jalan Jend Sudirman Blok A, No 1,2 3 Pematangsiantar. Lamanya waktu yang dibutuhkan dalam penelitian adalah 4 bulan yang dimulai dari awal Januari 2013 sampai dengan akhir April 2013. Universitas Sumatera Utara Secara detail metodologi penelitian ini dirancang seperti diagram block berikut ini : Gambar 3.1. Diagram Block Penelitian

3.2.1. Data Colection

Data tugas akhir mahasiswa diperoleh dari database AMIK Tunas Bangsa Pematangsiantar berjumlah 2020 dengan atribut sebagai berikut : 1. Nim 2. Nama 3. Tahun Akademik 4. Judul TA 5. Klasifikasi TA Keseluruhan data yang diperoleh dibuat dalam tabel data dapat dilihat pada Bab 4 4.2

3.2.2. Data Preprocessing

Data yang telah dikumpulkan dilakukan proses untuk mempersiapkan data inputan pada aplikasi SVC dan K-Medoids untuk proses klastering. Langkah-langkah dalam preprocessing data dilakukan sebagai berikut : 1. Data Cleaning Proses data cleaning dilakukan untuk memastikan dalam tabel data tidak terdapat missing value, tidak konsisten dan atribut yang hilang. 2. Data Transformasi Format data dibuat dalam bentuk Excel, akan dikonversi menjadi format XML sebagai inputan untuk aplikasi SVC dan K-Medoids. Data Collection Data Processing Data Analisis Clustering Cluster Analisis Universitas Sumatera Utara

3.2.3. Data Analisis Clustering

Data yang sudah dipersiapkan sebagai output dari preprocessing akan dianalisis oleh 2 metode klastering yakni : SVC dan K-Medoids.

3.2.4. Cluster Analisis

Hasil klaster yang diperoleh dari proses SVC dan K-Medoids diinterpretasikan untuk mendapatkan ferforma dari masing-masing klaster yang dihasilkan oleh SVC dan K-Medoids, kedua hasil klaster akan dibandingkan untuk melihat model klaster yang terbaik. Model klaster yang terbaik tersebut diperoleh dengan parameter yakni jumlah data pada setiap klaster, atribut data yang mudah dilihat dari setiap klaster yang terbentuk.

3.3. Rancangan Penelitian

Rancangan penelitian ini pertama kali dilakukan dengan pengamatan atau observasi untuk mempelajari data tugas akhir mahasiswa. Hasil pengamatan kemudian dibuat percobaan yang mendukung selanjutnya dilakukan eksperimen data dengan menggunakan algoritma Support Vector Clustering dan algoritma K- Medoids lalu membandingkan kedua algoritma tersebut untuk mendapatkan hasil klaster yang terbaik. Hasil dari eksperimen data ini merupakan pengembangan dari ilmu pengetahuan yang nantinya dapat merupakan input bagi pemecahan masalah yang ada di lembaga pendidikan AMIK Tunas Bangsa Pematangsiantar. Secara garis besar metodologi penelitian ini dilaksanakan adalah sebagai berikut : 1. Studi literature yang berkaitan dengan permasalahan dan teknik-teknik yang akan digunakan untuk analisis data bersumber dari journal- journal, buku-buku dan internet. 2. Pengambilan data yang bersumber dari database AMIK Tunas Bangsa Pematangsiantar dalam hal ini data tugas akhir mahasiswa. Universitas Sumatera Utara 3. Pemeriksaan kelengkapan data dan pembersihan data-data yang tidak lengkap. 4. Melakukan proses data Preparation Data Cleaning and Transformation untuk persiapan sebagai input analisis data. 5. Pengujian dan analisis data menggunakan software Rapidminer yang ada. 6. Pendokumentasian proses dan hasil pengolahan data. 7. Perumusan kesimpulan. 8. Penulisan laporan dalam bentuk tesis.

3.4. Flowchart Metodologi Penelitian