BAB III METODOLOGI PENELITIAN
3.1. Pendahuluan
Tujuan dari penulisan tesis ini adalah untuk membuat pengelompokkan data dari tugas akhir mahasiswa dengan membandingkan kedua algoritma
Support Vector Clustering dan algoritma K-Medoids untuk mengetahui algoritma mana yang
lebih cepat dalam hal pengelompokkan data tugas akhir mahasiswa tersebut, dengan menggunakan software Rapidminer sebagai pedoman dalam pembuatan
keputusan. Pada bagian ini kita mulai dengan menggambarkan studi kasus data mining untuk jumlah mahasiswa Diploma III di AMIK Tunas Bangsa
Pematangsiantar dalam hal ini judul Tugas Akhir mahasiswa tersebut untuk diolah datanya.
Data yang telah dikumpulkan dari database bagian pendidikan di AMIK Tunas Bangsa Pematangsiantar dan mensurvei data tugas akhir tersebut diambil
dari tahun 2007 sampai 2012. Instrumen penelitian yang digunakan harus mempunyai ukuran yang akurat, terperinci, bagaimana mendapatkan yang lebih
baik dalam proses data mining yang digambarkan pada bagian sebelum pemrosesan data.
3.2. Lokasi dan Waktu Penelitian
Penelitian ini dilakukan di Akademi Manajemen Informatika Komputer AMIK Tunas Bangsa Pematangsiantar Jalan Jend Sudirman Blok A, No 1,2 3
Pematangsiantar. Lamanya waktu yang dibutuhkan dalam penelitian adalah 4 bulan yang dimulai dari awal Januari 2013 sampai dengan akhir April 2013.
Universitas Sumatera Utara
Secara detail metodologi penelitian ini dirancang seperti diagram block berikut ini :
Gambar 3.1. Diagram Block Penelitian
3.2.1. Data Colection
Data tugas akhir mahasiswa diperoleh dari database AMIK Tunas Bangsa Pematangsiantar berjumlah 2020 dengan atribut sebagai berikut :
1. Nim
2. Nama
3. Tahun Akademik
4. Judul TA
5. Klasifikasi TA
Keseluruhan data yang diperoleh dibuat dalam tabel data dapat dilihat pada Bab 4 4.2
3.2.2. Data Preprocessing
Data yang telah dikumpulkan dilakukan proses untuk mempersiapkan data inputan pada aplikasi SVC dan K-Medoids untuk proses klastering.
Langkah-langkah dalam preprocessing data dilakukan sebagai berikut : 1.
Data Cleaning Proses data cleaning dilakukan untuk memastikan dalam tabel data
tidak terdapat missing value, tidak konsisten dan atribut yang hilang. 2.
Data Transformasi Format data dibuat dalam bentuk Excel, akan dikonversi menjadi
format XML sebagai inputan untuk aplikasi SVC dan K-Medoids.
Data Collection
Data Processing
Data Analisis Clustering
Cluster Analisis
Universitas Sumatera Utara
3.2.3. Data Analisis Clustering
Data yang sudah dipersiapkan sebagai output dari preprocessing akan dianalisis oleh 2 metode klastering yakni : SVC dan K-Medoids.
3.2.4. Cluster Analisis
Hasil klaster yang diperoleh dari proses SVC dan K-Medoids diinterpretasikan untuk mendapatkan ferforma dari masing-masing klaster
yang dihasilkan oleh SVC dan K-Medoids, kedua hasil klaster akan dibandingkan untuk melihat model klaster yang terbaik. Model klaster
yang terbaik tersebut diperoleh dengan parameter yakni jumlah data pada setiap klaster, atribut data yang mudah dilihat dari setiap klaster yang
terbentuk.
3.3. Rancangan Penelitian
Rancangan penelitian ini pertama kali dilakukan dengan pengamatan atau observasi untuk mempelajari data tugas akhir mahasiswa. Hasil pengamatan
kemudian dibuat percobaan yang mendukung selanjutnya dilakukan eksperimen data dengan menggunakan algoritma Support Vector Clustering dan algoritma K-
Medoids lalu membandingkan kedua algoritma tersebut untuk mendapatkan hasil klaster yang terbaik.
Hasil dari eksperimen data ini merupakan pengembangan dari ilmu pengetahuan yang nantinya dapat merupakan input bagi pemecahan masalah yang
ada di lembaga pendidikan AMIK Tunas Bangsa Pematangsiantar. Secara garis besar metodologi penelitian ini dilaksanakan adalah sebagai
berikut : 1.
Studi literature yang berkaitan dengan permasalahan dan teknik-teknik yang akan digunakan untuk analisis data bersumber dari journal-
journal, buku-buku dan internet. 2.
Pengambilan data yang bersumber dari database AMIK Tunas Bangsa Pematangsiantar dalam hal ini data tugas akhir mahasiswa.
Universitas Sumatera Utara
3. Pemeriksaan kelengkapan data dan pembersihan data-data yang tidak
lengkap. 4.
Melakukan proses data Preparation Data Cleaning and Transformation untuk persiapan sebagai input analisis data.
5. Pengujian dan analisis data menggunakan software Rapidminer yang
ada. 6.
Pendokumentasian proses dan hasil pengolahan data. 7.
Perumusan kesimpulan. 8.
Penulisan laporan dalam bentuk tesis.
3.4. Flowchart Metodologi Penelitian