3. Pemeriksaan kelengkapan data dan pembersihan data-data yang tidak
lengkap. 4.
Melakukan proses data Preparation Data Cleaning and Transformation untuk persiapan sebagai input analisis data.
5. Pengujian dan analisis data menggunakan software Rapidminer yang
ada. 6.
Pendokumentasian proses dan hasil pengolahan data. 7.
Perumusan kesimpulan. 8.
Penulisan laporan dalam bentuk tesis.
3.4. Flowchart Metodologi Penelitian
Adapun proses metodologi penelitian untuk Support Vector Clustering dan K-Medoids dapat dilihat pada gambar 3.2 berikut ini :
Identifikasi Permasalahan Penetapan Tujuan Penelitian
Studi Literatur :
- DataMining
- SVC
- K-Medoids
Tahap Identifikasi Awal
Pengumpulan Data : Data Tugas Akhir
Pengolahan Data :
Proses Validasi Metode Klastering K-Medoids dan SVC
Menggunakan Data TA
Pengolahan Data :
Proses klastering menggunakan data Tugas Akhir dengan metode
K-Medoids dan SVC
Tahap Pengumpulan dan Pengolahan Data
A
Universitas Sumatera Utara
Gambar 3.2. Flowchart Metodologi Penelitian
Dalam metodologi penelitian jelas kelihatan bahwa tahap awal, tahap pengumpulan data dan tahap analisis dan kesimpulan, sehingga proses ini dapat
memudahkan kita untuk menjalankan pengolahan-pengolahan dan pengumpulan datanya. Dalam hal ini metodologi penelitian yang diproses oleh SVC sangat
membantu dalam penulisan tesis ini.
Perbandingan Metode : Perhitungan variansi dalam klaster
dan variansi antar klaster masing- masing metode
Analisi dan Interpretasi Data Analisi hasil klastering dan
perbandingan metode Kesimpulan dan Saran
Tahap Analisi dan Kesimpulan
Universitas Sumatera Utara
3.5. Perancangan Proses Klastering.
Proses klastering seperti gambar 3.3. di bawah ini yang terdiri dari beberapa proses di antaranya proses klastering itu sendiri. Inputnya berupa teks
dokumen Tugas Akhir Mahasiswa AMIK Tunas Bangsa Pematangsiantar. Untuk mengelompokkan data yang didapat dari Tugas Akhir Mahasiswa AMIK
Tunas Bangsa Pematangsiantar yaitu Tentang Web, Jaringan dan Database, dapat dilihat pada gambar 3.3 berikut ini :
Gambar 3.3. Proses Klastering dari SVC dan K-Medoid
Input Teks Dokumen
Preprocessing
Feature Selection
Clustering
SVC
K-Medoids
Start
Clustering Teks Dokumen
Clustering Teks Dokumen
End
Universitas Sumatera Utara
BAB IV
HASIL DAN PEMBAHASAN
4.1. Komunitas Rapidminer
Rapidminer YALE adalah perangkat lunak Open Source untuk knowledge discovery dan data mining. Rapidminer memiliki kurang lebih 400 prosedure
operator data mining, termasuk operator masukan, output dan preprocessing dan visualisasi. Operator meta secara otomatis mengoptimalkan desain eksperimen
dan pengguna tidak memerlukan waktu yang panjang untuk menentukan langkah dan parameter yang lebih panjang. Sejumlah besar teknik visualisasi dan
kemungkinan untuk meletakkan breakpoints setelah masing-masing operator memberikan pandangan tentang keberhasilan desain anda bahkan untuk
menjalankan percobaan. Ribuan aplikasi data mining yang telah dikembangkan menggunakan
Rapidminer dan banyak digunakan di dunia bisnis maupun penelitian. Beberapa fitur dari Rapidminer antara lain :
1. Berlisensi gratis open source
2. Multiflatform karena deprogram dalam bahasa java
3. Internal data berbasis XML sehingga memudahkan pertukaran data
eksperimen 4.
Dilengkapi dengan scripting language untuk optomasi eksperimen 5.
Memiliki GUI Graphical User Interface, Command Line Mode batch Mode, dan java API yang dapat dipanggil dari program lain.
6. Dapat dikembangkan dengan menambahkan plugin dan ekstention
7. Fasilitas plotting untuk visualisasi, multidimensi dan model
Untuk pembahasan bab ini akan dilakukan dengan metode Rapidminer dalam penyelesaian, Support Vector Clustering dan K-Medoids. Sementara
datanya diperoleh dari bagian pendidikan AMIK Tunas Bangsa Pematangsiantar yaitu judul Tugas Akhir mahasiswa dari tahun 2009 sampai dengan 2013.
Universitas Sumatera Utara
4.2. Sampel Data Yang Bersumber Dari Bidang Pendidikan AMIK Tunas Bangsa Pematangsiantar.