Flowchart Metodologi Penelitian Perancangan Proses Klastering. Komunitas Rapidminer

3. Pemeriksaan kelengkapan data dan pembersihan data-data yang tidak lengkap. 4. Melakukan proses data Preparation Data Cleaning and Transformation untuk persiapan sebagai input analisis data. 5. Pengujian dan analisis data menggunakan software Rapidminer yang ada. 6. Pendokumentasian proses dan hasil pengolahan data. 7. Perumusan kesimpulan. 8. Penulisan laporan dalam bentuk tesis.

3.4. Flowchart Metodologi Penelitian

Adapun proses metodologi penelitian untuk Support Vector Clustering dan K-Medoids dapat dilihat pada gambar 3.2 berikut ini : Identifikasi Permasalahan Penetapan Tujuan Penelitian Studi Literatur : - DataMining - SVC - K-Medoids Tahap Identifikasi Awal Pengumpulan Data : Data Tugas Akhir Pengolahan Data : Proses Validasi Metode Klastering K-Medoids dan SVC Menggunakan Data TA Pengolahan Data : Proses klastering menggunakan data Tugas Akhir dengan metode K-Medoids dan SVC Tahap Pengumpulan dan Pengolahan Data A Universitas Sumatera Utara Gambar 3.2. Flowchart Metodologi Penelitian Dalam metodologi penelitian jelas kelihatan bahwa tahap awal, tahap pengumpulan data dan tahap analisis dan kesimpulan, sehingga proses ini dapat memudahkan kita untuk menjalankan pengolahan-pengolahan dan pengumpulan datanya. Dalam hal ini metodologi penelitian yang diproses oleh SVC sangat membantu dalam penulisan tesis ini. Perbandingan Metode : Perhitungan variansi dalam klaster dan variansi antar klaster masing- masing metode Analisi dan Interpretasi Data Analisi hasil klastering dan perbandingan metode Kesimpulan dan Saran Tahap Analisi dan Kesimpulan Universitas Sumatera Utara

3.5. Perancangan Proses Klastering.

Proses klastering seperti gambar 3.3. di bawah ini yang terdiri dari beberapa proses di antaranya proses klastering itu sendiri. Inputnya berupa teks dokumen Tugas Akhir Mahasiswa AMIK Tunas Bangsa Pematangsiantar. Untuk mengelompokkan data yang didapat dari Tugas Akhir Mahasiswa AMIK Tunas Bangsa Pematangsiantar yaitu Tentang Web, Jaringan dan Database, dapat dilihat pada gambar 3.3 berikut ini : Gambar 3.3. Proses Klastering dari SVC dan K-Medoid Input Teks Dokumen Preprocessing Feature Selection Clustering SVC K-Medoids Start Clustering Teks Dokumen Clustering Teks Dokumen End Universitas Sumatera Utara BAB IV HASIL DAN PEMBAHASAN

4.1. Komunitas Rapidminer

Rapidminer YALE adalah perangkat lunak Open Source untuk knowledge discovery dan data mining. Rapidminer memiliki kurang lebih 400 prosedure operator data mining, termasuk operator masukan, output dan preprocessing dan visualisasi. Operator meta secara otomatis mengoptimalkan desain eksperimen dan pengguna tidak memerlukan waktu yang panjang untuk menentukan langkah dan parameter yang lebih panjang. Sejumlah besar teknik visualisasi dan kemungkinan untuk meletakkan breakpoints setelah masing-masing operator memberikan pandangan tentang keberhasilan desain anda bahkan untuk menjalankan percobaan. Ribuan aplikasi data mining yang telah dikembangkan menggunakan Rapidminer dan banyak digunakan di dunia bisnis maupun penelitian. Beberapa fitur dari Rapidminer antara lain : 1. Berlisensi gratis open source 2. Multiflatform karena deprogram dalam bahasa java 3. Internal data berbasis XML sehingga memudahkan pertukaran data eksperimen 4. Dilengkapi dengan scripting language untuk optomasi eksperimen 5. Memiliki GUI Graphical User Interface, Command Line Mode batch Mode, dan java API yang dapat dipanggil dari program lain. 6. Dapat dikembangkan dengan menambahkan plugin dan ekstention 7. Fasilitas plotting untuk visualisasi, multidimensi dan model Untuk pembahasan bab ini akan dilakukan dengan metode Rapidminer dalam penyelesaian, Support Vector Clustering dan K-Medoids. Sementara datanya diperoleh dari bagian pendidikan AMIK Tunas Bangsa Pematangsiantar yaitu judul Tugas Akhir mahasiswa dari tahun 2009 sampai dengan 2013. Universitas Sumatera Utara

4.2. Sampel Data Yang Bersumber Dari Bidang Pendidikan AMIK Tunas Bangsa Pematangsiantar.