4.2. Sampel Data Yang Bersumber Dari Bidang Pendidikan AMIK Tunas Bangsa Pematangsiantar.
Data ini adalah data yang diambil dari bidang pendidikan AMIK Tunas Bangsa Pematangsiantar untuk contoh pengklasteran judul Tugas Akhir
mahasiswa di AMIK Tunas Bangsa Pematangsiantar, diambil sampel dari 2020 judul, sampel tersebut dapat dilihat pada tabel 4.1 berikut ini :
Tabel 4.1 Sampel Data Tugas Akhir
No Tahun
Akademik Nim
Nama Judul
Klasifikasi
1 20122013
201001030037 SRI REZEKI
PERANCANGAN SISTEM APLIKASI PENGOLAHAN
DATA SIMPAN PINJAM PADA CU. CINTA MULIA
PEMATANGSIANTAR DATABASE
2 20122013
201001030020 YULIA CITRA
DEWI Perancangan Dan
Impelementasi Pengarsipan Pembukuan
Pada Kantor Bpdas Asahan Barumun
Pematangsiantar DATABASE
3 20122013
201001030046 EVA ADINA
Aplikasi Game Tebak Kata Dengan
Menggunakan Macromedia Flash 8.0
WEB Programming
4 20122013
201001030152 ERNI
DWIYANA GULTOM
Perancangan Dan Implementasi Laporan
Pertanggungjawaban Kuintansi Serba Serbi
Berbasis Web Pada PT. Asuransi Jiwasraya
Pematangsiantar
WEB Programming
5 20122013
201001030005 ELLA
SRIWAHYUNI Perancangan Dan
Implementasi Data Absensi Karyawan PTPN
IV Perkebunan Bah Birong Ulu
DATABASE
Setelah dilakukan pengambilan sampel dan membuatnya ke dalam tabel maka penulis akan memproses data ini dengan menggunakan software
Rapidminer untuk Support Vector Clustering begitu dengan K-Medoids hasil
Universitas Sumatera Utara
proses nantinya akan dibandingkan dengan melihat hasil pengklasteran melalui tampilan yang ada.
4.3. Proses Support Vector Clustering
Dalam proses SVC tampilan yang diperlihatkan dilayar menjadi pedoman untuk mengetahui proses SVC dengan 4 tahapan yang dapat dilihat pada gambar 4.1 berikut ini
:
Process flow dari Support
Vector Clustering
Gambar 4.1. Tampilan dari Proses SVC dengan menggunakan Software Rapidminer
Universitas Sumatera Utara
Dengan memasukkan data yang bersumber dari bidang pendidikan AMIK Tunas Bangsa pematangsiantar yang berjumlah 2020 judul Tugas Akhir
mahasiswa, maka dapat dilihat tahap proses SVC yang dengan ini menggunakan software Rapidminer dengan 4 tahapan antara lain pengelompokan berdasarkan
nim, nama, tahun masuk, dan judul Tugas Akhir dari mahasiswa, kemudian dilakukan pengujian sehingga menghasilkan 4 tahapan dari masing-masing
gambar. Keterangan masing-masing gambar dapat dilihat pada halaman berikutnya.
Ringkasan
Operator ini membaca sebuah teladan dari file spreadsheet Excel.
Deskripsi
Operator ini dapat digunakan untuk memuat data dari spreadsheet Microsoft Excel. Operator ini mampu
membaca data dari Excel 95, 97, 2000, XP, dan 2003. Pengguna harus menentukan mana dari spreadsheet di
buku kerja harus digunakan sebagai tabel data. Tabel harus memiliki format sehingga setiap baris adalah
contoh dan setiap kolom mewakili atribut. Harap dicatat bahwa baris pertama mungkin digunakan untuk
nama atribut yang dapat ditunjukkan dengan parameter.
Tabel data dapat ditempatkan di manapun pada lembar dan diperbolehkan mengandung instruksi kedalam
bentuk format, baris kosong, dan kolom kosong. Nilai data yang hilang ditandai dengan sel kosong atau sel
yang hanya berisi ?.
Universitas Sumatera Utara
Masukan : Data file excel diatur, berupa Data Judul
Tugas Akhir, yang bersumber Dari Database AMIK Tunas Bangsa Pematangsiantar.
Output : data set excel Yang Akan menjadi
pengelompokkan Artikel Baru Support Vector
Clustering
Ringkasan Clustering dengan vektor dukungan
Deskripsi Implementasi Support Vector Clustering berdasarkan
{ rapidminer.cite BenHuretal2001a}. Operator ini akan membuat atribut klaster jika belum ada.
Masukan • Contoh set menampilkan: ExampleSetMetaData:
contoh: = 0; atribut: 0 Keluaran
• Klaster Model: • Berkelompok menjadi set parameter:
Parameter • menambahkan atribut klaster: Menunjukkan jika id
cluster dihasilkan sebagai atribut khusus yang baru. • tambahkan sebagai label: Jika nilai klaster
ditambahkan sebagai label. • menghapus berlabel: Hapus contoh berlabel.
• pts min: Jumlah minimal poin dalam setiap cluster. • Tipe kernel: The SVM Jenis kernel
• kernel gamma: The SVM parameter kernel gamma radial.
• Gelar kernel: The SVM kernel Gelar parameter polinomial.
• kernel: Parameter kernel SVM a saraf.
Universitas Sumatera Utara
• kernel b: The SVM parameter kernel b saraf. • kernel cache: Ukuran cache untuk evaluasi kernel im
MB • konvergensi epsilon: Presisi pada kondisi KKT
• max iterasi: Hentikan setelah ini banyak iterasi • p: Fraksi diperbolehkan outlier.
• r: Gunakan jari-jari ini bukan yang dihitung -1 untuk radius dihitung.
• titik sampel nomor: Jumlah titik sampel virtual untuk memeriksa neighborship.
Ringkasan
Operator ini dapat digunakan untuk langsung menurunkan ukuran kinerja dari data tertentu atau nilai
statistik.
Deskripsi
Operator ini dapat digunakan untuk memperoleh nilai tertentu dari contoh himpunan dan memberikan itu
sebagai nilai kinerja yang dapat digunakan untuk tujuan optimasi.
Masukan
• Contoh set: yang didapat dari Example Set
Keluaran
• kinerja: • Contoh set:
Parameter
• Jenis kinerja: Menunjukkan cara bagaimana makro harus didefinisikan.
• Statistik: Statistik dari atribut tertentu yang harus
Universitas Sumatera Utara
digunakan sebagai nilai makro. • nama atribut: The Nama dari atribut dari mana data
harus diturunkan. • nilai atribut: Nilai atribut yang harus dihitung.
• Indeks contoh: Indeks contoh dari mana data harus diturunkan. Indeks negatif dihitung dari akhir set data.
Penghitungan positif dimulai dengan 1, penghitungan negatif dengan -1.
• arah optimasi: Menunjukkan jika nilai kinerja harus diminimalkan atau dimaksimalkan.
Ringkasan Visualisasi teks.
Deskripsi Masukan
• set contoh masukan Keluaran
• set contoh keluaran • Teks pelabuhan Visualizer
Parameter text-atribut
Yang atribut harus digunakan untuk divisualisasikan? label-atribut
Yang atribut harus divisualisasikan sebagai label?
Seperti kita ketahui SVC merupakan metode klastering dengan menggunakan probabilitas kepadatan titik yang yang memakai kernel jarak pada dimensi tinggi.
Dua tahapan dari SVC adalah pelatihan data untuk menentukan jarak dan pelabelan klaster. Metode ini data dipetakan ke dalam dimensi yang lebih tinggi
dengan kernel jarak. Pada ruang dimensi baru dilakukan klaster data sehingga
Universitas Sumatera Utara
terlihat sebagai bentuk bola, untuk mendapatkan klaster data yang sesuai dilakukan pencarian bentuk bola yang minimal.
4.4. Hasil Proses SVC