4.5. Proses K-Medoids
Dalam proses K-Medoids tampilan yang diperlihatkan dilayar menjadi pedoman untuk mengetahui proses K-Medoids dengan 4 tahapan yang dapat dilihat pada tampilan
berikut ini :
Process flow dari
K-medoids Clustering
Gambar 4.11. Tampilan dari Proses K-Medoids dengan menggunakan Software Rapidminer
Universitas Sumatera Utara
Ringkasan
Operator ini membaca sebuah tampilan yang terbaik dari file spreadsheet Excel.
Deskripsi
Operator ini dapat digunakan untuk memuat data dari spreadsheet Microsoft Excel. Operator ini mampu
membaca data dari Excel 95, 97, 2000, XP, dan 2003. Pengguna harus menentukan mana dari spreadsheet di
buku kerja harus digunakan sebagai tabel data. Tabel harus memiliki format sehingga setiap baris adalah
contoh dan setiap kolom mewakili atribut. Harap dicatat bahwa baris pertama mungkin digunakan untuk
nama atribut yang dapat ditunjukkan dengan parameter.
Tabel data dapat ditempatkan di manapun pada lembar dan diperbolehkan mengandung instruksi sewenang-
wenang format, baris kosong, dan kolom kosong. Nilai data yang hilang ditandai dengan sel kosong atau sel
yang hanya berisi ?.
Masukan : Data file excel diatur, berupa Data Judul
Tugas Akhir, diambil Dari database sebuah institusi Pendidikan
Output : data set excel Yang Akan di kelompokan
Artikel Baru Support Vector Clustering
Parameter
• mengkonfigurasi Operator: Konfigurasi operator ini dengan cara Wizard.
• file excel: Nama dari file excel untuk membaca data dari.
• nomor lembar: Jumlah lembar yang harus diimpor. • baris offset: Jumlah baris untuk melewati di atas
Universitas Sumatera Utara
lembar karena tidak mengandung data yang dapat digunakan.
• Kolom offset: Jumlah kolom untuk melewati di sisi kiri lembar karena tidak mengandung data yang dapat
digunakan. • baris pertama sebagai nama: Mengindikasikan jika
baris pertama harus digunakan untuk nama-nama atribut.
• penjelasan: Peta nomor baris untuk nama penjelasan. • membaca tidak sesuai nilai-nilai sebagai missings:
Nilai yang tidak cocok dengan mengetik nilai yang ditentukan dianggap sebagai missings.
• kumpulan data meta informasi data: Informasi meta data
• nama atribut telah didefinisikan: parameter menjelaskan apakah nama-nama atribut yang
ditetapkan oleh pengguna secara manual atau yang dihasilkan oleh pembaca nama generik atau baris
pertama dari file
Ringkasan
Clustering dengan k-medoids
deskripsi
Operator ini merupakan implementasi k-medoids. Operator ini akan membuat atribut klaster yang belum
ada.
masukan
• Contoh set : ditampilkan: ExampleSetMetaData: contoh: = 0; atribut: 0
, Tampilan: ExampleSet
Universitas Sumatera Utara
keluaran
• klaster Model: • menjadi bagian yang berkelompok:
parameter
• menambahkan atribut klaster: Menunjukkan jika id cluster dihasilkan sebagai atribut khusus baru.
• tambahkan sebagai label: Jika nilai klaster ditambahkan sebagai label.
• menghapus berlabel: Hapus contoh berlabel. • k: Jumlah cluster yang harus terdeteksi.
• max berjalan: Jumlah maksimal berjalan K-Medoids dengan inisialisasi acak yang dilakukan.
• max optimasi langkah: Jumlah maksimal iterasi dilakukan untuk satu run K-Medoids.
• menggunakan pengacakan secara local : Menunjukkan jika pengacakan lokal harus digunakan.
• benih pengacakan lokal: Menentukan pengacakan lokal
• jenis ukuran: Jenis Ukuran • ukuran campuran: Pilih ukuran
• ukuran nominal: Pilih ukuran • ukuran numerik: Pilih ukuran
• perbedaan: Pilih divergence • Tipe kernel: Jenis kernel
• kernel gamma: Kernel parameter gamma. • kernel sigma1: Kernel Parameter sigma1.
• kernel sigma2: Kernel Parameter sigma2. • kernel sigma3: Kernel Parameter sigma3.
• Gelar kernel: Tingkat parameter kernel. • Pergeseran kernel: Pergeseran parameter kernel.
• kernel: Kernel parameter.
Universitas Sumatera Utara
• kernel b: Kernel parameter b.
Ringkasan
Operator ini dapat digunakan untuk langsung menurunkan ukuran kinerja dari data tertentu atau nilai
statistik.
Deskripsi
Operator ini dapat digunakan untuk memperoleh nilai tertentu dari contoh himpunan dan memberikan itu
sebagai nilai kinerja yang dapat digunakan untuk tujuan optimasi.
Masukan
• Contoh set: yang ditampilkan: ExampleSet
Keluaran
• Kinerja: • Contoh set:
Parameter
• Jenis kinerja: Menunjukkan cara bagaimana makro harus didefinisikan.
• Statistik: Statistik dari atribut tertentu yang harus digunakan sebagai nilai makro.
• nama atribut: Nama dari atribut dari mana data harus diturunkan.
• nilai atribut: Nilai atribut yang harus dihitung. • Indeks contoh: Indeks contoh dari mana data harus
Universitas Sumatera Utara
diturunkan. Indeks negatif dihitung dari akhir set data. Penghitungan positif dimulai dengan 1, penghitungan
negatif dengan -1. • arah optimasi: Menunjukkan jika nilai kinerja harus
diminimalkan atau dimaksimalkan.
Ringkasan
Visualisasi teks. Deskripsi
Masukan
• set contoh masukan
Keluaran
• set contoh keluaran • Teks tempat Visualizer
Parameter
text-atribut Yang atribut harus digunakan untuk divisualisasikan?
label-atribut Yang atribut harus divisualisasikan sebagai label?
Universitas Sumatera Utara
Hasil proses dari K-Medoids dapat dilihat kecepatan mengklaster data judul tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar memakan waktu 3,21
menit, sedangkan hasil klastering nya cukup memadai, yang dapat dilihat pada gambar
Metadat a View
Processi ng time
Centroid cluster
model
Gambar 4.12. Hasil klastering dengan proses K-Medoids
Execution Time = 3:21
Universitas Sumatera Utara
Pada pengklasteran menggunakan metode K-Medoids diambil Scatter Matrix dan berdasarkan judul dapat dilihat pada gambar 4.13 berikut ini :
Gambar 4.13. Hasil klastering K-Medoids berdasarkan judul dengan Scatter
Matrix
Berikutnya adalah hasil klastering K-Medoids berdasarkan klasifikasi dapat dilihat pada gambar 4.14. berikut ini :
Gambar 4.14. Hasil klastering K-Medoids berdasarkan klasifikasi dengan Scatter
Matrix
Universitas Sumatera Utara
Selanjutnya hasil klastering dari K-Medoids berdasarkan Nim dapat dilihat pada gambar 4.15 sebagai berikut :
Gambar 4.15. Hasil klastering K-Medoids berdasarkan Nim dengan Scatter
Matrix
Kemudian dilanjutkan dengan pengklasteringan dengan K-Medoids berdasarkan tahun akademik dapat dilihat pada gambar 4.16 berikut ini :
Gambar 4.16.
Hasil klastering K-Medoids berdasarkan Tahun Akademik dengan Scatter Matrix
Universitas Sumatera Utara
Untuk melihat hasil klastering baik proses SVC maupun proses K-Medoids ditemukan pengklasteran yang dapat dilihat pada tabel berikut :
Dari tabel diatas dapat dilihat jumlah daripada pengklasteran judul tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar dengan database berjumlah
1708 dan web programming berjumlah 311, selanjutnya dapat juga dilihat beberapa proses klaster berdasarkan judul dan klasifikasi, tahun, nim dan nama
yang dapat dilihat pada gambar 4.17 berikut ini :
Gambar 4.17. Hasil klastering K-Medoids didapat berdasarkan Klasifikasi
Universitas Sumatera Utara
Gambar 4.18. Hasil klastering K-Medoids didapat berdasarkan Tahun
Gambar 4.19. Hasil klastering K-Medoids didapat berdasarkan Nim
Universitas Sumatera Utara
Gambar 4.20. Hasil klastering K-Medoids didapat berdasarkan Nama
Gambar 4.21.
Hasil dari Klastering K-Medoids Dengan Sumbu -Y sebagai nama dan Sumbu -X sebagai Judul
Universitas Sumatera Utara
Gambar 4.22. Hasil dari Klastering K-Medoids Dengan Sumbu-Y sebagai Nim
dan Sumbu -X sebagai Judul
Gambar 4.23. Hasil dari Klastering K-Medoids Dengan Sumbu-Y sebagai Tahun
dan Sumbu- X sebagai Judul
Universitas Sumatera Utara
Gambar 4.24. Hasil dari Klastering K-Medoids Dengan Sumbu-Y sebagai Judul
dan Sumbu-X sebagai Judul
Gambar 4.25. Hasil dari Klastering K-Medoids Dengan Sumbu-Y sebagai
Klasifikasi dan Sumbu-X sebagai Judul
Universitas Sumatera Utara
Dari tampilan-tampilan yang telah ditunjukkan oleh gambar hasil proses SVC dan K-Medoids dapat dijelaskan bahwa :
1. Pada pengklasteringan judul Tugas akhir mahasiswa AMIK Tunas Bangsa
Pematangsiantar yang berjudul 2020 jelas kelihatan bahwa pengelompokkan terhadap database dan web programming masing-masing berjumlah 1708
untuk database dan 311 untuk web programming, karena jenis klasifikasi lain tidak ada diambil untuk Tugas akhir mahasiswa tersebut.
2. Pada pengklasteran dengan mengambil scatter sebagai pilihan dapat dilihat
pada gambar 4.7 dengan hasil pengelompokkan database dan web programming. Ini berlaku untuk algoritma SVC dan K-Medoids.
3. Selanjutnya dilakukan proses SVC dan K-Medoids dengan mengambil
sumbu-X sebagai judul, sumbu-Y sebagai klasifikasi dan pada lajur kolom diambil klasifikasi nim, nama dan tahun akademik hasilnya dapat dilihat pada
gambar sebelumnya.
Universitas Sumatera Utara
BAB V
PENUTUP
5.1. Kesimpulan