Spesifikasi Alat Implementasi algoritma Partitioning Around Medoids (PAM) untuk pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya serap Ujian Nasional

34 suatu berkas. Pada data nilai daya serap terdapat 2 atribut tetap yaitu KODE SEKOLAH dan NAMA SEKOLAH. Sisanya merupakan atribut nama kompetensi yang jumlahnya berbeda untuk tiap tahun ajaran. Daftar atribut yang digunakan dapat dilihat pada tabel 3.2.

4.1.4 Transformasi Data

Pada tahap transformasi data adalah mengubah format data asli ke dalam format data yang sesuai untuk penelitian, yaitu mengubah data dari kolom nilai daya serap per sekolah menjadi baris per sekolah untuk mempermudah proses penambangan data. Kemudian, mengubah format data yang sesuai untuk penelitian ini yaitu pada baris pertama dalam excel adalah nama kolom dari data yang digunakan dan baris berikutnya adalah data tersebut seperti pada gambar 4.2. Gambar 4.1 Data awal nilai daya serap 35 Gambar 4.2 Data setelah proses transformasi

4.2 Perancangan Perangkat Lunak Penambangan Data

4.2.1 Perancangan Umum

4.2.1.1 Input

Data input dari sistem yang akan dibangun berasal dari file dengan ekstensi .xls atau .csv yang dipilih langsung oleh user pengguna dari direktori komputer. Sebelum melakukan proses clustering , pengguna diharuskan mengisi jumlah cluster yang dikehendaki pada textfield yang telah disediakan.

4.2.1.2 Proses

Sistem ini akan mengimplementasikan algoritma Partitioning Around Medoids untuk mengelompokan data sekolah berdasarkan nilai daya serap ujian nasional mata pelajaran matematika pada tahun ajaran 20142015. Pada gambar 4.1 diperlihatkan proses dari sistem membuka berkas atau data dengan tipe .xls atau .csv kemudian sistem akan menyeleksi atribut yang tidak akan digunakan untuk proses clustering. Kemudian jika telah selesai menyeleksi atribut yang tidak akan digunakan, maka akan dilanjutkan dengan menginputkan nila untuk jumlah cluster . Kemudian akan di lakukan proses clustering dengan menggunakan algoritma k-medoids atau Partitioning Around Medoids. Kemudian sistem akan menampilkan hasil proses clustering. Setelah itu , hasil clustering dapat disimpan ke dalam direktori computer dengan tipe data berupa .doc atau .txt.