34 suatu berkas. Pada data nilai daya serap terdapat 2 atribut tetap yaitu KODE
SEKOLAH dan NAMA SEKOLAH. Sisanya merupakan atribut nama kompetensi yang jumlahnya berbeda untuk tiap tahun ajaran. Daftar atribut yang digunakan dapat
dilihat pada tabel 3.2.
4.1.4 Transformasi Data
Pada tahap transformasi data adalah mengubah format data asli ke dalam format data yang sesuai untuk penelitian, yaitu mengubah data dari kolom nilai daya serap per
sekolah menjadi baris per sekolah untuk mempermudah proses penambangan data. Kemudian, mengubah format data yang sesuai untuk penelitian ini yaitu pada baris
pertama dalam excel adalah nama kolom dari data yang digunakan dan baris berikutnya adalah data tersebut seperti pada gambar 4.2.
Gambar 4.1 Data awal nilai daya serap
35
Gambar 4.2 Data setelah proses transformasi
4.2 Perancangan Perangkat Lunak Penambangan Data
4.2.1 Perancangan Umum
4.2.1.1 Input
Data
input
dari sistem yang akan dibangun berasal dari
file
dengan ekstensi .xls atau .csv yang dipilih langsung oleh
user
pengguna dari direktori komputer. Sebelum melakukan proses
clustering
, pengguna diharuskan mengisi jumlah
cluster
yang dikehendaki pada
textfield
yang telah disediakan.
4.2.1.2 Proses
Sistem ini akan mengimplementasikan algoritma
Partitioning Around Medoids
untuk mengelompokan data sekolah berdasarkan nilai daya serap ujian nasional mata pelajaran matematika pada tahun ajaran 20142015. Pada gambar 4.1
diperlihatkan proses dari sistem membuka berkas atau data dengan tipe .xls atau .csv kemudian sistem akan menyeleksi atribut yang tidak akan digunakan untuk proses
clustering. Kemudian jika telah selesai menyeleksi atribut yang tidak akan digunakan, maka akan dilanjutkan dengan menginputkan nila untuk jumlah
cluster
. Kemudian akan di lakukan proses
clustering
dengan menggunakan algoritma k-medoids atau
Partitioning Around Medoids.
Kemudian sistem akan menampilkan hasil proses
clustering.
Setelah itu
,
hasil
clustering
dapat disimpan ke dalam direktori computer dengan tipe data berupa .doc atau .txt.