35
Gambar 4.2 Data setelah proses transformasi
4.2 Perancangan Perangkat Lunak Penambangan Data
4.2.1 Perancangan Umum
4.2.1.1 Input
Data
input
dari sistem yang akan dibangun berasal dari
file
dengan ekstensi .xls atau .csv yang dipilih langsung oleh
user
pengguna dari direktori komputer. Sebelum melakukan proses
clustering
, pengguna diharuskan mengisi jumlah
cluster
yang dikehendaki pada
textfield
yang telah disediakan.
4.2.1.2 Proses
Sistem ini akan mengimplementasikan algoritma
Partitioning Around Medoids
untuk mengelompokan data sekolah berdasarkan nilai daya serap ujian nasional mata pelajaran matematika pada tahun ajaran 20142015. Pada gambar 4.1
diperlihatkan proses dari sistem membuka berkas atau data dengan tipe .xls atau .csv kemudian sistem akan menyeleksi atribut yang tidak akan digunakan untuk proses
clustering. Kemudian jika telah selesai menyeleksi atribut yang tidak akan digunakan, maka akan dilanjutkan dengan menginputkan nila untuk jumlah
cluster
. Kemudian akan di lakukan proses
clustering
dengan menggunakan algoritma k-medoids atau
Partitioning Around Medoids.
Kemudian sistem akan menampilkan hasil proses
clustering.
Setelah itu
,
hasil
clustering
dapat disimpan ke dalam direktori computer dengan tipe data berupa .doc atau .txt.
36
Mulai File data bertipe .xls atau .csv
Seleksi atribut Proses seleksi atribut
Memasukkan jumlah cluster
Proses clustering k-medoids
Tampilkan hasil clustering
Simpan hasil clustering
File data bertipe .doc atau .txt
Selesai
Tidak Ya
Gambar 4.3 Proses Umum Sistem 4.2.1.3
Output
Hasil keluaran yang diperoleh dari sistem yang dibangun adalah data-data sekolah yang sudah dikelompokkan.
37
4.2.2 Diagram Konteks Context Diagram
Pengguna Clustering dengan K-
Medoids Data daya serap, jumlah cluster
Pengelompokan data sekolah
Gambar 4.4 Diagram Konteks 4.2.3
Diagram Usecase
Diagram usecase merupakan sebuah gambaran kebutuhan sistem dari sudut pandang di luar sistem. Pengguna sistem dalam diagram usecase disebut dengan
actor
. Pada sistem ini
actor
yang digunakan hanya satu
actor
. Fungsi yang dapat dilakukan oleh
actor
pada sistem ini adalah memilih data, seleksi atribut, proses
clustering
dengan memasukkan nilai jumlah
cluster
,dan menyimpan hasil. Gambar dari usecase ditunjukkan pada gambar 4.3 berikut.
actor Seleksi atribut
Proses clustering dengan algoritma PAM
Simpan hasil clustering
Input berkas include
include ext
en ds
Gambar 4.5 Diagram
Usecase