Pemrosesan Awal Sumber Data

35 Gambar 4.2 Data setelah proses transformasi

4.2 Perancangan Perangkat Lunak Penambangan Data

4.2.1 Perancangan Umum

4.2.1.1 Input

Data input dari sistem yang akan dibangun berasal dari file dengan ekstensi .xls atau .csv yang dipilih langsung oleh user pengguna dari direktori komputer. Sebelum melakukan proses clustering , pengguna diharuskan mengisi jumlah cluster yang dikehendaki pada textfield yang telah disediakan.

4.2.1.2 Proses

Sistem ini akan mengimplementasikan algoritma Partitioning Around Medoids untuk mengelompokan data sekolah berdasarkan nilai daya serap ujian nasional mata pelajaran matematika pada tahun ajaran 20142015. Pada gambar 4.1 diperlihatkan proses dari sistem membuka berkas atau data dengan tipe .xls atau .csv kemudian sistem akan menyeleksi atribut yang tidak akan digunakan untuk proses clustering. Kemudian jika telah selesai menyeleksi atribut yang tidak akan digunakan, maka akan dilanjutkan dengan menginputkan nila untuk jumlah cluster . Kemudian akan di lakukan proses clustering dengan menggunakan algoritma k-medoids atau Partitioning Around Medoids. Kemudian sistem akan menampilkan hasil proses clustering. Setelah itu , hasil clustering dapat disimpan ke dalam direktori computer dengan tipe data berupa .doc atau .txt. 36 Mulai File data bertipe .xls atau .csv Seleksi atribut Proses seleksi atribut Memasukkan jumlah cluster Proses clustering k-medoids Tampilkan hasil clustering Simpan hasil clustering File data bertipe .doc atau .txt Selesai Tidak Ya Gambar 4.3 Proses Umum Sistem 4.2.1.3 Output Hasil keluaran yang diperoleh dari sistem yang dibangun adalah data-data sekolah yang sudah dikelompokkan. 37

4.2.2 Diagram Konteks Context Diagram

Pengguna Clustering dengan K- Medoids Data daya serap, jumlah cluster Pengelompokan data sekolah Gambar 4.4 Diagram Konteks 4.2.3 Diagram Usecase Diagram usecase merupakan sebuah gambaran kebutuhan sistem dari sudut pandang di luar sistem. Pengguna sistem dalam diagram usecase disebut dengan actor . Pada sistem ini actor yang digunakan hanya satu actor . Fungsi yang dapat dilakukan oleh actor pada sistem ini adalah memilih data, seleksi atribut, proses clustering dengan memasukkan nilai jumlah cluster ,dan menyimpan hasil. Gambar dari usecase ditunjukkan pada gambar 4.3 berikut. actor Seleksi atribut Proses clustering dengan algoritma PAM Simpan hasil clustering Input berkas include include ext en ds Gambar 4.5 Diagram Usecase