Tabel 4. 1 Atribut yang tidak digunakan pada data Ujian Nasional 2015
Tahun Atribut
2015 No.
Kode Sek. Sts Sek.
Jumlah Peserta TOT
RANK
Atribut pada tabel tabel 4.5 tidak digunakan sebab atribut dalam tabel-tabel tersebut hanya atribut pendukung yang tidak digunakan dalam proses clustering.
Proses clustering membutuhkan atribut nama sekolah dan mata pelajaran. Hasil dari seleksi atribut pada data nilai ujian nasional IPA dan IPS di
Daerah Istimewa Yogyakarta tahun ajaran 20142015 dijelaskan pada tabel 4.2 dan 4.3.
Tabel 4. 2 Tabel Atribut Terseleksi Data Nilai Ujian Nasional Program Strudi IPA di Daerah Istimewa Yogyakarta Tahun ajaran 20142015
Nama Atribut Keterangan
NAMA SEKOLAH Nama Sekolah
BIN Ujian Nasional Bahasa Indonesia
ING Ujian Nasional Bahasa Ingris
MTK Ujian Nasional Matematika
FSK Ujian Nasional Fisika
KMA Ujian Nasional Kimia
BIO Ujian Nasional Biologi
Tabel 4. 3 Tabel Atribut Terseleksi Data Nilai Ujian Nasional Program Strudi IPS di Daerah Istimewa Yogyakarta Tahun ajaran 20142015
4.1.4. Tranformasi Data Data Transformation
Pada penelitian ini tidak dilakukan normalisasi karena data yang digunakan memiliki interval yang sama, yaitu 0-100, sehingga tahap ini tidak dilakukan.
Tahap kedua dalam transformasi data yaitu mengubah data numerik menjadi sebuah keputusan misal Tuntas atau Tidak Tuntas. Dalam penelitian ini pada
tahap ini tidak dilakukan.
4.2. PERANCANGAN PERANGKAT LUNAK PENAMBANGAN DATA
4.2.1. Diagram Use Case
Suatu sistem selalu memiliki interaksi antara pengguna dengan sistem itu sendiri, hal ini digambarkan dalam bentuk diagram use case. Diagram use case
dapat dilihat pada gambar 4.1. Nama Atribut
Keterangan NAMA SEKOLAH
Nama Sekolah BIN
Ujian Nasional Bahasa Indonesia ING
Ujian Nasional Bahasa Ingris MTK
Ujian Nasional Matematika EKO
Ujian Nasional Ekonomi SOS
Ujian Nasional Sosiologi GEO
Ujian Nasional Geografi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Gambar 4. 1 Use Case Diagram Pengguna dalam sistem yang akan dibangun ini hanya satu, diinisialkan
dengan nama pengguna. Interaksi yang dilakukan pengguna adalah: memilih berkas atau memasukkan data yang akan di kelompokkan, seleksi atribut yang
digunakan, sistem melakukan proses clustering, dan simpan hasil clustering menggunakan algoritma K-Means dan menyimpan hasil clustering.
4.2.1. 1. Gambaran Umum Use Case
Diagram use case pada lampiran 2 memiliki gambaran umum dari masing-masing use case. Gambaran umum use case terlampir pada lampiran 3.
4.2.1. 2. Narasi Use Case
Diagram use case pada gambar 4.1 juga memiliki narasi yang merupakan penjelasan lebih lengkap dari masing-masing use case. Narasi tersebut terdapat
pada lampiran 4.
4.2.2. Perancangan Umum
4.2.2.1. Input Sistem
Data input dari sistem yang akan dibangun berasal dari file dengan ekstensi .xls yang dipilih langsung oleh pengguna user dari direktori Komputer.
User juga berperan untuk memasukan nilai k pada textfield yang diinginkan oleh user. Data yang digunakan adalah data nilai hasil ujian nasional IPA dan IPS
untuk tahun ajaran 20112012 sampai 20142015.
4.2.2.2. Proses Sistem
Proses sitem yang akan dibangun terdiri dari beberaapa tahap untuk dapat melakukan pengelompokan clustering. Proses sistem yang terdiri dari beberapa
langkah berikut: 1.
Pengambilan data yang sudah melalui preprosesing untuk digunakan pada proses data mining.
2. Menentukan k sesuai dengan keinginan user
3. Proses pengelompokan menggunakan K-Means.
4. Menganalisa hasil pengelompokan K-Means terhadap proses data
mining yang telah dijalankan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Proses sistem digambarkan pada gambar 4.2 dibawah ini:
Fi le XLS?
Data numerik ?
Jumlah cluster K
Tentukan Centroid
Hitung jarak obyek ke pusat
Kelompokan obyek berdasarkan jarak
terkecil Tidak
Ya Cek Isi Data
Proses Clustering
Tampilkan Data ya
ya tidak
tidak
Ada selisih pusat cluster lama dengan
cluster baru ? Tentukan centroid
baru Masukan file
Start
Simpan Data
End
Gambar 4. 2 Diagram flowchart PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI