Spesifikasi Alat Tahap-Tahap Penelitian

Tabel 4. 1 Atribut yang tidak digunakan pada data Ujian Nasional 2015 Tahun Atribut 2015 No. Kode Sek. Sts Sek. Jumlah Peserta TOT RANK Atribut pada tabel tabel 4.5 tidak digunakan sebab atribut dalam tabel-tabel tersebut hanya atribut pendukung yang tidak digunakan dalam proses clustering. Proses clustering membutuhkan atribut nama sekolah dan mata pelajaran. Hasil dari seleksi atribut pada data nilai ujian nasional IPA dan IPS di Daerah Istimewa Yogyakarta tahun ajaran 20142015 dijelaskan pada tabel 4.2 dan 4.3. Tabel 4. 2 Tabel Atribut Terseleksi Data Nilai Ujian Nasional Program Strudi IPA di Daerah Istimewa Yogyakarta Tahun ajaran 20142015 Nama Atribut Keterangan NAMA SEKOLAH Nama Sekolah BIN Ujian Nasional Bahasa Indonesia ING Ujian Nasional Bahasa Ingris MTK Ujian Nasional Matematika FSK Ujian Nasional Fisika KMA Ujian Nasional Kimia BIO Ujian Nasional Biologi Tabel 4. 3 Tabel Atribut Terseleksi Data Nilai Ujian Nasional Program Strudi IPS di Daerah Istimewa Yogyakarta Tahun ajaran 20142015

4.1.4. Tranformasi Data Data Transformation

Pada penelitian ini tidak dilakukan normalisasi karena data yang digunakan memiliki interval yang sama, yaitu 0-100, sehingga tahap ini tidak dilakukan. Tahap kedua dalam transformasi data yaitu mengubah data numerik menjadi sebuah keputusan misal Tuntas atau Tidak Tuntas. Dalam penelitian ini pada tahap ini tidak dilakukan.

4.2. PERANCANGAN PERANGKAT LUNAK PENAMBANGAN DATA

4.2.1. Diagram Use Case

Suatu sistem selalu memiliki interaksi antara pengguna dengan sistem itu sendiri, hal ini digambarkan dalam bentuk diagram use case. Diagram use case dapat dilihat pada gambar 4.1. Nama Atribut Keterangan NAMA SEKOLAH Nama Sekolah BIN Ujian Nasional Bahasa Indonesia ING Ujian Nasional Bahasa Ingris MTK Ujian Nasional Matematika EKO Ujian Nasional Ekonomi SOS Ujian Nasional Sosiologi GEO Ujian Nasional Geografi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Gambar 4. 1 Use Case Diagram Pengguna dalam sistem yang akan dibangun ini hanya satu, diinisialkan dengan nama pengguna. Interaksi yang dilakukan pengguna adalah: memilih berkas atau memasukkan data yang akan di kelompokkan, seleksi atribut yang digunakan, sistem melakukan proses clustering, dan simpan hasil clustering menggunakan algoritma K-Means dan menyimpan hasil clustering.

4.2.1. 1. Gambaran Umum Use Case

Diagram use case pada lampiran 2 memiliki gambaran umum dari masing-masing use case. Gambaran umum use case terlampir pada lampiran 3.

4.2.1. 2. Narasi Use Case

Diagram use case pada gambar 4.1 juga memiliki narasi yang merupakan penjelasan lebih lengkap dari masing-masing use case. Narasi tersebut terdapat pada lampiran 4.

4.2.2. Perancangan Umum

4.2.2.1. Input Sistem

Data input dari sistem yang akan dibangun berasal dari file dengan ekstensi .xls yang dipilih langsung oleh pengguna user dari direktori Komputer. User juga berperan untuk memasukan nilai k pada textfield yang diinginkan oleh user. Data yang digunakan adalah data nilai hasil ujian nasional IPA dan IPS untuk tahun ajaran 20112012 sampai 20142015.

4.2.2.2. Proses Sistem

Proses sitem yang akan dibangun terdiri dari beberaapa tahap untuk dapat melakukan pengelompokan clustering. Proses sistem yang terdiri dari beberapa langkah berikut: 1. Pengambilan data yang sudah melalui preprosesing untuk digunakan pada proses data mining. 2. Menentukan k sesuai dengan keinginan user 3. Proses pengelompokan menggunakan K-Means. 4. Menganalisa hasil pengelompokan K-Means terhadap proses data mining yang telah dijalankan. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Proses sistem digambarkan pada gambar 4.2 dibawah ini: Fi le XLS? Data numerik ? Jumlah cluster K Tentukan Centroid Hitung jarak obyek ke pusat Kelompokan obyek berdasarkan jarak terkecil Tidak Ya Cek Isi Data Proses Clustering Tampilkan Data ya ya tidak tidak Ada selisih pusat cluster lama dengan cluster baru ? Tentukan centroid baru Masukan file Start Simpan Data End Gambar 4. 2 Diagram flowchart PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI