15
BAB III METODOLOGI PENELITIAN
3.1. SUMBER DATA
Data yang akan digunakan untuk penelitian ini berupa i berekstensi .xls yang diperoleh dari situs milik Kementrian Pendidikan dan kebudayaan yang dapat
diakses melalui alamat http:un.kemdikbud.go.idr-hasilun.html Data sumber merupakan data nilai Ujian Nasional SMA jurusan IPA dan IPS
di Daerah Istimewa Yogyakarta tahun 2015. Pada penelitian ini data mata pelajaran yang digunakan adalah seluruh mata pelajaran yang digunakan untuk Ujian
Nasional jurusan IPA Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, dan Biologi dan IPS Bahasa Indonesia, Bahasa Inggris, Matematika,
Geografi, Sosiologi, dan Ekonomi.
3.2. SPESIFIKASI ALAT
3.2.1. Hardware
Perangkat keras yang digunakan untuk membuat aplikasi ini adalah Laptop dengan spesifikasi prosessor Intel Core i3, RAM 2GB, HDD 300GB.
3.2.2. Software
Perangkat lunak yang digunakan dalam pembuatan aplikasi ini adalah Sistem Operasi Windows 8.1 Enterprise 64-bit, JDK 1, 7, dan NetBeans 7.2 .
3.3. TAHAP-TAHAP PENELITIAN
3.3.1. Studi Kasus
Ujian Nasional Sekolah Menengah Atas bertujuan untuk mengukur dan menilai pengetahuan dan kompetensi pada mata pelajaran tertentu. Selain itu hasil
dari Ujian Nasional juga dapat digunakan untuk memetakan kualitas pendidikan di Indonesia. Untuk meningkatkan mutu pendidikan Sekolah Menengah Atas di
Indonesia khususnya di Daerah Istimewa Yogyakarta maka dilakukanlah penelitian untuk memetakan kualitas pendidikan Sekolah Menengah Atas berdasarkan nilai
Ujian Nasional sehingga nantinya dapat dipergunakan untuk evaluasi dalam meningkatkan mutu pendidikan.
3.3.2. Penelitian Pustaka
Penulis melakukan penelitian ini dengan mencari literatur-literatur sebagai referensi untuk mengetahui teori-teori yang berkaitan dengan penelitian. Literatur-
literatur yang digunakan berasal dari buku, jurnal, dan karya ilmiah.
3.3.3. Knowledge Discovery in Database KDD
Penulis melakukan penelitian ini bertujuan untuk mengubah data mentah menjadi suatu informasi yang lebih bermanfaat, dalam penelitian ini penulis
menggunakan proses Knowledge Discovery in Database KDD di mana proses KDD tersebut terdiri dari pembersihan data, integrasi data, seleksi data,
transformasi data, penambangan data, evaluasi pola, dan presentasi pengetahuan. Han dkk, 2006
Pada penelitian ini, penulis melakukan pembersihan data dan integrasi data secara manual yaitu dengan menggunakan aplikasi spreadsheet. Tahap seleksi data,
transformasi data, dan penambangan data dilakukan di dalam perangkat lunak yang dikembangkan oleh penulis sebagai alat bantu untuk mempermudah tahap-tahap
tersebut. Pada tahap evaluasi pola dan presentasi pengetahuan, penulis melakukan evaluasi hasil dari perangkat lunak yang telah dibangun dan kemudian memberikan
penjelasan atas hasil evaluasi agar informasi yang didapat dapat bermanfaat bagi pihak-pihak yang membutuhkan.
3.3.4. Pengembangan Perangkat Lunak
Metode yang digunakan penulis dalam mengembangakan sistem penambangan data ini adalah metode waterfall. Waterfall adalah sebuah model
pengembangan perangkat lunak yang dilakukan secara sekuensial, dimana satu tahap dilakukan setelah tahap sebelumnya selesai dilakukan. Metode ini merupakan
metode yang paling umum digunakan oleh para pengembang perangkat lunak. Metode waterfall memiliki langkah-langkah sebagai berikut :
1. Analisis
Langkah ini merupakan langkah untuk menganalisis kebutuhan dari sistem yang akan dibangun.
2. Desain
Langkah ini merupakan langkah untuk merancang sebuah perangkat lunak sesuai dengan kebutuhan dari sistem yang telah
dianalisis. Pada langkah ini dilakukan perancangan antarmuka, struktur data, dan algoritma yang akan digunakan pada sistem ini.
3. Implementasi
Implementasi merupakan penerapan dari hasil desain ke dalam bahasa pemrograman yang nantinya akan menghasilkan
sebuah perangkat lunak. 4.
Pengujian Perangkat Lunak Langkah terakhir yang perlu dilakukan adalah pengujian
perangkat lunak yang telah selesai dibuat. Pengujian perangkat lunak yang dilakukan adalah dengan menggunakan pengujian blackbox,
pengujian membandingkan hasil perhitungan manual dengan hasil dari sistem yang dibuat, dan pengujian membandingkan hasil dari
sistem yang dibuat dengan sistem lain Orange.
BAB IV PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK
4.1 PEMROSESAN AWAL
4.1.1 Pembersihan Data Data Cleaning
Pembersihan data adalah proses membersihkan data dari data yang tidak diperlukan noise dan data yang tidak konsisten. Data yang memiliki noise
seperti beberapa sekolah nilai ujian nasionalnya kosong maka sekolah tersebut akan dihapus dari tabel data.
4.1.2 Integrasi Data Data Integration
Integrasi data adalah melakukan penggabungan data dari berbagai macam sumber. Dalam penelitian ini peneliti menggunakan 8 data yaitu data nilai
Ujian Nasional tahun 2015 jurusan IPA dan data nilai Ujian Nasional tahun 2015 jurusan IPS. Data penelitian ini diperoleh dari satu sumber sehingga
tidak dilakukan integrasi data.
4.1.3 Seleksi Data Data Selection
Seleksi atribut merupakan tahap yang perlu dilakukan sebelum proses penambangan data. Pada data asli nilai Ujian Nasional terdapat 4 atribut
tetap yaitu atribut KODE_SEKOLAH, NAMA_SEKOLAH, dan 6 mata pelajaran Ujian Nasional yang tertera pada tabel 4.1 dan tabel 4.2. Atribut
yang dibuang adalah atribut KODE_SEKOLAH karena KODE_SEKOLAH tidak dibutuhkan informasinya dalam pengelompokan dan Atribut yang
akan digunakan untuk proses penambangan data yaitu NAMA_SEKOLAH dan 6 mata pelajaran Ujian Nasional yang tertera pada tabel 4.3 dan tabel
4.4
Tabel 4.1 Atribut dari data asli nilai Ujian Nasional SMA jurusan IPA
No. Atribut
Keterangan
1 KODE_SEKOLAH
Kode Sekolah PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI