Silhouette Coefficient y=

15

BAB III METODOLOGI PENELITIAN

3.1. SUMBER DATA

Data yang akan digunakan untuk penelitian ini berupa i berekstensi .xls yang diperoleh dari situs milik Kementrian Pendidikan dan kebudayaan yang dapat diakses melalui alamat http:un.kemdikbud.go.idr-hasilun.html Data sumber merupakan data nilai Ujian Nasional SMA jurusan IPA dan IPS di Daerah Istimewa Yogyakarta tahun 2015. Pada penelitian ini data mata pelajaran yang digunakan adalah seluruh mata pelajaran yang digunakan untuk Ujian Nasional jurusan IPA Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Kimia, dan Biologi dan IPS Bahasa Indonesia, Bahasa Inggris, Matematika, Geografi, Sosiologi, dan Ekonomi.

3.2. SPESIFIKASI ALAT

3.2.1. Hardware

Perangkat keras yang digunakan untuk membuat aplikasi ini adalah Laptop dengan spesifikasi prosessor Intel Core i3, RAM 2GB, HDD 300GB.

3.2.2. Software

Perangkat lunak yang digunakan dalam pembuatan aplikasi ini adalah Sistem Operasi Windows 8.1 Enterprise 64-bit, JDK 1, 7, dan NetBeans 7.2 .

3.3. TAHAP-TAHAP PENELITIAN

3.3.1. Studi Kasus

Ujian Nasional Sekolah Menengah Atas bertujuan untuk mengukur dan menilai pengetahuan dan kompetensi pada mata pelajaran tertentu. Selain itu hasil dari Ujian Nasional juga dapat digunakan untuk memetakan kualitas pendidikan di Indonesia. Untuk meningkatkan mutu pendidikan Sekolah Menengah Atas di Indonesia khususnya di Daerah Istimewa Yogyakarta maka dilakukanlah penelitian untuk memetakan kualitas pendidikan Sekolah Menengah Atas berdasarkan nilai Ujian Nasional sehingga nantinya dapat dipergunakan untuk evaluasi dalam meningkatkan mutu pendidikan.

3.3.2. Penelitian Pustaka

Penulis melakukan penelitian ini dengan mencari literatur-literatur sebagai referensi untuk mengetahui teori-teori yang berkaitan dengan penelitian. Literatur- literatur yang digunakan berasal dari buku, jurnal, dan karya ilmiah.

3.3.3. Knowledge Discovery in Database KDD

Penulis melakukan penelitian ini bertujuan untuk mengubah data mentah menjadi suatu informasi yang lebih bermanfaat, dalam penelitian ini penulis menggunakan proses Knowledge Discovery in Database KDD di mana proses KDD tersebut terdiri dari pembersihan data, integrasi data, seleksi data, transformasi data, penambangan data, evaluasi pola, dan presentasi pengetahuan. Han dkk, 2006 Pada penelitian ini, penulis melakukan pembersihan data dan integrasi data secara manual yaitu dengan menggunakan aplikasi spreadsheet. Tahap seleksi data, transformasi data, dan penambangan data dilakukan di dalam perangkat lunak yang dikembangkan oleh penulis sebagai alat bantu untuk mempermudah tahap-tahap tersebut. Pada tahap evaluasi pola dan presentasi pengetahuan, penulis melakukan evaluasi hasil dari perangkat lunak yang telah dibangun dan kemudian memberikan penjelasan atas hasil evaluasi agar informasi yang didapat dapat bermanfaat bagi pihak-pihak yang membutuhkan.

3.3.4. Pengembangan Perangkat Lunak

Metode yang digunakan penulis dalam mengembangakan sistem penambangan data ini adalah metode waterfall. Waterfall adalah sebuah model pengembangan perangkat lunak yang dilakukan secara sekuensial, dimana satu tahap dilakukan setelah tahap sebelumnya selesai dilakukan. Metode ini merupakan metode yang paling umum digunakan oleh para pengembang perangkat lunak. Metode waterfall memiliki langkah-langkah sebagai berikut : 1. Analisis Langkah ini merupakan langkah untuk menganalisis kebutuhan dari sistem yang akan dibangun. 2. Desain Langkah ini merupakan langkah untuk merancang sebuah perangkat lunak sesuai dengan kebutuhan dari sistem yang telah dianalisis. Pada langkah ini dilakukan perancangan antarmuka, struktur data, dan algoritma yang akan digunakan pada sistem ini. 3. Implementasi Implementasi merupakan penerapan dari hasil desain ke dalam bahasa pemrograman yang nantinya akan menghasilkan sebuah perangkat lunak. 4. Pengujian Perangkat Lunak Langkah terakhir yang perlu dilakukan adalah pengujian perangkat lunak yang telah selesai dibuat. Pengujian perangkat lunak yang dilakukan adalah dengan menggunakan pengujian blackbox, pengujian membandingkan hasil perhitungan manual dengan hasil dari sistem yang dibuat, dan pengujian membandingkan hasil dari sistem yang dibuat dengan sistem lain Orange.

BAB IV PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK

4.1 PEMROSESAN AWAL

4.1.1 Pembersihan Data Data Cleaning

Pembersihan data adalah proses membersihkan data dari data yang tidak diperlukan noise dan data yang tidak konsisten. Data yang memiliki noise seperti beberapa sekolah nilai ujian nasionalnya kosong maka sekolah tersebut akan dihapus dari tabel data.

4.1.2 Integrasi Data Data Integration

Integrasi data adalah melakukan penggabungan data dari berbagai macam sumber. Dalam penelitian ini peneliti menggunakan 8 data yaitu data nilai Ujian Nasional tahun 2015 jurusan IPA dan data nilai Ujian Nasional tahun 2015 jurusan IPS. Data penelitian ini diperoleh dari satu sumber sehingga tidak dilakukan integrasi data.

4.1.3 Seleksi Data Data Selection

Seleksi atribut merupakan tahap yang perlu dilakukan sebelum proses penambangan data. Pada data asli nilai Ujian Nasional terdapat 4 atribut tetap yaitu atribut KODE_SEKOLAH, NAMA_SEKOLAH, dan 6 mata pelajaran Ujian Nasional yang tertera pada tabel 4.1 dan tabel 4.2. Atribut yang dibuang adalah atribut KODE_SEKOLAH karena KODE_SEKOLAH tidak dibutuhkan informasinya dalam pengelompokan dan Atribut yang akan digunakan untuk proses penambangan data yaitu NAMA_SEKOLAH dan 6 mata pelajaran Ujian Nasional yang tertera pada tabel 4.3 dan tabel 4.4 Tabel 4.1 Atribut dari data asli nilai Ujian Nasional SMA jurusan IPA No. Atribut Keterangan 1 KODE_SEKOLAH Kode Sekolah PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI