Validitas Cluster Pengelompokan Sekolah Menengah Atas di Provinsi Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan algoritma K-Means Clustering.

Tabel 2. 1 Kriteria Subjektif Kualitas Pengelompokkan Berdasarkan Silhouette Coeficient SC Nilai SC Interpretasi Oleh Kauffman 0,72 – 1,00 Strong Classification 0,51-0,70 Good Classification 0,26-0,50 Weak Classification 0-0,25 Bad Classification PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI 22 BAB III METODOLOGI PENELITIAN 3.1. Sumber Data Data yang digunakan pada penelitian ini didapat dari situs http:litbang.kemdikbud.go.idindex.phpun untuk data tahun ajaran 20142015. Data yang didapatkan berekstensi .xls dan berisikan nilai SMA dari jurusan IPA dan IPS.

3.1.1. Data yang digunakan

Data yang digunakan merupakan data nilai siswa program IPA dan IPS. Untuk program studi IPA terdiri dari mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, Biologi, Fisika dan Kimia. Sedangkan untuk program studi IPS terdiri dari mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika, Ekonomi, Sosiologi, dan Geografi. Salah satu contoh data yang digunakan berisi data seperti yang terdapat dalam tabel 3.1 sampai dengan tabel 3.4. Tabel 3. 1Table Atribut Data Mentah Nilai Hasil Ujian Nasional Program IPA 20142015 Nama Atribut Keterangan Kode Sek. Kode Sekolah NAMA SEKOLAH Nama Sekolah Sts Sek. Status SekolahSwastaNegeri Jm. Pes Jumlah Peserta BIN Ujian Nasional Bahasa Indonesia ING Ujian Nasional Bahasa Ingris MAT Ujian Nasional Matematika FIS Ujian Nasional Fisika KIM Ujian Nasional Kimia BIO Ujian Nasional Biologi TOT Total Nilai Ujian Tabel 3. 2 Table Atribut Data Mentah Nilai Hasil Ujian Nasional Program IPS 20142015 Nama Atribut Keterangan Kode Sek. Kode Sekolah NAMA SEKOLAH Nama Sekolah Sts Sek. Status SekolahSwastaNegeri Jm. Pes Jumlah Peserta BIN Ujian Nasional Bahasa Indonesia ING Ujian Nasional Bahasa Ingris MAT Ujian Nasional Matematika EKO Ujian Nasional Ekonomi SOS Ujian Nasional Sosiologi GEO Ujian Nasional Geografi TOT Total Nilai Ujian

3.2. Spesifikasi Alat

Sistem dibuat dengan menggunakan hardware dan software sebagai berikut:

3.2.1. Spesifikasi Hardware

a. Proses Intel Pentium Core i5 2.40GHz b. RAM 2.00 GB

3.2.2. Spesifikasi Software

a. Sistem Operasi Microsoft Windows 7 b. Compiler IDE NetBeans 7.2 Software ini akan digunakan untuk membuat interface dan sekaligus untuk membuat source code.

3.3. Tahap-Tahap Penelitian

3.3.1. Studi Kasus

Nilai Ujian Nasional merupakan tolak ukur atau parameter akhir dari proses pembelajaran di suatu tingkat pendidikan di suatu daerah. Dari nilai Ujian Nasional tersebut dapat digunakan untuk pemetaan kualitas pendidikan. Untuk PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI mengevaluasi nilai ujian nasional agar dapat terlihat pemetaannya dapat menggunakan nilai dari mata pelajaran yang diujikan pada program IPA maupun IPS. Dengan penelitian ini diharapkan dapat menemukan suatu pengelompokan sekolah yang telah menjalankan Ujian Nasional untuk mengetahui keberhasilan dari Ujian Nasional.

3.3.2. Penelitian Pustaka

Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan menggali teori-teori tentang teknik data mining. Dalam penelitian ini penulis mempelajari literatur yang berkaitan dengan teknik data mining asosiasi khususnya algoritma K-Means dan literatur lainnya yang berguna bagi sistem yang akan dibangun.

3.3.3. Knowledge Discovery in Database KDD

Dalam melakukan proses mengubah data mentah menjadi suatu informasi yang bermanfaat, penulis menggunakan proses Knowledge Discovery in Database KDD yang terdiri dari pembersihan data, integrasi data, seleksi data, transformasi data, penambangan data, evaluasi pola, dan presentasi pengetahuan. Pada tahap pembersihan data dan integrasi data, penulis melakukan secara manual dengan menggunakan aplikasi microsoft excel. Tahap selanjutnya yaitu seleksi data, transformasi data, dan penambangan data, penulis mengembangkan perangkat lunak sebagai alat bantu untuk melakukan tahap-tahap tersebut. Sedangkan untuk tahap evaluasi pola dan presentasi pengetahuan, penulis melakukan evaluasi dari hasil penambangan data yang didapat dari perangkat lunak yang telah dibangun dan menjelaskan hasil evaluasi tersebut agar informasi yang didapat dapat diterima oleh pihak-pihak yang membutuhkan.

3.3.4. Pengembangan Perangkat Lunak

Pada tahap seleksi data, transformasi data, dan penambangan data di dalam proses Knowledge Discovery in Database KDD, penulis mengembangkan perangkat lunak sebagai alat untuk mengolah Dataset yang penulis miliki untuk mendapatkan informasi yang berguna. Metode yang digunakan oleh penulis dan pengembang sistem adalah metode waterfall. Metode ini merupakan metode yang paling sering digunakan oleh para pengembang perangkat lunak. Metode ini menggunakan sistem linier yaitu apa yang dilakukan pada tahap sebelumnya akan mempengaruhi tahap selanjutnya. Metode waterfall mempunyai langkah-langkah sebagai berikut: 1. Analisa Pada langkah ini analisa terhadap kebutuhan sistem. Pengumpulan data dalam tahap ini bisa dilakukan melalui sebuah penelitian, wawancara atau studi literatur. Seorang sistem analis bertugas dalam mencari informasi sebanyak mungkin dari user sehingga sistem yang dibuat dapat sesuai dengan kebutuhan user. Pada tahapan ini menghasilkan dokumen user requirement yang dapat digunakan sistem analis untuk menerjemahkan ke dalam bahasa pemrograman. 2. Desain Pada proses desain akan menerjemahkan syarat kebutuhan ke sebuah perancangan perangkat lunak yang dapat dapat diperkirakan sebelum diubah ke dalam bahasa pemrograman. Fokus dari proses ini pada struktur data, arsitektur perangkat lunak, representasi interface, dan detail algoritma. Tahapan ini akan menghasilkan dokumen yang disebut software requirement. Dokumen ini yang digunakan seorang programmer untuk membangun sistemnya. 3. Pemrograman Pemrograman merupakan penerjemahan design ke dalam bahasa pemrograman. Pada tahap ini programmer akan mengubah proses transaksi yang diinginkan user ke dalam sistem yang dibangun. 4. Pengujian Perangkat Lunak Pada tahap pengujian perangkat lunak dilakukan setelah pemrograman selesai. Pengujian yang digunakan adalah membandingkan perhitungan manual dengan hasil yang diperoleh dari perangkat lunak. Tujuan pengujian ini adalah untuk menemukan PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI kesalahan – kesalahan yang terdapat pada perangkat lunak tersebut agar kemudian dapat diperbaiki.

3.3.5. Analisis dan Pembuatan Laporan

Analisis yang akan dilakukan adalah analisis kinerja dari alat uji yang dibuat menggunakan algoritma K-Means, dan hasil analisis tersebut nantinya akan diolah kedalam sebuah laporan tugas akhir. 27 BAB IV PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK PENAMBANGAN DATA

4.1. PEMROSESAN AWAL

4.1.1. Pembersihan Data Data Cleaning

Sebelum proses data mining dapat dilakukan, perlu proses cleaning pada data yang menjadi fokus. Pemrosesan pendahuluan dan pembersihan data merupakan operasi dasar seperti penghapusan noise dilakukan. Pada penelitian ini ada beberapa sekolah yang tidak ada nilainya maka peneliti menghapus sekolah yang tidak ada nilai hasil ujian.

4.1.2. Itegrasi Data Data Integration

Tahap ini berisikan penggabungan data dari bermacam-macam sumber. Peneliti menggunakan 2 data terdiri dari data nilai ujian nasional 20142015 jurusan IPA dan IPS. Peneliti tidak menggunakan tahap ini dikarenakan data berasal dari sumber yang sama sehingga tidak perlu melakukan proses integrasi data karena range nilai yang digunakan juga sudah sama.

4.1.3. Seleksi Data Data Selection

Pemilihan seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Seleksi data merupakan proses menganalisis data yang relevan dari dalam database. Atribut yang tidak digunakan pada data ujian nasional jurusan IPA dan IPS di DIY tahun 20142015 dijelaskan tabel 4.1. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Tabel 4. 1 Atribut yang tidak digunakan pada data Ujian Nasional 2015 Tahun Atribut 2015 No. Kode Sek. Sts Sek. Jumlah Peserta TOT RANK Atribut pada tabel tabel 4.5 tidak digunakan sebab atribut dalam tabel-tabel tersebut hanya atribut pendukung yang tidak digunakan dalam proses clustering. Proses clustering membutuhkan atribut nama sekolah dan mata pelajaran. Hasil dari seleksi atribut pada data nilai ujian nasional IPA dan IPS di Daerah Istimewa Yogyakarta tahun ajaran 20142015 dijelaskan pada tabel 4.2 dan 4.3. Tabel 4. 2 Tabel Atribut Terseleksi Data Nilai Ujian Nasional Program Strudi IPA di Daerah Istimewa Yogyakarta Tahun ajaran 20142015 Nama Atribut Keterangan NAMA SEKOLAH Nama Sekolah BIN Ujian Nasional Bahasa Indonesia ING Ujian Nasional Bahasa Ingris MTK Ujian Nasional Matematika FSK Ujian Nasional Fisika KMA Ujian Nasional Kimia BIO Ujian Nasional Biologi