Tabel 2. 1 Kriteria Subjektif Kualitas Pengelompokkan Berdasarkan Silhouette Coeficient SC
Nilai SC Interpretasi Oleh Kauffman
0,72 – 1,00
Strong Classification 0,51-0,70
Good Classification 0,26-0,50
Weak Classification 0-0,25
Bad Classification PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
BAB III
METODOLOGI PENELITIAN 3.1.
Sumber Data
Data yang digunakan pada penelitian ini didapat dari situs http:litbang.kemdikbud.go.idindex.phpun untuk data tahun ajaran 20142015.
Data yang didapatkan berekstensi .xls dan berisikan nilai SMA dari jurusan IPA dan IPS.
3.1.1. Data yang digunakan
Data yang digunakan merupakan data nilai siswa program IPA dan IPS. Untuk program studi IPA terdiri dari mata pelajaran Bahasa Indonesia, Bahasa
Inggris, Matematika, Biologi, Fisika dan Kimia. Sedangkan untuk program studi IPS terdiri dari mata pelajaran Bahasa Indonesia, Bahasa Inggris, Matematika,
Ekonomi, Sosiologi, dan Geografi. Salah satu contoh data yang digunakan berisi data seperti yang terdapat dalam tabel 3.1 sampai dengan tabel 3.4.
Tabel 3. 1Table Atribut Data Mentah Nilai Hasil Ujian Nasional Program IPA
20142015
Nama Atribut Keterangan
Kode Sek. Kode Sekolah
NAMA SEKOLAH Nama Sekolah
Sts Sek. Status SekolahSwastaNegeri
Jm. Pes Jumlah Peserta
BIN Ujian Nasional Bahasa Indonesia
ING Ujian Nasional Bahasa Ingris
MAT Ujian Nasional Matematika
FIS Ujian Nasional Fisika
KIM Ujian Nasional Kimia
BIO Ujian Nasional Biologi
TOT Total Nilai Ujian
Tabel 3. 2 Table Atribut Data Mentah Nilai Hasil Ujian Nasional Program IPS 20142015
Nama Atribut Keterangan
Kode Sek. Kode Sekolah
NAMA SEKOLAH Nama Sekolah
Sts Sek. Status SekolahSwastaNegeri
Jm. Pes Jumlah Peserta
BIN Ujian Nasional Bahasa Indonesia
ING Ujian Nasional Bahasa Ingris
MAT Ujian Nasional Matematika
EKO Ujian Nasional Ekonomi
SOS Ujian Nasional Sosiologi
GEO Ujian Nasional Geografi
TOT Total Nilai Ujian
3.2. Spesifikasi Alat
Sistem dibuat dengan menggunakan hardware dan software sebagai berikut:
3.2.1. Spesifikasi Hardware
a. Proses Intel Pentium Core i5 2.40GHz
b. RAM 2.00 GB
3.2.2. Spesifikasi Software
a. Sistem Operasi Microsoft Windows 7
b. Compiler IDE NetBeans 7.2
Software ini akan digunakan untuk membuat interface dan sekaligus untuk membuat source code.
3.3. Tahap-Tahap Penelitian
3.3.1. Studi Kasus
Nilai Ujian Nasional merupakan tolak ukur atau parameter akhir dari proses pembelajaran di suatu tingkat pendidikan di suatu daerah. Dari nilai Ujian
Nasional tersebut dapat digunakan untuk pemetaan kualitas pendidikan. Untuk PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
mengevaluasi nilai ujian nasional agar dapat terlihat pemetaannya dapat menggunakan nilai dari mata pelajaran yang diujikan pada program IPA maupun
IPS. Dengan penelitian ini diharapkan dapat menemukan suatu pengelompokan sekolah yang telah menjalankan Ujian Nasional untuk mengetahui keberhasilan
dari Ujian Nasional.
3.3.2. Penelitian Pustaka
Pada tahap ini, dilakukan penelitian pustaka untuk memperoleh informasi dan menggali teori-teori tentang teknik data mining. Dalam penelitian ini penulis
mempelajari literatur yang berkaitan dengan teknik data mining asosiasi khususnya algoritma K-Means dan literatur lainnya yang berguna bagi sistem
yang akan dibangun.
3.3.3. Knowledge Discovery in Database KDD
Dalam melakukan proses mengubah data mentah menjadi suatu informasi yang bermanfaat, penulis menggunakan proses Knowledge Discovery in Database
KDD yang terdiri dari pembersihan data, integrasi data, seleksi data, transformasi data, penambangan data, evaluasi pola, dan presentasi pengetahuan.
Pada tahap pembersihan data dan integrasi data, penulis melakukan secara manual dengan menggunakan aplikasi microsoft excel. Tahap selanjutnya yaitu
seleksi data, transformasi data, dan penambangan data, penulis mengembangkan perangkat lunak sebagai alat bantu untuk melakukan tahap-tahap tersebut.
Sedangkan untuk tahap evaluasi pola dan presentasi pengetahuan, penulis melakukan evaluasi dari hasil penambangan data yang didapat dari perangkat
lunak yang telah dibangun dan menjelaskan hasil evaluasi tersebut agar informasi yang didapat dapat diterima oleh pihak-pihak yang membutuhkan.
3.3.4. Pengembangan Perangkat Lunak
Pada tahap seleksi data, transformasi data, dan penambangan data di dalam proses Knowledge Discovery in Database KDD, penulis mengembangkan
perangkat lunak sebagai alat untuk mengolah Dataset yang penulis miliki untuk mendapatkan informasi yang berguna.
Metode yang digunakan oleh penulis dan pengembang sistem adalah metode waterfall. Metode ini merupakan metode yang paling sering digunakan
oleh para pengembang perangkat lunak. Metode ini menggunakan sistem linier yaitu apa yang dilakukan pada tahap sebelumnya akan mempengaruhi tahap
selanjutnya. Metode waterfall mempunyai langkah-langkah sebagai berikut:
1. Analisa
Pada langkah ini analisa terhadap kebutuhan sistem. Pengumpulan data dalam tahap ini bisa dilakukan melalui sebuah
penelitian, wawancara atau studi literatur. Seorang sistem analis bertugas dalam mencari informasi sebanyak mungkin dari user
sehingga sistem yang dibuat dapat sesuai dengan kebutuhan user. Pada tahapan ini menghasilkan dokumen user requirement yang dapat
digunakan sistem analis untuk menerjemahkan ke dalam bahasa pemrograman.
2. Desain
Pada proses desain akan menerjemahkan syarat kebutuhan ke sebuah perancangan perangkat lunak yang dapat dapat diperkirakan
sebelum diubah ke dalam bahasa pemrograman. Fokus dari proses ini pada struktur data, arsitektur perangkat lunak, representasi interface,
dan detail algoritma. Tahapan ini akan menghasilkan dokumen yang disebut software requirement. Dokumen ini yang digunakan seorang
programmer untuk membangun sistemnya. 3.
Pemrograman Pemrograman merupakan penerjemahan design ke dalam bahasa
pemrograman. Pada tahap ini programmer akan mengubah proses transaksi yang diinginkan user ke dalam sistem yang dibangun.
4. Pengujian Perangkat Lunak
Pada tahap pengujian perangkat lunak dilakukan setelah pemrograman
selesai. Pengujian
yang digunakan
adalah membandingkan perhitungan manual dengan hasil yang diperoleh dari
perangkat lunak. Tujuan pengujian ini adalah untuk menemukan PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
kesalahan – kesalahan yang terdapat pada perangkat lunak tersebut
agar kemudian dapat diperbaiki.
3.3.5. Analisis dan Pembuatan Laporan
Analisis yang akan dilakukan adalah analisis kinerja dari alat uji yang dibuat menggunakan algoritma K-Means, dan hasil analisis tersebut nantinya akan
diolah kedalam
sebuah laporan
tugas akhir.
27
BAB IV
PEMROSESAN AWAL DAN PERANCANGAN PERANGKAT LUNAK PENAMBANGAN DATA
4.1. PEMROSESAN AWAL
4.1.1. Pembersihan Data Data Cleaning
Sebelum proses data mining dapat dilakukan, perlu proses cleaning pada data yang menjadi fokus. Pemrosesan pendahuluan dan pembersihan data
merupakan operasi dasar seperti penghapusan noise dilakukan. Pada penelitian ini ada beberapa sekolah yang tidak ada nilainya maka peneliti menghapus sekolah
yang tidak ada nilai hasil ujian.
4.1.2. Itegrasi Data Data Integration
Tahap ini berisikan penggabungan data dari bermacam-macam sumber. Peneliti menggunakan 2 data terdiri dari data nilai ujian nasional 20142015
jurusan IPA dan IPS. Peneliti tidak menggunakan tahap ini dikarenakan data berasal dari sumber yang sama sehingga tidak perlu melakukan proses integrasi
data karena range nilai yang digunakan juga sudah sama.
4.1.3. Seleksi Data Data Selection
Pemilihan seleksi data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Seleksi data merupakan
proses menganalisis data yang relevan dari dalam database. Atribut yang tidak digunakan pada data ujian nasional jurusan IPA dan IPS
di DIY tahun 20142015 dijelaskan tabel 4.1. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 4. 1 Atribut yang tidak digunakan pada data Ujian Nasional 2015
Tahun Atribut
2015 No.
Kode Sek. Sts Sek.
Jumlah Peserta TOT
RANK
Atribut pada tabel tabel 4.5 tidak digunakan sebab atribut dalam tabel-tabel tersebut hanya atribut pendukung yang tidak digunakan dalam proses clustering.
Proses clustering membutuhkan atribut nama sekolah dan mata pelajaran. Hasil dari seleksi atribut pada data nilai ujian nasional IPA dan IPS di
Daerah Istimewa Yogyakarta tahun ajaran 20142015 dijelaskan pada tabel 4.2 dan 4.3.
Tabel 4. 2 Tabel Atribut Terseleksi Data Nilai Ujian Nasional Program Strudi IPA di Daerah Istimewa Yogyakarta Tahun ajaran 20142015
Nama Atribut Keterangan
NAMA SEKOLAH Nama Sekolah
BIN Ujian Nasional Bahasa Indonesia
ING Ujian Nasional Bahasa Ingris
MTK Ujian Nasional Matematika
FSK Ujian Nasional Fisika
KMA Ujian Nasional Kimia
BIO Ujian Nasional Biologi