nilai NA. Selain itu, nantinya diharapkan dari hasil outlier yang didapatkan, akan dapat menganalisa lebih lanjut pemasalahan UN yang terjadi di
Indonesia.
1.2. Rumusan Masalah
Rumusan masalah pada penelitian ini adalah sebagai berikut : 1.
Bagaimana mendeteksi outlier data rata-rata nilai ujian nasional, nilai ujian sekolah, dan nilai akhir dari Sekolah Menengah Atas SMA yang
ada di Provinsi Daerah Istimewa Yogyakarta DIY dengan menggunakan algoritma Influenced Outlierness INFLO?
2. Apakah algoritma Influenced Outlierness INFLO dapat mendeteksi
outlier data rata – rata nilai ujian nasional, nilai ujian sekolah, dan nilai
akhir dari Sekolah Menengah Atas SMA yang ada di Provinsi Daerah Istimewa Yogyakarta DIY?
1.3. Batasan Masalah
Batasan masalah pada penelitian ini adalah sebagai berikut : 1.
Algoritma deteksi outlier yang digunakan adalah Influenced Outlierness INFLO.
2. Data yang digunakan adalah data nilai ujian nasional, nilai ujian
sekolah, dan nilai akhir untuk tahun ajaran 2011-2014. 3.
Sekolah yang diteliti adalah Sekolah Menengah Atas SMA jurusan IPA dan IPS di Provinsi Daerah Istimewa Yogyakarta DIY.
1.4. Tujuan Penelitian
Tujuan dari penelitian ini adalah sebagai berikut : 1.
Mendeteksi outlier data rata – rata nilai ujian nasional, nilai ujian sekolah, dan nilai akhir dari Sekolah Menengah Atas SMA yang ada
di Provinsi Daerah Istimewa Yogyakarta DIY dengan menggunakan algoritma Influenced Outlierness INFLO.
2. Menganalisa kemampuan algoritma Influenced Outlierness INFLO
dalam mendeteksi outlier dari data rata – rata nilai ujian nasional, nilai
ujian sekolah, dan nilai akhir dari Sekolah Menengah Atas SMA yang ada di Provinsi Daerah Istimewa Yogyakarta DIY.
1.5. Manfaat Penelitian
Manfaat dari penelitian ini adalah sebagai berikut : 1.
Memberikan pengetahuan baru mengenai cara mendeteksi outlier dengan menggunakan algoritma Influenced Outlierness INFLO.
2. Memberikan informasi mengenai anomali data yang ada dalam nilai –
nilai ujian Sekolah Menengah Atas SMA.
1.6. Metodologi Penelitian
Metodologi penelitian yang digunakan dalam menyelesaikan tugas akhir ini adalah sebagai berikut :
1. Studi Pustaka
Metodologi pertama yang digunakan adalah studi pustaka. Tahap ini merupakan proses mengumpulkan informasi berupa algoritma
yang digunakan untuk mendeteksi outlier dari berbagai macam referensi yang tersedia buku, karya ilmiah, ataupun artikel lainnya yang banyak
terdapat pada internet. Selanjutnya adalah mempelajari dan menganalisa dari informasi yang didapat sehingga menentukan untuk
memilih algoritma Influenced Outlierness untuk penelitian deteksi outlier pada nilai ujian siswa Sekolah Menengah Atas.
2. Metode Knowledge Discovery in Database KDD
Metodologi kedua ini adalah teknik penambangan data yang dituliskan oleh Jiawei Han, Micheline Kamber, dan Jian Pei pada
bukunya Data Mining : Concepts and Techniques. Teknik KDD mencakup beberapa proses, yaitu :
a. Data Cleaning
Tahap ini merupakan proses dimana data yang tidak dibutuhkan pengganggu noise dan data yang tidak
konsisten akan dihapus. b.
Data Integration Tahap ini merupakan proses dimana bermacam-
macam data dari berbagai sumber akan digabungkan menjadi satu kesatuan.
c. Data Selection
Tahap ini merupakan proses dimana untuk melakukan analisis, data relevan akan diperoleh dari
database. d.
Data Transformation Tahap ini merupakan proses dimana data diubah
transformasi atau digabungkan sehingga menjadi tepat untuk ditambang dengan misalnya melakukan operasi
penjumlahan atau penggabungan. e.
Data Mining Tahap ini merupakan proses pokok dimana metode
cerdas dilaksanakan untuk menggali pola dari data. f.
Pattern Evaluation Tahap ini merupakan proses indentifikasi pola yang
sungguh menarik menampilkan basis pengetahuan dalam suatu ukuran ketertarikan.
g. Knowledge Presentation
Tahap ini merupakan proses dimana teknik menampilkan suatu gambaran dan pengetahuan digunakan
untuk menampilkan hasil tambang dari pengetahuan kepada pengguna.
3. Analisis dan Evaluasi
Metode ketiga ini adalah melakukan analisis dalam menentukan hasil yang outlier dengan menggunakan algoritma Influenced
Outlierness INFLO dari data-data yang dipergunakan. Data yang terdeteksi sebagai outlier adalah yang memiliki hasil INFLO menjauhi
angka “1”. Setelah itu akan dilakukan evaluasi dari hasil analisa yang
didapat, yaitu informasi baru mengenai hasil sekolah-sekolah yang terdeteksi sebagai outlier dari provinsi tertentu. Hasil evaluasi dapat
dijadikan permulaan untuk perbaikan dari sekolah yang terdeteksi outlier tersebut.
1.7. Sistematika Penulisan