4
1.2 Rumusan Masalah
Rumusan masalah pada penelitian ini adalah sebagai berikut: 1.
Apakah algoritma MixCBLOF dapat mendeteksi outlier data pada nilai ujian nasional, nilai indeks integritas, dan nilai akreditasi Sekolah
Menengah Atas SMA yang ada di Provinsi Daerah Istimewa Yogyakarta DIY?
2. Bagaimana karakteristik data-data atau sekolah yang diidentifikasi sebagai
outlier?
1.3 Tujuan
Tujuan dari penelitian ini adalah sebagai berikut: 1.
Menganalisa algoritma MixCBLOF dalam mendeteksi outlier data pada nilai ujian nasional, nilai indeks integritas, dan nilai akreditasi Sekolah
Menegah Atas SMA Provinsi Daerah Istimewa Yogyakarta DIY. 2.
Menganalisa karakteristik data-data atau sekolah yang diidentifikasi sebagai outlier.
1.4 Batasan Masalah
Batasan masalah pada penelitian ini sebagai berikut: 1.
Algoritma yang digunakan yaitu algoritma MixCBLOF Mix Cluster Based Local Outlier Factor.
2. Data yang digunakan yaitu nilai Ujian Nasional, nilai Indeks Integritas,
dan nilai Akreditasi selutuh Sekolah Menengah Atas SMA di Provinsi Daerah Istimewa Yogyakarta DIY pada tahun ajaran 20142015 yang
didapatkan dari website resmi Kemendikbud. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah sebagai berikut : 1.
Memberikan pengetahuan baru mengenai cara mendeteksi outlier dengan menggunakan algoritma Mix Cluster Based Local Outlier Factor
MixCBLOF. 2.
Memberikan informasi mengenai data yang unik dalam nilai hasil Ujian Nasional, Indeks Integritas Ujian Nasional, dan Akreditasi Sekolah
Menengah Atas SMA.
1.6 Metodologi Penelitian
Metodologi Penelitian yang digunakan dalam menyelesaikan tugas akhir ini adalah sebagai berikut :
1. Studi Pustaka
Metodologi pertama yang digunakan adalah studi pustaka. Tahap ini merupakan proses pengumpulan informasi berupa metode atau
algoritma yang digunakan untuk mendeteksi outlier dari berbagai referensi seperti buku, paper jurnal, skripsi, atau artikel-artikel lainnya yang ada di
internet. Selanjutnya yaitu mempelajari dan menganalisa dari informasi yang didapat sehingga menentukan untuk memilih algoritma MixCBLOF
Mix Cluster Based Local Outlier Factor untuk melakukan penelitian deteksi outlier pada data Ujian Nasional Sekolah Menengah Atas SMA.
2. Teknik Knowledge Discovery in Databases KDD.
Metodologi kedua adalah teknik penambangan data yang dituliskan oleh Han et.al. 2012. Teknik KDD memiliki beberapa langkah, yaitu :
a. Data Cleaning
Langkah ini merupakan langkah untuk menghilangkan noise pengganggu dan data yang tidak konsisten.
b. Data Integration
Langkah ini merupakan suatu proses dimana beberapa sumber data digabungkan menjadi satu kesatuan.
6
c. Data Selection
Langkah ini merupakan proses untuk melakukan analisis, dimana data yang relevan diambil dari database.
d. Data Transformation
Langkah ini merupakan proses dimana data diubah transformasi menjadi data yang tepat untuk ditambang sehingga dapat dilakukan
proses operasi seperti penjumlahan atau penggabungan. e.
Data Mining Langkah ini merupakan proses penting di mana metode cerdas yang
diterapkan untuk mengekstrak pola data. f.
Pattern Evaluation Langkah ini merupakan proses untuk mengidentifikasi pola-pola
menarik yang menampilkan basis pengetahuan dalam suatu ukuran ketertarikan.
g. Knowledge Presentation
Langkah ini merupakan proses dimana teknik untuk menampilkan suatu gambaran dan representasi pengetahuan hasil tambang kepada
pengguna.
1.7 Sistematika Penulisan