4
1.2 Rumusan Masalah
Rumusan masalah pada penelitian ini adalah sebagai berikut: 1.
Apakah algoritma MixCBLOF dapat mendeteksi
outlier
data pada nilai ujian nasional, nilai indeks integritas, dan nilai akreditasi Sekolah
Menengah Atas SMA yang ada di Provinsi Daerah Istimewa Yogyakarta DIY?
2. Bagaimana karakteristik data-data atau sekolah yang diidentifikasi sebagai
outlier
?
1.3 Tujuan
Tujuan dari penelitian ini adalah sebagai berikut: 1.
Menganalisa algoritma MixCBLOF dalam mendeteksi
outlier
data pada nilai ujian nasional, nilai indeks integritas, dan nilai akreditasi Sekolah
Menegah Atas SMA Provinsi Daerah Istimewa Yogyakarta DIY. 2.
Menganalisa karakteristik data-data atau sekolah yang diidentifikasi sebagai
outlier
.
1.4 Batasan Masalah
Batasan masalah pada penelitian ini sebagai berikut: 1.
Algoritma yang digunakan yaitu algoritma MixCBLOF Mix Cluster Based Local
Outlier
Factor. 2.
Data yang digunakan yaitu nilai Ujian Nasional, nilai Indeks Integritas, dan nilai Akreditasi selutuh Sekolah Menengah Atas SMA di Provinsi
Daerah Istimewa Yogyakarta DIY pada tahun ajaran 20142015 yang didapatkan dari website resmi Kemendikbud.
5
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah sebagai berikut : 1.
Memberikan pengetahuan baru mengenai cara mendeteksi
outlier
dengan menggunakan algoritma
Mix Cluster Based Local Outlier Factor
MixCBLOF. 2.
Memberikan informasi mengenai data yang unik dalam nilai hasil Ujian Nasional, Indeks Integritas Ujian Nasional, dan Akreditasi Sekolah
Menengah Atas SMA.
1.6 Metodologi Penelitian
Metodologi Penelitian yang digunakan dalam menyelesaikan tugas akhir ini adalah sebagai berikut :
1. Studi Pustaka
Metodologi pertama yang digunakan adalah studi pustaka. Tahap ini merupakan proses pengumpulan informasi berupa metode atau
algoritma yang digunakan untuk mendeteksi
outlier
dari berbagai referensi seperti buku, paper jurnal, skripsi, atau artikel-artikel lainnya yang ada di
internet. Selanjutnya yaitu mempelajari dan menganalisa dari informasi yang didapat sehingga menentukan untuk memilih algoritma MixCBLOF
Mix Cluster Based Local Outlier Factor
untuk melakukan penelitian deteksi
outlier
pada data Ujian Nasional Sekolah Menengah Atas SMA.
2. Teknik
Knowledge Discovery in Databases KDD
. Metodologi kedua adalah teknik penambangan data yang dituliskan
oleh Han et.al. 2012. Teknik KDD memiliki beberapa langkah, yaitu :
a. Data Cleaning
Langkah ini merupakan langkah untuk menghilangkan
noise
pengganggu dan data yang tidak konsisten.
b. Data Integration
Langkah ini merupakan suatu proses dimana beberapa sumber data digabungkan menjadi satu kesatuan.
6 c.
Data Selection
Langkah ini merupakan proses untuk melakukan analisis, dimana data yang relevan diambil dari
database
.
d. Data Transformation
Langkah ini merupakan proses dimana data diubah transformasi menjadi data yang tepat untuk ditambang sehingga dapat dilakukan
proses operasi seperti penjumlahan atau penggabungan.
e. Data Mining
Langkah ini merupakan proses penting di mana metode cerdas yang diterapkan untuk mengekstrak pola data.
f. Pattern Evaluation
Langkah ini merupakan proses untuk mengidentifikasi pola-pola menarik yang menampilkan basis pengetahuan dalam suatu ukuran
ketertarikan.
g. Knowledge Presentation
Langkah ini merupakan proses dimana teknik untuk menampilkan suatu gambaran dan representasi pengetahuan hasil tambang kepada
pengguna.
1.7 Sistematika Penulisan