Contoh Deteksi Outlier dengan Algoritma INFLO

6. Memberikan Kesimpulan Jika hasil INFLO dari suatu obyek jauh melebihi 1, maka obyek tersebut termasuk outlier. Namun jika hasil INFLO dari suatu obyek mendekati 1, maka obyek tersebut hanya merupakan anggota suatu cluster.

2.3.2. Contoh Deteksi Outlier dengan Algoritma INFLO

Contoh mendeteksi outlier menggunakan algoritma Influenced Outlierness INFLO dalam sebuah himpunan D yang memiliki 5 obyek, yaitu p1, p2, p3, p4, dan p5. Dari keempat obyek tersebut ditentukan nilai k jumlah tetangga adalah 2. 1. Nilai masing-masing obyek p1 9,5 p2 8,85 p3 9,35 p4 8,45 p5 7,95 2. Jarak antar obyek p1 p2 p3 p4 p5 p1 8,05823 11,6939 14,9646 17,3998 p2 8,05823 8,03197 11,6929 14,9277 p3 11,6939 8,03197 8,01639 11,6861 p4 14,9646 11,6929 8,01639 7,96571 p5 17,3998 14,9277 11,6861 7,96571 Setelah dijabarkan : p1 p2 p3 p4 p5 p1 p1 8,05823 p1 11,6939 p1 14,9646 p1 17,3998 p2 8,05823 p2 p2 8,03197 p2 11,6929 p2 14,9277 p3 11,6939 p3 8,03197 p3 p3 8,01639 p3 11,6861 p4 14,9646 p4 11,6929 p4 8,01639 p4 p4 7,96571 p5 17,3998 p5 14,9277 p5 11,6861 p5 7,96571 p5 Setelah diurutkan : p1 p2 p3 p4 p5 p1 p2 p3 p4 p5 p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571 p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861 p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277 p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998 3. Mencari � p1 p2 p3 p4 p5 p1 p2 p3 p4 p5 p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571 p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861 p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277 p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998 � = 2 tetangga terdekat dari masing-masing obyek. � = {p2, p3} � = {p3, p1} � = {p4, p2} � = {p5, p3} � = {p4, p3} 4. Mencari Influence Space IS Sebelum mencari � � , karena � � = � ∪ � , terlebih dahulu mencari � , seperti berikut : p1 p2 p3 p4 p5 p1 p2 p3 p4 p5 p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571 p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861 p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277 p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998 � = {p2} � = {p3, p1} � = {p4, p2} � = {p5, p3} � = {p4} Lalu hasil Influence Space IS menjadi seperti berikut : p1 p2 p3 p4 p5 p1 p2 p3 p4 p5 p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571 p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861 p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277 p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998 5. Menghitung k-distance � �� = nilai terbesar maksimal dari tetangga terdekat dari masing- masing obyek. � �� = 11,6939 � �� = 8,05823 � �� = 8,03197 � �� = 8,01639 � �� = 11,6861 6. Menghitung Local Density � = 1 11,6939 = 0,08551 � = 1 8,05823 = 0,1241 � = 1 8,03197 = 0,1245 � = 1 8,01639 = 0,12474 � = 1 11,6861 = 0,08557 7. Menghitung Influenced Outlierness INFLO � �� � = , + , , = 1,45355 � �� � = , + , , = 0,84618 � �� � = , + , , = 0,99934 � �� � = , + , , = 0,84202 � �� � = , + , , = 1,45636 8. Memberikan Kesimpulan Hasil INFLO dari masing-masing obyek, terlihat bahwa hasil INFLO tersebesar adalah milik obyek p1 dan p5 dengan hasilnya masing- masing 1,45355 dan 1,45636. Maka dari itu, obyek p1 dan p5 yang terdeteksi sebagai outlier. Obyek p1 terdeteksi karena nilainya adalah 9,5 yang dimana nilai tersebut adalah nilai tertinggi dari semua obyek, sedangkan obyek p5 terdeteksi karena nilainya adalah 7,95 yang dimana nilai tersebut adalah nilai terendah dari semua obyek. 27

3. BAB III

METODOLOGI PENELITIAN

3.1. SUMBER DATA

Data yang digunakan untuk penelitian berupa file yang memiliki ekstensi .xls yang diperoleh dari 2 sumber. Sumber yang pertama adalah Seksi Data dan Teknologi Informasi Dinas Pendidikan, Pemuda, dan Olah Raga DIKPORA Provinsi Daerah Istimewa Yogyakarta DIY. Lalu sumber yang kedua adalah dari website e-Reporting Ujian Nasional milik Pusat Penilaian Pendidikan http:118.98.234.22sekretariathasilunindex.phphasilun . Data sumber merupakan data nilai Ujian Nasional UN, Nilai Sekolah NS, dan Nilai Akhir NA dari tahun 2011 – 2014. Pada penelitian ini hanya untuk SMA jurusan Ilmu Pengetahuan Alam IPA dan Ilmu Pengetahuan Sosial IPS. Table 3.1 Tabel Atribut Data Nama Atribut Keterangan RANKING Urutan Ranking NAMA_SEKOLAH Nama Sekolah JENIS_SEKOLAH Jenis Sekolah SMA MA STATUS_SEKOLAH Status Sekolah Swasta Negeri Jumlah PESERTA Jumlah Peserta L Jumlah Peserta yang Lulus L Persentase Peserta yang Lulus TL Jumlah Peserta yang Tidak Lulus TL Persentase Peserta yang Tidak Lulus

Dokumen yang terkait

PEMBANGUNAN SISTEM INFORMASI NILAI UNTUK SEKOLAH MENENGAH ATAS BERBASIS WEB PEMBANGUNAN SISTEM INFORMASI NILAI UNTUK SEKOLAH MENENGAH ATAS BERBASIS WEB.

0 2 12

Implementasi algoritma Partitioning Around Medoids (PAM) untuk pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya serap Ujian Nasional.

0 0 2

Pengelompokan Sekolah Menengah Atas di Provinsi Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan algoritma K-Means Clustering.

1 1 87

Pengelompokan Sekolah Menengah Atas di Provinsi Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan algoritma agglomerative hierarchical clustering.

11 55 123

Implementasi algoritma fuzzy c-means untuk pengelompokan sekolah menengah atas di diy berdasarkan nilai ujian nasional dan nilai sekolah.

2 16 145

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor : studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma.

0 4 252

Penerapan metode enhanced class outlier distance based untuk identifikasi outlier pada data hasil ujian nasional, indeks integritas dan akreditasi sekolah menengah atas

1 6 143

Implementasi algoritma Partitioning Around Medoids (PAM) untuk pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya serap Ujian Nasional

7 43 133

Pemahaman Nilai-Nilai Kewirausahaan Dalam Menulis Naskah Drama Untuk Sekolah Menengah Atas (SMA) Dengan Menggunakan Model Peralihan Konsep

0 4 8

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

0 0 6