6. Memberikan Kesimpulan
Jika hasil INFLO dari suatu obyek jauh melebihi 1, maka obyek tersebut termasuk outlier. Namun jika hasil INFLO dari suatu
obyek mendekati 1, maka obyek tersebut hanya merupakan anggota suatu cluster.
2.3.2. Contoh Deteksi Outlier dengan Algoritma INFLO
Contoh mendeteksi outlier menggunakan algoritma Influenced Outlierness INFLO dalam sebuah himpunan D yang
memiliki 5 obyek, yaitu p1, p2, p3, p4, dan p5. Dari keempat obyek tersebut ditentukan nilai k jumlah tetangga adalah 2.
1. Nilai masing-masing obyek
p1
9,5
p2 8,85
p3
9,35
p4 8,45
p5 7,95
2. Jarak antar obyek
p1 p2
p3 p4
p5 p1
8,05823 11,6939 14,9646 17,3998
p2 8,05823
8,03197 11,6929 14,9277
p3 11,6939 8,03197
8,01639 11,6861
p4 14,9646 11,6929 8,01639
7,96571
p5
17,3998 14,9277 11,6861 7,96571
Setelah dijabarkan :
p1 p2
p3 p4
p5 p1
p1 8,05823 p1 11,6939 p1 14,9646 p1 17,3998 p2 8,05823 p2
p2 8,03197 p2 11,6929 p2 14,9277 p3 11,6939 p3 8,03197 p3
p3 8,01639 p3 11,6861 p4 14,9646 p4 11,6929 p4 8,01639 p4
p4 7,96571 p5 17,3998 p5 14,9277 p5 11,6861 p5 7,96571 p5
Setelah diurutkan :
p1 p2
p3 p4
p5 p1
p2 p3
p4 p5
p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571 p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861
p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277 p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998
3. Mencari
�
p1 p2
p3 p4
p5 p1
p2 p3
p4 p5
p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571 p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861
p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277 p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998
�
= 2 tetangga terdekat dari masing-masing obyek.
�
= {p2, p3}
�
= {p3, p1}
�
= {p4, p2}
�
= {p5, p3}
�
= {p4, p3}
4. Mencari Influence Space IS
Sebelum mencari �
�
, karena �
�
=
�
∪
�
, terlebih dahulu mencari
�
, seperti berikut :
p1 p2
p3 p4
p5 p1
p2 p3
p4 p5
p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571
p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861
p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277
p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998
�
= {p2}
�
= {p3, p1}
�
= {p4, p2}
�
= {p5, p3}
�
= {p4}
Lalu hasil Influence Space IS menjadi seperti berikut :
p1 p2
p3 p4
p5 p1
p2 p3
p4 p5
p2 8,05823 p3 8,03197 p4 8,01639 p5 7,96571 p4 7,96571
p3 11,6939 p1 8,05823 p2 8,03197 p3 8,01639 p3 11,6861
p4 14,9646 p4 11,6929 p5 11,6861 p2 11,6929 p2 14,9277
p5 17,3998 p5 14,9277 p1 11,6939 p1 14,9646 p1 17,3998
5. Menghitung k-distance
�
��
= nilai terbesar maksimal dari tetangga terdekat dari masing- masing obyek.
�
��
= 11,6939 �
��
= 8,05823 �
��
= 8,03197 �
��
= 8,01639 �
��
= 11,6861
6. Menghitung Local Density
� = 1 11,6939 = 0,08551
� = 1 8,05823 = 0,1241
� = 1 8,03197 = 0,1245
� = 1 8,01639 = 0,12474
� = 1 11,6861 = 0,08557
7. Menghitung Influenced Outlierness INFLO
� ��
�
=
, + ,
,
= 1,45355 � ��
�
=
, + ,
,
= 0,84618 � ��
�
=
, + ,
,
= 0,99934 � ��
�
=
, + ,
,
= 0,84202 � ��
�
=
, + ,
,
= 1,45636
8. Memberikan Kesimpulan
Hasil INFLO dari masing-masing obyek, terlihat bahwa hasil INFLO tersebesar adalah milik obyek p1 dan p5 dengan hasilnya masing-
masing 1,45355 dan 1,45636. Maka dari itu, obyek p1 dan p5 yang
terdeteksi sebagai outlier. Obyek p1 terdeteksi karena nilainya adalah 9,5 yang dimana nilai tersebut adalah nilai tertinggi dari semua obyek,
sedangkan obyek p5 terdeteksi karena nilainya adalah 7,95 yang dimana nilai tersebut adalah nilai terendah dari semua obyek.
27
3. BAB III
METODOLOGI PENELITIAN
3.1. SUMBER DATA
Data yang digunakan untuk penelitian berupa file yang memiliki ekstensi .xls yang diperoleh dari 2 sumber. Sumber yang pertama adalah
Seksi Data dan Teknologi Informasi Dinas Pendidikan, Pemuda, dan Olah Raga DIKPORA Provinsi Daerah Istimewa Yogyakarta DIY. Lalu
sumber yang kedua adalah dari website e-Reporting Ujian Nasional milik Pusat
Penilaian Pendidikan
http:118.98.234.22sekretariathasilunindex.phphasilun .
Data sumber merupakan data nilai Ujian Nasional UN, Nilai Sekolah NS, dan Nilai Akhir NA dari tahun 2011
– 2014. Pada penelitian ini hanya untuk SMA jurusan Ilmu Pengetahuan Alam IPA dan Ilmu
Pengetahuan Sosial IPS.
Table 3.1 Tabel Atribut Data
Nama Atribut Keterangan
RANKING Urutan Ranking
NAMA_SEKOLAH
Nama Sekolah
JENIS_SEKOLAH
Jenis Sekolah SMA MA
STATUS_SEKOLAH Status Sekolah Swasta Negeri
Jumlah PESERTA
Jumlah Peserta
L
Jumlah Peserta yang Lulus
L
Persentase Peserta yang Lulus
TL Jumlah Peserta yang Tidak Lulus
TL Persentase Peserta yang Tidak Lulus