Struktur Data LANDASAN TEORI
21 integritas. Atribut dari data akreditasi dapat dilihat pada tabel
3.3. Atribut dari data hasil ujian nasional dapat dilihat pada tabel 3.1. Atribut dari data nilai indeks integritas dapat dilihat pada
tabel 3.2. Pada tahap ini menggabungkan 3 file tersebut. c.
Data Selection
Proses memilih data atau atribut yang relevan untuk penelitian ini. Pada proses ini memilih atribut yang relevan untuk
digunakan pada penelitian ini dan menghapus atribut yang tidak digunakan. Atribut yang digunakan pada penelitian ini yaitu :
Tabel 3. 4 Tabel Atribut Terpilih Nama Atribut
Keterangan Jenis
Atribut
Bahasa Indonesia Nilai Bahasa Indonesia Numerik
Bahasa Inggris Nilai Bahasa Inggris
Numerik Matematika
Nilai Matematika Numerik
FisikaEkonomi Nilai FisikaEkonomi
Numerik KimiaSosiologi
Nilai KimiaSosiologi Numerik
BiologiGeografi Nilai BiologiGeografi
Numerik IIUN 2015
Indeks Integritas Ujian Nasional
Numerik
Peringkat Peringkat Akreditasi
Class Label
Tabel 3.5 Tabel Contoh Data
Kode Sekolah
Bahasa Indonesia
Bahasa Inggris
Matematika Fisika Kimia Biologi IIUN Akreditasi 02-021
78.69 67
55.86 74.1
51.1 67.05
74.14 A 02-029
83.31 66.62
57.92 62.19
59.1 63.31
79.29 A 02-002
87.29 75.76
65.63 75.57
75.95 73.08
91.92 A 04-069
80.06 61.44
46.71 64.49
44.94 66.31
74.52 A 04-002
86.12 71.52
65.22 72.56
74.53 70.57
92.4 A 02-049
76.42 54.54
34.85 39.52
44.47 46.16
80.8 A 03-024
71.67 55.56
52.87 70.28
41.07 70.95
67.66 A 04-025
81.38 61.44
45.77 61.72
53.83 62.58
79.31 A
22 04-023
86.7 68.67
67.15 71.26
73.52 70.78
92.82 A 03-016
74.68 49.68
41.38 37.45
45.81 58.45
75.62 A d.
Data Transformation
Proses dimana data diubah dan dikonsolidasikan ke dalam bentuk yang sesuai untuk ditambang. Pada penelitian ini set data
yang digunakan memiliki skala data yang sama antar atribut yaitu antara 1-100.
Class label
tidak digunakan dalam perhitungan jarak sehingga tidak perlu diubah menjadi numerik.
Pada penelitian ini tidak dilakukan tahap transformasi karena data yang digunakan memiliki atribut dengan skala yang sama
dan tidak perlu diubah dalam bentuk numerik. e.
Data Mining
Proses menerapkan metode yang digunakan untuk menemukan pola pada data yaitu algoritma
Enhance Class Outlier Distance Based
. f.
Pattern Evaluation
Proses mengidentifikasi pola-pola yang benar-benar menarik yang merupakan hasil dari penambangan data. Pada tahap ini
hasil dari identifikasi
outlier
akan dievaluasi dengan hipotesa yang telah dibentuk sebelumnya.
g.
Knowledge Presentation
Proses menyajikan pengetahuan dari hasil penambangan data kepada pengguna. Pada tahap ini hasil dari identifikasi
outlier
akan ditampilkan dengan bentuk yang mudah dimengerti oleh pengguna atau pihak yang berkepentingan. Pada tahap ini akan
dilakukan pembuatan aplikasi komputer berbasis dekstop dengan bahasa pemrograman Java.