3.2.5. Data Mining
Tahap selanjutnya adalah melakukan penambangan data yang juga terdiri dari beberapa tahapan. Pada proses saat ini digunakan
aplikasi Microsoft Excel.
1. Menghitung Jarak Menggunakan Euclidean Distance
Tahap ini adalah menghitung jarak distance dari suatu obyek p dan q di suatu database D. Rumus menghitung jarak dp, q
dirumuskan seperti pada Rumus 2.1, yaitu :
, = √∑
�
−
� �
.................... 2.1
Berikut adalah contoh perhitungan jarak antar obyek BIN, BING, MTK, FSK, KMA, BIO :
Table 3.4 Tabel Jarak Antar Obyek
3 19
52 59
61 64
3 2.230560468 4.923819656 5.772139984 5.990417348 5.931053869
19
2.230560468 2.886381818 3.825441151 3.990501222 3.893558783
52 4.923819656 2.886381818
1.295685147 1.415521105 1.034021276
59
5.772139984 3.825441151 1.295685147 0.59186147
0.860116271
61 5.990417348 3.990501222 1.415521105
0.59186147 0.809382481
64
5.931053869 3.893558783 1.034021276 0.860116271 0.809382481
73 6.653593014 4.633670252 1.819093181
1.16965807 0.948683298 0.860639297
74
6.598371011 4.471923523 1.806682042 1.497297566 1.243462907 1.056267012
78 6.673424908 4.645277171 1.922082204
1.38477435 1.015824788 1.061602562
86
7.202645347 5.081761506 2.333302381 2.141191257 1.896786757 1.480844354
88 7.227959601 5.117069474 2.374699981 2.270682717
1.99155718 1.570222914
89
7.478322004 5.501772442 2.664939024 2.048780125 1.972916623 1.745307996
97 7.728745047 5.707512593 2.849122672
2.29658442 2.172464039 1.869197689
103
7.968588332 5.940824859 3.081103698 2.437457692 2.328282629 2.08719908
104
8.08233877 6.074635792 3.208644574 2.507468843 2.286853734 2.199136194
125 9.21180764
7.193622175 4.326176141 3.676492894 3.496355245 3.330555509
130
9.261414579 7.196596418 4.357751714 3.710606419 3.560210668 3.37372198
139 10.29342994 8.263237864 5.429742167 4.937296831 4.783764208 4.488685776
73 74
78 86
88 89
3
6.653593014 6.598371011 6.673424908 7.202645347 7.227959601 7.478322004
19 4.633670252 4.471923523 4.645277171 5.081761506 5.117069474 5.501772442
52
1.819093181 1.806682042 1.922082204 2.333302381 2.374699981 2.664939024
59 1.16965807
1.497297566 1.38477435
2.141191257 2.270682717 2.048780125
61
0.948683298 1.243462907 1.015824788 1.896786757 1.99155718
1.972916623
64 0.860639297 1.056267012 1.061602562 1.480844354 1.570222914 1.745307996
73
0.834026378 0.865621164 1.230772115 1.282770439 1.067426812
74 0.834026378
1.078007421 1.09945441
1.071587607 1.471393897
78
0.865621164 1.078007421 1.469387628
1.40648498 1.558043645
86 1.230772115
1.09945441 1.469387628
0.503487835 1.427094951
88
1.282770439 1.071587607 1.40648498
0.503487835 1.374881813
89 1.067426812 1.471393897 1.558043645 1.427094951 1.374881813
97
1.369890507 1.73781472
1.723571873 1.068456831 1.282692481 0.999699955
103 1.493619764 1.810938983 1.842118346 1.281288414 1.427795504
0.88391176
104
1.476787053 1.881249585 1.684280262 1.506817839 1.510099334 0.9226592
125 2.673854895 2.973835907 2.911940933 2.289432244 2.358686075 1.946458322
130
2.74457647 2.856588875
2.88925596 2.317433926 2.321723498 1.949179314
139 3.972908255 4.114948359 4.022623522 3.342274675 3.329129015 3.180597428
97 103
104 125
130 139
3
7.728745047 7.968588332 8.08233877
9.21180764 9.261414579 10.29342994
19 5.707512593 5.940824859 6.074635792 7.193622175 7.196596418 8.263237864
52
2.849122672 3.081103698 3.208644574 4.326176141 4.357751714 5.429742167
59 2.29658442
2.437457692 2.507468843 3.676492894 3.710606419 4.937296831
61
2.172464039 2.328282629 2.286853734 3.496355245 3.560210668 4.783764208
64 1.869197689
2.08719908 2.199136194 3.330555509
3.37372198 4.488685776
73
1.369890507 1.493619764 1.476787053 2.673854895 2.74457647
3.972908255
74 1.73781472
1.810938983 1.881249585 2.973835907 2.856588875 4.114948359
78
1.723571873 1.842118346 1.684280262 2.911940933 2.88925596
4.022623522
86 1.068456831 1.281288414 1.506817839 2.289432244 2.317433926 3.342274675
88
1.282692481 1.427795504 1.510099334 2.358686075 2.321723498 3.329129015
89 0.999699955
0.88391176 0.9226592
1.946458322 1.949179314 3.180597428
97
0.414125585 0.839464115 1.514958745 1.722411101 2.753870004
103 0.414125585
0.68571131 1.319166403 1.397998569 2.576800342
104
0.839464115 0.68571131
1.289340917 1.476550033 2.647319399
125
1.514958745 1.319166403 1.289340917 0.917932459 1.636734554
130 1.722411101 1.397998569 1.476550033 0.917932459
1.509668838
139
2.753870004 2.576800342 2.647319399 1.636734554 1.509668838
2. Menghitung K-Distance dan Mencari Nearest Neighbors NN
Tahap ini adalah menentukan tetangga terdekat NN dengan asumsi jumlah tetangga terdekat k = 7. Caranya adalah dengan
mengurutkan jarak masing-masing obyek ke obyek lainya dari nilai terkecil ke terbesar, lalu memilih 7 jarak terdekat, yaitu
yang mengandung nilai terkecil. Selanjutnya adalah menghitung k-distance dari masing-masing obyek tersebut dengan mencari
nilai maksimal dari keseluruhan nilai jarak obyek dengan ke-7 tetangga terdekatnya.
Berikut adalah tetangga terdekat NN masing-masing obyek dengan jarak antar obyeknya :
Table 3.5 Tabel NN dengan Jarak Antar Obyeknya
3 19
52 59
3 19
52 59
19
2.230560468
3
2.230560468
64
1.034021276
61
0.59186147
52
4.923819656
52
2.886381818
59
1.295685147
64
0.860116271
59
5.772139984
59
3.825441151
61
1.415521105
73
1.16965807
64
5.931053869
64
3.893558783
74
1.806682042
52
1.295685147
61
5.990417348
61
3.990501222
73
1.819093181
78
1.38477435
74
6.598371011
74
4.471923523
78
1.922082204
74
1.497297566
73
6.653593014
73
4.633670252
86
2.333302381
89
2.048780125
61 64
73 74
61 64
73 74
59
0.59186147
61
0.809382481
74
0.834026378
73
0.834026378
64
0.809382481
59
0.860116271
64
0.860639297
64
1.056267012
73
0.948683298
73
0.860639297
78
0.865621164
88
1.071587607
78
1.015824788
52
1.034021276
61
0.948683298
78
1.078007421
74
1.243462907
74
1.056267012
89
1.067426812
86
1.09945441
52
1.415521105
78
1.061602562
59
1.16965807
61
1.243462907
86
1.896786757
86
1.480844354
86
1.230772115
89
1.471393897
78 86
88 89
78 86
88 89
73
0.865621164
88
0.503487835
86
0.503487835
103
0.88391176
61
1.015824788
97
1.068456831
74
1.071587607
104
0.9226592
64
1.061602562
74
1.09945441
97
1.282692481
97
0.999699955
74
1.078007421
73
1.230772115
73
1.282770439
73
1.067426812
59
1.38477435
103
1.281288414
89
1.374881813
88
1.374881813
88
1.40648498
89
1.427094951
78
1.40648498
86
1.427094951
86
1.469387628
78
1.469387628
103
1.427795504
74
1.471393897
97 103
104 125
97 103
104 125
103
0.414125585
97
0.414125585
103
0.68571131
130
0.917932459
104
0.839464115
104
0.68571131
97
0.839464115
104
1.289340917
89
0.999699955
89
0.88391176
89
0.9226592
103
1.319166403
86
1.068456831
86
1.281288414
125
1.289340917
97
1.514958745
88
1.282692481
125
1.319166403
130
1.476550033
139
1.636734554
73
1.369890507
130
1.397998569
73
1.476787053
89
1.946458322
125
1.514958745
88
1.427795504
86
1.506817839
86
2.289432244
130 139
130 139
125
0.917932459
130
1.509668838
103
1.397998569
125
1.636734554
104
1.476550033
103
2.576800342
139
1.509668838
104
2.647319399
97
1.722411101
97
2.753870004
89
1.949179314
89
3.180597428
86
2.317433926
88
3.329129015
Berikut ini adalah ringkasan nilai k-distance obyek :
Table 3.6 Tabel K-Distance
K-Distance 3
6.653593014
19 4.633670252
52 2.333302381
59 2.048780125
61 1.896786757
64 1.480844354
73 1.230772115
74 1.471393897
78 1.469387628
86
1.469387628
88 1.427795504
89 1.471393897
97 1.514958745
103 1.427795504
104 1.506817839
125
2.289432244
130 2.317433926
139 3.329129015
3. Mencari Influence Space IS
Tahap ini adalah mencari hubungan tetangga simetris dari suatu obyek. IS merupakan gabungan dari NN Nearest Neighbors
dan RNN Reverse Nearest Neighbors. RNN merupakan inverse dari tetangga suatu obyek.
Berikut adalah NN dari masing-masing obyek :
Table 3.7 Tabel NN
NN 3
19 52
59 64
61 74
73 19
3 52
59 64
61 74
73 52
64 59
61 74
73 78
86 59
61 64
73 52
78 74
89 61
59 64
73 78
74 52
86 64
61 59
73 52
74 78
86 73
74 64
78 61
89 59
86 74
73 64
88 78
86 61
89 78
73 61
64 74
59 88
86 86
88 97
74 73
103 89
78 88
86 74
97 73
89 78
103 89
103 104
97 73
88 86
74 97
103 104
89 86
88 73
125 103
97 104
89 86
125 130
88 104
103 97
89 125
130 73
86 125
130 104
103 97
139 89
86 130
125 103
104 139
97 89
86 139
130 125
103 104
97 89
88
Berikut adalah RNN dari masing-masing obyek : Table 3.8 Table RNN
RNN 3
19 19
3 52
64 59
61 59
61 64
73 52
78 61
59 64
73 78
74 52
64 61
59 73
52 74
78 73
74 64
78 61
89 59
86 74
73 64
88 78
86 61
89 78
73 61
64 74
59 88
86 86
88 97
74 73
103 89
78 88
86 74
97 89
78 103
89 103
104 97
73 88
86 74
97 103
104 89
86 88
125 103
97 104
89 86
125 130
88 104
103 97
89 125
130 125
130 104
103 97
139 130
125 103
104 139
139 130
125
Sehingga menghasilkan IS dari masing-masing obyek adalah sebagai berikut :
Table 3.9 Tabel IS
IS 3
19 52
59 64
61 74
73 19
3 52
59 64
61 74
73 52
64 59
61 74
73 78
86 59
61 64
73 52
78 74
89 61
59 64
73 78
74 52
86 64
61 59
73 52
74 78
86 73
74 64
78 61
89 59
86 74
73 64
88 78
86 61
89 78
73 61
64 74
59 88
86 86
88 97
74 73
103 89
78 88
86 74
97 73
89 78
103 89
103 104
97 73
88 86
74 97
103 104
89 86
88 73
125 103
97 104
89 86
125 130
88 104
103 97
89 125
130 73
86 125
130 104
103 97
139 89
86 130
125 103
104 139
97 89
86 139
130 125
103 104
97 89
88
4. Menghitung Local Density
Cara perhitungan Local Density seperti pada Rumus 2.5 :
� =
�
�
...................... 2.5
Berikut adalah hasil local density dari semua obyek :
Table 3.10 Tabel Density
Density 3
0.150294735
19
0.215811645
52 0.428577114
59
0.488095325
61 0.527207392
64
0.675290416
73 0.812498096
74
0.679627666
78 0.680555615
86
0.680555615
88 0.70038041
89
0.679627666
97 0.660083981
103
0.70038041
104 0.663650226
125
0.436789515
130 0.431511763
139
0.300378866
Selanjutnya adalah menhitung rata-rata density dari masing- maisng obyek :
Table 3.11 Tabel Rata-rata Density Tiap Obyek
Density Density
Density Density
3
0.15029474
19
0.21581165
52
0.42857711
59
0.48809532
19
0.21581165
3
0.15029474
64
0.67529042
61
0.52720739
52
0.42857711
52
0.42857711
59
0.48809532
64
0.67529042
59
0.48809532
59
0.48809532
61
0.52720739
73
0.8124981
64
0.67529042
64
0.67529042
74
0.67962767
52
0.42857711
61
0.52720739
61
0.52720739
73
0.8124981
78
0.68055561
74
0.67962767
74
0.67962767
78
0.68055561
74
0.67962767
73
0.8124981
73
0.8124981
86
0.68055561
89
0.67962767
Rata2 0.54673
Rata2 0.53737
Rata2 0.649119
Rata2 0.640483
Density Density
Density Density
61
0.52720739
64
0.67529042
73
0.8124981
74
0.67962767
59
0.48809532
61
0.52720739
74
0.67962767
73
0.8124981
64
0.67529042
59
0.48809532
64
0.67529042
64
0.67529042
73
0.8124981
73
0.8124981
78
0.68055561
88
0.70038041
78
0.68055561
52
0.42857711
61
0.52720739
78
0.68055561
74
0.67962767
74
0.67962767
89
0.67962767
86
0.68055561
52
0.42857711
78
0.68055561
59
0.48809532
61
0.52720739
86
0.68055561
86
0.68055561
86
0.68055561
89
0.67962767
Rata2 0.635029
Rata2 0.613874
Rata2 0.630137
Rata2 0.679445
Density
Density Density
Density
78
0.68055561
86
0.680556
88
0.70038
89
0.679628
73
0.8124981
88 0.70038
86 0.680556
103 0.70038
61
0.52720739
97
0.660084
74
0.679628
104
0.66365
64
0.67529042
74 0.679628
97 0.660084
97 0.660084
74
0.67962767
73
0.812498
73
0.812498
73
0.812498
59
0.48809532
103 0.70038
89 0.679628
88 0.70038
88
0.70038041
89
0.679628
78
0.680556
86
0.680556
86
0.68055561
78 0.680556
103 0.70038
74 0.679628
Rata2 0.651951
Rata2 0.701879
Rata2 0.699047
Rata2 0.699597
Density Density
Density Density
97
0.660084
103
0.70038
104
0.66365
125
0.43679
103 0.70038
97 0.660084
103 0.70038
130 0.431512
104
0.66365
104
0.66365
97
0.660084
104
0.66365
89 0.679628
89 0.679628
89 0.679628
103 0.70038
86
0.680556
86
0.680556
125
0.43679
97
0.660084
88 0.70038
125 0.43679
130 0.431512
139 0.300379
73
0.812498
130
0.431512
73
0.812498
89
0.679628
125 0.43679
88 0.70038
86 0.680556
86 0.680556
Rata2 0.667697
Rata2 0.607514
Rata2 0.628778
Rata2 0.588027
Density Density
130
0.431512
139
0.300379
125 0.43679
130 0.431512
103
0.70038
125
0.43679
104 0.66365
103 0.70038
139 0.300379
104 0.66365
97 0.660084
97 0.660084
89
0.679628
89
0.679628
86 0.680556
88 0.70038
Rata2 0.588781
Rata2 0.610346
5. Menghitung Influenced Outlierness INFLO
Tahap ini adalah menghitung INFLO dari suatu obyek, yang sudah tertera pada Rumus 2.8 :
� ��
�
=
∑ �
∈ � � | � � |
�
……..2.8
Berikut adalah hasil INFLO dari masing-masing obyek :
RK KODE
SEKOLAH NAMA SEKOLAH
INFLO
3 05-002
SMA 1 WONOSARI 3.637716679
19 05-001
SMA 2 WONOSARI 2.489995876
139 05-008
SMA PEMBANGUNAN 1 WONOSARI 2.031921516
52 05-021
SMA 1 SEMIN 1.51458995
130 05-024
SMA PEMBANGUNAN 2 KARANGMOJO 1.364460826 125
05-012 SMA DOMINIKUS WONOSARI
1.34624782 59
05-005 SMA 1 PATUK
1.312209708 61
05-022 SMA 1 RONGKOP
1.204513743 86
05-034 SMA 1 SEMANU
1.031332496 89
05-027 SMA IKIP VETERAN III TAMBAKROMO
1.02938221 97
05-026 SMA MUHAMMADIYAH PONJONG
1.011534045 74
05-006 SMA 1 PANGGANG
0.99973127 88
05-004 SMA 1 PLAYEN
0.998096173 78
05-009 SMA MUHAMMADIYAH WONOSARI
0.957968296 104
05-025 SMA PEMBANGUNAN 3 PONJONG
0.947454132 64
05-003 SMA 2 PLAYEN
0.909051598 103
05-007 SMA 1 TANJUNGSARI
0.867405998 73
05-020 SMA 1 KARANGMOJO
0.775555171
Hasil INFLO di atas jika batas outlier yang digunakan adalah 1, maka ada 11 obyek yang terdeteksi outlier, yaitu yang berwarna
kuning dan merah. Namun jika batas outlier yang digunakan adalah 1.5, maka hanya ada 4 obyek yang terdeteksi outlier,
yaitu yang berwarna merah.
3.2.6. Pattern Evaluation