Data Mining PENGOLAHAN DATA

3.2.5. Data Mining

Tahap selanjutnya adalah melakukan penambangan data yang juga terdiri dari beberapa tahapan. Pada proses saat ini digunakan aplikasi Microsoft Excel. 1. Menghitung Jarak Menggunakan Euclidean Distance Tahap ini adalah menghitung jarak distance dari suatu obyek p dan q di suatu database D. Rumus menghitung jarak dp, q dirumuskan seperti pada Rumus 2.1, yaitu : , = √∑ � − � � .................... 2.1 Berikut adalah contoh perhitungan jarak antar obyek BIN, BING, MTK, FSK, KMA, BIO : Table 3.4 Tabel Jarak Antar Obyek 3 19 52 59 61 64 3 2.230560468 4.923819656 5.772139984 5.990417348 5.931053869 19 2.230560468 2.886381818 3.825441151 3.990501222 3.893558783 52 4.923819656 2.886381818 1.295685147 1.415521105 1.034021276 59 5.772139984 3.825441151 1.295685147 0.59186147 0.860116271 61 5.990417348 3.990501222 1.415521105 0.59186147 0.809382481 64 5.931053869 3.893558783 1.034021276 0.860116271 0.809382481 73 6.653593014 4.633670252 1.819093181 1.16965807 0.948683298 0.860639297 74 6.598371011 4.471923523 1.806682042 1.497297566 1.243462907 1.056267012 78 6.673424908 4.645277171 1.922082204 1.38477435 1.015824788 1.061602562 86 7.202645347 5.081761506 2.333302381 2.141191257 1.896786757 1.480844354 88 7.227959601 5.117069474 2.374699981 2.270682717 1.99155718 1.570222914 89 7.478322004 5.501772442 2.664939024 2.048780125 1.972916623 1.745307996 97 7.728745047 5.707512593 2.849122672 2.29658442 2.172464039 1.869197689 103 7.968588332 5.940824859 3.081103698 2.437457692 2.328282629 2.08719908 104 8.08233877 6.074635792 3.208644574 2.507468843 2.286853734 2.199136194 125 9.21180764 7.193622175 4.326176141 3.676492894 3.496355245 3.330555509 130 9.261414579 7.196596418 4.357751714 3.710606419 3.560210668 3.37372198 139 10.29342994 8.263237864 5.429742167 4.937296831 4.783764208 4.488685776 73 74 78 86 88 89 3 6.653593014 6.598371011 6.673424908 7.202645347 7.227959601 7.478322004 19 4.633670252 4.471923523 4.645277171 5.081761506 5.117069474 5.501772442 52 1.819093181 1.806682042 1.922082204 2.333302381 2.374699981 2.664939024 59 1.16965807 1.497297566 1.38477435 2.141191257 2.270682717 2.048780125 61 0.948683298 1.243462907 1.015824788 1.896786757 1.99155718 1.972916623 64 0.860639297 1.056267012 1.061602562 1.480844354 1.570222914 1.745307996 73 0.834026378 0.865621164 1.230772115 1.282770439 1.067426812 74 0.834026378 1.078007421 1.09945441 1.071587607 1.471393897 78 0.865621164 1.078007421 1.469387628 1.40648498 1.558043645 86 1.230772115 1.09945441 1.469387628 0.503487835 1.427094951 88 1.282770439 1.071587607 1.40648498 0.503487835 1.374881813 89 1.067426812 1.471393897 1.558043645 1.427094951 1.374881813 97 1.369890507 1.73781472 1.723571873 1.068456831 1.282692481 0.999699955 103 1.493619764 1.810938983 1.842118346 1.281288414 1.427795504 0.88391176 104 1.476787053 1.881249585 1.684280262 1.506817839 1.510099334 0.9226592 125 2.673854895 2.973835907 2.911940933 2.289432244 2.358686075 1.946458322 130 2.74457647 2.856588875 2.88925596 2.317433926 2.321723498 1.949179314 139 3.972908255 4.114948359 4.022623522 3.342274675 3.329129015 3.180597428 97 103 104 125 130 139 3 7.728745047 7.968588332 8.08233877 9.21180764 9.261414579 10.29342994 19 5.707512593 5.940824859 6.074635792 7.193622175 7.196596418 8.263237864 52 2.849122672 3.081103698 3.208644574 4.326176141 4.357751714 5.429742167 59 2.29658442 2.437457692 2.507468843 3.676492894 3.710606419 4.937296831 61 2.172464039 2.328282629 2.286853734 3.496355245 3.560210668 4.783764208 64 1.869197689 2.08719908 2.199136194 3.330555509 3.37372198 4.488685776 73 1.369890507 1.493619764 1.476787053 2.673854895 2.74457647 3.972908255 74 1.73781472 1.810938983 1.881249585 2.973835907 2.856588875 4.114948359 78 1.723571873 1.842118346 1.684280262 2.911940933 2.88925596 4.022623522 86 1.068456831 1.281288414 1.506817839 2.289432244 2.317433926 3.342274675 88 1.282692481 1.427795504 1.510099334 2.358686075 2.321723498 3.329129015 89 0.999699955 0.88391176 0.9226592 1.946458322 1.949179314 3.180597428 97 0.414125585 0.839464115 1.514958745 1.722411101 2.753870004 103 0.414125585 0.68571131 1.319166403 1.397998569 2.576800342 104 0.839464115 0.68571131 1.289340917 1.476550033 2.647319399 125 1.514958745 1.319166403 1.289340917 0.917932459 1.636734554 130 1.722411101 1.397998569 1.476550033 0.917932459 1.509668838 139 2.753870004 2.576800342 2.647319399 1.636734554 1.509668838 2. Menghitung K-Distance dan Mencari Nearest Neighbors NN Tahap ini adalah menentukan tetangga terdekat NN dengan asumsi jumlah tetangga terdekat k = 7. Caranya adalah dengan mengurutkan jarak masing-masing obyek ke obyek lainya dari nilai terkecil ke terbesar, lalu memilih 7 jarak terdekat, yaitu yang mengandung nilai terkecil. Selanjutnya adalah menghitung k-distance dari masing-masing obyek tersebut dengan mencari nilai maksimal dari keseluruhan nilai jarak obyek dengan ke-7 tetangga terdekatnya. Berikut adalah tetangga terdekat NN masing-masing obyek dengan jarak antar obyeknya : Table 3.5 Tabel NN dengan Jarak Antar Obyeknya 3 19 52 59 3 19 52 59 19 2.230560468 3 2.230560468 64 1.034021276 61 0.59186147 52 4.923819656 52 2.886381818 59 1.295685147 64 0.860116271 59 5.772139984 59 3.825441151 61 1.415521105 73 1.16965807 64 5.931053869 64 3.893558783 74 1.806682042 52 1.295685147 61 5.990417348 61 3.990501222 73 1.819093181 78 1.38477435 74 6.598371011 74 4.471923523 78 1.922082204 74 1.497297566 73 6.653593014 73 4.633670252 86 2.333302381 89 2.048780125 61 64 73 74 61 64 73 74 59 0.59186147 61 0.809382481 74 0.834026378 73 0.834026378 64 0.809382481 59 0.860116271 64 0.860639297 64 1.056267012 73 0.948683298 73 0.860639297 78 0.865621164 88 1.071587607 78 1.015824788 52 1.034021276 61 0.948683298 78 1.078007421 74 1.243462907 74 1.056267012 89 1.067426812 86 1.09945441 52 1.415521105 78 1.061602562 59 1.16965807 61 1.243462907 86 1.896786757 86 1.480844354 86 1.230772115 89 1.471393897 78 86 88 89 78 86 88 89 73 0.865621164 88 0.503487835 86 0.503487835 103 0.88391176 61 1.015824788 97 1.068456831 74 1.071587607 104 0.9226592 64 1.061602562 74 1.09945441 97 1.282692481 97 0.999699955 74 1.078007421 73 1.230772115 73 1.282770439 73 1.067426812 59 1.38477435 103 1.281288414 89 1.374881813 88 1.374881813 88 1.40648498 89 1.427094951 78 1.40648498 86 1.427094951 86 1.469387628 78 1.469387628 103 1.427795504 74 1.471393897 97 103 104 125 97 103 104 125 103 0.414125585 97 0.414125585 103 0.68571131 130 0.917932459 104 0.839464115 104 0.68571131 97 0.839464115 104 1.289340917 89 0.999699955 89 0.88391176 89 0.9226592 103 1.319166403 86 1.068456831 86 1.281288414 125 1.289340917 97 1.514958745 88 1.282692481 125 1.319166403 130 1.476550033 139 1.636734554 73 1.369890507 130 1.397998569 73 1.476787053 89 1.946458322 125 1.514958745 88 1.427795504 86 1.506817839 86 2.289432244 130 139 130 139 125 0.917932459 130 1.509668838 103 1.397998569 125 1.636734554 104 1.476550033 103 2.576800342 139 1.509668838 104 2.647319399 97 1.722411101 97 2.753870004 89 1.949179314 89 3.180597428 86 2.317433926 88 3.329129015 Berikut ini adalah ringkasan nilai k-distance obyek : Table 3.6 Tabel K-Distance K-Distance 3 6.653593014 19 4.633670252 52 2.333302381 59 2.048780125 61 1.896786757 64 1.480844354 73 1.230772115 74 1.471393897 78 1.469387628 86 1.469387628 88 1.427795504 89 1.471393897 97 1.514958745 103 1.427795504 104 1.506817839 125 2.289432244 130 2.317433926 139 3.329129015 3. Mencari Influence Space IS Tahap ini adalah mencari hubungan tetangga simetris dari suatu obyek. IS merupakan gabungan dari NN Nearest Neighbors dan RNN Reverse Nearest Neighbors. RNN merupakan inverse dari tetangga suatu obyek. Berikut adalah NN dari masing-masing obyek : Table 3.7 Tabel NN NN 3 19 52 59 64 61 74 73 19 3 52 59 64 61 74 73 52 64 59 61 74 73 78 86 59 61 64 73 52 78 74 89 61 59 64 73 78 74 52 86 64 61 59 73 52 74 78 86 73 74 64 78 61 89 59 86 74 73 64 88 78 86 61 89 78 73 61 64 74 59 88 86 86 88 97 74 73 103 89 78 88 86 74 97 73 89 78 103 89 103 104 97 73 88 86 74 97 103 104 89 86 88 73 125 103 97 104 89 86 125 130 88 104 103 97 89 125 130 73 86 125 130 104 103 97 139 89 86 130 125 103 104 139 97 89 86 139 130 125 103 104 97 89 88 Berikut adalah RNN dari masing-masing obyek : Table 3.8 Table RNN RNN 3 19 19 3 52 64 59 61 59 61 64 73 52 78 61 59 64 73 78 74 52 64 61 59 73 52 74 78 73 74 64 78 61 89 59 86 74 73 64 88 78 86 61 89 78 73 61 64 74 59 88 86 86 88 97 74 73 103 89 78 88 86 74 97 89 78 103 89 103 104 97 73 88 86 74 97 103 104 89 86 88 125 103 97 104 89 86 125 130 88 104 103 97 89 125 130 125 130 104 103 97 139 130 125 103 104 139 139 130 125 Sehingga menghasilkan IS dari masing-masing obyek adalah sebagai berikut : Table 3.9 Tabel IS IS 3 19 52 59 64 61 74 73 19 3 52 59 64 61 74 73 52 64 59 61 74 73 78 86 59 61 64 73 52 78 74 89 61 59 64 73 78 74 52 86 64 61 59 73 52 74 78 86 73 74 64 78 61 89 59 86 74 73 64 88 78 86 61 89 78 73 61 64 74 59 88 86 86 88 97 74 73 103 89 78 88 86 74 97 73 89 78 103 89 103 104 97 73 88 86 74 97 103 104 89 86 88 73 125 103 97 104 89 86 125 130 88 104 103 97 89 125 130 73 86 125 130 104 103 97 139 89 86 130 125 103 104 139 97 89 86 139 130 125 103 104 97 89 88 4. Menghitung Local Density Cara perhitungan Local Density seperti pada Rumus 2.5 : � = � � ...................... 2.5 Berikut adalah hasil local density dari semua obyek : Table 3.10 Tabel Density Density 3 0.150294735 19 0.215811645 52 0.428577114 59 0.488095325 61 0.527207392 64 0.675290416 73 0.812498096 74 0.679627666 78 0.680555615 86 0.680555615 88 0.70038041 89 0.679627666 97 0.660083981 103 0.70038041 104 0.663650226 125 0.436789515 130 0.431511763 139 0.300378866 Selanjutnya adalah menhitung rata-rata density dari masing- maisng obyek : Table 3.11 Tabel Rata-rata Density Tiap Obyek Density Density Density Density 3 0.15029474 19 0.21581165 52 0.42857711 59 0.48809532 19 0.21581165 3 0.15029474 64 0.67529042 61 0.52720739 52 0.42857711 52 0.42857711 59 0.48809532 64 0.67529042 59 0.48809532 59 0.48809532 61 0.52720739 73 0.8124981 64 0.67529042 64 0.67529042 74 0.67962767 52 0.42857711 61 0.52720739 61 0.52720739 73 0.8124981 78 0.68055561 74 0.67962767 74 0.67962767 78 0.68055561 74 0.67962767 73 0.8124981 73 0.8124981 86 0.68055561 89 0.67962767 Rata2 0.54673 Rata2 0.53737 Rata2 0.649119 Rata2 0.640483 Density Density Density Density 61 0.52720739 64 0.67529042 73 0.8124981 74 0.67962767 59 0.48809532 61 0.52720739 74 0.67962767 73 0.8124981 64 0.67529042 59 0.48809532 64 0.67529042 64 0.67529042 73 0.8124981 73 0.8124981 78 0.68055561 88 0.70038041 78 0.68055561 52 0.42857711 61 0.52720739 78 0.68055561 74 0.67962767 74 0.67962767 89 0.67962767 86 0.68055561 52 0.42857711 78 0.68055561 59 0.48809532 61 0.52720739 86 0.68055561 86 0.68055561 86 0.68055561 89 0.67962767 Rata2 0.635029 Rata2 0.613874 Rata2 0.630137 Rata2 0.679445 Density Density Density Density 78 0.68055561 86 0.680556 88 0.70038 89 0.679628 73 0.8124981 88 0.70038 86 0.680556 103 0.70038 61 0.52720739 97 0.660084 74 0.679628 104 0.66365 64 0.67529042 74 0.679628 97 0.660084 97 0.660084 74 0.67962767 73 0.812498 73 0.812498 73 0.812498 59 0.48809532 103 0.70038 89 0.679628 88 0.70038 88 0.70038041 89 0.679628 78 0.680556 86 0.680556 86 0.68055561 78 0.680556 103 0.70038 74 0.679628 Rata2 0.651951 Rata2 0.701879 Rata2 0.699047 Rata2 0.699597 Density Density Density Density 97 0.660084 103 0.70038 104 0.66365 125 0.43679 103 0.70038 97 0.660084 103 0.70038 130 0.431512 104 0.66365 104 0.66365 97 0.660084 104 0.66365 89 0.679628 89 0.679628 89 0.679628 103 0.70038 86 0.680556 86 0.680556 125 0.43679 97 0.660084 88 0.70038 125 0.43679 130 0.431512 139 0.300379 73 0.812498 130 0.431512 73 0.812498 89 0.679628 125 0.43679 88 0.70038 86 0.680556 86 0.680556 Rata2 0.667697 Rata2 0.607514 Rata2 0.628778 Rata2 0.588027 Density Density 130 0.431512 139 0.300379 125 0.43679 130 0.431512 103 0.70038 125 0.43679 104 0.66365 103 0.70038 139 0.300379 104 0.66365 97 0.660084 97 0.660084 89 0.679628 89 0.679628 86 0.680556 88 0.70038 Rata2 0.588781 Rata2 0.610346 5. Menghitung Influenced Outlierness INFLO Tahap ini adalah menghitung INFLO dari suatu obyek, yang sudah tertera pada Rumus 2.8 : � �� � = ∑ � ∈ � � | � � | � ……..2.8 Berikut adalah hasil INFLO dari masing-masing obyek : RK KODE SEKOLAH NAMA SEKOLAH INFLO 3 05-002 SMA 1 WONOSARI 3.637716679 19 05-001 SMA 2 WONOSARI 2.489995876 139 05-008 SMA PEMBANGUNAN 1 WONOSARI 2.031921516 52 05-021 SMA 1 SEMIN 1.51458995 130 05-024 SMA PEMBANGUNAN 2 KARANGMOJO 1.364460826 125 05-012 SMA DOMINIKUS WONOSARI 1.34624782 59 05-005 SMA 1 PATUK 1.312209708 61 05-022 SMA 1 RONGKOP 1.204513743 86 05-034 SMA 1 SEMANU 1.031332496 89 05-027 SMA IKIP VETERAN III TAMBAKROMO 1.02938221 97 05-026 SMA MUHAMMADIYAH PONJONG 1.011534045 74 05-006 SMA 1 PANGGANG 0.99973127 88 05-004 SMA 1 PLAYEN 0.998096173 78 05-009 SMA MUHAMMADIYAH WONOSARI 0.957968296 104 05-025 SMA PEMBANGUNAN 3 PONJONG 0.947454132 64 05-003 SMA 2 PLAYEN 0.909051598 103 05-007 SMA 1 TANJUNGSARI 0.867405998 73 05-020 SMA 1 KARANGMOJO 0.775555171 Hasil INFLO di atas jika batas outlier yang digunakan adalah 1, maka ada 11 obyek yang terdeteksi outlier, yaitu yang berwarna kuning dan merah. Namun jika batas outlier yang digunakan adalah 1.5, maka hanya ada 4 obyek yang terdeteksi outlier, yaitu yang berwarna merah.

3.2.6. Pattern Evaluation

Dokumen yang terkait

PEMBANGUNAN SISTEM INFORMASI NILAI UNTUK SEKOLAH MENENGAH ATAS BERBASIS WEB PEMBANGUNAN SISTEM INFORMASI NILAI UNTUK SEKOLAH MENENGAH ATAS BERBASIS WEB.

0 2 12

Implementasi algoritma Partitioning Around Medoids (PAM) untuk pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya serap Ujian Nasional.

0 0 2

Pengelompokan Sekolah Menengah Atas di Provinsi Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan algoritma K-Means Clustering.

1 1 87

Pengelompokan Sekolah Menengah Atas di Provinsi Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan algoritma agglomerative hierarchical clustering.

11 55 123

Implementasi algoritma fuzzy c-means untuk pengelompokan sekolah menengah atas di diy berdasarkan nilai ujian nasional dan nilai sekolah.

2 16 145

Deteksi outlier menggunakan Algoritma Connectivity Based Outlier Factor : studi kasus data akademik mahasiswa Teknik Informatika Universitas Sanata Dharma.

0 4 252

Penerapan metode enhanced class outlier distance based untuk identifikasi outlier pada data hasil ujian nasional, indeks integritas dan akreditasi sekolah menengah atas

1 6 143

Implementasi algoritma Partitioning Around Medoids (PAM) untuk pengelompokan Sekolah Menengah Atas di DIY berdasarkan nilai daya serap Ujian Nasional

7 43 133

Pemahaman Nilai-Nilai Kewirausahaan Dalam Menulis Naskah Drama Untuk Sekolah Menengah Atas (SMA) Dengan Menggunakan Model Peralihan Konsep

0 4 8

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

0 0 6