View of ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE

ANALISIS KARAKTERISTIK KELOMPOK DENGAN MENGGUNAKAN PENDEKATAN CLUSTER ENSEMBLE

  Dyah Paminta Rahayu(dyahp@ut.ac.id) Jurusan Matematika FMIPA Universitas Terbuka

  ABSTRAK Pengelompokkan merupakan salah satu tehnik data mining yang digunakan untuk mengelompokkan data berdasarkan kemiripan atribut dari data obyek. Pada umumnya algoritma pengelompokan dikembangkan hanya untuk memproses salah satu tipe data kategori atau numerik. Tidak banyak algoritma yang dikembangkan untuk memproses data campuran kategori dan numerik. Salah satu algoritma untuk memproses data campuran adalah algCEBMDC, algoritma pengelompokan dengan pendekatan cluster ensemble. Tujuan penelitian ini adalah untuk menganalisis karakteristik hasil pengelompokan algoritma algCEBMDC. Metode penelitian mengikuti alur kerja data mining dan algoritma algCEBMDC. Data yang digunakan adalah data mahasiswa non aktif Program Studi Matematika FMIPA, Universitas Terbuka. Data awal bertipe campuran dibersihkan untuk mendapatkan data bersih siap proses, kemudian dipisah menjadi dua berdasarkan tipe datanya: kategori dan numerik. Data kategori diproses menggunakan algoritma QROCK, menghasilkan 44 kelompok yang diperoleh pada threshold 0.98 dengan nilai kohesi 2044. Data numerik diproses menggunakan algoritma AGNES, menghasilkan 69 kelompok yang diperoleh dari kombinasi ukuran jarak Cityblock distance dan metode penggabungan Average link dengan nilai cophenet 0,822. Hasil dari kedua pengelompokan digabung, dianggap sebagai data kategori, kemudian diproses menggunakan algoritma QROCK.

  Kelompok-kelompok yang dihasilkan memiliki kesamaan karakteristik pada pendidikan akhir, status pekerjaan, status perkawinan, dan jenis kelamin. Faktor prestasi akademik menunjukkan bahwa tingkat kelulusan matakuliah dalam dua semester pertama sangat rendah. Dapat dikatakan bahwa dua semester pertama merupakan masa kritis bagi mahasiswa Program Studi Matematika UT.

  

,

Kata kunci: algoritma algCEBMDC, kompleksitas pengelompokan

  ABSTRACT Clustering is one of data mining techniques which is used to group databased on similarity of the object data attributes. In general clustering algorithm is developed to process only one type of data, either category or numerical data type. Not many algorithms were developed to process the mixture between category and numerical data. One algorithm to process the mixed data is algCEBMDC, a clustering algorithm using cluster ensemble approach. The purpose of this study was to analyze the characteristics of the results of clustering algorithms algCEBMDC. The research methods follow the work-flow of data mining and algCEBMDC algorithm. The data used is the data of inactive students of Mathematics study program in Universitas Terbuka (The Indonesia Open University). First, the data is cleared up to get clean data ready for processing, and then is separated into two groups based on the type of category data and numerical data. The category data is processed using QROCK algorithm, producing 44 groups which is obtained at the 0.98 threshold value with

  Jurnal Matematika, Sains, dan Teknologi, Volume 14 Nomor 1, Maret 2013, 1-10

cohesion of 2044. The numerical data is processed using AGNES algorithm, generating 69

groups which is derived from a combination of Cityblock Distance and Average link method

with cophenet value of 0,822. The results of the two grouping are combined, considered as

a data category, then is processed using QROCK algorithm. The resulting groups had similar characteristics on the end of education, employment status, marital status, and

gender. The academic achievement factors indicate that the passing level of courses in the

first two semesters are very low. It can be concluded that the first two semesters is a critical

time for distance education students in mathematic study program. Keywords: algCEBMDC algorithm, characteristics, clustering

  Sebagai Universitas yang tergolong dalam ”Mega University”, Universitas Terbuka (UT) memiliki data kemahasiswaan dengan jumlah yang sangat besar. Gudang data tersebut sebenarnya dapat dimanfaatkan oleh pengelola untuk mengembangkan institusi, misalnya untuk peningkatan efektifitas pemasaran atau pengurangan biaya operasional. Selain itu gudang data dapat juga digunakan untuk memecahkan masalah-masalah berikut: bagaimana mengelompokkan mahasiswa yang memiliki kesamaan karakteristik tertentu, mengestimisasi data yang hilang, meningkatkan performa akademik mahasiswa, atau mengurangi resiko kegagalan mahasiswa. Untuk dapat memanfaatkan gudang data, dibutuhkan suatu teknologi yang dapat dengan cepat menganalisis data dalam jumlah besar. Teknologi yang dimaksud adalah data mining.

  Data mining adalah eksplorasi dan analisis secara otomatis atau semi otomatis terhadap

  data besar dengan tujuan untuk menemukan pola baru dan bermakna yang mungkin masih belum diketahui (Tan et al. 2006). Data mining merupakan bagian integral dari Knowledge Discovery in

  Databases (KDD). Keseluruhan proses KDD, mulai dari data masukan sampai menjadi informasi ditunjukkan oleh Gambar 1.

  Data Praproses Data Postprocessing

  Informasi

  Input Data Mining

Seleksi atribut Filtering Pola

Pengurangan dimensi Visualisasi

Normalisasi Interpretasi Pola Subsetting Data

  Gambar 1. Proses knowledge discovery in databases (Tan et al, 2006) Chong (2010) memanfaatkan beberapa teknik data mining, yaitu classi

  fication trees, multivariate adaptive regression splines (MARS), and neural networks untuk menganalisis student

retention pada Arizona State University (ASU). Saxena (2002) menggunakan salah satu teknik data

mining, yaitu analisis pengelompokkan dengan pendekatan hierarchical clustering untuk

  menganalisis data mahasiswa India Open University, sedangkan Sheela (2010) menggunakan metode pengelompokkan K-means untuk menemukan knowledge dari data akademik mahasiswa

  Department of Computer Science, University of Agriculture, Faisalabad.

  Rahayu, Analisis Karakteristik Kelompok

  Pada analisis pengelompokkan (cluster analysis) data, dilakukan pengelompokkan berdasarkan kemiripan atribut dari data obyek. Dalam hal ini data obyek yang berada di dalam kelompok yang sama memiliki kemiripan satu sama lain. Sedangkan dengan data obyek di dalam kelompok lain sama sekali tidak memiliki kemiripan. Semakin besar tingkat kemiripan antar obyek di dalam kelompok dan semakin besar tingkat perbedaan antar kelompok, berarti semakin baik pengelompokkan tersebut (Han & Kamber, 2001).

  Pada umumnya algoritma pengelompokkan dikembangkan hanya untuk memproses salah satu tipe data kategori atau numerik. Tidak banyak algoritma yang dikembangkan untuk memproses data campuran kategori dan numerik. Padahal secara umum data riil memiliki atribut dengan tipe campuran (kategori dan numerik).

  

AlgCEBMDC dan k-prototype adalah dua contoh algoritma pengelompokkan yang bekerja

  pada data bertipe campuran. Zengyou (2002) membandingkan kedua algoritma tersebut dan menunjukkan bahwa algCEBMDC memiliki akurasi lebih baik dibandingkan k-prototype.

  Algoritma algCEBMDC merupakan analisis pengelompokkan dengan pendekatan cluster

  ensemble. Algoritma ini menawarkan suatu teknik baru, yaitu teknik devide-and-conquer. Pertama,

  data awal bertipe campuran dipisah menjadi dua data kategori dan data numerik. Selanjutnya, kedua data tersebut diproses secara terpisah dengan menggunakan algoritma pengelompokkan yang sesuai dengan tipe masing-masing data. Untuk mendapatkan hasil akhir, kelompok-kelompok yang dihasilkan oleh kedua algoritma digabung dan dipandang sebagai data baru dengan tipe kategori, kemudian diproses dengan menggunakan algoritma pengelompokkan untuk data kategori (Zengyou, Xiaofe, & Shengchum. 2002).

  Artikel ini menganalisis karakteristik hasil pengelompokkan algoritma algCEBMDC pada data mahasiswa nonaktif Program Studi Matematika FMIPA, Universitas Terbuka.

  METODE

  Metode penelitian dikembangkan berdasarkan alur proses KDD yang ditulis oleh Tan, Steinbach, dan Kumar (2006) dan algoritma algCEBMDC (Zengyou, Xiaofe, & Sheng, 2002). Skema metode penelitian disajikan oleh Gambar 2.

  A.

  B.

  C.

  D. Pengum Pra Data mining pulan proses (algCEBMDC)

  Data Data

  Dataset Algoritma kategori

  QROCK

  Analisis

  Algoritma Data Data

  QROCK awal set

  Data

  Dataset Algoritma numerik AGNES

  Gambar 2. Skema metode penelitian

  Jurnal Matematika, Sains, dan Teknologi, Volume 14 Nomor 1, Maret 2013, 1-10

  Proses dimulai dengan pengumpulan data. Data awal yang berkaitan dengan demografi, latar belakang pendidikan, dan prestasi akademik mahasiswa diperoleh dari Pusat Komputer Universitas Terbuka pada tahun 2008. Data yang diperoleh berjumlah 5883 mahasiswa nonaktif Program Studi Matematika FMIPA-UT, memiliki 33 atribut campuran yang terdiri dari 23 atribut kategori dan 10 atribut numerik.

  Praproses data yang dilakukan adalah pembersihan data, reduksi data, pemisahan data, dan transformasi data. Pembersihan data dilakukan karena data seringkali memiliki record dengan nilai atribut yang tidak lengkap, kosong, tidak konsisten, dan noisy. Data demikian harus dihapus, tidak disertakan dalam proses data mining karena dapat mempengaruhi hasil akhir secara negatif. Reduksi data yang dilakukan adalah seleksi atribut, karena tidak semua atribut relevan dengan kebutuhan penelitian. Transformasi diperlukan untuk mengkonversi data ke dalam format sesuai dengan kebutuhan.

  Untuk mendapatkan hasil optimal, pemilihan algoritma pengelompokkan harus tepat karena kualitas hasil akhir dari suatu proses data mining tidak hanya tergantung pada kualitas data tetapi juga algoritma yang digunakan. Setiap algoritma pengelompokkan akan menghasilkan kelompok dengan tipenya masing-masing (Tan et al, 2006). Pada penelitian ini algoritma pengelompokkan yang digunakan adalah algoritma algCEBMDC.

  Pengelompokkan data kategori menggunakan fungsi just_qrock_edit, ditulis oleh Marisa (2008) dengan menerapkan algoritma QROCK yang merupakan percepatan dari algoritma ROCK. Masukan dari fungsi ini adalah data kategori dan treshold sebagai ukuran kemiripan antar obyek. Untuk mendapatkan kelompok terbaik, kelompok yang dihasilkan dievaluasi menggunakan ukuran nilai kohesi. Semakin tinggi total nilai kohesi suatu hasil pengelompokkan, semakin baik kelompok yang dihasilkan.

  Pengelompokkan data numerik menerapkan algoritma AGNES dengan menggunakan fungsi-fungsi yang tersedia dalam matlab 7.0, yaitu pdist untuk menghitung jarak antar obyek,

  

lingkage untuk menggabungkan obyek atau kelompok, chopenet untuk menghitung nilai chophenet,

  dan dendrogram untuk membuat dendrogram dari kelompok yang terbentuk. Hasil pengelompokkan dievaluasi dengan cara menghitung nilai cophenet. Hasil pengelompokkan dikatakan baik jika nilai

  cophenet mendekati angka 1. Hasil pengelompokkan algoritma QROCK dan algoritma AGNES

  digabung dan dipandang sebagai data baru dengan tipe kategori kemudian diproses dengan menggunakan algoritma QROCK.

  HASIL DAN PEMBAHASAN Praproses Data

  Pada proses pembersihan data ditemukan data yang memiliki atribut dengan nilai tidak lengkap, kosong, dan tidak konsisten. Nilai tidak lengkap terdapat pada atribut Tanggal Lahir pada bagian tahun lahir. Ketidaklengkapan pengisian tahun lahir mengakibatkan kesalahan dalam perhitungan umur mahasiswa karena umur dihitung berdasarkan tahun lahir. Nilai kosong terdapat pada atribut IPK (Indeks Prestasi Akademik) dan SKS (Satuan Kredit Semester). Hal tersebut bisa jadi karena belum ada satupun mata kuliah yang lulus, atau mahasiswa hanya melakukan pendaftaran sebagai mahasiswa UT tetapi tidak pernah mengikuti ujian. Nilai tidak konsisten terdapat pada atribut IPK dalam hubungannya dengan atribut SKS, yaitu terdapat 3 mahasiswa yang telah menempuh dan lulus beberapa mata kuliah tetapi IPK yang didapat 0. Nilai tidak konsisten juga terdapat pada atribut SKS dalam kaitannya dengan atribut Lama Studi, yaitu terdapat 5 mahasiswa yang rata-rata perolehan SKS tiap semester melebihi maksimum jumlah mata kuliah yang dapat

  Rahayu, Analisis Karakteristik Kelompok

  diambil tiap semesternya. Nilai tidak konsisten juga terdapat pada atribut Lama Studi, akibat dari kesalahan pada pengisian atribut Registrasi Akhir karena atribut Lama Studi dihitung berdasarkan atribut Registrasi Akhir. Terdapat 1751 record yang harus dihapus karena memiliki atribut dengan nilai tidak lengkap, kosong, dan tidak konsisten.

  Reduksi data yang dilakukan dalam penelitian ini adalah seleksi atribut. Dari 33 atribut yang dimiliki, terdapat 23 atribut yang dihapus karena tidak relevan dengan kebutuhan penelitian. Atribut nama dan alamat mahasiswa merupakan contoh atribut yang dihapus karena walaupun atribut tersebut penting bagi mahasiswa tetapi tidak relevan dengan kebutuhan penelitian.

  Setelah pembersihan dan reduksi data, dataset yang dianggap bersih dan siap diproses berjumlah 4132 records dengan 10 atribut bertipe campuran: 6 atribut kategori dan 4 atribut numerik. Data tersebut diberi nama DataMhs dengan struktur sebagai berikut:  Atribut Kategori. Semua status dalam atribut kategori dikonversi kedalam kode numerik. Atribut kategori meliputi:

  1. Jurusan Asal adalah atribut yang menerangkan jurusan dari pendidikan akhir yang dimiliki mahasiswa. Sebagai contoh, jika mahasiswa memiliki pendidikan akhir SLTA maka bisa jadi berasal dari jurusan IPA, IPS atau STM. Terdapat 79 (tujuh puluh sembilan) kode numerik untuk menerangkan status dari Jurusan Asal. Sebagai contoh ’101’ untuk ’SMTA Umum IPA/IPS’.

  2. UPBJJ adalah atribut yang menerangkan wilayah keberadaan mahasiswa. Terdapat 37 (tiga puluh tujuh) kode numerik untuk menerangkan status dari UPBJJ. Sebagai contoh ’21’ untuk ’UPBJJ UT Jakarta’.

  3. Pendidikan Akhir adalah atribut yang menerangkan pendidikan terakhir sebelum menjadi mahasiswa UT. Terdapat 6 (enam) kode numerik untuk menerangkan status dari Pendidikan Akhir, yaitu 1(SLTA), 2(D1), 3(D2), 4(D3), 5(S1), dan 6(S2).

  4. Status Kerja adalah atribut yang menerangkan jenis pekerjaan dari mahasiswa. Terdapat 5 (lima) kode numerik untuk menerangkan status dari Status Kerja, yaitu 2 (PNS), 3 (Swasta), 4 (Wiraswasta), 5 (Tidak Bekerja), dan 6 (Bekerja).

  5. Status Kawin memiliki 2(dua) kode numerik; 1(kawin) dan 0 (tidak kawin).

  6. Jenis Kelamin memiliki 2 (dua) kode numerik; 1 (Laki-laki) dan 0 (perempuan).  Atribut Numerik meliputi:

  1. Umur adalah atribut yang menerangkan usia mahasiswa ketika pertama kali mendaftar sebagai mahasiswa UT, memiliki rentang nilai antara 16 sampai dengan 66 tahun.

  2. IPK adalah atribut yang menerangkan IPK yang diperoleh selama menjadi mahasiswa UT, memiliki rentang nilai antara 1 sampai dengan 4.

  3. SKS adalah atribut yang menerangkan jumlah SKS dari sejumlah mata kuliah yang sudah berhasil ditempuh dan lulus dengan nilai minimal D, memiliki rentang nilai antara 3 sampai dengan 175 SKS.

  4. Lama Studi adalah atribut yang menerangkan berapa semester mahasiswa mengikuti perkuliahan di UT, memiliki rentang nilai antara 1 sampai dengan 34 semester.

  Sebelum proses data mining, DataMhs dipisah menjadi dua berdasarkan tipe dari atributnya. Data dengan atribut kategori diberi nama DataKategori dan data dengan atribut numerik diberi nama DataNumerik.

  Beberapa atribut dari DataKategori memiliki nilai dengan kode numerik yang sama. Sebagai contoh: atribut Pendidikan Akhir ‘D1’ memiliki kode numerik yang sama dengan atribut Status Kerja

  Jurnal Matematika, Sains, dan Teknologi, Volume 14 Nomor 1, Maret 2013, 1-10

  ‘PNS’, yaitu ‘2’, sedangkan atribut Status Kawin ‘Tidak Kawin’ memiliki kode numerik yang sama dengan atribut Jenis Kelamin ‘Perempuan’, yaitu ‘0’. Hal demikian dapat mengacaukan hasil perhitungan similarity antar obyek. Oleh karenanya perlu dilakukan transformasi pada DataKategori dengan cara mengubah kode numerik dari sebagian atribut, sedemikian sehingga setiap atribut memiliki kode numerik yang berbeda dengan atribut lain. Atribut yang dikenai transformasi adalah Status Kerja, Status Kawin, dan Jenis Kelamin.

  Beberapa atribut pada DataNumerik memiliki rentang nilai yang sangat berbeda. Sebagai contoh; atribut SKS memiliki rentang nilai antara 3 sampai dengan 175, sedangkan IPK memiliki rentang nilai antara 0 sampai dengan 4. Hal ini dapat mempengaruhi perhitungan dissimilarity antar obyek karena hasil perhitungan akan didominasi oleh perbedaan nilai SKS dibanding IPK (Tan, Steinbach, & Kumar, 2006). Oleh karenanya perlu dilakukan normalisasi terhadap semua atribut DataNumerik untuk mendapatkan nilai yang proporsional tanpa mengubah informasi yang terkandung. Normalisasi yang digunakan adalah z-score normalization.

  Pengelompokkan DataKategori

  Pengelompokkan DataKategori dilakukan dengan 11 (sebelas) variasi nilai threshold antara 0,90 dan 1,0. Untuk setiap threshold yang dimasukkan, akan menghasilkan jumlah kelompok, anggota tiap-tiap kelompok, dan nilai kohesi untuk masing-masing kelompok. Threshold merupakan parameter yang dapat digunakan untuk mengukur similarity dari pasangan obyek yang bertetangga. Semakin besar threshold, semakin mirip pasangan yang bertetangga tersebut. Hasil pengelompokkan terbaik menghasilkan 44 kelompok, diperoleh pada threshold 0,98 dengan nilai kohesi 2044.

  Kelompok yang dihasilkan oleh algoritma QROCK merupakan graph based clusters. Nilai kohesi tiap kelompok didapat dengan cara menghitung jumlah edge yang menghubungkan tiap obyek dalam kelompok, dibagi dengan jumlah anggota kelompok. Kualitas hasil pengelompokkan diukur dengan cara menjumlahkan nilai kohesi dari tiap-tiap kelompok yang dihasilkan. Semakin tinggi total nilai kohesi suatu hasil pengelompokkan, semakin baik kelompok yang dihasilkan (Dutta, Mahanta, & Arun., 2005).

  Kelompok-kelompok yang dihasilkan, terbentuk berdasarkan kesamaan pada empat atribut, yaitu Pendidikan Akhir, Status Kerja, Status Kawin, dan Jenis Kelamin. Dua obyek akan berada dalam kelompok yang sama apabila memiliki kesamaan pada keempat atribut tersebut. Sebaliknya, apabila salah satu dari keempat atribut tersebut berbeda, maka kedua obyek dipastikan akan berada dalam kelompok yang berbeda. Dua atribut lain yaitu Jurusan Asal dan UPBJJ tidak menentukan terbentuknya kelompok .

  Tabel 1. Karakteristik 6 Kelompok Besar Hasil Pengelompokkan DataKategori Nomor

  Jumlah Anggota Karakteristik Anggota Kelompok Kelompok 3 1113 Laki-laki bekerja, tidak kawin, SLTA

  2 882 Laki-laki tidak bekerja, tidak kawin, SLTA 6 609 Laki-laki tidak bekerja, kawin, SLTA 7 391 Perempuan tidak bekerja, tidak kawin, SLTA 4 365 Perempuan bekerja, tidak kawin, SLTA

  11 139 Perempuan bekerja, kawin, SLTA

  Rahayu, Analisis Karakteristik Kelompok

  Dari 44 kelompok yang dihasilkan terdapat 6 kelompok besar (84,7%, dengan anggota kelompok antara 139 sampai dengan 1113 obyek) dan 38 kelompok kecil. Karakteristik 6 kelompok besar tersebut disajikan pada Tabel 1.

  Pengelompokkan DataNumerik

  Pengelompokkan DataNumerik menggunakan 2 macam ukuran jarak, yaitu Eucliden

  distance dan Cityblock distance, dan 3 macam metode penggabungan, yaitu Single link, Complete

link, dan Average link. Terdapat 6 kemungkinan kombinasi ukuran jarak dan metode penggabungan

  yang digunakan sebagai masukan dari algoritma AGNES.

  2427 1942 1912 1235 2952 2573 3112 3111 3120 3211 3213 653 2581 2576 2680 2956 2745 2196 2589 2430 2497 2580 1370 2062 1397 2559 2406 2478 2480 2817 3064 3164 2554 2409 2494 2760 2577 2578 2951 2495 2833 3169 3171 3341 3207 3174 3346 3524 3526 3530 3416 3499 3473 3479 3496 3579 3622 3677 2506 2595 2510 2603 2775 2846 2848 2776 2693 2905 3080 3135 3081 2966 2975 2971 2974 3222 3176 3136 3390 3450 3397 2704 2990 3088 2912 2981 2783 3039 3277 3147 3244 3092 3094 3184 3045 3362 3432 3325 2434 2836 2602 2695 2608 3138 3309 3482 3275 3033 3307 3312 3394 3565 3183 3218 3227 3267 3453 3454 3315 3353 3352 3583 3598 3261 3303 3378 3475 3497 3339 3419 3478 3548 3633 232 239 243 250 253 920 928 686 1260 1508 1516 965 1118 1526 1100 1104 1947 1101 1470 1111 1498 1107 2333 2499 407 418 905 908 531 540 539 665 822 827 843 857 838 1199 1201 1494 1956 2087 1805 1781 2078 2174 1791 1939 2202 2505 2509 2318 2496 2329 2424 2587 2758 2599 1497 1502 1809 1963 435 676 935 695 1267 1262 1535 1512 1500 1518 915 1242 1255 1972 1525 1962 1799 2090 1976 2098 2435 573 914 1964 2186 1226 1960 417 422 533 1087 661 861 1209 1382 1392 1083 1932 1794 1778 2179 2752 2482 2487 2570 2574 2316 2674 2887 2677 3071 3073 2423 2897 2757 2764 1192 1910 2073 1440 1788 1899 1903 2166 2396 2291 2873 2473 2659 2556 2658 1887 2653 2651 3006 2154 2160 2159 2296 2301 2307 2398 2153 2470 2155 2299 2297 2657 2661 2740 2876 2743 3109 2300 2662 2819 241 242 428 1479 1485 1818 249 559 552 1241 1811 2198 402 406 876 898 1224 925 532 542 543 658 544 834 1782 1907 415 888 837 855 1096 1214 1454 1393 421 546 1092 868 885 860 1429 1206 1212 1410 1191 1374 1202 1422 2173 2308 2310 1783 2189 536 1093 913 1228 1913 1920 1922 2320 2498 408 675 2490 3025 2749 3214 3263 3481 3525 729 1771 2156 2305 2736 2948 1787 2180 2404 2567 2669 2821 2182 2825 2961 2954 2955 3067 1762 2068 2489 2563 2748 2553 2735 2815 3063 3163 3262 3302 3115 3209 3264 3119 3210 3127 3555 3558 803 1184 2060 1356 2471 2552 1908 2074 2655 3068 256 183 175 591 445 66 184 72 999 588 585 446 83 266 1007 178 75 176 177 76 174 2245 2243 2360 2355 2235 2025 2021 2024 2020 1854 1626 1621 1612 1604 1860 1856 1630 996 708 451 182 992 85 603 2630 455 456 1167 1021 1663 457 1017 265 998 1631 1646 601 713 1294 988 1279 1138 1991 1282 2113 1594 1846 1847 971 1143 1144 1994 1995 2229 1139 1278 1595 1596 1833 991 1999 1606 1154 1607 1608 1845 1130 1136 1544 1989 2341 1827 989 993 1151 1605 1587 1997 2114 2231 2453 2523 2620 1158 2032 2040 2037 2254 2530 2800 2720 2803 1660 2267 2136 2634 1591 1998 2226 2352 2527 2454 2518 2623 2629 2627 1837 2225 1992 2227 2350 2111 2347 2519 2512 2513 2612 2915 2987 2923 2858 2631 2920 2794 2528 2256 2131 2038 2252 2348 2233 2701 2230 2006 1147 3194 3185 2985 2517 2768 2611 2604 2437 2351 2356 2112 1156 81 1006 275 1035 1039 1694 1040 717 1681 1684 1876 1036 1037 1884 2050 1707 1303 1027 2044 2048 2638 2810 2047 2375 2464 2808 2933 1881 715 2269 2370 460 612 463 724 464 719 720 1714 718 1875 2374 2279 1033 1172 2270 2377 2277 1705 2280 1670 2141 2643 1665 2533 2534 2718 3046 2861 2864 3331 3469 3493 1058 805 802 740 620 488 469 381 359 292 199 111 1188 786 755 641 485 343 307 203 155 113 1 104 6 1060 807 764 627 484 367 352 145 138 131 116 51 114 1335 811 810 779 753 482 380 289 221 219 165 163 126 40 117 1886 799 517 61 816 36 527 516 473 470 383 41 112 506 328 97 121 212 364 196 1316 1890 1354 1322 1059 1057 804 346 99 133 3 32 35 28 29 58 1333 1061 626 625 521 520 489 481 344 329 327 315 303 288 285 284 220 194 135 119 96 128 633 737 758 7 1746 1330 1329 1326 754 752 743 741 738 733 646 635 491 480 474 472 351 335 158 153 150 93 141 769 10 1893 1334 1063 1052 800 744 644 501 362 320 316 293 164 154 120 118 33 110 91 1359 1353 1056 801 526 507 479 471 321 311 211 95 107 522 151 518 348 771 371 278 210 147 56 140 1357 1064 1183 643 146 159 144 379 43 106 31 2290 1313 1186 1752 1754 1751 1065 49 632 39 2293 2151 2650 2648 2150 1753 1343 1336 2061 1317 1185 746 378 282 508 376 55 137 505 2 195 514 1748 1352 790 776 761 222 193 167 809 806 217 92 136 12 14 15 20 21 500 468 377 353 337 326 325 324 308 305 302 295 223 198 197 98 100 510 524 630 636 637 745 747 775 788 812 813 818 13 18 38 44 23 523 492 368 354 357 355 347 345 340 334 333 331 322 318 306 301 291 283 162 30 101 623 634 640 642 762 773 774 791 814 1187 1319 1749 1757 1311 1312 1315 1320 1324 1327 1332 1339 16 1355 1347 1345 1344 1321 772 765 757 756 751 749 639 631 622 496 374 363 360 358 356 332 296 207 201 130 129 127 46 103 777 789 793 502 1349 792 781 361 300 206 52 105 5 17 42 45 27 1054 511 483 476 369 366 339 323 319 309 304 299 213 161 143 60 134 515 621 645 750 780 784 797 817 1348 1331 1318 1342 1325 1314 783 742 739 734 730 728 629 503 499 494 478 312 286 277 166 160 34 115 8 11 1350 1328 748 732 513 497 498 493 384 382 336 314 294 290 287 280 214 205 152 125 19 123 763 768 782 785 795 815 819 9 22 47 48 24 26 59 375 373 370 365 317 298 297 281 168 139 109 108 94 102 388 475 477 486 495 509 525 731 735 736 759 767 770 787 798 820 122 330 628 215 490 1055 1338 148 200 385 504 794 349 350 216 487 796 1181 1182 1337 1759 1891 1888 2385 1892 1747 2469 2289 2387 2474 2652 2874 2737 142 62 67 590 87 449 63 65 2249 2028 1620 1288 1005 2365 2253 2129 2019 1857 1286 1153 1002 1000 597 448 82 262 169 259 586 602 1003 179 187 255 260 261 447 587 589 604 1159 1640 1642 2022 1290 1644 1622 1285 1602 2003 2122 2242 2246 2452 2244 2247 2460 2264 2263 2260 2134 2362 2125 2031 2126 2023 2015 2120 2007 2124 2018 2251 1855 1161 454 1009 712 257 593 77 171 2367 2633 2632 2532 1015 1165 1025 1169 1671 1678 2041 1650 1651 1020 1672 1673 1877 1647 1648 1862 1866 1869 1870 2039 2042 2258 2261 1686 1879 1689 2142 1693 2274 2276 1166 1168 1680 1874 2045 2268 2143 2273 64 74 70 80 1152 1008 1001 997 706 600 596 594 450 86 263 68 599 598 452 264 71 258 1633 1632 1629 1625 1624 1623 1291 1160 1011 994 1641 1639 1635 1634 1157 1010 710 592 173 78 172 1638 1645 2248 180 254 709 987 1284 1613 1614 2009 1627 1628 1636 2127 1149 1610 1616 1603 1609 1611 1618 1850 2013 1643 1859 2016 2123 1863 2237 2239 2458 1834 1842 2002 1844 2011 2238 2457 2525 2526 2621 2622 1996 2117 2121 2359 2709 1012 1649 1658 1662 1864 1667 1865 1668 2369 1013 1014 1016 1163 1019 1170 1652 1655 1656 1664 1867 1657 1659 2135 2137 2138 1162 1293 1654 1669 1868 2033 2034 2035 2036 2133 2262 595 995 1004 605 714 1155 1287 1637 1858 2027 2029 2259 2361 1615 1848 1838 2000 2116 1861 2014 2358 2128 2250 2132 2257 2349 2628 2529 2798 2711 2799 2791 2921 2712 2924 3044 2854 2856 2635 2719 2802 2863 2995 2004 2366 2363 269 271 609 273 608 458 606 607 1031 1302 1299 1300 1688 1682 1692 716 1023 1018 1295 1030 1304 1685 1691 2272 1028 1029 1032 1034 1301 1171 1674 1675 1676 1679 1872 1687 1878 2046 2271 1173 1695 1697 1696 2275 2465 1307 1702 1706 1700 1701 1708 1704 1710 2380 2146 2379 2378 2467 1024 1292 1871 1661 1677 2372 1297 1690 1698 1298 1306 2144 2139 2145 1666 1873 2463 1683 2140 2536 2538 2637 2723 2639 2724 3000 3002 3102 3103 3056 3052 3100 3101 3248 2540 2644 2640 2642 2726 2730 2727 1296 1305 1880 2617 2616 2236 3099 3047 2998 3191 3151 3096 2991 3192 3093 2792 2860 2855 2459 2717 2714 2371 2462 2265 1164 1853 1653 1022 2017 707 73 170 2255 2715 3097 3155 3288 3195 3367 2466 2725 2645 2934 3003 2731 2869 3057 2809 2867 3055 3160 2728 2868 2535 2636 2537 2722 2930 2716 2928 3048 3157 2996 3156 3197 3287 3053 3054 3250 3291 3251 3292 3329 2721 2929 2994 2997 2801 2925 2866 3049 2806 3159 2993 3196 3246 224 225 923 548 228 231 238 554 562 917 229 236 685 1119 912 922 930 937 944 945 948 1503 1523 1813 1968 689 1114 1116 1513 1129 1251 1533 1249 1527 2097 389 419 528 647 535 545 652 874 896 904 1225 877 884 889 670 671 875 880 881 882 893 1220 1223 1446 1495 1790 2085 1478 1952 1945 1950 227 230 560 918 921 929 395 396 404 1084 1450 1459 1934 1099 1112 1463 1800 1954 1102 1465 1466 1473 1237 1245 1797 1499 1509 1511 1528 2091 1113 1501 1524 1472 1482 1490 1801 1804 426 430 431 690 953 960 962 1254 1536 570 571 583 572 577 688 932 952 956 958 1122 432 582 697 700 961 1127 683 1115 1519 1814 2204 433 439 569 576 1126 694 701 986 442 969 976 977 1566 979 692 968 973 967 985 1140 1542 1543 1555 1558 1572 1573 1575 1576 1831 2220 1560 1569 1585 702 703 705 1270 1588 1590 1593 1549 1559 990 1150 1835 1839 1851 1852 1589 1841 2228 2232 2103 2105 2447 2449 2442 434 955 574 911 926 1098 1507 1808 1816 2092 1969 1822 584 699 693 677 691 938 954 1266 1567 1570 1979 1990 1582 1821 1819 1273 1274 1993 2109 2001 529 654 664 856 1075 650 656 657 824 840 845 865 1070 1071 1195 1366 1414 1774 2077 1909 2075 2076 2167 537 903 1452 1775 2082 2183 651 839 866 1076 668 852 862 863 1384 1385 1408 1426 1444 662 847 858 1072 1213 1425 897 1090 1445 1462 2083 1067 1068 1074 1402 1409 1419 1427 1431 1773 1911 1776 1915 1403 1439 1378 1396 1761 1767 1769 1770 1901 1367 1386 1388 1369 1373 2067 2162 2555 2401 2407 823 854 1772 1205 1897 2483 2668 2485 2561 2388 2393 2392 2739 2664 2476 2654 3107 3110 2744 2881 2883 2761 672 872 878 869 1938 1117 1120 1190 1198 1203 1434 1441 1898 2304 1372 1380 1365 1906 1764 226 234 247 558 924 245 244 246 555 564 682 233 556 557 565 248 550 551 427 429 438 680 681 934 940 943 947 949 1124 1133 1137 1250 1253 1263 1537 1538 1824 1974 678 684 687 933 936 939 941 942 951 1121 1134 1534 2102 959 963 1125 980 1236 1238 1807 1467 1474 1475 1477 1480 1484 1487 1506 1817 1958 1961 1966 1247 1796 1798 1806 1256 1514 1515 1520 1812 2199 2201 2206 2436 2330 240 549 553 392 416 1105 1109 1469 1476 1483 1488 1217 1221 1233 1461 1240 1244 1246 1464 1468 1481 1489 1510 1522 1531 892 2191 2429 2416 2679 443 444 579 698 970 972 974 983 978 982 1265 1268 1540 1557 1564 1574 1586 1532 1820 1978 2107 2222 2208 2343 1280 1601 1832 1840 1987 1141 1271 1146 1269 1283 1541 1545 1548 1551 1554 1561 1563 1578 1828 1829 2217 1546 1547 1550 1553 1565 1568 1571 1580 1584 1581 1982 1988 2110 1275 1276 1277 1281 1552 1556 1830 2438 563 916 1491 1802 1493 1810 1965 1243 1955 2200 1252 1257 1264 1971 1261 1539 2108 2610 2340 2440 2445 2607 2844 2420 2422 2584 2687 2431 2501 2508 2594 2598 2606 2503 2592 2591 2690 1784 1931 2411 2419 2426 2678 1803 1815 1959 2093 2094 2195 2197 2328 2493 2585 2588 2590 2831 2895 3021 2834 2892 2963 2893 3216 3223 1207 1902 1399 2065 2158 2161 2302 2394 2172 2402 2405 2408 2390 2477 2481 1458 2080 2323 2410 2673 2885 2959 235 251 561 409 413 423 424 1095 1218 1229 1230 1455 1795 1937 2084 2192 2332 2414 2421 1108 1492 1793 1953 1451 1914 2175 1936 2184 2188 1222 2089 2321 655 1216 667 846 848 1423 1080 1194 1204 1196 1394 1896 2309 2400 2742 2070 2164 2165 2079 2170 2177 2484 2491 1766 2066 1894 2157 1905 2072 2389 2391 2472 2169 2171 2562 2565 2667 2882 2816 2822 3012 3014 391 400 410 399 401 420 425 674 541 1089 1094 870 894 895 907 1234 648 660 663 666 669 831 842 849 393 403 673 887 890 891 902 906 1219 1232 1460 659 826 829 835 873 883 886 1082 1086 1088 1215 1424 1432 1433 1436 1442 1785 1916 1924 1106 1110 1231 1471 1789 1941 2187 2315 2088 830 836 1081 1401 1404 1420 1435 1412 1418 1777 1919 1930 1933 1940 2306 2311 1078 1197 1208 1210 1368 1760 1768 2071 1362 1391 1364 1376 1377 1389 1398 1763 394 397 398 411 414 538 547 867 879 899 909 530 649 1091 821 833 853 1066 1073 1077 832 841 844 864 1069 1079 1405 1407 1413 1417 1437 1438 1406 1411 1421 1428 1430 1200 1375 1379 1381 1363 1371 1395 1400 1904 2064 1456 1944 1917 1926 1928 2313 1943 2081 2176 1415 1416 1786 1443 1765 1900 2418 2492 2884 2571 2575 2670 3265 3306 568 580 1132 966 696 1258 1505 1977 2101 2095 1825 1984 2207 2211 2214 1970 1826 1973 2441 2511 2782 2428 2507 2596 3029 1981 2106 2212 2346 2219 2209 2337 2335 2344 2345 2218 2342 2448 2336 2443 2694 2769 2977 2772 2432 2600 2691 2765 2771 2839 2766 2778 2907 2838 2689 2898 2754 2759 2605 2837 2902 2972 3133 2967 3132 3077 3134 3083 3141 3179 2502 2688 3030 3032 2970 3031 3079 3129 2609 2613 2774 2781 2840 2697 2779 704 1148 1619 1849 2115 2118 2223 2455 2522 2010 2240 2241 2456 2524 2516 2625 2705 2917 2986 2618 2619 2699 2710 2624 2702 2916 2785 2789 2850 2005 2354 2364 2012 2357 2521 2708 1123 1131 1529 1272 1980 1986 1142 1583 2520 1598 1600 1843 2353 2626 2707 2450 2700 2614 2698 2913 2914 2908 2909 2973 3137 3040 3452 3484 2989 3149 3190 3152 3193 3245 3361 3187 3189 3280 3284 3402 3355 3356 3359 3400 3462 3463 2910 3089 3144 3237 3143 3282 3321 3351 3145 3182 3273 3043 3090 3091 3095 3360 3430 3283 3285 3323 3326 3465 441 931 1128 1496 1949 1530 1504 1521 1975 2327 825 850 1453 1935 2317 1780 1921 900 919 1103 910 1097 828 1387 1390 2163 2475 2566 2168 2303 1193 1923 1895 2069 1925 1929 2314 2399 2488 2298 2560 2568 2676 1383 1227 2185 2413 1946 2319 2324 2193 2194 2326 2681 2684 2683 2763 2835 3026 3128 3172 3069 3116 3121 2564 2672 2818 2747 2950 3108 3117 3256 2500 2903 2968 3123 3126 3226 3311 3349 3385 3424 3038 3041 3281 2557 2741 2875 3010 2649 2660 2880 3061 3205 3206 3299 2671 2686 2829 2830 2960 2886 2820 2823 2890 2962 3072 3114 2953 3066 3166 3208 1259 2216 2210 2444 2446 2213 1967 2339 2099 2685 2756 2827 2889 3022 2900 3125 2692 2770 2784 2983 2786 3037 3139 2767 2773 2904 3034 3078 2845 2787 2847 2841 2842 2461 2795 3154 2514 2984 2988 3148 2703 2857 2852 2918 3241 3404 1447 2178 2181 1517 2205 2593 1948 2190 2325 2331 2582 2586 2899 2415 2579 2569 2751 2824 2832 3013 3070 3023 3212 3131 2601 2888 2896 2572 2958 3165 2675 2334 2583 2762 2826 3019 3122 2828 3017 3020 3028 3016 3018 2849 2911 2982 2906 2976 2978 3085 2901 2969 2965 3035 3036 3177 3228 3234 3483 3354 3232 3272 3269 3386 3217 3304 3342 3446 3420 3508 3529 3220 3225 3268 3347 3388 3480 3423 3421 3393 3511 3531 3239 3317 2964 3024 3266 3384 3215 3224 3274 3175 3313 3422 3507 3510 3532 3576 3596 3580 2814 3060 2949 3009 3257 3300 3337 3336 3338 3417 3477 3415 3498 3551 3616 3618 3672 3714 3671 3375 3632 3380 3381 3414 3440 3441 3553 3449 3502 3505 3503 3506 3527 3554 3593 3574 3653 3715 3673 436 964 3750 575 578 1486 1985 2224 2451 2338 2597 2979 2980 2919 3186 3240 3278 3320 3150 3130 3308 3229 3230 3233 3512 3146 3238 3276 3279 3399 3401 3403 3515 2086 2312 2894 2957 3340 3382 2780 2843 3076 3086 3178 3310 3426 3231 3235 3319 3389 3391 3427 3348 3509 3443 3447 3395 3557 3559 3624 3681 3758 3301 3442 3445 3474 3549 3621 3696 3500 3523 3550 3617 3439 3575 3697 3674 3675 3757 3726 3678 3698 1341 1361 2295 1889 2058 2549 2059 2063 2395 2656 2878 2738 2812 2813 3005 3008 3259 3004 2879 3203 3334 3412 3494 3007 3297 3204 3298 3374 2479 2551 3011 3062 3167 2665 3296 3162 3333 1918 2663 2746 2753 2682 3168 2877 2891 3173 3118 3383 3015 3170 3376 3495 3573 3592 3413 3476 3552 3594 3451 3560 3561 3578 3142 3180 3314 3387 3221 3344 3350 3425 3398 3489 3637 3504 3528 3623 3656 3658 3713 3597 3635 3626 3709 3634 3680 3377 3591 3756 3830 3620 3655 3699 3824 3833 3751 3774 3840 3654 3701 3784 3705 3708 3730 3345 3501 3581 3418 3619 3676 3736 3707 3695 3855 3725 3771 3832 3847 3657 3682 3737 3685 3783 3794 3804 3823 3704 3716 3814 3772 3878 3900 3803 3829 3752 3839 3793 3880 3865 3961 3906 3925 3926 3831 3876 3838 3856 3857 3858 3867 3922 3932 3933 3952 3970 3999 3991 2641 3252 3001 3293 2804 2862 2865 2851 2859 2926 2932 3051 2992 3098 3290 3406 3289 3468 2999 3629 3669 3712 3650 3645 3665 3710 3724 3780 2853 3243 3464 3516 3286 3318 3641 3460 3719 3491 3533 3607 3566 3582 3601 3636 3683 3760 3761 3659 3706 3689 3796 3813 3365 3467 3368 3409 3407 3435 3522 3611 3651 3694 3693 3568 3586 3570 3668 3588 3649 3537 3744 3646 3691 3666 3769 3188 3357 3458 3459 3538 3242 3358 3457 3488 3428 3429 3431 3539 3487 3517 3536 3324 3363 3433 3585 3608 3405 3518 3461 3490 3486 3514 3540 3456 3534 3567 3584 3604 3603 3688 3778 3642 3745 3723 3644 3667 3732 3720 3746 3562 3600 3738 3741 3773 3785 3564 3660 3602 3684 3717 3661 3662 3663 3786 3816 3817 3766 3852 3807 3881 3797 3818 3871 3914 3806 3826 3862 3820 3834 3822 3868 3879 3887 3199 3327 3364 3466 3520 3294 3330 3436 3471 3545 3571 3569 3470 3521 3627 3648 3253 3437 3613 3332 3546 3770 3791 3864 3811 3836 3905 3874 3934 3884 3821 3434 3587 3609 3643 3647 3692 3610 3754 3625 3762 3776 3763 3788 3805 3795 3740 3815 3640 3686 3753 3779 3768 3808 3870 3850 3853 3798 3845 3799 3882 3904 3812 3863 3899 3875 3872 3893 3924 3950 3975 3903 3931 3966 3930 3943 1026 2043 2373 2539 2541 2935 3158 3408 3492 3328 3366 2376 3050 2793 2796 2805 3249 3628 3542 3790 2287 2546 2149 2286 1885 1734 1736 1735 1048 619 1178 1047 466 1730 1726 1729 1727 1046 1045 88 616 722 725 1176 1043 1309 1720 1723 1712 2283 1725 1715 1717 1722 1716 1721 2734 2870 1699 2278 2542 1713 2281 2543 2544 2729 2937 2938 2732 2871 2872 2939 1719 1724 2382 2941 2943 89 1310 2148 2052 1042 1731 1044 1177 617 2285 1728 726 189 190 90 188 462 611 613 1718 2054 2646 268 272 274 270 276 1038 1883 610 1711 1882 614 1308 721 1175 2053 2147 2381 2284 1709 618 1738 1739 1733 1737 2055 2288 1740 2946 2384 2468 2548 1050 1179 1741 1732 2545 727 1742 1743 1745 1744 2947 2057 465 615 2282 2942 2056 2383 2547 3371 2647 2733 3104 3547 3201 3369 3438 2940 2944 3105 3295 3411 3472 3370 3792 3615 3670 191 192 1180 2945 3372 3652 3059 3202 3572 3749 3781 3630 3631 3735 3802 3895 3936 3886 157 4 149 2386 2294 1358 766 313 57 1062 467 372 37 341 25 124 1189 1051 1053 638 387 760 519 512 338 50 156 778 2550 2292 2152 1755 1346 1351 1360 1340 310 204 202 279 218 53 208 2397 1449 1323 342 386 209 1758 1756 624 132 54 1750 69 267 453 711 79 185 3027 3065 2486 2403 2322 1927 1779 859 1448 901 1457 1211 851 1792 252 2531 2266 2368 2119 2008 1289 2713 2026 84 181 440 679 927 1957 2203 2104 2696 2777 2615 2504 581 1823 946 950 1983 981 984 1562 2439 567 1579 1248 2096 2221 2234 2515 186 2130 237 566 1239 390 1085 871 437 957 975 2100 1135 2215 1145 1597 1592 1599 1836 1577 412 1951 2425 2433 405 2755 2811 3258 3260 3113 3305 3444 2922 3153 2931 2936 459 461 1041 723 1174 1703 2049 1049 3106 534 808 2412 2417 2666 3335 3379 3373 2790 3181 3198 2797 3042 2807 3612 3722 1617 2558 2750 3074 3075 3236 3322 3606 3543 3687 3082 3270 3392 3124 3084 3343 3448 3577 3775 3519 3638 3765 3835 3889 3901 3941 3911 3946 3949 3956 3981 3957 4007 4015 3605 3721 3747 3892 3894 3988 3748 3755 2051 3410 3254 3827 3782 3828 3968 3963 3965 2706 2927 3087 3140 3396 3485 3535 3563 3639 3731 3702 3727 3739 3718 3161 3200 3247 3544 3589 3590 2788 3316 3455 3513 3541 3219 3595 3743 3556 3679 3728 3700 3759 3837 3841 3861 3984 3973 3614 3711 3690 3809 3810 3890 3873 3935 3883 3915 3916 3733 3734 3800 3801 3960 3664 3825 3891 3898 3742 3843 3819 3849 3859 3777 3851 3860 3854 3920 3987 4000 4001 4020 3877 3944 3896 3928 3953 3885 3918 3910 3923 3955 3908 3938 3937 3951 3969 3992 3983 4006 3996 4014 3846 3958 2030 3271 3599 3703 3789 3844 3869 3959 3921 3995 3998 3866 3907 3927 3971 3919 3974 4008 4013 4053 4063 4012 4033 4039 4044 4047 4051 4024 4066 4035 4065 4069 4074 4092 4094 4067 4106 4096 4105 4059 4076 4083 4081 4103 4115 4073 4099 4082 4110 4119 4120 4117 4123 4070 4089 4112 4113 4101 4109 4111 4122 4125 4086 4093 4127 4129 4130 4131 4116 4121 4128 3729 3842 3848 3888 3897 3912 3967 3929 3940 3948 3764 3787 3767 3954 3962 4004 3985 3993 4023 4041 4050 3917 3939 3945 3979 3980 3978 3989 3990 3977 3902 3909 3947 3964 3972 3982 3913 3942 3986 4002 4009 4005 4018 4016 3994 4017 4022 4034 4060 4028 4040 4027 4032 4054 4062 4079 4080 4085 4097 4098 4071 4087 4019 4037 4038 4025 4021 4026 3976 3997 4011 4010 4003 4031 4072 4036 4042 4052 4084 4090 4045 4046 4055 4061 4108 4114 4056 4057 4064 4029 4030 4043 4048 4058 4075 4088 4095 4102 4068 4077 4078 4100 4104 4107 4124 3058 3255 4049 4091 4118 4126 4132 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 J 16 Data objek a ra k P e n g g a b u n g a n

  Gambar 3. Dendrogram hasil terbaik pengelompokkan DataNumerik Pengelompokkan terbaik diperoleh dari kombinasi ukuran jarak Cityblock distance dan metode penggabungan Average link dengan nilai cophenet 0,822. Dendrogram hasil pengelompokkan terbaik ditunjukkan oleh Gambar 3. Dengan memotong dendrogram pada jarak 2,8 dimana terjadi loncatan jarak penggabungan, diperoleh 69 kelompok.

  Dari 69 kelompok yang terbentuk, terdapat 6 kelompok besar (86,7% dari data observasi) dan 63 kelompok kecil. Karakteristik dari 6 kelompok besar disajikan pada Tabel 3. Tabel 3. Karakteristik 6 Kelompok Besar Hasil Pengelompokkan DataNumerik

  Nomor Kelompok

  Jumlah Anggota Karakteristik 18 2340 Usia 23 tahun, 13SKS, IPK 1,52 & Lama Studi 1,8 semester 62 641 Usia 31 tahun, 16SKS, IPK 1,64 & Lama Studi 2,5 semester 28 229 Usia 22 tahun, 44SKS, IPK 2,03 & Lama Studi 5,7 semester 23 136 Usia 42 tahun, 10SKS, IPK 1,40 & Lama Studi 1,9 semester 12 122 Usia 21 tahun, 12SKS, IPK 2,96 & Lama Studi 1,6 semester 47 116 Usia 23 tahun, 29SKS, IPK 1,42 & Lama Studi 7 semester

  Secara umum hasil pengelompokkan DataNumerik menunjukkan bahwa lebih dari 78% mahasiswa nonaktif belajar di UT hanya selama dua semester. Tingkat kelulusan matakuliah dalam

  Jurnal Matematika, Sains, dan Teknologi, Volume 14 Nomor 1, Maret 2013, 1-10

  dua semester pertama sangat rendah, hal ini ditunjukkan dengan rendahnya SKS dan IPK yang dicapai.

  Sebagaimana disampaikan Saxena (2002) bahwa dalam data kemahasiswaan sering tersimpan informasi yang sangat penting tentang mahasiswa. Pada pengelompokkan DataNumerik ditemukan beberapa kelompok kecil yang dapat dikategorikan sebagai outlier tetapi perlu mendapat perhatian karena merupakan informasi yang penting bagi pengelola UT. Sebagai contoh, kelompok 4 hanya beranggotakan 1 mahasiswa yang sudah menempuh 145 SKS dengan IPK 2,22 dan telah mengikuti pendidikan di UT selama 12 semester, sedangkan kelompok 16 beranggotakan 2 mahasiswa yang masing-masing telah menempuh 129 SKS dan 132 SKS dengan IPK 2,32 dan 2,11. Jika hanya dilihat dari SKS dan IPK seharusnya mahasiswa dalam kelompok 4 telah memenuhi syarat kelulusan, sedangkan mahasiswa dalam kelompok 16 berpotensi tinggi untuk dapat menyelesaikan studinya. Perlu pemeriksaan lebih lanjut apa yang menyebabkan mahasiswa tersebut berstatus nonaktif.

  Pengelompokkan DataGabungan

  Hasil pengelompokkan DataKategori menempatkan data obyek ke dalam 44 kelompok, sedangkan hasil pengelompokkan DataNumerik menempatkan data obyek ke dalam 69 kelompok. Struktur masing-masing keluaran tersebut berupa vektor berukuran 4132 (merepresentasikan data obyek) yang berisi nomor kelompok dimana data obyek berada.

  DataGabungan dibangun hanya dari enam kelompok besar hasil pengelompokkan DataKategori dan enam kelompok besar hasil pengelompokkan DataNumerik. Alasannya bahwa kelompok-kelompok tersebut merepresentasikan keluaran dari masing-masing proses pengelompokkan karena mewakili lebih dari 80% keseluruhan data observasi.

  Anggota dari DataGabungan adalah irisan enam kelompok besar hasil pengelompokkan DataKategori dan enam kelompok besar hasil pengelompokkan DataNumerik. DataGabungan berbentuk matrik 3069x2 dengan atribut pertama berisi nomor kelompok dari hasil pengelompokkan DataKategori dan atribut kedua berisi nomor kelompok dari hasil pengelompokkan DataNumerik.

  Kelompok yang dihasilkan oleh suatu algoritma pengelompokkan menempatkan setiap data obyek ke dalam satu kelompok tertentu. Jika dua obyek berada dalam kelompok yang sama maka kedua obyek tersebut dianggap sama. Sebaliknya jika dua obyek berada dalam kelompok yang berbeda maka kedua obyek dianggap berbeda. Jelas bahwa kelompok yang dihasilkan oleh setiap algoritma pengelompokkan tidak dapat diurutkan sebagaimana mengurutkan bilangan riil. Oleh karenanya kelompok-kelompok tersebut dapat dipandang sebagai data kategori. Zengyou et al. (2002) menyampaikan bahwa karena keluaran dari masing-masing algoritma klastering merupakan data kategori, maka persoalan cluster ensemble dapat dipandang sebagai persoalan pengelompokkan data kategori. Hasil dari masing-masing algoritma pengelompokkan dapat digabung menjadi data baru dengan tipe kategori. Karena itulah pengelompokkan DataGabungan menggunakan algoritma QROCK.

  Pengelompokkan DataGabungan dilakukan dengan lima variasi nilai threshold 0,6, 0,7, 0,8, 0,9 dan 1,0. Hasil terbaik pengelompokkan diperoleh pada threshold 1,0, menghasilkan 35 kelompok. Dari 35 kelompok yang dihasilkan, terdapat 7 kelompok besar (78% dari data observasi) dan 28 kelompok kecil. Karakteristik 7 klaster besar tersebut, sebagaimana disajikan pada Tabel 4, merupakan kombinasi dari lima klaster terbesar hasil klastering DataKategori dan dua klaster terbesar hasil klastering DataNumerik.

  Rahayu, Analisis Karakteristik Kelompok

  Dapat dikatakan bahwa Tabel 4 merepresentasikan karakteristik kelompok-kelompok mahasiswa nonaktif Program Studi Matematika tahun 2008. Kelompok-kelompok yang terbentuk memiliki kesamaan pada pendidikan akhir (SLTA), status pekerjaan, status perkawinan, dan jenis kelamin. Faktor prestasi akademik menunjukkan bahwa dua semester pertama merupakan masa kritis bagi mahasiswa Program Studi Matematika UT. Tingkat kelulusan matakuliah dalam dua semester pertama sangat rendah. Hal ini ditunjukkan dengan rendahnya SKS dan IPK yang dicapai.

  Tabel 4. Karakteristik 7 Kelompok Terbesar Hasil Pengelompokkan DataGabungan Nomor Jumlah

  Karakteristik Anggota Kelompok Kelompok Anggota 2 745 Laki-laki bekerja, tidak kawin, 23th, 13SKS,IPK1,52& 1,8 semester