BATASAN MASALAH Pengelompokan Sekolah Menengah Atas di Provinsi Daerah Istimewa Yogyakarta berdasarkan nilai Ujian Nasional menggunakan algoritma K-Means Clustering.
d. Analisis Cluster
Analisis klaster objek data tanpa berkonsultasi dengan label kelas yang diketahui. Data dikelompokkan berdasarkan prinsip memaksimalkan
kesamaan intraclass dan meminimalkan kesamaan antar kelas. Dengan kata lain, kelompok benda terbentuk sehingga objek dalam cluster
memiliki kesamaan yang tinggi dibandingkan satu sama lain , tetapi sangat berbeda untuk objek dalam cluster lainnya . Setiap cluster yang terbentuk
dapat dilihat sebagai kelas objek.
e. Analisi Outlier
Sebuah basis data dapat berisi objek data yang tidak sesuai dengan perilaku umum atau model data. Peristiwa langka bisa lebih menarik
daripada yang terjadi lebih teratur . Sebagian besar metode data mining membuang outlier sebagai noise atau pengecualian. Namun, dalam
beberapa aplikasi seperti deteksi penipuan, peristiwa langka bisa lebih menarik daripada peristiwa yang sering terjadi. Analisis data outlier
disebut sebagai outlier mining. Outlier dapat dideteksi menggunakan uji statistik yang
mengasumsikan distribusi atau model probabilitas data, atau menggunakan pendekatan jarak di mana objek yang berbeda dari setiap lainnya dianggap
outlier .
f. Analisi Evolution
Analisis evolusi menggambarkan data dan model keteraturan atau tren untuk objek yang perilakunya berubah dari waktu ke waktu. Meskipun
termasuk dalam karakterisasi, diskriminasi, asosiasi dan analisis korelasi, klasifikasi, prediksi, atau pengelompokan data, fitur yang berbeda dari
analisis tersebut meliputi analisis data time-series, urutan atau periodisitas pencocokan pola, dan analisis data berbasis kesamaan.
Han dkk,2006 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI