Prosedur Pengolahan Data Analisis Cluster

3.3 Prosedur Pengolahan Data

Bagan alir penyusunan model prediksi awal musim hujan di sajikan dalam Gambar 7, Metode penyusunan model dapat di jelaskan sebagai berikut : Gambar 8. Diagram alir penyusunan model prediksi AMH Kelompokan sta yang memiliki kemiripan AMH dengan cluster Tentukan domain SML yang berkorelasi tinggi tiap kelompok AMH Susun Pers. Hubungan antara PC anomali SML pada domain terpilih vs AMH tiap kelompok stasiun Daftar pengelompokan hasil cluster Rata-rata AMH berdasarkan daftar kelompok Analisis Korelasi Spasial Anomali SML vs AMH tiap kelompok Gunakan model untuk memprediksi AMH tahun 2008 Verifikasi Model PETA SKILL AMH Evaluasi Skill Model AMH dengan ROC Pilihekstrak data prediktor Anomali SML sesuai dengan Domain terpilih Reduksi Data Anomali SML Uji Kelayakan Model dengan Validasi Silang Data AMH Stasiun wilayah Jawa Periode 1978-2008 Data SML spasial Wilayah Global Periode 1978-2008

3.4 Analisis Cluster

Analisis cluster merupakan teknik multivariat ∑∑ − = = = G g n i g x x i W 1 1 2 yang mempunyai tujuan utama untuk mengelompokkan beberapa objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam kelompok yang sama. Kelompok yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Banyaknya cluster ditentukan dengan plot jarak antar data sebagai fungsi dari jumlah cluster. Bila terjadi lompatan signifikan jarak antar data maka dapat di tetapkan sebagai referensi jumlah cluster. Metode pemecahan dimulai dari satu kelompok besar yang mengandung seluruh observasi, selanjutnya observasi yang paling tidak sama dipisah dan dibentuk kelompok yang lebih kecil. Proses ini dilakukan hingga tiap observasi menjadi beberapa kelompok kecil objek. Kesamaan antar objek merupakan ukuran korespodensi antar objek. Teknik untuk mengukur jarak dalam metode ini yaitu metode ward’s, dengan menghitung jumlah kuadrat antara dua kelompok untuk seluruh variabel, formulasinya adalah : Dimana ; W : Jarak G : Kelompok Besar g : Objek kelompok kecil

3.5 Menghitung PCA Principal Componen Analysis