Principal Component Analysis Analisis data 1. Komputasi acoustic bottom backscattering

Pada penelitian ini Principal Component Analysis PCA digunakan untuk melihat hubungan antar parameter akustik dengan beberapa parameter fisika sedimen yang diduga dapat memberikan gambaran mengenai karakter dari dasar perairan. PCA menghitung suatu set variabel baru yang lebih kecil, variabel linear independen, yang disebut komponen utama Principal Component yang memberikan laporan dari sebagian besar perbedaan yang ada dalam data yang sebenarnya Gambar 17. Gambar 17. Proses klasifikasi nilai echo Preston, 2004

3.6.5. Clustering analysis

Clustering adalah operasi analisis multidimensional yang terdiri dari pembagian parameter-parameter deskriptor dalam suatu penelitian Legendre dan Legendre, 1998 . Clustering dapat diartikan sebagai proses pengelompokkan objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelascluster. Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering. Dua pendekatan utama adalah clustering dengan pendekatan partisi K-Means dan clustering dengan pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut dengan partition-based clustering Principal Component Analysis PCA mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada. Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan. Metode clustering yang akan digunakan pada penelitian ini untuk melihat hubungan antara nilai akustik dan sedimen properties yang ada adalah clustering dengan pendekatan hirarki. Metode clustering dengan pendekatan hirarki mengelompokkan data yang mirip dalam hirarki yang sama dan yang tidak mirip di hirarki yang agak jauh. Ada dua metode yang sering diterapkan yaitu agglomerative hieararchical clustering dan divisive hierarchical clustering. Agglomerative melakukan proses clustering dari N cluster menjadi satu kesatuan cluster, dimana N adalah jumlah data, sedangkan divisive melakukan proses clustering yang sebaliknya yaitu dari satu cluster menjadi N cluster. Salah satu cara untuk mempermudah pengembangan dendogram untuk hierarchical clustering ini adalah dengan membuat similarity matrix yang memuat tingkat kemiripan antar data yang dikelompokkan. Tingkat kemiripan bisa dihitung dengan berbagai macam cara seperti dengan Euclidean Distance Space. Berangkat dari similarity matrix ini, kita bisa memilih lingkage jenis mana yang akan digunakan untuk mengelompokkan data yang dianalisa, dimana pada penelitian ini digunakan average lingkage.