Principal Component Analysis Clustering analysis

Proses pengukuran sediment properties selain untuk melihat tekstur, sedimen juga digunakan untuk melihat ruang pori total dan densitas yang terkandung dalam sedimen. Densitas sedimen merupakan berat suatu volume sedimen dalam keadaan utuh yang dinyatakan dalam gcc. Pengukuran densitas dari sedimen dilakukan dengan menggunakan ring berukuran tinggi 5 cm dengan diameter 5 cm. Jika densitas berat isi telah diketahui, maka ruang pori total dihitung dengan menggunakan persamaan: Ruang pori total = 1 − x 100 ………. 12 Untuk klasifikasi tipe substrat di lokasi penelitian, maka dilakukan pengklasifikasian dengan menggunakan diagram segitiga tekstur USDA.

3.6.4. Principal Component Analysis

Principal Component Analysis PCA adalah cara untuk mengidentifikasi pola-pola dalam data dan mengungkapkan data sedemikian rupa untuk melihat persamaan dan perbedaan dari data Smith, 2002. Prosedur PCA pada dasarnya adalah bertujuan untuk menyederhanakan variabel yang diamati dengan cara menyusutkan mereduksi dimensinya. Hal ini dilakukan dengan cara menghilangkan korelasi diantara variabel bebas melalui transformasi variabel bebas asal ke variabel baru yang tidak berkorelasi sama sekali atau yang biasa disebut dengan principal component Soemartini, 2008. Principal Component Analysis PCA diterapkan pada data untuk menghilang redundansi. Jumlah Principal Component yang dipilih ditentukan oleh banyaknya variasi yang ada. Principal Component Analysis PCA ini bertujuan untuk : 1. Mengidentifikasi peubah baru yang mendasari data peubah ganda. 2. Mengurangi banyaknya dimensi himpunan peubah yang biasanya terdiri dari peubah yang banyak dan saling berkorelasi menjadi peubah baru yang tidak berkorelasi dengan mempertahankan sebanyak mungkin keragaman dalam data. 3. Menghilangkan peubah-peubah asal yang mempunyai sumbangan informasi yang kecil. Pada penelitian ini Principal Component Analysis PCA digunakan untuk melihat hubungan antar parameter akustik dengan beberapa parameter fisika sedimen yang diduga dapat memberikan gambaran mengenai karakter dari dasar perairan. PCA menghitung suatu set variabel baru yang lebih kecil, variabel linear independen, yang disebut komponen utama Principal Component yang memberikan laporan dari sebagian besar perbedaan yang ada dalam data yang sebenarnya Gambar 17. Gambar 17. Proses klasifikasi nilai echo Preston, 2004

3.6.5. Clustering analysis

Clustering adalah operasi analisis multidimensional yang terdiri dari pembagian parameter-parameter deskriptor dalam suatu penelitian Legendre dan Legendre, 1998 . Clustering dapat diartikan sebagai proses pengelompokkan objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar kelascluster. Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering. Dua pendekatan utama adalah clustering dengan pendekatan partisi K-Means dan clustering dengan pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut dengan partition-based clustering Principal Component Analysis PCA mengelompokkan data dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada. Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki yang berjauhan. Metode clustering yang akan digunakan pada penelitian ini untuk melihat hubungan antara nilai akustik dan sedimen properties yang ada adalah clustering dengan pendekatan hirarki. Metode clustering dengan pendekatan hirarki mengelompokkan data yang mirip dalam hirarki yang sama dan yang tidak mirip di hirarki yang agak jauh. Ada dua metode yang sering diterapkan yaitu agglomerative hieararchical clustering dan divisive hierarchical clustering. Agglomerative melakukan proses clustering dari N cluster menjadi satu kesatuan cluster, dimana N adalah jumlah data, sedangkan divisive melakukan proses clustering yang sebaliknya yaitu dari satu cluster menjadi N cluster. Salah satu cara untuk mempermudah pengembangan dendogram untuk hierarchical clustering ini adalah dengan membuat similarity matrix yang memuat tingkat kemiripan antar data yang dikelompokkan. Tingkat kemiripan bisa dihitung dengan berbagai macam cara seperti dengan Euclidean Distance Space. Berangkat dari similarity matrix ini, kita bisa memilih lingkage jenis mana yang akan digunakan untuk mengelompokkan data yang dianalisa, dimana pada penelitian ini digunakan average lingkage. 4

4.1. Sedimen dasar p