CLUSTERING SUHU PERMUKAAN LAUT SEBAGAI I

CLUSTERING SUHU PERMUKAAN LAUT SEBAGAI IDENTIFIKASI
KEBERADAAN SUMBER DAYA IKAN LAYANG DI PERAIRAN
SELAT MADURA MENGGUNAKAN METODE FUZZY C-MEANS

Fifi D. Rosalina1.
Universitas Islam Negeri Sunan Ampel, Surabaya, Indonesia1, .
E-mail: [email protected].

Abstrak
Suhu permukaan laut dinilai sebagai parameter cuaca yang sangat penting sebagai salah satu faktor pengendali
iklim dan curah hujan di Indonesia yang mana wilayahnya didominasi oleh wilayah perairan. Karena didominasi
oleh wilayah perairan maka banyak penduduk Indonesia yang bermata pencaharian sebagai nelayan dimana
kegiatan tersebut sangat bergantung pada kondisi cuaca yang terjadi. Banyaknya ikan yang berhasil diperoleh
bergantung pada minimum dan maksimum besarnya suhu permukaan laut dalam hal ini akan dilakukan
pengclusteran suhu permukaan laut yang juga memperhatikan beberapa faktor seperti suhu udara, kecepatan
angin, dan curah hujan yang akan diclusterkan sebanyak 3 cluster dan selanjutnya akan dilakukan validasi
dengan proses training dan testing. Untuk melihat hasil terbaik dari proses pengclusteran yang dilakukan maka
akan dilakukan validasi menggunakan metode Silhouette Index yang digunakan untuk menghitung jarak antar
data yang menunjukkan hasil nilai SI yang kurang dari 1 atau menjauhi 1 yang mengartikan bahwa hasil
pengclusteran sudah tepat dan terdapat nilai SI yang mendekati 0 yang mengartikan bahwa terdapat data hasil
pengclusteran yang berada pada perbatasan 2 cluster. Hasil dari pengclusteran ini dapat dijadikan sebagai

langkah untuk membuat Fuzzy Inference System yang digunnakan untuk mendeteksi keberadaan ikan layang di
Selat Madura.
Kata kunci: suhu permukaan laut, Fuzzy C-Means

1. Pendahuluan
Banyaknya wilayah perairan yang
mendominasi wilayah Indonesia membuat
Indonesia terkenal sebagai negara dengan
seribu pulau, hal ini menyebabkan perubahan
iklim yang terjadi di Indonesia bergantung
pada kondisi yang terjadi di laut dan di darat.
Interaksi yang terjadi pada kondisi di laut dan
di darat terbagi menjadi 3 faktor yaitu faktor
global, regional, dan lokal. Pada faktor global
meliputi El Nino–Southern Oscillation
(ENSO) yang merupakan suatu kondisi
anomali suhu permukaan laut yang terjadi di
Samudera Pasifik bagian Tengah hingga
Timur dimana suhu permukaan laut yang
terjadi lebih tinggi dari kondisi rata-ratanya

dan Indian Ocean Dipole Mode (IODM) yang
merupakan suatu kondisi yang mirip dengan
ENSO namun terjadi di Samudera Hindia

dimana peristiwa Indian Ocean Dipole Mode
(IODM) ditandai dengan terjadinya anomali
suhu permukaan laut yang terjadi di Samudera
Hindia tropis bagian barat dan timur.
Sedangkan faktor regional meliputi Monsun
yang merupakan suatu fenomena perbedaan
sel tekanan rendah dan sel tekanan tinggi yang
terjadi di Benua Asia dan Benua Australia
secara bergantian dengan perbedaan kecepatan
pemanasan yang terjadi di darat dan di laut.
Dan yang terakhir adalah faktor lokal yang
dipengaruhi oleh kondisi geografis masingmasing wilayah. Seperti yang telah disebutkan
diatas, suhu permukaan laut merupakan salah
satu faktor yang berperan penting sebagai
faktor pengendali iklim dan curah hujan di
Indonesia.

Karena suhu permukaan laut dinilai
sebagai parameter yang sangat penting dan

berkorelasi dengan wilayah Indonesia yang
didominasi oleh wilayah perairan, maka akan
dilakukan penelitian untuk mengcluster suhu
permukaan
laut
yang
diselesaikan
menggunakan metode Fuzzy C-Means.
Fenomena suhu permukaan laut dan penerapan
metode Fuzzy C-Means merupakan salah satu
permasalahan dan metode penyelesaian yang
telah banyak diaplikasikan dengan berbagai
topik permasalahan. Salah satu penelitian yang
mengkaji suhu permukaan laut adalah prediksi
suhu permukaan laut menggunakan ANFIS
yang mana pada penelitian tersebut
menghasilkan nilai akurasi 79,98% pada

kedalaman 1 dan 3 meter, 79,97% pada
kedalaman 5 meter [1], sedangkan pada
penelitian lain menggunakan Metode Fuzzy
Linear Regression dengan rata-rata kesalahan
prediksi sebesar 1,51% yang dilakukan
sebanyak 30 kali percobaan [2], dan contoh
yang terakhir adalah prediksi cuaca maritim
yang menggunakan metode Fuzzy SugenoTakagi yang digunakan untuk mendeteksi
keberadaan ikan yang mana pada penelitian
tersebut hanya menggunakan nilai input suhu
permukaan laut tanpa menggunakan beberapa
faktor yang mempengaruhi dengan nilai
RMSE validasi terbaik sebesar 0,217 dengan
akurasi 74,37% [3].
Dalam hal ini, penelitian yang
dilakukan
adalah
pengclusteran
suhu
permukaan laut yang dilakukan menggunakan

metode Fuzzy C-Means yang memiliki
keakuratan yang baik dalam pengclusteran
data. Hal ini didasarkan oleh penelitian yang
dilakukan oleh Jimmy dan Sherwin [4]dalam
penelitiannya pada segmentasi citra spot
menggunakan
Fuzzy
C-Means
yang
mengatakan bahwa metode tersebut memiliki
tingkta kestabilan yang lebih baik daripada
metode konvensional seperti K-Means. Selain
hanya memperhatikan perubahan suhu
permukaan laut yang terjadi dalam penelitian
ini juga memperhatikan faktor-faktor yang
mempengaruhi perubahan suhu permukaan
laut seperti kecepatan angin, curah hujan, dan
suhu udara. Sebagai negara seribu pulau
kondisi tersebut berbanding lurus dengan
banyaknya

penduduk
Indonesia
yang
bermatapencaharian sebagai nelayan, dimana
kegiatan nelayan tersebut juga bergantung
pada kondisi cuaca yang terjadi di laut,
terutama suhu permukaan laut. Sehingga
penelitian yang dilakukan diaplikasikan untuk
mendeteksi keberadaan ikan layang di Selat

Madura dengan melihat pola sebaran
perubahan suhu permukaan laut dimana ikan
layang berada pada kondisi optimum dengan
suhu 27,30 -28,13 .

2. Tinjauan Pustaka
2.1 Data Mining
Data mining merupakan suatu kajian
ilmu yang mempelajari persiapan data,
pengolahan fitur, klasifikasi, clustering,

evaluasi, asosiasi, dll. Data mining dapat
didefinisikan sebagai suatu proses yang
melakukan pembelajaran komputer dalam
menganalisis dan mengekstraksi pengetahuan
dari sekian banyak data yang dilakukan secara
otomatis. Atau dengan kata lain, data mining
dapat dikatakan sebagai suatu proses untuk
menemukan pola atau model yang shahih
dalam suatu database yang sangat besar.
Himpunan data pada data mining
mencakup data nominal dan data numerik,
sedangkan metode pada data mining
mencakup metode dalam estimasi, metode
dalam prediksi, klasifikasi, clustering, dan
asosiasi yang dapat diselesaikan dengan
metode-metode seperti Jaringan Syaraf Tiruan
(JST), metode C4.5, metode k-means, metode
Fuzzy C-Means, dll. Proses pembelajaran data
mining mencakup 3 langkah diantaranya
persiapan data yang berfungsi untuk

penanganan data yang memiliki noise, reduksi
data, pemilihan subset fitur, normalisasi data,
dan pembersihan data yang hasilnya dapat
mempengaruhi hasil output yang diperoleh
dimana suatu penelitian sangat bergantung
pada data yang valid. Langkah kedua yaitu
membangun model dan melakukan validasi
untuk mendapatkan suatu model terbaik yang
dapat diterapkan pada pembelajaran data
terhadap sistem yang dituju. Selanjutnya
langkah ketiga adalah penerapan, yaitu
memetakan
data
yang
baru
untuk
disimulasikan pada model terbaik yang telah
diperoleh untuk menghasilkan suatu prediksi.

2.2 Teori Fuzzy

Teori himpunan fuzzy diterapkan pada
suatu permasalahan yang menangani konsep
ketidakpastian atau ambigu yang pertama kali
diperkenalkan oleh Prof. Lotfi A. Zadeh [5]
pada beberapa kasus khusus, seperti nilai
keanggotaan yang kemudian akan menjadi 0
atau 1, teori dasar tersebut akan identik dengan
teori himpunan biasa dan himpunan fuzzy
akan menjadi himpunan crisp tradisional.

Namun yang menjadi permasalahan
adalah bagaimana tingkat kekaburan suatu
himpunan fuzzy dan bagaimana korelasi yang
terjadi pada dua himpunan fuzzy tersebut, hal
ini menimblkan munculnya suatu konsep yang
membahas tentang ukuran fuzzy yang
meninjau tingkat kekaburan dari suatu
himpunan fuzzy dan konsep ukuran kesamaan.

2.3 Fuzzy C-Means

Metode fuzzy clustering merupakan
suatu metode yang digunakan untuk
mengelompokkan data secara optimal dalam
suatu ruang vektor yang berdasarkan pada

bentuk normal Euclidian pada jarak antar
vektor. Salah satu metode dalam fuzzy
clustering adalah metode Fuzzy C-Means yang
diterapkan dalam penelitian ini yang dapat
direpresentasikan pada gambar 1.
Metode Fuzzy C-Means merupakan
suatu teknik peng-cluster -an yang mana
keberadaan tiap-tiap titik data dalam suatu
cluster ditentukan oleh derajat keanggotaan
[6]. Langkah pertama yang dilakukan pada
metode ini menentukan pusat cluster yang
merupakan lokasi rata-rata dari setiap cluster.

Gambar 1. Algoritma Fuzzy C-Means


Penentuan pusat cluster dilakukan dengan
memperbaiki pusat cluster dan derajat
keanggotaan secara berulang yang dilakukan
pada tiap titik data sehingga pusat cluster yang
dihasilkan dari proses perulangan akan
bergerak menuju lokasi yang tepat. Perulangan
ini dilakukan dengan melihat minimisasi
fungsi objektif. Hasil output dari metode
Fuzzy C-Means bukan merupakan Fuzzy
Inference System, namun berupa deretan pusat
cluster dan beberapa derajat keanggotaan
untuk tiap-tiap titik data yang mana informasi
ini digunakan untuk membangun suatu Fuzzy
Inference System [7]. Algoritma Fuzzy CMeans dituliskan sebagai berikut:
1. Input data yang akan dicluster X, berupa
matriks berukuran
dimana
=
jumlah sampe data,
= atribut setiap
data.
= data sampel ke-i
,
atribut
ke-j
.
2. Kemudian tentukan
a. Jumlah cluster = c
b. Pangkat = w

c.
d.
e.
f.

Maksimum iterasi = MaxIter
Error terkecil yang diharapkan =
Fungsi objektif awal
=
Iterasi awal =
3.
Bangkitkan bilangan random
sebagai elemenelemen matriks partisi awal U.
Hitung jumlah setiap kolom:

Hitung
4. Hitung pusat cluster ke-k:
dan

dengan

5. Hitung fungsi obyektif pada iterasi ke-t,
yang digunakan untuk proses perulangan
dengan dengan melihat besar kecilnya nilai
fungsi objektif

6. Hitung perubahan matriks partisi

Dengan i = 1,2,...,n dan k =1,2,...,c
7. Cek kondisi berhenti
a. Jika
atau
MaxIter maka berhenti
b. Jika tidak
, ulangi langkah ke4.

2.3 Silhouette Index
Silhouette Index (SI) merupakan suatu
metode evaluasi yang digunakan untuk
memvalidasi data yang telah dicluster dimana
metode tersebut digunakan untuk menghitung
jarak antar data yang digunakan baik data
tersebut dicluster sebanyak 1, ataupun lebih.
Nilai rentang SI berkisar antara -1 hingga +1.
Apabila nilai SI mendekati 1 maka data
tersebut menunjukkan bahwa data hasil
pengclusteran tersebut tidak tepat, sedangkan
apabila nilai SI bernilai 0 atau mendekati 0
maka data hasil pengclusteran tersebut berada
pada perbatasan dua cluster.

3. Metode Penelitian
3.1 Data
Dalam penelitian ini data yang
digunakan didapatkan dari data Automatic
Weather Station (AWS) yang terletak di
perairan Selat Madura yang posisinya tepat
berapa diatas permukaan laut, sedangkan
akumulasi data AWS didapatkan dari BMKG
Maritim Perak Surabaya.
Tabel 1. Contoh Data

Dalam penelitian ini, data yang
digunakan terhitung selama tiga bulan mulai
bulan Februari hingga Maret 2016 yang

mencakup data kecepatan angin (knot), suhu
udara ( ), curah hujan (mm) dan suhu
perrmukaan laut ( ). Data selama 3 bulan
yang digunakan berjumlah 270, yang dapat
dicontohkan pada Tabel 1.
Data-data yang terekam pada AWS
mencakup data kecepatan angin, suhu udara,
tekanan udara, kelembaban, radiasi sinar
matahari dan ketinggian air laut. Namun dalam
penelitian ini digunakan 3 faktor yang
mempengaruhi perubahan suhu permukaan
laut yang ditujukan untuk mendeteksi
keberadaan ikan layang di Selat Madura, 3
faktor tersebut diantaranya suhhu udara,
keccepatan angin, dan curah hujan. Tiga faktor
tersebut dipilih karena dinilai menjadi faktor
yang paling mempengaruhi dalam perubahan
suhu permukaan laut yang terjadi di laut.
Kemudian data-data tersebut diclusterkan
kedalam tiga cluster dimana hasil dari cluster
tersebut akan menghasilkan pusat-pusat cluster
yang dapat digunnakan dalam penyusunan
Fuzzy Inference System yang ditujukan untuk
mendeteksi keberadaan ikan layang.

3.2 Deskripsi Sistem
Metode pengclusteran yang dilakukan
pada penelitian ini ditujukan untuk mendeteksi
keberadaan ikan layang yang diselesaikan
menggunakan metode Fuzzy C-Means dengan
memperhatikan faktor yang mempengaruhi
seperti kecepatan angin (knot), suhu udara
( ), curah hujan (mm) dan suhu perrmukaan
laut ( ). Pengclusteran dilakukan sebanyak 3
cluster dari 270 data dimana hasil
pengclusteran dari masing-masing cluster
dapat dijadikan sebagai deretan pusat cluster
dan beberapa derajat keanggotaan untuk tiaptiap titik data yang mana informasi ini
digunakan untuk membangun suatu Fuzzy
Inference System namun hasil yang sebenarnya
didapatkan dari fuzzy proses c-means
bukanlah Fuzzy Inference System namun nilainilai yang diperoleh seperti nilai maksimum
dan nilai minimum dari masing-masing cluster
yang dijadikan sebagai dasar dalam pembuatan
Fuzzy
Inference
System.
Selanjutnya
pengclusteran
suhu
permukaan
laut
disimulasikan menggunakan program matlab
baik itu hasil fitur cluster ataupun dalam
proses training dan testing. Pada pemrograman
matlab untuk parameter-parameter yang
digunakan membentuk fitur parameter yang
berkorespondensi satu-satu, sehingga kita
dapat melihat hasil cluster dari setiap pasang

parameter yang diteliti. Algoritma metode
penelitian diatas dapat dilihat pada Gambar 2.

Gambar 2. Algoritma penyelesaian

3.2 Proses Pengclusteran
Pengclusteran
yang
dilakukan
dicluster sebanyak 3 dengan membuat setiap
parameter berpasangan karena hasil plot yang
dapat digunakan adalah 2D, namun parameter
yang digunakan ada lebih dari satu sehingga
dalam hasil output akan terbentuk 6 plot yang
menunjukkan hasil 3 cluster pada masingmasing parameter yang di kombinasikan.
Dalam proses pengclusteran seperti yang
ditunjkkan pada proses yang dilakukan Fuzzy
C-Means untuk melakukan pengclusteran,
dalam hal ini data yang diclusterkan adalah
semua data yang digunakan yakni berjumlah
270. Hal ini dilakukan untuk mengetahui
pengclusteran pada semua data. Setelah
pengclusteran selesai maka kita akan tau data
keberapa saja yang masuk ke cluster satu, dua
dan tiga yang kemudian kita tuliskan pada
tambahan kolom data untuk dilakukan proses
validasi.

3.3 Validasi
Apabila kita ingin mengetahui
ketepatan dari hasil penerapan metode yang
digunakan maka kita dapat melakukannya
dengan proses validasi, yang mana pada proses
tersebut akan dilakukan perhitungan yang
digunakan untuk mengetahui jarak antar data
yang digunakan menggunakan persamaan
Euclid. Namun dalam pengclusteran ini data
yang akan digunakan diclusterkan semua
untuk mendapatkan hasil pengclusteran
terhadap 270 data yang digunakan hal ini
dillakukan untuk mengetahui data keberapa
saja yang termasuk cluster 1, cluster 2, dan
cluster 3. Setelah semua data tercluster maka
validasi yang dilakukan digunakan untuk
menguji apakah hasil pengclusteran yang
diperoleh merupakan hasil pengclusteran
terbaik yang dapat diketahui dengan validasi
menngunakan metode Silhouette Index yang
diselesaikan menggunakan Matlab.

4 Hasil dan Pembahasan
Pada pengclusteran suhu permukaan
laut yang juga bergantung pada parameter lain
seperti suhu udara, kecepatan angin, dan curah
hujan yang dilakukan dengan metode Fuzzy CMeans membentuk 6 pasang hasil plot yang
dilakukan menggunakan software matlab
hingga didapatkan hasil pada gambar 3. Hasil
6 plot ini ditujukan untuk menunjukkan
sebaran data yang terjadi antar parameter
seperti clustering data antara suhu udara dan
kecepatan angin, kecepatan angin dan curah
hujan, suhu perrmukaan laut dan curah hujan,
dan sebagainya.
.

Gambar 3. Hasil Output

Dari hasil 6 plot tersebut maka kita
dapat melihat cluster data suhu perrmukaan
laut yang juga ditinjau dari parameter suhu
udara, kecepatan angin, dan curah hujan dalam
kurun waktu 3 bulan. Yang mana hasil cluster
berupa deretan pusat cluster dan beberapa
derajat keanggotaan untuk tiap titik-titik data
dapat dijadikan sebagai Fuzzy Inference
System yang ditujukan untuk mendeteksi
keberadaan ikan layang di Selat Madura.
Berdasarkan
hasil
pengclusteran
Fuzzy C-Means pada gambar 3, menunjukkan
bahwa hasil pengclusteran terbaik terlihat pada
plot dengan faktor curah hujan dan suhu udara
normal yang ada di laut yang terekam oleh
AWS dimana pada plot tersebut menunjukkan

sebaran data yang memiliki kerapatan yang
baik yang mengartikan bahwa jarak antar data
pada faktor tersebut relatif kecil.
Untuk
melihat
apakah
hasil
pengclusteran yang dilakukan merupakan hasil
pengclusteran terbaik maka akan dilakukan
validasi sebagai suatu evaluasi yang dilakukan
menggunakan metode Silhouette Index.

5 Validasi
Setelah data dicluster sebanyak tiga
maka untuk melihat ketepatan hasil
pengclusteran dapat dilihat dari nilai SI yang
dilakukan menggunakan Matlab. Yang dapat
ditunjukkan
pada
Gambar
4.

Gambar 4. Silhouette Index

Berdasarkan gambar 4 menunjukkan bahwa
nilai SI yang dihasilkan ada yang mendekati 0
dan kurang dari 1 yang dapat dikatakan masih
menjauhi 1. Apabila nilai SI mendekati 0 maka
nilai tersebut mengartikan bahwa terdapat data
dari hasil pengclusteran yang berada pada
perbatasan dua cluster. Sedangkan nilai SI
yang menjauhi 1 mengartikan bahwa data dari
hasil pengclusteran tepat berada pada suatu
cluster baik itu cluster 1, cluster 2 ataupun
cluster 3. Karena ketepatan hasil pengclusteran
menunjukkan nilai SI yang dominan menjauhi
1 maka hasil pengclusteran menggunakan
metode Fuzzy C-Means sudah tepat karena
data yang berada pada perbatasan 2 cluster
yang ditunjukkan pada Gambar 4.

6 Kesimpulan
Berdasarkan hasil penelitian terhadap
pengclusteran suhu permukaan laut yang juga
ditinjau dari faktor-faktor yang mempengaruhi
seperti kecepatan angin, suhu udara, dan curah

hujan dengan jumlah data sebanyak 270
diclusterkan
sebanyak
tiga
dengan
menghasilkan nilai SI yang menjauhi 1 dan
mendekati 0. Hasil nilai SI tersebut
menunjukkan bahwa hasil pengclusteran
menghasilkan hasil yang baik yang
ditunjukkan oleh figure yang didominassi oleh
nilai SI yang menjauhi 1 yang artinya data
hasil pengclusteran tepat berada pada suatu
cluster tertentu dan data yang berada pada
perbatasan
2
cluster
hanya
sedikit
dibandingkan data yang sudah berada pada
suatu cluster.
Sehingga metode pengclusteran Fuzzy
C-Means dan metode validasi Silhouette Index
dapat diterapkan terhadap pengclusteran data
suhu permukaan laut dengan pengaruh faktorfaktor seperti kecepatan angin, suhu udara, dan
curah hujan dengan hasil yang baik. Hasil
pengclusteran ini dapat diterapkan untuk
mendeteksi keberadaan ikan layang di Perairan

Selat Madura yang ditunjau dari beberapa
faktor yang digunakan.

Referensi
[1] d. I Kadek Budi Utama Putra,
"Perancangan Sistem Prediksi Suhu
Permukaan Laut dengan Adaptive Neuro
Fuzzy Inference System (ANFIS) pada
Maritime Weather Station (AWS) di
Perairan Dangkal Jawa Timur," ITS, p. 1.
[2] P. Waradiptya, "Prediksi Temperatur Laut
dengan Menggunakan Metode Fuzzy
Linear Regression," Telkom University, p. 1,
2006.
[3] B. W. Putra, "Prediksi Cuaca Maritim untuk
Mendeteksi Keberadaan Sumber Daya
Laut Ikan di Perairan Jawa Timur," ITS.
[4] J. J. d. S. Sasmita, "Segmentasi Citra Spot
dengan Menggunakan Pendekatan Fuzzy

C-Means," Universitas Bina Nusantara,
2017.
[5] S. K. d. H. Purnomo, Aplikasi Logika Fuzzy
untuk Pendukung Keputusan, Yogyakarta:
Graha Ilmu, 2013.
[6] N. d. N. AZ, "Otomasi Klasifikasi Awan Citra
Satelit MTSAT dengan Pendekatan Fuzzy
Logic," TELEMATIKA MKOM, vol. 4, p. 3,
2012.
[7] S. K. d. H. Purnomo, Aplikasi Logika Fuzzy
untuk Pendukung Keputusan, Yogyakarta:
Graha Ilmu, 2013.