Clustering pola batik Yogyakarta dengan algoritma k-means clustering - USD Repository
CLUSTERING POLA BATIK YOGYAKARTA
DENGAN ALGORITMA K-MEANS CLUSTERING SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Oleh:
Agnes Retnaningsih NIM: 065314039
PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2011
CLUSTERING THE YOGYAKARTA BATIK PATTERN USING K-MEANS CLUSTERING ALGORITHM A Thesis Presented as Partial Fulfillment of The Requirements To Obtain the Sarjana Komputer Degree In Department of Informatics Engineering By: Agnes Retnaningsih
Student ID: 065314039
INFORMATICS ENGINEERING STUDY PROGRAM
HALAMAN PERSEMBAHAN
“ Apabila kamu punya mimpi, t aruh dia 5 cm di depan keningmu, jadi t ak akan pernah lepas dari mat amu. Dan sehabis it u yang kit a perlu : Hanya kaki yang berjalan lebih jauh dari biasanya, t angan yang akan berbuat lebih banyak dari biasanya, dan mat a yang akan menat ap lebih lama.
Juga lapisan t ekad yang seribu kali lebih keras dari baja dan hat i yang akan bekerja lebih
keras, sert a mulut yang akan selalu berdoa.” (quoted from 5cm: Donny Dhirgantoro)Skripsi ini aku persembahkan untuk: Y esus K ristus K eluarga para sahabat baik T erimakasih untuk banyak hal…
Abstrak
Terdapat keragaman pola batik di Indonesia, baik dalam ragam bentukmaupun warnanya, seperti pada pola batik Yogyakarta, namun informasi melalui
pola yang ada tersebut tidak banyak diketahui. Pengelompokan pola batik
membantu untuk mengetahui batik yang mempunyai kemiripan informasi baik
bentuk ataupun warna.Pengelompokan pola batik dapat dilakukan dengan algoritma K-means
clustering . Algoritma ini merupakan salah satu metode pengelompokan yang
sering digunakan karena prosesnya yang cepat dan sederhana. Algoritma K-means
dimulai dengan inisialisasi cluster awal kemudian cluster tersebut diperbaiki
hingga tidak terjadi perubahan anggota atau konvergen. Untuk mengetahui
kualitas clustering yang terbentuk dapat menggunakan nilai dissimilarity. Nilai
dissimilarity diperoleh dengan membandingkan 2 obyek hasil clustering, dimana
ketika nilai kedua obyek itu sama berarti nilai dissimilarity-nya 0 dan jika berbeda
maka nilai dissimilarity-nya 1. Nilai dissimilarity yang rendah berarti obyek-
obyek dalam cluster memiliki nilai kesamaan yang tinggi. Pada dasarnya data
ditentukan similar atau dissimilar, berdasarkan atas kondisi jarak pada data
tersebut.Terdapat 4 pola batik yang akan dikelompokan dimana masing-masing
batik memiliki 25 citra batik, sehingga terdapat 100 data citra batik. Percobaan
dilakukan dengan k=2,3,4,5,6 dan 7. Dari hasil pengujian diperoleh bahwa ciri
warna merupakan ciri yang paling baik digunakan dalam pengelompokan pola
batik Yogyakarta dengan akurasi sebesar 60% pada 5 kali set percobaan.
ABSTRACT
There are various Indonesian batik patterns, not only in shape but also itscolor, such as Yogyakarta’s batik pattern, but the information of the patterns is not
too much known. Clustering batik pattern helps to know batik which having
similarity information both the shape and color.Clustering batik pattern can be used K-means clustering algorithm. This
algorithm is one of clustering method that used because its process is quick and
simple process. K-means algorithm started by initializing first cluster then the
cluster is corrected until there’s no alteration of the group or convergence. To
know the quality of clustering made can be used dissimilarity value. The
dissimilarity value is reached from comparing 2 result of clustering which will be
have 0 value if its same object and will be have 1 if its different. The low value of
dissimilarity means the objects in the cluster has high similarity. Basically, data is
similar or dissimilar based on the condition of data distance.There are 4 batik patterns which are clustered, where each batik pattern
has 25 images so that there are 100 batik images data. The experiment is
conducted with k= 2, 3, 4, 5, 6 and 7. From the experiments resulted that feature
color is the best feature used in Yogyakarta batik pattern clustering with 60%
accuracy for 5 set experiments.DAFTAR ISI
HALAMAN JUDUL BAHASA INDONESIA ...................................................... i
HALAMAN JUDUL BAHASA INGGRIS .......................................................... ii
HALAMAN PERSETUJUAN ............................................................................iii
HALAMAN PENGESAHAN ............................................................................. iv
HALAMAN PERSEMBAHAN ........................................................................... v
HALAMAN PERNYATAAN KEASLIAN KARYA .......................................... vi
HALAMAN PERSETUJUAN PUBLIKASI ...................................................... vii
ABSTRAK ....................................................................................................... viii
ABSTRACT ....................................................................................................... ix
KATA PENGANTAR ......................................................................................... x
DAFTAR ISI ..................................................................................................... xii
DAFTAR GAMBAR ........................................................................................ xiv
DAFTAR TABEL ............................................................................................. xv
BAB I: PENDAHULUAN………………………………………………………...1
1.1 Latar Belakang .................................................................................... 1
1.2 Rumusan Masalah ............................................................................... 2
1.3 Tujuan ................................................................................................. 2
1.4 Batasan Masalah .................................................................................. 2
1.5 Metodologi Penelitian ......................................................................... 3
1.6 Sistematika Penulisan .......................................................................... 4
BAB II : LANDASAN TEORI .......................................................................... 5
2.1 Batik Yogyakarta ................................................................................. 5
2.2 Clustering………………………………………………..…………….6
2.2.1 Karakteristik Clustering…………….……………………….7
2.2.2 Algoritma Clustering……….......……..………….…………8
2.3 Ciri.....………………….....………………………………..…………17
2.4 Perhitungan validasi cluster………........…….……………………....18
BAB III : ANALISA DAN PERANCANGAN SISTEM .................................... 20
3.1.1 Perancangan proses ekstraksi ciri......….…….……….…….21
3.1.2 Perancangan proses clustering……………………………..27
3.1.3 Perancangan proses evaluasi……………....……………….27
3.2.Perancangan antar muka...…………................... …………….……..30
3.2.1 Halaman home………………….....................……………..30
3.2.2 Halaman clustering…….........……..............……………....31
3.2.3 Halaman help……………………........................…............32
3.2.4 Halaman about…................…................…..……...……….32
3.3 Kebutuhan Perangkat Keras………………...……………………….33
BAB IV : IMPLEMENTASI DAN ANALISA SISTEM………………………..34
4.1 Data…………………………………………………………………..34
4.2. Implementasi Proses…..…………………………………….……….34
4.3. Hasil Penelitian..........……………………………... ……………….42
4.3.1 Set percobaan 1........…………………………... ………….42
4.3.2 Set percobaan 2…………………………………………….44
4.3.3 Set percobaan 3……………………........………………….46
4.3.4 Set percobaan 4……………………………........………….48
4.3.5 Set percobaan 5…………………………………………….50
BAB V : KESIMPULAN DAN SARAN………………………………….…….55
5.1 Kesimpulan……………………....……………………………….….55
5.2 Saran…………………………………………………………………55
DAFTAR PUSTAKA…………………………………………………………....56
LAMPIRAN 1: Coding Program………………………………..……………….59
LAMPIRAN 2 : Hasil………………………………………………..…..………78
LAMPIRAN 3 : Data batik ...………………………………………..…..………92
DAFTAR GAMBAR
Gambar 2.1 Contoh pola batik Yogyakarta ........................................................... 6Gambar 2.2 Ilustrasi Algoritma Hierarchical Clustering . ..................................... 9Gambar 2.3 Ilustrasi Single Linkage ................................................................... 10Gambar 2.4 Ilustrasi Centroid Linkage ............................................................... 10 Gambar2.5 Ilustrasi Complete Linkage .............................................................. 11 Gambar
2.6 Ilustrasi Average Linkage ................................................................ 12 Gambar
2.7 Proses K-means clustering .............................................................. 13
Gambar 3.1 Gambaran sistem secara umum ....................................................... 20Gambar 3.2 Blok digram sistem ......................................................................... 21Gambar 3.3 Hasil ciri informasi tepi pada citra batik .......................................... 23Gambar 3.4 Citra batik dalam 8 vektor vertikal dan 8 vektor horisontal.............. 24Gambar 3.5 Halaman home ............................................................................... 30Gambar 3.6. Tampilan halaman clustering ......................................................... 31Gambar 3.7. Tampilan help ................................................................................ 32Gambar 3.8. Tampilan about .............................................................................. 32
DAFTAR TABEL
Tabel 2.1 Contoh data obat ............................................................................................14Tabel 2.2 Hasil pengelompokan ...................................................................................17Tabel 3.1. Matriks Mean 8 Vektor .................................................................................24Tabel 3.2. Hasil clustering k=2 ......................................................................................28Tabel 3.3. Perhitungan dissimilaritas .............................................................................29Tabel 4.1. Contoh hasil dissimilaritas pada percobaan 1 ................................................40Tabel 4.2. Contoh hasil ekstraksi ciri warna ...................................................................41Tabel 4.3. Contoh hasil ekstraksi ciri informasi tepi .......................................................41Tabel 4.4. Contoh hasil ekstraksi ciri warna dan informasi tepi ......................................41Tabel 4.5. Contoh hasil pengelompokan ........................................................................41Tabel 4.6. Hasil perhitungan dissimilaritas dengan ciri warna ........................................42Tabel 4.7. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. ...........................43Tabel 4.8. Hasil dissimilaritas dengan ciri warna dan informasi tepi. .............................43Tabel 4.9. Hasil perhitungan dissimilaritas dengan ciri warna. .......................................44Tabel 4.10. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................45Tabel 4.11. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi..........45Tabel 4.12. Hasil perhitungan dissimilaritas dengan ciri warna. .....................................46Tabel 4.13. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................47Tabel 4.14. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi. ........47Tabel 4.15. Hasil perhitungan dissimilaritas dengan ciri warna. .....................................48Tabel 4.16. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................49Tabel 4.17. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi. ........49Tabel 4.18. Hasil perhitungan dissimilaritas dengan ciri warna. .....................................50Tabel 4.19. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................51Tabel 4.20. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi. ........51Tabel 4.21. Hasil perhitungan percobaan 1 sampai 5......................................................52Tabel 4.22. Hasil ciri paling ideal dalam pengelompokan ..............................................53BAB I PENDAHULUAN
1.1 Latar Belakang
Batik adalah suatu hasil karya asli dari masyarakat Indonesia. Setiap daerah
pembatik mempunyai keunikan dan kekhasan tersendiri, baik dalam ragam hias
maupun tata warnanya. Hal ini mengakibatkan keragaman pola batik di Indonesia,
seperti pada pola batik Yogyakarta, namun informasi melalui pola yang ada
tersebut tidak banyak diketahui. Pengelompokan pola batik atau image clustering
membantu untuk mengetahui batik yang mempunyai kemiripan informasi baik
bentuk, tekstur ataupun warna. Image Clustering merupakan suatu proses
pengelompokan yang bertujuan untuk mengelompokkan gambar menjadi
kelompok-kelompok dimana gambar dalam satu kelompok akan memiliki
karakteristik yang sama, sedangkan gambar dalam kelompok yang berbeda
memiliki karakteristik yang berbeda (Agusta Y,2011).Dalam pengelompokan dikenal beberapa teknik seperti pengelompokan
berdasarkan partisi, jarak, kepadatan dan hirarki. K-means merupakan salah satu
algoritma pengelompokan berdasarkan partisi dimana setiap data harus masuk ke
cluster tertentu (Zaiane, 1999). K-means memiliki kelebihan dalam kecepatan
memproses pengelompokan data (Wibisono Y dan Khodra, 2006), sehingga
algoritma K-means ini dipilih dalam pengelompokan pola batik daerah
Yogyakarta.1.2 Rumusan Masalah Dari latar belakang masalah di atas, maka dapat diperoleh rumusan masalah pada tugas akhir ini adalah : a. Bagaimana pengelompokan pola batik Yogyakarta menggunakan algoritma K-means? b. Bagaimana unjuk kerja algoritma K-means dalam pengelompokan pola batik Yogyakarta?
1.3 Tujuan Mengetahui unjuk kerja pengelompokan pola batik daerah Yogyakarta dengan algoritma K-means clustering.
1.4 Batasan Masalah
a. Penelitian dilakukan pada 4 pola batik dari daerah Yogyakarta yaitu pola kawunggalar, nitik cengkeh, parang barong dan parang pancing.
b. Data citra diambil dengan kamera digital dengan jarak rata- rata sekitar 30cm.
c. Setiap satu pola citra batik dibagi menjadi 25 file citra batik.
d. Citra yang diproses adalah citra bertipe JPG (*.jpg) dengan ukuran 200x200 piksel.
e. Algoritma yang digunakan dalam pengelompokan pola batik Yogyakarta adalah algoritma K-means.
f. Program yang dibuat hanya sebuah prototype untuk membantu menganalisa penerapan algoritma K-means dalam pengelompokan pola batik Yogyakarta.
1.5 Metodologi Penelitian
Metodologi yang digunakan dalam pengelompokan pola batik dengan algoritma K-means adalah sebagai berikut:
a. Studi Pustaka
Pada tahap ini mengumpulkan informasi baik dengan mencari informasi ke Museum Batik Yogyakarta, studi literatur dari buku, jurnal ataupun pencarian informasi lain melalui internet.
b. Perancangan Sistem Pada tahap ini dilakukan perancangan sistem yang akan dibuat.
c. Implementasi Tahap untuk membuat aplikasi yang digunakan untuk mempermudah dalam pengelompokan pola batik.
d. Pengujian dan Analisis Hasil Tujuan dari tahap ini adalah mengetahui tingkat keakuratan algoritma K- means dalam mengelompokan batik dan menganalisa hasil.
1.6 Sistematika Penulisan
Untuk mempermudah penyusunan skripsi, maka berikut ini akan dijabarkan sistematika penulisan laporan sebagai berikut:
BAB I : PENDAHULUAN Berisi latar belakang masalah, perumusan masalah, batasan masalah, tujuan penulisan, metodologi penelitian dan sistematika penulisan. BAB II : LANDASAN TEORI Bab ini membahas tentang landasan teori yang digunakan dalam clustering pola batik Yogyakarta. BAB III : ANALISA DAN PERANCANGAN SISTEM Bab ini berisi tentang perancangan sistem yang akan di bangun untuk mengelompokan pola batik Yogyakarta dan algoritma yang digunakan. BAB IV : IMPLEMENTASI SISTEM DAN ANALISA HASIL Bab ini membahas tentang implementasi program serta analisa hasil pengujian sistem clustering pola batik dengan algoritma K-means. BAB V : KESIMPULAN DAN SARAN Bab ini berisi tentang kesimpulan dari keseluruhan proses pembuatan tugas akhir ini serta saran untuk pengembangan lebih lanjut.
BAB II LANDASAN TEORI
2.1 Batik Yogyakarta
Batik Yogyakarta merupakan bagian dari perkembangan sejarah batik di
Jawa Tengah yang telah mengalami gabungan beberapa corak dari daerah lain.
Perjalanan batik Yogyakarta tidak bisa lepas dari perjanjian Giyanti 1755, begitu
Mataram terbelah dua, dan Kraton Yogyakarta berdiri, busana Mataram dibawa
dari Surakarta ke Yogyakarta, maka Sri Susuhunan Pakubuwono II merancang
busana baru dan pakaian adat Kraton Surakarta berbeda dengan busana
Yogyakarta (Anonim, 2009).Ciri khas batik gaya Yogyakarta adalah ada dua macam latar atau warna
dasar kain yaitu putih dan hitam, sementara warna batik umumnya putih (warna
kain mori), biru tua kehitaman dan coklat soga. Ragam hias pertama geometris
yaitu garis miring lerek atau lereng, garis silang atau ceplok dan kawung, serta
anyaman dan limaran. Ragam hias yang kedua bersifat non-geometris yaitu
semen, lung-lungan dan boketan. Ragam hias yang bersifat simbolis erat
hubungannya dengan falsafah Hindu – Jawa antara lain Sawat melambangkan
mahkota atau penguasa tinggi, Meru melambangkan gunung atau tanah ( bumi ),
Naga melambangkan air, Burung melambangkan angin atau dunia atas dan Lidah
api melambangkan nyala atau geni (Anonim, 2009).Contoh batik Yogyakarta : (a) (b) (c)
Gambar 2.1 Contoh pola batik Yogyakarta (a) kawunggalar, (b)parang barong, (c) nitik cengkeh.2.2 Clustering
Clustering adalah proses mengelompokkan obyek berdasarkan informasi
yang diperoleh dari data yang menjelaskan hubungan antar obyek dengan prinsip
memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan
kesamaan antar kelas atau cluster (Agus I,2009). Tujuan dari clustering adalah
menemukan cluster yang berkualitas dalam waktu yang tepat. Clustering dalam
data mining berguna untuk menemukan pola distribusi di dalam sebuah data set
yang berguna untuk proses analisa data. Kesamaan obyek biasanya diperoleh dari
kedekatan nilai-nilai atribut yang menjelaskan obyek-obyek data, sedangkan
obyek-obyek data biasanya direpresentasikan sebagai sebuah titik dalam ruang
multidimensi.Dengan menggunakan clustering, dapat diidentifikasi daerah yang padat,
pola-pola distribusi secara keseluruhan dan keterkaitan yang menarik antara
atribut-atribut data. Dalam data mining usaha difokuskan pada metode-metode
penemuan cluster pada basis data berukuran besar secara efektif dan efisien.Image Clustering merupakan suatu proses pengelompokan yang bertujuan
untuk mengelompokkan gambar menjadi kelompok-kelompok, dimana gambar
dalam satu kelompok akan memiliki karakteristik yang sama, sedangkan gambar
dalam kelompok yang berbeda memiliki karakteristik yang berbeda (Agusta Y,
2011).2.2.1 Karakteristik clustering
Karakteristik clustering dibagi menjadi 4 (Hasniawati,2007), yaitu :
a. Partitioning clustering
Partitioning clustering disebut juga exclusive clustering, dimana setiap
data harus masuk ke cluster tertentu. Karakteristik tipe ini juga memungkinkan
bagi setiap data yang termasuk cluster tertentu pada suatu tahapan proses, pada tahapan berikutnya berpindah ke cluster yang lain. Contoh : K-means. b. Hierarchical clustering Pada hierarchical clustering, setiap data harus masuk pada cluster tertentu dan suatu data yang termasuk pada cluster tertentu pada suatu tahapan proses, tidak dapat berpindah ke cluster lain pada tahapan berikutnya.
Contoh: Single Linkage, Centroid Linkage,Complete Linkage, Average Linkage .
c. Overlapping clustering Dalam overlapping clustering, setiap data memungkinkan termasuk ke beberapa cluster. Data mempunyai nilai keanggotaan (membership) pada beberapa cluster.
Contoh: Fuzzy C-means, Gaussian Mixture.
d. Hybrid Karakteristik hybrid merupakan karakter yang menggabungkan karakteristik dari partitioning, overlapping dan hierarchical.
2.2.2 Algoritma clustering
Terdapat beberapa algoritma yang sering digunakan dalam clustering (Zaiane,1999), yaitu :
a. Hierarchical Clustering
Dengan metode ini, data tidak langsung dikelompokkan ke dalam
beberapa cluster dalam 1 tahap, tetapi dimulai dari 1 cluster yang mempunyai
kesamaan, dan berjalan seterusnya selama beberapa iterasi, hingga terbentuk
beberapa cluster tertentu (Barakbah dan Arai,2004).Gambar 2.2 Ilustrasi Algoritma Hierarchical Clustering ( Hasniawati,2007)Penghitungan jarak antar obyek, maupun antar cluster-nya dilakukan dengan euclidian distance untuk data numerik (Barakbah dan Arai, 2004). Untuk data 2 dimensi, digunakan persamaan sebagai berikut :
( , ) = ∑
|
−| (2.1) Algoritma hierarchical clustering banyak diaplikasikan pada metode pengelompokan berikut : i. Single Linkage Hierarchical Method (SLHM)
Single Linkage adalah proses pengelompokan yang didasarkan pada jarak terdekat antar obyeknya atau minimum distance (Karypis dkk, 1999).
Metode SLHM sangat bagus untuk melakukan analisa pada tiap tahap pembentukan cluster. Metode ini juga sangat cocok untuk dipakai pada kasus shape independent clustering, karena kemampuannya untuk membentuk pattern atau pola tertentu dari cluster, sedangkan untuk kasus condensed clustering , metode ini tidak cocok.
Gambar 2.3 Ilustrasi Single Linkage (Hasniawati,2007).ii. Centroid Linkage Hierarchical Method Centroid Linkage adalah proses pengelompokan yang didasarkan pada jarak antar centroidnya (Barakbah A.R., 2006). Metode ini cocok untuk memperkecil variance within cluster karena melibatkan centroid pada saat penggabungan antar cluster. Metode ini juga baik untuk data yang mengandung outlier.
Gambar 2.4 Ilustrasi Centroid Linkage (Hasniawati, 2007).iii. Complete Linkage Hierarchical Method Complete Linkage adalah proses pengelompokan yang didasarkan pada jarak terjauh antar obyeknya atau maximum distance (Barakbah, 2006). Metode ini baik untuk kasus clustering dengan normal data set distribution , akan tetapi metode ini tidak cocok untuk data yang mengandung outlier.
Gambar 2.5 Ilustrasi Complete Linkage (Hasniawati, 2007), iv.Average Linkage Hierarchical Method Average Linkage adalah proses pengelompokkan yang didasarkan pada jarak rata-rata antar obyeknya (Barakbah, 2006). Metode ini relatif yang terbaik dari metode-metode hierarchical, namun metode ini memerlukan waktu komputasi yang paling tinggi dibandingkan dengan metode-metode hierarchical yang lain.
Gambar 2.6 Ilustrasi Average Linkage (Hasniawati, 2007).b. Algoritma K-means
Algoritma K-means adalah algoritma untuk mengelompokkan data
kedalam kelompok - kelompok atau cluster sejumlah k. K-means adalah teknik
yang cukup sederhana dan cepat dalam pekerjaan pengelompokkan data
(Wibisono dan Khodra, 2006). Prinsip utama dari teknik ini adalah menyusun k
centroid atau rata-rata (mean) dari sekumpulan data berdimensi tertentu.
Algoritma K-means dimulai dengan pembentukan inisialisasi cluster awal
kemudian secara iteratif cluster tersebut diperbaiki hingga tidak terjadi perubahan
anggota atau konvergen. Untuk perhitungan jarak dapat menggunakan
perhitungan jarak euclidean distance. Euclidean sering digunakan karena
penghitungan jarak dalam distance space ini merupakan jarak terpendek yang bisa
didapatkan antara dua titik yang diperhitungkan (Agusta,2007).Algoritma K-means: i.Tentukan jumlah cluster ii. Menentukan centroid iii. Hitung jarak data terhadap centroid iv. Mengelompokan berdasarkan jarak minimum
v. Menentukan centroid yang baru kemudian kembali ke langkah 3, sampai
tidak ada data yang berpindahSt art Jum lah clust er (kelom pok) ya
M enent ukan cent roid M emeriksa apakah ada kelompok yang berubah
M enghit ung jarak dat a dengan cara m em bandingkan t erhadap cent roid dengan kelompok sebelumnya t idak M engelom pokan berdasarkan jarak m inim um end
Gambar 2.7 Proses K-means clustering (Santoso, 2005) Contoh penerapan K-means (Teknomo,2006): Terdapat 4 tipe obat dimana obat tersebut memiliki 2 atribut, x dan y.Kelompokan data tersebut dalam k=2.
Tabel 2.1 Contoh data obatData atribut 1 (X): weight index (x) atribut 2 (Y): pH(y)
Obat A
1
1 Obat B
2
1 Obat C
4
3 Obat D
5
4
1. Inisialisasi centroid awal : misalkan Obat A and Obat B sebagai centroid
awal, sehingga c 1 (1,1) dan c 2 (2,1).
2. Menghitung jarak data terhadap centroid : hitung jarak antara centroid
dengan masing-masing data. Perhitungan jarak dapat menggunakaneuclidean distance , sehingga diperoleh matrik jarak pada iterasi 0 yaitu :
Tiap kolom matrik jarak tersebut melambangkan obyek data. Baris pertama matrik jarak merupakan hasil perhitungan jarak dengan c
1 sedang baris kedua merupakan hasil perhitungan terhadap c 2 . Contoh : Jarak obat C = (4, 3) terhadap c (1,1) adalah ,
1
dan terhadap c 2 (2,1) adalah , dsb.3. Pengelompokan : menentukan kelompok data berdasarkan jarak terkecil sehingga obat A dalam kelompok 1, obat B dalam kelompok 2, obat C ke kelompok 2 dan obat D pada kelompok 2. Matrik dengan elemen 1 menandakan anggota kelompok tersebut.
4. Iterasi-1, menentukan centroid baru : setelah anggota kelompok diketahui selanjutnya pada tiap kelompok,hitung centroid baru berdasarkan anggota kelompok tersebut. Kelompok 1 hanya memiliki satu anggota sehingga titik tersebut merupakan centroid baru pada c
1 sedangkan pada kelompok 2 memiliki 3 anggota, sehingga centroid yang baru diperoleh dengan mencari rata-rata dari ketiga data tersebut:
5. Iterasi-1, menghitung jarak terhadap centroid : langkah berikutnya adalah menghitung jarak semua data terhadap centroid yang baru. Seperti pada langkah ke-2, hasil perhitungan dapat kita lihat dalam matrik jarak sebagai berikut :
6. Iterasi-1, pengelompokan data: seperti pada langkah 3, kita tandai tiap data berdasarkan jarak terkecil sehingga diperoleh hasil obat A dan obat B berada pada kelompok 1 sedangkan obat C dan obat D berada pada
. kelompok 2
7. Iterasi-2, menentukan centroid baru:seperti pada langkah ke-4, maka tentukan centroid baru berdasarkan perhitungan pengelompokan dari iterasi sebelumnya.kelompok 1 dan kelompok 2 sama-sama memiliki 2 anggota, sehingga centroid baru diperoleh sebagai berikut:
= , = 1 , 1 dan = , = 4 , 3
8. Iterasi-2, menghitung jarak terhadap centroid : kembali ulangi langkah 2, sehingga diperoleh jarak matrik yang baru:
9. Iterasi-2,pengelompokan : menentukan anggota kelompok berdasarkan jarak paling kecil.
Hasil di atas menunjukan sehingga tidak ada perubahan anggota kelompok, berarti proses pengelompokan telah stabil dan tidak memerlukan iterasi lagi. Hasil akhir pengelompokan sebagai berikut:
Tabel 2.2 Hasil pengelompokandata atribut 1 (X): atribut 2 (Y): hasil weight index pH pengelompokan obat A
1
1
1 obat B
2
1
1 obat C
4
3
2 obat D
5
4
2 Pada tabel di atas, obat A dan obat B termasuk dalam kelompok satu sedang obat C dan obat D termasuk dalam kelompok 2.
2.3 Ciri
Ciri mewakili sesuatu yang khas pada citra yang akan di ekstraksi untuk
proses selanjutnya. Pada data citra terdapat beberapa ciri yang dapat digunakan
seperti warna dan bentuk (Herdiyeni, 2008). Pada pengelompokan pola batik
belum terdapat penelitian yang menyebutkan tentang ciri yang tepat, sehingga
penulis mencoba menggunakan ciri warna dan informasi tepi dengan harapan pilihan tersebut akan menghasilkan hasil yang maksimal. a) Informasi tepi Informasi tepi merupakan proses yang menghasilkan tepi-tepi dari obyek-obyek citra, dimana tujuannya adalah menandai bagian yang menjadi detail citra dan memperbaiki detail dari citra yang kabur, yang terjadi karena error atau adanya efek dari proses akuisisi citra (Riyanto, 2006). Dalam pengambilan informasi tepi ini digunakan metode canny karena merupakan metode deteksi tepi yang paling baik (Fisher dkk, 2003) serta telah digunakan dalam pengambilan ekstraksi dalam pengidentifikasian batik berdasarkan pola batik dan ciri-ciri batik menggunakan ekstraksi ciri tekstur kain (Imanuddin, 2010).
b) Warna Meneliti citra berdasarkan warna yang dikandungnya adalah salah satu teknik yang paling banyak digunakan. Perhitungan kadar warna berdasarkan atas percobaan yang telah dilakukan pada penelitian untuk klasifikasi tingkat kematangan tomat merah menggunakan metode perbandingan kadar warna (Noviyanto, 2009). Dalam sebuah citra terdapat 3 komponen warna utama, yaitu red, green dan blue, atau yang sering disebut RGB. Komponen RGB dalam setiap citra dapat digunakan sebagai ciri untuk proses pengolahan citra selanjutnya.
2.4 Perhitungan validasi cluster
Konsistensi hasil clustering dapat di ukur dengan nilai dissimilarity (Adi
evaluasi dianggap semakin berbeda, namun jika semakin kecil nilai dissimilarity,
maka kedua obyek tersebut dianggap semakin mirip (Karhendana,2008).Pada dasarnya data ditentukan similar atau dissimilar berdasarkan atas
kondisi jarak pada data tersebut, misalnya untuk kondisi similar interval yang
digunakan hanya 2 yaitu keadaan 0 (no similarity), 1(complete similarity). Rumus Similarity :1 = (2.2) Rumus Dissimilarity
= (2.3)
1 p and q adalah nilai atribut untuk 2 data yang dibandingkan.
Rumus untuk menghitung rata –rata dissimilarity (Adi dkk, 2008) adalah: , =
1 (2.4 ) ∶ ∑ ≠
∈ Dimana P k adalah permutasi semua label, 1 = 1 ketika ≠ ≠ dan bernilai 0 jika = . L adalah hasil clustering.
Permutasi digunakan untuk mengatasi adanya ketidakunikan label seperti
pada representasi label 1 pada pengelompokkan pertama dan label 2 pada
pengelompokan berikutnya yang terlihat berbeda, padahal kemungkinan kedua
label tersebut sama, sehingga semua data dibandingkan dengan hasil permutasi
untuk mengatasi adanya label yang berbeda yang sebenarnya mungkin sama pada
hasil pengelompokan (Adi dkk, 2008).BAB III ANALISA DAN PERANCANGAN SISTEM Pada bab analisa dan perancangan sistem ini berisi tentang penjelasan
rancangan dan proses kerja sistem yang akan dibuat. Sistem yang akan dibuat
tersebut digunakan untuk mengelompokan data citra dan menguji keakuratan
metode clustering dengan algoritma K-means dalam pengelompokan pola batik
Yogyakarta.3.1 Perancangan sistem secara umum
Sistem pengelompokan pola batik ini menggunakan algoritma K-means
untuk mengelompokan pola batik sehingga batik yang mempunyai kemiripan ciri
yang hampir sama akan dikelompokan menjadi satu kelompok. Proses berawal
dengan pembacaan data citra oleh sistem, kemudian data citra yang terbaca di
ekstraksi cirinya yaitu berupa informasi tepi dan warna. Dengan pengelompokan
menggunakan K-means, setiap citra yang telah di ekstraksi cirinya, kemudian
dikelompokkan. Setelah proses pengelompokkan selesai maka akan diperoleh
informasi tentang hasil pengelompokkan yang berupa label cluster untuk setiap
data dimana label yang sama menyatakan kelompok yang sama.User memasukan cit ra –cit ra yang Pengelompokan akan di kelom pokan cit ra oleh sist em hasil evaluasi
Keluaran berupa inf ormasi jumlah kelom pok yang ideal
Gambar 3.1 Gambaran sistem secara umumKum pulan cit ra bat ik Proses ekst raksi ciri
Tiap citra di ekstraksi cirinya Tiap ciri yang di peroleh di kelompokan dengan menggunakan
K-means clust ering algoritma K-means Hasil pengelompokan hasil ditampilkan Hasil kemudian di evaluasi untuk evaluasi mengetahui jumlah cluster yang ideal
Gambar 3.2 Blok diagram sistem3.1.1 Perancangan proses ekstraksi ciri
Proses ekstraksi ciri merupakan tahap pengambilan komponen –
komponen yang penting dalam citra yang selanjutnya digunakan untuk proses
pengelompokkan. Dalam proses pengelompokkan pola batik ini digunakan tiga
ciri yaitu warna, informasi tepi dan gabungan antara warna dan informasi tepi.a. Ciri warna Ciri warna diperoleh dengan mencari rata-rata Red ( ), rata-rata Green
( ̅), rata-rata Blue ( ), kadar Red, kadar Green dan kadar Blue seperti dalam
rumus berikut:i. Rata – rata R (mean Red)
∑ ∑ R =
(3.1) ii. Rata – rata G (mean Green) ∑ ∑
G = (3.2) iii. Rata – rata B (mean Blue)
∑ ∑ B =
(3.3) iv. =
(3.4) ̅ ̅ v. =
(3.5) ̅ vi.
= (3.6)
̅ di mana
M = lebar citra (kolom matriks) B ij = nilai piksel Blue
N = tinggi citra (baris matriks) = rata-rata Red R ij = nilai piksel Red ̅ = rata-rata Green G ij = nilai piksel Green= rata-rata Blue Dari ciri warna diperoleh 6 atribut yang berupa matrik dengan ukuran 1x6 .
Algorit m a ekst raksi ciri w arna Input : matrik dari citra batik berukuran 200x200 piksel Output : matrik ciri warna berukuran 1x6 untuk setiap citra masukan for x = 1: jumlah file citra Membaca citra
Mengambil keping warna merah
Mengambil keping warna hijau Mengambil keping warna biru Mencari rata-rata merah Mencari rata-rata hijau Mencari rata-rata biru
Kadar Merah = rata-rata merah/(rata-rata merah+rata-rata hijau+rata-
rata biru)Kadar Hijau = rata-rata hijau/(rata-rata merah+rata-rata hijau+rata-
rata biru) Kadar Biru = rata-rata biru/(rata-rata merah+rata-rata hijau+rata-rata biru) Menyimpan matrik kepadatan endb. Ciri informasi tepi Citra yang digunakan adalah citra dengan ukuran 200 x 200 piksel.
Selanjutnya citra batik dirubah menjadi grayscale, kemudian dikenai proses
deteksi canny, metode ini dipilih karena deteksi canny memiliki hasil deteksi tepi
yang paling baik (Fisher dkk, 2003).(a) (b) (c)
Gambar 3.3 Hasil ciri informasi tepi pada citra batik. (a) citra asli, (b) citra setelah proses grayscale, (c) citra setelah proses canny.
Citra selanjutnya dibuat menjadi 8 vektor secara vertikal dan 8 vektor secara
horisontal seperti dalam gambar 3.4. Setiap vektor dari citra tersebut kemudian di
- Mean
- Mean
- … + Mean
82 Total 3 = Mean 13 + Mean 23 + Mean 33 + … + Mean
6
4
5
3
2
7
1
88
Total 8 = Mean 18 + Mean 28 + Mean 38 + … + Mean
83 …….
32
hitung rata- ratanya, maka diperoleh nilai rata – rata tiap vektor seperti dalam
tabel 3.1.