Clustering pola batik Yogyakarta dengan algoritma k-means clustering - USD Repository

CLUSTERING POLA BATIK YOGYAKARTA

  DENGAN ALGORITMA K-MEANS CLUSTERING SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Program Studi Teknik Informatika Oleh:

  Agnes Retnaningsih NIM: 065314039

PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2011

  CLUSTERING THE YOGYAKARTA BATIK PATTERN USING K-MEANS CLUSTERING ALGORITHM A Thesis Presented as Partial Fulfillment of The Requirements To Obtain the Sarjana Komputer Degree In Department of Informatics Engineering By: Agnes Retnaningsih

  Student ID: 065314039

INFORMATICS ENGINEERING STUDY PROGRAM

HALAMAN PERSEMBAHAN

  “ Apabila kamu punya mimpi, t aruh dia 5 cm di depan keningmu, jadi t ak akan pernah lepas dari mat amu. Dan sehabis it u yang kit a perlu : Hanya kaki yang berjalan lebih jauh dari biasanya, t angan yang akan berbuat lebih banyak dari biasanya, dan mat a yang akan menat ap lebih lama.

  

Juga lapisan t ekad yang seribu kali lebih keras dari baja dan hat i yang akan bekerja lebih

keras, sert a mulut yang akan selalu berdoa.” (quoted from 5cm: Donny Dhirgantoro)

  Skripsi ini aku persembahkan untuk: Y esus K ristus K eluarga para sahabat baik T erimakasih untuk banyak hal…

  

Abstrak

Terdapat keragaman pola batik di Indonesia, baik dalam ragam bentuk

maupun warnanya, seperti pada pola batik Yogyakarta, namun informasi melalui

pola yang ada tersebut tidak banyak diketahui. Pengelompokan pola batik

membantu untuk mengetahui batik yang mempunyai kemiripan informasi baik

bentuk ataupun warna.

  Pengelompokan pola batik dapat dilakukan dengan algoritma K-means

clustering . Algoritma ini merupakan salah satu metode pengelompokan yang

sering digunakan karena prosesnya yang cepat dan sederhana. Algoritma K-means

dimulai dengan inisialisasi cluster awal kemudian cluster tersebut diperbaiki

hingga tidak terjadi perubahan anggota atau konvergen. Untuk mengetahui

kualitas clustering yang terbentuk dapat menggunakan nilai dissimilarity. Nilai

dissimilarity diperoleh dengan membandingkan 2 obyek hasil clustering, dimana

ketika nilai kedua obyek itu sama berarti nilai dissimilarity-nya 0 dan jika berbeda

maka nilai dissimilarity-nya 1. Nilai dissimilarity yang rendah berarti obyek-

obyek dalam cluster memiliki nilai kesamaan yang tinggi. Pada dasarnya data

ditentukan similar atau dissimilar, berdasarkan atas kondisi jarak pada data

tersebut.

  Terdapat 4 pola batik yang akan dikelompokan dimana masing-masing

batik memiliki 25 citra batik, sehingga terdapat 100 data citra batik. Percobaan

dilakukan dengan k=2,3,4,5,6 dan 7. Dari hasil pengujian diperoleh bahwa ciri

warna merupakan ciri yang paling baik digunakan dalam pengelompokan pola

batik Yogyakarta dengan akurasi sebesar 60% pada 5 kali set percobaan.

  

ABSTRACT

There are various Indonesian batik patterns, not only in shape but also its

color, such as Yogyakarta’s batik pattern, but the information of the patterns is not

too much known. Clustering batik pattern helps to know batik which having

similarity information both the shape and color.

  Clustering batik pattern can be used K-means clustering algorithm. This

algorithm is one of clustering method that used because its process is quick and

simple process. K-means algorithm started by initializing first cluster then the

cluster is corrected until there’s no alteration of the group or convergence. To

know the quality of clustering made can be used dissimilarity value. The

dissimilarity value is reached from comparing 2 result of clustering which will be

have 0 value if its same object and will be have 1 if its different. The low value of

dissimilarity means the objects in the cluster has high similarity. Basically, data is

similar or dissimilar based on the condition of data distance.

  There are 4 batik patterns which are clustered, where each batik pattern

has 25 images so that there are 100 batik images data. The experiment is

conducted with k= 2, 3, 4, 5, 6 and 7. From the experiments resulted that feature

color is the best feature used in Yogyakarta batik pattern clustering with 60%

accuracy for 5 set experiments.

  DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA ...................................................... i

HALAMAN JUDUL BAHASA INGGRIS .......................................................... ii

HALAMAN PERSETUJUAN ............................................................................iii

HALAMAN PENGESAHAN ............................................................................. iv

HALAMAN PERSEMBAHAN ........................................................................... v

HALAMAN PERNYATAAN KEASLIAN KARYA .......................................... vi

HALAMAN PERSETUJUAN PUBLIKASI ...................................................... vii

ABSTRAK ....................................................................................................... viii

ABSTRACT ....................................................................................................... ix

KATA PENGANTAR ......................................................................................... x

DAFTAR ISI ..................................................................................................... xii

DAFTAR GAMBAR ........................................................................................ xiv

DAFTAR TABEL ............................................................................................. xv

  

BAB I: PENDAHULUAN………………………………………………………...1

  1.1 Latar Belakang .................................................................................... 1

  1.2 Rumusan Masalah ............................................................................... 2

  1.3 Tujuan ................................................................................................. 2

  1.4 Batasan Masalah .................................................................................. 2

  1.5 Metodologi Penelitian ......................................................................... 3

  1.6 Sistematika Penulisan .......................................................................... 4

  

BAB II : LANDASAN TEORI .......................................................................... 5

  2.1 Batik Yogyakarta ................................................................................. 5

  2.2 Clustering………………………………………………..…………….6

  2.2.1 Karakteristik Clustering…………….……………………….7

  2.2.2 Algoritma Clustering……….......……..………….…………8

  2.3 Ciri.....………………….....………………………………..…………17

  2.4 Perhitungan validasi cluster………........…….……………………....18

  

BAB III : ANALISA DAN PERANCANGAN SISTEM .................................... 20

  3.1.1 Perancangan proses ekstraksi ciri......….…….……….…….21

  3.1.2 Perancangan proses clustering……………………………..27

  3.1.3 Perancangan proses evaluasi……………....……………….27

  3.2.Perancangan antar muka...…………................... …………….……..30

  3.2.1 Halaman home………………….....................……………..30

  3.2.2 Halaman clustering…….........……..............……………....31

  3.2.3 Halaman help……………………........................…............32

  3.2.4 Halaman about…................…................…..……...……….32

  3.3 Kebutuhan Perangkat Keras………………...……………………….33

  

BAB IV : IMPLEMENTASI DAN ANALISA SISTEM………………………..34

  4.1 Data…………………………………………………………………..34

  4.2. Implementasi Proses…..…………………………………….……….34

  4.3. Hasil Penelitian..........……………………………... ……………….42

  4.3.1 Set percobaan 1........…………………………... ………….42

  4.3.2 Set percobaan 2…………………………………………….44

  4.3.3 Set percobaan 3……………………........………………….46

  4.3.4 Set percobaan 4……………………………........………….48

  4.3.5 Set percobaan 5…………………………………………….50

  

BAB V : KESIMPULAN DAN SARAN………………………………….…….55

  5.1 Kesimpulan……………………....……………………………….….55

  5.2 Saran…………………………………………………………………55

DAFTAR PUSTAKA…………………………………………………………....56

LAMPIRAN 1: Coding Program………………………………..……………….59

LAMPIRAN 2 : Hasil………………………………………………..…..………78

LAMPIRAN 3 : Data batik ...………………………………………..…..………92

  

DAFTAR GAMBAR

Gambar 2.1 Contoh pola batik Yogyakarta ........................................................... 6Gambar 2.2 Ilustrasi Algoritma Hierarchical Clustering . ..................................... 9Gambar 2.3 Ilustrasi Single Linkage ................................................................... 10Gambar 2.4 Ilustrasi Centroid Linkage ............................................................... 10 Gambar

  2.5 Ilustrasi Complete Linkage .............................................................. 11 Gambar

  2.6 Ilustrasi Average Linkage ................................................................ 12 Gambar

  2.7 Proses K-means clustering .............................................................. 13

Gambar 3.1 Gambaran sistem secara umum ....................................................... 20Gambar 3.2 Blok digram sistem ......................................................................... 21Gambar 3.3 Hasil ciri informasi tepi pada citra batik .......................................... 23Gambar 3.4 Citra batik dalam 8 vektor vertikal dan 8 vektor horisontal.............. 24Gambar 3.5 Halaman home ............................................................................... 30Gambar 3.6. Tampilan halaman clustering ......................................................... 31Gambar 3.7. Tampilan help ................................................................................ 32Gambar 3.8. Tampilan about .............................................................................. 32

  

DAFTAR TABEL

Tabel 2.1 Contoh data obat ............................................................................................14Tabel 2.2 Hasil pengelompokan ...................................................................................17Tabel 3.1. Matriks Mean 8 Vektor .................................................................................24Tabel 3.2. Hasil clustering k=2 ......................................................................................28Tabel 3.3. Perhitungan dissimilaritas .............................................................................29Tabel 4.1. Contoh hasil dissimilaritas pada percobaan 1 ................................................40Tabel 4.2. Contoh hasil ekstraksi ciri warna ...................................................................41Tabel 4.3. Contoh hasil ekstraksi ciri informasi tepi .......................................................41Tabel 4.4. Contoh hasil ekstraksi ciri warna dan informasi tepi ......................................41Tabel 4.5. Contoh hasil pengelompokan ........................................................................41Tabel 4.6. Hasil perhitungan dissimilaritas dengan ciri warna ........................................42Tabel 4.7. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. ...........................43Tabel 4.8. Hasil dissimilaritas dengan ciri warna dan informasi tepi. .............................43Tabel 4.9. Hasil perhitungan dissimilaritas dengan ciri warna. .......................................44Tabel 4.10. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................45Tabel 4.11. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi..........45Tabel 4.12. Hasil perhitungan dissimilaritas dengan ciri warna. .....................................46Tabel 4.13. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................47Tabel 4.14. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi. ........47Tabel 4.15. Hasil perhitungan dissimilaritas dengan ciri warna. .....................................48Tabel 4.16. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................49Tabel 4.17. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi. ........49Tabel 4.18. Hasil perhitungan dissimilaritas dengan ciri warna. .....................................50Tabel 4.19. Hasil perhitungan dissimilaritas dengan ciri informasi tepi. .........................51Tabel 4.20. Hasil perhitungan dissimilaritas dengan ciri warna dan informasi tepi. ........51Tabel 4.21. Hasil perhitungan percobaan 1 sampai 5......................................................52Tabel 4.22. Hasil ciri paling ideal dalam pengelompokan ..............................................53

BAB I PENDAHULUAN

1.1 Latar Belakang

  Batik adalah suatu hasil karya asli dari masyarakat Indonesia. Setiap daerah

pembatik mempunyai keunikan dan kekhasan tersendiri, baik dalam ragam hias

maupun tata warnanya. Hal ini mengakibatkan keragaman pola batik di Indonesia,

seperti pada pola batik Yogyakarta, namun informasi melalui pola yang ada

tersebut tidak banyak diketahui. Pengelompokan pola batik atau image clustering

membantu untuk mengetahui batik yang mempunyai kemiripan informasi baik

bentuk, tekstur ataupun warna. Image Clustering merupakan suatu proses

pengelompokan yang bertujuan untuk mengelompokkan gambar menjadi

kelompok-kelompok dimana gambar dalam satu kelompok akan memiliki

karakteristik yang sama, sedangkan gambar dalam kelompok yang berbeda

memiliki karakteristik yang berbeda (Agusta Y,2011).

  Dalam pengelompokan dikenal beberapa teknik seperti pengelompokan

berdasarkan partisi, jarak, kepadatan dan hirarki. K-means merupakan salah satu

algoritma pengelompokan berdasarkan partisi dimana setiap data harus masuk ke

cluster tertentu (Zaiane, 1999). K-means memiliki kelebihan dalam kecepatan

memproses pengelompokan data (Wibisono Y dan Khodra, 2006), sehingga

algoritma K-means ini dipilih dalam pengelompokan pola batik daerah

Yogyakarta.

  1.2 Rumusan Masalah Dari latar belakang masalah di atas, maka dapat diperoleh rumusan masalah pada tugas akhir ini adalah : a. Bagaimana pengelompokan pola batik Yogyakarta menggunakan algoritma K-means? b. Bagaimana unjuk kerja algoritma K-means dalam pengelompokan pola batik Yogyakarta?

  1.3 Tujuan Mengetahui unjuk kerja pengelompokan pola batik daerah Yogyakarta dengan algoritma K-means clustering.

  1.4 Batasan Masalah

  a. Penelitian dilakukan pada 4 pola batik dari daerah Yogyakarta yaitu pola kawunggalar, nitik cengkeh, parang barong dan parang pancing.

  b. Data citra diambil dengan kamera digital dengan jarak rata- rata sekitar 30cm.

  c. Setiap satu pola citra batik dibagi menjadi 25 file citra batik.

  d. Citra yang diproses adalah citra bertipe JPG (*.jpg) dengan ukuran 200x200 piksel.

  e. Algoritma yang digunakan dalam pengelompokan pola batik Yogyakarta adalah algoritma K-means.

  f. Program yang dibuat hanya sebuah prototype untuk membantu menganalisa penerapan algoritma K-means dalam pengelompokan pola batik Yogyakarta.

1.5 Metodologi Penelitian

  Metodologi yang digunakan dalam pengelompokan pola batik dengan algoritma K-means adalah sebagai berikut:

a. Studi Pustaka

  Pada tahap ini mengumpulkan informasi baik dengan mencari informasi ke Museum Batik Yogyakarta, studi literatur dari buku, jurnal ataupun pencarian informasi lain melalui internet.

  b. Perancangan Sistem Pada tahap ini dilakukan perancangan sistem yang akan dibuat.

  c. Implementasi Tahap untuk membuat aplikasi yang digunakan untuk mempermudah dalam pengelompokan pola batik.

  d. Pengujian dan Analisis Hasil Tujuan dari tahap ini adalah mengetahui tingkat keakuratan algoritma K- means dalam mengelompokan batik dan menganalisa hasil.

1.6 Sistematika Penulisan

  Untuk mempermudah penyusunan skripsi, maka berikut ini akan dijabarkan sistematika penulisan laporan sebagai berikut:

BAB I : PENDAHULUAN Berisi latar belakang masalah, perumusan masalah, batasan masalah, tujuan penulisan, metodologi penelitian dan sistematika penulisan. BAB II : LANDASAN TEORI Bab ini membahas tentang landasan teori yang digunakan dalam clustering pola batik Yogyakarta. BAB III : ANALISA DAN PERANCANGAN SISTEM Bab ini berisi tentang perancangan sistem yang akan di bangun untuk mengelompokan pola batik Yogyakarta dan algoritma yang digunakan. BAB IV : IMPLEMENTASI SISTEM DAN ANALISA HASIL Bab ini membahas tentang implementasi program serta analisa hasil pengujian sistem clustering pola batik dengan algoritma K-means. BAB V : KESIMPULAN DAN SARAN Bab ini berisi tentang kesimpulan dari keseluruhan proses pembuatan tugas akhir ini serta saran untuk pengembangan lebih lanjut.

BAB II LANDASAN TEORI

2.1 Batik Yogyakarta

  Batik Yogyakarta merupakan bagian dari perkembangan sejarah batik di

Jawa Tengah yang telah mengalami gabungan beberapa corak dari daerah lain.

  

Perjalanan batik Yogyakarta tidak bisa lepas dari perjanjian Giyanti 1755, begitu

Mataram terbelah dua, dan Kraton Yogyakarta berdiri, busana Mataram dibawa

dari Surakarta ke Yogyakarta, maka Sri Susuhunan Pakubuwono II merancang

busana baru dan pakaian adat Kraton Surakarta berbeda dengan busana

Yogyakarta (Anonim, 2009).

  Ciri khas batik gaya Yogyakarta adalah ada dua macam latar atau warna

dasar kain yaitu putih dan hitam, sementara warna batik umumnya putih (warna

kain mori), biru tua kehitaman dan coklat soga. Ragam hias pertama geometris

yaitu garis miring lerek atau lereng, garis silang atau ceplok dan kawung, serta

anyaman dan limaran. Ragam hias yang kedua bersifat non-geometris yaitu

semen, lung-lungan dan boketan. Ragam hias yang bersifat simbolis erat

hubungannya dengan falsafah Hindu – Jawa antara lain Sawat melambangkan

mahkota atau penguasa tinggi, Meru melambangkan gunung atau tanah ( bumi ),

Naga melambangkan air, Burung melambangkan angin atau dunia atas dan Lidah

api melambangkan nyala atau geni (Anonim, 2009).

  Contoh batik Yogyakarta : (a) (b) (c)

Gambar 2.1 Contoh pola batik Yogyakarta (a) kawunggalar, (b)parang barong, (c) nitik cengkeh.

2.2 Clustering

  Clustering adalah proses mengelompokkan obyek berdasarkan informasi

yang diperoleh dari data yang menjelaskan hubungan antar obyek dengan prinsip

memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan

kesamaan antar kelas atau cluster (Agus I,2009). Tujuan dari clustering adalah

menemukan cluster yang berkualitas dalam waktu yang tepat. Clustering dalam

  

data mining berguna untuk menemukan pola distribusi di dalam sebuah data set

yang berguna untuk proses analisa data. Kesamaan obyek biasanya diperoleh dari

kedekatan nilai-nilai atribut yang menjelaskan obyek-obyek data, sedangkan

obyek-obyek data biasanya direpresentasikan sebagai sebuah titik dalam ruang

multidimensi.

  Dengan menggunakan clustering, dapat diidentifikasi daerah yang padat,

pola-pola distribusi secara keseluruhan dan keterkaitan yang menarik antara

atribut-atribut data. Dalam data mining usaha difokuskan pada metode-metode

penemuan cluster pada basis data berukuran besar secara efektif dan efisien.

  Image Clustering merupakan suatu proses pengelompokan yang bertujuan

untuk mengelompokkan gambar menjadi kelompok-kelompok, dimana gambar

dalam satu kelompok akan memiliki karakteristik yang sama, sedangkan gambar

dalam kelompok yang berbeda memiliki karakteristik yang berbeda (Agusta Y,

2011).

2.2.1 Karakteristik clustering

  

Karakteristik clustering dibagi menjadi 4 (Hasniawati,2007), yaitu :

a. Partitioning clustering

  Partitioning clustering disebut juga exclusive clustering, dimana setiap

data harus masuk ke cluster tertentu. Karakteristik tipe ini juga memungkinkan

bagi setiap data yang termasuk cluster tertentu pada suatu tahapan proses, pada tahapan berikutnya berpindah ke cluster yang lain. Contoh : K-means. b. Hierarchical clustering Pada hierarchical clustering, setiap data harus masuk pada cluster tertentu dan suatu data yang termasuk pada cluster tertentu pada suatu tahapan proses, tidak dapat berpindah ke cluster lain pada tahapan berikutnya.

  Contoh: Single Linkage, Centroid Linkage,Complete Linkage, Average Linkage .

  c. Overlapping clustering Dalam overlapping clustering, setiap data memungkinkan termasuk ke beberapa cluster. Data mempunyai nilai keanggotaan (membership) pada beberapa cluster.

  Contoh: Fuzzy C-means, Gaussian Mixture.

  d. Hybrid Karakteristik hybrid merupakan karakter yang menggabungkan karakteristik dari partitioning, overlapping dan hierarchical.

2.2.2 Algoritma clustering

  Terdapat beberapa algoritma yang sering digunakan dalam clustering (Zaiane,1999), yaitu :

a. Hierarchical Clustering

  Dengan metode ini, data tidak langsung dikelompokkan ke dalam

beberapa cluster dalam 1 tahap, tetapi dimulai dari 1 cluster yang mempunyai

kesamaan, dan berjalan seterusnya selama beberapa iterasi, hingga terbentuk

beberapa cluster tertentu (Barakbah dan Arai,2004).

Gambar 2.2 Ilustrasi Algoritma Hierarchical Clustering ( Hasniawati,2007)

  Penghitungan jarak antar obyek, maupun antar cluster-nya dilakukan dengan euclidian distance untuk data numerik (Barakbah dan Arai, 2004). Untuk data 2 dimensi, digunakan persamaan sebagai berikut :

  ( , ) = ∑

  

|

  | (2.1) Algoritma hierarchical clustering banyak diaplikasikan pada metode pengelompokan berikut : i. Single Linkage Hierarchical Method (SLHM)

  Single Linkage adalah proses pengelompokan yang didasarkan pada jarak terdekat antar obyeknya atau minimum distance (Karypis dkk, 1999).

  Metode SLHM sangat bagus untuk melakukan analisa pada tiap tahap pembentukan cluster. Metode ini juga sangat cocok untuk dipakai pada kasus shape independent clustering, karena kemampuannya untuk membentuk pattern atau pola tertentu dari cluster, sedangkan untuk kasus condensed clustering , metode ini tidak cocok.

Gambar 2.3 Ilustrasi Single Linkage (Hasniawati,2007).

  ii. Centroid Linkage Hierarchical Method Centroid Linkage adalah proses pengelompokan yang didasarkan pada jarak antar centroidnya (Barakbah A.R., 2006). Metode ini cocok untuk memperkecil variance within cluster karena melibatkan centroid pada saat penggabungan antar cluster. Metode ini juga baik untuk data yang mengandung outlier.

Gambar 2.4 Ilustrasi Centroid Linkage (Hasniawati, 2007).

  iii. Complete Linkage Hierarchical Method Complete Linkage adalah proses pengelompokan yang didasarkan pada jarak terjauh antar obyeknya atau maximum distance (Barakbah, 2006). Metode ini baik untuk kasus clustering dengan normal data set distribution , akan tetapi metode ini tidak cocok untuk data yang mengandung outlier.

Gambar 2.5 Ilustrasi Complete Linkage (Hasniawati, 2007), iv.

   Average Linkage Hierarchical Method Average Linkage adalah proses pengelompokkan yang didasarkan pada jarak rata-rata antar obyeknya (Barakbah, 2006). Metode ini relatif yang terbaik dari metode-metode hierarchical, namun metode ini memerlukan waktu komputasi yang paling tinggi dibandingkan dengan metode-metode hierarchical yang lain.

Gambar 2.6 Ilustrasi Average Linkage (Hasniawati, 2007).

b. Algoritma K-means

  Algoritma K-means adalah algoritma untuk mengelompokkan data

kedalam kelompok - kelompok atau cluster sejumlah k. K-means adalah teknik

yang cukup sederhana dan cepat dalam pekerjaan pengelompokkan data

(Wibisono dan Khodra, 2006). Prinsip utama dari teknik ini adalah menyusun k

centroid atau rata-rata (mean) dari sekumpulan data berdimensi tertentu.

  

Algoritma K-means dimulai dengan pembentukan inisialisasi cluster awal

kemudian secara iteratif cluster tersebut diperbaiki hingga tidak terjadi perubahan

anggota atau konvergen. Untuk perhitungan jarak dapat menggunakan

perhitungan jarak euclidean distance. Euclidean sering digunakan karena

penghitungan jarak dalam distance space ini merupakan jarak terpendek yang bisa

didapatkan antara dua titik yang diperhitungkan (Agusta,2007).

  Algoritma K-means: i.Tentukan jumlah cluster ii. Menentukan centroid iii. Hitung jarak data terhadap centroid iv. Mengelompokan berdasarkan jarak minimum

v. Menentukan centroid yang baru kemudian kembali ke langkah 3, sampai

tidak ada data yang berpindah

  St art Jum lah clust er (kelom pok) ya

  M enent ukan cent roid M emeriksa apakah ada kelompok yang berubah

  M enghit ung jarak dat a dengan cara m em bandingkan t erhadap cent roid dengan kelompok sebelumnya t idak M engelom pokan berdasarkan jarak m inim um end

Gambar 2.7 Proses K-means clustering (Santoso, 2005) Contoh penerapan K-means (Teknomo,2006): Terdapat 4 tipe obat dimana obat tersebut memiliki 2 atribut, x dan y.

  Kelompokan data tersebut dalam k=2.

Tabel 2.1 Contoh data obat

  Data atribut 1 (X): weight index (x) atribut 2 (Y): pH(y)

  Obat A

  1

  1 Obat B

  2

  1 Obat C

  4

  3 Obat D

  5

  4

  

1. Inisialisasi centroid awal : misalkan Obat A and Obat B sebagai centroid

awal, sehingga c 1 (1,1) dan c 2 (2,1).

  

2. Menghitung jarak data terhadap centroid : hitung jarak antara centroid

dengan masing-masing data. Perhitungan jarak dapat menggunakan

euclidean distance , sehingga diperoleh matrik jarak pada iterasi 0 yaitu :

  Tiap kolom matrik jarak tersebut melambangkan obyek data. Baris pertama matrik jarak merupakan hasil perhitungan jarak dengan c

  1 sedang baris kedua merupakan hasil perhitungan terhadap c 2 . Contoh : Jarak obat C = (4, 3) terhadap c (1,1) adalah ,

  

1

dan terhadap c 2 (2,1) adalah , dsb.

  3. Pengelompokan : menentukan kelompok data berdasarkan jarak terkecil sehingga obat A dalam kelompok 1, obat B dalam kelompok 2, obat C ke kelompok 2 dan obat D pada kelompok 2. Matrik dengan elemen 1 menandakan anggota kelompok tersebut.

  4. Iterasi-1, menentukan centroid baru : setelah anggota kelompok diketahui selanjutnya pada tiap kelompok,hitung centroid baru berdasarkan anggota kelompok tersebut. Kelompok 1 hanya memiliki satu anggota sehingga titik tersebut merupakan centroid baru pada c

  1 sedangkan pada kelompok 2 memiliki 3 anggota, sehingga centroid yang baru diperoleh dengan mencari rata-rata dari ketiga data tersebut:

  5. Iterasi-1, menghitung jarak terhadap centroid : langkah berikutnya adalah menghitung jarak semua data terhadap centroid yang baru. Seperti pada langkah ke-2, hasil perhitungan dapat kita lihat dalam matrik jarak sebagai berikut :

  6. Iterasi-1, pengelompokan data: seperti pada langkah 3, kita tandai tiap data berdasarkan jarak terkecil sehingga diperoleh hasil obat A dan obat B berada pada kelompok 1 sedangkan obat C dan obat D berada pada

  . kelompok 2

  7. Iterasi-2, menentukan centroid baru:seperti pada langkah ke-4, maka tentukan centroid baru berdasarkan perhitungan pengelompokan dari iterasi sebelumnya.kelompok 1 dan kelompok 2 sama-sama memiliki 2 anggota, sehingga centroid baru diperoleh sebagai berikut:

  = , = 1 , 1 dan = , = 4 , 3

  8. Iterasi-2, menghitung jarak terhadap centroid : kembali ulangi langkah 2, sehingga diperoleh jarak matrik yang baru:

9. Iterasi-2,pengelompokan : menentukan anggota kelompok berdasarkan jarak paling kecil.

  Hasil di atas menunjukan sehingga tidak ada perubahan anggota kelompok, berarti proses pengelompokan telah stabil dan tidak memerlukan iterasi lagi. Hasil akhir pengelompokan sebagai berikut:

Tabel 2.2 Hasil pengelompokan

  data atribut 1 (X): atribut 2 (Y): hasil weight index pH pengelompokan obat A

  1

  1

  1 obat B

  2

  1

  1 obat C

  4

  3

  2 obat D

  5

  4

  2 Pada tabel di atas, obat A dan obat B termasuk dalam kelompok satu sedang obat C dan obat D termasuk dalam kelompok 2.

2.3 Ciri

  Ciri mewakili sesuatu yang khas pada citra yang akan di ekstraksi untuk

proses selanjutnya. Pada data citra terdapat beberapa ciri yang dapat digunakan

seperti warna dan bentuk (Herdiyeni, 2008). Pada pengelompokan pola batik

belum terdapat penelitian yang menyebutkan tentang ciri yang tepat, sehingga

penulis mencoba menggunakan ciri warna dan informasi tepi dengan harapan pilihan tersebut akan menghasilkan hasil yang maksimal. a) Informasi tepi Informasi tepi merupakan proses yang menghasilkan tepi-tepi dari obyek-obyek citra, dimana tujuannya adalah menandai bagian yang menjadi detail citra dan memperbaiki detail dari citra yang kabur, yang terjadi karena error atau adanya efek dari proses akuisisi citra (Riyanto, 2006). Dalam pengambilan informasi tepi ini digunakan metode canny karena merupakan metode deteksi tepi yang paling baik (Fisher dkk, 2003) serta telah digunakan dalam pengambilan ekstraksi dalam pengidentifikasian batik berdasarkan pola batik dan ciri-ciri batik menggunakan ekstraksi ciri tekstur kain (Imanuddin, 2010).

  b) Warna Meneliti citra berdasarkan warna yang dikandungnya adalah salah satu teknik yang paling banyak digunakan. Perhitungan kadar warna berdasarkan atas percobaan yang telah dilakukan pada penelitian untuk klasifikasi tingkat kematangan tomat merah menggunakan metode perbandingan kadar warna (Noviyanto, 2009). Dalam sebuah citra terdapat 3 komponen warna utama, yaitu red, green dan blue, atau yang sering disebut RGB. Komponen RGB dalam setiap citra dapat digunakan sebagai ciri untuk proses pengolahan citra selanjutnya.

2.4 Perhitungan validasi cluster

  Konsistensi hasil clustering dapat di ukur dengan nilai dissimilarity (Adi

  

evaluasi dianggap semakin berbeda, namun jika semakin kecil nilai dissimilarity,

maka kedua obyek tersebut dianggap semakin mirip (Karhendana,2008).

  Pada dasarnya data ditentukan similar atau dissimilar berdasarkan atas

kondisi jarak pada data tersebut, misalnya untuk kondisi similar interval yang

digunakan hanya 2 yaitu keadaan 0 (no similarity), 1(complete similarity). Rumus Similarity :

  1 = (2.2) Rumus Dissimilarity

  = (2.3)

  1 p and q adalah nilai atribut untuk 2 data yang dibandingkan.

  Rumus untuk menghitung rata –rata dissimilarity (Adi dkk, 2008) adalah: , =

  1 (2.4 ) ∶ ∑ ≠

  ∈ Dimana P k adalah permutasi semua label, 1 = 1 ketika ≠ ≠ dan bernilai 0 jika = . L adalah hasil clustering.

  Permutasi digunakan untuk mengatasi adanya ketidakunikan label seperti

pada representasi label 1 pada pengelompokkan pertama dan label 2 pada

pengelompokan berikutnya yang terlihat berbeda, padahal kemungkinan kedua

label tersebut sama, sehingga semua data dibandingkan dengan hasil permutasi

untuk mengatasi adanya label yang berbeda yang sebenarnya mungkin sama pada

hasil pengelompokan (Adi dkk, 2008).

BAB III ANALISA DAN PERANCANGAN SISTEM Pada bab analisa dan perancangan sistem ini berisi tentang penjelasan

  

rancangan dan proses kerja sistem yang akan dibuat. Sistem yang akan dibuat

tersebut digunakan untuk mengelompokan data citra dan menguji keakuratan

metode clustering dengan algoritma K-means dalam pengelompokan pola batik

Yogyakarta.

3.1 Perancangan sistem secara umum

  Sistem pengelompokan pola batik ini menggunakan algoritma K-means

untuk mengelompokan pola batik sehingga batik yang mempunyai kemiripan ciri

yang hampir sama akan dikelompokan menjadi satu kelompok. Proses berawal

dengan pembacaan data citra oleh sistem, kemudian data citra yang terbaca di

ekstraksi cirinya yaitu berupa informasi tepi dan warna. Dengan pengelompokan

menggunakan K-means, setiap citra yang telah di ekstraksi cirinya, kemudian

dikelompokkan. Setelah proses pengelompokkan selesai maka akan diperoleh

informasi tentang hasil pengelompokkan yang berupa label cluster untuk setiap

data dimana label yang sama menyatakan kelompok yang sama.

  User memasukan cit ra –cit ra yang Pengelompokan akan di kelom pokan cit ra oleh sist em hasil evaluasi

  Keluaran berupa inf ormasi jumlah kelom pok yang ideal

Gambar 3.1 Gambaran sistem secara umum

  Kum pulan cit ra bat ik Proses ekst raksi ciri

  Tiap citra di ekstraksi cirinya Tiap ciri yang di peroleh di kelompokan dengan menggunakan

  K-means clust ering algoritma K-means Hasil pengelompokan hasil ditampilkan Hasil kemudian di evaluasi untuk evaluasi mengetahui jumlah cluster yang ideal

Gambar 3.2 Blok diagram sistem

3.1.1 Perancangan proses ekstraksi ciri

  Proses ekstraksi ciri merupakan tahap pengambilan komponen –

komponen yang penting dalam citra yang selanjutnya digunakan untuk proses

pengelompokkan. Dalam proses pengelompokkan pola batik ini digunakan tiga

ciri yaitu warna, informasi tepi dan gabungan antara warna dan informasi tepi.

  a. Ciri warna Ciri warna diperoleh dengan mencari rata-rata Red ( ), rata-rata Green

( ̅), rata-rata Blue ( ), kadar Red, kadar Green dan kadar Blue seperti dalam

rumus berikut:

i. Rata – rata R (mean Red)

  ∑ ∑ R =

  (3.1) ii. Rata – rata G (mean Green) ∑ ∑

  G = (3.2) iii. Rata – rata B (mean Blue)

  ∑ ∑ B =

  (3.3) iv. =

  (3.4) ̅ ̅ v. =

  (3.5) ̅ vi.

  = (3.6)

  ̅ di mana

M = lebar citra (kolom matriks) B ij = nilai piksel Blue

N = tinggi citra (baris matriks) = rata-rata Red R ij = nilai piksel Red ̅ = rata-rata Green G ij = nilai piksel Green

  = rata-rata Blue Dari ciri warna diperoleh 6 atribut yang berupa matrik dengan ukuran 1x6 .

  Algorit m a ekst raksi ciri w arna Input : matrik dari citra batik berukuran 200x200 piksel Output : matrik ciri warna berukuran 1x6 untuk setiap citra masukan for x = 1: jumlah file citra Membaca citra

  Mengambil keping warna merah

  Mengambil keping warna hijau Mengambil keping warna biru Mencari rata-rata merah Mencari rata-rata hijau Mencari rata-rata biru

Kadar Merah = rata-rata merah/(rata-rata merah+rata-rata hijau+rata-

rata biru)

Kadar Hijau = rata-rata hijau/(rata-rata merah+rata-rata hijau+rata-

rata biru) Kadar Biru = rata-rata biru/(rata-rata merah+rata-rata hijau+rata-rata biru) Menyimpan matrik kepadatan end

b. Ciri informasi tepi Citra yang digunakan adalah citra dengan ukuran 200 x 200 piksel.

  

Selanjutnya citra batik dirubah menjadi grayscale, kemudian dikenai proses

deteksi canny, metode ini dipilih karena deteksi canny memiliki hasil deteksi tepi

yang paling baik (Fisher dkk, 2003).

  (a) (b) (c)

Gambar 3.3 Hasil ciri informasi tepi pada citra batik. (a) citra asli, (b) citra setelah proses grayscale, (c) citra setelah proses canny.

  

Citra selanjutnya dibuat menjadi 8 vektor secara vertikal dan 8 vektor secara

horisontal seperti dalam gambar 3.4. Setiap vektor dari citra tersebut kemudian di

  • Mean
  • Mean
  • … + Mean

  82 Total 3 = Mean 13 + Mean 23 + Mean 33 + … + Mean

  6

  4

  5

  3

  2

  7

  1

  88

  Total 8 = Mean 18 + Mean 28 + Mean 38 + … + Mean

  83 …….

  32

  

hitung rata- ratanya, maka diperoleh nilai rata – rata tiap vektor seperti dalam

tabel 3.1.