Optimasi Aturan Asosiasi Multidimensi Menggunakan Algoritme Genetika Untuk Klasifikasi Kemunculan Titik Panas

(1)

OPTIMASI ATURAN ASOSIASI MULTIDIMENSI MENGGUNAKAN

ALGORTIME GENETIKA UNTUK KLASIFIKASI

KEMUNCULAN TITIK PANAS

NIA KURNIATI

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2015

(2)

(3)

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa tesis berjudul Optimasi Aturan Asosiasi Multidimensi Menggunakan Algoritme Genetika untuk Klasifikasi Kemunculan Titik Panas adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Oktober 2015

Nia Kurniati

(4)

RINGKASAN

NIA KURNIATI. Optimasi Aturan Asosiasi Multidimensi Menggunakan Algoritme Genetika untuk Klasifikasi Kemunculan Titik Panas. Dibimbing oleh IMAS SUKAESIH SITANGGANG dan IRMAN HERMADI.

Kebakaran hutan dan lahan adalah suatu permasalahan yang serius di Indonesia. Indikasi kebakaran hutan dan lahan dapat diketahui melalui titik panas yang terdeteksi di suatu lokasi tertentu pada saat tertentu. Titik panas adalah satu piksel daerah yang memiliki suhu tinggi dibandingkan dengan daerah sekitar yang tertangkap oleh sensor satelit. Salah satu upaya pencegahan kebakaran hutan ialah mengetahui karakteristik wilayah terjadinya titik panas dengan menggunakan data mining. Penambangan aturan asosiasi merupakan salah satu metode data mining

yang menghasilkan aturan yang bervariasi. Aturan (rule) yang dihasilkan memerlukan suatu algoritme untuk menemukan kemungkinan-kemungkinan dalam mencapai solusi yang optimal. Salah satu solusi optimal yang dapat diterapkan ialah menerapkan metode algoritme genetika.

Algoritme genetika menawarkan banyak manfaat dalam berbagai pemecahan masalah optimasi. Penelitian ini menerapkan algoritme genetika untuk membantu mengoptimasi sejumlah aturan asosiasi yang telah ditambang. Melalui algoritme genetika aturan asosiasi multidimensi diekstrak untuk menghasilkan aturan asosiasi yang menarik dari dataset yang bersifat kategori. Aturan dibangkitkan secara sekaligus dan menyeluruh untuk menghasilkan kombinasi yang bervariasi dari aturan asosiasi multidimensi yang dihasilkan secara otomatis. Dari sejumlah aturan yang dihasilkan tersebut kemudian dianalisis untuk mengetahui karakteristik wilayah yang memiliki potensi terjadinya titik panas.

Penelitian ini terdiri atas 3 (tiga) tahap yaitu optimasi aturan asosiasi multidimensi menggunakan algoritme genetika, klasifikasi kemunculan titik panas dengan menggunakan algoritme CPAR (Classification Based on Predictive Association Rules) di mana aturan diklasifikasi ke dalam 2 kelas yaitu kelas yang terdapat titik panas dan kelas yang tidak terdapat titik panas. Tahap terakhir adalah evaluasi aturan di mana dilakukan terhadap fitur-fitur spasial yang terdapat dalam aturan. Optimasi dalam algoritme genetika dilakukan melalui tahapan: skema pengkodean, evaluasi fitness, seleksi, pindah silang, mutasi. Hasil yang diperoleh dari penelitian ini ialah jumlah aturan dapat dikurangi. Jumlah aturan yang dihasilkan yaitu sebanyak 121 pada generasi ke-300 hingga mencapai 108 aturan pada generasi ke-50. Hasil klasifikasi menunjukkan bahwa daerah yang berpotensi timbulnya titik panas yang terdapat pada generasi ke-50 ditemukan pada daerah yang memiliki curah hujan lebih besar dari atau sama dengan 3 mm per hari dan yang memiliki temperatur pada interval 297 Kelvin hingga 298 Kelvin dengan laplace akurasi sebesar 0.76. Pada generasi 150 ditemukan daerah yang memiliki temperatur yaitu pada interval 297 Kelvin hingga 298 Kelvin dengan laplace akurasi sebesar 0.57. Pada generasi 300 ditemukan pada daerah yang memiliki kecepatan angin yaitu pada interval 1 m s-1 hingga 2 m s-1 dengan laplace akurasi sebesar 0.70.

Kata kunci: algortime apriori, algoritme CPAR, algoritme genetika, aturan asosiasi multidimensi, titik panas

(5)

SUMMARY

NIA KURNIATI. Multidimension Association Rule Optimization Using Genetic Algorithm for Hotspot Occurrence Classification Supervised by IMAS SUKAESIH SITANGGANG and IRMAN HERMADI.

Land and forest fire are a serious problem in Indonesia. Indications of land and forest fire could be known through the hotspots detected in a particular location at a given time. The hotspots are the pixels surrounding an area captured by the sensor on the satellite. One of the forest fire prevention efforts is by knowing the characteristics of the area hotspots using data mining. Association rules mining is a method of data mining that produces interesting and varied rules. The resulting rule requires an algorithm to find possibilities to achieve the optimal solution. One of the optimal solutions that can be applied is genetic algorithm.

Genetic algorithm offers many benefits in solving various optimization problems. This study proposed genetic algorithms method to help optimizing the number of mined association rules. Through genetic algorithms, multidimensional association rules were extracted to generate interesting association rules from categorical datasets. Through a process of genetic algorithms, all the rules was generated at once and thoroughly to produce varying combinations of multidimensional association rules generated automatically. In addition, the number of the generated rules were then analyzed to determine the characteristics of the area that have great hotspots occurrence potential.

This study was obtained by three stages that is association rules multidimensional optimization using genetic algorithms, classification hotspots occurrence using CPAR (Classification Based on Predictive Association Rules) algorithm where the rules are classified into two classes, namely classes that are hotspots and classes that there are no hotspots. The last stages is evaluation of the rules, in which the evaluation of spatial features contained in the generated rules

was conducted. Optimization in genetic algorithms was done through these stages:

encoding scheme, fitness evaluation, selection (roulette wheel), crossovers (one point crossover), and mutation. The results showed the proposed method successfully reduced the number of association rules. The number of rules generated as many as 121 in the generation of 300 to reach 108 rule in the 50th generation. Classification results show that the area has the potential emergence of hot spots were found on the generation of 50, found in areas where rainfall is greater than or equal to 3 mm per day and which has a temperature in the interval 297 Kelvin to 298 Kelvin by Laplace accuracy of 0.76. In the generation of 150, we found the area that have a temperature in the interval 297 Kelvin to 298 Kelvin by Laplace accuracy of 0.57. In the generation of 300, we found the area that have a wind speeds that is intervals of 1 m s-1 up to 2 m s-1 with Laplace accuracy

of 0.70.

Keywords: apriori algorithm, association rule multidimension, CPAR algorithm, genetic algorithm, hotspot

(6)

© Hak Cipta Milik IPB, Tahun 2015

Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan IPB

Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini dalam bentuk apa pun tanpa izin IPB

(7)

Tesis

sebagai salah satu syarat untuk memperoleh gelar Magister Komputer

pada

Program Studi Ilmu Komputer

OPTIMASI ATURAN ASOSIASI MULTIDIMENSI MENGGUNAKAN

ALGORTIME GENETIKA UNTUK KLASIFIKASI

KEMUNCULAN TITIK PANAS

SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR

BOGOR 2015

(8)

(9)

(10)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Februari 2014 ini berjudul Optimasi Aturan Asosiasi Multidimensi Menggunakan Algoritme Genetika untuk Klasifikasi Kemunculan Titik Panas.

Terima kasih tak terhingga penulis ucapkan untuk kedua orang tua tercinta Bapak H.Abd.Halim Mahmud (Alm) dan Ibu Hj.Rahmawati Amir. Adik saya Muhammad Ali dan Abdullah Arham, serta seluruh keluarga yang telah memberikan dukungan, kasih sayang, dan doanya. Semoga Allah SWT selalu merahmati. Penghargaan dan ucapan terima kasih yang setinggi-tingginya kepada Ibu Dr Imas Sukaesih Sitanggang SSi MKom dan Bapak Irman Hermadi SKom MS PhD yang telah banyak memberikan pengarahan dan bimbingan selama dalam penyelesaian penulisan dan penyusunan pada karya ilmiah ini. Ucapan terima kasih kepada Bapak DrEng Wisnu Ananta Kusuma ST MT selaku penguji. Penghargaan dan ucapan terima kasih penulis sampaikan kepada Direktorat Jenderal Pendidikan Tinggi (DIKTI) melalui Beasiswa Pendidikan Pascasarjana (BPPS) atas pemberian pembiayaan selama dalam penyusunan studi dan karya ilmiah ini. Terima kasih penulis sampaikan kepada pengelola perguruan tinggi Universitas Muslim Indonesia khususnya seluruh staf akademik Fakultas Ilmu Komputer UMI Makassar atas dukungan dan rekomendasi yang telah diberikan.

Ungkapan terima kasih juga kepada Ibu Dr Pipih Suptijah dan sekeluarga atas perhatian, sarana, dan dukungannya. Terima kasih kepada teman sepembimbingan (Aji, Edwin, Nisa, Sanusi, Usman), teman-teman Nikita (Azmida, Izaki, Indah, Faiza), teman-teman angkatan 14 (Abrar, Azis, Dhieka, Vira, Ina, Inggih, Khusnul, Lailan, Yessy) atas dukungan, saran, dan masukan yang diberikan selama dalam menyelesaikan penelitian ini. Terima kasih juga penulis sampaikan kepada pengelola pascasarjana, seluruh dosen, dan staf akademik Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) khususnya Departemen Ilmu Komputer Institut Pertanian Bogor dan seluruh teman-teman angkatan 14 atas kebersamaan selama kuliah dan dalam menyelesaikan penelitian ini.

Akhir kata semoga karya ilmiah ini bermanfaat. Kritik dan saran sangat penulis harapkan demi kesempurnaan dan pengembangan karya ilmiah ini. Atas segala saran dan masukan, penulis mengucapkan terima kasih.

Bogor, Oktober 2015

(11)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vii

1 PENDAHULUAN 1

Latar Belakang 1

Perumusan Masalah 2

Tujuan Penelitian 2

Manfaat Penelitian 3

Ruang Lingkup Penelitian 3

2 TINJAUAN PUSTAKA 3

Kebakaran Hutan 3

Titik Panas 4

Algoritme Genetika 4

Penambangan Aturan Asosiasi 5

Aturan Asosiasi Multidimensi 6

Algoritme Apriori 6

Klasifikasi Asosiatif (Associative Classification) 7

Algoritme CPAR 7

3 METODE PENELITIAN 9

Data dan Sumber Data 9

Spesifikasi Implementasi Sistem 9

Tahapan Penelitian 10

Optimasi Aturan Asosiasi Multidimensi Menggunakan Algoritme

Genetika 10

4 HASIL DAN PEMBAHASAN 13

Optimasi Menggunakan Algoritme Genetika 13

Pengujian Hasil Optimasi 14

Klasifikasi Kemunculan Titik Panas Menggunakan Algoritme CPAR 18

Pembentukan Gain 19

Evaluasi Aturan 23

5 SIMPULAN DAN SARAN 24

Simpulan 24

Saran 24

DAFTAR PUSTAKA 24

LAMPIRAN 27

(12)

DAFTAR TABEL

1 Data dan sumber data (Sitanggang 2013) 9

2 Contoh 10 record aturan asosiasi multidimensi (Sitanggang 2013) 13 3 Jumlah aturan dan nilai fitness dari proses algoritme genetika 14

4 Aturan asosiasi dari tiap generasi 16

5 Pembagian sampel data dari tiap generasi 18

6 Jumlah sampel data latih dari tiap generasi 19

7 Total Weight Threshold (TWT) untuk setiap generasi 19

8 Gain terbesar dengan Local Gain Threshold (LGT) dengan (bobot 1)

untuk setiap generasi 20

9 Gain terbesar dengan Local Gain Threshold (LGT) dengan (bobot 0.66)

untuk setiap generasi 21

10 Gain terbesar dengan Local Gain Threshold (LGT) dengan (bobot 0.33)

untuk setiap generasi 21

11 Gain terbesar dengan Local Gain Threshold (LGT) dengan (bobot 0.11)

untuk setiap generasi 22

12 Aturan dan Laplace accuracy (LA) dengan Gainsimilarity ratio 60% 22

DAFTAR GAMBAR

1 Siklus algoritme genetika (Goldberg 1989) 4

2 Model Penambangan aturan asosiasi (Rana dan Mann 2013) 5

3 Pseude-code algoritme apriori (Agrawal dan Srikant 1994) 7

4 Alur penelitian untuk optimasi aturan asosiasi menggunakan algoritme

genetika 10

5 Pembentukan kromosom 11

6 Pindah silang (one point crossover) 12

7 Nilai fitness terdapat titik panas 15

8 Nilai fitness tidakterdapat titik panas 15

9 Aturan terdapat titik panas 17

10 Aturan tidak terdapat titik panas 18

DAFTAR LAMPIRAN

1 Contoh 20 record dataset kebakaran hutan 27

2 Kode dan jumlah kemunculan fitur dalam dataset kebakaran hutan 28

3 Populasi awal 29

4 Induk hasil seleksi 29

5 Populasi awal 29

6 Aturan asosiasi dan kode rule terdapat titik panas dan titik terdapat titik

panas dari algoritme genetika 30

7 Kategori dan nilai Gain untuk bobot sampel positif dan sampel negatif

(13)

8 Kategori dan nilai Gain untuk bobot sampel positif dan sampel negatif

pada generasi 150 32

9 Kategori dan nilai Gain untuk bobot sampel positif dan sampel negatif

pada generasi 300 34

10 Kategori dan nilai Gain untuk bobot sampel positif pada generasi 50

dengan bobot=0.66 35

11 Kategori dan nilai Gain untuk bobot sampel positif pada generasi 150

dengan bobot=0.66 37

12 Kategori dan nilai Gain untuk bobot sampel positif pada generasi 300

dengan bobot=0.66 38

13 Kategori dan nilai Gain untuk bobot sampel negatif pada generasi 50

dengan bobot=0.66 40

14 Kategori dan nila Gain untuk bobot sampel negatif pada generasi 150

dengan bobot=0.66 41

15 Kategori dan nilai Gain untuk bobot sampel negatif pada generasi 300

dengan bobot=0.66 43

16 Kategori dan nilai Gain untuk bobot sampel positif pada generasi 50

dengan bobot=0.33 44

17 Kategori dan nilai Gain untuk bobot sampel positif pada generasi 150

dengan bobot=0.33 46

18 Kategori dan nilai Gain untuk bobot sampel positif pada generasi 300

dengan bobot=0.33 47

19 Kategori dan nilai Gain untuk bobot sampel negatif pada generasi 50

dengan bobot=0.33 49

20 Kategori dan nilai Gain untuk bobot sampel negatif pada generasi 150

dengan bobot=0.33 50

21 Kategori dan nilai Gain untuk bobot sampel negatif pada generasi 300

(14)

(15)

1 PENDAHULUAN

Latar Belakang

Kebakaran hutan dan lahan menjadi suatu permasalahan yang serius di Indonesia. Kejadian kebakaran hutan di Indonesia meningkat dari tahun ke tahun. Kabupaten Rokan Hilir adalah salah satu wilayah yang sering mengalami kebakaran hutan dan lahan di Riau. Kebakaran yang terjadi pada bulan Februari dan Maret tahun 2014 telah menyebabkan kerugian hingga 20 triliun rupiah (Nugroho 2014). Kerugian yang ditimbulkan ini tidak hanya dari sisi ekonomi tapi juga dari sisi kesehatan manusia dan lingkungan di sekitarnya. Menurut Syaufina (2008) kebakaran pada umumnya disebabkan oleh faktor manusia dan sebagian kecil karena faktor alam. Indikasi kebakaran hutan dan lahan dapat diketahui melalui titik panas yang terdeteksi di suatu lokasi tertentu pada saat tertentu (Syaufina 2008). Timbulnya kebakaran hutan yang tinggi di Indonesia menyebabkan perlu sejak dini melakukan analisis terhadap faktor penyebabnya. Salah satu yang dapat diterapkan dalam upaya pencegahan kebakaran hutan ialah mengetahui karakteristik wilayah terjadinya titik panas dengan menggunakan teknik data mining. Data mining ialah teknik analisis data untuk menemukan pengetahuan dalam basis data. Data mining memiliki kemampuan untuk dapat menemukan pola yang sering muncul di dalam dataset salah satunya yaitu menerapkan penambangan aturan asosiasi. Menurut Han et al. (2012) aturan asosiasi adalah pengetahuan untuk mengetahui keterkaitan dan bobot kepentingan antara objek yang satu dengan yang lainnya. Poornamala dan Lawrance (2012) mengembangkan metode data mining untuk menemukan aturan asosiasi.

Aturan asosiasi multidimensi merupakan pengetahuan baru yang mulai banyak dikembangkan. Studi oleh Sitanggang (2013) menerapkan teknik data mining yaitu penambangan aturan asosiasi menggunakan algoritme apriori untuk menghasilkan 1080 aturan asosiasi multidimensi dari data spasial kebakaran hutan. Dengan menggunakan minimum support sebesar 10% dan minimum

confidence sebesar 80% diperoleh sejumlah aturan untuk mengetahui faktor-faktor yang mempengaruhi terjadinya titik panas sebagai indikator terjadinya peristiwa kebakaran hutan. Menurut Han et al. (2012) aturan asosiasi yang bersifat

multidimensional sering disebut dengan high dimensional pattern. Aturan asosiasi multidimensi merupakan pengetahuan baru yang mulai banyak dikembangkan. Sebagaimana diketahui aturan asosiasi spasial multidimensi cenderung lebih kompleks dan lebih bervariasi dari pada non-spasial. Aturan ini tidak hanya melibatkan satu predikat tapi juga dapat terdiri dari dua predikat atau lebih. Menurut Saggar et al. (2004) penambangan aturan asosiasi mempunyai keterbatasan yaitu menghasilkan kompleksitas dalam aturan. Salah satu kompleksitas yang ditimbulkan yaitu jumlah aturan tumbuh secara eksponensial berdasarkan jumlah item. Kompleksitas dalam aturan ini dapat ditangani secara efisien yaitu dengan memangkas ruang pencarian. Selain itu menemukan seperangkat aturan yang berkualitas dan menarik dari aturan yang dihasilkan. Kompleksitas aturan yang diperoleh sangat bervariasi sehingga diperlukan suatu algoritme untuk dapat mencari kemungkinan-kemungkinan dalam memperoleh

(16)

solusi yang optimal. Salah satu solusi optimal yang dapat diterapkan ialah menerapkan metode algoritme genetika

Algoritme genetika merupakan metode penyelesaian solusi dari berbagai macam jenis permasalahan. Salah satu kasus permasalahan yang dapat diterapkan ialah yang berkaitan mengenai penambangan aturan asosiasi. Hsu et al. (2003) pertama kali menggabungkan algoritme aturan asosiasi dan algoritme genetika dalam melakukan pencarian secara efisien. Ghosh dan Nath (2004) menerapkan algortime genetika dalam mengurangi aturan yang bersifat multiobjektif. Saggar

et al. (2004) menggunakan algoritme genetika dalam mengoptimalkan kompleksitas aturan dengan memperhatikan atribut negatif. Du et al. (2009) berhasil menerapkan algoritme genetika dalam memproses ribuan aturan asosiasi dengan mengurangi aturan yang berlebihan dan meningkatkan efisiensi pencarian. Prakash et al. (2011) menerapkan algoritme genetika dalam menghasilkan sejumlah frequent itemset dengan memperhatikan atribut diskrit dan interval yang terdapat dalam aturan dan berhasil mengurangi waktu komputasi. Saxena et al.

(2012) mengurangi proses iterasi dalam menghasilkan individu yang terbaik. Rana dan Mann (2013) menerapkan Multi-fitness Function Genetic Algorithm (MFGA) dalam membangkitkan dan menghasilkan aturan yang lebih efisien dan efektif.

Penelitian sebelumnya telah membuktikan bahwa algoritme genetika dapat diterapkan dalam penambangan aturan asosiasi. Tujuan dari penelitian ini adalah menerapkan algoritme genetika dengan membuat model optimasi pembangkitan aturan asosiasi berbasis apriori untuk mengoptimasi 1080 aturan asosiasi multidimensi yang dihasilkan oleh Sitanggang (2013). Diharapkan jumlah aturan yang dihasilkan lebih sedikit dan mengetahui model aturan yang dihasilkan. Dari aturan yang diperoleh kemudian dibentuk aturan klasifikasi menggunakan algoritme CPAR (Classification Based on Predictive Association Rules) untuk mengidentifikasi karakteristik wilayah yang berpotensi munculnya titik panas.

Perumusan Masalah Perumusan pada penelitian ini ialah sebagai berikut:

1. Bagaimana menerapkan algoritme genetika untuk mengoptimasi aturan asosiasi multidimesi

2. Bagaimana karakteristik wilayah yang berpotensi terjadinya titik panas berdasarkan aturan asosiasi yang telah dioptimasi menggunakan algoritme genetika

3. Bagaimana menerapkan algoritme CPAR (Classification Based on Predictive Association Rules) terhadap aturan asosiasi multidimesi dalam mengidentifikasi potensi kemunculan titik panas.

Tujuan Penelitian Tujuan penelitian ini yaitu:

1. Membuat model optimasi pembangkitan aturan asosiasi berbasis apriori dengan menggunakan algoritme genetika.

2. Evaluasi dan klasifikasi titik panas menggunakan algoritme CPAR

Classification Based on Predictive Association Rules) untuk mengidentifikasi potensi kemunculan titik panas.

(17)

Manfaat Penelitian

Manfaat yang diharapkan dari penelitian ini ialah sebagai bahan analisis untuk mengetahui faktor penyebab terjadinya titik panas. Di samping itu hasil penelitian ini dapat digunakan sebagai informasi pendukung dalam pengambilan keputusan dalam upaya penanganan kebakaran hutan khususnya untuk area Kabupaten Rokan Hilir Riau.

Ruang Lingkup Penelitian Ruang lingkup dalam penelitian ini antara lain:

1. Data kebakaran hutan di wilayah studi Kabupaten Rokan Hilir Riau (Tahun 2008), data meliputi kondisi geografis, sosial, ekonomi, dan data cuaca.

2. Menerapkan metode algoritme genetika untuk mengoptimasi 1080 aturan asosiasi multidimensi (Sitanggang 2013).

2 TINJAUAN PUSTAKA

Kebakaran Hutan

Kebakaran hutan adalah suatu kejadian di mana api secara liar dan tidak terkontrol membakar bahan bakar bervegetasi pada hutan sedangkan kebakaran lahan terjadi pada wilayah hutan (Syaufina 2008). Prinsip segitiga api menerangkan mengenai penyebab dasar terjadinya pembakaran yaitu dipengaruhi oleh tiga hal diantaranya adalah bahan bakar, oksigen, dan panas. Hilangnya satu atau lebih dari segitiga ini akan mengakibatkan tidak terjadinya pembakaran. Segitiga api dapat divisualisasikan sebagai dasar hubungan reaksi berantai dalam pembakaran (Suratmo et al 2003). Aspek perilaku api dapat dipicu oleh bahan bakar yang mudah terbakar, energi panas yang cukup untuk membawa bahan bakar pada temperatur penyalaan dan oksigen yang cukup (Suratmo et al 2003). Berdasarkan pola penyebaran dan tipe bahan bakar, kebakaran hutan dan lahan dapat digolongkan ke dalam tiga tipe, yaitu kebakaran bawah (ground fire), kebakaran permukaan (surface fire), dan kebakaran tajuk (crown fire) (Syaufina 2008). Pada tipe kebakaran lahan gambut, api menjalar di bawah permukaan membakar bahan organik dengan pembakaran yang tidak menyala (smoldering) (Syaufina 2008). Terdapat beberapa faktor yang mempengaruhi perilaku api diantaranya adalah kandungan bahan bakar, iklim atau cuaca dan topografi (Syaufina 2008). Suhu, curah hujan, dan kecepatan angin merupakan tiga jenis data spasial yang termasuk dalam indikator cuaca (Boonyanuphap 2001).

Kondisi fisik atau lingkungan geografis lain yang berpengaruh pada kebakaran hutan dan lahan adalah tipe dan kedalaman. Aspek infrastruktur memiliki peran yang lebih besar dibanding faktor lingkungan fisik dalam mendukung kejadian kebakaran lahan gambut, antara lain yaitu jaringan jalan, tipe tutupan lahan dan vegetasi, ketebalan gambut, dan tingkat kehijauan vegetasi (Hadi 2006). Sumber pendapatan merupakan data spasial yang termasuk pada indikator dari kondisi sosial ekonomi (Sitanggang et al. 2013).

(18)

Titik Panas

Segitiga api merupakan suatu bentuk sederhana untuk menggambarkan proses pembakaran dan aplikasinya. Segitiga api dapat divisualisasikan sebagai dasar hubungan reaksi berantai dari pembakaran. Melemahnya satu atau lebih dari sisi segitiga ini akan melemahkan rantai tersebut dan mengurangi laju pembakaran serta intensitas kebakarannya (Suratmo et al. 2003). Titik panas adalah satu piksel daerah yang memiliki suhu lebih tinggi jika dibandingkan dengan daerah sekitar yang tertangkap oleh sensor satelit data digital (Albar 2002). Titik panas adalah salah satu indikator yang dapat digunakan untuk menentukan di mana lokasi terjadinya kebakaran hutan, yang mana data tersebut dapat diamati oleh citra satelit. Data titik panas terdiri dari koordinat geografis (longtitude dan latitude), lokasi titik panas dan jumlah kemunculan titik panas untuk masing-masing daerah (Suratmo et al. 2003).

Algoritme Genetika

Algoritme genetika adalah algoritme komputasi untuk masalah optimasi yang terinspirasi oleh teori evolusi untuk mencari solusi suatu permasalahan. Terdapat banyak sekali variasi pada algoritme genetika, salah satunya adalah algoritme genetika untuk masalah optimasi kombinasi, yaitu mendapatkan nilai solusi yang optimal terhadap suatu masalah yang memiliki banyak kemungkinan solusi (Goldberg 1989). Algoritme Genetika pertama kali dirintis oleh John Holland dari Universitas Michigan pada tahun 1960-an. Algoritme Genetika banyak digunakan untuk memecahkan masalah optimasi (Goldberg 1989).

Dalam algoritme genetika terdapat sekumpulan kromosom (calon solusi) yang dibangkitkan secara acak pada populasi awal agar dapat berkembang biak dengan sendirinya (melalui beberapa generasi) hingga konvergen agar memberikan suatu nilai fitness yang terbaik (nilai optimal). Kromosom yang terbentuk pada generasi baru disebut kromosom anak (offspring) (Arkaeman et al.

2012). David Goldbergmemperkenalkan siklus dari algoritme genetika (Goldberg 1989). Gambaran siklus tersebut dapat dilihat pada Gambar 1.

Gambar 1 Siklus algoritme genetika (Goldberg 1989) Terdapat 5 komponen dalam algoritme genetika (Goldberg 1989): 1. Sebuah kromosom merepresentasikan sebuah solusi

2. Menginisialisasi populasi awal

(19)

4. Menambahkan operator genetika selama reproduksi, seperti pindah silang, mutasi, dan lain-lain.

5. Mengatur parameter dalam algoritme seperti ukuran populasi dan peluang untuk operator genetik.

Seleksi (selection) merupakan jumlah perwakilan dari sebuah kromosom yang diterima untuk generasi selanjutnya dengan bergantung pada nilai fitness

yang dibandingkan dengan nilai fitness rata-rata. Kromosom yang terpilih dievaluasi dengan menggunakan fungsi fitness kemudian diseleksi untuk dijadikan induk (Arkaeman et al. 2012).

Penyilangan (crossover) adalah operator utama atau operator primer dalam algoritme genetika. Operator ini bekerja pada sepasang kromosom induk untuk menghasilkan dua kromosom anak dengan cara menukarkan beberapa elemen (gen) yang dimiliki masing-masing kromosom induk (Arkaeman et al. 2012). Menurut Goldberg (1989) parameter pindah silangyang baik ialah 0.6-1.0.

Mutasi (mutation) adalah operator sekunder atau operator pendukung dalam algoritme genetika yang berperan mengubah struktur kromosom secara spontan. Perubahan secara spontan ini menyebabkan terbentuknya suatu mutan, yaitu suatu kromosom baru yang secara genetik berbeda dari kromosom sebelumnya. Operator mutasi bekerja pada satu kromosom, tidak pada sepasang kromosom seperti halnya yang dilakukan penyilangan. Dalam pencarian solusi optimum, mutasi sangat diperlukan yaitu untuk (Arkaeman et al. 2012):

1. Mengembalikan gen-gen yang hilang pada generasi sebelumnya

2. Memunculkan generasi baru yang belum pernah muncul pada generasi sebelumnya.

Adapun penentuan peluang mutasiyang baik adalah 0.1-0.5 (Goldberg 1989). Penambangan Aturan Asosiasi

Penambangan aturan asosiasi merupakan implikasi dari bentuk A ke B, di mana A dan B adalah 2 himpunan itemset (Han et al. 2012). Aturan asosiasi bekerja pada dataset.Aturan asosiasi memiliki dua bagian, yaitu antecedent (jika) dan consequent (maka). Antecedent (jika) adalah item yang ditemukan dalam data, sedangkan consequent (maka) adalah item yang ditemukan dalam kombinasi. Aturan asosiasi menganalisis data transaksi dengan menggunakan kriteria support

dan confidence. Confidence digunakan untuk mengidentifikasi hubungan yang paling penting, sedangkan support merupakan indikasi seberapa sering item muncul dalam basis data (Saxena dan Ruchi 2012). Gambar 2 menunjukkan model penambangan aturan asosiasi (ARM) dalam Knowledge Discovery in Database (KDD) (Rana dan Mann 2013).

(20)

Rumus support diberikan dalam persamaan 1 (Han et al. 2012):

(1)

Rumus confidence diberikan dalam persamaan 2 (Han et al. 2012):

(2)

di mana,

A : Antecendent aturan (bagian jika) D : Dataset (transaction)

B : Consequent aturan (bagian maka)

Aturan yang menarik ialah aturan yang memenuhi ambang batas minimum

support (minSup) dan ambang batas confidence minimum (minConf), aturan yang memenuhi keduanya tersebut disebut sebagai aturan yang kuat (strong rule) (Han

et al. 2012). Terdapat 2 proses utama algoritme penambangan aturan asosiasi yaitu (Han et al. 2012):

1. Pembangkitan frequent itemset

Mencari semua itemset yang memenuhi ambang batas minsup. Itemset tersebut disebut frequent itemset (itemset yang sering muncul)

2. Pembangkitan aturan

Mengekstrak/menghasilkan aturan dengan confidence tinggi dari frequent itemset yang ditemukan pada langkah sebelumnya.

Aturan Asosiasi Multidimensi

Multidimensional association rule (2 dimensions) adalah semua attribut/dimensi/predikat yang ada pada basis data sebagai item (Budhi et al.

2010). Asosiasi Multidimensional merupakan high dimensional pattern, di mana tidak hanya melibatkan satu predikat tapi juga dapat terdiri dari dua atau lebih dimensi. Pola referensi dapat menjadi dua atau lebih dimensi, seperti usia, pendapatan dan pembeli (Han et al. 2012).

Multidimensional rules terdiri dari 2 macam (Han et al. 2012), yaitu: 1. Inter-dimension association rules (predikat tidak berulang)

Contoh :age(X,”19-25”) ^ occupation(X,“student”) => buys(X,“coke”)

2. Hybrid-dimension association rules (predikat berulang)

Contoh :age(X,”19-25”) ^ buys(X, “popcorn”) =>buys(X, “coke”)

Algoritme Apriori

Algoritme apriori adalah membentuk kandidat itemset. Kandidat yang terbentuk tersebut dibangkitkan menjadi large itemset (Agrawal dan Srikant 1994). Pembentukan large itemset dilakukan dengan mencari semua kombinasi

item-item yang memiliki support di atas minimum support (minsup) yang telah ditentukan. Kombinasi dari item-item inilah yang disebut dengan large itemset. Langkah ini dilakukan dengan iterasi untuk mencari large itemset yang memiliki kardinalitas dari 1 sampai k (k-itemset). Pembentukan large itemset dapat

(21)

Ck : candidateitemset dengan ukuran k

Lk : large itemset dengan ukuran k

 : data seluruh transaksi

L1 = {Large 1-itemset};

for (k=2; Lk-1≠  ; k++) do begin Ck = apriori-gen(Lk-1);

forall transaksi tdo begin Ct = subset (Ck, t);

forallcandidatescCtdo c.count++;

end

Lk = { c Ck | c.count  minsup} end

Answer = k Lk;

dilakukan dengan menggunakan algoritmeapriori. Gambar 3 berikut pseude-code

algoritme apriori (Agrawal dan Srikant 1994).

Gambar 3 Pseude-code algoritme Apriori(Agrawal dan Srikant 1994) Proses utama yang dilakukan dalam algoritme Apriori untuk mendapat

frequent itemset yaitu (Han et al 2012): 1. Join (penggabungan)

Proses ini dilakukan dengan cara pengkombinasian item dengan item yang lainnya hingga tidak dapat terbentuk kombinasi lagi.

2. Prune (pemangkasan)

Proses pemangkasan yaitu hasil dari item yang telah dikombinasikan kemudian dipangkas dengan menggunakan minimum support yang telah ditentukan oleh user.

Klasifikasi Asosiatif (Associative Classification)

Klasifikasi asosiatif merupakan penemuan aturan asosiasi yang berupa aturan jika-maka di mana yang terdapat dalam set aturan seperti X=>Y, sedangkan

Y dijadikan sebagai atribut kelas (label kelas) di mana dalam set aturan hanya terdapat pada bagian sisi kanan(maka) (Balaji dan Rao 2013). Menurut Yin dan Han (2003), aturan dinyatakan sebagai possible rule (PR) jika aturan menghasilkan confidence tertinggi. Aturan yang memenuhi minimum confidence

dinyatakan sebagai aturan yang akurat sedangkan aturan yang sesuai dengan minimum support disebut dengan frequent.

Algoritme CPAR

Klasifikasi pada penelitian ini menggunakan association rule. Menurut Yin dan Han (2003) algoritme yang efektif untuk digunakan dalam masalah klasifikasi adalah CPAR (Classification based on Predictive Association Rule). CPAR (Classification based on Predictive Association Rule) adalah algoritme

(22)

yang mengambil ide dari FOIL (First Order Inductive Learner) menggunakan algoritme greedy yaitu membangkitkan kandidat aturan yang berkualitas dengan membedakan sampel positif dan sampel negatif. FOIL secara berulang mencari aturan terbaik dan memindahkan seluruh contoh positif dalam dataset tercakup (Yin dan Han 2003). Pada algoritme ini klasifikasi diimplementasikan dalam tiga tahap: bangkitkan aturan (rule), evaluasi aturan (rule), dan klasifikasi. Pada proses pembangkitan aturan, CPAR membangun aturan dengan menambahkan literal satu persatu. Pada awal proses seluruh bobot ditetapkan sama dengan 1. CPAR menghitung Gain dari setiap literal. Masing-masing sampel dibangkitkan untuk mendapatkan aturan, sampel ini digunakan kembali di dalam perhitungan Gain

dengan mengurangi bobot melalui decay factor. Seluruh bobot sampel positif dan bobot sampel negatif dikurangihingga mencapai nilai minimum di mana dihitung berdasarkan parameter yang telah ditentukan. Setelah dilakukan proses pembangkitan aturan, CPAR mengevaluasi setiap aturan yaitu bertujuan untuk menentukan kekuatan prediksinya. Pada tahap ini aturan terbaik pada setiap kelas diperoleh berdasarkan Laplace accuracy. Yin dan Han (2003) melakukan pendekatan terhadap 26 dataset dengan menentukan parameter Total Weight Threshold (TWT)=0.05, minimum gain=0.7, dan decay factor=2/3. Parameter tersebut digunakan karena ukuran dataset yang digunakan cukup kecil. Herwanto dan Arymurthy (2010) menggunakan 41.958 record pada dataset pasien yang terdiagnosis terkena penyakit kanker payurdara dengan menentukan parameter

TotalWeightThreshold (TWT)=0.05, minimum gain=0.7, dan decay factor=1/3.

TotalWeightThreshold (TWT) dihitung dengan mengalikan jumlah bobot positif dan jumlah bobot negatif dengan konstanta selama percobaan sama dengan 0.05. Herwanto dan Arymurthy (2010) dan Yin dan Han (2003). Formula untuk

Total Weight Threshold (TWT) dihitung dengan persamaan 3 berikut Herwanto dan Arymurthy (2010) dan Yin dan Han (2003):

TWT = Bobot sampel positif/bobot sampel negatif * 0.05 (3) FOIL Gain digunakan untuk mengukur informasi dari penambahan literal

ke dalam tiap aturan (current rule). Misalkan terdapat contoh positif |P| dan contoh negatif |N| memenuhi bagian badan dari pada aturan (current rule body).

Setelah literal p ditambahkan ke aturan, terdapat | | contoh positif dan | |

contoh negatif yang memenuhi badan aturan (rules body)yang baru (Yin dan Han 2003). Pada persamaan 4 Gain dihitung dengan formula berikut (Yin dan Han 2003):

[ ] (4)

di mana |P| dan |N| adalah banyaknya objek yang mengandung kelas positif dan banyaknya objek yang mengandung kelas negatif yang memenuhi set aturan. Untuk | | dan | | adalah jumlah sampel yang mengandung kelas positif dan jumlah sampel yang mengandung kelas negatif yang memenuhi set aturan baru.

Gain yang diambil dalam setiap literal ialah Gain yang berada diatas LGT (Local Gain Threshold). Formula untuk LGT dihitung dengan persamaan 5 berikut Herwanto dan Arymurthy (2010) dan Yin dan Han (2003):

(23)

LGT (Local Gain Threshold) = Gain terbesar * Gain silmilarity Ratio(%) (5)

Laplace accuracy (LA) yaitu evaluasi aturan yang digunakan untuk memprediksi dan mengetahui kekuatan dari suatu aturan (Yin dan Han 2003). Laplace accuracy

(LA) dihitung dengan persamaan 6 berikut (Yin dan Han 2003):

Laplace accuracy (LA) = ( +1)/( +k) (6)

di mana k adalah jumlah kelas, adalah jumlah total aturan dari set aturan yang terpilih, merupakan jumlah aturan terpilih yang diprediksi.

3 METODE PENELITIAN

Data dan Sumber Data

Data spasial yang digunakan mengacu pada data penelitian sebelumnya (Sitanggang 2013) yaitu dataset kebakaran hutan wilayah Kabupaten Rokan Hilir provinsi Riau tahun 2008. Data ini meliputi kondisi geografis, ekonomi, sosial, dan cuaca. Adapun data dan sumber data yang diperoleh diuraikan pada Tabel 1.

Tabel 1 Data dan sumber data (Sitanggang 2013)

Data Tahun Sumber

Titik panas 2008 FIRMS MODIS Fire/Titik panas,

NASA/University of Maryland Suhu harian maksimal, curah

hujan harian, dan kecepatan angin

2008 Badan Meterologi Klimatologi dan Geofisika (BMKG)

Sungai, jalan, dan tutupan lahan 2008 Badan Koordinasi Survey dan Pemetaan Nasional

(BAKOSURTANAL) Tipe lahan gambut, kedalaman

dan lahan gambut

Weatland International Sumber pendapatan BPS (Badan Pusat Statistik)

Spesifikasi Implementasi Sistem

Spesifikasi implementasi untuk penelitian ini dilakukan dengan menggunakan komputer personal. Spesifikasi perangkat keras yang digunakan yaitu Processor Intel(R) Core(TM) i3-3217U CPU@1,80GHz, Memori (RAM): 4 GB, Harddrive: 500GB, 5400 rpm. Adapun perangkat lunak yang digunakan yaitu sistem operasi Microsoft Windows 8 original, pengolahan data menggunakan Microsoft Excel2010 dan aplikasi Matlab 7 R2010asebagai editor pemrograman.

(24)

Tahapan Penelitian

Tahapan yang dilakukan pada penelitian ini terdiri atas 3 tahap, yaitu optimasi aturan asosiasi multidimensi menggunakan algoritme genetika, klasifikasi kemunculan titik panas (algoritme CPAR), dan evaluasi aturan. Optimasi dalam algoritme genetika dilakukan melalui tahapan: skema pengkodean (encoding), evaluasi fitness, seleksi, pindah silang (crossover), mutasi (mutation).

Alur penelitian ditampilkan pada Gambar 4.

Encoding

Hitung Fitness

Seleksi (Roulette wheel)

Pindah silang

Mutasi

Klasifikasi Kemunculan Titik Panas (algoritme CPAR)

Pembangkitan aturan Stopping criteria (fitness>=minConf)

Yes/No?

Bangkitkan Populasi Evaluasi Aturan

Aturan asosiasi multidimensi

Mulai

Aturan asosiasi multidimensi Baru

Selesai

Populasi baru

(Frequent itemset) No

Yes Optimasi ARM

menggunakan algoritme genetika

Gambar 4 Alur penelitian untuk optimasi aturan asosiasi menggunakan algoritme genetika

Dataset

Dataset yang digunakan mengacu pada data penelitian sebelumnya (Sitanggang 2013) yaitu dataset kebakaran hutan wilayah Kabupaten Rokan Hilir provinsi Riau tahun 2008. Data terdiri dari 490 record dan 13 atribut yang berisi karakteristik dari tiap masing-masing wilayah yang saling berkaitan. Atribut-atribut penjelas ada tiga jenis yaitu lingkungan geografis, data sosial ekonomi, dan data cuaca. Dataset kebakaran hutan (Sitanggang 2013) diuraikan di Lampiran 1.

Optimasi aturan asosiasi multidimensi menggunakan algoritme genetika Penelitian ini bertujuan untuk mengurangi aturan asosiasi multidimensi yang telah dihasilkan oleh Sitanggang (2013) dengan menggunakan algoritme genetika. Jumlah aturan asosiasi yang diperoleh sebanyak 1080 aturan yang terdiri dari atribut kategori fitur spasial.

Bangkitkan Populasi

Tahap awal yang dilakukan dalam proses algoritme genetika ialah membangkitkan populasi sebanyak jumlah kromosom. Pada tahap ini jumlah ukuran populasi yang dibangkitkan ialah sebanyak 1080 kromosom.

(25)

Skema pengkodean (Encoding)

Skema pengkodean merupakan domain solusi dari permasalahan di mana dilakukan melalui pendekatan Michigan. Setiap aturan dikodekan ke dalam kromosom (Gupta dan Sikka 2013). Representasi kromosom dapat dilakukan menggunakan penomoran, pohon, bit, array, daftar atau dalam bentuk lainnya (Indira dan Kanmani 2012). Menurut Du et al. (2009) aturan dikodekan sebagai nomor baku. Pengkodean dilakukan disebabkan jumlah string yang cukup panjang yang mana dapat mempengaruhi kecepatan pada proses komputasi. Pada penelitian ini kode dan jumlah kemunculan fitur dalam dataset kebakaran hutan diperlihatkan pada Lampiran 2. Setiap masing-masing variabel string yang telah diterjemahkan (dikodekan) dilakukan berdasarkan ukuran dan jumlah data yang diperoleh, di mana tiap 1 (satu) string membawa 3 digit angka. Setiap gen ditempatkan ke dalam 13 kolom di mana penempatan setiap gen berdasarkan urutan masing-masing. Setelah dilakukan tahap pengkodean kemudian dilanjutkan dengan pembentukan kromosom yaitu kumpulan kromosom yang terdapat dalam satu populasi, kumpulan kromosom ini dinyatakan sebagai populasi awal. Gambar 5 menunjukkan pembentukan kromosom yang dikodekan di mana A adalah

antecendent (bagian jika), B adalah consequent (bagian maka). Contoh rule ke-78:

Gambar 5 Pembentukan kromosom Evaluasi fitness

Evaluasi nilai fitness adalah nilai yang menyatakan baik tidaknya suatu solusi (kromosom). Tujuan dari proses fitness adalah untuk mencari kromosom yang memiliki nilai fitness yang paling tinggi. Nilai fitness yang paling tinggi tersebut menjadi tolak ukur optimal suatu solusi. Semakin optimal nilai fitness

yang dihasilkan maka kualitas kromosom yang memenuhi nilai fitness tersebut dinyatakan semakin baik (memenuhi syarat fitness). Menurut Du et al. (2009)

support dan confidence merupakan parameter dalam mencari nilai fitness,

sedangkan variabel a dan variabel b merupakan koefisien bobot untuk mengontrol nilai fitness. Pada tahap ini koefisien bobot dinyatakan sebagai dan Fungsi fitness diberikan pada persamaan 7 berikut (Du et al. 2009):

fitness(r) = a × sup(r) + b × conf(r) (7)

Dist_road<=2.5km Screen_temp= (297K;298K)

Hotspot_occurence =Yes

Precipitation >=3mm/day

302 901 132 115

If Dist_road<=2.5km, Screen_temp=(297K;298K), Hotspot_occurence=Yes

Then Precipitation>=3mm/day

A B

(26)

di mana,

sup : Support dari aturan r a : Koefisien bobot nilai support conf : Confidence dari aturan r b : Koefisien bobot nilai confidence

Seleksi (Roulette wheel)

Proses seleksi menggunakan roulette wheel yaitu menyeleksi populasi baru dengan melakukan distribusi probabilitas yang berdasarkan dari hasil probabilitas yang terpilih. Kromosom yang terpilih dievaluasi dengan menggunakan fungsi

fitness kemudian diseleksi untuk dijadikan induk (Goldberg 1989). Pindah Silang (One point crossover)

Pindah silang (crossover) adalah operator utama dalam algoritme genetika yang bekerja pada sepasang kromosom induk untuk menghasilkan dua kromosom anak dengan cara menukarkan beberapa elemen yang dimiliki masing-masing kromosom. Penentuan parameter pindah silang yang baik ialah 0.6-1.0 (Goldberg 1989). Parameter pindah silang yang digunakan sebesar 0.6. Gambar 6 mengilustrasikan proses pindah silang untuk one point crossover.

Gambar 6 Pindah silang (one point crossover) Mutasi (mutation)

Mutasi adalah proses genetik yang merubah nilai satu atau lebih gen di sebuah kromosom dalam populasi. Mutasi dilakukan dengan menentukan nilai awal secara acak dengan parameter peluang mutasi(Goldberg 1989). Talbi (2009) menganjurkan mutasi yaitu antara 0.001-0.01. Proses mutasi dilakukan dengan memilih dua gen secara acak kemudian menukar (swap) dua gen yang terpilih dengan parameter mutasi di mana ditentukan syarat mutasi sebesar 0.001 dikali dengan banyaknya domain variabel yang digunakan.

Kriteria berhenti

Kriteria berhenti (stopping criteria) ialah membatasi jumlah generasi dengan berdasarkan syarat fungsi fitness (Engelbrecht 2007). Pada tahapan ini

Stopping criteria terjadi ketika nilai fitness lebih besar atau sama dengan minimum confidence (minconf) (Jaiswal dan Dubey 2013). Hal tersebut menandakan bahwa diperoleh parameter support dan confidence yang optimal (sesuai syarat kriteria).

Pembangkitan aturan

Populasi baru yang dihasilkan oleh algoritme genetika dibangkitkan melalui algoritme apriori. Apriori adalah algoritme untuk mencari frequent itemset

dengan menggunakan metode association rule. Itemset yang terbentuk tersebut dibangkitkan menjadi largeitemset (Agrawal dan Srikant 1994).

(27)

4 HASIL DAN PEMBAHASAN

Optimasi Menggunakan Agoritme Genetika

Pada penelitian ini, optimasi menggunakan algoritme genetika dimulai dengan membangkitkan populasi awal sebanyak 1080 aturan (rule). Contoh 10

record aturan asosiasi multidimensi dapat dilihat pada Tabel 2 (Sitanggang 2013). Tabel 2 contoh 10 record aturan asosiasi multidimensi (Sitanggang 2013)

No. Aturan asosiasi multidimensi

1 2 3 4 5

hotspot_occurrence=No precipitation>=3mm/day hotspot_occurrence=No school=<=0.1

hotspot_occurrence=Yes precipitation>=3mm/day

school=<=0.1,hotspot_occurrence=No precipitation>=3mm/day precipitation>=3mm/day, hotspot_occurrence=No school=<=0.1

6 7 8 9 10

screen_temp=(297K,298K), hotspot_occurrence=No precipitation>=3mm/day

hotspot_occurrence=Yes school=<=0.1

school=<=0.1, hotspot_occurrence=Yes precipitation>=3mm/day precipitation>=3mm/day, hotspot_occurrence=Yes school=<=0.1 wind_speed=(1 m s-1, 2 m s-1),hotspot_occurrence=No

precipitation>=3mm/day

Penomoran variabel

Penomoran variabel dilakukan dengan tujuan sebagai indeks yang mewakili satu variabel string. Variabel awal yang diperoleh adalah dalam bentuk string. Setiap masing-masing variabel string yang diterjemahkan (dikodekan) membawa 3 digit angka yang mewakili satu variabel atau satu gen. menurut Indira dan Kanmani (2012) gen dapat direpresentasikan dalam bentuk string, bit, pohon, array, bilangan real, daftar aturan, elemen permutasi, elemen program dan lain-lain Gen merupakan bagian dari kromosom, di mana satu gen hanya mewakili satu variabel.

Bangkitkan Populasi

Populasi awal yang dibangkitkan ini berupa kumpulan kromosom. Populasi awal yang diperoleh dilakukan secara menyeluruh. Contoh populasi awal dapat dilihat pada Lampiran 3 di mana ukuran populasi awal yaitu berukuran 10 dan jumlah gen sebanyak 25. Populasi awal yang diperoleh kemudian dibangkitkan dengan menghitung fitness yang terdapat pada setiap kromosom. Hasil fitness dihitung berdasarkan formula pada persamaan 7. Tahap selanjutnya yaitu proses seleksi. Seleksi dilakukan dengan teknik roulette-wheel. Jumlah seleksi yang digunakan yaitu sebanyak populasi awal yang dibangkitkan. Setiap kromosom mempunyai kesempatan untuk terpilih dan dibangkitkan secara acak. Bilangan acak yang diperoleh dikalikan dengan total fitness. Pada proses ini tiap masing-masing kromosom menempati potongan lingkaran pada roda roulette

sesuai dengan nilai fitness-nya. Kromosom dengan nilai fitness paling besar akan mempunyai kesempatan terpilih paling besar untuk menjadi induk. Induk dari hasil seleksi dapat dilihat pada Lampiran 4.

(28)

Pada tahap pindah silang dilakukan dengan memilih sepasang kromosom induk untuk menghasilkan dua kromosom anak dengan cara menukarkan beberapa elemen (gen) yang dimiliki masing-masing kromosom induk. Pindah silang dilakukan dengan one point crossover dengan nilai probabilitas pindah silang sebesar 0.6 yang berarti sebanyak 60% banyaknya kromosom yang mengalami proses pindah silang. Selanjutnya proses mutasi dilakukan dengan menentukan kromosom mana yang akan mengalami perubahan gen. Perubahan terjadi pada dua gen yang terpilih secara acak kemudian menukar (swap) dua gen tersebut. Semakin besar nilai probabilitas mutasi, semakin banyak kromosom dalam populasi yang akan mengalami mutasi. Probabilitas mutasi yaitu sebesar sebesar 0.001 dikali dengan banyaknya domain variabel yang digunakan yaitu sekitar 1% dari seluruh kromosom dalam populasi yang mengalami mutasi. Populasi baru yang diperoleh diperlihatkan pada Lampiran 5. Populasi baru tersebut dibangkitkan melalui algoritme apriori kemudian mencari frequent itemset dengan menggunakan metode association rule. Selanjutnya frequent itemset yang diperoleh dibangkitkan dengan ketentuan ambang batas (threshold) minsup yaitu sebesar 0.1 dan mincof yaitu sebesar 0.8. Kemudian mengekstrak aturan berdasarkan nilai confidence. Support diperoleh berdasarkan rumus pada persamaan 1 dan confidence diperoleh berdasarkan rumus pada persamaan 2.

Pengujian Hasil Optimasi

Hasil pengujian yang diperoleh setelah aturan dioptimasi menggunakan algoritme genetika ialah aturan dapat dikurangi. Pengujian dilakukan sebanyak 5 (lima) generasi dan menghasilkan nilai fitness paling tinggi yang memenuhi syarat kriteria. Nilai fitness diperoleh dari persamaan 7. Dapat dilihat pada Tabel 3.Jumlah aturandan hasil rata-rata nilai fitness dari proses algoritme genetika.

Tabel 3 Jumlah aturan dan rata-rata nilai fitness dari proses algoritme genetika Generasi

Terdapat titik panas

Tidak

terdapat titik panas Jumlah

rule

Record Fitness Record Fitness

50 38 0.827 70 0.877 108

100 36 0.824 76 0.851 112

150 40 0.831 78 0.872 118

200 42 0.831 74 0.832 116

300 44 0.833 77 0.873 121

Aturan yang mempunyai kualitas yang tinggi dapat digunakan untuk memprediksi data (Yin dan Han 2003). Pada Tabel 3 memperlihatkan bahwa pada tiap generasi diperoleh nilai fitness yang tertinggi terdapat titik panas yaitu pada generasi ke-300 dengan rataan nilai fitness sebesar 0.833. Sebaliknya nilai fitness

yang tertinggi tidak terdapat titik panas yaitu pada generasi ke-50 diperoleh dengan rataan nilai fitness sebesar 0.877. Pengujian dari tiap generasi diperoleh hasil nilai fitness yang terdapat titik panas yang diperlihatkan pada Gambar 7 dan hasil nilai fitness yang tidak terdapat titik panas yang diperlihatkan pada Gambar 8.

(29)

0 0.2 0.4 0.6 0.8 1

50 100 150 200 300

Fitness

Nilai fitness terdapat titik panas

RY1 RY2 RY3 RY4 RY5 RY6 RY7 RY8

Generasi

0 0.2 0.4 0.6 0.8 1 1.2

50 100 150 200 300

Fitness

Nilai fitness tidak terdapat titik panas

RN1 RN2 RN3 RN4 RN5 RN6 RN7 RN8

Generasi

Gambar 7 Nilai fitness terdapat titik panas

Gambar 8 Nilai fitness tidak terdapat titik panas

Grafik garis yang diperlihatkan pada Gambar 7 menunjukkan bahwa nilai

fitness yang diperoleh pada tiap generasi yang memenuhi syarat kriteria ditemukan pada aturan dengan kodeRY1,RY2,RY3,RY4,dan R5 di mana dengan rentang nilai fitness yaitu sebesar 0.8 hingga 0.9. Sedangkan grafik garis pada Gambar 8 untuk hasil nilai fitness yang tidak terdapat titik panas menunjukkan bahwa nilai fitness yang tidak terdapat titik panas pada tiap generasi yang memenuhi syarat kriteria ditemukan pada aturan dengan kode NY1,NY2,NY3,NY4,dan NY5 di mana dengan rentang nilai fitness yaitusebesar 0.8 hingga 0.9. Adapun penjelasan aturan dari setiap kode yang diberikan diperlihatkan pada Lampiran 6. Aturan dengan nilai fitness yang telah memenuhi syarat kriteria dinyatakan sebagai aturan yang berkualitas sedangkan aturan yang menghasilkan nilai fitness dibawah dari syarat kriteria aturan tersebut tidak memenuhi threshold dan tidak diambil. Berikut diperlihatkan Tabel 4 contoh 5

record aturan asosiasi yang terdapat variabel titik panas dan contoh 5 record tidak terdapat variabel titik panas dari tiap generasi.

(30)

Tabel 4 Aturan asosiasi dari tiap generasi

Generasi Aturan asosiasi Fitness

precipitation>=3mm/day hotspot_occurence=Yes

precipitation>=3mm/day,school<=0.1 hotspot_occurence=Yes precipitation>=3mm/day, screen_temp(297K;298K)

hotspot_occurence=Yes

school<=0.1 hotspot_occurence=Yes

screen_temp(297K;298K) hotspot_occurence=Yes

0.901 0.826 0.818 0.816 0.818 dist_river=<=1.5km, peatland_depth=non_peatland hotspot_occurence=No peatland_depth=non_peatland,peatland_type=non_peatland hotspot_occurence=No

population=<=50, school<=0.1 hotspot_occurence=No precipitation>=3mm/day,school<=0.1 hotspot_occurence=No precipitation>=3mm/day, peatland_type=non_peatland hotspot_occurence=No 0.887 0.924 0.882 0.981 0.913 100

precipitation>=3mm/day hotspot_occurence=Yes

precipitation>=3mm/day,school<=0.1 hotspot_occurence=Yes precipitation>=3mm/day, screen_temp(297K;298K)

hotspot_occurence=Yes

school<=0.1 hotspot_occurence=Yes

screen_temp(297K;298K) hotspot_occurence=Yes

0.901 0.826 0.826 0.816 0.818 dist_river=<=1.5km, peatland_depth=non_peatland hotspot_occurence=No peatland_depth=non_peatland,peatland_type=non_peatland hotspot_occurence=No

population=<=50,school<=0.1 hotspot_occurence=No precipitation>=3mm/day,school<=0.1 hotspot_occurence=No precipitation>=3mm/day, peatland_type=non_peatland hotspot_occurence=No 0.913 0.924 0.882 0.882 0.826 150

precipitation>=3mm/day hotspot_occurence=Yes

precipitation>=3mm/day,school<=0.1 hotspot_occurence=Yes precipitation>=3mm/day, screen_temp(297K;298K)

hotspot_occurence=Yes

school<=0.1 hotspot_occurence=Yes

screen_temp(297K;298K) hotspot_occurence=Yes

0.901 0.826 0.818 0.816 0.818

dist_river=<=1.5km dan peatland_depth=non_peatland hotspot_occurence=No

peatland_depth=non_peatland,peatland_type=non_peatland

hotspot_occurence=No

population=<=50,school<=0.1 hotspot_occurence=No precipitation>=3mm/day,school<=0.1 hotspot_occurence=No precipitation>=3mm/day,peatland_type=non_peatland hotspot_occurence=No 0.887 0.924 0.882 0.981 0.913 200

precipitation>=3mm/day hotspot_occurence=Yes

precipitation>=3mm/day,school<=0.1 hotspot_occurence=Yes precipitation>=3mm/day, screen_temp(297K;298K)

hotspot_occurence=Yes

school<=0.1 hotspot_occurence=Yes

screen_temp(297K;298K) hotspot_occurence=Yes

0.901 0.826 0.818 0.816 0.818 dist_river=<=1.5km, peatland_depth=non_peatland

(31)

0 20 40 60 80 100

50 100 150 200 300

Rule

Generasi

Aturan terdapat titik panas

RY1 RY2 RY3 RY4 RY5

Generasi Aturan asosiasi Fitness

hotspot_occurence=No

peatland_depth=non_peatland,peatland_type=non_peatland

hotspot_occurence=No

population=<=50, school<=0.1 hotspot_occurence=No precipitation>=3mm/day,school<=0.1 hotspot_occurence=No precipitation>=3mm/day, peatland_type=non_peatland hotspot_occurence=No

0.887 0.924 0.882 0.981 0.924

300

precipitation>=3mm/day hotspot_occurence=Yes

precipitation>=3mm/day,school<=0.1 hotspot_occurence=Yes precipitation>=3mm/day, screen_temp(297K;298K)

hotspot_occurence=Yes

school<=0.1 hotspot_occurence=Yes

screen_temp(297K;298K) hotspot_occurence=Yes

0.901 0.826 0.818 0.816 0.818

dist_river=<=1.5km, peatland_depth=non_peatland hotspot_occurence=No

peatland_depth=non_peatland, peatland_type=non_peatland

hotspot_occurence=No

population=<=50, school<=0.1 hotspot_occurence=No precipitation>=3mm/day, school<=0.1 hotspot_occurence=No precipitation>=3mm/day, peatland_type=non_peatland hotspot_occurence=No

0.913 0.924 0.882 0.981 0.913 Aturan yang terpilih adalah aturan yang sering muncul dalam tiap set aturan. Dapat dilihat grafik balok pada Gambar 9 adalah jumlah aturan terpilih yang terdapat titik panas. Sedangkan grafik balok yang diperlihatkan pada Gambar 10 adalah jumlah aturan terpilih yang tidak terdapat titik panas.

(32)

0 20 40 60 80 100

50 100 150 200 300

Rule

Generasi

Aturan tidak terdapat titik panas

RN1 RN2 RN3 RN4 RN5

Gambar 10 Aturan tidak terdapat titik panas

Grafik balok pada Gambar 9 menunjukkan bahwa aturan yang terdapat titik panas yang paling sering dan banyak muncul dari tiap generasi adalah “precipitation>=3mm/day,screen_temp(297K;298K) hotspot_occurence=Yes”

dengan kode aturan yaitu RY3. Sedangkan Grafik balok pada Gambar 10

menunjukkan bahwa aturan yang tidak terdapat titik panas yang paling sering dan banyak muncul dari tiap generasi adalah “precipitation>=3mm/day,

peatland_type=non_peatland Hotspot_occurence=No”dengan kode aturan yaitu RN5. Adapun kode pada setiap aturan diperlihatkan pada Lampiran 6.

Klasifikasi kemunculan titik panas menggunakan algoritme CPAR Klasifikasi dilakukan terhadap aturan yang telah melalui tahap algoritme genetika di mana aturan tersebut digunakan untuk sampel data. Proses pelatihan terhadap sampel data menggunakan algoritme CPAR. Pelatihan terhadap sampel data dilakukan dengan membagi data di mana 60% data latih dan 40% data uji. Data latih dan data uji memuat informasi tentang jarak ke pusat kota terdekat, jarak ke jalan terdekat, jarak ke sungai terdekat, sumber pendapatan, tutupan lahan, kerapatan populasi, curah hujan, sekolah, suhu, kecepatan angin, tipe lahan gambut, kedalaman lahan gambut, dan kemunculan titik panas. Tabel 5 menunjukkan pembagian sampel data dari tiap generasi.

Tabel 5 Pembagian sampel data dari tiap generasi Generasi Jumlah

aturan

Data latih

Data uji

50 108 65 43

100 112 68 44

150 118 72 47

200 116 70 46

(33)

Data latih yang diperoleh dari setiap generasi kemudian dipisahkan menjadi sampel positif (aturan yang terdapat titik panas) dan sampel negatif (aturan asosiasi yang tidak terdapat titik panas). Berdasarkan pembagian sampel data yang diperlihatkan pada Tabel 5. Pembagian sampel positif dan sampel negatif dilakukan terhadap data latih yang terdapat pada generasi 50, 150, dan 300. Jumlah sampel data latih dari tiap generasi diberikan pada Tabel 6.

Tabel 6 Jumlah sampel data latih dari tiap generasi Generasi Jumlah

data latih

Sampel positif

Sampel negatif

50 65 28 37

150 72 28 44

300 73 29 44

Pembentukan nilai kategori dilakukan berdasarkan pada data kebakaran hutan wilayah Kabupaten Rokan Hilir provinsi Riau. Pada penelitian ini jumlah kategori yang terbentuk yaitu sebanyak 54 kategori yaitu yang tertera pada lampiran 7 di mana setiap kategori mewakili atribut berdasarkan karakteristik data. Dalam himpunan aturan terdapat 2 (dua) label kelas yaitu kelas positif dengan keterangan ‘hotspot_occurence=Yes’ (terdapat titik panas) dan kelas negatif dengan keterangan ‘hotspot_occurence=No’ (tidak terdapat titik panas).

Pada awal proses setiap record untuk setiap sampel diberikan bobot sebanyak 1. Bobot total sampel positif dan sampel negatif yang diperlihatkan pada Tabel 7. Bobot total diproses secara terus menerus sampai bobot total lebih kecil dari Total Weight Threshold (TWT). Total Weight Threshold (TWT) dihitung berdasarkan formula pada persamaan 3. Tabel 7 menunjukkan Total Weight Threshold (TWT) untuk setiap generasi.

Tabel 7 Total Weight Threshold (TWT) untuk setiap generasi Generasi

Bobot total positif (record)

Bobot total negatif (record)

TWT Bobot total sampel

positif × 0.05

Bobot total sampel negatif × 0.05

50 28 37 1.40 1.85

150 28 44 1.40 2.20

300 29 44 1.45 2.20

Pembentukan Gain

Pembentukan Gain terhadap kategori yang terpilih ialah kategori yang menghasilkan Gain terbesar (Best Gain) dan telah memenuhi syarat LGT (Local Gain Threshold). Gain dihitung berdasarkan formula pada persamaan 4 sedangkan LGT (Local Gain Threshold) dihitung berdasarkan formula pada persamaan 5. Total bobot pada setiap kategori yang memiliki Gain terbesar (Best Gain) diuji dengan gain similarity ratio sebesar 60%. Pada Tabel 8 dapat dilihat hasil Gain terbesar untuk sampel positif dan sampel negatif dengan LGT (bobot 1) untuk setiap generasi.

(34)

Tabel 8 Gain terbesar dengan LGT (bobot 1) untuk setiap generasi Sampel Generasi Kategori Keterangan atribut Gain

terbesar LGT Positif 50 36 31 29 Screen_temp(297K;298K) Precipitation>=3mm/day Population<=50 3.84 2.97 2.73 2.30

150 31

36 Precipitation>=3mm/day Screen_temp(297K;298K) 5.52 4.13 3.31 300 31 39 34 Precipitation>=3mm/day Wind_speed(1 m s-1;2 m s-1) School<=0.1 4.56 3.81 3.71 2.73 Negatif 50 36 31 29 Screen_temp(297K;298K) Precipitation>=3mm/day Population<=50 3.84 2.97 2.73 2.30

150 31

36 Precipitation>=3mm/day Screen_temp(297K;298K) 5.52 4.13 3.31 300 31 39 34 Precipitation>=3mm/day Wind_speed(1 m s-1;2 m s-1) School<=0.1 4.56 3.81 3.71 2.73

Pada Tabel 8 kategori yang memiliki Gain terbesar dari LGT pada generasi 50 adalah kategori 36 yang berisi atribut Screen_temp(297K;298K)

dengan Gain sebesar 3.84. Kategori yang memiliki Gain terbesar dari LGT pada generasi 150 adalah kategori 31 yang berisi atribut Precipitation>=3mm/day

dengan Gain sebesar 5.52. Kategori yang memiliki Gain terbesar dari LGT pada generasi 300 adalah kategori 31 yang berisi atribut Precipitation>=3mm/day

dengan Gain sebesar 4.56. Gain terbesar dengan bobot sebesar 1 untuk sampel positif dan sampel negatif diperlihatkan pada Tabel 8 dan diberikan secara detil pada Lampiran 7, 8, dan 9. Setelah Gain terbesar diperoleh, proses selanjutnya bobot sampel positif dan negatif direvisi menggunakan decay factor, tujuannya untuk menurunkan bobot pada aturan di mana semua aturan disisipkan pada setiap atribut ke dalam rule list kemudian setiap record rule list tersebut disalin secara satu persatu. Jika setiap bobot masih lebih besar dari total bobot (TWT) maka setiap atribut dalam rule list direvisi dengan menurunkan bobot hingga lebih kecil dari total bobot (TWT). Total bobot pada setiap sampel yang ditemukan dalam

rule list dilanjutkan dengan menghitung Gain berdasarkan formula pada persamaan 4. Tahap ini secara terus menerus dilakukan hingga seluruh nilai Gain

yang diperoleh tersebut lebih kecil dari global minimum threshold yaitu sebesar 0.7. Hasil Gain terbesar untuk sampel positif dengan bobot=0.66 diperlihatkan pada Tabel 9 dan diberikan secara detil pada Lampiran 10, 11, dan 12. Hasil Gain

terbesaruntuk sampel negatif dengan bobot=0.66 diperlihatkan pada Tabel 9 dan diberikan secara detil pada Lampiran 13, 14, dan 15. Pada Tabel 9 dapat dilihat hasil Gain terbesar dengan LGT (bobot=0.66) untuk setiap generasi.

(35)

Tabel 9 Gain terbesar dengan LGT (bobot=0.66) untuk setiap generasi Sampel Generasi Kategori Keterangan atribut Gain

terbesar LGT Positif 50 36 29 39 Screen_temp(297K;298K) Population<=50

Wind_speed(1 m s-1;2 m s-1)

1.21 1 0.84

0.72

150 36 Screen_temp(297K;298K) 1.46 0.96

300 39

Wind_speed(1 m s-1;2 m s-1) School<=0.1

2.03

1.35 0.81

Negatif

50 31

Precipitation>=3mm/day Population<=50

5.18

3.65 3.18

150 31 Precipitation>=3mm/day 9.62 5.77

300

31 39 34

Precipitation>=3mm/day Wind_speed(1 m s-1;2 m s-1) School<=0.1 4.56 3.81 3.71 2.73

Berdasarkan hasil Gain terbesar dengan bobot 0.66 yang diperlihatkan pada Tabel 9 menunjukkan bahwa Gain yang diperoleh untuk sampel positif dan sampel negatif pada setiap generasi masih lebih besar dari global minimum

sehingga setiap atribut direvisi kembali dengan bobot sebesar 0.33. Adapun Gain

terbesar dengan bobot sebesar 0.33 untuk sampel positif diperlihatkan pada Tabel 10 dan diberikan secara detil pada Lampiran 16. Pada Tabel 10 dapat dilihat hasil

Gain terbesar dengan LGT (bobot=0.33) untuk setiap generasi.

Tabel 10terbesar dengan LGT (bobot=0.33) untuk setiap generasi Sampel Generasi Kategori Keterangan atribut Gain

terbesar LGT Positif 50 39 Wind_speed(1 m s-1;2 m s-1) 0.55 0.33 Negatif 50 31 36 29 Precipitation>=3mm/day Screen_temp(297K;298K) Population<=50 7.74 7.16 4.68 4.64

150 31 Precipitation>=3mm/day 14.50 8.70

300 31 Precipitation>=3mm/day 13.78 8.26

Pada Tabel 10 memperlihatkan bahwa untuk sampel positif pada generasi ke 50 ditemukan atribut Wind_speed(1 m s-1;2 m s-1) dengan Gain sebesar 0.55 yang berarti bahwa nilai Gain pada sampel positif yang diperoleh lebih kecil dari

global minimum sehingga proses dihentikan, sedangkan untuk generasi 150 dan generasi 300 pada sampel positif tidak diperlihatkan karena nilai Gain yang dihasilkan kurang dari global minimum yaitu minus sehingga proses revisi dihentikan. Adapun hasil Gain yang dihasilkan untuk generasi 150 diberikan secara detil pada Lampiran 17 dan generasi 300 diberikan secara detil pada Lampiran 18. Hasil Gain yang diperoleh dari sampel negatif diperlihatkan pada Tabel 10 dan diberikan secara detil pada Lampiran 19,20, dan 21.Hasil Gain

untuk sampel negatif pada Tabel 10 memperlihatkan bahwa Gain yang dihasilkan pada setiap generasi masih lebih besar dari global minimum sehingga direvisi kembali dengan bobot sebesar 0.11. Pada Tabel 11 diperoleh nilai bobot setelah

(36)

bobot sampel positif dan sampel negatif diturunkan hingga 0.11. Selanjutnya pada setiap sampel Gain dihitung kembali. Pada Tabel 11 dapat dilihat hasil Gain

terbesar dengan LGT (bobot=0.11) untuk setiap generasi.

Tabel 11 Gain terbesar dengan LGT (bobot=0.11) untuk setiap generasi Sampel Generasi Kategori Keterangan atribut Gain

terbesar LGT

Negatif

50 31 Precipitation>=3mm/day 17.91 10.74

150 54 Peatland_dept=non_peatland 12.01 7.20

36 Screen_temp(297K;298K) 8.70

300 31 Precipitation>=3mm/day 13.78 8.26

Pada akhir proses semua aturan yang diperoleh dihitung menggunakan

Laplace accuracy (LA) yaitu berdasarkan formula yang diberikan pada persamaan 6. Hasil perhitungan Laplace accuracy (LA)untuk setiap aturan diperoleh dengan ketentuan Gain similarity ratio sebesar 60%. Aturan dan hasil Laplace accuracy

(LA)dengan Gainsimilarity ratio 60% diberikan pada Tabel 12.

Tabel 12 Aturan dan Laplace accuracy (LA)dengan Gainsimilarity ratio 60%

Generasi Aturan L.A.

50 If Screen_temp(297K;298K) Then hotspot_occurence=Yes

If Precipitation>=3mm/day Then hotspot_occurence=Yes

If Population<=50 Then hotspot_occurence=Yes

If Precipitation>=3mm/day dan Screen_temp(297K;298K)

Then hotspot_occurence=Yes

If Screen_temp(297K;298K) Then hotspot_occurence=No

If Precipitation>=3mm/day Then hotspot_occurence=No

If Population<=50 Then hotspot_occurence=No

If Precipitation>=3mm/day dan Screen_temp(297K;298K)

Then hotspot_occurence=No

0.54 0.62 0.38 0.76 0.45 0.37 0.61 0.21 150 If Precipitation>=3mm/day Then hotspot_occurence=Yes

If Screen_temp(297K;298K) Then hotspot_occurence=Yes

If Precipitation>=3mm/day and Screen_temp(297K;298K)

Then hotspot_occurence=Yes

If Precipitation>=3mm/day Then hotspot_occurence=No

If Screen_temp(297K;298K) Then hotspot_occurence=No

If Precipitation>=3mm/day and Screen_temp(297K;298K)

Then hotspot_occurence=No

0.52 0.57 0.55 0.47 0.42 0.44 300 If Precipitation>=3mm/day Then hotspot_occurence=Yes

If Wind_speed(1 m s-1;2 m s-1) Then hotspot_occurence=Yes

If School<=0.1 Then hotspot_occurence=Yes

If Precipitation>=3mm/day and School<=0.1 Then

hotspot_occurence=Yes

If Precipitation>=3mm/day Then hotspot_occurence=No

If Wind_speed(1 m s-1;2 m s-1) Then hotspot_occurence=No

If School<=0.1 Then hotspot_occurence=No

If Precipitation>=3mm/day and School<=0.1 Then

hotspot_occurence=No 0.48 0.70 0.58 0.50 0.51 0.30 0.41 0.50

(37)

Evaluasi aturan

Hasil perhitungan Laplace accuracy (LA) pada Tabel 12 memperlihatkan bahwa dengan menggunakan Gain similarity ratio 60% diperoleh 22 aturan dari tiap generasi. Pada generasi 50 diperoleh aturan If Precipitation>=3mm/day and

Screen_temp(297K;298K) Then hotspot_occurence=Yes yang memiliki Laplace Accuracy (LA) paling tinggi untuk kelas positif yaitu sebesar 0.76. Ini berarti bahwa daerah yang memiliki curah hujan lebih besar dari atau sama dengan 3 mm per hari dan cuaca dengan temperatur yaitu pada interval 297 Kelvin hingga 298 Kelvin mempunyai peluang munculnya titik panas sebesar 76%. Sebaliknya Pada kelas negatif diperoleh aturan If Precipitation>=3mm/day and

Screen_temp(297K;298K) Then hotspot_occurence=No yang memiliki Laplace Accuracy (LA) pada kelas negatif yaitu sebesar 0.21. Ini berarti bahwa proporsi peluang tidak munculnya titik panas sebesar 21% ditemukan pada daerah yang memiliki curah hujan lebih besar dari atau sama dengan 3 mm per hari dan pada daerah yang memiliki temperatur pada interval 297 Kelvin hingga 298 Kelvin. Pada generasi 150 diperoleh aturan If Screen_temp(297K;298K) Then

hotspot_occurence=Yes yang menghasilkan Laplace Accuracy (LA) paling tinggi untuk kelas positif yaitu sebesar 0.57. Ini berarti bahwa daerah yang memiliki cuaca dengan temperatur yaitu pada interval 297 Kelvin hingga 298 Kelvin mempunyai peluang munculnya titik panas sebesar 57%. Sebaliknya pada kelas negatif diperoleh aturan If Screen_temp(297K;298K) Then hotspot_occurence=No

yang memiliki Laplace Accuracy (LA) sebesar 0.42. Hal ini menjelaskan bahwa proporsi peluang tidak munculnya titik panas diperoleh sebesar 42% pada daerah yang memiliki cuaca dengan temperatur pada interval 297 Kelvin hingga 298 Kelvin. Pada generasi 300 diperoleh aturan If Wind_speed(1 m s-1; 2 m s-1) Then

hotspot_occurence=Yes yang memiliki Laplace Accuracy (LA)paling tinggi untuk kelas positif yaitu sebesar 0.70. Hal ini menjelaskan bahwa proporsi peluang munculnya titik panas sebesar 70%. Pada kelas negatif aturan If Wind_speed(1 m s

-1

;2 m s-1) Then hotspot_occurence=No memiliki Laplace Accuracy (LA) sebesar 0.30. Hal ini berarti bahwa proporsi peluang tidak munculnya titik panas sebesar 30% ditemukan pada daerah yang memiliki kecepatan angin pada interval 1 m s-1 hingga 2 m s-1.

Dengan menggunakan algoritme genetika model dan kualitas aturan dapat diketahui berdasarkan nilai fitness yang diperlihatkan pada Tabel 3 dan aturan yang diperlihatkan pada Tabel 4. di mana rata-rata aturan yang terdapat titik panas yang paling banyak muncul ialah aturan yang berisi “Precipitation>=3mm/day, Screen_temp(297K;298K) hotspot_occurence=Yes” dengan nilai fitness sebesar 0.818. Seperti halnya untuk aturan yang tidak terdapat titik panas yang paling banyak muncul ialah aturan yang berisi “precipitation>=3mm/day,

peatland_type=non_peatland hotspot_occurence=No" dengan nilai fitness sebesar 0.913.

(38)

5 SIMPULAN DAN SARAN

Simpulan

Dari hasil penelitian yang dilakukan, optimasi aturan asosiasi multidimensi dapat diterapkan dengan menggunakan algoritme genetika. Melalui algoritme genetika jumlah aturan yang dihasilkan dapat dikurangi yaitu sebanyak 108 aturan pada generasi ke-50, 118 aturan pada generasi ke-150, dan 121 aturan pada generasi ke-300. Rata-rata nilai fitness yang diperoleh pada tiap generasi

yaitu sebesar 0.8 hingga 0.9. Aturan yang sering muncul pada tiap generasi adalah “If precipitation>=3mm/day,screen_temp(297K;298K) Then

hotspot_occurence=Yes” diberikan pada kode aturan RY3 dengan nilai fitness

sebesar 0.818. Aturan yang tidak terdapat titik panas yang sering dan banyak muncul pada tiap generasi adalah “If precipitation>=3mm/day,

peatland_type=non_peatland Then hotspot_occurence=No” diberikan pada kode aturan RN5 dengan nilai fitness sebesar 0.913. Dengan menggunakan algorime CPAR, diperoleh hasil Laplace Accuracy (LA) yang paling tinggi terhadap aturan yang berpotensi munculnya titik panas yaitu pada generasi 50 sebesar 0.76 yang berisi aturan If precipitation>=3mm/day and

screen_temp(297K;298K) Then hotspot_occurence=Yes. Pada generasi 150 diperoleh Laplace Accuracy (LA) paling tinggi sebesar 0.57 yang berisi aturan If

Screen_temp(297K;298K) Then hotspot_occurence=Yes. Pada generasi 300 diperoleh Laplace Accuracy (LA) paling tinggi sebesar 0.70 yang berisi aturan If

Wind_speed(1 m s-1;2 m s-1) Then hotspot_occurence=Yes.

Saran

Pada pekerjaan di masa depan penelitian ini dapat dijadikan sebagai bahan analisis validasi model sesuai dengan keadaan real yang terdapat di lapangan.

DAFTAR PUSTAKA

Agrawal R, Srikant R. 1994. Fast algorithms for mining association rules,

Proceedings of the VLDB Conference. 487-489.

Arkaeman Y, Seminar BK, Gunawan H. 2012. Algoritme Genetika Teori dan Aplikasi untuk Bisnis dan Industri. Bogor (ID): IPB Press.

Albar I. 2002. Fenomena El Nino dan Hotspot: Pemicu dan Solusi Kebakaran Hutan. Jakarta (ID):Direktorat Penanggulangan Kebakaran Hutan, Departemen Kehutanan.

Balaji BV, Rao VV. 2013. Improved classification based association rule mining,

International Journal of Advanced Research in Computer and Coomunication Engineering. 2(5):2211-2221.

Budi GS, Yulia, Abadi B. 2010. Multilevel and Multidimension Association Rule untuk analisa Market Basket Pada PT. Maha Agung. Universitas Kristen Petra Surabaya.

Boonyanuphap J. 2001. GIS-based method in developing wildfire risk model: A case study in Sasamba, East Kalimantan, Indonesia [tesis]. Bogor (ID): Institut Pertanian Bogor.

(1)

Deep

42 Peatland_type Hemists/Saprists(60/40); 0 0 0.00 Moderate

43 Peatland_type Hemists/Saprists(60/40); 0 0 0.00 Very_deep

44 Peatland_type non_peatland 3 3.3 0.30

45 Peatland_type Saprists(100);Moderate 0 0 0.00 46 Peatland_type Saprists/Hermists(60/40);

Moderate 0 0 0.00

47 Peatland_type Saprists/min(50/50); 0 0 0.00 Moderate

48 Peatland_type Saprists/min(50/50); 0 0 0.00 Shallow

49 Peatland_type Saprists/Hermists(90/10);

Moderate 0 0 0.00

50 Peatland_depth (Deep/Thick:200-400cm) 0 0 0.00 51 Peatland_depth (Moderate:100-200cm) 0 0 0.00 52 Peatland_depth (Shallow/Thin50:100cm) 0 0 0.00 53 Peatland_depth (Very_Deep/very_thick>400

cm) 0 0 0.00

54 Peatland_depth non_peatland 5 3.63 4

Lampiran 20 Kategori dan nilai

Gain

untuk sampel negatif pada generasi 150

dengan bobot=0.33

Kategori Atribut Keterangan

Bobot sampel positif Bobot sampel negatif Gain

1 Dist_city >14km 0 0 0.00

2 Dist_city <=7km 0 0 0.00

3 Dist_city (7km;14km) 0 0 0.00

4 Dist_river >3km 0 0 0.00

5 Dist_river <=1.5km

0

5.94

0.00

6 Dist_river (7km;14km) 0 0 0.00

7 Dist_road >5km 0 0 0.00

8 Dist_road <=2.5km 0 0 0.00

9 Dist_road (2.5km;5km) 0 0 0.00

10 Income_source Agriculture 0 0 0.00

11 Income_source Forestry 0 0 0.00

12 Income_source No_data 0 0 0.00

13 Income_source Other_agriculture 0 0 0.00

14 Income_source Others 0 0 0.00

15 Income_source Plantation 0 0 0.00

16 Income_source Trading_restaurant 0 0 0.00

17 Land_cover Bare_Land 0 0 0.00

(2)

Kategori Atribut Keterangan Bobot sampel positif Bobot sampel negatif Gain

19 Land_cover Mix_Garden 0 0 0.00

20 Land_cover Mangrove 0 0 0.00

21 Land_cover Paddy_field 0 0 0.00

22 Land_cover Plantation 0 0 0.00

23 Land_cover Settlement 0 0 0.00

24 Land_cover Shurbs 0 0 0.00

25 Land_cover Swamp 0 0 0.00

26 Land_cover Unirrigated_agriculture 0 0 0.00

27 Land_cover Water_body 0 0 0.00

28 Population >100 0 0 0.00

29 Population <=50 0 2 0.00

30 Population (50;100) 0 0 0.00

31 Precipitation >=3mm/day 22 7.26 14.5

32 Precipitation (2mm/day;3mm/day) 0 0 0.00

33 School >0.2 0 0 0.00

34 School <=0.1 2 2.64 0.20

35 School (0.1;0.2) 0 0 0.00

36 Screen_temp (297K;298K) 10 2.31 7.36

37 Screen_temp (298K;299K) 0 0 0.00

38 Wind_speed (0m/s;1m/s) 0 0 0.00

39 Wind_speed (1m/s;2m/s) 0 0 0.00

40 Peatland_type Hemists/min(30/70); 0 0 0.00 Moderate

41 Peatland_type Hemists/Saprists(60/40); 0 0 0.00 Deep

42 Peatland_type Hemists/Saprists(60/40); 0 0 0.00 Moderate

43 Peatland_type Hemists/Saprists(60/40); 0 0 0.00 Very_deep

44 Peatland_type non_peatland 0 7.26 0.00

45 Peatland_type Saprists(100);Moderate 0 0 0.00 46 Peatland_type Saprists/Hermists(60/40);

Moderate 0 0 0.00

47 Peatland_type Saprists/min(50/50); 0 0 0.00 Moderate

48 Peatland_type Saprists/min(50/50); 0 0 0.00 Shallow

49 Peatland_type Saprists/Hermists(90/10);

Moderate 0 0 0.00

50 Peatland_depth (Deep/Thick:200-400cm) 0 0 0.00 51 Peatland_depth (Moderate:100-200cm) 0 0 0.00 52 Peatland_depth (Shallow/Thin50:100cm) 0 0 0.00 53 Peatland_depth (Very_Deep/very_thick>400

cm) 0 0 0.00

(3)

Kategori Atribut Keterangan Bobot sampel positif Bobot sampel negatif Gain

1 Dist_city >14km 0 0 0.00

2 Dist_city <=7km 0 0 0.00

3 Dist_city (7km;14km) 0 0 0.00

4 Dist_river >3km 0 0 0.00

5 Dist_river <=1.5km

0

5.61

0.00

6 Dist_river (7km;14km) 0 0 0.00

7 Dist_road >5km 0 0 0.00

8 Dist_road <=2.5km 7 3.96 3.32

9 Dist_road (2.5km;5km) 0 0 0.00

10 Income_source Agriculture 0 0 0.00

11 Income_source Forestry 0 0 0.00

12 Income_source No_data 0 0 0.00

13 Income_source Other_agriculture 0 0 0.00

14 Income_source Others 0 0 0.00

15 Income_source Plantation 0 0 0.00

16 Income_source Trading_restaurant 0 0 0.00

17 Land_cover Bare_Land 0 0 0.00

18 Land_cover Dryland_forest 0 0 0.00

19 Land_cover Mix_Garden 0 0 0.00

20 Land_cover Mangrove 0 0 0.00

21 Land_cover Paddy_field 0 0 0.00

22 Land_cover Plantation 0 0 0.00

23 Land_cover Settlement 0 0 0.00

24 Land_cover Shurbs 0 0 0.00

25 Land_cover Swamp 0 0 0.00

26 Land_cover Unirrigated_agriculture 0 0 0.00

27 Land_cover Water_body 0 0 0.00

28 Population >100 0 0 0.00

29 Population <=50 0 0 0.00

30 Population (50;100) 0 0 0.00

31 Precipitation >=3mm/day 22 7.59 13.78

32 Precipitation (2mm/day;3mm/day) 0 0 0.00

33 School >0.2 0 0 0.00

34 School <=0.1 9 1.98 6.51

35 School (0.1;0.2) 0 0 0.00

36 Screen_temp (297K;298K) 8 2.97 4.85

37 Screen_temp (298K;299K) 0 0 0.00

38 Wind_speed (0m/s;1m/s) 0 0 0.00

39 Wind_speed (1m/s;2m/s) 6 0.66 4.91

40 Peatland_type Hemists/min(30/70); 0 0 0.00 Moderate

(4)

Kategori Atribut Keterangan

Bobot sampel positif

Bobot sampel negatif

Gain Deep

42 Peatland_type Hemists/Saprists(60/40); 0 0 0.00 Moderate

43 Peatland_type Hemists/Saprists(60/40); 0 0 0.00 Very_deep

44 Peatland_type non_peatland 0 4.95 0.00

45 Peatland_type Saprists(100);Moderate 0 0 0.00 46 Peatland_type Saprists/Hermists(60/40);

Moderate 0 0 0.00

47 Peatland_type Saprists/min(50/50); 0 0 0.00 Moderate

48 Peatland_type Saprists/min(50/50); 0 0 0.00 Shallow

49 Peatland_type Saprists/Hermists(90/10);

Moderate 0 0 0.00

50 Peatland_depth (Deep/Thick:200-400cm) 0 0 0.00 51 Peatland_depth (Moderate:100-200cm) 0 0 0.00 52 Peatland_depth (Shallow/Thin50:100cm) 0 0 0.00 53 Peatland_depth (Very_Deep/very_thick>400

Optimasi Aturan Asosiasi Multidimensi Menggunakan Algoritme Genetika Untuk Klasifikasi Kemunculan Titik Panas

OPTIMASI ATURAN ASOSIASI MULTIDIMENSI MENGGUNAKAN

ALGORTIME GENETIKA UNTUK KLASIFIKASI

KEMUNCULAN TITIK PANAS

NIA KURNIATI

PERNYATAAN MENGENAI TESIS DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

RINGKASAN

SUMMARY

© Hak Cipta Milik IPB, Tahun 2015

Hak Cipta Dilindungi Undang-Undang

OPTIMASI ATURAN ASOSIASI MULTIDIMENSI MENGGUNAKAN

ALGORTIME GENETIKA UNTUK KLASIFIKASI

KEMUNCULAN TITIK PANAS

PRAKATA

DAFTAR ISI

DAFTAR TABEL

DAFTAR GAMBAR

DAFTAR LAMPIRAN

1

PENDAHULUAN

2 TINJAUAN PUSTAKA

3 METODE PENELITIAN

4 HASIL DAN PEMBAHASAN

5 SIMPULAN DAN SARAN

DAFTAR PUSTAKA

Lampiran 20 Kategori dan nilai

Gain

untuk sampel negatif pada generasi 150

dengan bobot=0.33

0

5.94

0.00

0

5.61

0.00

RIWAYAT HIDUP

Penulis dilahirkan di Kota Makassar Sulawesi

Selatan pada 15 Juni 1986 sebagai anak pertama dari

pasangan Bapak H.Abdul Halim dan Ibu Hj.Rahmawati.

Pendidikan sarjana ditempuh di Program Studi Teknik

Informatika Ilmu Komputer Universitas Muslim Indonesia,

lulus pada tahun 2008. Penulis melanjutkan jenjang

magister pada tahun 2012 di Program Studi Magister Ilmu

Komputer, Fakutas Matematika dan Ilmu Pengetahuan

Alam, Institut Pertanian Bogor (IPB).

Parts

Dokumen yang terkait

Klasifikasi Data Spasial untuk Kemunculan Hotspot di Provinsi Riau Menggunakan Algoritme ID3

Optimasi Parameter pada Support Vector Machine untuk Klasifikasi Fragmen Metagenome Menggunakan Algoritme Genetika

Post pruning pohon keputusan spasial untuk klasifikasi kemunculan titik panas

Klasifikasi fragmen metagenome menggunakan oblique decision tree dengan optimasi algoritme genetika

Klasifikasi Formula Jamu Berdasarkan Khasiat Menggunakan Oblique Decision Tree dengan Optimasi Menggunakan Algoritme Genetika

Klasifikasi Data Spasial Untuk Kemunculan Hotspot Di Provins! Riau Menggunakan Algoritme Id3

Klasifikasi Kemunculan Titik Panas Pada Lahan Gambut Di Sumatera Dan Kalimantan Menggunakan Algoritme K-Nearest Neighbor

Klasifikasi Kemunculan Titik Panas Pada Lahan Gambut Di Sumatera Dan Kalimantan Menggunakan Algoritme Random Forest

Klasifikasi Kemunculan Titik Panas Pada Lahan Gambut Di Sumatera Dan Kalimantan Dengan Menggunakan Algoritme Pohon Keputusan C5.0

Klasifikasi Kemunculan Titik Panas Pada Lahan Gambut Di Sumatera Dan Kalimantan Menggunakan Algoritme Naive Bayes

Dokumen yang Anda mencari sudah siap untuk unduhkan