Optimasi Metode Extreme Learning Machine Dalam Penentuan Kualitas Air Sungai Menggunakan Algoritme Genetika

  

Vol. 2, No. 10, Oktober 2018, hlm. 3265-3273 http://j-ptiik.ub.ac.id

Optimasi Metode Extreme Learning Machine Dalam Penentuan Kualitas

Air Sungai Menggunakan Algoritme Genetika

1 2 3 Regina Anky Chandra , Edy Santoso , Sigit Adinugroho

  Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya 1 2 3 Email: reginanky18@gmail.com, edy144@ub.ac.id, sigit.adinu@ub.ac.id

  

Abstrak

  Seiring dengan meningkatnya jumlah populasi manusia, sumber air bersih yang ada di bumi terus berkurang. Dampak yang diberikan akibat tercemarnya sumber air juga tidak dapat diremehkan. Beberapa diantaranya adalah menurunnya kadar oksigen yang ada di bumi dikarenakan tumbuhan tidak dapat berfotosintesis dengan baik, mengganggu kesuburan tanah, mematikan hewan-hewan yang hidup di dalam air dan masih banyak dampak lainnya. Salah satu sumber air di muka bumi ini berasal dari sungai. Untuk menjaga kualitas air agar tetap pada kondisi alamiahnya, perlu dilakukan pengukuran dan analisis terhadap air sungai tentang status mutu airnya. Pada penelitian ini digunakan 7 parameter pengukuran kualitas air sungai yang kemudian akan diklasifikasikan menjadi 3 kelas berbeda. Kelas klasifikasi dibagi menjadi tercemar ringan, tercemar sedang dan tercemar berat. Sedangkan metode yang digunakan untuk pengukuran dan analisis pada penelitian ini adalah metode Extreme Learning Machine (ELM) dan Algoritme Genetika. Dalam penelitian ini, bobot awal yang digunakan pada proses training dan testing ELM akan dioptimasi menggunakan Algoritma Genetika. Data training dan data testing yang digunakan, ditentukan oleh 5 fold yang telah dibentuk dari data awal yang berjumlah 150 data. Data tiap

  

fold akan diuji menjadi data testing secara bergantian. Berdasarkan hasil pengujian dari penelitian yang

telah dilakukan, penelitian ini mampu meraih tingkat akurasi sebesar 88.0002%.

  Kata kunci : kualitas air sungai, klasifikasi, prediksi, extreme learning machine (elm), algoritma genetika

  

Abstract

Along with the increasing number of human population, the source of clean water on earth continues to

decrease. The impact given due to contamination of water sources is also not light. Some of them are

the decrease in oxygen levels in the earth because plants can not photosynthesize well, disrupt soil

fertility, kill animals that live in water and many other impacts. One of the water sources on earth is

from the river. To maintain water quality in order to stay in its natural condition, it is necessary to

measure and analyze the water quality status of river water. In this research used 7 parameters of river

water quality measurement which will be classified into 3 different classes. Classification class is

divided into lightly polluted, moderately polluted and heavily polluted. While the method used for the

measurement and analysis in this study is the method of Extreme Learning Machine (ELM) and Genetic

Algorithm. In this study, the input weight used in the ELM training and testing process will be optimized

using Genetic Algorithm. Training and testing data used, determined by 5 fold that has been formed

from the initial data which amounts to 150 data. The data of each fold will be tested into data testing

alternately. Based on the results of testing of research that has been done, this research is able to achieve

an accuracy of 88.0002%.

  Keywords: river water quality, classification, prediction, extreme learning machine (elm), genetic algorithm

  yang tidak membutuhkan air. Bidang 1.

   PENDAHULUAN pendidikan, pertanian, rumah tangga, rekreasi,

  industri, lingkungan, semuanya membutuhkan Air merupakan satu dari sekian banyak air yang akan dijadikan sebagai komponen di sumber daya alam yang banyak digunakan oleh dalamnya. Namun dengan meningkatnya jumlah makhluk hidup dan sudah menjadi kebutuhan populasi manusia mengakibatkan sumber air pokok untuk bertahan hidup. Tidak ada bidang

  Fakultas Ilmu Komputer Universitas Brawijaya

3265 bersih yang ada di bumi terus berkurang. Hal ini dikarenakan hilangnya sumber air akibat alih lahan pertanian dan pemukiman penduduk serta pencemaran air yang semakin buruk dan memprihatinkan dari hari ke hari. Akibatnya, banyak air yang tercemar dan susah sekali mencari sumber air bersih. Dampak yang diberikan akibat tercemarnya sumber air juga tidak ringan. Beberapa diantaranya adalah menurunnya kadar oksigen yang ada di bumi karena tumbuhan tidak bisa berfotosintesis dengan baik, mengganggu kesuburan tanah, mematikan hewan-hewan yang hidup di dalam air (Budiarta et al., 2016).

  Penurunan kualitas air akan menurunkan dayaguna, hasil guna, produktivitas, daya dukung dan daya tampung dari sumberdaya air yang pada akhirnya akan menurunkan kekayaan sumber daya air. Salah satu sumber air di muka bumi ini berasal dari sungai. Tidak sedikit juga air sungai yang mengalami penurunan kualitas air. Untuk menjaga kualitas air agar tetap pada kondisi alamiahnya, perlu dilakukan pengelolaan dan pengendalian pencemaran air secara bijaksana. Hal ini dibutuhkan upaya pemantauan dan pengendalian pencemaran terhadap air sungai. Upaya yang dilakukan yaitu melakukan pengukuran dan analisis terhadap air sungai tentang status mutu air sebagaimana yang ditetapkan dalam Peraturan Pemerintah no 82 tahun 2001 (Azizah, 2016).

  Algoritme Genetika (Genetic Algorithms), merupakan tipe Algoritme Evolusi yang paling populer dan banyak diterapkan pada masalah- masalah kompleks. Seiring berkembang pesatnya teknologi informasi, Algoritme Genetika juga semakin berkembang dengan diterapkannya berbagai macam modifikasi ke dalam Algoritme Genetika. Karena kemampuannya untuk menyelesaikan berbagai masalah kompleks, algoritme ini banyak digunakan di dalam berbagai bidang yang sering menghadapi masalah optimasi, serta permasalahan yang memiliki model matematika yang cukup rumit. Algoritme Genetika menghasilkan himpunan solusi optimal yang sangat berguna pada peyelesaian masalah dengan banyak obyektif (Mahmudy, 2015).

  2. AIR SUNGAI

  yang lebih baik (Mahmudy, Marian & Luong 2013e, 2013f, 2014 disitasi dalam Mahmudy 2015). Penelitian ini bertujuan untuk mengoptimalkan kinerja atau meningkatkan akurasi dari penelitian yang sebelumnya (Azizah, 2016) yang memiliki nilai akurasi sebesar 87.89%, agar prediksi yang dihasilkan lebih akurat.

  hybrid sangat efektif untuk menghasilkan solusi

  Berdasarkan uraian tersebut, penulis mengajukan penelitian yang berjudul “Optimasi Metode Extreme Learning Machine dalam Penentuan Kualitas Air Sungai Menggunakan Algoritme Genetika”. Penelitian ini menggunakan Algoritme Genetika dikarenakan algoritme ini cukup fleksibel untuk dihibridisasikan dengan algoritme lainnya (Gen & Cheng, 1997 disitasi dalam Mahmudy, 2015). Beberapa penelitian membuktikan bahwa Algoritme Genetika yang dimodifikasi atau di-

  percobaan penelitiannya, mereka menyatakan bahwa GAP-ELM adalah alternatif yang valid untuk permasalahan klasifikasi.

  Optimally Pruned ELM (OP-ELM). Pada

  Untuk mengatasi kelemahan pada penelitiannya, Alencar et al. (2016) mengusulkan sebuah metode baru untuk memangkas neuron hidden layer menggunakan Algoritme Genetika. Pendekatan yang diusulkan, disebut GAP-ELM, memilih subset dari hidden neuron untuk mengoptimalkan fungsi fitness multiobjective yang didapat dari penggabungan antara akurasi dan jumlah neuron yang dipangkas. Kinerja GAP-ELM lebih efisien ketika diterapkan pada beberapa dataset di dunia nyata dibandingkan dengan metode SLFN lain dan metode pemangkasan terkenal yang disebut

  , sehingga hasil prediksi yang dihasilkan lebih optimal dan akurat (Agustina et al., 2010).

  Jaringan Saraf Tiruan (JST) merupakan upaya untuk memodelkan pemrosesan informasi berdasarkan kemampuan sistem saraf manusia. Salah satu metode dalam JST adalah Extreme

  Smoothing

  ELM lebih unggul dalam proses learning speed, serta mempunyai tingkat akurasi yang lebih baik dibandingkan dengan metode konvensional seperti Moving Average dan Exponential

  Feedforward Neural Network (SLFNs). Metode

  dikenal dengan istilah Single Hidden Layer

  feedforward dengan satu hidden layer atau lebih

  (ELM). ELM merupakan salah satu metode di dalam jaringan saraf tiruan

  Learning Machine

  Sungai merupakan tempat/wadah serta jaringan pengaliran air, mulai dari mata air sampai muara yang dibatasi di sisi kanan dan kirinya serta sepanjang pengalirannya oleh garis luar pengamatan (Peraturan Pemerintah No.35 tahun 1991). Sungai memiliki fungsi dan nilai untuk kesejahteraan manusia serta kehidupan memiliki learning speed yang cepat dan mampu yang ada di dalam sungai itu sendiri. Karena itu menghasilkan good generalization performance. sungai merupakan salah satu ekosistem yang Dengan random pada range tertentu, bisa penting bagi manusia (Siahaan et al., 2011 menghindari hasil prediksi yg tidak stabil disitasi dalam Budiarta et al., 2016, p2). (Huang et al., 2005).

  Pemanfaatan air harus dilakukan secara Secara umum model jaringan syaraf tiruan bijak dengan mempertimbangkan kepentingan yang menggunakan ELM sebagai metode generasi sekarang dan yang akan datang. Akan pembelajarannya menurut Huang, et al.. dapat tetapi, seiring meningkatnya proses dilihat pada Gambar 1. pembangunan di berbagai bidang dan laju

  W

  pertumbuhan penduduk yang semakin pesat

  x

  menyebabkan pemanfaatan air tidak lagi i1 dilakukan dengan baik. Hal ini memberikan dampak buruk yang mempengaruhi sifat fisik

  x i2

  dan sifat kimia air sehingga menurunkan kualitas

  i y

  air. Pengelolaan sumber daya air bertujuan

  

  menyediakan air dalam jumlah yang cukup dengan kualitas yang sesuai dengan tujuannya

  x (Azizah, 2016). in

  Kualitas air merupakan istilah yang

  Input Hidden Output

  menggambarkan kesesuaian atau tingkat

  Layer

  kecocokan air untuk penggunaan tertentu,

  Layer Layer

  misalnya: air minum, rumah tangga, perikanan, Gambar 1 Struktur ELM pengairan/irigasi, peternakan, industri, rekreasi dan sebagainya. Kualitas air dapat diketahui

  Metode ELM mempunyai model matematis dengan melakukan pengujian tertentu terhadap yang berbeda dari jaringan syaraf tiruan air tersebut. Pengujian yang umumnya dilakukan

  feedforward . Model matematis dari ELM lebih

  adalah uji kimia, fisik, biologi, atau uji wujud air sederhana dan efektif. Struktur dari metode ELM (bau dan warna). Pada penelitian ini, akan bisa dilihat pada Gambar 1. digunakan parameter fisika yaitu TSS, parameter

  Langkah-langkah perhitungan dengan kimia organik yang meliputi BOD, COD, DO, metode ELM ini dibedakan menjadi 2 proses, pH dan parameter kimia anorganik yang yaitu proses training dan proses testing. meliputi fenol, minyak dan lemak.

  3.1 Proses Training 3. EXTREME LEARNING MACHINE

  Sebelum digunakan untuk proses prediksi,

  Extreme Learning Machine (ELM)

  ELM harus melalui proses training terlebih merupakan metode pembelajaran baru dari JST. dahulu. Tujuan dari proses ini adalah Metode ini diperkenalkan oleh Huang (2004). mendapatkan output weight dengan tingkat

  ELM adalah jaringan syaraf tiruan feedforward kesalahan yang rendah. Langkah-langkah proses sederhana dengan satu hidden layer yang lebih

  training metode ELM yaitu sebagai berikut:

  dikenal dengan istilah Single Hidden Layer 1.

  Inisialisasi input weight dan bias dengan Feedforward Neural Networks (SLFNs). bilangan acak yang kecil. Metode ELM ini dibuat untuk mengurangi kelemahan-kelemahan JST feedforward

  2. Menghitung semua keluaran di hidden layer terutama mengenai learning speed. JST dengan menggunakan fungsi aktivasi.

  feedforward

  memiliki learning speed rendah, Perhitungan keluaran hidden layer dikarenakan JST feedforward menggunakan ditunjukkan pada Persamaan 1.

  slow gradient based learning algorithm untuk

  melakukan training dan semua parameter pada (1)

  = (∑ ) + . jaringan ditentukan secara iteratif dengan

  =1 menggunakan metode pembelajaran tersebut.

  Keterangan: Pada ELM parameter-parameter seperti

  = Matriks keluaran hidden

  input weight dan hidden bias dipilih secara layer . random dari nilai tertentu, sehingga ELM

  • = [1, 2, ..., N], dimana N = Matriks Moore-Penrose

  . = [1, 2, ..., Ñ], dimana Ñ = Matriks Target. adalah jumlah hidden neuron .

  Generalized Inverse adalah jumlah data.

  3.2 Proses Testing = Jumlah input neuron.

  Proses testing dilakukan berdasarkan input = Bobot input dengan ukuran

  weight , bias, dan output weight yang sesuai dari

  ordo matriks, hidden perhitungan training. Proses training bertujuan

  neuron x input neuron.

  untuk mengembangkan model ELM, sedangkan = Bobot input yang di- proses testing bertujuan untuk mengevaluasi

  transpose .

  kemampuan ELM sebagai metode untuk = Data input. memprediksi. Langkah-langkah proses testing = Bias. yaitu sebagai berikut: 1.

  Inisialisasi input weight dan bias yang didapatkan pada perhitungan training.

  3. Setelah keluaran hidden layer ( ) didapatkan, kemudian ( ) dihitung dengan 2.

  Menghitung semua keluaran di hidden layer menggunakan fungsi aktivasi sigmoid biner dengan menggunakan fungsi aktivasi yang ditunjukkan pada Persamaan 2. menggunakan Persamaan 1 dan 2.

  1 3.

  Menggunakan hasil output weight dari (2)

  ( ) =

  −

  1 +

  hidden layer ke output layer dari proses

  Keterangan:

  training

  . Menghitung keluaran pada output ( ) = Fungsi aktivasi sigmoid

  layer yang merupakan hasil prediksi yang

  biner  2.71828183 ditunjukkan pada Persamaan 5. = Eksponensial

  (5) = Data ke x. =

  Keterangan: = Output hasil prediksi.

  4. Matriks Moore-Penrose Menghitung

  = Keluaran hidden layer

  Generalized Inverse/ Moore-Penrose dengan fungsi aktivasi.

  • Pseudo Inverse

  ( ) dari hasil keluaran = Output weight .

  hidden layer dengan fungsi aktivasi dengan Persamaan 3.

  4. ALGORITME GENETIKA

  • −1

  (3) = ( )

  Algoritme genetika merupakan algoritme Keterangan: yang populer dan telah digunakan untuk

  • = Matriks Moore-Penrose menyelesaikan masalah-masalah optimasi yang Generalized Inverse .

  bersifat kompleks di bidang fisika, biologi, = Matriks H yang telah di- ekonomi, sosiologi dan lain-lain. (Mahmudy,

  transpose .

  2015). Algoritme genetika merupakan suatu = Matriks H hasil keluaran metode yang menggunakan seleksi alam yang

  hidden layer

  yang telah merupakan bagian utama dari prinsip evolusi diaktivasi. sebagai dasar pemikiran untuk menyelesaikan

  −1

  = Inverse dari perkalian ( ) suatu permasalahan. Prinsip ini dikemukakan matriks dengan

  . oleh Charles Darwin, dimana tanpa menghiraukan prinsip dasar penurunan sifat,

5. Menghitung output weight dari hidden layer

  Darwin mengemukakan penggabungan kualitas ke output layer yang ditunjukkan pada induk pada generasi berikutnya, disamping itu Persamaan 4. bahwa individu yang mampu beradaptasi dengan

  • lingkunganya akan mempunyai kesempatan (4)

  = hidup yang lebih besar. Keterangan:

  Penggunaan prinsip genetika pada = Matriks output weight dari komputer dimulai pada tahun 1950 ketika

  hidden layer

  ke output beberapa ahli Biologi mengunakan komputer

  layer .

  untuk simulasi sistem biologi. Akhir tahun 1975 John Holland dari Universitas Michigan melalui

  4.3 Reproduksi

  • Crossover Persilangan pada algoritme genetika melibatkan dua buah individu yang dipilih secara acak menjadi parent yang akan membentuk kromosom baru. Proses ini diawali dengan penentuan tingkat crossover (crossover
  • Mutasi Pada proses mutasi digunakan 1 kromosom parent sebagai inputannya yang diambil secara random dan memperhitungkan inputan mutation rate-nya. Sistem melakukan perulangan untuk menghasilkan offspring dari hasil mutasi sejumlah mutation rate dikalikan dengan jumlah populasi awal (popsize). Proses mutasi menggunakan metode random mutation dilakukan dengan memilih satu posisi atau titik dari suatu kromosom pada parent terpilih. Kemudian nilai dari posisi kromosom terpilih akan dimutasi menggunakan Persamaan 7. Setelah proses selesai maka akan tampil individu dari hasil mutasi kromosom yang dipilih secara random .

  = Nilai yang dibangkitkan secara random. = Nilai maksimal dari 1 kolom seluruh individu (kolom kromosom terpilih). = Nilai minimal dari 1 kolom seluruh individu (kolom kromosom terpilih). 123456789 987654321

  Keterangan: ′( ) = Hasil/Offspring mutasi.

  ( ) + ( − ) (7)

  ′

  ′( ) =

  = Parent. = alpha, nilai dibangkitkan secara random.

  (6) Keterangan: = Hasil/Offspring crossover.

  (1) = (1) + (P(2) − P(1)) (2) = (2) + (P(1) − P(2))

  dengan ukuran populasi (popsize). Pada Extended Intermediate Crossover, dipilih 2 parents untuk melakukan perhitungan crossover menggunakan Persamaan 6.

  crossover diperoleh dengan mengalikan cr

  keturunan (offspring) yang dihasilkan dari proses crossover. Hasil offspring dari proses

  rate / cr). Nilai ini menentukan rasio dari

  Reproduksi merupakan sebuah proses yang dilakukan untuk menghasilkan keturunan (offspring) yang berasal dari induk kromosom yang dipilih secara random. Terdapat dua operator genetika dalam reproduksi yaitu crossover dan mutasi.

  dihitung berdasarkan presisi variabel dan solusi yang dicari (Mahmudy, 2015).

  paper yang berjudul “Adaption in Natural and

  (stringLen)

  Tahap inisialisasi ini bertujuan untuk membangkitkan himpunan solusi baru secara acak yang terdiri dari sejumlah string kromosom dan ditempatkan pada penampungan yang disebut dengan populasi. Pada tahap ini miu (µ) yang menyatakan ukuran populasi atau popsize harus ditentukan. Panjang string kromosom

  4.2 Inisialisasi

  Gambar 2 Representasi kromosom

  solusi, dimana dapat diilustrasikan dalam Gambar 2 dibawah ini:

  decoder . Kromosom ini dapat mewakili suatu

  unit-unit yang dinamakan gen, karakter,

  genotype atau kromosom-kromosom terdiri dari

  Individu dalam populasi disebut string,

  string . Gen ini mewakili sebagian kecil dari solusi permasalahan.

  Gen adalah suatu sel dari suatu kromosom atau nilai yang terdapat dalam Algoritme Genetika ini dapat dibentuk oleh sebuah byte bahkan tidak menutup kemungkinan suatu

  4.1 Representasi Kromosom

  ” mengunakan konsep dasar algoritme genetika. Algoritme genetika bekerja dengan suatu populasi string dan melakukan proses pencarian nilai optimal secara parallel, dengan mengunakan operator genetika. Algoritme genetika akan melakukan rekombinasi antar individu. Algoritme genetika memiliki elemen dasar berupa string yang tersusun dari rangkaian substring (gen), yang masing-masing merupakan kode dari parameter dalam ruang solusi dimana suatu string (kromosom) menyatakan kandidat solusi. Kumpulan string dalam populasi berkembang dari generasi ke generasi melalui operator genetika. Pada setiap iterasi, individu-individu (kromosom) dalam populasi itu akan dievolusi dan diseleksi untuk menentukan populasi pada generasi berikutnya. Populasi ini akan terus berulang sampai menemukan suatu parameter dengan nilai yang paling optimal sesuai dengan yang diinginkan

  Artificial System

  Kromosom A Kromosom B

  4.4 Individu terbaik dalam penampungan akan lolos Evaluasi

  untuk masuk dalam generasi berikutnya. Metode Melakukan evaluasi pada data kromosom seleksi elitism menjamin individu yang terbaik terhadap nilai fitness yang digunakan. Nilai akan selalu lolos (Mahmudy, 2015) .

  fitness merupakan suatu ukuran baik tidaknya

  suatu solusi yang dinyatakan sebagai satu 5.

   METODE

  individu, atau dengan kata lain nilai fitness menyatakan nilai dari fungsi tujuan. Algoritme Langkah-langkah komputasi pada penelitian genetika mempunyai tujuan untuk ini dapat dilihat pada flowchart Gambar 3. memaksimalkan nilai fitness atau mencari nilai fitness maksimal.

  Mulai Pada Algoritme Genetika, suatu individu dievaluasi berdasarkan suatu nilai tertentu berdasarkan suatu fungsi tertentu

  Popsize , ukuran

  sebagai ukuran nilai fitness-nya. Pada masalah generasi, cr, mr optimasi, jika solusi yang dicari adalah memaksimalkan fungsi h, maka nilai fitness yang digunakan adalah nilai dari fungsi h

  Inisialisasi tersebut, yakni f = h. Sedangkan jika masalahnya Kromosom Awal adalah meminimalkan fungsi h, maka fungsi h tidak bisa digunakan secara langsung. Sehingga for i = 1 to ukuran nilai fitness untuk masalah minimasi adalah f = generasi

  1/h

  , yang artinya semakin kecil nilai h, maka semakin besar nilai f. Namun fungsi ini akan bermasalah jika h bernilai 0, yang akan

  Reproduksi mengakibatkan f bernilai tak hingga. Maka, h perlu ditambah dengan sebuah bilangan. Sehingga rumus fitness bisa menghasilkan solusi

  Evaluasi yang optimal. Fitness yang digunakan pada penelitian ini ditunjukkan pada Persamaan 8.

  (8) Seleksi

  ( ) = Di mana : adalah individu yang akan dihitung nilai

  • i

  fitness -nya

  4.5 Individu terbaik Seleksi

  Seleksi merupakan tahapan terakhir pada sekali proses evolusi yang dilakukan untuk Selesai memilih individu dari himpunan populasi dan

  Gambar 3 Flowchart prediksi kualitas air

  offspring yang akan dipertahankan hidup pada

  sungai generasi berikutnya. Semakin besar nilai fitness Komputasi ELM akan terjadi di dalam kromosom, maka semakin besar peluang proses evaluasi untuk menghasilkan nilai kromosom tersebut terpilih. Hal ini dilakukan

  fitness .

  agar terbentuk generasi berikutnya yang lebih baik dari generasi sekarang (Mahmudy, 2015).

  Metode seleksi yang digunakan dalam penelitian ini adalah metode seleksi elitism. Metode seleksi elitism bekerja dengan cara mengumpulkan semua individu dalam populasi (parent) dan offspring dalam satu penampungan. Kemudian melakukan sorting secara descending (dari terbesar ke terkecil) pada nilai fitness nya. Individu terbaik/tertinggi akan di ambil sesuai dengan jumlah populasi awal/popsize/miu (µ).

  Gambar 4 Flowchart prediksi kualitas air sungai

  Extreme Learning Machine

  85

  90

  10

  20

  30

  40

  50 Pengujian Popsize Rata-rata Akurasi Terbaik Rata-rata Akurasi Total

  Mulai Masukkan

  Pengujian popsize bertujuan untuk mengetahui ukuran populasi yang menghasilkan tingkat akurasi terbaik. Pengujian popsize pada penelitian ini akan dilakukan dengan 5 variasi

  Inisialisasi Parameter Awal (h, bias)

  Proses

  Training

  Normalisasi

  Selesai

  Hasil Prediksi dan akurasi

  Proses

  Testing

  80

  75

  70

  Gambar 5 Hasil pengujian popsize Berdasarkan grafik hasil pengujian popsize di atas, popsize 20 menghasilkan rata-rata akurasi tertinggi, yaitu 86.6666. Pada grafik diatas ditunjukkan ketidakstabilan rata-rata akurasi, akan tetapi pada ukuran generasi 20-50 mulai ditunjukkan kestabilan rata-rata akurasinya. Pada penelitian ini dapat disimpulkan bahwa semakin besar popsize-nya, akan semakin rendah rata-rata akurasi yang dihasilkan. Menurut Mahmudy (2015), semakin besar nilai dari popsize, akan memengaruhi waktu komputasi dan menyebabkan kinerja Algoritme Genetika meningkat bahkan melakukan eksplorasi lebih luas lagi. Oleh karena itu, Algoritme Genetika memiliki kemungkinan untuk mengeksplorasi area yang tidak optimum.

  82,6666 77.5234 80.3809 79.2381 77,7144

  83,3334 86,6666 86 85,3334

  77.1429

6. HASIL DAN PEMBAHASAN

6.1 Pengujian Popsize

  Pengujian ukuran generasi bertujuan untuk mengetahui ukuran generasi yang menghasilkan tingkat akurasi terbaik. Pengujian ukuran generasi pada penelitian ini akan dilakukan dengan 5 variasi ukuran generasi yang berbeda. Variasi ukuran generasi yang digunakan adalah kelipatan 10, dimulai dari 10 hingga 50. Pada masing-masing variasi ukuran generasi akan dilakukan percobaan sebanyak 7 kali percobaan.

  6.2 Pengujian Ukuran Generasi

  Parameter lain yang digunakan untuk mendukung pengujian ini, diantaranya adalah

  popsize dan kombinasi cr mr. Selama pengujian

  popsize dengan ukuran yang sama, nilai dari

  Parameter lain yang digunakan untuk mendukung pengujian ini, diantaranya adalah ukuran generasi dan kombinasi cr mr. Selama pengujian sebanyak 7 kali percobaan, pengujian

  dilakukan beberapa kali percobaan untuk diambil nilai rata-rata akurasi terbaiknya.

  running program akan berbeda, sehingga

  banyak melibatkan variabel yang dibangkitkan secara random , mengakibatkan nilai yang dihasilkan setiap kali

  Learning Machine

  digunakan adalah kelipatan 10, dimulai dari 10 hingga 50. Pada masing-masing variasi popsize akan dilakukan percobaan sebanyak 7 kali percobaan. Karena pada perhitungan Algoritme Genetika dan Extreme

  popsize yang berbeda. Variasi popsize yang

  sebanyak 7 kali percobaan, pengujian ukuran generasi dengan ukuran yang sama, nilai dari kedua parameter tersebut tidak boleh berubah/diganti. Nilai parameter yang digunakan pada pengujian ini yaitu popsize = 50,

  kedua parameter tersebut tidak boleh berubah/diganti. Nilai parameter yang digunakan pada pengujian ini yaitu ukuran generasi = 100, cr = 0.4 dan mr = 0.2. Hasil pengujian variasi popsize dapat dilihat pada Gambar 5. cr = 0.4 dan mr = 0.2. Hasil pengujian variasi

  popsize dapat dilihat pada Gambar 6.

  20

  85

  80

  75

  70

  78 79,7778 80,5714

  86,6666 86,6668 84 83,3334 85,3332 81,904882,5714

  30

  10

  40

  82,6666 85,3334 85,9998

  82 88,0002 86,6666 86,6666

  84,6666 86,6668 79.6285 82.3809

  85

  90

  90

50 Pengujian Ukuran Generasi

  Metode ELM-GA dapat digunakan untuk menentukan kualitas air sungai. Pada penelitian ini, input weight/bobot awal dioptimasi menggunakan Algoritme Genetika. Proses optimasi dilakukan dengan melakukan perhitungan menggunakan Algoritme Genetika. Pada tahap evaluasi, nilai fitness dihitung

  0.5

  0.8

  0.3 &

  0.7

  0.4 &

  0.6

  0.5 &

  0.6 &

  0.9

  0.4

  0.7 &

  0.3

  0.8 &

  0.2

  0.9 &

  0.1 Pengujian Kombinasi cr dan mr Rata-rata Akurasi Terbaik Rata-rata Akurasi Total

  0.2 &

  0.1 &

  7. KESIMPULAN DAN SARAN

  0.2

  Berdasarkan grafik hasil pengujian kombinasi cr dan mr di atas, kombinasi cr = 0.5 dan mr = 0.5 menghasilkan rata-rata akurasi tertinggi, yaitu 88.0002. Pada grafik diatas ditunjukkan ketidakstabilan rata-rata akurasi. Semakin banyak ukuran generasinya bukan berarti solusi yang dihasilkan akan optimal. Pada jumlah tertentu (saat mulai stabil), kombinasi cr mr memiliki kemungkinan lebih tinggi dalam menghasilkan solusi yang optimal. Menurut Mahmudy, 2015, setiap permasalahan akan memiliki kombinasi nilai cr dan mr yang berbeda-beda. Nilai cr yang terlalu rendah akan mengakibatkan tidak ditemukannya solusi optimal dari permasalahan, sedangkan nilai mr yang terlalu rendah akan mengakibatkan konvergensi dini.

  Rata-rata Akurasi Terbaik Rata-rata Akurasi Total 86,6666 86,6666

  Gambar 7 Hasil pengujian kombinasi cr dan mr

  sebanyak 7 kali percobaan, pengujian kombinasi cr dan mr dengan kombinasi yang sama, nilai dari kedua parameter tersebut tidak boleh berubah/diganti. Nilai parameter yang digunakan pada pengujian ini yaitu popsize = 20, dan ukuran generasi = 20. Hasil pengujian variasi popsize dapat dilihat pada Gambar 7.

  popsize dan ukuran generasi. Selama pengujian

  77,9048 77.2381 78.8571 76.0001

  79.4287 80.2857 80.1 77.0477

  78.77

  Gambar 6 Hasil pengujian ukuran generasi Berdasarkan grafik hasil pengujian ukuran generasi di atas, ukuran generasi 20 menghasilkan rata-rata akurasi tertinggi, yaitu 86.6668. Grafik diatas menunjukkan ketidakstabilan rata-rata akurasi. Pada ukuran generasi 10 hingga 40, rata-rata akurasi mengalami penurunan, sedangkan pada ukuran generasi 50 mulai ditunjukkan peningkatan rata- rata akurasinya. Semakin banyak ukuran generasinya bukan berarti solusi yang dihasilkan akan optimal. Pada jumlah tertentu (saat mulai stabil), ukuran generasi memiliki kemungkinan lebih tinggi dalam menghasilkan solusi yang optimal. Menurut Mahmudy (2015), semakin besar nilai dari ukuran generasi, akan memengaruhi waktu komputasi dan menyebabkan kinerja Algoritme Genetika meningkat bahkan melakukan eksplorasi lebih luas lagi. Oleh karena itu, Algoritme Genetika memiliki kemungkinan untuk mengeksplorasi area yang tidak optimum.

  75

  80

  Parameter lain yang digunakan untuk mendukung pengujian ini, diantaranya adalah

  Pengujian kombinasi cr (crossover rate) dan mr (mutation rate) bertujuan untuk mengetahui ukuran kombinasi cr dan mr yang menghasilkan tingkat akurasi terbaik. Pengujian kombinasi cr dan mr pada penelitian ini akan dilakukan dengan 11 variasi kombinasi cr dan mr yang berbeda. Pada masing-masing variasi kombinasi cr dan mr akan dilakukan percobaan sebanyak 7 kali percobaan.

  0.2 &

  0.4

  0.4 &

  70

6.3 Pengujian Kombinasi cr dan mr

  menggunakan metode Extreme Learning Budiarta, Aprilyan David, Rizqy Ajie Setiawan,

  Machine , dengan individu gabungan sebagai Siska Putri Nuralisa dan Umi Hidayati.

  bobot awal atau input weight-nya secara 2016. Kajian Kualitas Air Dengan bergantian.

  Menggunakan Analisis Parameter Fisik Berdasarkan pengujian yang telah dilakukan Dan Kimia Pada Sungai Desa Wiyurejo pada bab sebelumnya, ketiga pengujian tersebut Kecamatan Pujon Kabupaten Malang. mempengaruhi waktu eksekusi dan nilai akurasi Fakultas Ilmu Sosial Universitas Negeri yang dihasilkan. Semakin besar popsize dan

  Malang. Malang. ukuran generasinya akan membutuhkan waktu Huang, G.B., Zhu, Q.Y., dan Siew, C.K. 2004. eksekusi yang cukup lama. Banyaknya popsize

  Extreme Learning Machine : A New dan generasi tidak selalu menghasilkan solusi Learning Scheme of Feedforward neural yang optimal. Solusi optimal yang didapatkan Networks. Proceedings of International oleh penelitian ini berdasarkan pengujian yang Joint Conference on Neural Networks. telah dilakukan, diantaranya parameter popsize Budapest, Hungary, 25-29 Juli 2004. dengan ukuran 20 dan nilai akurasi 86.6666%, Singapura: Nanyang Avenue. parameter ukuran generasi sejumlah 20 dan nilai akurasi 86.6668% serta parameter kombinasi cr Mahmudy, Wayan Firdaus. 2015. Dasar-Dasar

  Algoritme Evolusi. Program Teknologi dan mr mendapatkan nilai akurasi 88.0002% Informasi dan Ilmu Komputer (PTIIK) dengan kombinasi cr = 0.5 dan mr = 0.5. Akurasi pada penelitian ini mencapai Universitas Brawijaya. Malang. 88.0002%, meningkat 0.1102% dari penelitian sebelumnya (Azizah, 2016) yang dapat menyentuh angka 87.89%.

  Pada penelitian yang akan datang diharapkan akan dilakukan pengembangan atau penggabungan metode lain dengan ELM seperti

  Optimally Pruned Extreme Learning Machine

  (OPELM), Parallel Layer Extreme Learning

  Machine (PL-ELM), Radial Basis Function Extreme Learning Machine (RBF-ELM), dan

  metode modifikasi ELM lain dapat digunakan pada penelitian selanjutnya untuk meningkatkan hasil klasifikasi.

  Pada penelitian selanjutnya juga diharapkan peneliti dapat melakukan seleksi fitur untuk meningkatkan tingkat akurasi prediksi dalam penentuan kualitas air sungai. Seleksi fitur dapat dilakukan untuk mengurangi jumlah fitur/parameter yang tidak mempengaruhi tingkat akurasi atau menghapus beberapa data yang kurang atau tidak relevan.

  DAFTAR PUSTAKA Agustina, Irwin Dwi, Wiwik Anggraeni, S.Si,

  M.Kom, dan Ahmad Mukhlason, S.Kom, M.Sc. 2010. Penerapan Metode Extreme Learning Machine untuk Peramalan Permintaan. Institut Teknologi Sepuluh Nopember. Surabaya.

  Azizah, Alvia Nur. 2016. Penentuan Kualitas Air Sungai Menggunakan Metode Extreme Learning Machine. Fakultas Ilmu Komputer Universitas Brawijaya. Malang.