Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika
KAJIAN ANALISIS REGRESI LINIER BERGEROMBOL
DENGAN PENDEKATAN ALGORITMA GENETIKA
AEP HIDAYATULOH
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Kajian Analisis Regresi
Linier Bergerombol dengan Pendekatan Algoritma Genetika adalah benar karya
saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk
apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau
dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Februari 2015
Aep Hidayatuloh
NIM G14090097
ABSTRAK
AEP HIDAYATULOH. Kajian Analisis Regresi Linier Bergerombol dengan
Pendekatan Algoritma Genetika. Dibimbing oleh AGUS MOHAMAD SOLEH
dan BAGUS SARTONO.
Analisis Regresi Linier Bergerombol (RLB) dengan pendekatan Algoritma
Genetika (AG) mampu mencari solusi terbaik pada data bergerombol berdasarkan
nilai adjusted R-square (R2adj), namun belum mampu mendeteksi jumlah
gerombol optimum yang terbentuk karena semakin besar asumsi banyaknya
gerombol maka nilai R2adj juga semakin tinggi. Analisis ini juga mampu
menggerombolkan suatu amatan dengan baik sehingga dapat meningkatkan
kemampuan analisis regresi linier. Jika dibandingkan dengan analisis regresi linier
klasik, analisis ini mampu menghasilkan parameter dugaan dan R2adj pada data
bergerombol yang lebih baik. Program untuk analisis RLB dengan pendekatan
AG dapat dilihat di http://bit.ly/CLRwGA.
Kata kunci: algoritma genetika, regresi linier bergerombol
ABSTRACT
AEP HIDAYATULOH. The Study of Clustered Linear Regression Analysis with
Genetic Algorithms Approach. Supervised by AGUS MOHAMAD SOLEH and
BAGUS SARTONO.
Clustered Linear Regression (CLR) analysis with Genetic Algorithms (GA)
approach is able to find solutions to the data clustering based on the adjusted Rsquare (R2adj) value, but have not been able to determine the optimum clusters
because of the larger number of clusters the R2adj value also higher. This analysis
is able to determine cluster for an observation so that it can improve the ability of
linear regression analysis. If compared to classical linear regression analysis, this
analysis is able to produce better estimation of parameters and R2adj value. CLR
analysis with GA approach program can be accessed at http://bit.ly/CLRwGA.
Keywords: clustered linear regression, genetic algorithms
KAJIAN ANALISIS REGRESI LINIER BERGEROMBOL
DENGAN PENDEKATAN ALGORITMA GENETIKA
AEP HIDAYATULOH
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015
Judul Skripsi : Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika
Nama
: Aep Hidayatuloh
NIM
: G14090097
Disetujui oleh
Agus Mohamad Soleh, MT
Pembimbing I
Dr Bagus Sartono, MSi
Pembimbing II
Diketahui oleh
Dr Anang Kurnia, MSi
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan kepada Allaah Subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Karya ilmiah
ini diberi judul Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika.
Terima kasih penulis ucapkan kepada Bapak Agus Mohamad Soleh, MT
dan Bapak Dr Bagus Sartono, MSi selaku pembimbing yang telah bersabar dalam
memberikan nasihat kepada penulis.
Terima kasih juga kepada:
1. Seluruh Dosen dan Staf Departemen Statistika FMIPA IPB atas segala
bantuannya.
2. Bapak Harianto Tanudjaja dan seluruh staf PT Ganesha Cipta Informatika
yang telah membantu selama penulisan karya ilmiah ini.
3. Bapak, Ibu, Kakak dan adik-adikku yang selalu menjadi motivasi bagi
penulis, serta seluruh keluarga atas segala doa dan dukungannya.
4. Teman seperjuangan Syarif Amrulla, Linda Erijayanti, Mochammad
Fachrouzi Iskandar, Dyah Ayuning Pawestri, Muhammad Hafid, dan
seluruh teman-teman Statistika 46. Tidak lupa juga satu-satunya teman
sedaerah, Fatih Mulia Utama.
5. Seluruh pihak yang sudah memberikan dukungannya demi selesainya
penulisan karya ilmiah ini.
Penulis menyadari bahwa karya ilmiah ini masih belum sempurna. Demi
lebih sempurnanya karya ilmiah ini penulis mengharapkan saran dan kritik dari
pembaca. Semoga karya ilmiah ini dapat memberikan banyak manfaat.
Bogor, Februari 2015
Aep Hidayatuloh
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Algoritma Genetika
2
METODE
5
Data
5
Prosedur Analisis Data
6
HASIL DAN PEMBAHASAN
Ilustrasi Penerapan
9
9
Kajian Kinerja Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika
11
Diskusi
19
SIMPULAN DAN SARAN
19
Simpulan
19
Saran
20
DAFTAR PUSTAKA
20
LAMPIRAN
21
RIWAYAT HIDUP
26
DAFTAR TABEL
1
2
3
4
5
6
7
8
9
Parameter regresi data 2 gerombol
Parameter regresi data 3 gerombol
R2adj dan jumlah anggota gerombol hasil dugaan
Nilai R2adj*
Nilai R2adj tertinggi dari 30 ulangan pada data dengan 2 gerombol
Hasil pendugaan gerombol optimal berdasarkan urutan
Pendugaan parameter data dengan 2 gerombol (regresi linier klasik)
Pendugaan parameter data dengan 2 gerombol (RLB-AG)
Pendugaan gerombol optimal berdasarkan urutan pada data 1 dengan 3
gerombol
10 Pendugaan parameter data dengan 3 gerombol (regresi linier klasik)
11 Pendugaan parameter data dengan 3 gerombol (RLB-AG)
5
6
10
12
12
13
14
15
16
17
18
DAFTAR GAMBAR
1
2
3
4
Ilustrasi teknik pindah-silang dan mutasi
Bagan alir analisis RLB dengan pendekatan AG
Diagram pencar
Performa RLB dengan pendekatan AG
4
7
10
11
DAFTAR LAMPIRAN
1
2
3
4
5
Sebaran data pada data dengan 2 gerombol
Sebaran data pada data dengan 3 gerombol
Jumlah anggota gerombol hasil penggerombolan pada data 1
Jumlah anggota gerombol hasil penggerombolan pada data 2
Jumlah anggota gerombol hasil penggerombolan pada data 3
21
22
23
24
25
PENDAHULUAN
Latar Belakang
Data yang diperoleh pada suatu penelitian sering kali berasal dari satu
populasi yang sama namun tidak sepenuhnya dapat digambarkan hanya dengan
satu model. Data tersebut sebenarnya terdiri dari beberapa subpopulasi atau
gerombol dan masing-masing memiliki model regresi yang berbeda. Data seperti
ini akan menghasilkan model yang tidak efektif jika menggunakan analisis regresi
linier klasik dengan menggunakan pendugaan Metode Kuadrat Terkecil (MKT)
untuk melihat hubungan antara peubah respon dan peubah penjelas. Permasalahan
lain yang terjadi pada data seperti ini adalah tidak diketahui banyaknya gerombol
yang terbentuk dan amatan atau objek yang termasuk dalam suatu gerombol juga
tidak diketahui. Permasalahan-permasalahan di atas memerlukan penanganan
khusus agar model yang dihasilkan oleh MKT lebih baik dalam menggambarkan
karakteristik data tersebut. Pendugaan parameter regresi linier dengan MKT
membutuhkan informasi tambahan, yaitu gerombol yang terbentuk pada data.
Oleh sebab itu, dibutuhkan solusi yang mampu menangani masalah regresi pada
kasus seperti ini.
Beberapa metode yang ada untuk analisis pada permasalahan tersebut antara
lain adalah pada penelitian Ari dan Guvernir (2002) menggunakan MARS, RSBF,
k-Nearest Neighborhood Regression (KNNR), dan Regresi Linier Bergerombol
(RLB), sedangkan yang digunakan pada penelitian Barman dan Dabeer (2011)
menggunakan Individual Regression (IR), Collective Regression (CR), Algoritma
EM, Algoritma K-rataan, Singular Value Thresholding, Metode Curds dan Whey,
dan Regresi Lokal (LoR). Berdasarkan penelitian terhadap beberapa algoritma
tersebut, Ari dan Guvernir (2002) menyatakan RLB memiliki hasil yang lebih
baik, sedangkan Barman dan Dabeer (2011) menyatakan LoR memiliki hasil
terbaik. RLB merupakan perluasan dari metode regresi linier klasik yang
membagi data menjadi beberapa subgugus data, sehingga dapat memberikan hasil
yang lebih akurat untuk fungsi regresi linier. Pendekatan ini juga mengeliminasi
permasalahan yang disebabkan oleh korelasi antar peubah penjelas yang sering
terjadi dalam dunia nyata (Ari dan Guvernir 2002). Pada penelitian ini dilakukan
analisis RLB dengan menggunakan pendekatan algoritma genetika.
Metode analisis RLB dengan pendekatan algoritma genetika digunakan
untuk memeroleh persamaan regresi sekaligus menggerombolkan amatan-amatan
ke dalam suatu gerombol. Hal tersebut dilakukan dengan mengoptimalkan nilai
fungsi kesuaian (fitness). Pada penelitian ini disusun program analisis RLB
dengan pendekatan algoritma genetika menggunakan SAS/IML, SAS/Base, dan
SAS Macro kemudian mengevaluasi kemampuan analisis tersebut pada data
berukuran kecil, sedang dan besar. Data yang digunakan pada penelitian ini adalah
data simulasi dengan banyaknya gerombol yang dibangkitkan adalah 2 dan 3
gerombol. Sebagai informasi, SAS/IML sebenarnya sudah mempunyai beberapa
program terkait algoritma genetika. Namun pada penelitian ini tidak
menggunakan program tersebut dan membuat program baru untuk lebih
mempermudah.
2
Tujuan Penelitian
Penelitian ini bertujuan memberikan metode alternatif dalam permasalahan
analisis regresi linier bergerombol. Hasil yang diharapkan dari penelitian ini
adalah:
1. Mengevaluasi kemampuan metode analisis regresi linier bergerombol
dengan pendekatan algoritma genetika.
2. Memberikan informasi jumlah gerombol dan penggerombolan amatan
yang terbentuk pada data.
3. Membentuk persamaan regresi linier yang mampu menggambarkan data
bergerombol dengan baik.
4. Mengukur keakuratan parameter regresi hasil dugaan dengan parameter
regresi aktual.
5. Menerapkan analisis pada data berukuran sedang dan besar.
TINJAUAN PUSTAKA
Algoritma Genetika
Antoniou dan Lu (2007) menyatakan proses optimasi adalah proses untuk
mendapatkan hasil terbaik. Umumnya hasil yang diinginkan adalah nilai maksimum atau minimum. Salah satu Algoritma yang saat ini sedang berkembang dan
mulai banyak diterapkan dalam menyelesaikan permasalahan optimasi adalah
Algoritma Genetika. Algoritma Genetika (AG) adalah sebuah teknik optimasi dan
pencarian solusi berdasarkan prinsip-prinsip genetika dan seleksi alam. AG
memungkinkan sebuah populasi terdiri dari banyak individu untuk berkembang
dibawah aturan seleksi tertentu menuju keadaan yang mengoptimumkan fungsi
fitness (misalnya meminimumkan fungsi biaya) (Haupt dan Haupt 2004). AG
diperkenalkan oleh John H. Holland pada tahun 1975. Prinsip dasar AG
mengadaptasi proses teori evolusi alam. Secara garis besar, proses evolusi yang
terjadi adalah seleksi dari populasi awal, pindah-silang (crossover), mutasi, dan
seleksi alam.
Proses seleksi alam yang terjadi melibatkan proses perubahan gen pada
individu-individu melalui proses perkembangbiakan sehingga menghasilkan keturunan terbaik. Setiap individu memiliki informasi penting yang telah dikodekan
dan dikenal sebagai kromosom. Individu yang baik akan menghasilkan keturunan
yang baik dan ukuran kebaikan suatu individu dilihat dari nilai kesuaian (fitness).
Nilai kesuaian diperoleh dari hasil evaluasi individu terhadap fungsi kesuaian
yang ingin dicari nilai optimumnya. AG juga sudah banyak digunakan pada
penelitian tentang optimasi dalam berbagai bidang, diantaranya adalah pada
penyusunan kelompok belajar (Angga dan Lestari 2012), untuk desain ruang
dalam rumah (Liliana 2006), dan tentang penyelesaian masalah transportasi
(Sarwadi dan Anjar 2004).
Beberapa istilah AG yang digunakan dalam penelitian ini.
Gen
: sebuah nilai yang memiliki informasi tertentu dan berperan
penting dalam proses pewarisan sifat dari individu kepada
keturunannya. Biasanya gen berupa bilangan biner atau
3
numerik. Dalam penelitian ini gen adalah bilangan
numerik yang menunjukkan gerombol.
Kromosom
: gabungan dari beberapa gen yang menggambarkan
karakteristik suatu individu.
Individu
: suatu nilai yang menyatakan solusi.
Keturunan
: individu baru hasil pindah-silang.
Populasi
: kumpulan individu yang akan diproses dalam siklus
evolusi untuk mencari solusi terbaik.
Fungsi kesuaian : fungsi yang akan dicari nilai optimumnya.
Nilai kesuaian
: menyatakan kebaikan suatu individu atau solusi yang
diperoleh dari fungsi kesuaian.
AG lebih sesuai untuk mencari solusi terbaik/optimum global dari kemungkinan
solusi yang berukuran besar atau masalah yang rumit. Pada masalah yang tidak
terlalu rumit, metode lain yang lebih sesuai mungkin dapat menemukan solusi
lebih cepat dibandingkan AG (Haupt dan Haupt 2004).
Operator-operator genetika yang terlibat dalam AG adalah
1. Inisialisasi Populasi.
Membentuk populasi awal yang dibutuhkan pada proses pencarian
solusi. Sivanandam dan Deepa (2008) menyatakan ada dua hal penting dari
populasi yang digunakan dalam AG, (1) inisial generasi populasi dan (2)
ukuran populasi. Dalam praktiknya, sekitar 100 individu dalam populasi sudah
cukup, tetapi ukurannya bisa berubah menyesuaikan dengan waktu dan
kemampuan komputasi yang digunakan. Populasi dapat dibangkitkan secara
acak, berdasarkan teori tertentu, atau menggunakan suatu metode. Aturan atau
batasan yang mengikat saat pembangkitan populasi harus benar-benar
diperhatikan. Pada penelitian ini populasi awal dibangkitan secara acak.
2. Seleksi
AG juga melakukan seleksi terhadap individu seperti seleksi alam.
Sebanyak g individu yang terpilih diharapkan adalah individu terbaik yang
akan dijadikan sebagai tetua pada tahapan pindah-silang. Tetua umumnya
dipilih berdasarkan nilai kesuaian, namun beberapa metode seleksi tidak
menggunakannya. Sivanandam dan Deepa (2008) menyebutkan ada beberapa
teknik seleksi yang dapat digunakan, diantaranya adalah
a. Seleksi acak
Individu dipilih secara acak dari populasi tanpa memerhatikan nilai
kesuaian.
b. Seleksi Peringkat
Individu diperingkatkan berdasarkan nilai kesuaian yang paling baik. Pada
kasus memaksimumkan suatu fungsi, individu yang memiliki nilai
kesuaian paling tinggi dipilih untuk diakukan pindah-silang.
c. Seleksi Roda Rolet
Seperti pada permainan Rolet, individu dipilih secara acak tetapi dengan
proporsi peluang yang berbanding lurus dengan besarnya nilai kesuaian.
Individu yang memiliki nilai kesuaian yang baik memiliki peluang yang
lebih tinggi.
4
d. Seleksi Turnamen
Beberapa individu (tiga atau empat) dipilih secara acak dari populasi.
Kemudian bandingkan nilai kesuaian. Individu dengan nilai kesuaian yang
paling tinggi dipilih untuk pindah-silang, sedangkan yang lain dikembalikan ke dalam populasi agar memiliki kemungkinan terambil lagi.
3. Pindah-silang
Pindah-silang adalah proses yang melibatkan 2 individu dari tetua yang
terpilih untuk menghasilkan individu atau keturunan baru yang disebut anak.
Dua tetua ditukarkan gen dalam kromosomnya. Cara penukaran gen seperti
penukaran unsur yang ada pada vektor. Beberapa teknik pindah-silang adalah :
a. Satu titik (Single point)
Masing-masing kromosom dipotong pada satu titik silang dengan panjang
yang sama. Kemudian bagian-bagian ini saling ditukarkan. Teknik pindahsilang inilah yang akan digunakan pada penelitian ini. Ilustrasinya seperti
Gambar 1(a).
b. Dua titik (Two/Double point)
Sama seperti pada teknik pindah-silang satu titik, tetapi menggunakan dua
titik silang. Masing-masing kromosom dipotong pada 2 titik silang dengan
panjang yang sama. Kemudian bagian-bagian ini saling ditukarkan seperti
Gambar 1(b).
c. Seragam (Uniform)
Teknik ini dilakukan dengan membangkitkan bilangan acak Seragam(0,1)
sesuai panjang kromosom dan nilainya dibulatkan. Misalnya jika nilai
bilangan acak adalah 1 maka gen ditukar, jika 0 gen tetap. Proses pindahsilang akan terlihat seperti Gambar 1(c).
(a) Teknik pindah-silang satu titik
(c) Teknik pindah-silang seragam
(b) Teknik pindah-silang dua titik
(d) Teknik mutasi
Gambar 1 Ilustrasi teknik pindah-silang dan mutasi
5
4. Mutasi
Mutasi diperlukan untuk menjaga agar solusi yang diperoleh bersifat
lebih luas. Tingkat terjadinya mutasi ini umumnya sangat kecil, yaitu sekitar
1% atau kurang. Mutasi tidak bisa diatur terlalu besar karena perubahan dari
generasi ke generasi akan seperti langkah acak dan akan terlalu lama mencapai
konvergensi (Sartono 2010). Proses mutasi dilakukan dengan mengganti
beberapa gen, misalnya 1 diganti dengan 2 dan sebagainya. Gambar 1(d)
memberikan ilustrasi teknik mutasi tersebut.
METODE
Data
Data yang digunakan pada penelititan ini adalah hasil pembangkitan.
Ukuran data dibagi 3, yaitu data berukuran kecil (100 amatan), sedang (1000
amatan) dan besar (5000 amatan) (Barman dan Dabeer 2011). Data yang
digunakan pada simulasi terdiri atas 2 dan 3 gerombol dengan bentuk hubungan
linier antara peubah X dan Y pada masing-masing gerombol berbeda satu dengan
yang lainnya. Percobaan dilakukan pada data rekaan dengan 2 peubah penjelas
yang dibangkitkan dengan persamaan berikut.
X1 = 50 – 3.275 θ dan X2 = 20 + 14 θ,
dengan θ~Seragam(0,1). εodel untuk masing-masing gerombol ke-i adalah
Yi = β0i + β1i X1 + β2i X2 + , i = 1, 2, .., c,
dengan c adalah banyaknya gerombol, sedangkan ~N(μ=0, σ2=10). Tabel 1 dan
Tabel 2 menunjukkan parameter yang digunakan untuk mambangkitkan data
simulasi.
Tabel 1 menunjukkan parameter regresi yang digunakan untuk membangkitkan data dengan gerombol sebanyak 2. Perbedaan antara data 1, data 2, dan data 3
adalah bentuk hubungan linier antara peubah X1 dan X2 dengan Y. Data 1
Tabel 1 Parameter regresi data 2 gerombol
Data
1
2
3
Gerombol
1
2
1
2
1
2
Parameter
β0
β1
β2
155.80
-7.65
18.76
6.50
-7.65
18.76
5.58
-2.65
8.76
1.25
-5.72
35.65
1150.80
-7.65 -18.76
6.50
-5.72
19.65
6
Tabel 2 Parameter regresi data 3 gerombol
Data
1
2
3
Gerombol
1
2
3
1
2
3
1
2
3
Parameter
β0
β1
515.80
5.65
209.00
5.65
1.50
5.65
0.80 -1.76
-19.00 -1.26
-16.50
0.57
105.80
1.77
15.80
1.77
1186.50 -7.57
β2
19.65
19.65
19.65
12.88
-5.76
3.96
8.76
8.76
-16.96
mempunyai bentuk hubungan linier positif. Antara gerombol 1 dan 2 membentuk
pola linier sejajar yang ditunjukkan oleh β1 yang bernilai negatif dan β2 yang
bernilai positif dengan nilai yang sama untuk masing-masing gerombol. Namun
karena nilai β0 untuk gerombol 1 dan 2 berbeda maka bentuk pola hubungan
liniernya sejajar tapi tidak berhimpit. Data 2 juga mempunyai bentuk hubungan
linier positif antara peubah X1 dan X2 dengan Y. Pola yang terbentuk antara
gerombol 1 dan 2 tidak sejajar yang terlihat dari nilai β1 yang bernilai negatif dan
β2 yang bernilai positif tapi tidak sama untuk masing-masing gerombol.
Perbedaan parameter tersebut menyebabkan kemiringan pada pola hubungan
linier masing-masing gerombol berbeda sehingga bentuk hubungan linier antara
peubah X2 dan Y pada gerombol 1 lebih landai dibandingkan dengan gerombol 2.
Selanjutnya data 3 mempunyai bentuk hubungan linier anatara peubah X1 dan X2
dengan Y yang berbeda untuk masing-masing gerombol. Plot antara Y dengan X1
dan X2 untuk masing-masing data dengan 2 gerombol dapat dilihat di Lampiran 1.
Parameter regresi yang digunakan untuk membangkitkan data dengan 3
gerombol ditunjukkan pada Tabel 2. Bentuk hubungan linier antara peubah X1 dan
X2 dengan Y pada data 1 sejajar antar gerombol yang dapat dilihat berdasarkan β1
dan β2 yang bernilai sama. Pada data 2, masing-masing gerombol mempunyai
kemiringan yang berbeda. Gerombol pertama cukup miring, satu gerombol lagi
lebih landai, sedangkan gerombol lainnya mempunyai bentuk hubungan linier
negatif antara peubah X2 dan Y. Data 3 mempunyai 2 gerombol dengan bentuk
hubungan linier antara peubah X2 dan Y yang sejajar. Satu gerombol lainnya
mempunyai bentuk hubungan linier negatif antara peubah X2 dan Y. Plot antara Y
dengan X1 dan X2 untuk masing-masing data dengan gerombol sebanyak 3 dapat
dilihat di Lampiran 1.
Prosedur Analisis Data
Analisis regresi linier bergerombol (RLB) dengan pendekatan AG adalah
sebuah metode yang meningkatkan keakuratan dari regresi linier klasik dengan
membagi sebuah gugus data ke dalam beberapa subgugus data. Metode ini
7
Gambar 2 Bagan alir analisis RLB dengan pendekatan AG
merupakan integrasi antara analisis regresi linier dan analisis gerombol. Prosedur
analisis yang digunakan pada penelitian ini dibagi menjadi 2 bagian, yaitu
penyusunan program menggunakan SAS/IML, SAS/Base, SAS/Graph, dan SAS
Macro yang dievaluasi berdasarkan data berukuran kecil dan penerapan pada data
sedang dan besar. Pada bagian pendugaan banyaknya gerombol optimum
penggerombolan amatan dilakukan masing-masing 30 ulangan pada data yang
sama dan pada pendugaan parameter dilakukan 500 ulangan dengan data yang
berbeda-beda. Proses analisis RLB dengan pendekatan AG dapat dilihat pada
Gambar 2 untuk 1 kali ulangan. Penjelasan detail prosesnya adalah sebagai
berikut.
1. Menenentukan asumsi banyaknya gerombol.
Penentuan banyaknya gerombol yang digunakan pada penelitian ini adalah 2
sampai 5 gerombol. Hal ini karena diduga banyaknya gerombol yang
terbentuk berada diantara nilai tersebut.
8
2. Menginisialisasi populasi awal.
Populasi awal dibangkitkan secara acak sebanyak 210 individu dengan
pembangkitan dari sebaran Seragam(1, c), dengan c adalah asumsi banyaknya
gerombol.
3. Menghitung nilai kesuaian.
Misalnya terdapat satu gugus data yang terdiri dari n amatan, peubah
respon Y dan peubah penjelas X. Jika pada data tersebut terbentuk c gerombol
maka gen yang terbentuk berupa bilangan numerik 1, 2, 3 sampai c.
Kromosom yang dalam kasus ini sekaligus sebagai individu yang terbentuk
berupa sebuah vektor yang mempunyai n unsur. Unsur-unsur vektor tersebut
adalah kode gerombol. Jika unsur pertama mempunyai gen 1 maka amatan
pada data tersebut termasuk anggota gerombol 1, gen 2 menunjukkan amatan
termasuk gerombol 2, dan seterusnya hingga gen c menunjukkan amatan
termasuk ke dalam gerombol ke-c. Individu tersebut pada analisis ini diperlakukan seperti peubah kategorik. Pada analisis regresi linier, jika sebuah
peubah berkategori (nominal atau ordinal) maka perlu diubah menjadi satu
atau beberapa peubah boneka, dalam kasus ini akan terbentuk sebanyak c - 1.
Sebagai ilustrasi, misalnya ada data dengan satu peubah respon Y, 2
peubah penjelas X1 dan X2, 100 amatan, serta banyaknya gerombol c = 3. Jika
S adalah peubah boneka maka akan ada 3 – 1 = 2 peubah boneka, yaitu S1 dan
S2. Koromosom akan terdiri dari 100 gen sebagai kode gerombol untuk
masing-masing amatan, yaitu 1, 2, dan 3. Nilai kesuaian untuk data seperti
diatas diperoleh dengan menghitung nilai R2adj dari model yang digunakan
dalam RLB dengan pendekatan AG, yaitu
Y = β0 + β1X1 + β2X2 +
1S1
+
2S2
+
3S1X1
+
4S1X2
+
5S2X1
+
6S2X2
+
dengan:
(S1, S2) =
(0, 0) untuk gerombol 1
(1, 0) untuk gerombol 2
(0, 1) untuk gerombol 3
Model di atas jika dituliskan dalam notasi matriks adalah seperti berikut.
Y = Xβ + Z'� + ε
keterangan:
X = [ 1 X1 X2 ], matriks peubah bebas X1 dan X2.
β0
β = [ β1 ], vektor parameter regresi untuk peubah bebas.
β2
Z' = [ S1 S2 S1X1 S1X2 S2X1 S2X2 ], matriks peubah bebas S1, S2 dan
interaksinya dengan peubah X1 dan X2.
1
δ =[
2
], parameter regresi untuk peubah S1, S2, S1X1, S1X2, S2X1 dan S2X2.
9
Jika nilai S1 dan S2 disubstitusikan maka model untuk masing-masing
gerombol adalah
Y1 = β0 + β1 X1 + β2 X2 + 1
untuk gerombol 1,
Y2 = (β0 + 1) + (β1 + 3) X1 + (β2 + 4) X2 + 2
untuk gerombol 2, dan
Y3 = (β0 + 2) + (β1 + 5) X1 + (β2 + 6) X2 + 3
untuk gerombol 3.
4. Mengevaluasi kekonvergenan nilai kesuaian.
Misalnya g adalah banyaknya individu terbaik yang akan dipilih pada
tahap seleksi individu. Proses analisis dikatakan konvergen jika selisih antara
nilai maksimum dan minimum nilai R2adj dari g individu terpilih yang sudah
diurutkan pada iterasi ke-i ≤ α, yaitu α = 10-6. Jika metode sudah konvergen
maka proses berhenti, tetapi jika belum konvergen maka dilanjutkan ke tahap
berikutnya. Penentuan maksimum iterasi juga perlu dilakukan untuk mencegah program terus berjalan pada kondisi yang tidak mungkin konvergen, yaitu
ditentukan sebanyak 2000 iterasi.
5. Menyeleksi individu.
Pada penelitian ini ditentukan g = 15 individu terpilih yang memiliki nilai
kesuaian tertinggi untuk menjadi tetua pada proses pindah silang. Teknik
seleksi yang digunakan adalah seleksi peringkat berdasarkan nilai R2adj.
6. Melakukan proses pindah-silang.
Pindah-silang dilakukan terhadap masing-masing 2 tetua untuk menghasilkan
keturunan baru dengan teknik satu titik. Penentuan titik silang pada penelitian
ini ditentukan pada tengah-tengah kromosom atau dengan proporsi sekitar
50%:50%.
7. Melakukan proses mutasi pada individu.
Proses mutasi pada penelitian ini hanya dilakukan pada anak hasil pindahsilang untuk menjaga kualitas tetua dan memastikan nilai kesuaiannya tidak
menurun. Peluang terjadinya mutasi ditentukan sebesar 0.8%.
8. Menggabungkan anak hasil mutasi dengan induknya.
9. Mengulangi tahap 3 sampai 8 hingga nilai kesuaian konvergen atau setelah
mencapai iterasi maksimum.
10. Mengulangi tahap 1 sampai 9 dengan banyaknya gerombol yang berbeda.
11. Bandingkan nilai R2adj tertinggi dari hasil masing-masing gerombol. Gerombol
yang memiliki nilai R2adj paling tinggi maka itulah gerombol optimal yang
terbentuk.
12. Mengulang tahap 2 sampai 8 sebanyak 30 kali untuk memperoleh pola nilai
R2adj dan pengelompokkan data, dan mengulang 500 pada data yang berbeda
untuk menduga parameter. Asumsi banyaknya gerombol dalam pendugaan
parameter disesuai-kan dengan jumlah gerombol yang sudah diketahui.
HASIL DAN PEMBAHASAN
Ilustrasi Penerapan
Terdapat data dengan satu peubah respon Y dan dua peubah penjelas, yaitu
X1 dan X2. Data tersebut terdiri dari 100 amatan. Dari data tersebut ingin
diperoleh model yang mampu menghasilkan prediksi untuk nilai Y dengan baik.
10
Gambar 3 Diagram pencar
Kebaikan model regresi linier diukur dari besarnya nilai R2adj. Karena itu
diterapkan analisis regresi linier klasik pada data tersebut dan diperoleh nilai R2adj
sebesar 46.91%. Artinya hanya 46.91% keragaman data yang dapat dijelaskan
oleh model tersebut. Hal ini menunjukkan bahwa model yang sudah diperoleh
masih belum cukup baik untuk menduga nilai Y. Berdasarkan diagram pencar
pada Gambar 3, dicurigai terbentuk gerombol pada data tersebut. Oleh sebab itu,
dibutuhkan solusi yang dapat mengatasi permasalahan analisis regresi linier pada
data bergerombol tersebut. Solusi ini diharapkan mampu menghasilkan nilai R2adj
yang lebih tinggi dibandingkan dengan yang dihasilkan oleh analisis regresi linier
klasik. Salah satu solusi yang dapat digunakan pada data dengan kondisi seperti
ini adalah analisis RLB dengan pendekatan AG.
Analisis ini mencari solusi terbaik berdasarkan nilai R2adj dan melakukan
penggerombolan untuk masing-masing amatan. Tabel 3 menunjukkan nilai R2adj
maksimum yang menunjukkan solusi terbaik untuk data tersebut. Jika diasumsikan ada 2 gerombol maka nilai maksimum yang diperoleh adalah 99.08%,
sedangkan jika diasumsikan ada 5 gerombol nilai maksimumnya adalah 99.70%.
Nilai R2adj yang diperoleh ini sangat jauh berbeda dibandingkan dengan hasil yang
diperoleh dari analisis regresi linier klasik. Berdasarkan pendekatan hasil tersebut,
gerombol optimum yang terbentuk pada data tersebut adalah gerombol yang
memiliki nilai R2adj maksimum paling tinggi, yaitu 5 gerombol. Secara keseluruhan, penerapan analisis RLB dengan pendekatan AG mampu menghasilkan nilai
R2adj lebih tinggi dibandingkan dengan hasil dari analisis regresi linier klasik. Pada
Tabel 3 juga disajikan jumlah anggota gerombol untuk masing-masing asumsi
banyaknya gerombol dari hasil penduggan. Jika diasumsikan terbentuk 2
Tabel 3 R2adj dan jumlah anggota gerombol hasil dugaan
Asumsi banyaknya
gerombol
2
3
4
5
R2adj
(%)
99.08
99.22
99.40
99.70
1
55
10
43
22
Gerombol
2
3
4
45
37
53
13
9
35
30
10
12
5
26
11
gerombol maka dari 100 amatan tersebut sebanyak 55 amatan dimasukkan ke
dalam gerombol 1 dan 45 amatan ke dalam gerombol 2. Jika terbentuk 3 gerombol
maka sebanyak 10 amatan masuk ke dalam gerombol 1, 37 amatan masuk ke
dalam gerombol 2 dan sebanyak 53 amatan menjadi anggota gerombol 3.
Selanjutnya untuk asumsi banyaknya gerombol 4 dan 5 dapat dilihat pada tabel.
Kajian Kinerja Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika
Konvergensi
Kemampuan dan performa analisis RLB dengan pendekatan AG dilihat
berdasarkan nilai R2adj dan kesalahan penggerombolan. Penentuan banyaknya
gerombol yang terbentuk diperoleh dari nilai R2adj maksimum antar asumsi
banyaknya gerombol. Gerombol yang menghasilkan nilai paling tinggi maka
gerombol tersebutlah yang dianggap sebagai gerombol optimum. Seperti yang
sudah dijelaskan di awal, AG akan mencari solusi terbaik dengan memilih
individu-individu yang memiliki nilai kesuaian terbaik. Setiap generasi yang
dihasilkan akan memiliki nilai kesuaian maksimum yang lebih baik atau sama
dengan nilai kesuaian maksimum generasi sebelumnya. Nilai kesuaian atau R2adj
akan mempunyai pola meningkat pada setiap generasinya.
Gambar 4 menunjukkan performa dari analisis RLB denggan pendekatan
AG yang dilihat berdasarkan peningkatan nilai R2adj tiap iterasi pada data
berukuran kecil. Analisis ini menghasilkan R2adj yang sangat kecil di iterasi awal
dan terus meningkat pada iterasi-iterasi berikutnya. Seperti terlihat pada Gambar
4, analisis ini mampu mencapai konvergen karena selisih nilai maksimum dan
minimum R2adj dari g = 15 individu terpilih kurang dari α. Pada data berukuran
sedang dapat mencapai konvergen dengan iterasi yang lebih banyak dibandingkan
dengan jumlah iterasi pada data berukuran kecil. Pada data berukuran besar masih
sulit untuk mencapai konvergensi sehingga program baru akan berhenti setelah
mencapai iterasi maksimum, yaitu hingga 2000 iterasi. Walau demikian, pola nilai
R2adj terus meningkat.
Gambar 4 Performa RLB dengan pendekatan AG
12
Tabel 4 Nilai R2adj*
Data
1
2
3
Dua gerombol (%)
99.08
99.91
98.46
Tiga gerombol (%)
99.79
99.79
97.24
Kemampuan Mendeteksi Gerombol dan Menduga Parameter Regresi
Evaluasi RLB dengan pendekatan AG dilakukan pada data bangkitan mulai
dari 2 sampai dengan 5 gerombol. Analisis RLB pada data bangkitan yang sudah
diketahui gerombolnya menghasilkan nilai R2adj*. Namun pada kenyataannya ini
tidak pernah diketahui sebelumnya. Nilai R2adj* dari masing-masing data ditunjukkan pada Tabel 4 dengan R2adj* pada data 1, data 2, dan data 3 dengan 2 gerombol
masing-masing adalah 99.08%, 99.91%, dan 98.46%.
Selanjutnya pada Tabel 5 disajikan ringkasan nilai R2adj dugaan dari 30
ulangan untuk masing-masing data. Pada data 1, jika diasumsikan terbentuk 2
gerombol maka diperoleh nilai minimum sebesar 83.89%, median sebesar 88.53%
dan maksimumnya sebesar 99.08% (dengan regresi klasik hanya 46.91%). Nilai
maksimum R2adj jika diasumsikan terbentuk 2 gerombol sudah sesuai dengan nilai
R2adj* pada data 1 dengan 2 gerombol dan jika diasumsikan terbentuk 5 gerombol
maka nilai minimumnya sebesar 95.22%, median sebesar 99.46%, dan maksimum
sebesar 99.77%. Semakin besar asumsi banyaknya gerombol terlihat nilai
maksimumnya semakin tinggi.
Pada data 2, analisis ini menghasilkan nilai R2adj minimum sebesar 72.81%,
median sebesar 98.42%, dan nilai maksimum sebesar 99.91% dengan asumsi
tebentuk 2 gerombol. Karena nilai R2adj* dari data 2 adalah 99.91%, maka metode
ini juga mampu mencapai nilai optimum. Jika diasumsikan terbentuk 5 gerombol
maka diperoleh nilai minimum sebesar 99.91%, median sebesar 99.96%, dan
Tabel 5 Nilai R2adj tertinggi dari 30 ulangan pada data dengan 2 gerombol
Data
1
2
3
Asumsi banyaknya
gerombol
2
3
4
5
2
3
4
5
2
3
4
5
Minimum
(%)
83.89
90.61
93.81
95.22
72.81
89.78
99.84
99.91
76.55
98.77
98.76
99.30
Median Maksimum
(%)
(%)
88.53
99.08
99.16
99.40
99.36
99.67
99.46
99.77
98.42
99.91
99.92
99.94
99.93
99.97
99.96
99.98
98.50
98.50
98.91
99.04
99.40
99.49
99.52
99.64
13
maksimum sebesar 99.98%. Selanjutnya, pada data 3 dengan asumsi terbentuk 2
gerombol menghasilkan nilai minimum sebesar 76.55%, median sebesar 98.50%,
dan nilai maksimum sebesar 98.50%. Pada data ini analisis RLB dengan
pendekatan AG juga mampu mencapai nilai optimum karena nilai R2adj*-nya
adalah 98.46%. Jika diasumsikan terbentuk 5 gerombol maka nilai minimum
sebesar 99.30%, median sebesar 99.52%, dan maksimum sebesar 99.64%.
Berdasarkan hasil dari data-data tersebut terlihat pola nilai R2adj yang sama, yaitu
nilainya akan semakin tinggi seiring besarnya asumsi banyaknya gerombol.
Walau demikian, analisis ini sudah mampu memperoleh nilai R2adj yang
mendekati R2adj* dari masing-masing data. Hal tersebut dapat dilihat dari nilai
maksimum untuk gerombol yang terbentuk sebanyak 2 gerombol.
Banyaknya gerombol yang sesuai dengan data bangkitan diharapkan
mempunyai nilai R2adj paling tinggi atau selalu berada pada urutan paling atas jika
diurutkan berdasarkan nilai R2adj. Tabel 6 menampilkan urutan gerombol hasil
pendugaan dari 30 kali ulangan pada data bangkitan dengan 2 gerombol. Pada
data 1, jika diprediksi terbentuk 2 gerombol maka hasilnya menempati urutan
terakhir sebanyak 19 kali dan tidak memiliki nilai R2adj paling tinggi, sedangkan
jika terbentuk 5 gerombol hasilnya menempati urutan teratas sebanyak 21 kali.
Dengan kata lain, jika diasumsikan ada 2 gerombol hasilnya hampir selalu berada
pada urutan terakhir atau nilai R2adj paling kecil. Pola urutan yang terlihat dari 30
ulangan tersebut menunjukkan semakin banyak gerombol yang diduga akan
menghasilkan nilai R2adj dugaan yang semakin tinggi pula seperti yang
diperlihatkan pada Tabel 5.
Kemampuan analisis RLB dengan pendekatan AG membentuk gerombol
pada data sudah cukup baik. Pada data 1 dengan asumsi terbentuk 2 gerombol dan
nilai R2adj yang paling tinggi, tidak ada kesalahan penggerombolan data yang
dapat dilihat di Lampiran 3. Pada data tersebut terdapat 55 amatan yang termasuk
ke dalam gerombol 1 dan 45 amatan yang termasuk ke dalam gerombol 2. Hasil
pendugaan juga menunjukkan jumlah yang sama, yaitu 55 amatan untuk gerombol
1 dan 45 amatan untuk gerombol 2. Hal ini menunjukkan penggerombol sudah
sesuai dengan gerombol yang ada pada data. Sama halnya untuk data 2 yang dapat
Tabel 6 Hasil pendugaan gerombol optimal berdasarkan urutan
Data
1
2
3
Urutan
(ke-)
1
2
3
4
1
2
3
4
1
2
3
4
Asumsi banyaknya gerombol
2
3
4
5
0
2
7
21
2
5
17
6
9
16
3
2
19
7
3
1
0
3
5
22
0
5
20
5
4
19
4
3
26
3
1
0
0
0
7
23
0
1
22
7
0
29
1
0
30
0
0
0
14
dilihat di Lampiran 4. Penggerombolan amatan pada data 3 terjadi kesalahan
penggerombolan amatan jika diasumsikan ada 2 gerombol. Dari 55 amatan yang
sebenarnya termasuk gerombol 1, ada 1 amatan yang dimasukkan ke dalam
gerombol 2. Dari 45 amatan yang termasuk gerombol 2, 2 diantaranya
dimasukkan ke dalam gerombol 1 seperti disajikan pada Lampiran 5. Berdasarkan
Lampiran 1 terlihat sebaran data antara peubah Y dan X2 untuk data 3 membentuk
perpotongan jika dibuat garis regresi. Hal ini yang menyebabkan terjadi kesalahan
penggerombolan. Karena AG bersifat stokastik maka hasilnya dapat berbeda
untuk setiap kali menjalankan program tersebut.
Pendugaan parameter dengan analisis regresi linier klasik dan RLB dengan
pendekatan AG dilakukan untuk masing-masing 500 data yang berbeda. Hasil
pendugaan parameter menggunakan regresi klasik pada data dengan 2 gerombol
disajikan pada Tabel 7. Hasil pendugaan pada data 1 menunjukkan rata-rata nilai
R2adj sebesar 54.66% yang dapat dikatakan sangat kecil untuk ukuran kebaikan
suatu model. Karena parameter yang digunakan untuk membangkitkan data terdiri
atas 2 gerombol sehingga b0 hasil dugaan dan parameternya berbias. Namun pada
data ini pendugaan dengan regresi klasik menghasilkan b1 dan b2 yang mendekati
parameternya karena bentuk hubungan linier antara gerombol 1 dan 2 adalah
sejajar. Dilihat dari besarnya nilai b0 yang diperoleh, diperkirakan jika dibuat garis
regresi maka garis tersebut akan berada di antara gerombol 1 dan 2.
Kebaikan persamaan regresi hasil pendugaan menggunakan regresi klasik
pada data 2 rata-ratanya adalah 5.55% yang jauh lebih kecil dibandingkan nilai
R2adj dari data 1. Hal tersebut karena bentuk hubungan linier antara peubah Y dan
X tidak sejajar dan juga menyebabkan koefisien regresi berbeda cukup jauh dari
parameternya. Jika dibuat garis regresi seperti pada data 1 di atas maka garis
tersebut juga akan berada di antara gerombol 1 dan 2. Pada data 3 rata-rata nilai
R2adj lebih besar dibandingkan dengan hasil pendugaan pada data 2 namun masih
termasuk nilai yang sangat kecil untuk ukuran kebaikan suatu model. Nilai
Tabel 7 Pendugaan parameter data dengan 2 gerombol (regresi linier klasik)
Data
1
2
3
Statistik
b0
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
104.64
358.15
155.80
6.50
-39.32
1363.66
5.58
1.25
807.45
371.96
1150.80
6.50
b1
b2
-7.53 18.77
7.27
1.78
-7.65 18.76
-7.65 18.76
-2.67 16.82
28.01
6.70
-2.65
8.76
-5.72 35.65
-7.09 -7.22
7.56
1.61
-7.65 -18.76
-5.72 19.65
R2adj
(%)
54.66
5.30
5.55
4.49
14.66
6.70
15
parameter dugaan yang diperoleh dari analisis regresi klasik pada data ini juga
berbias karena parameter yang digunakan untuk membangkitkan terdiri atas 2
gerombol. Nilai b1 dan b2 negatif yang menandakan bahwa hubungan linier antara
Y dengan X1 dan X2 negatif, padahal bentuk hubungan linier antara Y dan X2
adalah positif.
Selanjutnya, hasil pendugaan parameter menggunakan analisis RLB dengan
pendekatan AG disajikan pada Tabel 8 yang menunjukkan hasil yang diperoleh
dari data dengan 2 gerombol. Rata-rata nilai ukuran kebaikan model pada data 1,
baik untuk masing-masing gerombol maupun secara keseluruhan, sangat tinggi
dibandingkan dengan hasil yang diperoleh dari analisis regresi linier klasik. Ratarata nilai b0 yang dihasilkan masih cukup jauh berbeda dengan parameternya yang
menandakan bahwa nilainya tidak kekar. Namun untuk nilai b1 dan b2 yang
dihasilkan sudah cukup baik karena mendekati parameternya. Hasil serupa juga
diperoleh pada data 2 yang menghasilkan rata-rata R2adj tinggi dan koefisien
regresi yang mendekati parameternya. Nilai b0 yang diperoleh dari data-data ini
berbeda jauh dengan parameternya, tapi nilai b1 dan b2 sudah mendekati parameternya. Rata-rata R2adj juga sangat tinggi dibandingkan dengan hasil yang
diperoleh dari analisis regresi linier klasik yang hanya memiliki rata-rata sebesar
14.66%. Hasil pendugaan parameter dengan analisis ini terhadap data 3
menghasilkan nilai b0, b1, dan b2 yang sudah mendekati parameternya. Nilai R2adj
secara keseluruhan dan masing-masing gerombol juga sangat tinggi. Nilai galat
baku dari Tabel 8 lebih kecil dan parameter dugaan untuk data-data tersebut juga
lebih dekat dibandingkan dengan hasil regresi linier klasik. Berdasarkan hasil
Tabel 8 Pendugaan parameter data dengan 2 gerombol (RLB-AG)
Gerombol 1
Data
1
2
3
Statistik
Gerombol 2
2
b0
Rata-rata
157.71
Galat baku
18.97
Rata-rata
R2adj (%)
Parameter
155.80
gerombol
Rata-rata
9.17
Galat baku
37.54
Rata-rata
R2adj (%)
Parameter
5.58
gerombol
Rata-rata
1150.00
Galat baku
18.15
Rata-rata
R2adj(%)
Parameter
1150.80
gerombol
b1
-7.69
0.40
R adj
(%)
18.77 99.90
0.11 0.02
b2
b0
13.36
31.28
R2adj
(%)
-7.79 18.76 99.90
0.65 0.15 0.02
b1
b2
99.90
-7.65
-2.71
0.67
18.76
6.50
8.73 99.96 -10.69
0.23 0.39 154.68
-7.65 18.76
-5.63 35.91 99.88
1.45 3.08 1.26
99.92
-2.65
-7.64
0.37
8.76
1.25
-18.75 99.83
0.09 0.03
8.27
34.00
-5.72 35.65
-5.76 19.65 99.83
0.69 0.15 0.03
99.83
-7.65
-18.76
6.50
-5.72 19.65
16
Tabel 9 Pendugaan gerombol optimal berdasarkan urutan pada data 1 dengan
3 gerombol
Urutan
(ke-)
1
2
3
4
Asumsi banyaknya gerombol
2
3
4
5
0
3
7
20
0
3
19
8
6
18
4
2
24
6
0
0
tersebut, analisis RLB dengan pendekatan AG mampu menghasilkan pendugaan
parameter yang lebih baik pada data bergerombol dibandingkan dengan analisis
regresi linier klasik.
Hasil yang diperoleh dari 30 ulangan analisis RLB dengan pendekatan AG
pada data dengan 3 gerombol tidak jauh berbeda dari pola yang diperoleh pada
data dengan 2 gerombol. Pada Tabel 9 disajikan urutan gerombol berdasarkan
nilai R2adj untuk data 1. Hasil tersebut menunjukkan semakin besar asumsi
banyaknya gerombol akan menghasilkan R2adj yang lebih tinggi, sehingga gerombol 3 sebagian besar berada pada urutan ke-3. Pola ini masih sama dengan pola
yang diperoleh dari data dengan 2 gerombol (Tabel 6). Penggunaan R2adj sebagai
fungsi kesuaian belum mampu memberikan hasil penentuan gerombol optimum
dengan baik.
Pendugaan parameter pada data dengan 3 gerombol menggunakan regresi
linier klasik disajikan pada Tabel 10. Sama halnya dengan Tabel 7, untuk data 1
menunjukkan bahwa nilai b1 dan b2 mampu mendekati parameternya karena
bentuk hubungan linier antar gerombol adalah sejajar (Lampiran 2). Namun nilai
b0 tidak mampu diduga dengan baik sehingga hasilnya berbias dan nilai R2adj yang
diperoleh juga sangat kecil. Parameter dugaan dari data 2 menggunakan analisis
regresi linier klasik terlihat jauh berbeda dengan parameternya. Pendugaan
parameter pada data seperti ini terlihat tidak efektif karena selain dugaan
parameternya yang jauh menyimpang, ukuran kebaikan modelnya juga sangat
kecil. Selain itu, b2 bernilai positif padahal ada satu model yang memiliki nilai
negatif. Hasil pada data 3 juga mempunyai parameter dugaan yang jauh menyimpang dari parameternya dan nilai R2adj yang sangat kecil jika menggunakan
analisis regresi linier klasik. Nilai b1 dan b2 keduanya bernilai positif padahal ada
parameter yang keduanya positif, keduanya negatif dan ada juga model dengan b 1
negatif dan b2 positif. Berdasarkan hasil tersebut ternyata pendugaan analisis
regresi linier pada data bergerombol menghasilkan parameter yang berbias dan
nilai R2adj yang sangat kecil.
Pendugaan parameter menggunakan analisis RLB dengan pendekatan AG
pada data dengan 3 gerombol disajikan pada Tabel 11. Hasil untuk analisis pada
data 1 memperlihatkan bahwa parameter dugaan sudah mendekati parameter yang
digunakan untuk membangkitkan data, dan simpangannya juga cukup kecil dan
nilai R2adj yang diperoleh juga cukup tinggi. Jika dibandingkan dengan hasil yang
diperoleh dari analisis regresi klasik parameter dugaan yang diperoleh juga lebih
baik dan nilai R2adj yang jauh lebih tinggi, tapi simpangan untuk b0 masih cukup
tinggi. Hasil pendugaan parameter pada data 2 juga menunjukkan parameter
17
Tabel 10 Pendugaan parameter data dengan 3 gerombol (regresi linier klasik)
Data
1
2
3
Statistik
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Parameter gerombol 3
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Parameter gerombol 3
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Parameter gerombol 3
b0
307.28
1111.06
515.80
209.00
1.50
324.40
294.57
105.80
15.80
1186.50
-190.02
1136.80
0.80
-19.00
-16.50
b1
b2
R2adj(%)
5.11 19.62
12.17
22.89
5.27
6.17
5.65 19.65
5.65 19.65
5.65 19.65
-0.10
2.49
2.69
5.99
1.48
3.66
1.76
8.76
1.76
8.76
-7.57 -16.96
2.87
3.83
0.36
23.36
5.34
2.35
-1.76 12.88
-1.26 -5.76
0.57
3.96
dugaan yang sudah cukup mendekati parameter yang digunakan untuk membangkitkan data. Nilai R2adj yang dihasilkan juga sangat tinggi baik untuk masingmasing gerombol maupun secara keseluruhan.
Selanjutnya untuk pendugaan parameter pada data 3 menghasilkan pendugaan yang juga cukup baik. Hasil parameter dugaan yang diperoleh sudah mendekati
parameternya dan nilai R2adj yang sangat tinggi untuk masing-masing gerombol
ataupun secara keseluruhan. Jika dibandingkan dengan hasil yang diperoleh dari
analisis regresi linier klasik, hasil dari analisis RLB dengan pendekatan AG lebih
baik dalam pendugaan parameter dan model yang dihasilkan juga memiliki
ukuran kebaikan yang tinggi untuk data bergerombol. Penggunaan analisis RLB
dengan pendekatan AG pada data seperti ini juga menghasilkan pendugaan
parameter yang lebih baik dibandingkan dengan analisis regresi linier klasik.
Namun galat baku yang diperoleh untuk semua b0 sangat besar. Hal ini menunjukkan bahwa nilai pendugaan b0 tidak bersifat kekar (robust), sedangkan nilai b1 dan
b2 galat bakunya cukup kecil.
Waktu Proses
Waktu yang dibutuhkan untuk memproses data dengan 100 amatan, 2
peubah bebas dan asumsi gerombol antara 2 sampai 5 gerombol adalah sekitar 1
menit. Software yang digunakan adalah SAS versi 9.2 pada komputer personal
dengan spesifikasi prosesor 2.0 GHz, RAM 2 GB dan sistem operasi Microsoft
Windows 7 Ultimate 32-bit. Semakin banyak asumsi gerombol yang dicobakan
maka waktu yang dibutuhkan pun semakin lama. Begitupun halnya jika amatan
atau peubah bebas lebih banyak.
18
Tabel 11 Pendugaan parameter data dengan 3 gerombol (RLB-AG)
Gerombol 1
Data
Statistik
1
Rata-rata
Galat baku
Rata-rata
R2adj (%)
Parameter
gerombol
Rata-rata
Galat baku
Rata-rata
R2adj (%)
Parameter
gerombol
Rata-rata
Galat baku
Rata-rata
R2adj (%)
Parameter
gerombol
2
3
b0
514.33
109.19
b1
b2
6.25 18.44
4.78 7.08
Gerombol 2
R2adj
b0
b1
b2
(%)
97.28 267.41 5.82 17.09
1.94 1196.52 28.14 26.47
Gerombol 3
R2adj
(%)
93.79
5.25
b0
b1
0.43
90.76
6.10
5.34
R2adj
(%)
19.89 96.02
10.49 4.21
1.50
5.65
19.65
b2
95.67
515.80
5.65 19.65
0.44 -2.83 13.59
875.43 18.96 12.25
209.00
96.22
4.87
-20.24
184.19
5.65 19.65
-0.74
4.21
-5.34
7.09
98.58
1.96
-24.60 0.27
466.25 11.93
4.00 98.56
13.88 2.86
97.86
0.80
121.38
281.97
-1.76 12.88
1.34
3.24
8.45
7.77
95.94
5.08
-19.00
-1.26
-5.76
-16.50
0.57
3.96
16.20
427.17
3.01
8.34
7.74
9.22
93.65 1204.99
4.83 105.15
-9.76
6.02
-12.89 98.47
7.31 3.05
1186.50
-7.57
-16.96
94.53
105.80
1.77
8.76
15.80
1.77
8.76
19
Diskusi
Dari segi waktu, analisis RLB dengan pendekatan AG ini mampu menghasilkan solusi terbaik dalam yang waktu relatif singkat. Penerapan program pada
data berukuran kecil membutuhkan waktu sekitar 1 menit hingga proses selesai.
Namun, jika diterapkan pada data besar maka dibutuhkan waktu yang lebih lama.
Pada data berukuran sedang dibutuhkan waktu sekitar 1 jam untuk melakukan
analisis ini hingga selesai, sedangkan pada data berukuran besar dibutuhkan waktu
lebih dari 5 jam tetapi tidak mencapai konvergen. Nopiah et al. (2010)
menyatakan bahwa kompleksitas waktu proses dari AG adalah linier terhadap
banyaknya iterasi atau generasi.
Analisis RLB dengan pendekatan AG menggunakan program SAS/IML,
SAS/Base, dan SAS Macro mampu menghasilkan solusi terbaik. Namun, dalam
praktiknya dibutuhkan beberapa kali ulangan untuk memeroleh hasil terbaik. Jika
hanya dilakukan satu kali ulangan maka hasil yang diperoleh mungkin bukan
solusi optimal. Nugroho (2008) tentang pencarian jalur alternatif menyatakan
bahwa penggunaan bilangan acak pada AG menyebabkan beberapa kali pencarian
tidak menghasilkan solusi optimal. Oleh sebab itu, diperlukan beberapa kali
ulangan untuk mendapatkan solusi optimum. Program yang digunakan untuk
analisis RLB dengan pendekatan AG ini masih mempunyai keterbatasan.
Beberapa diantaranya adalah penentuan besarnya peluang mutasi, banyaknya
peubah penjelas, banyaknya asumsi gerombol yang dicobakan, fungsi kesuaian
yang berpengaruh terhadap hasil penentuan gerombol optimum, dan banyaknya
amatan.
SIMPULAN DAN SARAN
Simpulan
Berdasarkan hasil yang diperoleh, kemampuan analisis RLB dengan pendekatan AG dapat dikatakan sudah baik karena analisis ini mampu mencari nilai
R2adj yang terus meningkat setiap iterasi dan mendekati nilai R2adj*. Bahkan
dengan asumsi banyaknya gerombol yang semakin besar, nilai R2adj juga semakin
tinggi. Akan tetapi hal ini menyebabkan analisis ini belum mampu menduga
banyaknya gerombol optimum yang terbentuk pada data dengan baik. Kriteria
yang digunakan sebagai fungsi kesuaian, yaitu R2adj ternyata belum mampu
menentukan gerombol optimum yang sesuai dengan yang diharapkan. Namun jika
dibandingkan dengan analisis regresi linier klasik tanpa memerhatikan gerombol,
analisis ini mampu memberikan hasil yang jauh lebih baik. Analisis ini juga
mampu memberikan hasil penggerombolan dengan baik. Pada asumsi banyaknya
gerombol dan nilai R2adj yang sesuai dengan data yang dibangkitkan, semua
amatan digerombolkan dengan tepat. Pada data 3 ada perpotongan garis regresi
sehingga dapat terjadi kesalahan penggerombolan di sekitar titik perpotongan
tersebut.
20
Saran
Pada penelitian selanjutnya dibutuhkan penerapan teknik atau metode lain
untuk mengetahui banyaknya gerombol optimum. Misalnya fungsi kesuaian yang
digunakan adalah A = R2adj – P, dengan P adalah sebuah nilai penalti yang lebih
besar dari 0 jika gerombol yang diasumsikan tidak sesuai. Banyaknya asumsi
gerombol yang dicobakan juga dapat ditambah. Inisialisasi populasi awal dapat
menggunakan teknik atau metode lain sehingga waktu proses metode ini akan
lebih cepat. Program untuk analisis RLB dengan pendekatan AG disusun
menggunakan SAS/Base, SAS/IML, dan SAS Macro. Program tersebut dapat
dilihat di http://bit.ly/CLRwGA.
DAFTAR PUSTAKA
Angga K, Lestari J. 2012. Penerapan Algoritma Genetik pada Proses Penyusunan
Kelompok Belajar di Sekolah. BIT. 9(1).
Antoniou A, Lu WS. 2007. Practical Optimization: Algorithms and Engineering
Applications. New York(US) : Springer.
Ari B, Guvernir HA. 2002. Clustered Linear Regression. Knowledge-Based
System. 15:169-175.
Barman K, Dabeer O. 2011. Clustered Regression with Unknown Cluster. arXiv.
1103.4480v1.
Haupt RL, Haupt SE. 2004. Practical Genetic Algoritms. Canada(US) : John
Wiley & Sons, Inc.
Liliana. 2006. Implementasi Algoritma Genetika untuk Desain Ruang dalam
Rumah. Seminar Nasional Sistem dan Informatika[Internet]. 2006 Nop 17. Bali
(ID);
[diunduh
2014
Feb
19].
Tersedia
pada:
https://yudiagusta.files.wordpress.com/2009/11/73-76-snsi06-12-implementasialgoritma-genetika-untuk-desain-ruang-dalam-rumah.pdf
Nopiah ZM, Khairir MI, Abdullah S, Baharin MN, Arifin A. 2010. Time
Complexity Analysis of the Genetic Algorithm Clustering Method. Proceeding
Recent Advances In Signal Processing, Robotics And Automation[Internet].
[Waktu dan tempat pertemuan tidak diketa
DENGAN PENDEKATAN ALGORITMA GENETIKA
AEP HIDAYATULOH
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Kajian Analisis Regresi
Linier Bergerombol dengan Pendekatan Algoritma Genetika adalah benar karya
saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk
apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau
dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah
disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir
skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Februari 2015
Aep Hidayatuloh
NIM G14090097
ABSTRAK
AEP HIDAYATULOH. Kajian Analisis Regresi Linier Bergerombol dengan
Pendekatan Algoritma Genetika. Dibimbing oleh AGUS MOHAMAD SOLEH
dan BAGUS SARTONO.
Analisis Regresi Linier Bergerombol (RLB) dengan pendekatan Algoritma
Genetika (AG) mampu mencari solusi terbaik pada data bergerombol berdasarkan
nilai adjusted R-square (R2adj), namun belum mampu mendeteksi jumlah
gerombol optimum yang terbentuk karena semakin besar asumsi banyaknya
gerombol maka nilai R2adj juga semakin tinggi. Analisis ini juga mampu
menggerombolkan suatu amatan dengan baik sehingga dapat meningkatkan
kemampuan analisis regresi linier. Jika dibandingkan dengan analisis regresi linier
klasik, analisis ini mampu menghasilkan parameter dugaan dan R2adj pada data
bergerombol yang lebih baik. Program untuk analisis RLB dengan pendekatan
AG dapat dilihat di http://bit.ly/CLRwGA.
Kata kunci: algoritma genetika, regresi linier bergerombol
ABSTRACT
AEP HIDAYATULOH. The Study of Clustered Linear Regression Analysis with
Genetic Algorithms Approach. Supervised by AGUS MOHAMAD SOLEH and
BAGUS SARTONO.
Clustered Linear Regression (CLR) analysis with Genetic Algorithms (GA)
approach is able to find solutions to the data clustering based on the adjusted Rsquare (R2adj) value, but have not been able to determine the optimum clusters
because of the larger number of clusters the R2adj value also higher. This analysis
is able to determine cluster for an observation so that it can improve the ability of
linear regression analysis. If compared to classical linear regression analysis, this
analysis is able to produce better estimation of parameters and R2adj value. CLR
analysis with GA approach program can be accessed at http://bit.ly/CLRwGA.
Keywords: clustered linear regression, genetic algorithms
KAJIAN ANALISIS REGRESI LINIER BERGEROMBOL
DENGAN PENDEKATAN ALGORITMA GENETIKA
AEP HIDAYATULOH
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika
pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2015
Judul Skripsi : Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika
Nama
: Aep Hidayatuloh
NIM
: G14090097
Disetujui oleh
Agus Mohamad Soleh, MT
Pembimbing I
Dr Bagus Sartono, MSi
Pembimbing II
Diketahui oleh
Dr Anang Kurnia, MSi
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan kepada Allaah Subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Karya ilmiah
ini diberi judul Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika.
Terima kasih penulis ucapkan kepada Bapak Agus Mohamad Soleh, MT
dan Bapak Dr Bagus Sartono, MSi selaku pembimbing yang telah bersabar dalam
memberikan nasihat kepada penulis.
Terima kasih juga kepada:
1. Seluruh Dosen dan Staf Departemen Statistika FMIPA IPB atas segala
bantuannya.
2. Bapak Harianto Tanudjaja dan seluruh staf PT Ganesha Cipta Informatika
yang telah membantu selama penulisan karya ilmiah ini.
3. Bapak, Ibu, Kakak dan adik-adikku yang selalu menjadi motivasi bagi
penulis, serta seluruh keluarga atas segala doa dan dukungannya.
4. Teman seperjuangan Syarif Amrulla, Linda Erijayanti, Mochammad
Fachrouzi Iskandar, Dyah Ayuning Pawestri, Muhammad Hafid, dan
seluruh teman-teman Statistika 46. Tidak lupa juga satu-satunya teman
sedaerah, Fatih Mulia Utama.
5. Seluruh pihak yang sudah memberikan dukungannya demi selesainya
penulisan karya ilmiah ini.
Penulis menyadari bahwa karya ilmiah ini masih belum sempurna. Demi
lebih sempurnanya karya ilmiah ini penulis mengharapkan saran dan kritik dari
pembaca. Semoga karya ilmiah ini dapat memberikan banyak manfaat.
Bogor, Februari 2015
Aep Hidayatuloh
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Tujuan Penelitian
2
TINJAUAN PUSTAKA
2
Algoritma Genetika
2
METODE
5
Data
5
Prosedur Analisis Data
6
HASIL DAN PEMBAHASAN
Ilustrasi Penerapan
9
9
Kajian Kinerja Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika
11
Diskusi
19
SIMPULAN DAN SARAN
19
Simpulan
19
Saran
20
DAFTAR PUSTAKA
20
LAMPIRAN
21
RIWAYAT HIDUP
26
DAFTAR TABEL
1
2
3
4
5
6
7
8
9
Parameter regresi data 2 gerombol
Parameter regresi data 3 gerombol
R2adj dan jumlah anggota gerombol hasil dugaan
Nilai R2adj*
Nilai R2adj tertinggi dari 30 ulangan pada data dengan 2 gerombol
Hasil pendugaan gerombol optimal berdasarkan urutan
Pendugaan parameter data dengan 2 gerombol (regresi linier klasik)
Pendugaan parameter data dengan 2 gerombol (RLB-AG)
Pendugaan gerombol optimal berdasarkan urutan pada data 1 dengan 3
gerombol
10 Pendugaan parameter data dengan 3 gerombol (regresi linier klasik)
11 Pendugaan parameter data dengan 3 gerombol (RLB-AG)
5
6
10
12
12
13
14
15
16
17
18
DAFTAR GAMBAR
1
2
3
4
Ilustrasi teknik pindah-silang dan mutasi
Bagan alir analisis RLB dengan pendekatan AG
Diagram pencar
Performa RLB dengan pendekatan AG
4
7
10
11
DAFTAR LAMPIRAN
1
2
3
4
5
Sebaran data pada data dengan 2 gerombol
Sebaran data pada data dengan 3 gerombol
Jumlah anggota gerombol hasil penggerombolan pada data 1
Jumlah anggota gerombol hasil penggerombolan pada data 2
Jumlah anggota gerombol hasil penggerombolan pada data 3
21
22
23
24
25
PENDAHULUAN
Latar Belakang
Data yang diperoleh pada suatu penelitian sering kali berasal dari satu
populasi yang sama namun tidak sepenuhnya dapat digambarkan hanya dengan
satu model. Data tersebut sebenarnya terdiri dari beberapa subpopulasi atau
gerombol dan masing-masing memiliki model regresi yang berbeda. Data seperti
ini akan menghasilkan model yang tidak efektif jika menggunakan analisis regresi
linier klasik dengan menggunakan pendugaan Metode Kuadrat Terkecil (MKT)
untuk melihat hubungan antara peubah respon dan peubah penjelas. Permasalahan
lain yang terjadi pada data seperti ini adalah tidak diketahui banyaknya gerombol
yang terbentuk dan amatan atau objek yang termasuk dalam suatu gerombol juga
tidak diketahui. Permasalahan-permasalahan di atas memerlukan penanganan
khusus agar model yang dihasilkan oleh MKT lebih baik dalam menggambarkan
karakteristik data tersebut. Pendugaan parameter regresi linier dengan MKT
membutuhkan informasi tambahan, yaitu gerombol yang terbentuk pada data.
Oleh sebab itu, dibutuhkan solusi yang mampu menangani masalah regresi pada
kasus seperti ini.
Beberapa metode yang ada untuk analisis pada permasalahan tersebut antara
lain adalah pada penelitian Ari dan Guvernir (2002) menggunakan MARS, RSBF,
k-Nearest Neighborhood Regression (KNNR), dan Regresi Linier Bergerombol
(RLB), sedangkan yang digunakan pada penelitian Barman dan Dabeer (2011)
menggunakan Individual Regression (IR), Collective Regression (CR), Algoritma
EM, Algoritma K-rataan, Singular Value Thresholding, Metode Curds dan Whey,
dan Regresi Lokal (LoR). Berdasarkan penelitian terhadap beberapa algoritma
tersebut, Ari dan Guvernir (2002) menyatakan RLB memiliki hasil yang lebih
baik, sedangkan Barman dan Dabeer (2011) menyatakan LoR memiliki hasil
terbaik. RLB merupakan perluasan dari metode regresi linier klasik yang
membagi data menjadi beberapa subgugus data, sehingga dapat memberikan hasil
yang lebih akurat untuk fungsi regresi linier. Pendekatan ini juga mengeliminasi
permasalahan yang disebabkan oleh korelasi antar peubah penjelas yang sering
terjadi dalam dunia nyata (Ari dan Guvernir 2002). Pada penelitian ini dilakukan
analisis RLB dengan menggunakan pendekatan algoritma genetika.
Metode analisis RLB dengan pendekatan algoritma genetika digunakan
untuk memeroleh persamaan regresi sekaligus menggerombolkan amatan-amatan
ke dalam suatu gerombol. Hal tersebut dilakukan dengan mengoptimalkan nilai
fungsi kesuaian (fitness). Pada penelitian ini disusun program analisis RLB
dengan pendekatan algoritma genetika menggunakan SAS/IML, SAS/Base, dan
SAS Macro kemudian mengevaluasi kemampuan analisis tersebut pada data
berukuran kecil, sedang dan besar. Data yang digunakan pada penelitian ini adalah
data simulasi dengan banyaknya gerombol yang dibangkitkan adalah 2 dan 3
gerombol. Sebagai informasi, SAS/IML sebenarnya sudah mempunyai beberapa
program terkait algoritma genetika. Namun pada penelitian ini tidak
menggunakan program tersebut dan membuat program baru untuk lebih
mempermudah.
2
Tujuan Penelitian
Penelitian ini bertujuan memberikan metode alternatif dalam permasalahan
analisis regresi linier bergerombol. Hasil yang diharapkan dari penelitian ini
adalah:
1. Mengevaluasi kemampuan metode analisis regresi linier bergerombol
dengan pendekatan algoritma genetika.
2. Memberikan informasi jumlah gerombol dan penggerombolan amatan
yang terbentuk pada data.
3. Membentuk persamaan regresi linier yang mampu menggambarkan data
bergerombol dengan baik.
4. Mengukur keakuratan parameter regresi hasil dugaan dengan parameter
regresi aktual.
5. Menerapkan analisis pada data berukuran sedang dan besar.
TINJAUAN PUSTAKA
Algoritma Genetika
Antoniou dan Lu (2007) menyatakan proses optimasi adalah proses untuk
mendapatkan hasil terbaik. Umumnya hasil yang diinginkan adalah nilai maksimum atau minimum. Salah satu Algoritma yang saat ini sedang berkembang dan
mulai banyak diterapkan dalam menyelesaikan permasalahan optimasi adalah
Algoritma Genetika. Algoritma Genetika (AG) adalah sebuah teknik optimasi dan
pencarian solusi berdasarkan prinsip-prinsip genetika dan seleksi alam. AG
memungkinkan sebuah populasi terdiri dari banyak individu untuk berkembang
dibawah aturan seleksi tertentu menuju keadaan yang mengoptimumkan fungsi
fitness (misalnya meminimumkan fungsi biaya) (Haupt dan Haupt 2004). AG
diperkenalkan oleh John H. Holland pada tahun 1975. Prinsip dasar AG
mengadaptasi proses teori evolusi alam. Secara garis besar, proses evolusi yang
terjadi adalah seleksi dari populasi awal, pindah-silang (crossover), mutasi, dan
seleksi alam.
Proses seleksi alam yang terjadi melibatkan proses perubahan gen pada
individu-individu melalui proses perkembangbiakan sehingga menghasilkan keturunan terbaik. Setiap individu memiliki informasi penting yang telah dikodekan
dan dikenal sebagai kromosom. Individu yang baik akan menghasilkan keturunan
yang baik dan ukuran kebaikan suatu individu dilihat dari nilai kesuaian (fitness).
Nilai kesuaian diperoleh dari hasil evaluasi individu terhadap fungsi kesuaian
yang ingin dicari nilai optimumnya. AG juga sudah banyak digunakan pada
penelitian tentang optimasi dalam berbagai bidang, diantaranya adalah pada
penyusunan kelompok belajar (Angga dan Lestari 2012), untuk desain ruang
dalam rumah (Liliana 2006), dan tentang penyelesaian masalah transportasi
(Sarwadi dan Anjar 2004).
Beberapa istilah AG yang digunakan dalam penelitian ini.
Gen
: sebuah nilai yang memiliki informasi tertentu dan berperan
penting dalam proses pewarisan sifat dari individu kepada
keturunannya. Biasanya gen berupa bilangan biner atau
3
numerik. Dalam penelitian ini gen adalah bilangan
numerik yang menunjukkan gerombol.
Kromosom
: gabungan dari beberapa gen yang menggambarkan
karakteristik suatu individu.
Individu
: suatu nilai yang menyatakan solusi.
Keturunan
: individu baru hasil pindah-silang.
Populasi
: kumpulan individu yang akan diproses dalam siklus
evolusi untuk mencari solusi terbaik.
Fungsi kesuaian : fungsi yang akan dicari nilai optimumnya.
Nilai kesuaian
: menyatakan kebaikan suatu individu atau solusi yang
diperoleh dari fungsi kesuaian.
AG lebih sesuai untuk mencari solusi terbaik/optimum global dari kemungkinan
solusi yang berukuran besar atau masalah yang rumit. Pada masalah yang tidak
terlalu rumit, metode lain yang lebih sesuai mungkin dapat menemukan solusi
lebih cepat dibandingkan AG (Haupt dan Haupt 2004).
Operator-operator genetika yang terlibat dalam AG adalah
1. Inisialisasi Populasi.
Membentuk populasi awal yang dibutuhkan pada proses pencarian
solusi. Sivanandam dan Deepa (2008) menyatakan ada dua hal penting dari
populasi yang digunakan dalam AG, (1) inisial generasi populasi dan (2)
ukuran populasi. Dalam praktiknya, sekitar 100 individu dalam populasi sudah
cukup, tetapi ukurannya bisa berubah menyesuaikan dengan waktu dan
kemampuan komputasi yang digunakan. Populasi dapat dibangkitkan secara
acak, berdasarkan teori tertentu, atau menggunakan suatu metode. Aturan atau
batasan yang mengikat saat pembangkitan populasi harus benar-benar
diperhatikan. Pada penelitian ini populasi awal dibangkitan secara acak.
2. Seleksi
AG juga melakukan seleksi terhadap individu seperti seleksi alam.
Sebanyak g individu yang terpilih diharapkan adalah individu terbaik yang
akan dijadikan sebagai tetua pada tahapan pindah-silang. Tetua umumnya
dipilih berdasarkan nilai kesuaian, namun beberapa metode seleksi tidak
menggunakannya. Sivanandam dan Deepa (2008) menyebutkan ada beberapa
teknik seleksi yang dapat digunakan, diantaranya adalah
a. Seleksi acak
Individu dipilih secara acak dari populasi tanpa memerhatikan nilai
kesuaian.
b. Seleksi Peringkat
Individu diperingkatkan berdasarkan nilai kesuaian yang paling baik. Pada
kasus memaksimumkan suatu fungsi, individu yang memiliki nilai
kesuaian paling tinggi dipilih untuk diakukan pindah-silang.
c. Seleksi Roda Rolet
Seperti pada permainan Rolet, individu dipilih secara acak tetapi dengan
proporsi peluang yang berbanding lurus dengan besarnya nilai kesuaian.
Individu yang memiliki nilai kesuaian yang baik memiliki peluang yang
lebih tinggi.
4
d. Seleksi Turnamen
Beberapa individu (tiga atau empat) dipilih secara acak dari populasi.
Kemudian bandingkan nilai kesuaian. Individu dengan nilai kesuaian yang
paling tinggi dipilih untuk pindah-silang, sedangkan yang lain dikembalikan ke dalam populasi agar memiliki kemungkinan terambil lagi.
3. Pindah-silang
Pindah-silang adalah proses yang melibatkan 2 individu dari tetua yang
terpilih untuk menghasilkan individu atau keturunan baru yang disebut anak.
Dua tetua ditukarkan gen dalam kromosomnya. Cara penukaran gen seperti
penukaran unsur yang ada pada vektor. Beberapa teknik pindah-silang adalah :
a. Satu titik (Single point)
Masing-masing kromosom dipotong pada satu titik silang dengan panjang
yang sama. Kemudian bagian-bagian ini saling ditukarkan. Teknik pindahsilang inilah yang akan digunakan pada penelitian ini. Ilustrasinya seperti
Gambar 1(a).
b. Dua titik (Two/Double point)
Sama seperti pada teknik pindah-silang satu titik, tetapi menggunakan dua
titik silang. Masing-masing kromosom dipotong pada 2 titik silang dengan
panjang yang sama. Kemudian bagian-bagian ini saling ditukarkan seperti
Gambar 1(b).
c. Seragam (Uniform)
Teknik ini dilakukan dengan membangkitkan bilangan acak Seragam(0,1)
sesuai panjang kromosom dan nilainya dibulatkan. Misalnya jika nilai
bilangan acak adalah 1 maka gen ditukar, jika 0 gen tetap. Proses pindahsilang akan terlihat seperti Gambar 1(c).
(a) Teknik pindah-silang satu titik
(c) Teknik pindah-silang seragam
(b) Teknik pindah-silang dua titik
(d) Teknik mutasi
Gambar 1 Ilustrasi teknik pindah-silang dan mutasi
5
4. Mutasi
Mutasi diperlukan untuk menjaga agar solusi yang diperoleh bersifat
lebih luas. Tingkat terjadinya mutasi ini umumnya sangat kecil, yaitu sekitar
1% atau kurang. Mutasi tidak bisa diatur terlalu besar karena perubahan dari
generasi ke generasi akan seperti langkah acak dan akan terlalu lama mencapai
konvergensi (Sartono 2010). Proses mutasi dilakukan dengan mengganti
beberapa gen, misalnya 1 diganti dengan 2 dan sebagainya. Gambar 1(d)
memberikan ilustrasi teknik mutasi tersebut.
METODE
Data
Data yang digunakan pada penelititan ini adalah hasil pembangkitan.
Ukuran data dibagi 3, yaitu data berukuran kecil (100 amatan), sedang (1000
amatan) dan besar (5000 amatan) (Barman dan Dabeer 2011). Data yang
digunakan pada simulasi terdiri atas 2 dan 3 gerombol dengan bentuk hubungan
linier antara peubah X dan Y pada masing-masing gerombol berbeda satu dengan
yang lainnya. Percobaan dilakukan pada data rekaan dengan 2 peubah penjelas
yang dibangkitkan dengan persamaan berikut.
X1 = 50 – 3.275 θ dan X2 = 20 + 14 θ,
dengan θ~Seragam(0,1). εodel untuk masing-masing gerombol ke-i adalah
Yi = β0i + β1i X1 + β2i X2 + , i = 1, 2, .., c,
dengan c adalah banyaknya gerombol, sedangkan ~N(μ=0, σ2=10). Tabel 1 dan
Tabel 2 menunjukkan parameter yang digunakan untuk mambangkitkan data
simulasi.
Tabel 1 menunjukkan parameter regresi yang digunakan untuk membangkitkan data dengan gerombol sebanyak 2. Perbedaan antara data 1, data 2, dan data 3
adalah bentuk hubungan linier antara peubah X1 dan X2 dengan Y. Data 1
Tabel 1 Parameter regresi data 2 gerombol
Data
1
2
3
Gerombol
1
2
1
2
1
2
Parameter
β0
β1
β2
155.80
-7.65
18.76
6.50
-7.65
18.76
5.58
-2.65
8.76
1.25
-5.72
35.65
1150.80
-7.65 -18.76
6.50
-5.72
19.65
6
Tabel 2 Parameter regresi data 3 gerombol
Data
1
2
3
Gerombol
1
2
3
1
2
3
1
2
3
Parameter
β0
β1
515.80
5.65
209.00
5.65
1.50
5.65
0.80 -1.76
-19.00 -1.26
-16.50
0.57
105.80
1.77
15.80
1.77
1186.50 -7.57
β2
19.65
19.65
19.65
12.88
-5.76
3.96
8.76
8.76
-16.96
mempunyai bentuk hubungan linier positif. Antara gerombol 1 dan 2 membentuk
pola linier sejajar yang ditunjukkan oleh β1 yang bernilai negatif dan β2 yang
bernilai positif dengan nilai yang sama untuk masing-masing gerombol. Namun
karena nilai β0 untuk gerombol 1 dan 2 berbeda maka bentuk pola hubungan
liniernya sejajar tapi tidak berhimpit. Data 2 juga mempunyai bentuk hubungan
linier positif antara peubah X1 dan X2 dengan Y. Pola yang terbentuk antara
gerombol 1 dan 2 tidak sejajar yang terlihat dari nilai β1 yang bernilai negatif dan
β2 yang bernilai positif tapi tidak sama untuk masing-masing gerombol.
Perbedaan parameter tersebut menyebabkan kemiringan pada pola hubungan
linier masing-masing gerombol berbeda sehingga bentuk hubungan linier antara
peubah X2 dan Y pada gerombol 1 lebih landai dibandingkan dengan gerombol 2.
Selanjutnya data 3 mempunyai bentuk hubungan linier anatara peubah X1 dan X2
dengan Y yang berbeda untuk masing-masing gerombol. Plot antara Y dengan X1
dan X2 untuk masing-masing data dengan 2 gerombol dapat dilihat di Lampiran 1.
Parameter regresi yang digunakan untuk membangkitkan data dengan 3
gerombol ditunjukkan pada Tabel 2. Bentuk hubungan linier antara peubah X1 dan
X2 dengan Y pada data 1 sejajar antar gerombol yang dapat dilihat berdasarkan β1
dan β2 yang bernilai sama. Pada data 2, masing-masing gerombol mempunyai
kemiringan yang berbeda. Gerombol pertama cukup miring, satu gerombol lagi
lebih landai, sedangkan gerombol lainnya mempunyai bentuk hubungan linier
negatif antara peubah X2 dan Y. Data 3 mempunyai 2 gerombol dengan bentuk
hubungan linier antara peubah X2 dan Y yang sejajar. Satu gerombol lainnya
mempunyai bentuk hubungan linier negatif antara peubah X2 dan Y. Plot antara Y
dengan X1 dan X2 untuk masing-masing data dengan gerombol sebanyak 3 dapat
dilihat di Lampiran 1.
Prosedur Analisis Data
Analisis regresi linier bergerombol (RLB) dengan pendekatan AG adalah
sebuah metode yang meningkatkan keakuratan dari regresi linier klasik dengan
membagi sebuah gugus data ke dalam beberapa subgugus data. Metode ini
7
Gambar 2 Bagan alir analisis RLB dengan pendekatan AG
merupakan integrasi antara analisis regresi linier dan analisis gerombol. Prosedur
analisis yang digunakan pada penelitian ini dibagi menjadi 2 bagian, yaitu
penyusunan program menggunakan SAS/IML, SAS/Base, SAS/Graph, dan SAS
Macro yang dievaluasi berdasarkan data berukuran kecil dan penerapan pada data
sedang dan besar. Pada bagian pendugaan banyaknya gerombol optimum
penggerombolan amatan dilakukan masing-masing 30 ulangan pada data yang
sama dan pada pendugaan parameter dilakukan 500 ulangan dengan data yang
berbeda-beda. Proses analisis RLB dengan pendekatan AG dapat dilihat pada
Gambar 2 untuk 1 kali ulangan. Penjelasan detail prosesnya adalah sebagai
berikut.
1. Menenentukan asumsi banyaknya gerombol.
Penentuan banyaknya gerombol yang digunakan pada penelitian ini adalah 2
sampai 5 gerombol. Hal ini karena diduga banyaknya gerombol yang
terbentuk berada diantara nilai tersebut.
8
2. Menginisialisasi populasi awal.
Populasi awal dibangkitkan secara acak sebanyak 210 individu dengan
pembangkitan dari sebaran Seragam(1, c), dengan c adalah asumsi banyaknya
gerombol.
3. Menghitung nilai kesuaian.
Misalnya terdapat satu gugus data yang terdiri dari n amatan, peubah
respon Y dan peubah penjelas X. Jika pada data tersebut terbentuk c gerombol
maka gen yang terbentuk berupa bilangan numerik 1, 2, 3 sampai c.
Kromosom yang dalam kasus ini sekaligus sebagai individu yang terbentuk
berupa sebuah vektor yang mempunyai n unsur. Unsur-unsur vektor tersebut
adalah kode gerombol. Jika unsur pertama mempunyai gen 1 maka amatan
pada data tersebut termasuk anggota gerombol 1, gen 2 menunjukkan amatan
termasuk gerombol 2, dan seterusnya hingga gen c menunjukkan amatan
termasuk ke dalam gerombol ke-c. Individu tersebut pada analisis ini diperlakukan seperti peubah kategorik. Pada analisis regresi linier, jika sebuah
peubah berkategori (nominal atau ordinal) maka perlu diubah menjadi satu
atau beberapa peubah boneka, dalam kasus ini akan terbentuk sebanyak c - 1.
Sebagai ilustrasi, misalnya ada data dengan satu peubah respon Y, 2
peubah penjelas X1 dan X2, 100 amatan, serta banyaknya gerombol c = 3. Jika
S adalah peubah boneka maka akan ada 3 – 1 = 2 peubah boneka, yaitu S1 dan
S2. Koromosom akan terdiri dari 100 gen sebagai kode gerombol untuk
masing-masing amatan, yaitu 1, 2, dan 3. Nilai kesuaian untuk data seperti
diatas diperoleh dengan menghitung nilai R2adj dari model yang digunakan
dalam RLB dengan pendekatan AG, yaitu
Y = β0 + β1X1 + β2X2 +
1S1
+
2S2
+
3S1X1
+
4S1X2
+
5S2X1
+
6S2X2
+
dengan:
(S1, S2) =
(0, 0) untuk gerombol 1
(1, 0) untuk gerombol 2
(0, 1) untuk gerombol 3
Model di atas jika dituliskan dalam notasi matriks adalah seperti berikut.
Y = Xβ + Z'� + ε
keterangan:
X = [ 1 X1 X2 ], matriks peubah bebas X1 dan X2.
β0
β = [ β1 ], vektor parameter regresi untuk peubah bebas.
β2
Z' = [ S1 S2 S1X1 S1X2 S2X1 S2X2 ], matriks peubah bebas S1, S2 dan
interaksinya dengan peubah X1 dan X2.
1
δ =[
2
], parameter regresi untuk peubah S1, S2, S1X1, S1X2, S2X1 dan S2X2.
9
Jika nilai S1 dan S2 disubstitusikan maka model untuk masing-masing
gerombol adalah
Y1 = β0 + β1 X1 + β2 X2 + 1
untuk gerombol 1,
Y2 = (β0 + 1) + (β1 + 3) X1 + (β2 + 4) X2 + 2
untuk gerombol 2, dan
Y3 = (β0 + 2) + (β1 + 5) X1 + (β2 + 6) X2 + 3
untuk gerombol 3.
4. Mengevaluasi kekonvergenan nilai kesuaian.
Misalnya g adalah banyaknya individu terbaik yang akan dipilih pada
tahap seleksi individu. Proses analisis dikatakan konvergen jika selisih antara
nilai maksimum dan minimum nilai R2adj dari g individu terpilih yang sudah
diurutkan pada iterasi ke-i ≤ α, yaitu α = 10-6. Jika metode sudah konvergen
maka proses berhenti, tetapi jika belum konvergen maka dilanjutkan ke tahap
berikutnya. Penentuan maksimum iterasi juga perlu dilakukan untuk mencegah program terus berjalan pada kondisi yang tidak mungkin konvergen, yaitu
ditentukan sebanyak 2000 iterasi.
5. Menyeleksi individu.
Pada penelitian ini ditentukan g = 15 individu terpilih yang memiliki nilai
kesuaian tertinggi untuk menjadi tetua pada proses pindah silang. Teknik
seleksi yang digunakan adalah seleksi peringkat berdasarkan nilai R2adj.
6. Melakukan proses pindah-silang.
Pindah-silang dilakukan terhadap masing-masing 2 tetua untuk menghasilkan
keturunan baru dengan teknik satu titik. Penentuan titik silang pada penelitian
ini ditentukan pada tengah-tengah kromosom atau dengan proporsi sekitar
50%:50%.
7. Melakukan proses mutasi pada individu.
Proses mutasi pada penelitian ini hanya dilakukan pada anak hasil pindahsilang untuk menjaga kualitas tetua dan memastikan nilai kesuaiannya tidak
menurun. Peluang terjadinya mutasi ditentukan sebesar 0.8%.
8. Menggabungkan anak hasil mutasi dengan induknya.
9. Mengulangi tahap 3 sampai 8 hingga nilai kesuaian konvergen atau setelah
mencapai iterasi maksimum.
10. Mengulangi tahap 1 sampai 9 dengan banyaknya gerombol yang berbeda.
11. Bandingkan nilai R2adj tertinggi dari hasil masing-masing gerombol. Gerombol
yang memiliki nilai R2adj paling tinggi maka itulah gerombol optimal yang
terbentuk.
12. Mengulang tahap 2 sampai 8 sebanyak 30 kali untuk memperoleh pola nilai
R2adj dan pengelompokkan data, dan mengulang 500 pada data yang berbeda
untuk menduga parameter. Asumsi banyaknya gerombol dalam pendugaan
parameter disesuai-kan dengan jumlah gerombol yang sudah diketahui.
HASIL DAN PEMBAHASAN
Ilustrasi Penerapan
Terdapat data dengan satu peubah respon Y dan dua peubah penjelas, yaitu
X1 dan X2. Data tersebut terdiri dari 100 amatan. Dari data tersebut ingin
diperoleh model yang mampu menghasilkan prediksi untuk nilai Y dengan baik.
10
Gambar 3 Diagram pencar
Kebaikan model regresi linier diukur dari besarnya nilai R2adj. Karena itu
diterapkan analisis regresi linier klasik pada data tersebut dan diperoleh nilai R2adj
sebesar 46.91%. Artinya hanya 46.91% keragaman data yang dapat dijelaskan
oleh model tersebut. Hal ini menunjukkan bahwa model yang sudah diperoleh
masih belum cukup baik untuk menduga nilai Y. Berdasarkan diagram pencar
pada Gambar 3, dicurigai terbentuk gerombol pada data tersebut. Oleh sebab itu,
dibutuhkan solusi yang dapat mengatasi permasalahan analisis regresi linier pada
data bergerombol tersebut. Solusi ini diharapkan mampu menghasilkan nilai R2adj
yang lebih tinggi dibandingkan dengan yang dihasilkan oleh analisis regresi linier
klasik. Salah satu solusi yang dapat digunakan pada data dengan kondisi seperti
ini adalah analisis RLB dengan pendekatan AG.
Analisis ini mencari solusi terbaik berdasarkan nilai R2adj dan melakukan
penggerombolan untuk masing-masing amatan. Tabel 3 menunjukkan nilai R2adj
maksimum yang menunjukkan solusi terbaik untuk data tersebut. Jika diasumsikan ada 2 gerombol maka nilai maksimum yang diperoleh adalah 99.08%,
sedangkan jika diasumsikan ada 5 gerombol nilai maksimumnya adalah 99.70%.
Nilai R2adj yang diperoleh ini sangat jauh berbeda dibandingkan dengan hasil yang
diperoleh dari analisis regresi linier klasik. Berdasarkan pendekatan hasil tersebut,
gerombol optimum yang terbentuk pada data tersebut adalah gerombol yang
memiliki nilai R2adj maksimum paling tinggi, yaitu 5 gerombol. Secara keseluruhan, penerapan analisis RLB dengan pendekatan AG mampu menghasilkan nilai
R2adj lebih tinggi dibandingkan dengan hasil dari analisis regresi linier klasik. Pada
Tabel 3 juga disajikan jumlah anggota gerombol untuk masing-masing asumsi
banyaknya gerombol dari hasil penduggan. Jika diasumsikan terbentuk 2
Tabel 3 R2adj dan jumlah anggota gerombol hasil dugaan
Asumsi banyaknya
gerombol
2
3
4
5
R2adj
(%)
99.08
99.22
99.40
99.70
1
55
10
43
22
Gerombol
2
3
4
45
37
53
13
9
35
30
10
12
5
26
11
gerombol maka dari 100 amatan tersebut sebanyak 55 amatan dimasukkan ke
dalam gerombol 1 dan 45 amatan ke dalam gerombol 2. Jika terbentuk 3 gerombol
maka sebanyak 10 amatan masuk ke dalam gerombol 1, 37 amatan masuk ke
dalam gerombol 2 dan sebanyak 53 amatan menjadi anggota gerombol 3.
Selanjutnya untuk asumsi banyaknya gerombol 4 dan 5 dapat dilihat pada tabel.
Kajian Kinerja Analisis Regresi Linier Bergerombol dengan Pendekatan
Algoritma Genetika
Konvergensi
Kemampuan dan performa analisis RLB dengan pendekatan AG dilihat
berdasarkan nilai R2adj dan kesalahan penggerombolan. Penentuan banyaknya
gerombol yang terbentuk diperoleh dari nilai R2adj maksimum antar asumsi
banyaknya gerombol. Gerombol yang menghasilkan nilai paling tinggi maka
gerombol tersebutlah yang dianggap sebagai gerombol optimum. Seperti yang
sudah dijelaskan di awal, AG akan mencari solusi terbaik dengan memilih
individu-individu yang memiliki nilai kesuaian terbaik. Setiap generasi yang
dihasilkan akan memiliki nilai kesuaian maksimum yang lebih baik atau sama
dengan nilai kesuaian maksimum generasi sebelumnya. Nilai kesuaian atau R2adj
akan mempunyai pola meningkat pada setiap generasinya.
Gambar 4 menunjukkan performa dari analisis RLB denggan pendekatan
AG yang dilihat berdasarkan peningkatan nilai R2adj tiap iterasi pada data
berukuran kecil. Analisis ini menghasilkan R2adj yang sangat kecil di iterasi awal
dan terus meningkat pada iterasi-iterasi berikutnya. Seperti terlihat pada Gambar
4, analisis ini mampu mencapai konvergen karena selisih nilai maksimum dan
minimum R2adj dari g = 15 individu terpilih kurang dari α. Pada data berukuran
sedang dapat mencapai konvergen dengan iterasi yang lebih banyak dibandingkan
dengan jumlah iterasi pada data berukuran kecil. Pada data berukuran besar masih
sulit untuk mencapai konvergensi sehingga program baru akan berhenti setelah
mencapai iterasi maksimum, yaitu hingga 2000 iterasi. Walau demikian, pola nilai
R2adj terus meningkat.
Gambar 4 Performa RLB dengan pendekatan AG
12
Tabel 4 Nilai R2adj*
Data
1
2
3
Dua gerombol (%)
99.08
99.91
98.46
Tiga gerombol (%)
99.79
99.79
97.24
Kemampuan Mendeteksi Gerombol dan Menduga Parameter Regresi
Evaluasi RLB dengan pendekatan AG dilakukan pada data bangkitan mulai
dari 2 sampai dengan 5 gerombol. Analisis RLB pada data bangkitan yang sudah
diketahui gerombolnya menghasilkan nilai R2adj*. Namun pada kenyataannya ini
tidak pernah diketahui sebelumnya. Nilai R2adj* dari masing-masing data ditunjukkan pada Tabel 4 dengan R2adj* pada data 1, data 2, dan data 3 dengan 2 gerombol
masing-masing adalah 99.08%, 99.91%, dan 98.46%.
Selanjutnya pada Tabel 5 disajikan ringkasan nilai R2adj dugaan dari 30
ulangan untuk masing-masing data. Pada data 1, jika diasumsikan terbentuk 2
gerombol maka diperoleh nilai minimum sebesar 83.89%, median sebesar 88.53%
dan maksimumnya sebesar 99.08% (dengan regresi klasik hanya 46.91%). Nilai
maksimum R2adj jika diasumsikan terbentuk 2 gerombol sudah sesuai dengan nilai
R2adj* pada data 1 dengan 2 gerombol dan jika diasumsikan terbentuk 5 gerombol
maka nilai minimumnya sebesar 95.22%, median sebesar 99.46%, dan maksimum
sebesar 99.77%. Semakin besar asumsi banyaknya gerombol terlihat nilai
maksimumnya semakin tinggi.
Pada data 2, analisis ini menghasilkan nilai R2adj minimum sebesar 72.81%,
median sebesar 98.42%, dan nilai maksimum sebesar 99.91% dengan asumsi
tebentuk 2 gerombol. Karena nilai R2adj* dari data 2 adalah 99.91%, maka metode
ini juga mampu mencapai nilai optimum. Jika diasumsikan terbentuk 5 gerombol
maka diperoleh nilai minimum sebesar 99.91%, median sebesar 99.96%, dan
Tabel 5 Nilai R2adj tertinggi dari 30 ulangan pada data dengan 2 gerombol
Data
1
2
3
Asumsi banyaknya
gerombol
2
3
4
5
2
3
4
5
2
3
4
5
Minimum
(%)
83.89
90.61
93.81
95.22
72.81
89.78
99.84
99.91
76.55
98.77
98.76
99.30
Median Maksimum
(%)
(%)
88.53
99.08
99.16
99.40
99.36
99.67
99.46
99.77
98.42
99.91
99.92
99.94
99.93
99.97
99.96
99.98
98.50
98.50
98.91
99.04
99.40
99.49
99.52
99.64
13
maksimum sebesar 99.98%. Selanjutnya, pada data 3 dengan asumsi terbentuk 2
gerombol menghasilkan nilai minimum sebesar 76.55%, median sebesar 98.50%,
dan nilai maksimum sebesar 98.50%. Pada data ini analisis RLB dengan
pendekatan AG juga mampu mencapai nilai optimum karena nilai R2adj*-nya
adalah 98.46%. Jika diasumsikan terbentuk 5 gerombol maka nilai minimum
sebesar 99.30%, median sebesar 99.52%, dan maksimum sebesar 99.64%.
Berdasarkan hasil dari data-data tersebut terlihat pola nilai R2adj yang sama, yaitu
nilainya akan semakin tinggi seiring besarnya asumsi banyaknya gerombol.
Walau demikian, analisis ini sudah mampu memperoleh nilai R2adj yang
mendekati R2adj* dari masing-masing data. Hal tersebut dapat dilihat dari nilai
maksimum untuk gerombol yang terbentuk sebanyak 2 gerombol.
Banyaknya gerombol yang sesuai dengan data bangkitan diharapkan
mempunyai nilai R2adj paling tinggi atau selalu berada pada urutan paling atas jika
diurutkan berdasarkan nilai R2adj. Tabel 6 menampilkan urutan gerombol hasil
pendugaan dari 30 kali ulangan pada data bangkitan dengan 2 gerombol. Pada
data 1, jika diprediksi terbentuk 2 gerombol maka hasilnya menempati urutan
terakhir sebanyak 19 kali dan tidak memiliki nilai R2adj paling tinggi, sedangkan
jika terbentuk 5 gerombol hasilnya menempati urutan teratas sebanyak 21 kali.
Dengan kata lain, jika diasumsikan ada 2 gerombol hasilnya hampir selalu berada
pada urutan terakhir atau nilai R2adj paling kecil. Pola urutan yang terlihat dari 30
ulangan tersebut menunjukkan semakin banyak gerombol yang diduga akan
menghasilkan nilai R2adj dugaan yang semakin tinggi pula seperti yang
diperlihatkan pada Tabel 5.
Kemampuan analisis RLB dengan pendekatan AG membentuk gerombol
pada data sudah cukup baik. Pada data 1 dengan asumsi terbentuk 2 gerombol dan
nilai R2adj yang paling tinggi, tidak ada kesalahan penggerombolan data yang
dapat dilihat di Lampiran 3. Pada data tersebut terdapat 55 amatan yang termasuk
ke dalam gerombol 1 dan 45 amatan yang termasuk ke dalam gerombol 2. Hasil
pendugaan juga menunjukkan jumlah yang sama, yaitu 55 amatan untuk gerombol
1 dan 45 amatan untuk gerombol 2. Hal ini menunjukkan penggerombol sudah
sesuai dengan gerombol yang ada pada data. Sama halnya untuk data 2 yang dapat
Tabel 6 Hasil pendugaan gerombol optimal berdasarkan urutan
Data
1
2
3
Urutan
(ke-)
1
2
3
4
1
2
3
4
1
2
3
4
Asumsi banyaknya gerombol
2
3
4
5
0
2
7
21
2
5
17
6
9
16
3
2
19
7
3
1
0
3
5
22
0
5
20
5
4
19
4
3
26
3
1
0
0
0
7
23
0
1
22
7
0
29
1
0
30
0
0
0
14
dilihat di Lampiran 4. Penggerombolan amatan pada data 3 terjadi kesalahan
penggerombolan amatan jika diasumsikan ada 2 gerombol. Dari 55 amatan yang
sebenarnya termasuk gerombol 1, ada 1 amatan yang dimasukkan ke dalam
gerombol 2. Dari 45 amatan yang termasuk gerombol 2, 2 diantaranya
dimasukkan ke dalam gerombol 1 seperti disajikan pada Lampiran 5. Berdasarkan
Lampiran 1 terlihat sebaran data antara peubah Y dan X2 untuk data 3 membentuk
perpotongan jika dibuat garis regresi. Hal ini yang menyebabkan terjadi kesalahan
penggerombolan. Karena AG bersifat stokastik maka hasilnya dapat berbeda
untuk setiap kali menjalankan program tersebut.
Pendugaan parameter dengan analisis regresi linier klasik dan RLB dengan
pendekatan AG dilakukan untuk masing-masing 500 data yang berbeda. Hasil
pendugaan parameter menggunakan regresi klasik pada data dengan 2 gerombol
disajikan pada Tabel 7. Hasil pendugaan pada data 1 menunjukkan rata-rata nilai
R2adj sebesar 54.66% yang dapat dikatakan sangat kecil untuk ukuran kebaikan
suatu model. Karena parameter yang digunakan untuk membangkitkan data terdiri
atas 2 gerombol sehingga b0 hasil dugaan dan parameternya berbias. Namun pada
data ini pendugaan dengan regresi klasik menghasilkan b1 dan b2 yang mendekati
parameternya karena bentuk hubungan linier antara gerombol 1 dan 2 adalah
sejajar. Dilihat dari besarnya nilai b0 yang diperoleh, diperkirakan jika dibuat garis
regresi maka garis tersebut akan berada di antara gerombol 1 dan 2.
Kebaikan persamaan regresi hasil pendugaan menggunakan regresi klasik
pada data 2 rata-ratanya adalah 5.55% yang jauh lebih kecil dibandingkan nilai
R2adj dari data 1. Hal tersebut karena bentuk hubungan linier antara peubah Y dan
X tidak sejajar dan juga menyebabkan koefisien regresi berbeda cukup jauh dari
parameternya. Jika dibuat garis regresi seperti pada data 1 di atas maka garis
tersebut juga akan berada di antara gerombol 1 dan 2. Pada data 3 rata-rata nilai
R2adj lebih besar dibandingkan dengan hasil pendugaan pada data 2 namun masih
termasuk nilai yang sangat kecil untuk ukuran kebaikan suatu model. Nilai
Tabel 7 Pendugaan parameter data dengan 2 gerombol (regresi linier klasik)
Data
1
2
3
Statistik
b0
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
104.64
358.15
155.80
6.50
-39.32
1363.66
5.58
1.25
807.45
371.96
1150.80
6.50
b1
b2
-7.53 18.77
7.27
1.78
-7.65 18.76
-7.65 18.76
-2.67 16.82
28.01
6.70
-2.65
8.76
-5.72 35.65
-7.09 -7.22
7.56
1.61
-7.65 -18.76
-5.72 19.65
R2adj
(%)
54.66
5.30
5.55
4.49
14.66
6.70
15
parameter dugaan yang diperoleh dari analisis regresi klasik pada data ini juga
berbias karena parameter yang digunakan untuk membangkitkan terdiri atas 2
gerombol. Nilai b1 dan b2 negatif yang menandakan bahwa hubungan linier antara
Y dengan X1 dan X2 negatif, padahal bentuk hubungan linier antara Y dan X2
adalah positif.
Selanjutnya, hasil pendugaan parameter menggunakan analisis RLB dengan
pendekatan AG disajikan pada Tabel 8 yang menunjukkan hasil yang diperoleh
dari data dengan 2 gerombol. Rata-rata nilai ukuran kebaikan model pada data 1,
baik untuk masing-masing gerombol maupun secara keseluruhan, sangat tinggi
dibandingkan dengan hasil yang diperoleh dari analisis regresi linier klasik. Ratarata nilai b0 yang dihasilkan masih cukup jauh berbeda dengan parameternya yang
menandakan bahwa nilainya tidak kekar. Namun untuk nilai b1 dan b2 yang
dihasilkan sudah cukup baik karena mendekati parameternya. Hasil serupa juga
diperoleh pada data 2 yang menghasilkan rata-rata R2adj tinggi dan koefisien
regresi yang mendekati parameternya. Nilai b0 yang diperoleh dari data-data ini
berbeda jauh dengan parameternya, tapi nilai b1 dan b2 sudah mendekati parameternya. Rata-rata R2adj juga sangat tinggi dibandingkan dengan hasil yang
diperoleh dari analisis regresi linier klasik yang hanya memiliki rata-rata sebesar
14.66%. Hasil pendugaan parameter dengan analisis ini terhadap data 3
menghasilkan nilai b0, b1, dan b2 yang sudah mendekati parameternya. Nilai R2adj
secara keseluruhan dan masing-masing gerombol juga sangat tinggi. Nilai galat
baku dari Tabel 8 lebih kecil dan parameter dugaan untuk data-data tersebut juga
lebih dekat dibandingkan dengan hasil regresi linier klasik. Berdasarkan hasil
Tabel 8 Pendugaan parameter data dengan 2 gerombol (RLB-AG)
Gerombol 1
Data
1
2
3
Statistik
Gerombol 2
2
b0
Rata-rata
157.71
Galat baku
18.97
Rata-rata
R2adj (%)
Parameter
155.80
gerombol
Rata-rata
9.17
Galat baku
37.54
Rata-rata
R2adj (%)
Parameter
5.58
gerombol
Rata-rata
1150.00
Galat baku
18.15
Rata-rata
R2adj(%)
Parameter
1150.80
gerombol
b1
-7.69
0.40
R adj
(%)
18.77 99.90
0.11 0.02
b2
b0
13.36
31.28
R2adj
(%)
-7.79 18.76 99.90
0.65 0.15 0.02
b1
b2
99.90
-7.65
-2.71
0.67
18.76
6.50
8.73 99.96 -10.69
0.23 0.39 154.68
-7.65 18.76
-5.63 35.91 99.88
1.45 3.08 1.26
99.92
-2.65
-7.64
0.37
8.76
1.25
-18.75 99.83
0.09 0.03
8.27
34.00
-5.72 35.65
-5.76 19.65 99.83
0.69 0.15 0.03
99.83
-7.65
-18.76
6.50
-5.72 19.65
16
Tabel 9 Pendugaan gerombol optimal berdasarkan urutan pada data 1 dengan
3 gerombol
Urutan
(ke-)
1
2
3
4
Asumsi banyaknya gerombol
2
3
4
5
0
3
7
20
0
3
19
8
6
18
4
2
24
6
0
0
tersebut, analisis RLB dengan pendekatan AG mampu menghasilkan pendugaan
parameter yang lebih baik pada data bergerombol dibandingkan dengan analisis
regresi linier klasik.
Hasil yang diperoleh dari 30 ulangan analisis RLB dengan pendekatan AG
pada data dengan 3 gerombol tidak jauh berbeda dari pola yang diperoleh pada
data dengan 2 gerombol. Pada Tabel 9 disajikan urutan gerombol berdasarkan
nilai R2adj untuk data 1. Hasil tersebut menunjukkan semakin besar asumsi
banyaknya gerombol akan menghasilkan R2adj yang lebih tinggi, sehingga gerombol 3 sebagian besar berada pada urutan ke-3. Pola ini masih sama dengan pola
yang diperoleh dari data dengan 2 gerombol (Tabel 6). Penggunaan R2adj sebagai
fungsi kesuaian belum mampu memberikan hasil penentuan gerombol optimum
dengan baik.
Pendugaan parameter pada data dengan 3 gerombol menggunakan regresi
linier klasik disajikan pada Tabel 10. Sama halnya dengan Tabel 7, untuk data 1
menunjukkan bahwa nilai b1 dan b2 mampu mendekati parameternya karena
bentuk hubungan linier antar gerombol adalah sejajar (Lampiran 2). Namun nilai
b0 tidak mampu diduga dengan baik sehingga hasilnya berbias dan nilai R2adj yang
diperoleh juga sangat kecil. Parameter dugaan dari data 2 menggunakan analisis
regresi linier klasik terlihat jauh berbeda dengan parameternya. Pendugaan
parameter pada data seperti ini terlihat tidak efektif karena selain dugaan
parameternya yang jauh menyimpang, ukuran kebaikan modelnya juga sangat
kecil. Selain itu, b2 bernilai positif padahal ada satu model yang memiliki nilai
negatif. Hasil pada data 3 juga mempunyai parameter dugaan yang jauh menyimpang dari parameternya dan nilai R2adj yang sangat kecil jika menggunakan
analisis regresi linier klasik. Nilai b1 dan b2 keduanya bernilai positif padahal ada
parameter yang keduanya positif, keduanya negatif dan ada juga model dengan b 1
negatif dan b2 positif. Berdasarkan hasil tersebut ternyata pendugaan analisis
regresi linier pada data bergerombol menghasilkan parameter yang berbias dan
nilai R2adj yang sangat kecil.
Pendugaan parameter menggunakan analisis RLB dengan pendekatan AG
pada data dengan 3 gerombol disajikan pada Tabel 11. Hasil untuk analisis pada
data 1 memperlihatkan bahwa parameter dugaan sudah mendekati parameter yang
digunakan untuk membangkitkan data, dan simpangannya juga cukup kecil dan
nilai R2adj yang diperoleh juga cukup tinggi. Jika dibandingkan dengan hasil yang
diperoleh dari analisis regresi klasik parameter dugaan yang diperoleh juga lebih
baik dan nilai R2adj yang jauh lebih tinggi, tapi simpangan untuk b0 masih cukup
tinggi. Hasil pendugaan parameter pada data 2 juga menunjukkan parameter
17
Tabel 10 Pendugaan parameter data dengan 3 gerombol (regresi linier klasik)
Data
1
2
3
Statistik
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Parameter gerombol 3
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Parameter gerombol 3
Rata-rata
Galat baku
Parameter gerombol 1
Parameter gerombol 2
Parameter gerombol 3
b0
307.28
1111.06
515.80
209.00
1.50
324.40
294.57
105.80
15.80
1186.50
-190.02
1136.80
0.80
-19.00
-16.50
b1
b2
R2adj(%)
5.11 19.62
12.17
22.89
5.27
6.17
5.65 19.65
5.65 19.65
5.65 19.65
-0.10
2.49
2.69
5.99
1.48
3.66
1.76
8.76
1.76
8.76
-7.57 -16.96
2.87
3.83
0.36
23.36
5.34
2.35
-1.76 12.88
-1.26 -5.76
0.57
3.96
dugaan yang sudah cukup mendekati parameter yang digunakan untuk membangkitkan data. Nilai R2adj yang dihasilkan juga sangat tinggi baik untuk masingmasing gerombol maupun secara keseluruhan.
Selanjutnya untuk pendugaan parameter pada data 3 menghasilkan pendugaan yang juga cukup baik. Hasil parameter dugaan yang diperoleh sudah mendekati
parameternya dan nilai R2adj yang sangat tinggi untuk masing-masing gerombol
ataupun secara keseluruhan. Jika dibandingkan dengan hasil yang diperoleh dari
analisis regresi linier klasik, hasil dari analisis RLB dengan pendekatan AG lebih
baik dalam pendugaan parameter dan model yang dihasilkan juga memiliki
ukuran kebaikan yang tinggi untuk data bergerombol. Penggunaan analisis RLB
dengan pendekatan AG pada data seperti ini juga menghasilkan pendugaan
parameter yang lebih baik dibandingkan dengan analisis regresi linier klasik.
Namun galat baku yang diperoleh untuk semua b0 sangat besar. Hal ini menunjukkan bahwa nilai pendugaan b0 tidak bersifat kekar (robust), sedangkan nilai b1 dan
b2 galat bakunya cukup kecil.
Waktu Proses
Waktu yang dibutuhkan untuk memproses data dengan 100 amatan, 2
peubah bebas dan asumsi gerombol antara 2 sampai 5 gerombol adalah sekitar 1
menit. Software yang digunakan adalah SAS versi 9.2 pada komputer personal
dengan spesifikasi prosesor 2.0 GHz, RAM 2 GB dan sistem operasi Microsoft
Windows 7 Ultimate 32-bit. Semakin banyak asumsi gerombol yang dicobakan
maka waktu yang dibutuhkan pun semakin lama. Begitupun halnya jika amatan
atau peubah bebas lebih banyak.
18
Tabel 11 Pendugaan parameter data dengan 3 gerombol (RLB-AG)
Gerombol 1
Data
Statistik
1
Rata-rata
Galat baku
Rata-rata
R2adj (%)
Parameter
gerombol
Rata-rata
Galat baku
Rata-rata
R2adj (%)
Parameter
gerombol
Rata-rata
Galat baku
Rata-rata
R2adj (%)
Parameter
gerombol
2
3
b0
514.33
109.19
b1
b2
6.25 18.44
4.78 7.08
Gerombol 2
R2adj
b0
b1
b2
(%)
97.28 267.41 5.82 17.09
1.94 1196.52 28.14 26.47
Gerombol 3
R2adj
(%)
93.79
5.25
b0
b1
0.43
90.76
6.10
5.34
R2adj
(%)
19.89 96.02
10.49 4.21
1.50
5.65
19.65
b2
95.67
515.80
5.65 19.65
0.44 -2.83 13.59
875.43 18.96 12.25
209.00
96.22
4.87
-20.24
184.19
5.65 19.65
-0.74
4.21
-5.34
7.09
98.58
1.96
-24.60 0.27
466.25 11.93
4.00 98.56
13.88 2.86
97.86
0.80
121.38
281.97
-1.76 12.88
1.34
3.24
8.45
7.77
95.94
5.08
-19.00
-1.26
-5.76
-16.50
0.57
3.96
16.20
427.17
3.01
8.34
7.74
9.22
93.65 1204.99
4.83 105.15
-9.76
6.02
-12.89 98.47
7.31 3.05
1186.50
-7.57
-16.96
94.53
105.80
1.77
8.76
15.80
1.77
8.76
19
Diskusi
Dari segi waktu, analisis RLB dengan pendekatan AG ini mampu menghasilkan solusi terbaik dalam yang waktu relatif singkat. Penerapan program pada
data berukuran kecil membutuhkan waktu sekitar 1 menit hingga proses selesai.
Namun, jika diterapkan pada data besar maka dibutuhkan waktu yang lebih lama.
Pada data berukuran sedang dibutuhkan waktu sekitar 1 jam untuk melakukan
analisis ini hingga selesai, sedangkan pada data berukuran besar dibutuhkan waktu
lebih dari 5 jam tetapi tidak mencapai konvergen. Nopiah et al. (2010)
menyatakan bahwa kompleksitas waktu proses dari AG adalah linier terhadap
banyaknya iterasi atau generasi.
Analisis RLB dengan pendekatan AG menggunakan program SAS/IML,
SAS/Base, dan SAS Macro mampu menghasilkan solusi terbaik. Namun, dalam
praktiknya dibutuhkan beberapa kali ulangan untuk memeroleh hasil terbaik. Jika
hanya dilakukan satu kali ulangan maka hasil yang diperoleh mungkin bukan
solusi optimal. Nugroho (2008) tentang pencarian jalur alternatif menyatakan
bahwa penggunaan bilangan acak pada AG menyebabkan beberapa kali pencarian
tidak menghasilkan solusi optimal. Oleh sebab itu, diperlukan beberapa kali
ulangan untuk mendapatkan solusi optimum. Program yang digunakan untuk
analisis RLB dengan pendekatan AG ini masih mempunyai keterbatasan.
Beberapa diantaranya adalah penentuan besarnya peluang mutasi, banyaknya
peubah penjelas, banyaknya asumsi gerombol yang dicobakan, fungsi kesuaian
yang berpengaruh terhadap hasil penentuan gerombol optimum, dan banyaknya
amatan.
SIMPULAN DAN SARAN
Simpulan
Berdasarkan hasil yang diperoleh, kemampuan analisis RLB dengan pendekatan AG dapat dikatakan sudah baik karena analisis ini mampu mencari nilai
R2adj yang terus meningkat setiap iterasi dan mendekati nilai R2adj*. Bahkan
dengan asumsi banyaknya gerombol yang semakin besar, nilai R2adj juga semakin
tinggi. Akan tetapi hal ini menyebabkan analisis ini belum mampu menduga
banyaknya gerombol optimum yang terbentuk pada data dengan baik. Kriteria
yang digunakan sebagai fungsi kesuaian, yaitu R2adj ternyata belum mampu
menentukan gerombol optimum yang sesuai dengan yang diharapkan. Namun jika
dibandingkan dengan analisis regresi linier klasik tanpa memerhatikan gerombol,
analisis ini mampu memberikan hasil yang jauh lebih baik. Analisis ini juga
mampu memberikan hasil penggerombolan dengan baik. Pada asumsi banyaknya
gerombol dan nilai R2adj yang sesuai dengan data yang dibangkitkan, semua
amatan digerombolkan dengan tepat. Pada data 3 ada perpotongan garis regresi
sehingga dapat terjadi kesalahan penggerombolan di sekitar titik perpotongan
tersebut.
20
Saran
Pada penelitian selanjutnya dibutuhkan penerapan teknik atau metode lain
untuk mengetahui banyaknya gerombol optimum. Misalnya fungsi kesuaian yang
digunakan adalah A = R2adj – P, dengan P adalah sebuah nilai penalti yang lebih
besar dari 0 jika gerombol yang diasumsikan tidak sesuai. Banyaknya asumsi
gerombol yang dicobakan juga dapat ditambah. Inisialisasi populasi awal dapat
menggunakan teknik atau metode lain sehingga waktu proses metode ini akan
lebih cepat. Program untuk analisis RLB dengan pendekatan AG disusun
menggunakan SAS/Base, SAS/IML, dan SAS Macro. Program tersebut dapat
dilihat di http://bit.ly/CLRwGA.
DAFTAR PUSTAKA
Angga K, Lestari J. 2012. Penerapan Algoritma Genetik pada Proses Penyusunan
Kelompok Belajar di Sekolah. BIT. 9(1).
Antoniou A, Lu WS. 2007. Practical Optimization: Algorithms and Engineering
Applications. New York(US) : Springer.
Ari B, Guvernir HA. 2002. Clustered Linear Regression. Knowledge-Based
System. 15:169-175.
Barman K, Dabeer O. 2011. Clustered Regression with Unknown Cluster. arXiv.
1103.4480v1.
Haupt RL, Haupt SE. 2004. Practical Genetic Algoritms. Canada(US) : John
Wiley & Sons, Inc.
Liliana. 2006. Implementasi Algoritma Genetika untuk Desain Ruang dalam
Rumah. Seminar Nasional Sistem dan Informatika[Internet]. 2006 Nop 17. Bali
(ID);
[diunduh
2014
Feb
19].
Tersedia
pada:
https://yudiagusta.files.wordpress.com/2009/11/73-76-snsi06-12-implementasialgoritma-genetika-untuk-desain-ruang-dalam-rumah.pdf
Nopiah ZM, Khairir MI, Abdullah S, Baharin MN, Arifin A. 2010. Time
Complexity Analysis of the Genetic Algorithm Clustering Method. Proceeding
Recent Advances In Signal Processing, Robotics And Automation[Internet].
[Waktu dan tempat pertemuan tidak diketa