KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) - Diponegoro University | Institutional Repository (UNDIP-IR)

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN

DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG
DENGAN SUPPORT VECTOR MACHINE (SVM)

SKRIPSI

Disusun Oleh :

MEKAR SEKAR SARI
NIM. 24010210120008

JURUSAN STATISTIKA

FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2014

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN


DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG
DENGAN SUPPORT VECTOR MACHINE (SVM)

MEKAR SEKAR SARI
NIM. 24010210120008

Skripsi

Diajukan Sebagai Syarat untuk Mendapatkan Gelar Sarjana
Pada Jurusan Statistika

JURUSAN STATISTIKA

FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2014
i

ii


iii

KATA PENGANTAR
Puji syukur ke hadirat Allah SWT yang telah melimpahkan rahmat, berkah,
dan karunia-Nya sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul
Klasifikasi Wilayah Desa-Perdesaan Dan Desa-Perkotaan Wilayah Kabupaten
Semarang Dengan Support Vector Machine (SVM) .
Tanpa bantuan dan dukungan dari berbagai pihak, penulis tidak akan mampu
menyelesaikan laporan ini. Penulis menyampaikan terima kasih yang sebesarbesarnya kepada :
1.

Ibu Dra. Hj. Dwi Ispriyanti, M.Si selaku Ketua Jurusan Statistika Fakultas
Sains dan Matematika Universitas Diponegoro.

2.

Ibu Diah Safitri, S.Si, M.Si selaku dosen pembimbing I dan Bapak Sugito,
S.Si, M.Si selaku dosen pembimbing II.


3.

Bapak Ibu Dosen Jurusan Statistika Fakultas Sains dan Matematika
Universitas Diponegoro.

4.

Semua pihak yang tidak dapat penulis sebutkan satu per satu.
Penulis menyadari masih terdapat kekurangan pada Laporan Tugas Akhir ini.

Oleh karena itu, saran dan kritik dari semua pihak yang bersifat membangun sangat
penulis harapkan demi kesempurnaan Tugas Akhir ini.
Semarang, September 2014
Penulis

iv

 
P 





 
    w y  



   

  

y
 
cu pada perbedaan karakteristik/

kondisi antarwilayah di Indonesia dengan metode Support Vector Machine
(SVM). Klasifikasi pada permasalahan ini bekerja dengan membangun fungsi
pemisah yang melibatkan fungsi kernel untuk memetakan data input ke ruang
dimensi yang lebih tinggi. Algoritma Sequential Minimal Optimization (SMO)

digunakan pada proses training data klasifikasi wilayah desa-perdesaan dan desaperkotaan untuk mendapatkan fungsi pemisah (hyperplane) yang optimal. Untuk
menentukan fungsi kernel dan parameter yang sesuai dengan data pada penelitian
ini digunakan metode grid search yang dipadukan dengan metode leave-one-out
cross-validation. Pada klasifikasi menggunakan motode SVM ini didapatkan
ukuran ketepatan klasifikasi, yaitu nilai akurasi terbaik sebesar 90% dengan
menggunakan fungsi kernel Radial Basis Function (RBF) dengan parameter
C=100 dan γ=2-5.
ci : Klasifikasi, support vector machine, sequential minimal
optimization, grid search, leave-one-out, cross-validation, desa-perdesaan, desaperkotaan

 

v

ABSTRACT
This research will be carry out classification based on the status of the
rural and urban regions that reflect the differences in characteristics/ conditions
between regions in Indonesia with Support Vector Machine (SVM) method.
Classification on this issue is working by build separation functions involving the
kernel function to map the input data into a higher dimensional space. Sequential

Minimal Optimization (SMO) algorithms is used in the training process of data
classification of rural and urban regions to get the optimal separation function
(hyperplane). To determine the kernel function and parameters according to the
data, grid search method combined with the leave-one-out cross-validation
method is used. In the classification using SVM, accuracy is obtained, which the
best value is 90% using Radial Basis Function (RBF) kernel functions with
parameters C=100 dan γ=2-5.
Keywords : classification, support vector machine, sequential minimal
optimization, grid search, leave-one-out, cross validation, rural, urban

vi

!"#!R $%$
&''l 'mn
&()(*(+ ,-.-)////////////////////////////////////////////////////////////////////////////////////////////////
)EMBAR PENGESAHAN I .................................................................................. ii
LEMBAR PENGESAHAN II................................................................................ iii
KATA PENGANTAR ........................................................................................... iv
ABSTRAK .............................................................................................................. v
ABSTRACT........................................................................................................... vi

DAFTAR ISI......................................................................................................... vii
DAFTAR GAMBAR ............................................................................................. ix
DAFTAR TABEL................................................................................................... x
DAFTAR LAMPIRAN.......................................................................................... xi
DAFTAR SIMBOL............................................................................................... xii
BAB I

PENDAHULUAN ................................................................................... 1

1.1

Latar Belakang ......................................................................................... 1

1.3

Batasan Masalah....................................................................................... 3

1.4

Tujuan ...................................................................................................... 4


BAB II TINJAUAN PUSTAKA .......................................................................... 5
2.1

Klasifikasi Wilayah Desa-Perdesaan Dan Desa-Perkotaan ..................... 5

2.2

0122345 678t34 9:8;?@A?R B?MC?R
Halaman

Dambar
EFG

Hyperplane terbaik........................................................................ 11

Dambar
EFE

Hyperplane terbaik dengan margin maksimal .............................. 12


HFG
Dambar

Diagram Alir Klasifikasi dengan Metode SVM............................ 30

Dambar
IFG

Persentase Jumlah Desa-Perdesaan dan Desa-Perkotaan
Kabupaten Semarang .................................................................... 31

ix

JKLMKR MKNOP
Halaman
T
abel

QRS


Variabel, Klasifikasi, Skor, dan Kriteria Desa Perkotaan ...................... 7

T
abel

QRQ

Matriks Konfusi.................................................................................... 25

TRS

Jumlah Wilayah Administratif Terkecil Kabupaten Semarang

T
abel

Berdasarkan Status Daerah................................................................... 31

TRQ


T
abel

Persentase Akurasi Hasil Klasifikasi Dengan Leave-One-Out CrossValidation ............................................................................................. 34

T
abel

TRU

Error Klasifikasi Untuk Setiap Parameter cost (C) .............................. 35

T
abel

TRT

Error Klasifikasi Untuk Setiap Parameter degree (d) dan cost (C)...... 37

TRV

Nilai

T
abel

untuk hyperplane dengan fungsi kernel Polynomial dengan

parameter C=0,01 dan d=2 ................................................................... 38

TRW

T
abel

Support vector untuk hyperplane dengan fungsi kernel Polynomial
dengan parameter C=0,01 dan d=2....................................................... 39

T
abel

TRV

Error Klasifikasi Untuk Setiap Parameter gamma ( ) dan cost (C)..... 41

TRX

Nilai

T
abel

untuk hyperplane dengan fungsi kernel RBF dengan

parameter C=100 dan

TRY

T
abel

TRW

............................................................. 42

Support vector untuk hyperplane dengan fungsi kernel RBF dengan
parameter C=100 dan

T
abel

=2

=2

............................................................. 43

Akurasi Hasil Klasifikasi Dengan Metode SVM ................................. 47

x

Z[\][RL[MP
^[R_
Halaman

`

Data Klasifiksasi Wilayah Desa-perdesaan Desa-Perkotaan

Lampia
rn

Kabupaten Semarang................................................................... 51

a

Pembagian Data Training-Testing Secara Acak.......................... 61

b

Syntax R Klasifikasi dengan SVM .............................................. 65

Lampia
rn
Lampia
rn
Lampia
rn

c

Output Klasifikasi SVM Dengan Kernel Linier .......................... 66

Lampia
rn

d

Output Klasifikasi SVM Dengan Fungsi Kernel Polynomial ..... 68

Lampia
rn

e

Output Klasifikasi SVM Dengan Fungsi Kernel Radial Basis
Function (RBF)............................................................................ 72

xi

fghigR jkMlmn
: data input ke-i
( )

: fungsi hyperplane

( )

: label kelas data input
: parameter fungsi hyperplane
: parameter fungsi hyperplane
: ruang vector dengan dimensi n
: label kelas data ke-i
: data uji
: norm vektor w
: jarak antara dua hyperplane
: alpha, pengali Lagrange yang berkorespondensi dengan
: fungsi Lagrange primal
: fungsi Lagrange dual
: parameter cost
: variable slack ke-i

( ,
( )

)

: fungsi Kernel
: transformasi data input ( ) di future space
: konstanta fungsi Kernel Polynomial
: gamma, parameter fungsi Kernel Radial Basis Function (RBF)
: sigma, parameter fungsi Kernel Tangent hyperbolic (sigmoid)
: Batas atas nilai pengali Lagrange

xii

: Batas bawah nilai pengali Lagrange
: dot-product dua elemen vektor

xiii

pqp r
stuDqvwxwqu
yzy {|}|~ €l||‚g
ƒ„…†‡†ˆ ‰Š‹ŒŠŽ„† ‹„†„ ‘ ‹†…†’ “†”† •„Š‘†• –„…†‡†ˆ
†‹’„Š„Ž•“†•„—, ‡†„•˜ ”“Œ™„ŠŽ„, ‘†˜”†•Šš‘Œ•†, ‘›†’†•†Šœ ‹†Š ‹Ž† †•†˜
‹„Ž˜• ‹Š†Š Š†’† …†„Š ‡†Š ’“˜”†‘†Š –„…†‡†ˆ †‹’„Š„Ž•“†•„— •“‘›„…
(†‹†Š ž˜Ž†• Ÿ•†•„Ž•„‘œ  ¡o¡). ¢Š•˜‘ “††„ ‘”“…˜†Šœ ‹†•† ’ŠŠ†„
‘…†Ž„—„‘†Ž„ –„…†‡†ˆ ‹Ž† ‹†Š ‘Œ•† Ž†Š†• “’†Š—††• •“˜•†’† ‹†…†’ ˆ†…
”“Š›†Š††Š ”’†Š˜Š†Š£ †‹†Š ž˜Ž†• Ÿ•†•„Ž•„‘ (žŸ) ’“˜”†‘†Š Ž†…†ˆ Ž†•˜
†‹†Š ”Š‡‹„† ‹†•† ”’†„†Š –„…†‡†ˆ †‹’„Š„Ž•“†•„— ‡†Š •…†ˆ ‹„‘…†Ž„—„‘†Ž„‘†Š
’Š¤†‹„ –„…†‡†ˆ ‹Ž†-”“‹Ž††Š ‹†Š ‹Ž†-”“‘Œ•††Š ˜Š•˜‘ ‘”“…˜†Š Ž•†•„Ž•„‘
‹†Š ‘”“…˜†Š …†„ŠŠ‡† ‡†Š “ˆ˜˜Š†Š ‹Š†Š †Š†…„Ž„Ž ‹†Š ”“Š›†Š††Š
”’†Š˜Š†Š£ Ÿ††„ ›ŒŠ•Œˆœ žŸ „†Ž†Š‡† ’Š˜Š†‘†Š ‘…†Ž„—„‘†Ž„ ‹Ž†
”“‘Œ•††Š ”“‹Ž††Š Ž††„ ‹†Ž†“ ˜Š•˜‘ ’“Š›†Š†‘†Š ‘„†•†Š ŽŠŽ˜Ž †•†˜
Ž˜“™‡ (†‹†Š ž˜Ž†• Ÿ•†•„Ž•„‘œ  ¡o¡).
ž“Š›†Š††Š ”’†Š˜Š†Š –„…†‡†ˆ ’Š›†‘˜” “††„ †Ž”‘ ‡†Š •Š•˜Š‡†
’’”“•„’†Š‘†Š ”“†Š ‘•“‘†„•†Š †Š•†“† ‹Ž† ‹†Š ‘Œ•†. ¥„‘ ¦Œ˜…†ŽŽ (o§§¨)
‹†…†’ ©†“„†Š ( ¡¡ª), ’…†…˜„ ‘ŒŠŽ” †“Œ”Œ…„•†Š ’Š‘†Š‘†Š †ˆ–†
”Š’†Š†Š ‹Ž† ‹†”†• •“›†”†„ ‹Š†Š †„‘ †”†„…† ‹Ž† •“Ž˜• ‹„‘†„•‘†Š
‹Š†Š ”Š’†Š†Š ‘Œ•† ‹†…†’ –„…†‡†ˆ •“Ž˜•. «•“‘†„•†Š †Š•†“† ‹Ž† ‹†Š
‘Œ•† ¤˜† ˆ†“˜Ž ‹„”†Š‹†Š ‹†“„ ˆ†… ˜‹†‡† ‹†Š „Š•“†‘Ž„ ŽŒŽ„†… ‡†Š
’’˜Š‘„Š‘†Š †‹†Š‡† •„’†… †…„‘ ‡†Š Ž†…„Š ’Š˜Š•˜Š‘†Š£
o

¬

­®¯°±²±³¯°± ¯´µ¯¶¯ ·±®¯¸¯¹ º»°¯ º¯´ ³¼µ¯ °¯´½¯µ ¾»´µ±´½ º±®¯³¿³¯´ ¿´µ¿³
À»´»´µ¿³¯´ Á»´±° ±´µ»¶Â»´°± ¯¾¯ ¸¯´½ ¯³¯´ º±Ã»¶±³¯´Ä ­»º¿¯ ·±®¯¸¯¹ µ»¶°»Ã¿µ
À»À±®±³± ±´µ»¶º»¾»´º»´°± ¸¯´½ µ±´½½± º¯®¯À ¶¯´µ¯± ³»µ»¶³¯±µ¯´ ¾»¶À±´µ¯¯´ º¯´
¾»´¯·¯¶¯´Ä ű °¯À¾±´½ ¾»¶µ±Àï´½¯´ »³¼´¼À± °»¾»¶µ± °¿º¯¹ º±¿¶¯±³¯´
°»Ã»®¿À´¸¯, ³»µ»¶³¯±µ¯´ ¯´µ¯¶¯ ³»º¿¯ ·±®¯¸¯¹ µ»¶°»Ã¿µ Á¿½¯ ¾»´µ±´½ ¿´µ¿³
À»´½¯µ¯°± À¯°¯®¯¹ ¿¶Ã¯´±°¯°± ¸¯´½ À»À±®±³± ±À¾®±³¯°± ¾¼®±µ±³Ä ­¯¶»´¯´¸¯,
³»µ»¶³¯±µ¯´ º»°¯ ³¼µ¯ µ±º¯³ °»³»º¯¶ À»Àï·¯ ±À¾®±³¯°± »³¼´¼À± µ»µ¯¾± Á¿½¯
º¯À¾¯³ ¾¼®±µ±³ (Ư¶±½¯´Ç ¬ÈÈÉ).
Ê»´½½¼®¼´½¯´ ·±®¯¸¯¹ º»°¯-¾»¶º»°¯¯´ º¯´ º»°¯-¾»¶³¼µ¯¯´ ¼®»¹ ËÊÌ
À»®±Ã¯µ³¯´ ûû¶¯¾¯ ¯¶±¯Ã»® ¸¯´½ µ»®¯¹ º±µ»µ¯¾³¯´ û¶º¯°¯¶³¯´ Ê»¶¯µ¿¶¯´ ­»¾¯®¯
˯º¯´ Ê¿°¯µ ̵¯µ±°µ±³ ͼÀ¼¶ ÉΠƯ¹¿´ ¬ÈÏÈ µ»´µ¯´½ ­®¯°±²±³¯°± Ê»¶³¼µ¯¯´ º¯´
Ê»¶º»°¯¯´ º± дº¼´»°±¯. Ñ»´½¯Ò¿ ¾¯º¯ ³¶±µ»¶±¯ º»°¯-¾»¶º»°¯¯´ º¯´ º»°¯-¾»¶³¼µ¯¯´
¸¯´½ µ»¶Ò¯´µ¿À º¯®¯À ¾»¶¯µ¿¶¯´ µ»¶°»Ã¿µ ¾»´¿®±° û¶À¯³°¿º À»®¯³¿³¯´
³®¯°±²±³¯°± º»´½¯´ À»´»¶¯¾³¯´ ±®À¿ °µ¯µ±°µ±³¯ À»´½½¿´¯³¯´ µ»³´±³ ÓÔÕÔ Ö×Ø×ØÙ.
Ñ»´¿¶¿µ ̯´µ¼°¯ (¬ÈÈÎ), ÓÔÕÔ Ö×Ø×ØÙ, °»¶±´½ Á¿½¯ º±°»Ã¿µ ÚØÛÜÝÞÓÙÞ
Ó×ßàÛáÞâã ×Ø ÓÔÕÔäÔßÞ (­ÅÅ), ¯º¯®¯¹ ³»½±¯µ¯´ ¸¯´½ À»®±¾¿µ± ¾»´½¿À¾¿®¯´Ç
¾»À¯³¯±¯´ º¯µ¯ ¹±°µ¼¶±° ¿´µ¿³ À»´»À¿³¯´ ³»µ»¶¯µ¿¶¯´Ç ¾¼®¯ ¯µ¯¿ ¹¿Ã¿´½¯´ º¯®¯À
°»µ º¯µ¯ û¶¿³¿¶¯´ û°¯¶. Æ»¶º¯¾¯µ ûû¶¯¾¯ µ»³´±³ ÓÔÕÔ Ö×Ø×ØÙ ¸¯´½ º¯¾¯µ
º±½¿´¯³¯´ º¯®¯À ¾»¶À¯°¯®¯¹¯´ ³®¯°±²±³¯°±. ͯÀ¿´Ç ¾¯º¯ ¾»¶À¯°¯®¯¹¯´ ±´± ¾»´¿®±°
¯³¯´ À»´½½¿´¯³¯´ µ»³´±³ ³®¯°±²±³¯°± åæççÛâÕ èÞàÕÛâ éÔàê×ØÞ (ÌëÑ) ¿´µ¿³
À»´½»µ¯¹¿± ³»µ»¾¯µ¯´ ¹¯°±® ³®¯°±²±³¯°± À»®¯®¿± ´±®¯± ¯³¿¶¯°± ¸¯´½ º±¾»¶¼®»¹.
åæççÛâÕ èÞàÕÛâ éÔàê×ØÞ (ÌëÑ) ¯º¯®¯¹ °¿¯µ¿ µ»³´±³ ¿´µ¿³ À»´»À¿³¯´
²¿´½°± ¾»À±°¯¹ (êãçÞâçÝÔØÞ) ¸¯´½ ñ°¯ À»À±°¯¹³¯´ º¿¯ ¹±À¾¿´¯´ º¯µ¯ º¯¶± º¿¯

ì

íîïðñ òðóô õîöõî÷ð (øðùóúíû üýýþ). ÿ÷î ÷ðñðö ø ð÷ðïð îðíñúðïíðó õððñ
 
.
 
 ÷îóôðó ðöôúó òðóô ðíñúðï ðíðó îõîöúíðó
ôîóîöðïúñðñú òðóô ïîõú õðúí ùð÷ð î÷î íïðñúúíðñú. ø õîíîöð ÷îóôðó õðúí
ùð÷ð úùóðó ÷ðð õîö÷úîóñú úóôôú (öðñîòû ü). îóôðùïúíðñúíðó î÷î
íïðñúúíðñú ø ùð÷ð ùîöðñðïððó îöñîõ ðíð ùîóïúñ îóôðõúï
Klasifikasi Wilayah Desa-Perdesaan dan Desa-Perkotaan Wilayah Kabupaten
Semarang Dengan       sebagai judul Tugas Akhir.



umu$"!"%"&
!"#
Berdasarkan pada latar belakang, rumusan masalah yang akan dibahas dalam

penelitian ini adalah mengaplikasikan metode klasifikasi      
(SVM) pada data desa-perdesaan dan desa-perkotaan di Kabupaten Semarang
untuk mengetahui ketepatan hasil klasifikasi metode tersebut melalui nilai akurasi
yang diperoleh.

' (")"!"# $"!"%"&
Batasan ruang lingkup permasalahan dari penelitian ini adalah sebagai
berikut :
1. Data yang digunakan merupakan data klasifikasi desa-perdesaan dan desaperkotaan wilayah Kabupaten Semarang.
2. Dalam penelitian ini terdiri dari sepuluh variabel independen yang
merupakan kriteria klasifikasi desa-perdesaan dan desa-perkotaan menurut
Badan Pusat Statistik.

4

3. Fungsi kernel yang digunakan untuk menentukan *+,-.,/01- terbaik pada
klasifikasi menggunakan metode SVM adalah fungsi kernel linier,

,2/+12340/ dan 50640/ 70848 9:1;? @AB
uju
Tujuan dari penelitian ini, antara lain :
1. Menentukan fungsi kernel dan parameter terbaik untuk *+,-.,/01- SVM
dengan menerapkan metode C.46 8-0.;*.
2. Menentukan *+,-.,/01- dengan parameter terbaik yang telah didapatkan
untuk klasifikasi data menggunakan SVM.
3. Evaluasi hasil klasifikasi dengan menghitung akurasi hasil prediksi
klasifikasi dengan metode SVM.