Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial

PENERAPAN ANALISIS POHON REGRESI PADA DATA
PERLINDUNGAN SOSIAL

PUTRI DWI ANDINI

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012

ABSTRAK
PUTRI DWI ANDINI. Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial.
Dibimbing oleh KUSMAN SADIK dan DIAN KUSUMANINGRUM .
Kemiskinan merupakan suatu permasalahan yang dihadapi oleh negara-negara berkembang.
Kemiskinan menyangkut suatu kondisi kekurangan dari sebuah tuntutan kehidupan yang paling
mendasar, khususnya dari aspek konsumsi, pendapatan, dan kebutuhan sosial. Salah satu upaya
yang dilakukan pemerintah dalam menanggulangi masalah kemiskinan adalah dengan mengadakan
program perlindungan sosial. Namun, program perlindungan sosial yang ada tidaklah mencukupi
dalam menurunkan tingkat resiko bagi keluarga miskin. Oleh karena itu, pemerintah perlu
melakukan evaluasi untuk melakukan klasifikasi terhadap keluarga penerima bantuan
perlindungan sosial agar program perlindungan sosial yang dilakukan tepat sasaran. CART

merupakan metodologi statistik nonparametrik yang dikembangkan untuk topik analisis
klasifikasi, baik untuk peubah respon kategorik maupun kontinu. Tujuan utama CART adalah
untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian.
Dalam penelitian ini digunakan algoritma CART dengan menggunakan pendekatan analisis pohon
regresi untuk menganalisis faktor-faktor penciri yang mempengaruhi pemberian bantuan Program
Perlindungan Sosial (PLS) di Kabupaten Bogor. Hasil analisis pohon regresi menghasilkan pohon
maksimal dengan jumlah simpul sebanyak 20 simpul yang terdiri dari 9 simpul dalam dan 11
simpul terminal. Setelah dilakukan pemangkasan dengan menggunakan 10-fold cross validation
diperoleh pohon optimal dengan jumlah simpul sebanyak 8 simpul yang terdiri dari 3 simpul
dalam dan 5 simpul terminal. Pada pohon optimal diperoleh tiga peubah penjelas yang efektif
dalam memprediksi persentase keluarga yang menerima bantuan perlindungan sosial. Persentase
keluarga yang anggotanya menjadi buruh tani muncul sebagai peubah yang paling efektif, diikuti
oleh bahan bakar untuk memasak dan persentase keluarga yang menerima kartu ASKESKIN
setahun terakhir. Hasil pengelompokan pohon regresi dapat digunakan sebagai referensi
pemerintah dalam menentukan segmentasi penerima bantuan program perlindungan sosial bagi
kelompok-kelompok desa yang berada di Kabupaten Bogor berdasarkan kombinasi peubah -peubah
penjelas yang dihasilkan.
Kata kunci : Program Perlindungan Sosial, CART, Pohon Regresi

PENERAPAN ANALISIS POHON REGRESI PADA DATA

PERLINDUNGAN SOSIAL

PUTRI DWI ANDINI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2012

Judul : Penerapan Analisis Pohon Regresi pada Data Perlindungan Sosial
Nama : Putri Dwi Andini
NRP : G14070067

Disetujui :


Pembimbing I

Pembimbing II

Dr. Ir. Kusman Sadik, M.Si.
NIP. 19690912 199702 1 001

Dian Kusumaningrum, M. Si.

Diketahui :
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M. Si.
NIP. 196504211990021001

Tanggal Lulus :

PRAKATA

Alhamdulillahi rabbil’alamin,
Puji syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia -Nya sehingga
penulis dapat menyelesaikan karya ilmiah dengan judul “Penerapan Analisis Pohon Regresi pada
Data Perlindungan Sosial”. Karya ilmiah ini merupakan hasil penelitian dalan rangka memenuhi
tugas akhir yang merupakan salah satu syarat untuk memperoleh gelar Sarjana Statistika di
Fakultas Matematika dan Ilmu pengetahuan Alam Institut Pertanian Bogor.
Terima kasih penulis ucapkan kepada berbagai pihak yang telah membantu penyelesaian karya
ilmiah ini :
1. Bapak Dr. Ir. Kusman Sadik, M. Si. dan Ibu Dian Kusumaningrum, M. Si. selaku
pembimbing yang telah meluangkan waktu, serta memberikan arahan dan masukan yang
bermanfaat bagi penulis.
2. Ibu Dra. Itasia Dina Sulvianti M. Si. selaku dosen penguji.
3. Seluruh dosen Departemen Statistika IPB atas nasehat dan ilmu yang bermanfaat.
4. Bapak, Ibu, Mas Danis, dan Virgia yang telah memberikan cinta dan kasih sayang
sepenuhnya, semangat, dan do’a yang tulus setiap waktu.
5. Seluruh staf Departemen Statistika yang telah banyak membantu penulis selama
perkuliahan di Statistika.
6. Teman-teman Statistika 44 atas kebersamaan dan keceriaannya selama ini.
Semoga tulisan ini dapat bermanfaat bagi semua pihak yang membutuhkan.


Bogor, Februari 2012

Putri Dwi Andini

RIWAYAT HIDUP
Penulis dilahirkan di Gisting, Lampung pada tangal 11 Agustus 1989 sebagai anak kedua dari
tiga bersaudara dari pasangan Bapak Fathulloh, S.P. dan Ibu Sunarsih. Penulis telah berhasil
menyelesaikan pendidikannya di Sekolah Dasar Negeri (SDN) 4 Gisting Bawah pada tahun 2001.
Jenjang pendidikan selanjutnya penulis tempuh di Sekolah Menengah Pertama Negeri (SMPN) 2
Talang Padang dan lulus pada tahun 2004. Penulis menamatkan pendidikannya di Sekolah
Menengah Atas (SMA) AL-Kautsar Bandar Lampung pada tahun 2007 dan pada tahun yang sama
penulis diterima sebagai mahasiswa Departemen Statistika, Institut Pertanian Bogor (IPB) melalui
jalur Seleksi Penerimaan Mahasiswa Baru (SPMB).
Selama mengikuti perkuliah penulis aktif menjadi pengurus Himpunan Profesi Gamma Sigma
Beta (GSB) Departemen Statistika sebagai staff Beta Club pada periode kepengurusan 2010-2011.
Penulis melaksanakan praktik lapang pada tanggal 07 Februari sampai 01 April 2011 di PT
Mediatrac Fractal Collective Intelligence (MFCI), Jakarta Selatan.

DAFTAR ISI
Halaman

DAFTAR TABEL................................................................................................................................... vii
DAFTAR GAMBAR.............................................................................................................................. vii
DAFTAR LAMPIRAN .......................................................................................................................... vii
PENDAHULUAN
Latar Belakang .............................................................................................................................. 1
Tujuan ............................................................................................................................................ 1
TINJAUAN PUSTAKA
Metode Pohon Regresi ................................................................................................................ 1
Aturan Penyekatan ................................................................................................................ 2
Proses Penyekatan................................................................................................................. 2
Aturan Penghentian .............................................................................................................. 2
Aturan Pemangkasan ............................................................................................................ 3
Validasi .................................................................................................................................. 3
Pemilihan Pohon Regresi Terbaik....................................................................................... 3
Aturan Penentuan Dugaan Respon .................................................................................... 3
METODOLOGI
Data................................................................................................................................................. 4
Metode ........................................................................................................................................... 4
HASIL DAN PEMBAHASAN
Deskripsi Data............................................................................................................................... 4

Pohon Regresi Program Perlindungan Sosial Kabupaten Bogor ......................................... 6
Pemangkasan (Prunning) Pohon Regresi Maksimal untuk Menghasilkan Pohon
Regresi Optimal............................................................................................................................. 6
SIMPULAN DAN SARAN
Simpulan ....................................................................................................................................... 8
Saran ............................................................................................................................................... 8
DAFTAR PUSTAKA .............................................................................................................................. 8
LAMPIRAN ............................................................................................................................................... 9

vii

DAFTAR TABEL
Halaman
1

Matriks korelasi antara peubah Y dan peubah X2 , X8 , dan X5 ....................................................................... 6

DAFTAR GAMBAR
Halaman
1

2
3
4
5
6
7
8

Struktur pohon regresi ................................................................................................................... 2
Persentase pengguna bahan bakar untuk memasak .................................................................. 4
Persentase tempat pembuangan sampah sebagian besar penduduk...................................... 5
Persentase sumber air yang digunakan untuk memasak atau minum..................................... 5
Persentase sertifikasi lahan tempat tinggal penduduk ............................................................. 5
Boxplot sebaran data peubah X2 , X8 , dan X9 ............................................................................ 5
Grafik banyaknya simpul terhadap kuadrat tengah galat ........................................................ 7
Struktur pohon optimal hasil pemangkasan ............................................................................... 7

DAFTAR LAMPIRAN
1
2

3
4
5
6
7
8
9

Halaman
Diagram alir pembentukan pohon regresi .............................................................................. .10
Diagram alir pembentukan pohon regresi maksimal ............................................................. .11
Diagram alir pembentukan pohon regresi optimal ................................................................ .12
Tabel peubah bebas yang digunakan beserta kategorinya ................................................. .13
Deskripsi peubah-peubah numerik .......................................................................................... .14
Deskripsi peubah-peubah kategorik ........................................................................................ .14
Struktur pohon maksimal persentase keluarga penerima bantuan PLS............................. .15
Struktur pohon optimal persentase keluarga penerima bantuan PLS ................................ .16
Program R .................................................................................................................................... .17

1


PENDAHULUAN
Latar Belakang
Kemiskinan
merupakan
suatu
permasalahan yang dihadapi oleh negaranegara berkembang. Kemiskinan menyangkut
suatu kondisi kekurangan dari sebuah tuntutan
kehidupan yang paling mendasar, khususnya
dari aspek konsumsi, pendapatan, dan
kebutuhan sosial (iridsindonesia.com).
Mayoritas penduduk Indonesia rentan
terhadap kemiskinan. Hampir 40% dari
penduduk, hidup hanya sedikit di atas garis
kemiskinan
nasional
dan
mempunyai
pendapatan kurang dari US$ 2 per hari.
Perubahan sedikit saja dalam tingkat harga,

pendapatan, dan kondisi kesehatan dapat
menyebabkan
mereka
berada
dalam
kemiskinan, walaupun hanya untuk sementara
waktu. Salah satu upaya yang dilakukan
pemerintah dalam menanggulangi masalah
kemiskinan adalah dengan mengadakan
program perlindungan
sosial. Namun,
program perlindungan sosial yang ada
tidaklah mencukupi dalam menurunkan
tingkat resiko bagi keluarga miskin. Kondisi
ini dapat diperbaiki dengan menyediakan
program perlindungan sosial yang lebih
bermanfaat bagi penduduk miskin serta
masyarakat yang rentan terhadap kemiskinan
(siteresources.worldbank.org). Oleh karena
itu, pemerintah perlu melakukan evaluasi
dalam
melakukan
klasifikasi
terhadap
keluarga penerima bantuan perlindungan
sosial agar program perlindungan sosial yang
dilakukan tepat sasaran.
Penelitian ini menggunakan analisis pohon
regresi untuk memprediksi faktor-faktor yang
mempengaruhi
pemberian
bantuan
perlindungan sosial. Pohon regresi bertujuan
untuk
menghasilkan
segmentasi atau
pengelompokan
pengamatan
menjadi
beberapa kelompok, dimana pengamatan yang
berada pada satu kelompok umumnya lebih
homogen dibandingkan kelompok yang lain.
Metode pohon regresi mampu mengeksplorasi
struktur data yang kompleks baik dimensinya
maupun
jenis
peubahnya,
mampu
mengidentifikasi peubah yang kontribusinya
dominan terhadap peubah respon, serta hasil
analisisnya relatif lebih mudah untuk
diinterpretasikan terutama bagi pengguna
yang bukan statistisi (Lewis 2000). Hasil
penelitin ini diharapkan mampu memberian
segmnentasi desa-desa penerima bantuan
perlindungan sosial di Kabupaten Bogor.

Tujuan
Menentukan
peubah-peubah
paling
penting dalam memprediksi pemberian
bantuan Program Perlindungan Sosial (PLS)
di Kabupaten Bogor dengan menggunakan
pendekatan pohon regresi.
TINJAUAN PUSTAKA
Metode Pohon Regresi
Classification
And Regression Tree
(CART) merupakan metodologi statistik
nonparametrik yang dikembangkan untuk
topik analisis klasifikasi, baik untuk peubah
respon kategorik maupun kontinu (Breiman et
al. 1993). CART menghasilkan suatu pohon
klasifikasi jika peubah responnya kategorik,
dan menghasilkan pohon regresi jika peubah
responnya kontinu. Tujuan utama CART
adalah untuk mendapatkan suatu kelompok
data yang akurat sebagai penciri dari suatu
pengklasifikasian.
Pohon regresi adalah salah satu metode
atau algoritma dari salah satu teknik pohon
keputusan (decision tree) yang dibentuk
melalui suatu algoritma penyekatan (if-then
logical) secara rekursif. Seperti halnya regresi
biasa, metode ini juga digunakan untuk
mengetehui pengaruh peubah penjelas
terhadap peubah respon. Perbedaannya adalah
pada pohon regresi, pendugaan respon
dilakukan
pada
kelompok-kelompok
pengamatan yang dibentuk berdasarkan
peubah-peubah penjelasnya, bukan untuk
keseluruhan data sehingga interpretasi hasil
mudah dilakukan. Metode pohon regresi
menghasilkan
kelompok-kelompok
pengamatan yang dicirikan oleh peubahpeubah yang memisahkan simpul. Peubahpeubah penjelas yang dianggap berpengaruh
terhadap respon adalah peubah-peubah yang
muncul sebagai pemisah (Breiman et al.,
1993). Beberapa sifat yang dimiliki metode
pohon ragresi antara lain:
1. Tidak memerlukan spesifikasi bentuk
fungsional modelnya.
2. Kekar terhadap pengaruh pencilan.
3. Dapat menangani peubah bebas kategorik
dan kontinu secara lebih baik.
4. Dapat menangani pengamatan data hilang
pada satu atau beberapa peubah bebasnya.
Metode pohon regresi secara teknis
dikenal sebagai metode penyekatan rekursif
biner. Proses penyekatannya adalah biner
karena kumpulan data yang disebut simpul
selalu disekat menjadi dua sekatan yang
disebut simpul anak. Menurut Brieman et al.

2

(1993), aturan utama dari algoritma CART
secara umum adalah:
1. Penyekatan setiap simpul
2. Penetapan simpul akhir
3. Penentuan nilai dugaan respon bagi setiap
simpul akhir.
Struktur pohon regresi memiliki satu
simpul akar yang dinyatakan dengan t 1 yang
mengandung semua gugus data (Gambar 1).
Simpul dalam adalah simpul yang masih bisa
disekat menjadi simpul anak atau simpul
dalam. Simpul dalam dilambangkan dengan
lingkaran (t 2 , t 3 , t7 ), sedangkan simpul akhir
atau simpul terminal adalah simpul yang tidak
bisa disekat lagi. Simpul akhir dilambangkan
dengan kotak (t 4 , t5 , t6 , t 8 , t9 ).

t1

t3

t2

t4

t5

t6

t7

t8

t9

Gambar 1 Struktur pohon regresi
Aturan Penyekatan
Pohon regresi dibentuk melalui penyekatan
gugus data dengan sederetan penyekatan biner
sampai dihasilkan simpul akhir (Breimann et
al. 1993). Untuk menyekat suatu simpul
menjadi dua simpul anak dilakukan dengan
aturan sebagai berikut:
1. Setiap penyekatan tergantung dari nilai
yang berasal dari satu peubah penjelas.
2. Untuk peubah kontinu Xj , penyekatan
yang diperbolehkan adalah Xj ≤ c, dimana
c adalah nilai tengah antara dua nilai
amatan peubah Xj secara berurutan. Jadi
jika Xj memiliki nilai n yang berbeda maka
akan ada n-1 penyekatan.
3. Untuk
peubah
penjelas
kategorik,
penyekatan yang terjadi berasal dari semua
kemungkinan penyekatan berdasarkan
terbentuknya dua anak gugus yang saling
lepas (disjoint). Jika Xj adalah peubah
kategorik nominal dengan L kategori,
maka akan ada 2L-1 -1 penyekatan.

Sedangkan jika berupa kategorik ordinal
maka aka nada L-1 penyekatan.
Proses Penyekatan
Menurut Breimann et al. (1993) proses
penyekatan pada tiap simpul adalah dengan
cara sebagai berikut:
1. Tentukan semua kemungkinan penyekatan
pada tiap peubah penjelas.
2. Pilih penyekatan terbaik dari masingmasing peubah penjelas dan pilih
penyekatan
terbaik
dari kumpulan
penyakatan terbaik tersebut. Penyekatan
terbaik dihitung berdasarkan selisih jumlah
kuadrat deviasi dari masing-masing simpul
anak dengan simpul induknya. Selisih
terbesar akan dijadikan penyekat terbaik.
Jumlah kuadrat galat (JKG) pada simpul
ke-t dijadikan sebagai kriteria kehomogenan
di dalam masing-masing simpul. Misalkan
simpul t berisi anak contoh {(Xn , Yn )}, N(t)
adalah banyaknya amatan dalam simpul t, dan
rataan respon dalam simpul t diduga oleh
rataan respon dalam simpul t tersebut, yang
dihitung sebagai berikut:
∑ �
̅(t) =
Sedangkan jumlah kuadrat galat pada simpul t
dinyatakan sebagai:
JKG(t) = ∑ �
̅(t)]2
Misalkan ada penyekatan s yang menyekat
t menjadi simpul anak kiri
dan simpul anak
kanan
, fungsi penyekat yang digunakan
adalah:
(s,t) = JKG(t) – {JKG( ) + JKG( )}
dimana (s,t) adalah fungsi penyekat pada
pohon regresi, JKG(t ) adalah jumlah kuadrat
galat simpul induk, dan JKG( ) adalah
jumlah kuadrat galat simpul anak kiri, dan
JKG( )} adalah jumlah kuadrat galat simpul
anak kanan. Penyekatan terbaik s* adalah:
(s*,t) = �� ��� (s,t)
dengan S adalah gugus yang berisi semua
kemungkinan penyekatan.

Aturan Penghentian
Jika penyekatan terbaik ditemukan, maka
data disekat menjadi dua bagian. Dua bagian
disebut simpul anak kiri dan simpul anak
kanan. Proses penyekatan diulang lagi
terhadap dua simpul anak. Sampai tak
mungkin disekat lagi dan dihentikan. Breiman
et al. (1993) menyatakan bahwa proses
rekursif berakhir jika banyaknya amatan pada
simpul akhir ≤ 5. Selain jumlah amatan
minimum, kriteria penghentian pohon regresi
adalah
dengan
memaksimumkan

3

kehomogenan ragam pada tiap simpul, serta
dipengaruhi juga oleh peubah-peubah yang
berpengaruh terhadap respon. Simpul yang tak
bisa disekat lagi disebut simpul akhir.
Aturan Pemangkasan
Pohon yang dibentuk pada proses
penyekatan berukuran sangat besar. Hal ini
karena aturan pemberhentian berdasarkan
banyaknya amatan pada simpul akhir atau
besarnya peningkatan kehomogenan. Cara
untuk mengatasi masalah ini adalah mencari
pohon dengan ukuran yang layak. Pencarian
pohon dengan ukuran yang layak dilakukan
dengan kriteria sebagai berikut:
1. Penentuan pohon awal yang besar
2. Secara iteratif pohon tersebut di pangkas
(pruning) menjadi deretan pohon yang
makin kecil dan tersarang
3. Dipilih pohon yang terbaik dari deretan ini
dengan menggunakan sample uji (test
sample) atau sampel validasi silang (cross
validation sample)
Langkah awal pemangkasan dilakukan T1 ,
yaitu subpohon yang memenuhi kriteria R(T 1 )
= R(Tmax). Untuk mendapatkan T 1 dan Tmax
ambil t L dan t R yang merupakan simpul anak
kiri dan simpul anak kanan dari T max yang
dihasilkan dari pemilihan pada setiap simpul
induk t. Karena R(t) = R(t L ) + R(t R), maka
pangkas simpul anak t L dan t R tersebut. Ulangi
proses ini sampai tidak ada lagi pemangkasan
yang mungkin (Breiman et al. 1993).
Inti dari pemangkasan cost complexity
minimum adalah pemotongan hubungan
terlemah (weakest link ) pada pohon regresi.
Untuk sembarang Tt yang merupakan cabang
dari T1 , besar rataan kuadrat kesalahan
didefinisikan
R(Tt ) = ∑ � �
dengan R(Tt ) adalah kuadrat tengah galat
subpohon dan ∑ � �
adalah jumlah
kuadrat tengah simpul kiri dan simpul kanan
hasil pemilahan subpohon.
Validasi
Validasi silang pada pohon regresi
dilakukan sebelum proses pemangkasan.
Aspek terpenting adalah kestabilan dari
pendugaan pohon regresi yang diperoleh.
Kestabilan pohon regresi dapat bernilai
rendah jika pohon regresi mengandung terlalu
banyak peubah penjelas atau jika dua atau
lebih peubah penjelas memiliki korelasi tinggi
(multikolinieritas).
Cara
terbaik
untuk
melakukan proses validasi dan pemangkasan
yaitu dengan menggunakan kelompok data
peubah bebas (penjelas)
untuk proses

validasi. Data dibagi menjadi 10 kelompok.
Sembilan kelompok data digunakan untuk
membangun pohon regresi dan 10 kelompok
data digunakan untuk proses validasi
(Breiman et al. 1993). Proses ini diulang
dalam 10 cara yang berbeda, sehingga setiap
kelompok data digunakan untuk validasi
silang.
Menurut Dietterich (1998) dan Kuhnerta et
al. (2000) dalam Mendes dan Akkartal (2009)
proses validasi silang lipat 10 (10- fold cross
validation) akan menghasilkan sebuah pohon
akhir. Penduga kuadrat tengah galat validasi
silang lipat 10 dirumuskan dengan
Rcv (Tk) =
cv



∑�


̅�



dengan R (Tk) merupakan kuadrat tengah
galat pohon optimal hasil pemangkasan, N
adalah jumlah pengamatan dalam simpul k,
� adalah nilai dari peubah respon, dan ̅(k)
adalah rataan dari simpul k.
Pohon terbaik adalah Tk0 yaitu :
Rcv (Tk0 ) = min Rcv (Tk)
dengan R (Tk0 ) merupakan kuadrat tengah
galat pohon regresi optimal terbaik (Breiman
et al. 1993)
cv

Pemilihan Pohon Regresi Terbaik
Keragaman yang dapat dijelaskan dalam
CART adalah sebagai berikut :
] x 100%

�� = [

dengan
�� adalah keragaman yang dapat
dijelaskan oleh pohon regresi, � �� �� adalah
kuadrat tengah galat pohon regresi hasil
pemangkasan, dan � adalah kuadrat tengah
galat dari peubah respon (kuadrat tengah galat
dari simpul akar).
� = ∑�





̅

dengan � adalah nilai dari peubah respon dan
̅ adalah nilai rataan dari peubah respon
(Breiman et al. 1993).
Aturan Penentuan Nilai Dugaan Respon
Setelah pohon regresi terbentuk, maka
CART akan menghitung ringkasan statistik
dari masing-masing simpul akhir. Apabila
metode kuadrat terkecil dipilih sebagai aturan
penyekatan, maka akan dihitung rataan dan
standar deviasi dari peubah respon. Nilai
rataan pada simpul akhir merupakan nilai
dugaan dari peubah respon pada kasus simpul
terakhir tersebut (Komalasari 2005).

4

METODOLOGI
Data
Data yang digunakan untuk analisis ini
adalah data Potensi Desa/Kelurahan (PODES)
dan data Pendataan Program Perlindungan
Sosial (PPLS) tahun 2010 di Kabupaten
Bogor, di mana kriteria keterangan rumah
tangga yang digunakan adalah status
penguasaan bangunan, luas dan jenis lantai,
jenis dinding dan atap, sumber air minum,
sumber penerangan, bahan bakar untuk
memasak,
fasilitas
buang air besar,
kepemilikan asset, dan kepesertaan dalam
program perlindungan sosial.
Peubah respon yang diamati berasal dari
data PPLS dari setiap desa di Kabupaten
Bogor, di mana peubah responnya berupa
persentase keluarga yang menerima bantuan
perlindungan sosial. Sedangkan peubah
penjelas yang digunakan sebagai berikut:
X1 =
Bahan bakar untuk memasak
X2 =
Persentase keluarga yang menerima
kartu ASKESKIN setahun terakhir
X3 =
Persentase surat miskin yang
dikeluarkan desa setahun terakhir
X4 =
Tempat
sebagian
penduduk
membuang sampah
X5 =
Tempat buang air besar
X6 =
Tempat
penampungan
sampah
sementara
X7 =
Jenis permukaan jalan yang terluas
X8 =
Persentase pengguna PLN
X9 =
Persentase keluarga yang anggotanya
menjadi buruh tani
X10 =
Sumber air untuk memasak atau
minum pada umumnya
X11 =
Sertifikasi sebagian besar lahan
tempat tinggal penduduk
X12 =
Jumlah TKI
Metode
Tahapan-tahapan yang dilakukan dalam
penelitian ini adalah:
1. Tahap awal adalah proses persiapan data.
2. Pemilihan peubah-peubah penjelas yang
akan dianalisis dari data podes.
3. Membangun pohon regresi dengan
algoritma CART.
a. Penyekatan pada setiap peubah
penjelas.
b. Pemilihan penyekat terbaik dengan
kriteria jumlah kuadrat galat terkecil.
c. Menentukan nilai dugaan respon pada
setiap simpul.
4. Pemangkasan (pruning) pohon regresi
untuk menghasilkan pohon regresi
optimal.

5. Melakukan interpretasi hasil analisis.
HASIL DAN PEMBAHASAN
Deskripsi Data
Jumlah desa yang digunakan sebanyak 428
desa yang terletak di Kabupaten Bogor.
Peubah penjelas yang digunakan berjumlah 12
buah. Deskripsi untuk peubah penjelas
numerik dapat dilihat pada Lampiran 5,
sedangkan
deskripsi peubah penjelas
kategorik dapat dilihat pada Lampiran 6.
Berdasarkan Lampiran 5 terlihat bahwa
rata-rata persentase keluarga yang menerima
kartu ASKESKIN setahun terakhir sebesar
24.03%, rata-rata persentase surat keterangan
tidak mampu (SKTM) yang dikeluarkan desa
setahun terakhir sebesar 4.554%, dan rata-rata
persentase keluarga yang anggotanya menjadi
buruh tani sebesar 22.57%. Rata-rata
persentase
ketiga
peubah
tersebut
menunjukkan bahwa angka kemiskinan di
Kabupaten Bogor cukup rendah. Mayoritas
penduduk desa di Kabupaten Bogor sudah
menggunakan listrik yang dikelola oleh PLN.
Hal tersebut dapat dilihat dari tingginya ratarata persentase pengguna PLN yaitu sebesar
90.70%. Rata-rata jumlah TKI di desa yang
berada di Kabupaten Bogor sebanyak 4 orang,
dengan desa dengan jumlah TKI terbanyak
yaitu Desa Tengah, Kecamatan Cibinong
dengan jumlah TKI sebanyak 244 orang.
LPG
1.17%

kayu
bakar
23.83%

minyak
tanah
75%

Gambar 2 Persentase pengguna bahan bakar
untuk memasak
Berdasarkan Gambar 2 terlihat bahwa
sebagian besar masyarakat di Kabupaten
Bogor masih menggunakan minyak tanah
sebagai bahan bakar untuk memasak dengan
persentase 75%, 23.83% menggunakan kayu
bakar,
dan
sisanya
sebesar
1.17%
menggunakan gas LPG sebagai bahan bakar
untuk
memasak.
Hal
tersebut
mengindikasikan bahwa minyak tanah dan
kayu bakar masih diminati oleh sebagian
besar penduduk di Kabupaten Bogor.

5

lainnya
21.73%

memasak dan minum masing-masing sebesar
1.87% dan 0.47%.

sungai
6.77%

tempat
sampah
5.61%

SHGB
akta 0.47%
jual beli
5%

dalam
lubang
65.98%

Persentase tempat pembuangan
sampah
sebagian
besar
penduduk

Berdasarkan Gambar 3 dapat terlihat
bahwa sebagian besar masyarakat di
Kabupaten Bogor membuang sampah di
dalam lubang kemudian dibakar dengan
persentase sebesar 65.98%, tempat sampah
sebesar 5.61%, serta sungai dan lainnya
masing-masing sebesar 6.77% dan 21.73%.
Namun, sebagian besar desa yang berada di
Kabupaten bogor belum memiliki tempat
penampungan sampah sementara. Hal ini
dapat dilihat pada Lampiran 6 dimana hanya
78 desa yang sudah memiliki tempat
penampungan sampah sementara. Mayoritas
penduduk di desa-desa yang berada di
Kabupaten Bogor sudah mempunyai tempat
buang air besar sendiri, terlihat dari besarnya
persentase penduduk yang mempunyai
jamban sendiri. Hal ini menunjukkan bahwa
mayoritas penduduk di Kabupaten Bogor
sudah memiliki sanitasi yang baik.
pompa
listrik PAM
12.38% 1.87%

mata air
17.52%
sungai/
danau
0.47%

girik/let
ter C
88%

Gambar 5 Persentase sertifikasi lahan tempat
tinggal penduduk
Pada Gambar 5 terlihat bahwa sebagian
besar penduduk menggunakan girik/letter C
sebagai bukti kepemilikan lahan tempat
tinggal dengan persentase sebesar 88%, dan
hanya 7% penduduk di Kabupaten Bogor
yang sudah memiliki sertifikat hak milik
sebagai bukti kepemilikan lahan tempat
tinggal. Sisanya, persentase sertifikat hak
guna bangunan dan akta jual beli masingmasing 0.47% dan 4.90%.
Boxplot of X2, X3, X8, X9
100

80

Persentase

Gambar 3

sertifika
si hak
milik
7%

60

40

20

0
X2

X3

X8

X9

Gambar 6 Boxplot sebaran data peubah X2 ,
X3 , X8 , dan X9
sumur
67.76%

Gambar 4

Persentase sumber air yang
digunakan untuk memasak
atau minum pada umumnya

Sebagian besar masyarakat di Kabupaten
Bogor menggunakan air sumur untuk
keperluan memasak dan minum. Hal tersebut
terlihat pada Gambar 4 dimana pesentase
pengguna air sumur yaitu sebesar 67.76%,
persentase pengguna mata air sebesar 17.52%,
persentase pengguna pompa listrik sebesar
12.38%, serta persentase pengguna PAM/air
kemasan dan sungai/danau untuk keperluan

Desa-desa di Kabupaten memiliki angka
kemiskinan yang cukup rendah. Hal tersebut
terlihat dari boxplot pada Gambar 6.
Berdasarkan Gambar 6 terlihat bahwa 75%
desa di Kabupaten Bogor memiliki persentase
penerima kartu ASKESKIN setahun terakhir
(X2 ) dibawah 40% dan seluruh desa di
Kabupaten bogor memiliki persentase surat
miskin yang dikeluarkan desa setahun terakhir
(X3 ) dibawah 40%. Hal ini mengindikasikan
bahwa desa-desa yang ada di Kabupaten
Bogor dikategorikan sebagai desa tidak
miskin. Hampir semua desa di Kabupaten
Bogor menggunakan listrik yang dikelola oleh
PLN. Hal ini terlihat dari persentase desa

6

pengguna PLN dimana lebih dari 75% desadesa di Kabupaten Bogor memiliki persentase
pengguna PLN (X9 ) diatas 80%. Namun, ada
satu desa di Kabupaten Bogor dengan
persentase pengguna PLN masih dibawah
20% yaitu Desa Cisarua, Kecamatan
Sukajaya. Gambar 6 juga menunjukkan bahwa
sebagian besar desa di Kabupaten Bogor
memiliki
persentase
keluarga
yang
anggotanya menjadi buruh tani (X9 ) dibawah
40%. Hal tersebut menunjukkan bahwa masih
banyak masyarakat di desa-desa yang ada di
Kabupaten Bogor yang bekerja di luar sektor
pertanian.
Nilai korelasi antara peubah X2 , X3 , X8 ,
X9 , dan X12 dilihat pada Tabel 1.
Tabel 1 Matriks korelasi antara peubah X2 ,
X3 , X8 , X9 , dan X12
X2

X3

X8

X3

0.113

X8

-0.258

X9

0.169

0.096

-0.136

X12

-0.045

-0.000

-0.001

X9

0.070
-0.045

Berdasarkan Tabel 1 terlihat korelasi
antara beberapa peubah penjelas cukup
rendah. Hal tersebut menunjukkan tidak
adanya multikolinieritas sehingga tidak
mempengaruhi kestabilan dari pohon regresi
yang akan dihasilkan.
Pohon Regresi Program Perlindungan
Sosial Kabupaten Bogor
Pohon regresi Program Perlindungan
Sosial (PLS) Kabupaten Bogor menghasilkan
20 simpul yang terdiri dari 9 simpul dalam
(internal node) dan 11 simpul terminal
(terminal node) dengan keragaman pada
peubah respon yang dapat dijelaskan oleh
model sebesar 46.77%. Hal ini menunjukkan
bahwa sebesar 46.77% keragaman persentase
penerima bantuan PLS dapat dijelaskan oleh
peubah penjelas yang memberikan pengaruh
signifikan
dalam pembentukan pohon
maksimal. Dari 11 simpul yang terbentuk
pada pohon maksimal maka persentase
keluarga penerima bantuan PLS dapat
dikelompokkam
menjadi
11
kelompok
dengan
berbagai karakteristik peubah
penjelasnya.
Simpul
akhir
merupakan
kelompok desa dengan persentase perolehan
bantuan PLS yang relatif homogen. Struktur
pohon maksimal dapat dilihat pada Lampiran
7.

Berdasarkan pohon regresi maksimal yang
terbentuk, ternyata tidak semua peubah
penjelas yang digunakan untuk menduga
persentese pemerima bantuan PLS masuk ke
dalam model. Peubah X4 , X5 , X6 , X7 , dan X12
tidak muncul dalam pembentukan pohon
maksimal artinya peubah-peubah tersebut
bukan merupakan peubah yang efektif dalam
memprediksi persentase keluarga penerima
bantuan PLS. Peubah yang paling efektif
dalam memprediksi persentase keluarga
pemerima bantuan PLS adalah persentase
keluarga yang anggotanya menjadi buruh tani
(X9 ). Jadi, peubah persentase keluarga yang
anggotanya menjadi buruh tani merupakan
peubah yang mempunyai kontribusi utama
dalam pembentukan pohon regresi maksimal.
Peubah lain yang berpengaruh adalah X1 , X2 ,
X3 , X8 , X10 , dan X11 . Setelah diperoleh pohon
maksimal, dilakukan proses pemangkasan
untuk mendapatkan pohon optimal. Hal ini
bertujuan untuk mendapatkan pohon regresi
yang lebih sederhana dengan prediksi
kesalahan yang cukup kecil.
Berdasarkan penelitian sebelumnya yang
dilakukan oleh Mendes dan Akkartal (2009),
pohon regresi yang digunakan adalah pohon
regresi optimal. Hal tersebut dikarenakan
pohon
optimal
lebih
efektif
dalam
memprediksi persentase penerima bantuan
PLS dan memudahkan dalam interpretasi
pohon regresi.
Pemangkasan (Pruning) Pohon Regresi
Maksimal untuk Menghasilkan Pohon
Regresi Optimal
Pohon regresi yang terbentuk melalui
proses pemilahan secara rekursif akan
berukuran sangat besar. Hal ini dikarenakan
aturan penghentian (stopping rule) yang
digunakan hanya berdasarkan banyaknya
jumlah amatan pada simpul terminal minimal
lima atau penurunan tingkat keragaman nilai
persentase keluarga penerima bantuan
perlindungan sosial dalam simpul anakan
hasil pemilahan. Oleh kerena itu, perlu
dilakukan pemangkasan untuk memperoleh
pohon regresi optimal yang berukuan
sederhana tetapi memberikan kesalahan
prediksi yang cukup kecil. Pemangkasan
dilakukan dengan proses validasi silang yaitu
dengan menggunakan validasi silang lipat 10
(10fold
cross
validation)
untuk
menghasilkan pohon regresi terbaik. Hasil
proses validasi silang terlihat pada Gambar 7.
Berdasarkan Gambar 7 terlihat bahwa
pohon regresi dengan lima buah simpul akhir
memiliki kuadrat tengah galat terkecil,

7

3200

1200

740

-Inf

50000

55000

14000

45000

Kuadrat
Tengah Galat
deviance

60000

sehingga pohon regresi dengan lima buah
simpul akhir dari total 8 simpul dipilih
sebagai pohon regresi optimal terbaik hasil
dari proses validasi silang lipat 10.

2

4

6

8

10

Banyaknya size
Simpul Akhir

Gambar 7

Grafik kuadrat tengah galat
terhadap banyaknya simpul
akhir

Pohon regresi optimal persentase keluarga
penerima bantuan PLS memiliki keragaman
pada peubah respon yang dapat dijelaskan
oleh model sebesar 38.31%. Hal ini
menunjukkan
bahwa
sebesar
38.31%
keragaman persentase keluarga penerima
bantuan PLS dapat dijelaskan oleh peubahpeubah penjelas yang memberikan pengaruh
signifikan dalam pembentukan pohon optimal.
Dari lima simpul yang terbentuk maka
persentase keluarga penerima bantuan PLS
dapat dikelompokkan menjadi lima kelompok
pendugaan dengan berbagai karakteristik
peubah penjelasnya. Gambar 8 merupakan
struktur pohon optimal persentase keluarga
penerima PLS. Deskripsi struktur pohon
optimal dapat dilihat pada Lampiran 8.
X9 < 3.4

|

X1:ab
14.15

X2 < 15.2

X2 < 62.08

33.00
22.50

Gambar 8

47.50

29.96

Struktur pohon optimal hasil
pemangkasan

Berdasarkan deskripsi pohon optimal pada
Lampiran 8, persentase penerima bantuan PLS
pada Node 0 atau simpul akar dibagi menjadi
dua simpul berdasarkan persentase keluarga
yang anggotanya menjadi buruh tani sebagai
Simpul 1 (X9 ≤ 3.4%) dan Simpul 2 (X9 >
3.4%). Jadi, persentase keluarga yang
anggotanya menjadi buruh tani adalah peubah
yang paling efektif dalam memprediksi
persentase keluarga penerima bantuan PLS.
Nilai dugaan bagi persentase keluarga
penerima bantuan PLS pada Simpul 1 dan
Simpul 2 masing-masing adalah 14.15% dan
29.28%. Proporsi dari persentase keluarga
penerima bantuan PLS pada Simpul 1 dan
Simpul 2 adalah 17.52% dan 82.48% dari
total keseluruhan data amatan.
Simpul 2 yang dihasilkan oleh persentase
keluarga yang anggotanya menjadi buruh tani
dibagi menjadi simpul baru berdasarkan jenis
bahan bakar yang digunakan untuk memasak.
Namun, pada persentase keluarga yang
anggotanya menjadi buruh tani ≤ 3.4%
(Simpul 1) tidak terbentuk simpul baru. Hal
ini dikarenakan pada Simpul 1 menunjukkan
kehomogenan kelompok yang disebut simpul
terminal. Oleh karena itu, Simpul 1 lebih
efisien dibandingkan Simpul 2 dalam
memprediksi persentase keluarga penerima
bantuan PLS.
Bahan bakar yang digunakan untuk
memasak adalah peubah kedua yang memiliki
pengaruh
paling
signifikan
untuk
memprediksi presentase keluarga penerima
bantuan PLS. Berdasarkan jenis bahan bakar
yang digunakan untuk memasak, sebanyak
353 amatan pada Simpul 2 dibagi menjadi dua
simpul baru, yaitu Simpul 3 dengan jenis
bahan bakar yang digunakan untuk memasak
berupa gas LPG dan minyak tanah dan Simpul
4 dengan bahan bakar yang digunakan untuk
memasak berupa kayu bakar. Persentase
keluarga yang anggotanya menjadi buruh tani
> 3.4% dan jenis bahan bakar yang digunakan
untuk memasak berupa LPG dan minyak
tanah memberikan nilai prediksi bagi
persentase keluarga penerima bantuan PLS
sebesar 27.32%. Persentase keluarga yang
anggotanya menjadi buruh tani > 3.4% dan
kayu bakar sebagai bahan bakar untuk
memasak memberikan nilai prediksi sebesar
34.32% bagi persentase keluarga penerima
bantuan PLS.
Berdasarkan persentase keluarga yang
menerima kartu ASKESKIN setahun terakhir,
persentase keluarga yang menerima bantuan
perlindungan sosial pada Simpul 3 dan Simpul
4 dibagi menjadi simpul-simpul baru. Simpul

8

3 mempunyai simpul baru yaitu Simpul 5 (X2
≤ 15.2 %) dan Simpul 6 (X2 > 15.2%),
sedangkan Simpul 4 mempunya simpul baru
yaitu Simpul 7 (X2 ≤ 62.08) dan Simpul 8 (X2
> 62.08). Hal ini menunjukkan bahwa
disamping
persentase
keluarga
yang
anggotanya menjadi buruh tani dan bahan
bakar yang digunakan untuk memasak,
persentase keluarga yang menerima kartu
ASKESKIN setahun terakhir juga dapat
digunakan untuk memprediksi persentase
keluarga penerima bantuan PLS.
Persentase keluarga yang anggotanya
menjadi buruh tani > 3.4%, jenis bahan bakar
yang digunakan untuk memasak berupa LPG
dan minyak tanah, dan persentase keluarga
yang menerima kartu ASKESKIN setahun
terakhir ≤ 15.2% memberikan nilai prediksi
bagi persentase keluarga penerima bantuan
PLS sebesar 22.50%, sedangkan persentase
keluarga yang anggotanya menjadi buruh tani
> 3.4%, jenis bahan bakar yang digunakan
untuk memasak berupa LPG dan minyak
tanah, dan persentase keluarga yang menerima
kartu ASKESKIN setahun terakhir > 15.2%
memberikan nilai prediksi bagi persentase
keluarga penerima bantuan PLS sebesar
29.96%.
Persentase keluarga yang anggotanya
menjadi buruh tani > 3.4%, jenis bahan bakar
yang digunakan untuk memasak berupa kayu
bakar, dan persentase keluarga yang
menerima kartu ASKESKIN setahun terakhir
≤ 62.08% memberikan nilai prediksi bagi
persentase keluarga penerima bantuan PLS
sebesar 33%, sedangkan persentase keluarga
yang anggotanya menjadi buruh tani > 3.4%,
jenis bahan bakar yang digunakan untuk
memasak berupa kayu bakar, dan persentase
keluarga yang menerima kartu ASKESKIN
setahun terakhir > 62.08% memberikan nilai
prediksi bagi persentase keluarga penerima
bantuan PLS sebesar 47.50%.

SIMPULAN DAN SARAN
Simpulan
Pohon regresi persentase keluarga
penerima bantuan PLS menghasilkan pohon
optimal dengan 5 simpul terminal dari total 8
simpul yang dihasilkan. Berdasarkan pohon
regresi optimal, dapat disimpulkan bahwa
persentase keluarga yang anggotanya menjadi
buruh tani, bahan bakar untuk memasak, dan
persentase keluarga yang menerima kartu
ASKESKIN setahun terakhir merupakan

peubah
penting
dalam
memprediksi
presentase keluarga penerima bantuan PLS.
Ketiga peubah tersebut merupakan peubah
yang paling efisien didandingkan sembilan
peubah lainnya dalam memprediksi pres entase
keluarga penerima bantuan PLS. Hasil
pengelompokan
pohon
regresi
dapat
digunakan sebagai referensi pemerintah dalam
menentukan segmentasi penerima bantuan
program perlindungan sosial bagi kelompokkelompok desa yang berada di Kabupaten
Bogor berdasarkan kombinasi peubah-peubah
penjelas yang dihasilkan.
Saran
Perlu dilakukan penelitian lebih lanjut
untuk mengetahui jumlah minimum simpul
akhir pada pohon maksimal yang layak untuk
pemangkasan.

DAFTAR PUSTAKA
Anonim. 2012. Jumlah Penduduk Miskin
Kabupaten Bogor Tertinggi di Jawa
Barat. http://iridsindonesia.com/ page/5.
[15 Januari 2012].
Anonim. 2012. Mengurangi Kemiskinan.
https:// worldbank.org/INTINDONESIA.
[15 Januari 2012].
Breiman et al. 1993.Classification and
Regression Trees. Chapman and Hall:
New York.
Komalasari WB. 2005. Penentuan FaktorFaktor yang Mempengaruhi Pendapatan
Usahatani dengan Menggunakan Metode
Pohon Regresi CART dan CHAID.
[Tesis]. Sekolah Pascasarjana IPB.
Bogor.
Lewis RJ. 2000. An Introduction to
Classification and Regression Tree
(CART) Analysis. California: Department
of Emergency Medicine, Harbor-UCLA
Medical Centre.
Mendez M, Akkartal E. 2009. Regression
Tree Analysis for Predicting Slaugther
Weight in Broilers. Italia, Journal Animal
Science 8 : 615-624.
8

9

LAMPIRAN

10

Lampiran 1. Diagram alir pembentukan pohon regresi

Mulai

Memilih peubah-peubah
penjelas yang bersesuaian antara
data Podes dan data PPLS

Membangun pohon maksimal
dengan menggunakan algoritma
CART

Pemangkasan untuk
memperoleh pohon optimal

Pohon regresi optimal

Selesai

11

Lampiran 2. Diagram alir pembentukan pohon regresi maksimal

Mulai

Tentukan jumlah kemungkinan
penyekatan pada tiap peubah
penjelas

Kontinu

Kategorik

Jumlah penyekatan = n-1

Nominal
Banyaknya peyekatan = 2L-1 -1
Ordinal
Banyaknya penyekatan = L-1

Cari penyekatan terbaik dari
tiap peubah penjelas
ϕ (s,t)

Cari penyekatan terbaik dari
tiap peubah penjelas
ϕ (s,t)

Pilih penyekatan
terbaik dari kumpulan
penyekatan terbaik
tersebut
ϕ (s*,t) = �� ��� ϕ (s,t)

Penghentian jika
amatan pada simpul
akhir ≤ 5 (Breimann
et al. 1993)

Ya
selesai

Tidak

Proses
rekursif

12

Lampiran 3. Diagram alir pembentukan pohon regresi optimal

Pohon regresi maksimal

10-fold cross validation

Kuadrat tengah galat (KTG)
� �� �� = ∑�





̅ �

Cari pohon optimal terbaik
dengan kriteria kuadrat tengah
galat (KTG) terkecil

� �� ��0 = min � �� (��
Pohon regresi optimal

selesai

13

Lampiran 4. Tabel peubah bebas yang digunakan beserta kategorinya
Kode

Peubah

Jenis

Kategori

X1

Bahan bakar untuk memasak

X2

Persentase
keluarga
yang
menerima
kartu
ASKESKIN
setahun terakhir

Kontinu

-

X3

Jumlah
surat
miskin
yang
dikeluarkan desa setahun terakhir

Kontinu

-

X4

Tempat
sebagian
membuang sampah

X5

penduduk

Kategorik

Kategorik

1 = Kayu Bakar
2 = Minyak Tanah
3 = LPG

1 = Sungai
2 = Lubang
3 = Tempat Sampah
4 = Lainnya

Tempat buang air besar

Kategorik

1 = Bukan Jamban
2 = Jamban Bersama
3 = Jamban Umum
4 = Jamban Pribadi

X6

Tempat penampungan
sementara

sampah

Kategorik

1 = Tidak ada
2 = Ada

X7

Jenis permukaan jalan yang terluas

Kategorik

1 = Tanah
2 = Diperkeras
3 = Aspal

X8

Persentase pengguna PLN

Kontinu

-

X9

Persentase
keluarga
yang
anggotanya menjadi buruh tani

Kontinu

-

X10

Sumber air untuk memasak atau
minum pada umumnya

Kategorik

1 = Mata Air
2 = Sungai/ Danau
3 = Sumur
4 = Pompa Listrik
5 = PAM/ Air Kemasan

X11

Sertifikasi sebagian besar lahan
tempat tinggal penduduk

Kategorik

1 = Girik/ Letter C
2 = Akta Jual Beli
3 = Sertifikat Hak Guna
Bangunan
4 = Sertifikat Hak Milik

X12

Jumlah TKI

Kontinu

-

14

Lampiran 5. Deskripsi peubah-peubah numerik
Mean

Peubah
Persentase keluarga yang menerima
kartu ASKESKIN setahun terakhir

Simp.
Baku

Median

Min

Max

24.031

19.206

20.15

0

98.36

4.554

4.738

3.015

0

33.33

Persentase pengguna PLN

90.702

19.95

97.94

18.52

100

Persentase keluarga yang anggotanya
menjadi buruh tani

22.575

20.157

17.265

0

84.35

3.825

12.652

2

0

244

Persentase SKTM yang dikeluarkan desa
setahun terakhir

Jumlah TKI

Lampiran 6. Deskripsi peubah-peubah kategorik
Peubah

Kategori

Bahan bakar untuk memasak

Jumlah

Persentase

Kayu Bakar

102

23.83

Minyak Tanah
LPG
Sungai

321
5
29

75
1.17
6.77

Lubang
Tempat Sampah
Lainnya

282
24
93

65.89
5.61
21.73

Bukan Jamban
Jamban Bersama
Jamban Umum

98
8
21

22.9
1.87
4.90

Jamban Pribadi
Tidak ada
Ada

301
350
78

70.33
81.78
18.22

Jenis permukaan jalan yang terluas

Tanah
Diperkeras
Aspal

8
117
303

1.87
27.34
70.79

Sumber air untuk memasak atau minum pada
umumnya

Mata Air
Sungai/ Danau
Sumur

75
2
290

17.52
0.47
67.76

Pompa Listrik
PAM/Air Kemasan
Girik/ Letter C

53
8
376

12.38
1.87
87.85

Akta Jual Beli
Sertifikat
Hak
Guna Bangunan
Sertifikat
Hak
Milik

21
2

4.90
0.47

29

6.78

Tempat
sampah

sebagian

penduduk

membuang

Tempat buang air besar

Tempat penampungan sampah sementara

Sertifikasi sebagian besar lahan tempat tinggal
penduduk

15

Lampiran 7.

Struktur pohon maksimal persentase keluarga penerima bantuan program
perlindungan sosial

Y
X9

X9 ≤ 3.4%
X9 > 3.4%

14.15%
29.28%
X1

X1 : LPG, Gasoline

X1 : kayu bakar

27.32%

34,32%

X2

X2

X2 ≤ 15.2%

X2 > 15.2%

X2 ≤ 62.08%

22.5%

29.96%

33.00%

X11

X10

X11 : SHGB, SHM

X11 : AJB, Girik

X10 : Pompa, PAM

19.23%

30.66%

30.91%

X9

X3

47.50%

X10 : MA, Sungai, Sumur
36.61%

X9 ≤ 13.225%

X9 > 13.225%

X3 ≤ 2.385%

X3 > 2.385%

26.75%

32.17%

27.13%

33.87%

X8

X2 > 62.08%

X8

X8 ≤ 96.25%

X2 > 96.25%

X8 ≤ 75.965%

X8 > 75.965%

34.69%

29.51%

22.67%

35.94%

16

Lampiran 8. Struktur pohon optimal persentase keluarga penerima bantuan program perlindungan
sosial

Node 0
Mean
N
%
Predicted

26.63%
428
100
26.63%

X9

X9 ≤ 3.4%

X9 > 3.4%

Node 1

Mean
N
%
Predicted

Node 2
Mean
N
%
Predicted

14.15%
75
17.52
14.15%

29.28%
353
82.48
29.28%

X1

X1 : LPG, Gasoline

X1 : Kayu Bakar

Node 3
Mean
N
%
Predicted

Node 4
27.32%
254
59.35
27.32%

Mean
N
%
Predicted

X2

X2 ≤ 15.2%
Node 5

Mean
N
%
Predicted

22.50%
90
21.03
22.50%

34.32%
99
23.13
34.32%

X2

X2 > 15.2%
Node 6
Mean
N
%
Predicted

29.96%
164
38.32
29.96%

X2 ≤ 62.08%
Node 7
Mean
N
%
Predicted

X2 > 62.08%

33%
90
21.03
33%

Node 8
Mean
N
%
Predicted

47.5%
9
2.1
47.5%

17

Lampiran 9. Program R
a. Program R untuk membangun pohon maksimal
> tmp tmp.tr tmp.tr
> plot(tmp.tr); text(tmp.tr, cex=0.3)
> summary(tmp.tr)
b. Program R pemangkasan pohon maksimal dengan menggunakan kriteria kuadrat tengah galat
> tmp.tr.cv for(i in 2:5)tmp.tr.cv$dev tmp.tr.cv$dev plot(tmp.tr.cv)
c. Program R untuk penentuan pohon optimal hasil pemangkasan
> opt.trees=which(tmp.tr.cv$dev==min(tmp.t r.cv$dev))
> best.leave=min(tmp.tr.cv$size[opt.trees])
> tmp.tr.pruned=prune.tree(tmp.tr, best=best.leave)
> plot(tmp.tr.pruned)
> plot(tmp.tr.pruned); text(tmp.tr.pruned, cex=0.7)
> summary(tmp.tr.pruned)