Penggerombolan dan identifikasi trend kabupaten di Indonesia berdasarkan data dan informasi kemiskinan tahun 2002-2009

PENGGEROMBOLAN DAN IDENTIFIKASI TREND KABUPATEN DI
INDONESIA BERDASARKAN DATA DAN INFORMASI KEMISKINAN
TAHUN 2002-2009

ANNA CHINTYA DEWI

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2011

ABSTRAK
ANNA CHINTYA DEWI. Penggerombolan dan Identifikasi Trend Kabupaten di Indonesia
Berdasarkan Data dan Informasi Kemiskinan Tahun 2002-2009. Dibimbing oleh HARI
WIJAYANTO dan AGUS M. SOLEH.
Analisis gerombol dan pengkajian trend kemiskinan kabupaten dilakukan menggunakan
metode yang mengadopsi sistem Cluster-based Temporal Representation of Event Data (CTREND) dengan membuat Temporal Cluster Graph yang memetakan data multiatribut kedalam
grafik dua dimensi. Rasio jarak antara gerombol awal dan akhir jalur dengan jarak sepanjang jalur
terbesar yaitu sebesar 0.86 yang mengindikasikan trend yang searah terjadi pada kabupatenkabupaten yang perlu meningkatkan perbaikan bidang tenaga kerja serta peningkatan penyediaan
fasilitas air bersih. Sedangkan rasio jarak terkecil yaitu sebesar 0.10 mengindikasikan berubahubahnya peningkatan atau penurunan karakteristik kemiskinan sepanjang jalur sehingga trendnya

tidak searah. Kabupaten-kabupaten di Provinsi Papua dan Papua Barat perlu mendapatkan
perhatian lebih dalam pengentasan kemiskinan karena memiliki trend yang cukup konsisten
sebagai kabupaten pada gerombol yang relatif miskin setiap tahunnya.
Kata kunci: analisis gerombol, C-TREND, Temporal Cluster Graph, rasio jarak

PENGGEROMBOLAN DAN IDENTIFIKASI TREND KABUPATEN DI
INDONESIA BERDASARKAN DATA DAN INFORMASI KEMISKINAN
TAHUN 2002-2009

ANNA CHINTYA DEWI

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Program Studi Statistika

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR

2011

Judul Skripsi
Nama
NRP

: Penggerombolan dan Identifikasi Trend Kabupaten di Indonesia
Berdasarkan Data dan Informasi Kemiskinan Tahun 2002-2009
: Anna Chintya Dewi
: G14070065

Disetujui

Pembimbing 1

Pembimbing 2

Dr. Ir. Hari Wijayanto, MS
NIP.196504211990021001


Agus M. Soleh, S.Si,MT
NIP. 197503151999031004

Diketahui
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, MS
NIP. 196504211990021001

Tanggal Lulus :

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia-Nya
sehingga tulisan ini berhasil diselesaikan. Tulisan ini merupakan hasil penelitian penulis dalam
rangka memenuhi tugas akhir yang merupakan salah satu syarat untuk memperoleh gelar Sarjana
Statistika di Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor.
Terimakasih yang tak terhingga penulis ucapkan kepada :
1. Allah SWT, Maha Pencipta yang keberkahannya tidak pernah putus.

2. Bapak Dr. Ir. Hari Wijayanto, MS dan Bapak Agus M. Soleh, S.Si, MT atas segala
bimbingan dan arahan kepada penulis.
3. Bapak Ir. Bunawan Sunarlim, MS selaku dosen penguji yang telah banyak memberikan
masukan untuk penyempurnaan tulisan ini.
4. Dinas Pendidikan Kabupaten Rokan Hilir selaku pemberi beasiswa.
5. Kedua orang tua dan seluruh keluarga besar penulis atas doa dan pelajaran yang tak pernah
berhenti.
Semoga tulisan ini dapat bermanfaat bagi semua pihak yang membutuhkan.

Bogor, Agustus 2011

Penulis

RIWAYAT HIDUP
Penulis dilahirkan di Binjai, Sumatera Utara pada tanggal 20 Mei 1989 sebagai anak
tunggal dari pasangan Muhammad Yusuf dan Chairani Damayanti.
Tahun 2007 penulis lulus dari SMA Negeri I Bagan Sinembah, Rokan Hilir dan pada tahun
yang sama lulus seleksi masuk Institut Pertanian Bogor melalui jalur Beasiswa Utusan Daerah
(BUD) Rokan Hilir, Riau. Penulis memilih mayor Statistika Fakultas Matematika dan Ilmu
Pengetahuan Alam.

Selama perkuliahan penulis aktif menjadi anggota Badan Pengawas Himpunan Keprofesian
Gamma Sigma Beta Periode Kepengurusan 2010. Penulis telah melaksanakan Praktik Lapang di
PT Infomedia Nusantara, Jakarta Selatan pada bulan Maret sampai April 2011.

DAFTAR ISI
Halaman
DAFTAR TABEL .. ..................................................................................................................... vii
DAFTAR GAMBAR ................................................................................................................... vii
DAFTAR LAMPIRAN ................................................................................................................ vii
PENDAHULUAN
Latar Belakang ............................................................................................................... 1
Tujuan ...... ..................................................................................................................... 1
TINJAUAN PUSTAKA
Kemiskinan .................................................................................................................... 1
Analisis Gerombol ......................................................................................................... 2
Analisis Komponen Utama ............................................................................................ 2
Cluster-based Temporal Representation of Event Data (C-TREND) ............................. 3
Temporal Cluster Graph ................................................................................................. 3
METODOLOGI
Sumber Data ................................................................................................................... 3

Metode Analisis ............................................................................................................. 4
HASIL DAN PEMBAHASAN
Eksplorasi Data .............................................................................................................. 4
Penggerombolan Kabupaten Menggunakan Metode K-Means ...................................... 4
Analisis Trend Menggunakan Temporal Cluster Graph ................................................. 7
KESIMPULAN DAN SARAN .................................................................................................... 8
DAFTAR PUSTAKA .................................................................................................................. 8
LAMPIRAN ........... ..................................................................................................................... 9

vi

DAFTAR TABEL
Halaman
1 Korelasi antar peubah tahun 2002 ......................................................................................... 5
2 Jumlah gerombol optimal tahun 2002-2009 .............................................................................. 5

DAFTAR GAMBAR
Halaman
1
2

3
4
5
6

Contoh Temporal Cluster Graph ........................................................................................... 3
Diagram bintang rataan peubah gerombol 1 tahun 2002 ........................................................... 5
Diagram bintang rataan peubah gerombol 2 tahun 2002 ........................................................... 6
Diagram bintang rataan peubah gerombol 3 tahun 2002 ........................................................... 6
Diagram bintang rataan peubah gerombol 4 tahun 2002 ........................................................... 6
Diagram bintang rataan peubah gerombol 5 tahun 2002 ........................................................... 6

DAFTAR LAMPIRAN
1
2
3
4
5
6
7

8

Halaman
Korelasi antar peubah bebas tahun 2003-2009 .......................................................................... 10
Proporsi kumulatif keragaman komponen utama tahun 2002-2009 .......................................... 12
Daftar kabupaten anggota gerombol tahun 2002-2009 ............................................................. 13
Diagram bintang rataan peubah tahun 2002 dan tahun 2009 .................................................... 21
Temporal Cluster Graph
.............................................................................................. 27
Besarnya Direct Distance dan Path Distance serta rasio yang terbentuk ................................. 28
Pergerakan jumlah anggota gerombol tahun 2002-2009 ........................................................... 29
Grafik pergerakan jumlah anggota gerombol tahun 2002-2009 ................................................ 32

vii

1

PENDAHULUAN
Latar belakang
Indonesia merupakan negara kepulauan

dengan jumlah penduduk sekitar 237.56 juta
jiwa di mana 13.33% dari total penduduk
Indonesia berada di bawah garis kemiskinan
(BPS 2010). Secara nasional, trend
kemiskinan di Indonesia menunjukkan jumlah
penduduk miskin yang semakin berkurang
dari tahun ke tahun. Hal ini dapat terlihat dari
persentase jumlah penduduk miskin secara
nasional pada tahun 2007, 2008, dan 2009
dengan nilai masing-masing sebesar 16.58%,
15.42%, dan 14.15% (BPS 2010).
Pemerintah telah mengupayakan berbagai
program
dalam
rangka
pengentasan
kemiskinan sehingga diharapkan dapat
mencapai pemerataaan. Untuk itu, gambaran
pengelompokan
kabupaten

berdasarkan
indikator kemiskinan dibutuhkan sebagai
acuan dalam menetapkan prioritas pengadaan
program-program
dalam
rangka
mengentaskan kemiskinan penduduk. Selain
itu, perlu dilakukan pengkajian terhadap trend
masing-masing gerombol yang terbentuk dari
tahun ke tahun untuk melihat perubahan
kekonsistenan gerombol dari waktu ke waktu.
Penggerombolan dan identifikasi trend
gerombol yang terbentuk dilakukan untuk
kabupaten-kabupaten
di
Indonesia
menggunakan metode yang mengadopsi
sistem
Cluster-based
Temporal

Representation of Event Data (C-TREND)
dengan membuat Temporal Cluster Graph
yang memetakan data multiatribut antar waktu
ke dalam grafik dua dimensi.
Tujuan
Tujuan dari penelitian ini adalah :
1. Menggerombolkan kabupaten-kabupaten
seluruh Indonesia berdasarkan indikator
kemiskinan untuk mengetahui kabupaten
yang menjadi prioritas dalam rangka
mengentaskan kemiskinan.
2. Mengidentifikasi dan memvisualisasikan
trend pada gerombol yang terbentuk.

TINJAUAN PUSTAKA
Kemiskinan
Menurut Badan Pusat Statistik (2010),
kemiskinan adalah ketidakmampuan dari sisi
ekonomi untuk memenuhi kebutuhan dasar
makanan dan bukan makanan yang diukur
dari sisi pengeluaran. Oleh karena itu,
Penduduk Miskin adalah penduduk yang

memiliki rata-rata pengeluaran perkapita
perbulan dibawah garis kemiskinan (GK).
Langkah-langkah penghitungan Garis
Kemiskinan adalah sebagai berikut :
1. Melakukan
penghitungan
Garis
Kemiskinan
Makanan
sebelum
disetarakan dengan 2100 kilokalori
(GKMj). GKMj merupakan jumlah nilai
pengeluaran dari 52 komoditi dasar
makanan yang riil dikonsumsi penduduk.
GKMj dapat dirumuskan sebagai berikut:
.
)= ∑
GKMj = ∑
dengan:
GKMj = Garis Kemiskinan Makanan
daerah ke-j sebelum disetarakan
dengan 2100 kilokalori
= harga komoditi ke-k di daerah
ke-j
ata
= kuantitas komoditi ke-k yang
dikosumsi di daerah ke-j
= nilai
pengeluaran
untuk
konsumsi komoditi ke-k di
daerah ke-j
j
= Daerah
k
= komoditi
2. Melakukan penyetaraan GKMj dengan
2100 kilokalori dengan terlebih dahulu
mengalikan 2100 terhadap harga implisit
rata-rata kalori menurut daerah j.
Fj = ̅̅̅̅̅ x 2100 dengan ̅̅̅̅̅

=∑

dengan:
Fj
= Garis Kemiskinan Makanan daerah
ke-j
̅̅̅̅̅ = harga rata-rata kalori di daerah ke-j
Kk
= kalori komoditi ke-k di daerah ke-j
3. Melakukan
penghitungan
Garis
Kemiskinan Non Makanan (NFj). NFj
merupakan penjumlahan nilai kebutuhan
minimum dari komoditi-komoditi nonmakanan meliputi perumahan, sandang,
pangan, pendidikan, dan kesehatan. Secara
matematis dirumuskan sebagai berikut:
NFj = ∑
Vi)
dengan :
NFj = Garis Kemiskinan Non Makanan
daerah ke-j
ri
= rasio pengeluaran per
komoditi/subkelompok non-makanan
daerah ke-j hasil Survei Paket
Komoditi Kebutuhan Dasar (SPKKD)
2004

2

Vi

j
4.

= nilai pengeluaran per
komoditi/subkelompok non-makanan
daerah ke-j hasil Susenas Modul
Konsumsi
= daerah
Melakukan
perhitungan
Garis
Kemiskinan (GK) untuk masing-masing
daerah dengan persamaan:
GKj= Fj + NFj

Analisis Gerombol
Analisis gerombol merupakan salah satu
metode dalam peubah ganda yang tujuan
utamanya
mengelompokkan
objek
berdasarkan kemiripan atau ketakmiripan
karakteristik-karakteristiknya sehingga tiap
objek yang terdapat dalam satu gerombol
memiliki kesamaan yang tinggi sesuai dengan
kriteria pemilihan yang ditentukan (Johnson
dan Wichern 1998). Ada dua metode
penggerombolan klasik, yaitu:
1. Metode berhierarki
Metode berhierarki digunakan jika
belum diketahui banyaknya gerombol yang
akan dibentuk. Terdapat beberapa metode
perhitungan jarak antar dua gerombol dalam
metode berhierarki yaitu menggunakan jarak
terdekat (Single Linkage), menggunakan jarak
terjauh
(Complete
Linkage),
dan
menggunakan jarak antara rataan gerombol
(Centroid Linkage). Fungsi jarak yang sering
digunakan adalah jarak Euclidian dengan
asumsi tidak ada korelasi antar peubah yang
didefenisikan sebagai berikut:
Dij=[(xi-xj)`(xi-xj)]1/2
dengan:
dij= jarak antara objek ke-i dan objek ke-j
xi = vektor peubah untuk objek ke-i
xj = vektor peubah untuk objek ke-j
2. Metode tak berhierarki
Metode tak berhierarki digunakan jika
banyaknya gerombol yang akan dibentuk telah
ditentukan. Penentuan pusat gerombol
merupakan langkah awal yang akan sangat
menentukan hasil penggerombolan. Salah satu
metode yang paling banyak digunakan adalah
metode K-Means yang menggerombolkan
objek berdasarkan kedekatan ukuran jarak
terhadap centroid masing-masing gerombol
(Anderberg 1973). Adapun langkah-langkah
utama
dalam
proses
penggerombolan
menggunakan metode K-Means:

1. Tentukan banyaknya gerombol yang
diinisialisasi dengan K dan tentukan
centroid tiap gerombol.
2. Hitung jarak setiap objek dengan setiap
centroid. Masukkan objek ke dalam
gerombol yang memiliki jarak terdekat.
3. Hitung kembali centroid untuk gerombol
yang baru terbentuk. Lakukan sampai
tidak ada objek yang berpindah gerombol.
Salah satu cara menentukan banyaknya
gerombol awal yang optimum yang
diinisialisasi dengan K adalah menggunakan
algoritma Hartigan ( Hartigan 1975, diacu
dalam Subanar dan Kariyam 2007) yaitu
dengan membandingkan jumlah kuadrat dari
tiap gerombol yang terbentuk yang secara
matematis dapat dituliskan:
H(k) =
dengan:
tr(Wk) = teras matriks jumlah kuadrat Wk ,
=∑


̅

̅

dengan:
p = banyaknya peubah
ng = banyaknya anggota gerombol ke-g
= kasus ke-i, (i= 1,2,3,...ng)
̅ = rata-rata peubah pada gerombol ke-g

Banyaknya gerombol diestimasi mulai dari
1 ≤ k ≤ n. Banyaknya gerombol akan terus
ditambah sampai H(k) ≤ 10.
Analisis Komponen Utama
Analisis
komponen
utama
(AKU)
merupakan suatu pendekatan statistika yang
ide utamanya adalah mengurangi dimensi
suatu data set yang peubahnya saling
berhubungan dengan memuat sebesar
mungkin keragaman yang ada pada data set
awal.
Hal
ini
dilakukan
dengan
mentransformasi data awal dengan p peubah
menjadi q gugus peubah baru di mana q