Pereduksian Peubah Pada Metode Two Step Cluster (Studi Kasus Penggerombolan Desa/Kelurahan Di Jawa Barat)

RINGKASAN
RANI KARLINA. Pereduksian Peubah Pada Metode Two Step Cluster (Studi Kasus
Penggerombolan Desa/Kelurahan di Jawa Barat). Dibimbing oleh UTAMI DYAH SYAFITRI
dan AAM ALAMUDI.
Penggerombolan adalah proses mengelompokkan objek ke dalam kelompok-kelompok
berdasarkan kemiripan atau ketakmiripan. Permasalahan yang biasa timbul pada analisis
gerombol ini yaitu berkaitan dengan jenis peubah yang digunakan dan ukuran data (n) yang sangat
besar. Two Step Cluster merupakan analisis penggerombolan yang dirancang untuk menangani
data dengan ukuran yang besar dan dapat digunakan untuk peubah kontinu dan kategorik karena
fungsi jarak yang digunakan adalah jarak Log Likelihood atau Euclidian. Data yang digunakan
dalam penelitian ini adalah data Podes Sensus Ekonomi tahun 2005 untuk wilayah Jawa Barat.
Hasil penggerombolan sebelum pereduksian peubah menghasilkan empat gerombol
sedangkan untuk hasil penggerombolan setelah pereduksian peubah menghasilkan tiga gerombol.
Dari hasil perbandingan penggerombolan tersebut, dapat ditunjukkan bahwa hasil penggerombolan
sebelum dan sesudah pereduksian peubah memberikan hasil yang relatif sama karena tingginya
persentase kekonsistenannya. Namun untuk hasil yang lebih baik disarankan untuk memperhatikan
hubungan antar peubahnya sehingga diharapkan peubah yang digunakan dalam Two Step Cluster
adalah peubah yang saling bebas.

PEREDUKSIAN PEUBAH PADA METODE TWO STEP CLUSTER
(Studi Kasus Penggerombolan Desa/Kelurahan di Jawa Barat)


RANI KARLINA

DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

RINGKASAN
RANI KARLINA. Pereduksian Peubah Pada Metode Two Step Cluster (Studi Kasus
Penggerombolan Desa/Kelurahan di Jawa Barat). Dibimbing oleh UTAMI DYAH SYAFITRI
dan AAM ALAMUDI.
Penggerombolan adalah proses mengelompokkan objek ke dalam kelompok-kelompok
berdasarkan kemiripan atau ketakmiripan. Permasalahan yang biasa timbul pada analisis
gerombol ini yaitu berkaitan dengan jenis peubah yang digunakan dan ukuran data (n) yang sangat
besar. Two Step Cluster merupakan analisis penggerombolan yang dirancang untuk menangani
data dengan ukuran yang besar dan dapat digunakan untuk peubah kontinu dan kategorik karena
fungsi jarak yang digunakan adalah jarak Log Likelihood atau Euclidian. Data yang digunakan
dalam penelitian ini adalah data Podes Sensus Ekonomi tahun 2005 untuk wilayah Jawa Barat.
Hasil penggerombolan sebelum pereduksian peubah menghasilkan empat gerombol

sedangkan untuk hasil penggerombolan setelah pereduksian peubah menghasilkan tiga gerombol.
Dari hasil perbandingan penggerombolan tersebut, dapat ditunjukkan bahwa hasil penggerombolan
sebelum dan sesudah pereduksian peubah memberikan hasil yang relatif sama karena tingginya
persentase kekonsistenannya. Namun untuk hasil yang lebih baik disarankan untuk memperhatikan
hubungan antar peubahnya sehingga diharapkan peubah yang digunakan dalam Two Step Cluster
adalah peubah yang saling bebas.

PEREDUKSIAN PEUBAH PADA METODE TWO STEP CLUSTER
(Studi Kasus Penggerombolan Desa/Kelurahan di Jawa Barat)

OLEH :
RANI KARLINA
G14103031

Skripsi
Sebagai Salah Satu Syarat untuk Memperoleh
Gelar Sarjana Sains
Pada
Departemen Statistika


DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007

Judul : Pereduksian Peubah Pada Metode Two Step Cluster (Studi Kasus
Penggerombolan Desa/Kelurahan di Jawa Barat)
Nama : Rani Karlina
NRP : G14103031

Menyetujui,

Pembimbing I

Pembimbing II

Utami Dyah Syafitri, M.Si
NIP 132311922

Ir. Aam Alamudi, M.Si

NIP 131950980

Mengetahui,
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor

Dr. Drh. Hasim, DEA
NIP 131578806

Tanggal Lulus :

PRAKATA
Puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala limpahan rahmat dan
karunia-Nya sehingga karya ilmiah ini dapat diselesaikan. Shalawat serta salam semoga selalu
tercurahkan kepada Rasulullah Muhammad SAW, kepada keluarganya, para sahabat serta umatnya
hingga akhir zaman.
Banyak ilmu, pelajaran dan masukan yang bermanfaat dirasakan oleh penulis selama
menyelesaikan karya ilmiah ini, sehingga pada kesempatan kali ini penulis ingin mengucapkan
terima kasih, kepada :
1. Ibu Utami Dyah Syafitri, M.Si dan Bapak Ir. Aam Alamudi, M.Si selaku pembimbing I

dan pembimbing II yang telah meluangkan waktu dan memberikan arahan, saran serta
masukan yang sangat bermanfaat bagi penulis.
2. Seluruh dosen Departemen Statistika IPB atas segala ilmu yang bermanfaat.
3. Karya ini kupersembahkan kepada kedua orang tuaku, Papahku tersayang dan Mamahku
tercinta (terima kasih untuk doanya, kasih sayang dan motivasi), serta my luvly sister
Alline (thanks buat semua kelakuannya).
4. Keluarga-keluargaku yang lain, yang ada di Jakarta dan di Bogor. Makasih buat doanya.
5. Sahabat-sahabatku tersayang, Adist, Rahayu, Meylinda, Yuni dan Vina. Thanks buat
semuanya, thanks for the great 4 years in Statistika. We will still be, friends forever.
6. Ahmad Rasyid Fadlilah Putera Ariyat. Thanks buat semua support, kesabaran dan
sayangnya. I don’t know I have to say what to you. Thanks for everything honey. LuvU..
^_^
7. Aang (teman seperjuangan waktu PL), Edo (tempat curhat yang baik), Riko, Dwi, Bayu,
Daus, Adit, Wondo, Ema (teman satu PS), Essi, Muti, dan semua teman seperjuangan di
STK 40. I’m gonna miss you all.
8. Teman-teman main, Achie (my best friend), Yasmin, Tiwi, Pipit, Nyie, Juju dan Reni.
9. Ibu Dedeh, Bang Sudin, Ibu Sulis, Ibu Markonah, Pak Iyan, Mang Herman, Mang Dur,
Bu Aat. Thanks buat semua bantuannya, maaf kalo sering ngerepotin.
10. Adik-adik kelas 41, 42 dan 43 buat keceriannnya.
11. Ka Irfan, statistics tutor. Thanks y Ka..

12. Semua pihak yang tidak dapat disebutkan satu per satu yang telah membantu penulis
dalam menyelesaikan karya ilmiah ini.

Bogor, November 2007

Penulis

RIWAYAT HIDUP
Penulis dilahirkan di kota Bogor pada tanggal 6 Desember 1985 sebagai anak pertama dari
dua bersaudara, anak pasangan Enan M. Adiwilaga dan Avyantini Soewarma.
Pada tahun 1997 penulis lulus dari SD Negeri Polisi 4 Bogor, dan melanjutkan ke sekolah
menengah pertama di SLTP Negeri 4 Bogor dan lulus tahun 2000. Penulis menyelesaikan studi di
SMU Negeri 2 Bogor pada tahun 2003 dan pada tahun yang sama penulis diterima di Departemen
Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor (IPB)
melalui jalur Undangan Seleksi Masuk IPB (USMI).
Selama mengikuti perkuliahan, penulis aktif dalam kegiatan Himpunan Profesi Gamma Sigma
Beta (Himpro GSB) sebagai staf bagian Kewirausahaan pada tahun 2004/2005 dan ketua
departemen bagian Kewirausahaan pada tahun 2005/2006. Penulis pernah menjadi surveyor
Verifikasi dan Validasi Data Administrasi Kependudukan Departemen Dalam Negeri pada tahun
2006. Penulis mengikuti kegiatan praktik lapang di PT. Astra International Jakarta pada bulan

Februari – April 2007.

DAFTAR ISI

Halaman
DAFTAR TABEL ............................................................................................................. vii
DAFTAR GAMBAR ........................................................................................................ vii
DAFTAR LAMPIRAN ..................................................................................................... viii
PENDAHULUAN
Latar Belakang .................................................................................................... 1
Tujuan ................................................................................................................. 1
TINJAUAN PUSTAKA
Analisis Gerombol ..............................................................................................
Two Step Cluster .................................................................................................
Pembentukan Gerombol Awal ............................................................................
Pembentukan Gerombol Optimal ........................................................................
Ukuran Jarak .......................................................................................................

1
2

2
3
4

BAHAN DAN METODE
Bahan .................................................................................................................. 5
Metode ................................................................................................................ 5
HASIL DAN PEMBAHASAN
Deskripsi Data .....................................................................................................
Penggerombolan Desa/Kelurahan Tanpa Pereduksian Peubah Menggunakan
Two Step Cluster .................................................................................................
Pereduksian Peubah ............................................................................................
Penggerombolan Desa/Kelurahan dengan Pereduksian Peubah Menggunakan
Two Step Cluster .................................................................................................
Perbandingan Gerombol .....................................................................................

5
5
6
7

7

SIMPULAN ...................................................................................................................... 8
DAFTAR PUSTAKA ....................................................................................................... 8
LAMPIRAN ...................................................................................................................... 9

DAFTAR TABEL

Halaman
Tabel 1. Perbandingan Metode Hirarki, Non Hirarki, dan Two Step Cluster .................... 2
Tabel 2. Distribusi Hasil Penggerombolan Sebelum Pereduksian Peubah ........................ 6
Tabel 3. Distribusi Hasil Penggerombolan Setelah Pereduksian Peubah .......................... 7
Tabel 4. Tabulasi Silang Hasil Penggerombolan Sebelum dan Sesudah
Pereduksian Peubah ............................................................................................ 7

DAFTAR GAMBAR

Halaman
Gambar 1. CF Tree ........................................................................................................... 2
Gambar 2. Proses Pembelahan dari Satu Dahan Menjadi Dua Dahan .............................. 3

Gambar 3. Tahapan Penelitian yang Dilakukan ................................................................ 5
Gambar 4. Persentase Status Desa/Kelurahan ................................................................... 5

DAFTAR LAMPIRAN

Halaman
1.

Peubah-peubah yang Digunakan dalam Analisis Gerombol ...................................... 9

2.

Tabel BIC (Schwarz’s Bayesian Criterion) Sebelum Mengalami Pereduksian
Peubah ....................................................................................................................... 10

3.

Nilai Rataan dan Simpangan Baku Untuk Masing-masing Gerombol Sebelum
Mengalami Pereduksian Peubah ............................................................................... 11


4.

Tingkat Kepentingan Peubah Kategorik Untuk Masing-masing Gerombol
Sebelum Mengalami Pereduksian Peubah ................................................................. 12

5.

Tingkat Kepentingan Peubah Kontinu Untuk Masing-masing Gerombol
Sebelum Mengalami Pereduksian Peubah ................................................................. 13

6.

Karakteristik Masing-masing Gerombol Sebelum Mengalami Pereduksian
Peubah ....................................................................................................................... 14

7.

Nilai Korelasi Peubah-peubah Kontinu ...................................................................... 15

8.

Hasil Uji Asosiasi Antar Peubah Kategorik ............................................................... 16

9.

Tabel BIC (Schwarz’s Bayesian Criterion) Setelah Mengalami Pereduksian
Peubah ....................................................................................................................... 18

10. Nilai Rataan dan Simpangan Baku Untuk Masing-masing Gerombol Setelah
Mengalami Pereduksian Peubah ............................................................................... 18
11. Tingkat Kepentingan Peubah Kategorik Untuk Masing-masing Gerombol
Setelah Mengalami Pereduksian Peubah ................................................................... 19
12. Tingkat Kepentingan Peubah Kontinu Untuk Masing-masing Gerombol
Setelah Mengalami Pereduksian Peubah ................................................................... 20
13. Karakteristik Masing-masing Gerombol Setelah Mengalami Pereduksian
Peubah ....................................................................................................................... 21

PENDAHULUAN
Latar Belakang
Penggerombolan adalah proses
mengelompokkan objek ke dalam kelompokkelompok berdasarkan kemiripan atau
ketakmiripan. Hasil dari penggerombolan
akan menunjukkan bahwa objek-objek yang
berada dalam satu gerombol akan lebih
homogen dibandingkan antar gerombol.
Metode
penggerombolan
yang
sering
digunakan adalah metode penggerombolan
berhirarki dan metode penggerombolan non
hirarki. Peubah yang dapat digerombolkan
oleh kedua metode tersebut berupa peubah
kontinu.
Permasalahan yang biasa timbul pada
analisis gerombol ini yaitu berkaitan dengan
jenis peubah yang digunakan dan ukuran data
(n) yang sangat besar. Untuk mengatasi kedua
permasalahan tersebut, Chiu et al (2001) telah
mengembangkan algoritma Two Step Cluster
dengan menggunakan software SPSS yang
memungkinkan untuk mengolah data yang
memiliki tipe peubah yang berbeda, yaitu
kontinu dan kategorik.
Two Step Cluster merupakan analisis
penggerombolan yang dirancang untuk
menangani data dengan ukuran yang sangat
besar. Fungsi jarak yang digunakan adalah
jarak Euclidian atau jarak Log Likelihood.
Karena menggunakan ukuran jarak tersebut,
maka dimungkinkan digunakan berbagai tipe
data baik kontinu maupun kategorik. Hasil
akhir dari metode ini adalah pembentukan
gerombol optimal berdasarkan kriteria
tertentu.
Windy
(2005)
telah
melakukan
penggerombolan desa/kelurahan di Jawa Barat
menggunakan metode Two Step Cluster
dengan data Podes 2003, tetapi tidak
memperhatikan hubungan antar peubahnya.
Dalam penelitian ini akan dilakukan
penggerombolan desa/kelurahan di Jawa Barat
berdasarkan karakteristik yang terdapat dalam
Podes 2005 dengan memperhatikan hubungan
antar peubahnya.
Tujuan

1.

Tujuan penelitian ini adalah :
Menggerombolkan desa/kelurahan di
wilayah Jawa Barat menggunakan metode
Two Step Cluster dan menjelaskan
karakteristik masing-masing gerombol
(sebelum dan sesudah pereduksian
peubah).

2.

Membandingkan hasil penggerombolan
antara sebelum dan sesudah pereduksian
peubah.

TINJAUAN PUSTAKA
Analisis Gerombol
Analisis gerombol merupakan salah satu
metode peubah ganda yang tujuan utamanya
adalah mengelompokkan objek berdasarkan
karakteristik-karakteristiknya. Analisis gerombol
mengklasifikasikan objek sehingga setiap
objek yang terdapat di dalam satu gerombol
memiliki kesamaan yang tinggi sesuai dengan
kriteria pemilihan yang ditentukan. Hasil dari
pengelompokkan
harus
memperlihatkan
keragaman yang kecil di dalam satu gerombol
dan keragaman yang besar antar gerombol
(Hair et al, 1998). Ada dua metode yang
sudah umum dilakukan dalam analisis
gerombol, yaitu metode hirarki dan metode
non hirarki.
Metode Hirarki
Metode
penggerombolan
berhirarki
digunakan jika banyaknya gerombol yang
akan dibentuk belum diketahui sebelumnya.
Metode ini ditujukan untuk ukuran data yang
kecil (n < 500). Metode penggerombolan
berhirarki ini dibedakan menjadi dua yaitu
metode penggabungan (agglomerative) dan
metode pemisahan (divisive) (Hair et al,
1998).
Metode agglomerative dimulai dengan n
buah
gerombol
yang
masing-masing
beranggotakan satu objek. Kemudian dua
gerombol yang paling dekat digabung dan
ditentukan kembali kedekatan antar gerombol
yang baru. Proses ini berlanjut sampai
didapatkan satu gerombol yang anggotanya
adalah seluruh objek.
Metode divisive dimulai dengan satu
gerombol yang anggotanya adalah seluruh
objek, kemudian objek-objek yang paling jauh
dipisah dan membentuk gerombol lain. Proses
ini berlanjut sampai semua objek masingmasing membentuk satu gerombol.
Dalam metode berhirarki
terdapat
beberapa ukuran jarak antar gerombol, antara
lain jarak minimum atau pautan tunggal
(single linkage), jarak maksimum atau pautan
lengkap (complete linkage), jarak antar
centroid atau pautan centroid (centroid
linkage), median antara gerombol atau pautan
median (median linkage), rata-rata dari semua
jarak atau pautan rataan (average linkage),
serta metode Ward. Jenis peubah yang dapat

1

digerombolkan dengan metode ini adalah
peubah kontinu (rasio dan interval) dan fungsi
jarak yang sering digunakan dalam metode
berhirarki ini adalah jarak Euclidian atau jarak
Mahalanobis.
Metode Non Hirarki
Metode penggerombolan non hirarki
digunakan jika banyaknya gerombol yang
akan dibentuk sudah diketahui sebelumnya.
Metode ini cocok digunakan pada data yang
berukuran besar (2000). Contoh dari metode
non hirarki adalah K-means. Langkah pertama
dalam metode k-means yaitu menentukan
besarnya k, yaitu banyaknya gerombol.
Pemilihan k dapat ditentukan secara subyektif
berdasarkan latar belakang bidang masingmasing. Fungsi jarak yang sering digunakan
adalah jarak Euclidian. Jenis peubah yang
dapat digerombolkan dengan metode ini
adalah peubah kontinu (Hair et al, 1998).

Tabel 1. Perbandingan Metode Hirarki, Non
Hirarki, dan Two Step Cluster
Aspek
yang
dibandingkan
Ukuran
data
Jenis
peubah
Banyak
gerombol
Ukuran
jarak

Metode
Hirarki

Metode
Non Hirarki

Two Step
Cluster

Untuk data
kecil

Untuk data
besar

Kontinu

Kontinu

Untuk data
sangat besar
Kontinu dan
kategorik

Belum
diketahui
Euclidian
atau
Mahalanobis

Sudah
diketahui

Belum diketahui

Euclidian

Euclidian atau
Log Likelihood



Asumsi
sebaran

Tidak ada
asumsi

Tidak ada
asumsi


Two Step Cluster


Two Step Cluster adalah analisis
penggerombolan yang dirancang untuk
menangani data dengan ukuran yang sangat
besar. Analisis ini juga dapat mengatasi
masalah pengukuran dengan tipe data yang
berbeda yaitu kontinu dan kategorik. Fungsi
jarak yang digunakan dalam Two Step Cluster
adalah jarak Euclidian atau jarak Log
Likelihood (Bacher et al, 2004).
Prosedur penggerombolan objek dalam
Two Step Cluster ini dilakukan melalui dua
tahapan yaitu tahap pembentukan gerombol
awal dan tahap pembentukan gerombol
optimal (Chiu et al, 2001). Perbandingan
antara metode hirarki, non hirarki dan Two
Step Cluster selengkapnya dapat dilihat pada
Tabel 1.
Pembentukan Gerombol Awal
Pada tahapan ini dilakukan pembentukan
Cluster Features (CF) Tree. CF Tree terdiri
dari tingkatan cabang (depth) dan masingmasing cabang berisikan angka yang
dimasukkan. Jika dimisalkan sebuah pohon,
maka cabang tersebut terdiri dari batang,
dahan, dan daun. Tingkatan daun atau daun
entri merepresentasikan hasil akhir anak
gerombol. Maksimum depth dan maksimum
node yang digunakan mengikuti default dari
SPSS yaitu sebanyak 3 dan 8. Sehingga
maksimum daun entri (anak gerombol) yang
terbentuk adalah 512 anak gerombol.

Metode

Penggabungan
(agglomerative) dan
pemisahan
(divisive)


K-means


Peubah
kontinu
menyebar
normal
Peubah
kategorik
menyebar
multinomial
Antar
peubahnya
saling
bebas
Pembentukan CF
Tree
Agglomerative
Menentukan
gerombol
optimal

Prosedur CF Tree diawali dengan memilih
satu amatan secara acak sebagai amatan awal
yang akan diukur jaraknya satu persatu
terhadap
amatan
lainnya
dengan
menggunakan ukuran jarak yang telah
ditentukan. Jika besarnya jarak tersebut lebih
kecil dari batas penerimaan (treshold
distance), maka amatan akan masuk dalam
daun entri yang sama dengan yang awal.
Sebaliknya, jika jarak tersebut lebih besar dari
batas penerimaan, maka amatan akan masuk
dalam daun entri yang baru. Batas penerimaan
(treshold distance) merupakan suatu nilai
yang dimulai dari nol dan akan berubah
mengikuti ukuran jarak terkecil di antara anak
gerombol yang terbentuk.
daun
dahan
batang

Gambar 1. CF Tree

2

Jika tidak ada lagi tempat dalam cabang
daun untuk menciptakan daun entri baru (node
telah melewati batas maksimum), maka
cabang daun akan terbagi menjadi dua. Jika
dimisalkan pada sebuah pohon, dari satu
dahan membelah menjadi dua dahan. Entrian
pada cabang daun yang asli akan dibagi ke
dalam dua grup (dahan) dengan menggunakan
pasangan daun terjauh sebagai penempatan
dan
membagi-bagikan
sisa
entrian
berdasarkan kriteria kedekatan.

Gambar 2. Proses Pembelahan dari Satu
Dahan Menjadi Dua Dahan
Begitu juga pada cabang dahan, apabila
tidak tersedia tempat untuk menciptakan daun
entri baru, maka batang akan terbagi dua
dengan menggunakan pasangan dahan terjauh
sebagai penempatan dan membagi-bagikan
sisa entrian berdasarkan kriteria kedekatan.
Proses ini akan berlanjut sampai semua
amatan selesai dimasukkan. Jika CF Tree
berkembang
melebihi
batas
ukuran
maksimum, maka CF Tree akan dibangun
ulang dengan meningkatkan kriteria batas
penerimaan.
Pembentukan Gerombol Optimal
Pada tahapan ini, hasil dari tahap pertama
yaitu CF Tree digerombolkan menggunakan
analisis gerombol hirarki dengan metode
agglomerative. Suatu gerombol dikatakan
optimal apabila memiliki jarak antar gerombol
paling jauh dan jarak antar objek dalam
gerombol tersebut paling dekat.
Langkah pertama yang dilakukan dalam
menentukan gerombol optimal adalah
menghitung BIC (Schwarz’s Bayesian
Criterion) atau AIC (Akaike’s Information
Criterion) untuk tiap gerombol. Hasil
perhitungan tersebut digunakan untuk
menduga jumlah gerombol. Langkah kedua
adalah mencari peningkatan jarak terbesar
antara dua gerombol terdekat pada masingmasing tahapan penggerombolan.
Rumus BIC dan AIC untuk gerombol J
adalah sebagai berikut :
J

BIC (J) = -2

∑ξ

j

+ m j log( N)

(1)

J

AIC (J) = -2

∑ξ

j

+ 2m j

(2)

j=1

dengan:
⎛KA 1
⎝ k =1 2

KB



k =1



ξ j = − N ⎜ ∑ log(σˆ k2 + σˆ 2jk ) + ∑ Eˆ jk ⎟
Lk N
N jkl
jkl
log
Eˆ jk = − ∑
l =1 N
Nj
j

KB


m j = J ⎨2 K A + ∑ ( LK − 1) ⎬
k =1


N = jumlah total observasi
Nj = jumlah observasi di dalam gerombol j
Njkl = jumlah data di gerombol j untuk
peubah kategorik ke-k dengan kategori
ke-l
σˆ k2 = ragam dugaan untuk peubah kontinu
ke-k untuk keseluruhan observasi
2
ˆ
σ jk = ragam dugaan untuk peubah kontinu

ke-k dalam gerombol j
KA = jumlah total peubah kontinu
KB = jumlah total peubah kategorik
LK = jumlah kategori untuk peubah
kategorik ke-k
Solusi gerombol yang terbaik memiliki
BIC terkecil, tetapi ada beberapa kasus dalam
penggerombolan dimana BIC akan terus
menurun nilainya bila jumlah gerombol
semakin meningkat. Maka dalam situasi
tersebut, ratio BIC Changes (rasio perubahan
BIC) dan ratio of Distance Measure Changes
(rasio perubahan jarak) mengidentifikasi
solusi gerombol terbaik.
Menurut Chiu et al (2001) BICk atau AICk
menghasilkan penduga awal yang baik bagi
jumlah
gerombol
maksimum.
Jumlah
gerombol maksimum adalah banyaknya
gerombol yang memiliki rasio BICk/BICl yang
pertama kali lebih kecil dari c1. Nilai c1 =0.04,
berdasarkan studi simulasi (Bacher et al,
2004).
Jumlah gerombol yang terbentuk dapat
diketahui dengan menggunakan perbandingan
antar jarak untuk k gerombol, dengan rumus
perbandingannya sebagai berikut :
R(k) = dk-1 / dk
(3)
dk = lk-1 - lk
(4)
dimana:
R(k) = rasio perubahan jarak
lv
= (mvlog n - BICv)/2 atau
lv
= (2mv - AICv)/2
v
= k, k-1
dk-1 = jarak jika k gerombol digabungkan
dengan k-1 gerombol

j=1

3

Jumlah gerombol optimal diperoleh
berdasarkan
ketentuan
ditemukannya
perbedaan yang nyata pada rasio perubahan
gerombol. Rasio perubahan gerombol dihitung
sebagai berikut:
R(k1)/R(k2)
(5)
dimana :
R(k1) =
rasio perubahan jarak terbesar
pertama
R(k2) =
rasio perubahan jarak terbesar
kedua
Jika rasio perubahan lebih besar dari nilai
batas c2, jumlah gerombol optimal ditetapkan
sama dengan k1, selainnya jumlah gerombol
optimal sama dengan maksimum {k1,k2}. Nilai
c2 = 1.15, berdasarkan studi simulasi (Bacher
et al, 2004).
Ukuran Jarak

Ukuran kemiripan dan ketakmiripan yang
digunakan dalam analisis gerombol adalah
jarak antar objek dan jarak antar gerombol.
Fungsi jarak yang sering digunakan antara
lain adalah :
Jarak Euclidian
Jarak Euclidian adalah jarak yang paling
umum dan paling sering digunakan dalam
analisis gerombol. Jarak Euclidian antara dua
titik dapat terdefinisikan dengan jelas. Jarak
ini digunakan apabila semua peubah yang
digunakan adalah peubah kontinu (Johnson &
Wichern, 2002).
Jarak Euclidian antara gerombol ke-i dan
ke-j dari p peubah didefinisikan :

(

)

1
2

2⎤
⎡p
d (i, j ) = ⎢∑ X j − X i ⎥
(6)
⎣ i =1

dengan :
d (i, j ) = jarak antara objek i ke objek j

Xi
Xj
p

= nilai tengah pada gerombol ke-i
= nilai tengah pada gerombol ke-j
= banyaknya peubah yang diamati

Jarak Manhattan
Ukuran ini merupakan bentuk umum dari
jarak Euclidian (Johnson & Wichern, 2002).
Fungsi jaraknya didefinisikan :

(

)

1

k⎤k
⎡p
(7)
d (i, j ) = ⎢∑ X j − X i ⎥
⎣ i =1

dengan :
d (i, j ) = jarak antara objek i ke objek j

Xi

= nilai tengah pada gerombol ke-i

X

= nilai tengah pada gerombol ke-j
= banyaknya peubah yang diamati

j

p

Jarak Mahalanobis
Jarak Mahalanobis sangat berguna dalam
menghilangkan atau mengurangi perbedaan
skala pada masing-masing komponen. Pada
permasalahan tertentu, pada saat menentukan
jarak, perlu juga dipertimbangkan ragam dan
peragam (Johnson & Wichern, 2002). Jarak
Mahalanobis didefinisikan :

(

d (i , j ) = ⎡ X i − X
⎢⎣

) S (X
'

j

−1

i

)

1

2
−Xj ⎤
⎥⎦

(8)

dengan :
d (i, j ) = jarak antara objek i ke objek j
= nilai tengah pada gerombol ke-i
= nilai tengah pada gerombol ke-j
= matriks ragam peragam gabungan
antara X i dan X j

Xi

X
S

j

−1

Jarak Log Likelihood
Jarak Log Likelihood dapat diterapkan
untuk peubah kontinu maupun kategorik.
Asumsi yang ada pada jarak ini adalah peubah
kontinu menyebar normal, peubah kategorik
menyebar multinomial dan antar peubahnya
saling bebas. Metode Two Step Cluster cukup
tegar terhadap pelanggaran asumsi tersebut
sehingga metode ini masih dapat digunakan
ketika terjadi pelanggaran asumsi.
Jarak antara gerombol j dan s
didefinisikan:
d ( j, s) = ξ j + ξ s − ξ j ,s
(9)

dengan :
⎛KA 1



ξ j = −N ⎜⎜ ∑ log(σˆ k2 + σˆ 2jk ) + ∑ Eˆ jk ⎟⎟
KB



KB

⎛KA 1
ξ s = − N ⎜⎜ ∑ log σˆ k2 + σˆ sk2 + ∑ Eˆ sk ⎟⎟
k =1
⎝ k =1 2

k =1

2

k =1

(

)

KB
⎛KA 1

= −N⎜⎜ ∑ logσˆ k2 +σˆ 2jsk + ∑ Eˆ jsk ⎟⎟
2
1
1
k
k
=
=


Lk N
N
jkl
jkl
Eˆ jk = −∑
log
Nj
l =1 N j

ξ

j,s

(

)

N
= jumlah total observasi
Nj = jumlah observasi di dalam gerombol j
Njkl = jumlah data di gerombol j untuk
peubah kategorik ke-k dengan
kategori ke-l
σˆ k2 = ragam dugaan untuk peubah kontinu
ke-k untuk keseluruhan observasi
σˆ 2jk = ragam dugaan untuk peubah kontinu
KA

ke-k dalam gerombol j
= jumlah total peubah kontinu

4

KB
LK

= jumlah total peubah kategorik
=
jumlah kategori untuk peubah
kategorik ke-k
d(j,s) = jarak antara gerombol j dan s
= indeks kombinasi gerombol j dan s

BAHAN DAN METODE
Bahan

Bahan yang digunakan dalam penelitian
ini adalah data Podes Sensus Ekonomi tahun
2005 untuk wilayah Jawa Barat. Data populasi
tersebut digunakan karena dianggap jumlah
amatannya cukup besar dan terdiri dari
peubah-peubah yang bertipe kontinu dan
kategorik. Kategori peubah yang akan
digunakan yaitu:
1. Keterangan umum desa/kelurahan
2. Kependudukan dan ketenagakerjaan
3. Perumahan dan lingkungan hidup
4. Sosial budaya
5. Rekreasi, hiburan dan olahraga
6. Angkutan, komunikasi dan informasi
7. Penggunaan lahan
8. Ekonomi
Masing- masing kategor i peub ah
dijabarkan ke dalam peubah-peubah yang
lebih terperinci (Lampiran 1).

Yang pertama k a li d ilakuk an ya itu
melakukan
penggerombolan
dengan
memasukkan semua peubah kemudian
menjelaskan masing-masing karakteristik
gerombolnya.
Selanjutnya
dilakukan
pemeriksaan asumsi korelasi dan memilih
peubah-peubah mana saja yang saling bebas
untuk kemudian dilakukan penggerombolan
dengan peubah yang sudah direduksi.
Kemudian
dijelaskan
masing-masing
karakteristik gerombolnya. Langkah terakhir
yaitu membandingkan hasil penggerombolan
antara sebelum dan sesudah pereduksian
peubah. Perangkat lunak yang digunakan
adalah adalah SPSS 13 for Windows dan
Microsoft Excel.

HASIL DAN PEMBAHASAN
Deskripsi Data

Desa/kelurahan yang berada di Jawa Barat
secara keseluruhan terdiri dari 5808 desa.
Pada Gambar 4 terlihat bahwa jumlah desa
yang berstatus perkotaan sebanyak 1834 atau
32% sedangkan desa/kelurahan yang berstatus
pedesaan sebanyak 3974 atau 68% dari
keseluruhan.
Status Desa

Metode

Secara garis besar, tahapan penelitian yang
dilakukan dapat dijelaskan dengan Gambar 3.
Two step cluster
dengan semua
peubah

Pemeriksaan
asumsi korelasi

Pemilihan peubah
yang saling bebas

Karakteristik
gerombol

Two step cluster
dengan peubah
yang sudah
direduksi

Karakteristik
gerombol

Perbandingan
gerombol

Gambar

3.

Tahapan Penelitian
Dilakukan

yang

Perkotaan
32%

Pedesaan
68%

Gambar 4. Persentase Status Desa/Kelurahan
Penggerombolan Desa/Kelurahan
Tanpa Pereduksian Peubah
Menggunakan Two Step Cluster

Dalam penentuan jumlah gerombol,
digunakan nilai BIC yang ditentukan secara
subjektif karena perhitungan AIC maupun
BIC memberikan hasil yang relatif sama.
Gerombol yang dihasilkan pada tahap pertama
sebanyak 10 gerombol. Hal ini terlihat dari
rasio BICk/BICl yang pertama kali lebih kecil
dari nilai 0.04. Pada gerombol 10, nilai dari
rasio tersebut sebesar 0.036. Sedangkan untuk
penentuan
jumlah
gerombol
optimal
didasarkan pada rasio perubahan gerombol.
Pada Lampiran 2, dua nilai R(k) terbesar

5

terdapat pada solusi dua gerombol (R(k) =
2.375) dan solusi empat gerombol (R(k) =
2.320). Rasio antara kedua nilai tersebut
adalah 1.023 dan lebih kecil dari batas nilai
konstanta c2 = 1.15. Oleh karena itu, dalam
kasus ini empat gerombol merupakan solusi
optimal.
Seluruh
anggota
populasi
amatan
terdistribusi ke dalam empat gerombol yang
terbentuk sehingga dapat dikatakan tidak ada
pencilan pada data ini. Distribusi anggota dari
masing-masing gerombol yang terbentuk
dapat dilihat pada Tabel 2.
Tabel 2.

Distribusi Hasil Penggerombolan
Sebelum Pereduksian Peubah
Gerombol
N
Total (%)
1
1692
29.1
2
283
4.9
3
670
11.5
4
3163
54.5
Total
5808
100

Karakteristik masing-masing gerombol
dapat dijelaskan melalui Lampiran 3, 4 dan 5.
Lampiran 3 menampilkan rataan dan
simpangan baku dari masing-masing peubah
untuk masing-masing gerombol. Sedangkan
Lampiran 4 dan 5 menampilkan selang
kepentingan dari peubah-peubah untuk
masing-masing gerombol. Lampiran 4
menampilkan uji chi-square untuk peubah
yang bertipe kategorik dan Lampiran 5 adalah
uji t-students untuk peubah yang bertipe
kontinu.
Karakteristik
masing-masing
gerombol dapat dijelaskan sebagai berikut :
1. Gerombol satu dapat dikategorikan ke
dalam gerombol pedesaan. Hal ini terlihat
dari tingginya persentase keluarga
pertanian yang ada. Hal ini diperkuat juga
dengan cukup tingginya jumlah lahan
pertanian yang ada. Begitu juga dengan
fasilitas-fasilitas yang ada dilihat dari segi
angkutan, komunikasi, dan informasi
seperti
jumlah
keluarga
yang
berlangganan telepon kabel, jumlah
wartel/warpostel dan jumlah warnet yang
memiliki nilai kecil.
2. Gerombol dua dapat dikategorikan ke
dalam
gerombol
daerah
industri.
Walaupun pada gerombol ini memiliki
jumlah lahan pertanian yang paling
tinggi, tapi diimbangi juga dengan jumlah
industri yang ada.
3. Gerombol tiga dapat dikategorikan ke
dalam gerombol perkotaan. Hal ini
terlihat dari jumlah lahan yang ada
dimana memiliki nilai yang terkecil.

4.

Kebalikan dari lahan-lahan yang ada,
j umla h fa sil i t a s-fasilitas seperti
w ar te l /w arp o ste l,
w ar n e t
d an
supermarket memiliki nilai yang terbesar
pada gerombol ini. Sumber penghasilan
utama dari gerombol ini pun berasal dari
perdagangan besar/eceran dan jasa.
Gerombol empat memiliki karakteristik
yang hampir sama dengan gerombol satu.
Sumber penghasilan utamanya berasal
dari pertanian. Untuk fasilitas-fasilitas
yang ada tidak berbeda terlalu jauh
dengan gerombol satu.

Masing-masing karakteristik dari masingmasing gerombol dapat dilihat lebih jelas pada
Lampiran 6.
Pereduksian Peubah

Pemeriksaan hubungan atau asosiasi antar
peubah digunakan untuk melihat peubahpeubah mana saja yang akan direduksi. Untuk
peubah-peubah
yang
bertipe
kontinu,
digunakan nilai korelasi untuk menentukan
hubungan antar peubahnya sedangkan untuk
peubah-peubah yang bertipe kategorik
digunakan uji asosiasi.
Untuk memilih peubah-peubah mana saja
yang harus direduksi, dilakukan korelasi antar
peubah kontinu. Setelah didapatkan hasil
korelasi dari masing-masing peubahnya,
dilihat peubah-peubah mana saja yang
memiliki nilai korelasi yang tinggi dengan
peubah lainnya kemudian dipilih salah satu
dari dua peubah yang saling berkorelasi
tersebut untuk direduksi. Dari 24 peubah
kontinu, setelah diperiksa terdapat 13 pasang
peubah yang memiliki nilai korelasi yang
tinggi dengan peubah-peubah lainnya
sehingga peubah-peubah tersebut direduksi.
Begitu pula dengan peubah yang bertipe
kategorik, dilakukan uji asosiasi antar
peubahnya. Dari 16 peubah yang ada, setelah
dilakukan uji asosiasi, terdapat 11 pasang
peubah yang berasosiasi sehingga peubahpeubah tersebut perlu direduksi. Oleh karena
itu, pada penggerombolan desa/kelurahan
dengan pereduksian peubah, hanya digunakan
16 peubah yang terdiri dari 11 peubah kontinu
dan 5 peubah kategorik dari 40 peubah total.
Hasil selengkapnya dapat dilihat pada
Lampiran 7 dan Lampiran 8.

6

Penggerombolan Desa/Kelurahan
dengan Pereduksian Peubah
Menggunakan Two Step Cluster

Dalam penentuan jumlah gerombol,
digunakan nilai BIC yang ditentukan secara
subjektif karena perhitungan AIC maupun
BIC memberikan hasil yang relatif sama.
Berbeda dengan hasil penggerombolan tanpa
pereduksian
peubah,
gerombol
yang
dihasilkan pada tahap pertama ini sebanyak 12
gerombol. Hal ini terlihat dari rasio BICk/BICl
yang pertama kali lebih kecil dari nilai 0.04.
Pada gerombol 12, nilai dari rasio tersebut
sebesar 0.038. Sedangkan untuk penentuan
jumlah gerombol optimal didasarkan pada
rasio perubahan gerombol. Pada Lampiran 9,
dua nilai R(k) terbesar terdapat pada solusi
tiga gerombol (R(k) = 2.528) dan solusi tujuh
gerombol (R(k) = 1.659). Rasio antara kedua
nilai tersebut adalah 1.523 dan lebih besar dari
batas nilai konstanta c2 = 1.15. Oleh karena
itu, dalam kasus ini tiga gerombol merupakan
solusi optimal. Distribusi anggota dari
masing-masing gerombol yang terbentuk
dapat dilihat pada Tabel 3.
Distribusi Hasil Penggerombolan
Setelah Pereduksian Peubah
Gerombol
N
Total (%)
1
4007
69
2
319
5.5
3
1482
25.5
Total
5808
100

2.

3.

oleh sumber penghasilan utama dari
gerombol ini yang berasal dari pertanian.
Kebalikan dari jumlah lahan yang ada,
untuk jumlah terminal dan jumlah industri
memiliki nilai yang terkecil diantara
gerombol lainnya.
Gerombol dua dapat dikategorikan ke
dalam
gerombol
daerah
industri.
Walaupun jumlah lahan pertanian yang
ada memiliki nilai yang paling tinggi dan
sebagian besar penghasilan utamanya
berasal dari pertanian, hal ini diimbangi
juga dengan jumlah industri yang ada.
Gerombol tiga dikategorikan ke dalam
gerombol perkotaan. Hal ini terlihat dari
sedikitnya jumlah lahan pertanian yang
ada. Tetapi kebalikannya, untuk fasilitasfasilitas dan industri, gerombol ini
memiliki jumlah yang paling besar jika
dibandingkan dengan gerombol lainnya.
Sumber penghasilan utama dari gerombol
ini pun berasal dari perdagangan
besar/eceran dan jasa.

Masing-masing karakteristik dari masingmasing gerombol dapat dilihat lebih jelas pada
Lampiran 13.

Tabel 3.

Karakteristik masing-masing gerombol
dapat dijelaskan melalui Lampiran 10, 11 dan
12. Lampiran 10 menampilkan rataan dan
simpangan baku dari masing-masing peubah
untuk masing-masing gerombol. Sedangkan
Lampiran 11 dan 12 menampilkan selang
kepentingan dari peubah-peubah untuk
masing-masing gerombol. Lampiran 11
menampilkan uji chi-square untuk peubah
yang bertipe kategorik dan Lampiran 12
adalah uji t-students untuk peubah yang
bertipe kontinu.
Hasil penggerombolan setelah adanya
pereduksian peubah ini bukan hasil mentah
dari output mentah yang ada, tetapi telah
disesuaikan dengan karakteristik hasil
penggerombolan sebelum adanya pereduksian
p eubah . Karak ter istik ma sing- ma sing
gerombol dapat dijelaskan sebagai berikut :
1. Gerombol satu dapat dikategorikan ke
dalam gerombol pedesaan. Hal ini terlihat
dari cukup tingginya jumlah lahan
pertanian yang ada dan diperkuat juga

Perbandingan Gerombol

Berdasarkan
hasil
penggerombolan
sebelum dan setelah pereduksian peubah,
dilakukan tabulasi silang untuk melihat
seberapa konsisten
anggota dari hasil
penggorombolan sebelum pereduksian dengan
setelah dilakukan pereduksian dan distribusi
penyebaran gerombol keempat pada hasil
penggerombolan
sebelum
pereduksian
peubah.
Tabel

4.

Tabulasi Silang Hasil
Penggerombolan Sebelum dan
Sesudah Pereduksian Peubah
Sebelum

1 N
% kolom
2 N
Sesudah
% kolom
3 N
% kolom
N
Total
% kolom

1
1582
93.5%
45
2.7%
65
3.8%
1692
100%

2
13
4.6%
244
86.2%
26
9.2%
283
100%

3
22
3.3%
2
0.3%
646
96.4%
670
100%

4
2390
75.6%
28
0.9%
745
23.6%
3163
100%

Total
4007
69.0%
319
5.5%
1482
25.5%
5808
100%

Sebanyak 93.5% tetap berada pada
gerombol satu, sebanyak 86.2% tetap berada
pada gerombol dua, dan sebanyak 96.4% tetap
berada pada gerombol tiga. Dilihat dari hasil
tabulasi silang, ada beberapa desa yang
berpindah ke gerombol lainnya. Dari hasil
matriks 3x3, terlihat bahwa ada underestimate
sebanyak 37 (1.39%) desa/kelurahan dan

7

overestimate
sebanyak
136
(5.14%)
desa/kelurahan.
Pendistribusian anggota gerombol empat
hasil penggerombolan dengan semua peubah,
terlihat bahwa sebagian besar (75.6%)
terdistribusi ke dalam anggota gerombol satu.
Hal ini dibuktikan dengan miripnya
karakteristik pada gerombol empat dengan
gerombol satu. Sedangkan sebanyak 0.9%
terdistribusi ke dalam gerombol dua dan
sebanyak 23.6% terdistribusi ke dalam
gerombol tiga.
Hasil ini menunjukkan bahwa hasil
penggerombolan sebelum dan sesudah
pereduksian peubah memberikan hasil yang
relatif sama karena tingginya persentase
kekonsistenannya. Sehingga untuk efisiensi
disarankan
untuk
menggunakan
hasil
penggerombolan sesudah pereduksian peubah.

Conference on Knowledge Discovery and
Data Mining 2001.
Hair JFJr, Anderson RE, Tatham RL, Black
WC. 1998. Multivariate Data Analysis. Ed
ke-5. New Jersey : Prentice Hall.
Johnson RA and Wichern DW. 2002. Applied
Multivariate Statistical Analysis. Ed ke-5.
New Jersey : Prantice Hall.

SIMPULAN
Berdasarkan hasil penggerombolan dengan
me t o d e T wo S tep Clus t e r seb e lu m
pereduksian peubah, didapatkan gerombol
optimal sebanyak empat gerombol. Sedangkan
dari
hasil
penggerombolan
sesudah
pereduksian peubah, didapatkan gerombol
optimal sebanyak tiga gerombol. Karakteristik
gerombol satu sampai dengan tiga baik untuk
hasil penggerombolan sebelum dan sesudah
pereduksian peubah memiliki karakteristik
yang sama. Gerombol satu merupakan
gerombol yang dapat dikategorikan ke dalam
gerombol
pedesaan,
gerombol
kedua
dikategorikan ke dalam daerah industri,
gerombol ketiga dikategorikan ke dalam
gerombol perkotaan, dan gerombol keempat
pada
hasil
penggerombolan
sebelum
pereduksian memiliki karakteristik yang mirip
dengan gerombol satu. Dilihat dari kedua hasil
tersebu t, dapat d itunjukk an b ahwa
pemeriksaan hubungan atau asosiasi antar
peubah perlu diperhatikan agar dihasilkan
gerombol yang lebih baik.

DAFTAR PUSTAKA
Bacher J, Wenzig K, Vogler M. 2004. SPSS
Two Step Cluster – A First Evaluation.
http://www.statisticalinnovations.com/pro
ducts/Two Step.pdf. [4 Juni 2007].
Chiu T, Fang D, Chen J, Wang Y, and Jeris C.
(2001). A Robust and Scalable Clustering
Algorithm for Mixed Type Attributes in
Large Database Environment. Proceedings
of the 7th ACM SIGKDD International

8

LAMPIRAN

9

Lampiran 1. Peubah-peubah yang Digunakan dalam Analisis Gerombol
Kategori Peubah
Keterangan Umum
Desa/Kelurahan

Kependudukan dan
Ketenagakerjaan

Perumahan dan
Lingkungan Hidup
Sosial Budaya
Rekreasi, Hiburan,
dan Olahraga

Angkutan,
Komunikasi, dan
Informasi

Peubah

Keterangan (satuan)

Tipe Peubah

X1

Letak geografis desa/kelurahan

Kategorik

X2
X3
X4
X5
X6
X7
X8
X9

Jumlah penduduk laki-laki (orang)
Jumlah penduduk perempuan (orang)
Jumlah keluarga (keluarga)
Persentase keluarga pertanian (persen)
Sumber penghasilan utama
Keluarga yang menggunakan listrik
Penerangan jalan utama desa/kelurahan
Bahan bakar yang digunakan
Desa/kelurahan dihuni oleh lebih dari 1
suku etnis
Tempat hiburan alam bahari
Tempat hiburan alam non bahari
Tempat hiburan budaya
Gedung bioskop
Jenis permukaan jalan yang terluas
Jumlah terminal (unit)
Jumlah keluarga yang berlangganan
telepon kabel (keluarga)
Jumlah wartel/warpostel (unit)
Jumlah warnet (unit)
Kantor pos
Sinyal telepon genggam
Luas desa/kelurahan (km2)
Luas lahan sawah (km2)
Luas lahan sawah berpengairan yang
diusahakan (km2)
Luas lahan sawah tidak berpengairan
yang diusahakan (km2)
Luas lahan sementara tidak diusahakan
(km2)
Luas lahan bukan sawah (km2)
Luas lahan pertanian (km2)
Luas ladang yang diusahakan (km2)
Luas ladang yang tidak diusahakan (km2)
Luas lahan untuk non pertanian (km2)
Kawasan industri
Sentra industri
Lingkungan/perkampungan industri kecil
Jumlah industri besar (unit)
Jumlah industri sedang (unit)
Jumlah supermarket (unit)
Jumlah bank umum (unit)
Jumlah biro/agen perjalanan (unit)
Kepadatan penduduk

Kontinu
Kontinu
Kontinu
Kontinu
Kategorik
Kategorik
Kategorik
Kategorik

X10
X11
X12
X13
X14
X15
X16
X17
X18
X19
X20
X21
X22
X23
X24
X25

Penggunaan Lahan

Ekonomi

Kependudukan

X26
X27
X28
X29
X30
X31
X32
X33
X34
X35
X36
X37
X38
X39
X40

Kategorik
Kategorik
Kategorik
Kategorik
Kategorik
Kategorik
Kontinu
Kontinu
Kontinu
Kontinu
Kategorik
Kategorik
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kategorik
Kategorik
Kategorik
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu
Kontinu

10

Lampiran 2. Tabel BIC (Schwarz’s Bayesian Criterion) Sebelum Mengalami Pereduksian Peubah

Number of Clusters
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Schwarz's
Bayesian
Criterion (BIC)
160214.399
124624.116
110008.390
100789.925
97180.680
94408.837
91921.289
90094.960
88415.819
87137.618
85967.679
85117.467
84331.245
83741.963
83260.117

BIC Change
-35590.283
-14615.726
-9218.466
-3609.244
-2771.844
-2487.548
-1826.329
-1679.141
-1278.201
-1169.938
-850.212
-786.222
-589.282
-481.846

Ratio of BIC
Changes
1.000
.411
.259
.101
.078
.070
.051
.047
.036
.033
.024
.022
.017
.014

Ratio of
Distance
Measures
2.375
1.547
2.320
1.245
1.091
1.268
1.063
1.209
1.060
1.214
1.045
1.160
1.096
1.050

11

Lampiran 3.

Nilai Rataan dan Simpangan Baku Untuk Masing-masing Gerombol Sebelum
Mengalami Pereduksian Peubah

Peubah*

Statistik

X2

rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku
rataan
simp.baku

X3
X4
X5
X16
X17
X18
X19
X22
X23
X24
X25
X26
X27
X28
X29
X30
X31
X35
X36
X37
X38
X39
X40

1
2065.50
901.949
2046.90
863.19
1152.73
485.99
74.03
14.983
0.02
0.14
10.27
31.65
1.17
1.87
0.01
0.12
681.82
485.74
166.04
116.41
102.53
97.64
62.06
76.04
1.32
6.70
515.50
463.03
281.91
343.11
126.86
191.76
9.59
28.95
96.56
202.32
0.05
0.76
0.08
0.44
0.02
0.20
0.01
0.11
0.02
0.19
842.29
570.19

2
3017.06
1351.31
2975.55
1377.07
1667.60
768.96
69.38
20.07
0.25
0.57
47.14
194.59
2.40
4.04
0.07
0.67
2886.50
12990.30
543.69
473.54
268.61
406.78
245.06
332.79
29.94
72.21
2342.57
13009.90
619.04
947.86
443.81
882.64
117.69
241.78
1161.57
13023.90
0.17
0.92
0.19
0.99
0.04
0.31
0.06
0.27
0.01
0.08
457.85
388.97

Gerombol
3
8063.40
5630.16
8071.43
5861.68
3922.85
2626.64
11.54
18.37
0.22
0.43
1471.19
1751.48
14.30
11.40
1.02
1.82
262.87
206.47
45.55
80.79
32.76
68.16
11.74
35.14
1.00
5.58
217.15
180.89
18.76
57.29
17.85
62.53
3.70
15.41
176.55
148.70
3.41
10.05
4.15
9.54
2.12
2.82
1.39
2.11
0.53
1.04
9731.30
9156.80

4
2874.45
1397.31
2827.18
1350.90
1506.17
701.42
56.55
23.66
0.05
0.22
99.69
210.12
3.14
3.44
0.03
0.18
385.35
321.79
176.15
149.68
147.69
148.08
27.36
56.39
1.00
5.54
208.92
282.16
70.61
142.39
37.45
83.08
3.39
15.89
97.05
205.63
0.18
0.93
0.41
1.38
0.11
0.42
0.07
0.31
0.03
0.21
2086.76
1532.52

Overall
3244.32
2863.93
3212.07
2909.40
1689.86
1355.73
57.08
27.55
0.07
0.27
229.29
763.07
3.82
6.19
0.14
0.73
579.46
2935.87
176.05
190.71
127.17
160.30
46.28
106.14
2.50
18.03
403.15
2922.43
152.91
332.46
81.04
247.53
10.80
61.97
157.95
2885.64
0.52
3.66
0.73
3.63
0.31
1.21
0.20
0.87
0.09
0.43
2526.71
4262.64

* Kode peubah dapat dilihat pada Lampiran 1

12

Lampiran 4. Tingkat Kepentingan Peubah Kategorik Untuk Masing-masing Gerombol Sebelum
Mengalami Pereduksian Peubah

TwoStep Cluster Number = 2

TwoStep Cluster Number = 1

Bonferroni Adjustment Applied

Bonferroni Adjustment Applied

Critical Value

Critical Value

Test Statistic

X9

X21

X21

X11

X6

X1

X8

X15

X15

X8

X20

X9

Variable

Variable

Test Statistic

X10
X34
X32
X33

X6
X7
X10
X32

X14

X12

X13

X13

X12

X33

X7

X14

X1

X20

X11

X34

0

1,000

2,000

3,000

0

4,000

50

100

150

200

250

Chi-Square

Chi-Square

TwoStep Cluster Number = 4

TwoStep Cluster Number = 3

Bonferroni Adjustment Applied

Bonferroni Adjustment Applied

Critical Value

Critical Value

Test Statistic
X9

X9

X21

X20

X8

X21

X15

X14

X14

X8

X6

X32

X20

Variable

Variable

Test Statistic
X6

X15
X10
X33

X11
X32
X7

X34

X1

X13

X10

X1

X34

X12

X13

X7

X12

X11

X33

0

500

1,000

1,500

2,000

2,500

Chi-Square

0

500

1,000

1,500

Chi-Square

Catatan: Kode peubah dapat dilihat pada Lampiran 1

13

Lampiran 5.

Tingkat Kepentingan Peubah Kontinu Untuk Masing-masing Gerombol Sebelum
Mengalami Pereduksian Peubah

TwoStep Cluster Number = 1

TwoStep Cluster Number = 2

Bonferroni Adjustment Applied

Bonferroni Adjustment Applied
Critical Value

Test Statistic

Variable

Variable

Critical Value
X2
X3
X17
X18
X36
X37
X38
X40
X5
X4
X19
X35
X28
X16
X39
X31
X24
X27
X29
X22
X25
X26
X23
X30

-300

-200

-100

0

X40
X39
X17
X37
X23
X5
X25
X36
X38
X28
X30
X29
X26
X35
X18
X24
X16
X22
X3
X2
X27
X19
X31
X4

Test Statistic

-100

100

-80

-60

-40

-20

0

20

Student's t

Student's t

TwoStep Cluster Number = 3

TwoStep Cluster Number = 4
Bonferroni Adjustment Applied

Bonferroni Adjustment Applied

Critical Value

X5
X28
X23
X22
X24
X27
X29
X25
X18
X2
X4
X3
X40
X17
X37
X38
X19
X30
X39
X36
X16
X35
X26
X31

Test Statistic

Variable

Variable

Critical Value

-60

-40

-20

0

20

Student's t

X27
X17
X19
X22
X28
X29
X37
X30
X38
X35
X25
X31
X40
X3
X26
X2
X4
X39
X36
X18
X24
X16
X5
X23

-40

Test Statistic

-30

-20

-10

0

10

Student's t

Catatan: Kode peubah dapat dilihat pada Lampiran 1

14

Lampiran 6. Karakteristik Masing-masing Gerombol Sebelum Mengalami Pereduksian Peubah
No.

Cluster 1
Terdiri dari 1692 desa/kelurahan (29.1%)
1. Persentase keluarga pertanian
2. Bahan bakar yang digunakan kayu
bakar
3. Ada lemah sinyal telepon genggam

Cluster 2
Terdiri dari 283 desa/kelurahan (4.9%)
1. Jumlah terminal
2. Luas desa/kelurahan
3. Luas lahan sawah
4. Luas lahan sawah berpengairan
yang diusahakan
5. Luas lahan sawah tidak berpengairan
yang diusahakan
6. Luas lahan sementara tidak
diusahakan
7. Luas lahan bukan sawah
8. Luas lahan pertanian
9. Luas ladang yang diusahakan
10. Luas ladang yang tidak diusahakan
11. Luas lahan untuk non pertanian

1.

1.
2.

1

2

3

Luas lahan sawah tidak
berpengairan yang diusahakan
2. Luas lahan sementara tidak
diusahakan
3. Luas lahan bukan sawah
4. Luas lahan pertanian
5. Luas ladang yang diusahakan
6. Sumber penghasilan utama dari
pertanian
1. Jumlah penduduk laki-laki
2. Jumlah penduduk perempuan
3. Jumlah keluarga
4. Jumlah keluarga yang berlangganan
telepon kabel
5. Jumlah wartel/warpostel
6. Jumlah warnet
7. Luas lahan untuk non pertanian
8. Jumlah industri besar
9. Jumlah industri sedang
10. Jumlah supermarket
11. Jumlah bank umum

3.
4.

1.
2.
3.
4.

Persentase keluarga pertanian
Bahan bakar yang digunakan kayu
bakar
Jumlah bank umum
Jumlah industri besar

Jumlah biro/agen perjalanan
Kepadatan penduduk
Sumber penghasilan utama dari
pertanian
Ada kuat sinyal telepon genggam

Cluster 3
Terdiri dari 670 desa/kelurahan (11.5%)
1. Jumlah penduduk laki-laki
2. Jumlah penduduk perempuan
3. Jumlah keluarga
4. Jumlah keluarga yang berlangganan
telepon kabel
5. Jumlah wartel/warpostel
6. Jumlah warnet
7. Jumlah industri besar
8. Jumlah industri sedang
9. Jumlah supermarket
10. Jumlah bank umum
11. Jumlah biro/agen perjalanan
12. Kepadatan penduduk
13. Sumber penghasilan utama dari
perdagangan besar/eceran dan jasa
1. Jumlah terminal
2. Bahan bakar yang digunakan minyak
tanah
3. Ada kuat sinyal telepon genggam

1.
2.
3.
4.
5.
6.
7.
8.

Persentase keluarga pertanian
Luas desa/kelurahan
Luas lahan sawah
Luas lahan sawah berpengairan
yang diusahakan
Luas lahan sawah tidak berpengairan
yang diusahakan
Luas lahan sawah sementara tidak
diusahakan
Luas lahan pertanian
Luas ladang yang diusahakan

Catatan: No merupakan keterangan peubah dalam mencirikan gerombol
1 = Ciri utama ( memiliki nilai terbesar); 3 = ciri yang memiliki nilai terkecil; 2 = ciri yang memiliki nilai antara 1 dan 3

Cluster 4
Terdiri dari 3163 desa/kelurahan (54.5%)
1. Sumber penghasilan utama dari
pertanian
2. Bahan bakar yang digunakan minyak
tanah
3. Ada kuat sinyal telepon genggam

1.

3.
4.
5.

Jumlah keluarga yang berlangganan
telepon kabel
Luas lahan sawah berpengairan yang
diusahakan
Jumlah industri sedang
Jumlah supermarket
Kepadatan penduduk

1.
2.

Luas lahan bukan sawah
Luas ladang yang tidak diusahakan

2.

Lampira