Penerapan Analisis Gerombol Data Tidak Lengkap Dengan Algoritma Khusus Pada Data Kesejahteraan Rakyat Provinsi Aceh

PENERAPAN ANALISIS GEROMBOL DATA TIDAK
LENGKAP DENGAN ALGORITMA KHUSUS PADA DATA
KESEJAHTERAAN RAKYAT PROVINSI ACEH

RAHMAWATI EKA HANDAYANI

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul “Penerapan Analisis
Gerombol Data Tidak Lengkap dengan Algoritma Khusus pada Data Kesejahteraan
Rakyat Provinsi Aceh” adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apapun kepada perguruan tinggi
manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor,

November 2016

Rahmawati Eka Handayani
NIM G152140461

RINGKASAN
RAHMAWATI EKA HANDAYANI. Penerapan Analisis Gerombol Data
Tidak Lengkap dengan Algoritma Khusus pada Data Kesejahteraan Rakyat
Provinsi Aceh. Dibimbing oleh ERFIANI dan UTAMI DYAH SYAFITRI.
Analisis gerombol merupakan teknik peubah ganda yang mempunyai tujuan
utama untuk mengelompokkan objek-objek berdasarkan kemiripan karakteristik
yang dimilikinya (Mattjik dan Sumertajaya 2011). Semakin mirip dua objek, maka
semakin besar kemungkinan dua objek tersebut untuk dikelompokkan dalam satu
gerombol. Analisis gerombol secara umum memerlukan data yang lengkap.
Permasalahan yang sering terjadi pada analisis gerombol adalah ditemukan
kumpulan objek atau peubah dengan data tidak lengkap.
Secara umum penanganan data tidak lengkap pada analisis gerombol dapat

dilakukan dengan tiga pendekatan. Pendekatan pertama adalah mengabaikan data
yang tidak lengkap (marginalisasi). Kelemahan dari pendekatan ini adalah
mengakibatkan kehilangan banyak informasi. Pendekatan kedua adalah menduga
data yang tidak lengkap. Pendugaan data dilakukan dengan metode imputasi, yaitu
menduga data tidak lengkap menggunakan angka nol, nilai median, nilai rata-rata,
dan lainnya. Pendugaan dengan metode imputasi lebih sering digunakan dengan
alasan lebih mudah dan sederhana (Safitri 2015). Kelemahan metode imputasi
dikemukakan oleh Wagstaff dan Laidler (2005) yaitu hasil pendugaan dari metode
imputasi tidak efisien karena memberikan informasi yang tidak berarti. Pendekatan
ke tiga yaitu metode tanpa imputasi yang digunakan untuk mengatasi kelemahan
dari metode imputasi. Beberapa penelitian yang mengembangkan metode tanpa
imputasi antara lain. Wagstaff (2004) melakukan penelitian penggerombolan untuk
data tidak lengkap tanpa imputasi dengan pendekatan k-means soft constraints
(KSC). Matyja dan Simiński (2014) telah melakukan penelitian penggerombolan
untuk data tidak lengkap dengan membandingkan metode imputasi, marginalisasi
dan algoritma khusus penggerombolan. Beberapa algorima khusus
penggerombolan yang digunakan seperti partial distance strategy (PDS), optimum
completion strategy (OCS), serta nearest prototype strategy (NPS). PDS
merupakan algoritma khusus penggerombolan data tidak lengkap tanpa imputasi,
sedangkan metode OCS dan NPS merupakan algorima khusus penggerombolan

data tidak lengkap dengan mengambil teknik imputasi di dalam proses iterasinya.
Hasil perbandingan tersebut memperoleh kesimpulan bahwa metode algoritma
khusus lebih unggul dalam menggerombolkan data tidak lengkap dibanding metode
imputasi dan marginalisasi. Safitri (2015) telah mengkaji metode gerombol tanpa
imputasi dengan membandingkan metode KSC dan metode PDS. Pada penelitian
tersebut didapat kesimpulan bahwa metode PDS lebih unggul dibanding metode
KSC.
Pada penelitian ini, digunakan metode algoritma khusus yaitu metode OCS
dan NPS yang diterapkan untuk menggerombolkan data kesejahteraan rakyat
Provinsi Aceh tahun 2006. Selanjutnya metode tersebut dibandingkan dengan
metode PDS dari hasil penelitian Safitri (2015). Data yang digunakan dalam
penelitian ini adalah data sekunder yang merupakan data yang sama dengan
penelitian Safitri (2015). Peubah yang digunakan ditinjau dari berbagai sumber,
seperti Rencana Pembangunan Jangka Panjang (RPJP), Millenium Development

Goals (MDGs), dan indikator kesejahteraan yang dipublikasikan oleh BPS dan
BAPPENAS Provinsi Aceh tahun 2007 yang bekerjasama dengan instansi
pemerintah lainnya.
Tujuan dari penelitian ini adalah mengelompokkan dan mengevaluasi hasil
gerombol kabupaten/kota di Provinsi Aceh tahun 2006. Penggerombolan dilakukan

berdasarkan indikator kesejahteraan rakyat. Metode Penggerombolan yang
digunakan adalah metode OCS dan NPS. Evaluasi hasil penggerombolan dilakukan
dengan dua cara yaitu menggunakan RMSSTD dan Pseudo F. Pada penelitian ini
pseudo F tidak dapat digunakan untuk mengevaluasi hasil penggerombolan karena
setiap jumlah gerombol memiliki penciri yang berbeda-beda. Hasil gerombol
optimum dapat ditentukan berdasarkan hasil RMSSTD. Jumlah gerombol optimum
yang diperoleh dari metode OCS yaitu 5 gerombol dengan nilai RMSSTD terkecil
0,6459. Pada metode NPS, jumlah gerombol dengan nilai RMSSD terkecil
diperoleh sebanyak 6 gerombol dengan nilai RMSSTD yaitu 0,6057.
Penelitian Safitri (2015), menggunakan data yang sama untuk menangani data
tidak lengkap dengan menggunakan metode PDS. Hasil penelitian tersebut
diperoleh nilai RMSSTD terkecil yaitu pada jumlah gerombol 4 dengan nilai
RMSSTD sebesar 0,7493. Nilai RMSSTD pada metode OCS dan NPS dengan
jumlah gerombol 4, masing-masing memperoleh nilai sebesar 0,6989 untuk OCS
dan 0,6983 untuk NPS. Berdasarkan hasil tersebut, menunjukkan bahwa metode
OCS dan NPS memiliki nilai RMSSTD lebih kecil dari metode PDS. Secara
keseluruhan metode OCS dan NPS lebih baik dari metode PDS pada penelitian
Safitri (2015) dalam menangani data tidak lengkap.
.
Kata kunci: gerombol, OCS, NPS, RMSSTD, Pseudo F


SUMMARY
RAHMAWATI EKA HANDAYANI. The Application of Incomplete Data
Cluster Analysis through Special Algorithm on Public's Welfare Data of Aceh
Province. Supervised by ERFIANI and UTAMI DYAH SYAFITRI.
Cluster analysis is a multivariate technique in which grouping the objects
based on similarity or dissimilarity of characteristics (Mattjik and Sumertajaya
2011). Cluster analysis requires complete data. Preprocessing is needed to
overcome incomplete data. There are two techniques for preprocessing:
marginalization and imputation. Disadvantage of marginalization approach is will
cause in losing a lot of information. On other hand, imputation method is easier and
simple, although it is in efficient because of providing non-significant information.
Wagstaff (2004) conducted a research grouping to incomplete data without
imputation with approach k-means soft constraints (KSC). Matyja and Simiński
(2014) developed special clustering algorithm such as PDS, OCS, and NPS, and
compared the results with marginalization and imputation. PDS is a special
algorithm method of incomplete data pure without imputation, whereas the method
of OCS and NPS are a special algorithm method of incomplete data with involving
imputation in the process of iteration. Those three algorithm were better than
marginalization and imputation. Safitri (2015) also discovered that PDS was better

than KSC.
Data used in this research is secondary data which is the same data with
Safitri’s research (2015). Variables are used from various sources, such as Long
Term Development Plan (RPJP), the Millennium Development Goals (MDGs) and
indicators of welfare published by BPS and Bappenas of Aceh Province in
cooperation with other government agencies in 2007.
The purpose of this study was to clustering and evaluate the results of the
group districts / cities in Aceh province in 2006. Grouping is done based on the
indicators of people's welfare. Evaluation of the results of the grouping is done in
two ways: using RMSSTD and Pseudo F. In this study pseudo F can not be used to
evaluate the results of the grouping for each number of groups have a different
identifier. The optimum group results can be determined based on the results
RMSSTD.
In this research two methods : OCS and NPS were compered to overcome
missing data in the dataset. Based on RMSSTD, the optimum cluster number was
5 for OCS and 6 for NPS. RMSSTD value of 4 clusters of PDS was higher than
OCS and NPS. This means that OCS and NPS outperformed than PDS. In
conclusion, the algorithm involving imputation is better than the algorithm without
imputation.
Keywords: cluster, OCS, NPS, RMSSTD, Pseudo F


© Hak Cipta Milik IPB, Tahun 2016
Hak Cipta Dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau
menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah, dan pengutipan tersebut tidak merugikan kepentingan IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apapun tanpa izin IPB

PENERAPAN ANALISIS GEROMBOL DATA TIDAK
LENGKAP DENGAN ALGORITMA KHUSUS PADA DATA
KESEJAHTERAAN RAKYAT PROVINSI ACEH

RAHMAWATI EKA HANDAYANI

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika Terapan


SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2016

Penguji Luar Komisi pada Ujian Tesis: Dr. Bagus Sartono, M.Si

PRAKATA
Puji dan syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan
hidayah-Nya, sehingga penulis dapat menyelesaikan tesis yang berjudul
“Penerapan Analisis Gerombol Data Tidak Lengkap dengan Algoritma Khusus
pada Data Kesejahteraan Rakyat Provinsi Aceh”. Penulis menyadari, bahwa banyak
pihak yang telah berpartisipasi dan membantu dalam menyelesaikan penulisan tesis
ini.
Terima kasih penulis ucapkan kepada Ibu Dr. Ir. Erfiani, M.Si dan Ibu Dr.
Utami Dyah Syafitri, M.Si selaku pembimbing atas kesediaan memberikan ide,
kritik dan saran kepada penulis, dan terimakasih atas segala masukan, motivasi dan
kesabaran dalam membimbing dan membagi ilmunya kepada penulis dalam
penyusunan tesis ini. Terimakasih kepada Dr. Bagus Sartono, M.Si selaku penguji

luar komisi pembimbing atas masukan yang diberikan. Ucapan terima kasih juga
penulis sampaikan sebesar-besarnya kepada seluruh Dosen Departemen Statistika
IPB yang telah mengasuh dan mendidik penulis selama di bangku kuliah hingga
berhasil menyelesaikan studi, serta seluruh staf Departemen Statistika IPB atas
bantuan, pelayanan, dan kerjasamanya selama ini.
Ucapan terima kasih yang tulus penulis ucapkan kepada kedua orangtuaku
Bapak Shohibun dan Ibu Fadliyah serta kepada keempat adikku Ziki Ibadul Iman,
Ukhti Mujahidah, Lutfi Qurotul A’yun dan Fadil Akmalul Azmi dan seluruh
keluargaku yang selalu memberikan motivasi, dukungan, semangat serta do’a
selama ini kepada penulis.
Terakhir tak lupa penulis juga menyampaikan terima kasih kepada seluruh
mahasiswa Pascasarjana Departemen Statistika atas segala bantuan dan
kebersamaannya selama menghadapi masa-masa terindah maupun tersulit dalam
menuntut ilmu, serta semua pihak yang telah banyak membantu dan tak sempat
penulis sebutkan satu per satu.
Penulis menyadari bahwa tesis ini masih terdapat kekurangan dan belum bisa
dikatakan sempurnan. Penulis berharap tesis ini dapat memberikan manfaat bagi
semua pihak.
Bogor,


November 2016

Rahmawati Eka Handayani

DAFTAR ISI
DAFTAR TABEL
DAFTAR GAMBAR
PENDAHULUAN
Latar Belakang
Tujuan Penelitian
TINJAUAN PUSTAKA
Analisis Gerombol
Penggerombolan Data Tidak Lengkap
Optimum Completion Strategy (OCS)
Nearest Prototype Strategy (NPS)
Root Mean Square Standard Deviation (RMSSTD)
Pseudo F Statistic
Biplot Analysis
METODE PENELITIAN
Data

Metode Analisis
HASIL DAN PEMBAHASAN
Analisis Gerombol Metode OCS
Analisis Gerombol Metode NPS
Perbandingan Hasil Gerombol PDS, OCS, dan NPS
Hasil Gerombol Metode OCS
Hasil Gerombol Metode NPS
SIMPULAN DAN SARAN
Simpulan
Saran
DAFTAR PUSTAKA
RIWAYAT HIDUP

vi
vi
1
1
2
2
2
3
4
5
6
6
7
8
8
9
12
12
14
16
16
19
23
23
23
24
25

DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
11
12

Daftar peubah indikator kesejahteraan rakyat
Hasil RMSSTD metode OCS
Hasil Pseudo F pada metode OCS
Hasil RMSSTD metode NPS
Hasil Pseudo F pada metode NPS
Hasil RMSSTD metode OCS, NPS, dan PDS
Hasil penggerombolan kabupaten/kota di Provinsi
Aceh pada metode OCS
Pusat gerombol metode OCS
Karakteristik gerombol metode OCS
Hasil penggerombolan kabupaten/kota di Provinsi
Aceh pada metode NPS
Pusat gerombol metode NPS
Karakteristik gerombol metode NPS

9
12
13
14
15
16
17
17
18
20
20
22

DAFTAR GAMBAR
1
2
3
4

Diagram alir penelitian
Grafik RMSSTD metode OCS
Grafik RMSSTD metode NPS
Biplot indikator kesejahteraan rakyat Provinsi Aceh Tahun 2006
dengan 5 gerombol pada metode OCS
5 Biplot indikator kesejahteraan rakyat Provinsi Aceh Tahun 2006
dengan 6 gerombol pada metode NPS

11
13
15
18
21

1

PENDAHULUAN

Latar Belakang
Meningkatnya kesejahteraan rakyat yang adil dan merata merupakan tujuan
dari pembangunan nasional Indonesia. Badan Koordinasi Keluarga Berencana
Nasional (BKKBN) mengemukakan definisi keluarga sejahtera apabila keluarga
dapat memenuhi kebutuhan anggotanya baik sandang, pangan, perumahan,
kesehatan, sosial, dan agama serta mempunyai keseimbangan antara penghasilan
keluarga dengan jumlah anggota keluarga. Berbagai program dan kegiatan
pembangunan telah dilakukan pemerintah Indonesia guna mencapai tujuan tersebut.
Suatu taraf kesejahteraan dapat dinilai melalui indikator-indikator yang terukur dari
berbagai aspek pembangunan. Badan Pusat Statistika (BPS) mengembangkan
Indikator Kesejahteraan Rakyat (INKERSRA) yang terdiri dari indikator dampak
(output indicators), indikator masukan (input indicators) dan indikator proses
(process indicators). Indikator tersebut mencakup beberapa kelompok indikator
sektoral, antara lain: kependudukan, pendidikan, kesehatan, gizi, konsumsi dan
pengeluaran rumah tangga, ketenagakerjaan, dan perumahan.
Menurut penelitian Jasmina (2015), untuk mengukur tingkat kesejahteraan
rakyat maka diperlukan data dan informasi yang akurat. Dalam rangka evaluasi
kondisi yang ada, maka perlu dilakukan analisis untuk melihat pemerataan
kesejahteraan rakyat tingkat kabupaten/kota. Salah satu analisis statistika yang
dapat mengelompokkan suatu kabupaten/kota berdasarkan kriteria kesejahteraan
rakyat adalah analisis gerombol. Permasalahan yang terjadi, banyak ditemukan
dalam peubah kesejahteraan rakyat terdapat kabupaten/kota yang memiliki data
tidak lengkap. Kabupaten/kota tersebut merupakan kabupaten/kota yang baru
terbentuk (pemekaran), sehingga data pada kabupaten/kota tersebut menjadi tidak
lengkap pada beberapa peubah.
Dalam kondisi data tidak lengkap pada analisis gerombol pada umumnya
dilakukan penanganan dengan tiga pendekatan. Pendekatan pertama adalah
mengabaikan data yang tidak lengkap. Konsep semacam ini disebut marginalisasi,
namun pendekatan ini akan mengakibatkan kehilangan banyak informasi.
Pendekatan kedua adalah menduga data yang tidak lengkap. Pendugaan dilakukan
dengan berbagai metode imputasi, yaitu menduga data tidak lengkap menggunakan
angka nol, nilai median, nilai rata-rata, dan lainnya. Pendugaan dengan metode
imputasi lebih sering digunakan dengan alasan lebih mudah dan sederhana (Safitri
2015). Kelemahan metode imputasi dikemukakan oleh Wagstaff dan Laidler (2005)
yang menyatakan bahwa hasil pendugaan dari metode imputasi tidak efisien karena
memberikan informasi yang tidak berarti seperti menyebabkan adanya pencilan.
Pendekatan ke tiga yaitu metode tanpa imputasi yang digunakan untuk mengatasi
kelemahan dari metode imputasi. Beberapa penelitian yang mengembangkan
metode tanpa imputasi antara lain. Wagstaff (2004) melakukan penelitian
penggerombolan untuk data tidak lengkap tanpa imputasi dengan pendekatan kmeans soft constraints (KSC). Matyja dan Simiński (2014) juga telah melakukan
penelitian penggerombolan untuk data tidak lengkap dengan membandingkan
metode imputasi, marginalisasi dan algortima khusus penggerombolan. Beberapa
algoritma khusus yang digunakan antara lain partial distance strategy (PDS),

2
optimal completion strategy (OCS), nearest prototype strategy (NPS). PDS
merupakan algoritma khusus penggerombolan data tidak lengkap tanpa imputasi,
sedangkan metode OCS dan NPS merupakan algoritma khusus data tidak lengkap
dengan mengambil teknik imputasi di dalam proses iterasinya. Hasil perbandingan
tersebut memperoleh kesimpulan bahwa algoritma khusus penggerombolan lebih
unggul dalam menggerombolkan data tidak lengkap. Safitri (2015) telah mengkaji
metode gerombol tanpa imputasi dengan membandingkan metode KSC dan metode
PDS untuk menggerombolkan data tidak lengkap, dalam kesimpulannya
menyatakan bahwa metode PDS lebih unggul dari metode KSC. Dalam penelitian
ini digunakan algoritma khusus penggerombolan untuk menutupi kekurangan dari
metode imputasi di teknik preprocessing. Metode yang digunakan yaitu metode
OCS dan NPS yang diterapkan untuk menggerombolkan kabupaten/kota di Provinsi
Aceh berdasarkan indikator kesejahteraan rakyat tahun 2006.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Mengelompokkan kabupaten/kota di Provinsi Aceh tahun 2006 berdasarkan
peubah-peubah yang menentukan indikator kesejahteraan rakyat dengan metode
penggerombolan OCS dan NPS.
2. Mengevaluasi hasil gerombol kabupaten/kota di Provinsi Aceh tahun 2006.

2

TINJAUAN PUSTAKA

Analisis Gerombol
Analisis gerombol merupakan teknik peubah ganda yang mempunyai
tujuan utama untuk mengelompokkan objek-objek berdasarkan kemiripan atau
ketidakmiripan karakteristik yang dimilikinya. Karakteristik objek-objek dalam
suatu gerombol memiliki tingkat kemiripan yang tinggi, sedangkan karakteristik
antar objek pada suatu gerombol dengan gerombol lain memiliki tingkat kemiripan
yang rendah. Dengan kata lain, keragaman dalam satu gerombol minimum
sedangkan keragaman antar gerombol maksimum (Mattjik dan Sumertajaya 2011).
Ukuran kemiripan atau ketidakmiripan antar objek yang digunakan biasanya
ditunjukkan dengan menggunakan ukuran jarak. Pengukuran jarak yang dikenal
yaitu jarak Euclid yang didefinisikan sebagai berikut:
1

K
2
d ij   ( xik  x jk ) 2 
 k 1

Keterangan :
d ij = jarak antara objek ke-i dan objek ke-j
xik = nilai objek ke-i pada peubah ke-k
x jk = nilai objek ke-j pada peubah ke-k

3
K = banyaknya peubah
Menurut Rencher (2002), terdapat dua metode sebagai pendekatan umum
dalam analisis gerombol yaitu metode berhirarki dan metode tak berhirarki. Metode
berhirarki digunakan untuk menggerombolkan pengamatan secara terstruktur
berdasarkan kemiripan sifatnya dan gerombol yang diinginkan belum diketahui
banyaknya. Metode ini dilakukan dengan dua pendekatan yaitu dengan
penggabungan dan pemisahan. Penggabungan didapatkan dengan menggabungkan
pengamatan atau gerombol secara bertahap sehingga pada akhirnya didapat hanya
satu gerombol saja. Sedangkan dengan cara pemisahan dimulai dengan membentuk
satu gerombol besar beranggotakan seluruh pengamatan. Gerombol besar tersebut
kemudian dipisah menjadi gerombol yang kecil, sampai satu gerombol hanya
beranggotakan satu pengamatan saja. Beberapa metode berhirarki yang sering
digunakan yaitu metode pautan tunggal (single linkage), pautan lengkap (complete
lingkage), pautan rataan (average linkage), dan pautan Ward.
Sedangkan metode tak berhirarki dimulai dengan menentukan terlebih
dahulu jumlah gerombol yang diinginkan, sehingga sifat pengelompokannya tidak
alamiah karena dikondisikan untuk jumlah penggerombolan tertentu. K-Means
adalah contoh umum metode tak berhirarki yang sering digunakan. Menurut BenArieh et all. (2010), mengatakan bahwa keuntungan metode ini adalah kemudahan
dalam implementasi dan lebih efisiensi, sementara kelemahannya adalah kesulitan
dalam menentukan jumlah gerombol.
Penggerombolan Data Tidak Lengkap
Pada banyak kasus jika ditemukan data tidak lengkap, umumnya data
diduga dengan menggunakan metode imputasi. Metode imputasi yang umum
digunakan seperti imputasi dengan nilai konstan, angka nol, nilai acak, nilai median,
nilai rata-rata, dan lainnya. Kekuarangan dari metode imputasi dikemukakan oleh
Wagstaff dan Laidler (2005) yang menyatakan bahwa hasil pendugaan dari metode
imputasi tidak efisien karena memberikan informasi yang tidak berarti. Oleh karena
itu untuk menutupi kekurangan dari metode imputasi, diperlukan algoritma khusus
penggerombolan untuk meningkatkan nilai-nilai yang tidak lengkap selama proses
iterasi. Beberapa pendekatan yang dapat digunakan untuk menutupi kekurangan
dari metode imputasi yaitu metode optimal completion Strategy (OCS) dan metode
nearest prototype strategy (NPS).
OCS merupakan algoritma khusus penggerombolan data tidak lengkap yang
menggunakan teknik imputasi di setiap proses iterasi. Dalam artian nilai yang tidak
lengkap kemudian diduga dengan teknik imputasi, namun nilai hasil dugaan
tersebut akan berbeda di setiap proses iterasi. Nilai tersebut digunakan untuk
membantu dalam proses penggerombolan. Hal tersebut diperlukan untuk
mengurangi kekurangan dari metode imputasi. OCS mengambil pendekatan
optimasi alternatif untuk menemukan nilai tidak lengkap yang lebih baik selama
iterasi. Metode ini meningkatkan nilai yang tidak lengkap dengan memanfaatkan
informasi centroid gerombol dan nilai keanggotaanya. Sedangkan metode NPS
merupakan modifikasi sederhana dari algoritma OCS. Metode NPS menggantikan
nilai yang tidak lengkap menggunakan hasil centroid gerombol berdasarkan jarak
yang minimum.

4
Optimal Completion Strategy (OCS)
Pendugaan data tidak lengkap pada metode OCS dilakukan pada setiap
iterasi, sehingga dugaan data tidak lengkap menghasilkan nilai yang berbeda-beda
pada setiap iterasi (Matyja dan Simiński 2014). Sebagai langkah awal, nilai dugaan
ditetapkan dengan menggunakan nilai rata-rata sebagai nilai inisiasi.
Langkah selanjutnya dalam tahapan algoritma OCS adalah pembentukan
titik awal pusat gerombol. Pembentukan pusat gerombol disesuaikan dengan jumlah
gerombol yang ditentukan di awal. Selanjutnya mencari jarak dari suatu objek ke-i
ke pusat gerombol ke-c dan mengalokasikan objek ke dalam gerombol berdasarkan
jarak minimun. Proses iterasi selanjutnya dalam metode OCS yaitu nilai-nilai yang
tidak lengkap kemudian digantikan dengan memanfaatkan informasi centroid
gerombol dan nilai keanggotaan objek ke-i terhadap gerombol ke–c. Tahapan
algoritma metode OCS adalah sebagai berikut:
1. Membagi objek-objek ke dalam c gerombol awal berdasarkan letak keadaan
geografis.
2. Menentukan pusat gerombol ke-c dengan formula:
n

c ck 

 (u
i 1

ci

) 2 xik

n

 (u
i 1

ci

)2

Keterangan :
c ck = pusat gerombol ke-c berdasarkan peubah ke–k
uci = nilai keanggotan objek ke–i terhadap gerombol ke–c,dengan
C

u
c 1

ci

1 ∀ � ;

xik = item objek ke–i pada peubah ke-k
n = banyaknya objek
3. Mencari jarak dari suatu objek ke-i ke pusat gerombol ke-c dengan menggunakan
jarak euclid dengan formula:
d ci 

K

(x
k 1

ik

 cck ) 2

Keterangan :
d ci = jarak objek ke–i terhadap gerombol ke-c
K = banyaknya peubah
4. Kemudian menentukan gerombol dari suatu objek ke dalam suatu gerombol
berdasarkan jarak yang paling minimum
5. Mengganti nilai-nilai yang tidak lengkap dengan formula sebagai berikut:

5

 (u ) c

 (u )
C

xik

2

c 1
C

ci

ck

2

c 1

,1  i  C

ci

6. Memperbarui nilai keanggotaan objek ke-i terhadap gerombol ke-c dengan
menggunakan formula sebagai berikut:

d 
u ci    Ci 
c 1  d ci 
C

2

7. Ulangi langkah 1 hingga 6 dan berhenti sampai max | cck( r )  cck( r 1) | 10 5 
c,k

Keterangan :
r = iterasi
C = banyaknya gerombol
Nearest Prototype Strategy (NPS)
NPS merupakan modifikasi sederhana dari algoritma OCS. Dalam algoritma
NPS nilai-nilai dari item data yang tidak lengkap kemudian diganti dengan nilainilai berdasarkan centroid gerombol yang memiliki derajat keanggotaan tertinggi
(Matyja dan Simiński 2014). Iterasi yang digunakan dalam metode NPS sama
dengan metode OCS pada awal iterasi. Tahapan algoritma NPS adalah sebagai
berikut:
1. Membagi objek-objek ke dalam c gerombol awal berdasarkan letak keadaan
geografis.
2. Menentukan pusat gerombol ke-c dengan formula:
n

 (u
i 1

c ck 

ci

) 2 xik

n

 (u
i 1

ci

)2

Keterangan :
cck = pusat gerombol ke-c berdasarkan peubah ke–k
uci = nilai keanggotan objek ke–i terhadap gerombol ke–c, dengan
C

u
c 1

ci

1 ∀ � ;

xik = item objek ke–i pada peubah ke-k
n
= banyaknya objek
3. Mencari jarak dari suatu objek ke-i ke pusat gerombol ke-c dengan menggunakan
jarak euclid dengan formula:
d ci 

K

(x
k 1

ik

 cck ) 2

6
Keterangan :

d ci = jarak objek ke–i terhadap gerombol ke-c
K = banyaknya peubah
4. Kemudian menentukan gerombol dari suatu objek ke dalam suatu gerombol
berdasarkan jarak yang paling minimum
5. Mengganti nilai-nilai yang tidak lengkap dengan formula sebagai berikut:
xik  cck , dci = min{d11, d21 ......... dci}

6. Memperbarui nilai keanggotaan objek ke-i terhadap gerombol ke-c dengan
formula sebagai berikut:

d 
u ci    Ci 
c 1  d ci 
C

2

7. Ulangi langkah 1 hingga 6 dan berhenti sampai max | cck( r )  cck( r 1) | 10 5 
c,k

Keterangan :
r = iterasi
C = banyaknya gerombol
Root Mean Square Standard Deviation (RMSSTD)
RMSSTD merupakan indeks validasi yang bisa dijadikan tolak ukur dalam
pengujian validitas kelompok yang bertujuan untuk mengevaluasi hasil kelompok
yang terbaik. RMSSTD mengukur kehomogenan dari kelompok yang terbentuk
(Halkidi et all. 2001). Formula yang digunakan sebagai berikut :
K

nck

  (x
RMSSTD =

k 1 c 1
K

i

 (n
k 1

ck

 xk ) 2
 1)

Keterangan :
x i = nilai objek ke-i
xk = rata-rata peubah ke-k

nck = banyaknya objek yang masuk ke dalam gerombol ke-c pada
peubah ke-k
K = banyaknya peubah
Pseudo F Statistic
Hasil gerombol yang optimum yaitu apabila peubah yang digunakan
memiliki keragaman yang homogen dalam satu gerombol. Pseudo F merupakan
salah satu metode alternatif untuk melihat keragaman pada masing-masing peubah

7
yang digunakan dalam analisis gerombol di setiap jumlah gerombol. Pseudo F dapat
menggambarkan rasio keragaman antar gerombol dengan keragaman di dalam
gerombol (Caliński dan Harabasz 1974). Peubah yang memiliki keragaman yang
homogen dapat dilihat berdasarkan hasil nilai pseudo F yang tertinggi. Semakin
besar nilai pseudo F maka semakin baik hasil penggerombolan yang dimiliki.
Menurut Rencher (2002) formula yang digunakan dalam perhitungan pseudo F
adalah:

F

( ( xc2. / n)  x 2 .. / cn ) /( c  1)
c

( xci2   xc. / n) /( n  c)
2

ci

c

Keterangan:
x c2. = total nilai pada gerombol ke-c kuadrat
x 2 .. = nilai total umum kuadrat
x ci2 = nilai pada objek ke-i terhadap gerombol ke-c kuadrat
n
= banyaknya objek
c = banyaknya gerombol
Analisis Biplot
Biplot adalah teknik statistik deskriptif yang dapat disajikan secara visual
guna menyajikan secara simultan n objek pengamatan dan k peubah dalam ruang
bidang datar, sehingga ciri-ciri peubah dan objek pengamatan serta posisi relatif
antar objek pengamatan dengan peubah dapat dianalisis. Menurut Johnson dan
Wichern (2007), biplot adalah representasi grafis dari informasi dalam sebuah n
dikali k matriks data yang mengacu pada dua jenis informasi yang terkandung
dalam matriks data. Sedangkan menurut Rencher (2002), biplot adalah representasi
dua dimensi dari matriks X, dengan menunjukkan suatu titik untuk masing-masing
vektor n pengamatan bersama dengan titik untuk masing-masing peubah k.
Informasi dalam baris berkaitan dengan objek dan yang di kolom berkaitan dengan
informasi peubah. Biplot merupakan upaya membuat gambar di ruang berdimensi
banyak menjadi gambar di ruang berdimensi dua. Pereduksian dimensi ini
mengakibatkan menurunnya informasi yang terkandung dalam biplot.
Biplot merupakan teknik statistika deskriptif dimensi ganda yang
mendasarkan pada penguraian nilai singular (SVD), dengan matriks X merupakan
matriks yang terkoreksi terhadap rataannya yang kemudian dapat diuraikan sebagai
berikut :
X = ULAT
U dan A adalah matriks dengan kolom ortonormal (UUT=AAT=I) dan L
adalah matriks diagonal dengan yang unsur-unsur diagonalnya adalah akar dari akar
ciri XTX yaitu 1  2  3  ......   p . Unsur –unsur diagonal matriks L
ini disebut nilai singular matriks XTX dan kolom-kolom matriks AT adalah vektor
ciri dari XTX. Kemudian didefinisikan �� merupakan matriks dengan unsur-unsur

8
diagonalnya adalah

1  2  ....  p . Misalkan matriks G=U �� dan

matriks H=��−� A dengan  besarnya 0    1, maka diperoleh persamaan:
X = U�� ��−� AT = GHT

Matriks G adalah titik-titik koordinat dari n objek dan matriks H adalah titik
koordinat dari k peubah. Menurut Mattjik dan Sumertajaya (2011), beberapa hal
yang bisa diterangkan dari analisis biplot yaitu:
1. Kedekatan antar Objek
Dua objek yang memiliki karakteristik yang sama akan digambarkan sebagai dua
titik dengan posisi yang berdekatan.
2. Keragaman Peubah
Peubah yang memiliki keragaman yang kecil digambarkan dengan vektor yang
pendek, sedangkan keragaman yang besar digambarkan dengan vektor yang
panjang.
3. Korelasi antar peubah
Dua peubah yang memiliki korelasi negatif akan memiliki sudut yang tumpul,
sedangkan dua peubah yang memiliki korelasi yang positif akan memiliki sudut
yang lancip.
4. Kedekatan objek dengan peubah
Suatu objek yang searah dengan vektor dari suatu peubah, maka dapat dikatakan
bahwa objek tersebut memiliki nilai di atas rata-rata dari peubah tersebut.
Sebaliknya, jika suatu peubah berlawanan dengan arah vektor sutau peubah,
maka objek tersebut memiliki nilai di bawah rata-rata dari peubah tersebut.

2 METODE PENELITIAN

Data
Data yang digunakan dalam penelitian ini adalah data sekunder yang
merupakan data yang sama dengan penelitian Safitri (2015). Unit amatan berupa 23
kabupaten/kota di Provinsi Aceh. Peubah yang digunakan sebanyak 10 peubah.
Peubah yang digunakan diambil dari berbagai sumber, seperti Rencana
Pembangunan Jangka Panjang (RPJP), Millenium Development Goals (MDGs) dan
indikator kesejahteraan yang dipublikasikan oleh BPS dan BAPPENAS Provinsi
Aceh tahun 2007 yang bekerjasama dengan instansi pemerintah lainnya. Peubahpeubah yang digunakan ditunjukkan pada Tabel 1.

9

Tabel 1 Daftar peubah indikator kesejahteraan rakyat
Peubah indikator kesejahteraan rakyat
Persentase laju pertumbuhan penduduk (%)
Kepadatan penduduk per km2 (jiwa)
Angka beban ketergantungan (jiwa)
Rata-rata lama sakit (bulan/ tahun)
Persentase penduduk usia 10 tahun ke atas dengan pendidikan
tertinggi SLTP atau lebih (%)
Pengeluaran rata-rata perkapita sebulan (Rp)
Persentase rumah tangga dengan luas lantai kurang dari 10 m2 (%)
Persentase rumah tangga dengan sumber air minum ledeng (%)
Persentase penduduk usia muda 0 – 14 tahun (%)
Persentase penduduk usia lanjut ≥ 65 tahun (%)

Simbol
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10

Metode Analisis
Tahapan analisis data yang dilakukan dalam penelitian ini sebagai berikut :
1. Menentukan gerombol awal kabupaten/kota Provinsi Aceh tahun 2006.
Jumlah gerombol optimum tidak diketahui dari awal, sehingga jumlah gerombol
ditetapkan sebanyak 2, 3, 4, 5, 6, 7, dan 8 gerombol. Alokasi kabupaten/kota
pada setiap gerombol ditentukan berdasarkan letak keadaan geografis Provinsi
Aceh.
2. Menstandarisasikan data kesejahteraan rakyat Provinsi Aceh, karena perbedaan
satuan pada peubah.
3. Menggerombolkan kabupaten/kota Provinsi Aceh tahun 2006 dengan metode
OCS dan NPS.
3a. Metode penggerombolan dengan OCS dilakukan dengan tahapan berikut:
(1) Membagi objek-objek ke dalam c gerombol awal.
(2) Tetapkan xik  xk , untuk r =1, jika xik data tidak lengkap.
Keterangan:
xik = item objek ke–i pada peubah ke-k
r
= iterasi
(3) Masuk ke tahapan 2 sampai 4 algoritma OCS
(4) Berhenti jika max | cck( r )  cck( r 1) | 10 5 
c,k

Keterangan :
cck = pusat gerombol ke-c berdasarkan peubah ke–k
(5) Selainnya r = r +1, perbarui nilai keanggotaan objek ke-i terhadap
gerombol ke-c dengan menggunakan formula sebagai berikut:

d 
u ci    Ci 
c 1  d ci 
C

2

Keterangan:
uci = nilai keanggotan objek ke–i terhadap gerombol ke–c,

10
C

dengan

u
c 1

ci

1 ∀ � ;

d ci = jarak objek ke–i terhadap gerombol ke-c
C = banyaknya gerombol
(6) Menentukan xik dengan formula :

 (u ) c

 (u )
C

xik

r +1

2

c 1

ci

C

c 1

,1  i  C , jika xik data tidak lengkap.

ck
2

ci

(7) Kembali ke langkah 3.
3b. Metode penggerombolan dengan NPS dilakukan dengan tahapan berikut:
(1) Membagi objek-objek ke dalam c gerombol awal.
(2) Tetapkan xik  xk , untuk r =1, jika xik data tidak lengkap.
(3) Masuk ke tahapan 2 sampai 4 algoritma NPS
(4) Berhenti jika max | cck( r )  cck( r 1) | 10 5 
c,k

(5) Selainnya r = r +1, tentukan :
r +1
xik  cck , dci = min {d11, d21 ......... dci}, jika xik data tidak lengkap.
(6) Memperbarui nilai keanggotaan objek ke-i terhadap gerombol ke-c
dengan menggunakan formula sebagai berikut:

d 
u ci    Ci 
c 1  d ci 
C

2

(7) Kembali ke langkah 3.
4. Evaluasi terhadap hasil penggerombolan.
Evaluasi hasil gerombol dalam hal ini dilakukan dengan dua cara yaitu dengan
Root Mean Square Standard Deviation (RMSSTD) dan Pseudo F statistik
5. Intepretasi hasil penggerombolan dari hasil metode penggerombolan data tidak
lengkap yang terbaik berdasarkan RMSSTD.
6. Intepretasi hasil berdasarkan pada centroid masing-masing gerombol. Karena
data berdimensi banyak maka digunakan biplot. Biplot digunakan untuk
melihat secara visual karakteristik pada masing-masing gerombol.

11

Diagram alir yang digunakan dalam penelitian ini adalah:

Mulai

Data Kesejahteraan
Rakyat Provinsi Aceh
Tahun 2006

Standarisasi Data

Menentukan gerombol
awal 2, 3,4, 5, 6, 7, dan 8
Metode OCS

Metode NPS

Menganalisis jumlah
gerombol optimum

Hasil Gerombol
Metode OCS

Menganalisis jumlah
gerombol optimum

Membandingkan
ketepatan gerombol
OCS, NPS, dan PDS

Selesai

Gambar 1 Diagram alir penelitian

Hasil Gerombol
Metode NPS

12
4

HASIL DAN PEMBAHASAN

Kabupaten/kota di Provinsi Aceh yang digunakan dalam penelitian ini yaitu
sebanyak 23 kabupaten/kota. Kapubaten yang memiliki data tidak lengkap pada
tahun 2006 yaitu Kabupaten Pidie Jaya dan Kabupaten Subulussalam. Kabupaten
tersebut merupakan kabupaten hasil pemekaran pada awal tahun 2007. Beberapa
peubah yang memiliki data tidak lengkap pada kabupaten tersebut antara lain pada
peubah X3 : angka beban ketergantungan (jiwa), X4 : rata-rata lama sakit
(bulan/tahun), X6 : pengeluaran rata-rata perkapita sebulan (Rp), X7 : persentase
rumah tangga dengan luas lantai kurang dari 10 m2 (%), X8 : persentase rumah
tangga dengan sumber air minum ledeng (%), X9 : persentase penduduk usia muda
0-14 tahun (%), dan X10 : persentase penduduk usia lanjut ≥
tahun (%).
Keseluruhan data yang digunakan dalam penelitian ini memiliki 8% data yang tidak
lengkap.
Analisis Gerombol Metode OCS
Penentuan jumlah gerombol yang optimum pada metode OCS dapat
dilakukan menggunakan kriteria RMSSTD dan pseudo F. Hasil RMSSTD dapat
mengevaluasi jumlah gerombol yang optimum secara kuantitatif berdasarkan hasil
nilai RMSSTD yang terkecil. Jumlah gerombol yang memiliki RMSSTD terkecil
menunjukkan bahwa jumlah gerombol tersebut memiliki keragaman yang lebih
kecil dalam satu gerombol dibanding jumlah gerombol lainnya. Semakin kecil nilai
RMSSTD semakin kecil keragaman dari gerombol yang terbentuk. Nilai RMSSTD
yang tinggi menunjukkan gerombol yang terbentuk memiliki keragaman yang
tinggi. Tabel 2. Menunjukkan hasil RMSSTD pada masing-masing jumlah
gerombol dengan metode OCS. Berdasarkan Tabel 2. Jumlah gerombol 5 memiliki
nilai RMSSTD lebih kecil dari jumlah gerombol lainnya. Hal tersebut menunjukkan
bahwa jumlah gerombol 5 memiliki keragaman yang lebih kecil dalam satu
gerombol dibanding jumlah gerombol lainnya.
Tabel 2 Hasil RMSSTD metode OCS
OCS
Jumlah
Gerombol RMSSTD
2
0,9081
3
0,7351
4
0,6989
5
0,6459
6
0,8022
7
0,8716
8
0,6990
Hasil RMSSTD pada metode OCS dapat terlihat jelas berdasarkan grafik
RMSSTD yang ditunjukkan pada Gambar 2.

13
1
0,9

RMSSTD

0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0

1

2

3

4

5

6

7

8

Gambar 2 Grafik RMSSTD metode OCS
Gambar 2. Menunjukkan bahwa semakin besar jumlah gerombol maka
RMSSTD membentuk pola kubik dengan titik belok minimum pada jumlah
gerombol 5. Sehingga jumlah gerombol lima merupakan jumlah gerombol yang
optimum dalam menggerombolkan kabupaten/kota di Provinsi Aceh.
Pada penelitian ini, pseudo F digunakan untuk menunjukkan keragaman
masing-masing peubah pada setiap jumlah gerombol. Jumlah gerombol dapat
dicirikan oleh peubah dengan nilai pseudo F yang tinggi dibanding jumlah
gerombol lainnya. Peubah yang memiliki nilai pseudo F tertinggi menunjukkan
bahwa jumlah gerombol tersebut memiliki peubah dengan keragaman yang lebih
kecil dibanding jumlah gerombol lainnya. Hal tersebut dapat memperlihatkan
jumlah gerombol yang optimum untuk mendukung hasil RMSSTD. Berdasarkan
grafik RMSSTD menunjukkan bahwa hasil nilai RMSSTD akan menurun sangat
signifikan pada jumlah gerombol 2, 3, 4 dan 5, oleh karena itu perhitungan pseudo
F di masing-masing peubah dilakukan pada jumlah gerombol 2, 3 ,4 dan 5. Tabel
3. Menunjukkan hasil pseudo F pada masing-masing peubah berdasarkan metode
OCS.
Tabel 3 Hasil Pseudo F pada metode OCS
dua
tiga
empat
lima
Peubah
Pseudo F
Pseudo F
Pseudo F
Pseudo F
X1
0,98
14,79
12,02
10,70
X2
1,41
111,99
90,05
159,28
X3
12,71
7,16
7,70
7,52
X4
5,82
2,47
2,45
6,37
X5
0,58
1,07
7,11
3,75
X6
1,98
13,52
8,85
10,16
X7
2,69
9,13
9,62
25,58
X8
5,75
16,83
11,84
4,40
X9

26,09

14,06

11,98

8,24

X10

6,65

7,51

11,81

7,51

14
Berdasarkan Tabel 3. Hasil pseudo F dengan jumlah gerombol dua memiliki
nilai pseudo F tertinggi pada peubah X3, X8, dan X9. Kemudian jumlah gerombol 3
memiliki nilai pseudo F tertinggi pada peubah X1 dan X6. Selanjutnya jumlah
gerombol empat memiliki nilai pseudo F tertinggi pada peubah X5 dan X10.
Kemudian jumlah gerombol lima memiliki nilai pseudo F tertinggi pada peubah X2,
X4, dan X7. Berdasarkan hasil perhitungan pseudo F pada masing-masing peubah,
setiap jumlah gerombol memiliki penciri yang berbeda-beda, sehingga pseudo F
dalam penelitian ini tidak dapat digunakan untuk mengambil keputusan. Hasil
jumlah gerombol yang optimum dapat dilihat berdasarkan hasil RMSSTD yaitu
dengan jumlah gerombol lima.
Analisis Gerombol Metode NPS
Metode NPS merupakan algoritma khusus penggerombolan data tidak
lengkap dengan teknik yang sama dengan metode OCS. Perbedaan dari metode
OCS yaitu dalam menggantikan nilai yang tidak lengkap. Metode NPS
menggantikan nilai yang tidak lengkap menggunakan pusat gerombol, berdasarkan
jarak yang minimum. Evaluasi jumlah gerombol yang optimum pada metode NPS
juga dapat dilihat dari hasil nilai RMSSTD dan pseudo F. Berikut merupakan hasil
nilai RMSSTD pada masing-masing jumlah gerombol dengan metode NPS yang
ditunjukkan pada Tabel 4.
Tabel 4 Hasil RMSSTD metode NPS
NPS
Jumlah
Gerombol RMSSTD
2
0,9050
3
0,8071
4
0,6983
5
0,6459
6
0,6057
7
0,5919
8
0,5868
Hasil RMSSTD pada Tabel 4. Menunjukkan bahwa semakin banyak jumlah
gerombol hasil RMSSTD akan semakin kecil, namun pada jumlah gerombol enam
sudah terlihat kovergen. Pada jumlah gerombol tujuh dan delapan perbedaan hasil
RMSSTD dengan jumlah gerombol enam tidak jauh berbeda. Penurunan hasil nilai
RMSSTD pada masing-masing jumlah gerombol pada metode NPS akan terlihat
jelas pada grafik RMSSTD yang ditunjukkan pada Gambar 3.
Berdasarkan Gambar 3. Menunjukkan bahwa semakin banyak jumlah
gerombol maka nilai RMSSTD akan mengalami penurunan. Penurunan yang sangat
signifikan terjadi pada jumlah gerombol 2, 3, 4, 5, dan 6, pada jumlah gerombol 7
dan 8 terlihat penurunan tidak jauh berbeda dari jumlah gerombol 6. Berdasarkan
hasil RMSSTD yang ditunjukkan pada Gambar 3. Hasil gerombol dapat dikatakan
telah konvergen pada jumlah gerombol 6. Artinya berdasarkan RMSSTD dengan
metode NPS hasil penggerombolan dinyatakan optimum pada jumlah gerombol 6.

15
1
0,9
0,8

RMSSTD

0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1

2

3

4

5

6

7

8

Gambar 3 Grafik RMSSTD metode NPS
Jumlah gerombol yang optimum yaitu apabila setiap peubah yang
digunakan memiliki keragam yang kecil dalam satu gerombol. Hal tersebut dapat
ditunjukkan berdasarkan perhitungan pseudo F pada masing-masing peubah di
setiap jumlah gerombol. Berdasarkan grafik RMSSTD pada Gambar 3.
Menunjukkan bahwa jumlah gerombol mengalami penurunan yang signifikan pada
jumlah gerombol 2, 3, 4, 5, dan 6. Dalam hal ini akan ditunjukkan hasil pseudo F di
masing-masing peubah pada jumlah gerombol 2, 3, 4, 5, dan 6. Berikut merupakan
hasil perhitungan pseudo F pada masing-masing peubah dengan metode NPS yang
ditunjukkan pada Tabel 5.

Peubah
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10

Tabel 5 Hasil Pseudo F pada metode NPS
Dua
Tiga
Empat
Lima
Pseudo F Pseudo F
Pseudo F Pseudo F
0,98
0,46
12,02
10,7
1,41
5,27
90,05
159,28
14,14
19,01
7,78
7,66
6,46
3,42
2,59
6,46
0,58
0,15
7,11
3,75
2,18
6,47
8,86
10,31
2,95
33,51
9,71
25,66
18,84
8,96
5,81
4,57
29,48
20,8
12,05
8,4
7,36
19,65
12,05
7,54

Enam
Pseudo F
8,59
120,4
6,33
6,02
2,95
57,01
19,73
3,94
6,3
5,72

Berdasarkan Tabel 5. Hasil pseudo F dengan jumlah gerombol dua memiliki
nilai pseudo F tertinggi pada peubah X4, X8, dan X9. Kemudian jumlah gerombol
tiga memiliki nilai pseudo F tertinggi pada peubah X3 dan X10. Selanjutnya jumlah
gerombol empat memiliki nilai pseudo F tertinggi pada peubah X1 dan X5.
Kemudian jumlah gerombol lima memiliki nilai pseudo F tertinggi pada peubah X2

16
dan X7. Sedangkan jumlah gerombol enam memiliki nilai pseudo F tertinggi pada
peubah X6. Berdasarkan hasil perhitungan pseudo F pada masing-masing peubah,
setiap jumlah gerombol memiliki penciri yang berbeda-beda, sehingga hasil pseudo
F pada metode NPS dalam penelitian ini tidak dapat digunakan untuk mengambil
keputusan. Hasil jumlah gerombol yang optimum dari metode NPS dapat dilihat
berdasarkan hasil RMSSTD yaitu dengan jumlah gerombol enam.
Perbandingan Hasil Gerombol PDS, OCS, dan NPS
Penelitian Safitri (2015), telah mengkaji metode gerombol murni tanpa
imputasi dengan membandingkan metode KSC dan metode PDS menggunakan data
simulasi dan data kesejahteraan rakyat Provinsi Aceh tahun 2006. Pada penelitian
tersebut menyimpulkan bahwa metode PDS lebih baik dibanding metode KSC
dalam menggerombolkan data tidak lengkap. Kemudian metode PDS diterapkan
untuk menggerombolkan kabupaten/kota Provinsi Aceh tahun 2006 dengan 4
gerombol. Berdasarkan informasi tersebut, dalam penelitian ini akan dibandingkan
metode yang terbaik dari OCS, NPS atau PDS dalam menggerombolkan
kabupaten/kota di Provinsi Aceh tahun 2006 dengan 4 gerombol. Metode yang
memiliki nilai RMSSTD yang terkecil maka dapat dikatakan bahwa metode
tersebut dapat menghasilkan keragaman yang kecil dalam satu gerombol dibanding
metode lainnya. Sehingga untuk mendapatkan metode yang terbaik yaitu dilihat
berdasarkan hasil nilai RMSSTD pada masing-masing metode dengan jumlah
gerombol empat. Hasil RMSSTD dapat dilihat pada Tabel 6.
Tabel 6 Hasil RMSSTD metode OCS, NPS, dan PDS
Metode RMSSTD
OCS
0,6989
NPS
0,6983
PDS
0,7493
Hasil RMSSTD pada Tabel 5. Menunjukkan bahwa metode OCS dan NPS
dengan jumlah gerombol empat memiliki nilai RMSSTD lebih kecil dibanding
metode PDS. Berdasarkan hasil tersebut dapat dikatakan bahwa metode OCS dan
NPS lebih baik dibanding metode PDS dalam menggerombolkan data tidak lengkap
pada data kesejahteraan rakyat di Provinsi Aceh tahun 2006.
Hasil Gerombol Matode OCS
Hasil penggerombolan metode OCS, mendapatkan jumlah gerombol 5
sebagai jumlah gerombol optimum. Berdasarkan hasil RMSSTD, jumlah gerombol
5 memiliki nilai yang lebih kecil dibanding dengan jumlah gerombol lainnya.
Berikut merupakan hasil penggerombolan kabupaten/kota Provinsi Aceh tahun
2006 dengan 5 gerombol yang ditunjukkan pada Tabel 7.

17
Tabel 7 Hasil penggerombolan kabupaten/kota di Provinsi Aceh pada
metode OCS
Gerombol
Kabupaten/Kota
1
Sabang, Kota Langsa dan Lhokseumawe
2
Simeulue, Aceh Singkil, Aceh Tenggara, Aceh Timur, Aceh
Tengah, Bireuen, Aceh Utara, Bener Merieh
3
Aceh Selatan, Aceh Barat, Aceh Barat Daya, Gayo Lues, Aceh Jaya,
Subulussalam
4
Aceh Besar, Pidie, Aceh Tamiang, Nagan Raya, Pidie Jaya
5
Banda Aceh
Karakteristik dari masing-masing gerombol dapat dilihat berdasarkan pusat
gerombol pada masing-masing peubah yang ditunjukkan pada Tabel 8.
Tabel 8 Pusat gerombol metode OCS
Gerombol
Peubah
1
2
3
4
X1
-0,6918 -0,2472 0,3720 -0,3336
X2
0,3796 -0,2906 -0,3453 -0,2273
X3
-1,2368 0,7553 0,0383 -0,0719
X4
0,1755 -0,7848 1,2251 -0,0682
X5
0,1207 0,2592 -0,8441 0,8028
X6
0,5120 -0,3527 -0,5532 0,1337
X7
1,3552 -0,4093 -0,5578 -0,2938
X8
-0,2345 0,6920 0,0676 -0,8475
X9
-0,9347 0,9197 -0,1911 -0,3875
X10
-0,8453 -0,6212 0,7912 1,0743

5
3,4889
4,3947
-2,1620
-0,0709
-1,3853
3,4511
3,1502
-1,9669
-2,0209
-0,6134

Selain menggunakan pusat gerombol dari masing-masing peubah,
karakteristik kabupaten/kota pada setiap gerombol juga dapat dilihat secara visual
dengan menggunakan analisis biplot. Hasil analisis biplot ditunjukkan pada Gambar
4.
Keragaman yang dapat dijelaskan dari hasil analisis biplot pada Gambar 4.
yaitu sebesar 90,9% dengan dimensi pertama menjelaskan 83,1% dan dimensi
kedua menjelaskan 7,8%. Hal tersebut juga menunjukkan bahwa terdapat 9,1%
informasi yang hilang atau tidak dapat dijelaskan dari biplot.
Berdasarkan Gambar 4. Gerombol yang terdekat/searah dengan arah vektor
dari peubah, maka gerombol tersebut memiliki nilai rata-rata yang relatif tinggi.
Namun sebaliknya, jika gerombol terletak berlawanan dengan dengan arah vektor
dari peubah, maka gerombol tersebut memiliki nilai rata-rata yang relatif rendah.
Kedekatan gerombol terhadap vektor peubah juga ditunjukkan berdasarkan hasil
pusat gerombol pada Tabel 8. Meskipun tidak semua peubah dapat dicirikan dari
hasil biplot karena terdapat 9,1% informasi yang tidak dapat dijelaskan dari hasil
biplot.

18

Gambar 4 Biplot indikator kesejahteraan rakyat Provinsi Aceh Tahun 2006
dengan 5 gerombol pada metode OCS
Karakteristik kabupaten/kota di Provinsi Aceh yang dicirikan dari hasil
biplot di masing-masing gerombol pada metode OCS ditunjukkan pada Tabel 9.

Gerombol


1



2








Tabel 9 Karakteristik gerombol metode OCS
Karakteristik Gerombol
Pengeluaran rata-rata perkapita sebulan (X6) tinggi
Persentase rumah tangga dengan luas lantai kurang dari 10 m2
(X7 ) tinggi
Persentase penduduk usia 10 tahun ke atas dengan pendidikan
tertinggi SLTP atau lebih (X5) sedang
Persentase laju pertumbuhan penduduk (X1) rendah
Angka beban ketergantungan (X3) rendah
Persentase penduduk usia muda 0 – 14 tahun (X9) rendah
Persentase penduduk usia lanjut ≥ 65 tahun (X10) rendah
Angka beban ketergantungan (X3) tinggi
Persentase penduduk usia 10 tahun ke atas dengan pendidikan
tertinggi SLTP atau lebih (X5) tinggi

19
Gerombol

2

3

4

5

Karakteristik Gerombol
 Persentase rumah tangga dengan sumber air minum ledeng (X8)
tinggi
 Persentase rumah tangga dengan sumber air minum ledeng (X8)
tinggi
 Persentase penduduk usia muda 0 – 14 tahun (X9) tinggi
 Kepadatan penduduk perkm2 (X2) rendah
 Rata-rata lama sakit (X4) rendah
 Pengeluaran rata-rata perkapita sebulan (X6) rendah
 Persentase penduduk usia lanjut ≥ 65 tahun (X10) rendah
 Angka beban ketergantungan (X3) tinggi
 Rata-rata lama sakit (X4) tinggi
 Persentase penduduk usia lanjut ≥ 65 tahun (X10) tinggi
 Kepadatan penduduk perkm2 (X2) rendah
 Persentase penduduk usia 10 tahun ke atas dengan pendidikan
tertinggi SLTP atau lebih (X5) rendah
 Pengeluaran rata-rata perkapita sebulan (X6) rendah
 Persentase rumah tangga dengan luas lantai kurang dari 10 m2 (X7 )
rendah
 Persentase penduduk usia 10 tahun ke atas dengan pendidikan
tertinggi SLTP atau lebih (X5) tinggi
 Persentase penduduk usia lanjut ≥ 65 tahun (X10) tinggi
 Angka beban ketergantungan (X3) sedang
 Persentase penduduk usia muda 0 – 14 tahun (X9) sedang
 Persentase laju pertumbuhan penduduk (X1) rendah
 Persentase rumah tangga dengan sumber air minum ledeng (X8)
rendah
 Persentase laju pertumbuhan penduduk (X1) tinggi
 Kepadatan penduduk perkm2 (X2) tinggi
 Pengeluaran rata-rata perkapita sebulan (X6) tinggi
 Persentase rumah tangga dengan luas lantai kurang dari 10 m2 (X7)
tinggi
 Angka beban ketergantungan (X3) rendah
 Persentase penduduk usia 10 tahun ke atas dengan pendidikan
tertinggi SLTP atau lebih (X5) rendah
 Persentase rumah tangga dengan sumber air minum ledeng (X8)
rendah
Hasil Gerombol Metode NPS

Hasil penggerombolan dengan metode NPS, mendapatkan jumlah gerombol
6 sebagai jumlah gerombol optimum. Berdasarkan grafik RMSSTD, hasil gerombol
dikatakan sudah konvergen pada jumlah gerombol 6. Berikut merupakan hasil
penggerombolan kabupaten/kota Provinsi Aceh tahun 2006 dengan 6 gerombol
yang ditunjukkan pada Tabel 10.

20
Tabel 10 Hasil penggerombolan kabupaten/kota di Provinsi Aceh pada
metode NPS
Gerombol
Kabupaten/Kota
1
Sabang, Kota Langsa dan Lhokseumawe
2
Simeulue, Aceh Singkil, Aceh Tenggara, Aceh Timur, Aceh
Tengah, Bireuen, Aceh Utara, Bener Merieh
3
Aceh Selatan, Aceh Barat, Aceh Barat Daya, Gayo Lues, Aceh
Jaya, Subulussalam
4
Aceh Besar, Pidie, Aceh Tamiang, Nagan Raya, Pidie Jaya
5
Banda Aceh
6
Aceh Barat Daya
Karakteristik dari masing-masing gerombol dapat dilihat berdasarkan pusat
gerombol pada masing-masing peubah yang ditunjukkan pada Tabel 11.

Peubah

Tabel 11 Pusat gerombol metode NPS
Gerombol
1
2
3
4
5

6

X1

-0,6919

-0,2472

0,4676

-0,3336

3,4889

-0,1059

X2

0,3796

-0,2906

-0,3483

-0,2273

4,3947

-0,3305

X3

-1,2368

0,7553

0,1817

-0,0693

-2,162

-0,5611

X4

0,17