Analisis Komponen Utama Nonlinier Dan Analisis Komponen Utama Dengan Successive Interval Pada Analisis Gerombol K-Means

ANALISIS KOMPONEN UTAMA NONLINIER DAN
ANALISIS KOMPONEN UTAMA DENGAN SUCCESSIVE
INTERVAL PADA ANALISIS GEROMBOL K-MEANS

ARISTA MARLINCE TAMONOB

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
Dengan ini saya menyatakan bahwa tesis berjudul Analisis Komponen
Utama Nonlinier dan Analisis Komponen Utama dengan Successive Interval pada
Analisis Gerombol K-Means adalah benar karya saya dengan arahan dari komisi
pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi
mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan
maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan
dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Desember 2015
Arista M. Tamonob
NRP G152130521

RINGKASAN
ARISTA MARLINCE TAMONOB. Analisis Komponen Utama Nonlinier dan
Analisis Komponen Utama dengan Successive Interval pada Analisis Gerombol
K-Means. Dibimbing oleh ASEP SAEFUDDIN dan AJI HAMIM WIGENA.

Salah satu analisis gerombol non hirarki yang biasa digunakan yaitu
analisis gerombol K-Means digunakan untuk data bersifat numerik dan
menggunakan konsep jarak euclid sebagai ukuran melihat kemiripan dan
ketakmiripan gerombol. Jarak euclid digunakan apabila peubah amatan saling
bebas atau tidak berkorelasi satu sama lain.
Salah satu asumsi dalam analisis gerombol yang harus dipenuhi yaitu tidak
ada kasus multikoliniearitas antar peubah. Konsep jarak euclid dapat digunakan
untuk data numerik dengan cara mentransformasi peubah-peubah asal terlebih
dahulu dengan menggunakan analisis komponen utama sedangkan kasus dengan
data kategorik dapat diatasi dengan metode yang dikembangkan oleh Gifi pada

tahun 1989 yaitu Analisis Komponen Utama Nonlinier (AKUNL) dan dapat
diatasi dengan Analisis Komponen Utama (AKU) pada data yang sudah
dinumerikkan menggunakan metode successive interval.
Tujuan penelitian ini adalah untuk menerapkan AKUNL dan AKU dengan
successive interval pada data kategorik dan membandingkan kedua metode pada
analisis gerombol K-Means.
Data yang digunakan dalam penelitian ini berasal dari hasil pendataan
Survei Sosial Ekonomi Nasional (SUSENAS) Provinsi Nusa Tenggara Timur
tahun 2013 dengan 13 peubah kategorik.
Hasil penelitian menunjukkan bahwa AKUNL dan AKU dengan successive
interval sama-sama menghasilkan 8 komponen utama dengan total keragaman
AKUNL sebesar 77% dan AKU dengan successive interval sebesar 78% . Namun
dari kedua metode ini, AKU dengan successive interval memiliki rasio keragaman
dalam gerombol dan antar gerombol lebih kecil dibandingkan AKUNL yaitu
sebesar 0.00033, hal tersebut berarti metode AKU dengan successive interval
merupakan metode yang lebih baik dari AKUNL. Faktor-faktor yang perlu
diperhatikan untuk mengurangi kemiskinan di Provinsi NTT berdasarkan metode
AKU dengan successive interval yaitu dari segi bangunan tempat tinggal (luas
lantai, jenis lantai, atap, dan dinding) yang dihuni oleh masyarakat, dari segi
kualitas sumber daya manusia (pendidikan, literasi, dan pekerjaan), dari segi

pemenuhan kebutuhan hidup (bahan bakar, air minum, raskin), dari segi fasilitas
(aset dan handphone) terkhususnya untuk masyarakat yang jauh dari perkotaan.
Kata kunci: analisis gerombol K-Means, analisis komponen utama, analisis
komponen utama nonlinier, successive interval

SUMMARY
ARISTA MARLINCE TAMONOB. Nonliniear Principal Componet Analysis and
Principal Component Analysis with Successive Interval in K-Means Cluster
Analysis. Supervised by ASEP SAEFUDDIN and AJI HAMIM WIGENA.
One of non hierarchical cluster analysis commonly used is the analysis
of K-Means cluster used for numerical data and used euclid distance as a measure
to see similarity and dissimilarity measured. Euclidean distance is used if the
observation variables are independent oruncorrelated with one another.
One of the assumptions in cluster analysis is no multicoliniearity between
variables. Euclid distance concept used for numerical data by transforming the
variables using principal component analysis, while case with categorical data can
be resolved either by the develop method by Gifi in 1989 that is Nonliniear
Principal Component Analysis (NLPCA) or by by making categorical data into
numerical data by the method called successive interval and then used Principal
Component Analysis (PCA).

The aims of this researched were applied NLPCA and PCA with successive
interval in categorical data and to compared both of method in K-Means cluster
analysis.
The data used is the core data SUSENAS 2013 of East Nusa Tenggara
Province. Variables used consisted of 13 categorical variable.
In this study, it was concluded that NLPCA and PCA with successive interval
produced 8 principal components with variance total of NLPCA about 77% and
from PCA with successive interval about 78%. In K-Means cluster analysis with
PCA successive interval had variance ratio within cluster and between cluster
smaller than NLPCA about 0.00033. Factors that need to be considered to reduce
poverty in NTT based method PCA by successive interval, there are from
residential buildings (floor area, type of floor, ceiling, and walls) are inhabited by
people, from quality of human resources (education, literacy, and employment),
from subsistance (fuel, drinking water, poor rice), from facilities (assest and
handphone) especially to communities far from urban areas.
Keywords: K-Means cluster analysis, nonliniear principal component analysis,
principal component analysis, successive interval

© Hak Cipta Milik IPB, Tahun 2015
Hak Cipta Dilindungi Undang-Undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan
atau menyebutkan sumbernya. Pengutipan hanya untuk kepentingan pendidikan,
penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau
tinjauan suatu masalah; dan pengutipan tersebut tidak merugikan kepentingan
IPB
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis ini
dalam bentuk apa pun tanpa izin IPB

ANALISIS KOMPONEN UTAMA NONLINIER DAN
ANALISIS KOMPONEN UTAMA DENGAN SUCCESSIVE
INTERVAL PADA ANALISIS GEROMBOL K-MEANS

ARISTA MARLINCE TAMONOB

Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister Sains
pada
Program Studi Statistika Terapan


SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2015

Penguji Luar Komisi pada Ujian Tesis: Dr Ir Indahwati, MSi

Judul Tesis : Analisis Komponen Utama Nonlinier dan Analisis Komponen
Utama dengan Successive Interval pada Analisis Gerombol KMeans
Nama
: Arista Marlince Tamonob
NIM
: G152130521

Disetujui oleh
Komisi Pembimbing

Prof Dr Ir Asep Saefuddin, MSc
Ketua


Dr Ir Aji Hamim Wigena, MSc
Anggota

Diketahui oleh

Ketua Program Studi
Statistika Terapan

Dekan Sekolah Pascasarjana

Dr Ir Indahwati, MSi

Dr Ir Dahrul Syah, MScAgr

Tanggal Ujian:
09 November 2015

Tanggal Lulus:

PRAKATA

Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus atas segala
karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih
dalam penelitian yang dilaksanakan sejak bulan Mei 2015 ini ialah data kategorik,
dengan judul Analisis Komponen Utama Nonlinier dan Analisis Komponen
Utama dengan successive interval pada Analisis Gerombol K-Means.
Terima kasih penulis ucapkan kepada Bapak Prof Dr Ir Asep Saefuddin dan
Bapak Dr Ir Aji Hamim Wigena selaku pembimbing. Disamping itu, penghargaan
penulis sampaikan kepada BPS yang telah membantu dalam pengumpulan data
dan DIKTI yang telah membantu dalam hal dana perkuliahan. Ungkapan terima
kasih juga disampaikan kepada orangtua tercinta, Bapak Marthen Tamonob dan
Mama Paulina Tamonob-Doko, adik-adik tersayang, Yanry Arisandi Tamonob
dan Onisimus Tamonob,serta semua teman-teman dan keluarga besar atas segala
doa dan kasih sayangnya.
Semoga karya ilmiah ini bermanfaat.

Bogor, Desember 2015
Arista M. Tamonob

DAFTAR ISI
DAFTAR TABEL


vi

DAFTAR GAMBAR

vi

DAFTAR LAMPIRAN

vi

1 PENDAHULUAN
Latar Belakang
Perumusan Masalah
Tujuan Penelitian
Manfaat Penelitian
Ruang Lingkup Penelitian

1
1

2
2
2
3

2 TINJAUAN PUSTAKA
Data Kategorik
Asosiasi Data Kategorik
Analisis Komponen Utama Nonlinier (AKUNL)
Analisis Komponen Utama
Successive Interval
Analisis Gerombol K-Means

3
3
3
4
6
6
8


3 METODE
Data
Metode Analisis

9
9
9

4 HASIL DAN PEMBAHASAN
Pengecekan Multikolinieritas
Analisis Komponen Utama Nonlinier
Analisis Komponen Utama dengan Successive Interval
Perbandingan Hasil Gerombol

10
12
12
13
13

5 SIMPULAN DAN SARAN
Simpulan
Saran

16
16
16

DAFTAR PUSTAKA

16

LAMPIRAN

18

RIWAYAT HIDUP

26

DAFTAR TABEL
1
2
3
4
5

Uji korelasi atau asosiasi yang dipilih
Hasil analisis komponen utama nonlinier
Hasil analisis komponen utama dari data hasil successive interval
Jumlah objek rumah tangga disetiap gerombol untuk metode AKUNL
Jumlah objek rumah tangga disetiap gerombol untuk metode AKU
dengan successive interval
6 Keragaman antar gerombol dan dalam gerombol dua metode
7 Hasil ANOVA analisis gerombol K-Means untuk metode AKU dengan
successive interval
8 Koefisien komponen utama metode AKU dengan successive interval

4
12
13
14
14
14
15
15

DAFTAR GAMBAR
1
2
3
4

Peta Provinsi Nusa Tenggara Timur
Persentase jenjang pendidikan kepala rumah tangga
Persentase jenis bahan bakar yang digunakan untuk memasak
Persentase kepemilikan jamban tiap rumah tangga

10
11
11
11

DAFTAR LAMPIRAN
1
2
3
4
5

Peubah kategorik awal yang digunakan
Peubah berskala ordinal
Deskripsi 15 peubah kategorik
Asosiasi peubah kategorik
Data hasil successive interval

18
20
21
24
25

1 PENDAHULUAN
Latar Belakang
Dalam penelitian yang berkaitan dengan ilmu sosial dan ilmu perilaku, para
peneliti sering dihadapkan dengan peubah-peubah yang banyak dengan skala
pengukuran yang berbeda yaitu skala numerik (interval dan rasio) dan skala
kategorik (nominal dan ordinal). Analisis gerombol merupakan suatu metode
dalam analisis peubah ganda yang dapat digunakan untuk mengelompokkan
peubah atau objek. Objek-objek dikelompokkan ke dalam beberapa kelompok
berdasarkan tingkat kemiripan antar objek (Johnsons & Wichern 2002). Secara
umum, peubah yang digunakan sebagai dasar penggerombolan terdiri dari dua
jenis, yaitu peubah kategorik dan peubah numerik.
Pada umumnya terdapat dua metode dalam melakukan penggerombolan,
yaitu metode penggerombolan hirarki dan non hirarki. Metode penggerombolan
hirarki digunakan jika jumlah gerombol yang diinginkan belum diketahui
sebelumnya sedangkan metode penggerombolan non hirarki digunakan jika
jumlah gerombol yang diinginkan sudah ditetapkan sebelumnya. Salah satu
analisis gerombol non hirarki yang biasa digunakan yaitu analisis gerombol KMeans yang digunakan untuk data bersifat numerik dan menggunakan konsep
jarak euclid sebagai ukuran untuk mengetahui kemiripan dan ketakmiripan
gerombol. Jarak euclid digunakan apabila peubah amatan saling bebas atau tidak
berkorelasi satu sama lain.
Salah satu asumsi dalam analisis gerombol yang harus dipenuhi yaitu tidak
ada kasus multikoliniearitas antar peubah (Hair et al. 2010). Konsep jarak euclid
dapat digunakan untuk data numerik dengan cara mentransformasi peubah-peubah
asal terlebih dahulu dengan menggunakan analisis komponen utama (Kaufman &
Petter 2005) sedangkan untuk data kategorik dapat diatasi dengan metode yang
dikembangkan oleh Gifi pada tahun 1989 yaitu analisis komponen utama
nonlinier (AKUNL). Analisis komponen utama nonlinier menghasilkan skor
komponen objek dan skor komponen utama yang berjenis data numerik sehingga
dapat dianalisis lebih lanjut dengan analisis gerombol menggunakan konsep jarak
euclid (Safitri et al. 2012).
Data kategorik dengan skala pengukuran ordinal dapat dijadikan skala
interval dengan menggunakan metode yang dikemukakan oleh Hays pada tahun
1976 (Waryanto & Millafati 2006) yaitu successive interval. Analisis komponen
utama (AKU) dapat digunakan pada data hasil successive interval untuk
mereduksi data dan mengatasi multikolinieritas sehingga dapat dianalisis lebih
lanjut dengan analisis gerombol.
Beberapa penelitian sebelumnya yang menggunakan metode successive
interval ini antara lain pernah dilakukan Kusnadi (2012) untuk menjadikan data
berskala ordinal menjadi data berskala interval untuk digunakan dalam analisis
jalur pada penelitian dengan judul perubahan status kelembagaan dan kualitas
pelayanan pasien rumah sakit, Rahmawati et al. (2014) mentransformasi data hasil
kuesioner berupa data kategorik berskala ordinal menjadi data interval yang akan
dianalisis menggunakan analisis korelasi kanonik pada penelitian analisis
pengaruh motivasi dan lingkungan kerja terhadap kepuasaan kerja dan kinerja

2
karyawan di PT Sinar Sosro, Jawa Timur. Penelitian-penelitan sebelumnya yang
berkaitan dengan analisis gerombol menggunakan AKUNL telah dilakukan oleh
Ahzan (2010) yang meneliti tentang analisis gerombol hirarki pada data kategorik
dengan menggunakan AKUNL pada analisis gerombol hirarki diperoleh hasil
bahwa metode pautan lengkap lebih menghasilkan gerombol yang lebih
menggambarkan kondisi sesungguhnya dibandingkan dengan hasil metode pautan
tunggal dan pautan rataan. Selain itu untuk kasus data campuran, Islamiyati
(2010) meneliti tentang aplikasi analisis komponen utama nonlinier (PRINCALS)
pada peningkatan mutu pendidikan tinggi dengan menggunakan analisis gerombol
K-Means dan diperoleh faktor-faktor yang berpengaruh terhadap prestasi belajar
adalah umur masuk, nilai NEM, status sekolah, jalur masuk, pekerjaan ayah,
pendidikan ayah dan ibu, dan status tempat tinggal, Yunianto (2011) meneliti
tentang perbandingan penggerombolan dengan analisis komponen utama nonlinier
dan gerombol dua langkah pada data campuran dan diperoleh hasil bahwa metode
gerombol dua langkah dapat menjelaskan hasil penggerombolan lebih baik dan
lebih spesifik dibandingkan dengan metode pautan centroid dengan transformasi
AKU.
Berdasarkan penelitian-penelitian tersebut maka penelitian kali ini bertujuan
untuk meneliti tentang perbandingan AKUNL dan AKU dengan successive
interval untuk data kategorik pada analisis gerombol K-Means dengan
menggunakan data kriteria kemiskinan Provinsi Nusa Tenggara Timur tahun
(NTT) 2013 dan mengetahui peubah-peubah yang signifikan terhadap kemiskinan
di NTT.

Perumusan Masalah
Masalah yang dirumuskan dalam penelitian ini adalah bagaimana penerapan
analisis gerombol K-Means pada data kategorik menggunakan analisis komponen
utama nonlinier dan analisis komponen utama dengan successive interval,
manakah metode yang terbaik dari kedua metode tersebut pada analisis gerombol
K-Means, dan peubah-peubah yang berpengaruh terhadap kemiskinan di Provinsi
NTT dari metode terbaik.

Tujuan Penelitian
Tujuan penelitian ini untuk menerapkan analisis komponen utama nonlinier
dan analisis komponen utama dengan successive interval pada data kategorik,
membandingkan metode analisis komponen utama nonliniear dan analisis
komponen utama dengan successive interval pada analisis gerombol K-Means,
dan mengetahui peubah-peubah yang signifikan terhadap kemiskinan di Provinsi
NTT dari metode yang terbaik.
Manfaat Penelitian
Manfaat penelitian ini adalah mengetahui metode untuk menerapkan analisis
gerombol K-Means pada data kategorik.

3
Ruang Lingkup Penelitian
Penelitian terbatas pada data kategorik untuk data kemiskinan Provinsi Nusa
Tenggara Timur tahun 2013.

2 TINJAUAN PUSTAKA
Data Kategorik
Berdasarkan jenisnya data dibedakan menjadi data numerik (kuantitatif) dan
data kategorik (kualitatif). Data numerik yaitu data yang dinyatakan dalam
besaran numerik (angka), misalkan data pendapatan per kapita, pengeluaran,
harga, dan lain-lain, sedangkan data kategorik diklasifikasikan berdasarkan
kategori atau kelas tertentu.
Data kategorik dapat dibedakan menjadi:
a. Data nominal
Data dengan urutan atau nilai tidak menunjukkan tingkatan hanya sebagai label
saja. Contoh: agama, jenis kelamin, suku atau ras.
b. Data ordinal
Data dengan urutan kategori menunjukkan tingkatan atau ranking. Contoh:
jenjang pendidikan dan kebiasaan merokok.
Data kategorik dapat pula diperoleh dengan mengelompokkan data kontinu
namun resikonya bisa kehilangan informasi. Dalam penerapannya lebih mudah
mencatat data kategorik daripada data kontinu, responden lebih mudah menjawab
kategori dalam hal ini untuk pertanyaan sensitif, secara makna lebih praktis.
Penyajian data kategorik dapat berupa frekuensi, tabel frekuensi, dan tabel
kontingensi (Agresti 2002).
Asosiasi Data Kategorik
Dalam kasus dimana peubah yang dihubungkan bersifat numerik, maka
analisis menggunakan korelasi merupakan salah satu pilihan. Namun, jika kedua
peubah yang dihubungkan bersifat kategorik, maka penggunaan analisis korelasi
tidak bisa digunakan karena angka pada suatu kategori hanya berupa kode bukan
nilai yang sebenarnya. Alasan yang lain mengapa analisis korelasi tidak bisa
digunakan pada data kategorik karena salah satu tipe peubah kategorik adalah
nominal yang tidak bisa diurutkan kategorinya. Pemberian urutan yang berbeda
jelas akan memberikan nilai korelasi yang berbeda pula sehingga dua orang yang
menghitung nilai korelasi besar kemungkinan memberikan hasil yang tidak sama.
Untuk itulah maka analisis khi-kuadrat yang akan digunakan untuk mencari
hubungan (asosiasi) antar peubah-peubah kategorik tersebut.
Analisis khi-kuadrat didasarkan pada tabel kontingensi (sering juga
disebut tabulasi silang). Tabel kontingensi adalah tabel yang sel-selnya berisi
frekuensi dari perpotongan baris dan kolom. Bentuk umum dari tabel kontingensi
dengan peubah pertama memiliki m kategori dan peubah kedua memiliki k
kategori.

4
Hipotesis yang akan diuji

H 0 : kedua peubah saling bebas (tidak ada asosisasi)
H1 : kedua peubah tidak bebas (ada asosiasi)
Statistik uji yang digunakan:

 2 hitung
Jika nilai

 2hitung

Oij  Eij 
  
Eij
j 1 i 1
k

bernilai lebih besar daripada nilai

(m  1)(k  1) maka tolak

2

m

 2tabel (db; )

dengan derajat bebas

H0 .

Kuat atau lemahnya asosiasi dapat dilihat dari nilai asosiasi antara selang -1
sampai dengan 1. Nilai asosiasi sama dengan 1 berarti ada asosiasi kuat antar
peubah, jika nilai asosiasi sama dengan nol berarti tidak ada asosiasi antar peubah.
Uji korelasi atau uji asosiasi dengan skala ukur yang berbeda dapat dilihat
pada Tabel 1. Data berskala ukur ordinal dapat dilihat hubungan keeratan antar
peubah dengan menggunakan koefisien korelasi rank Spearman.
n

rs 

1  6 d i 2
i 1

n( n 2  n)

dengan:
rs  koefisien korelasi Spearman

di  selisih peringkat untuk setiap data
n = jumlah sampel atau data
Tabel 1 Uji korelasi atau asosiasi yang dipilih
Peubah 1
Nominal

Peubah 2
Nominal

Nominal
Ordinal
Ordinal
Numerik

Ordinal
Ordinal
Numerik
Numerik

Uji korelasi atau asosiasi yang dipilih
Koefisien Kontingensi, Lambda, Phi, dan
Cramer
Koefisien Kontingensi, Lambda
Spearman, Gamma, Somers’d
Spearman
Pearson

Analisis Komponen Utama Nonlinier (AKUNL)
Analisis Komponen Utama Nonlinier merupakan pengembangan dari
analisis Komponen Utama dan biasa disebut juga PRINCALS (Principal
Component Analysis by Alternating Least Square) atau Analisis Komponen
Utama dengan menggunakan pendekatan Alternating Least Square yang
diperkenalkan oleh Gifi pada tahun 1989. AKUNL menghasilkan tiga kelompok
unsur, yaitu bobot peubah atau skor komponen utama (variable loadings),
kategori kuantifikasi (category quantifications) dan skor komponen objek (object
scores). Dalam AKUNL, kategori semua peubah dengan skala bukan numerik
akan diberi kuantifikasi kategori dengan skala numerik yang sesuai. Analisis

5
Komponen Utama Nonlinier bertujuan untuk mengoptimalkan atau mencari ratarata kuadrat korelasi yang optimal antara peubah yang telah diberi kuantifikasi
kategori dengan komponen. Dalam pencarian nilai optimal tersebut, baik
komponen loading dan kuantifikasi kategori akan memberikan nilai yang
bervariasi sampai nilai optimum ditemukan (Konig 2002 diacu dalam Azizah et al
2014).
Apabila terdapat suatu data yang dibentuk ke dalam matriks H yang
berukuran n  m maka untuk memudahkan perhitungan AKUNL dipakai notasi:
n = banyak pengamatan (objek); i  1, 2,.., n
m = banyak peubah
kj = banyak kategori pada peubah ke-j; j  1, 2,.., m

h j = vektor kolom ke-j dari matriks H berukuran n 1

G j = matriks indikator dari h j berukuran n  k j dengan:
1, jika objek ke-i berada dalam kategori ke -r dari peubah j
g( j )ir 
0, jika objek ke-i tidak berada dalam ketegori ke-r dari peubah j
i  1, 2,..., n; r  1, 2,..., k j

G j merupakan matriks yang berisi frekuensi dari tiap kategori pada tiap
kategori pada setiap peubah. G j dikatakan lengkap apabila dari setiap baris pada

G j mempunyai satu unsur bernilai satu dan lainnya nol.
Analisis Komponen Utama Nonlinier didasarkan pada teori meet loss yang

bertujuan untuk meminimumkan fungsi homogeneity loss ( M ) .
m

 M ( X , Y1 ,..., Ym )  m1  ( X  G jYj ) '( X  G jYj )
j 1

dengan normalisiasi AVE ( X s )  0 untuk dimensi s=1,..,p dan X’X=I. AVE ( X s )
adalah vektor yang merupakan rata-rata kolom dari elemen matriks X s . Notasi

 M digunakan karena  M ( X , Y )  0 yang berimplikasi pada nilai ranking G j
paling sedikit p.
Fungsi

 M diminimumkan menggunakan metode alternating least square

untuk mendapatkan pendugaan nilai bobot peubah a j . Algoritma untuk
menghitung p dimensi pertama secara simultan dan meminimumkan
menggunakan alternating least square adalah :

 M dengan

Yj  D-1j G'j X dengan Dj = G j'G j
m

Z   G jYj
j1

X = GRAM(Z)

X adalah skor komponen objek berukuran

n p

(p = banyak peubah), Yj

adalah multiple category quantification berukuran k j  p , GRAM(Z) adalah

6
matriks ortogonal dari ortogonalisasi Gram-Schmidt dari matriks Z, dan a j adalah
bobot peubah untuk peubah j (Gifi 1989).

Analisis Komponen Utama
Analisis Komponen Utama adalah metode analisis peubah ganda yang
bertujuan memperkecil dimensi peubah asal sehingga diperoleh peubah baru
(komponen utama) yang tidak saling berkorelasi tetapi menyimpan sebagian besar
informasi yang terkandung pada peubah asal (Johnson & Wichern 2002).
Misalkan X1 , X 2 ,..., X p adalah peubah acak yang menyebar menurut sebaran

tertentu dengan vektor nilai tengah μ dan matriks peragam Σ .
Komponen utama merupakan kombinasi liniear terboboti dari peubahpeubah asal yang mampu menerangkan data secara maksimum.
Komponen utama ke-j dari p peubah dapat dinyatakan sebagai berikut:

Yj  a1 j x1  a2 j x2  ...  a pj x p  a ' x
dan keragaman komponen utama ke-j adalah

Var(Yj )   j ; j  1, 2,..., p

1 , 2 ,...,  p adalah akar ciri yang diperoleh dari persaman:
Σ  jI  0

dimana 1  2  ...   p  0 . Vektor ciri a sebagai pembobot dari transformasi
linear peubah asal diperoleh dari persamaan :
 Σ   jI  a j  0
Total keragaman komponen utama adalah

1  2  ...   p  tr  Σ 

dan persentase total keragaman data yang mampu diterangkan oleh komponen
utama ke-j adalah :

 j

x100% 

 tr  Σ 

Persentase keragaman dianggap cukup mewakili total keragaman jika data
75% atau lebih. Pembangkitan komponen utama tergantung dari jenis data asal
yang digunakan. Apabila data yang digunakan memiliki satuan pengukuran yang
sama maka digunakan matriks peragam. Jika syarat di atas tidak terpenuhi, maka
digunakan matriks korelasi.

Successive Interval
Menurut tingkatannya, data secara berurut dari skala terendah ke tertinggi
adalah data nominal, ordinal, interval, dan rasio. Pada penelitian di bidang ilmu
sosial seringkali digunakan data kualitatif (nominal dan ordinal) sebagai refleksi
dari konsep yang sifatnya abstrak atau tidak bisa diukur secara langsung. Konsep
yang tidak dapat diukur secara langsung tersebut dituangkan dalam kuesioner

7
sehingga dapat ditanyakan terhadap responden. Pada umumnya, jawaban
responden yang diukur menggunakan skala likert (likert scale) diadakan skoring
yakni pemberian nilai numerikal 1, 2, 3, 4, dan 5, setiap skor yang diperoleh akan
memiliki tingkat pengkuran ordinal.
Dalam penggunaan alat analisis, umumnya ditentukan skala minimal dari
data yang dibutuhkan. Dalam kasus penelitian di bidang sosial yang biasanya
ditemui banyak menggunakan skala ordinal sementara persyaratan alat analisis
membutuhkan data dengan skala minimal adalah data interval. Dalam kondisi
tersebut, kita perlu mentransformasikan data dari skala ordinal ke interval.
Sebuah metode untuk mentransformasi data dari skala ordinal ke interval
diperkenalkan oleh Hays (1976) dalam bukunya Quantification in Psychology.
Metode successive interval merupakan proses untuk mengubah data dengan skala
pengukuran ordinal menjadi data interval.
Tahapan dalam metode successive interval (Waryanto & Millafati 2006),
yaitu:
a. Menghitung frekuensi dari setiap data kategori
Frekuensi merupakan banyaknya tanggapan responden dalam memilih poin
disetiap kategori yang ada.
b. Menghitung proporsi berdasarkan frekuensi setiap kategori
Proporsi dihitung dengan membagi setiap frekuensi dengan jumlah responden.
c. Menghitung proporsi kumulatif
Proporsi kumulatif dihitung dengan menjumlahkan proporsi secara berurutan
untuk setiap nilai.
d. Menghitung nilai z untuk setiap proporsi kumulatif
Nilai z diperoleh dari tabel distribusi normal baku, dengan asumsi bahwa
proporsi kumulatif berdistribusi normal baku.
e. Menghitung nilai densitas fungsi z
Nilai densitas dihitung dengan menggunakan rumus sebagai berikut:
1
 1 
f ( z) 
exp   z 2 
2
 2 
f. Menghitung scale value (interval rata-rata) untuk setiap kategori
Menghitung scale value digunakan rumus
density at lower limit-density at upper limit
SV=
area under offer limit-area under lower limit
dengan:
nilai density = nilai diambil dari densitas z

area = nilai diambil dari proporsi kumulatif
g. Menghitung nilai hasil penskalaan
Nilai SV terkecil (nilai negatif yang terbesar) diubah menjadi sama dengan 1
kemudian transformasi nilai skala dengan rumus y  SV  SV min

8
Analisis Gerombol K-Means
Analisis gerombol K-Means dikembangkan oleh Mac Queen pada tahun
1967 dan merupakan salah satu metode pengelompokkan data non hirarki yang
paling terkenal dan banyak digunakan di berbagai bidang karena sederhana dan
mudah diimplementasikan (Johnson & Wichern 2002). K-Means merupakan
metode penggerombolan secara partitioning yang memisahkan data ke dalam
kelompok yang berbeda. Tujuan dari penggelompokkan data ini adalah untuk
meminimalisasi ragam didalam suatu kelompok dan memaksimalkan ragam antar
kelompok.
Dasar algoritma K-Means adalah sebagai berikut:
1. Menentukan nilai k sebagai jumlah gerombol yang ingin dibentuk
2. Membangkitkan titik pusat gerombol k awal secara acak
3. Menghitung jarak setiap data ke masing-masing pusat gerombol menggunakan
jarak euclid
4. Mengelompokan setiap data berdasarkan jarak antar terdekat antar data dengan
pusatnya
5. Menentukan posisi pusat gerombol baru dengan cara menghitung nilai rata-rata
dari data-data yang ada pada pusat gerombol yang sama
Hasil penggerombolan yang baik apabila objek dalam gerombol yang sama
memiliki keragaman yang rendah sedangkan objek antar gerombol memiliki
tingkat keragaman yang tinggi (Serban & Grigoretta 2006).
nj

Keragaman antar gerombol SSB   n j ( x. j  x )2
j 1

dengan:

x  rata-rata total seluruh objek
n j  banyaknya objek gerombol ke-j
x. j  rata-rata objek pada gerombol ke-j
k

nj

Keragaman dalam gerombol SSW   ( xij  x. j )2
j 1 i 1

dengan:

xij  objek ke-i gerombol ke-j
x. j  rata-rata objek pada gerombol ke-j

k  banyaknya gerombol
Untuk perbandingan dua metode dilihat rasio keragaman dalam gerombol
dan antar gerombol. Rasio keragaman yang lebih kecil menunjukkan bahwa
metode tersebut merupakan metode terbaik (Yunianto 2011).
Rasio Keragaman=

Keragaman dalam gerombol (SSW)
Keragaman antar gerombol (SSB)

9

3 METODE
Data
Penelitian ini menggunakan data kor SUSENAS Provinsi Nusa Tenggara
Timur tahun 2013. Peubah yang digunakan terdiri dari 13 peubah kategorik
(Afandi 2009) dengan 2 peubah berskala ordinal dan 11 peubah berskala nominal
yaitu pendidikan (X1) berskala ordinal, luas lantai (X2) berskala ordinal, jenis
lantai (X3) berskala nominal, dinding (X4) berskala nominal, atap (X5) berskala
nominal, jamban (X6) berskala nominal, air minum (X7) berskala nominal, bahan
bakar (X8) berskala nominal, aset (X9) berskala nominal, literasi (X10) berskala
nominal, pekerjaan (X11) berskala nominal, raskin (X12) berskala nominal, dan
handphone (X13) berskala nominal.
Dalam metode successive interval memerlukan data berskala ukur ordinal
sehingga 11 data berskala nominal tersebut dijadikan data berskala ordinal dengan
merubah urutan kategori sehingga terurut dari kategori yang paling rendah sampai
dengan kategori paling tinggi. Sebagai contoh, peubah X6 yaitu peubah
kepemilikan jamban dengan kategori awal berskala nominal yaitu:
1) milik sendiri
2) bukan milik sendiri
3) tidak ada
diubah urutan kategorinya, diawali dengan kategori paling rendah sampai dengan
kategori tertinggi sehingga kategori pada peubah X6 menjadi berskala ordinal
yaitu:
1) tidak ada
2) bukan milik sendiri
3) milik sendiri
Peubah beserta kategori awal dapat dilihat pada Lampiran 1 sedangkan
peubah beserta kategori berskala ordinal dapat dilihat pada Lampiran 2.
Kelompok untuk analisis gerombol terdiri dari 2 kelompok yaitu kelompok rumah
tangga miskin dan kelompok rumah tangga tidak miskin.

Metode Analisis
1. Melakukan eksplorasi data
Data dieksplorasi dan dilakukan pemeriksaan adanya multikoliniearitas antar
peubah, karena data yang digunakan berskala ordinal maka dilihat asosiasi
antar peubah dengan menggunakan korelasi spearman.
2. Melakukan analisis komponen utama nonlinier
Data kemiskinan bertipe kategorik dilakukan analisis komponen utama
nonlinier sehingga diperoleh skor komponen utama yang akan digunakan pada
analisis gerombol K-Means.
3. Melakukan successive interval terhadap data peubah bebas
Data berskala ordinal dijadikan berskala interval dengan menggunakan metode
successive interval.
4. Melakukan AKU terhadap data hasil successive interval

10
Data hasil successive interval dilakukan analisis komponen utama untuk
mereduksi data dan mengatasi multikoliniearitas sehingga diperoleh skor
komponen utama yang akan digunakan pada analisis gerombol K-Means.
5. Menerapkan analisis gerombol K-Means pada skor komponen utama AKUNL
dan AKU dengan successive interval dari poin 2 dan 4.
6. Membandingkan kedua metode
Kedua metode dibandingkan dengan melihat rasio keragaman antar gerombol
dan dalam gerombol.

4 HASIL DAN PEMBAHASAN
Provinsi Nusa Tenggara Timur (NTT) merupakan sebuah provinsi di
Indonesia yang terletak di bagian Tenggara Indonesia. Provinsi ini terdiri dari 21
kabupaten dan 1 kota yang tersebar di beberapa pulau besar diantaranya pulau
Timor, pulau Sumba, pulau Flores, dan pulau Alor seperti yang terlihat pada
Gambar 1. Menurut BPS (2014), NTT menempati urutan ketiga dari 33 provinsi
di Indonesia yang memiliki persentase penduduk miskin tertinggi yaitu sebesar
19.60% setelah Papua sebesar 27.80% dan Papua Barat 26.26%.
Deskripsi data menggunakan data yang telah berskala ukur ordinal dengan
hanya menampilkan 3 peubah yaitu pendidikan, bahan bakar, dan jamban.
Deskripsi data untuk 10 peubah kategorik lainnya dapat dilihat pada Lampiran 3.

Gambar 1 Peta Provinsi Nusa Tenggara Timur
Sumber: (Ar, 2015)
Pada Gambar 2, Gambar 3, dan Gambar 4 disajikan deskripsi data kor
SUSENAS Provinsi NTT tahun 2013 dengan 10422 rumah tangga untuk tiga
peubah kriteria kemiskinan yaitu peubah pendidikan, peubah bahan bakar, dan
peubah jamban.

11
tidak tamat SD
tamat SMP/sederajat

tamat SD/sederajat
tamat SMA/sederajat
7%10,7%
15,6%
12,6%
54%

Gambar 2 Persentase jenjang pendidikan kepala rumah tangga
Tingkat pendidikan di Nusa Tenggara Timur masih memprihatinkan.
Berdasarkan Gambar 2, sebanyak 54% masyarakat NTT hanya menempuh jenjang
pendidikan sampai tingkat SD atau setara. Fasilitas sekolah yang masih minim di
daerah pedesaan, tenaga pendidik yang masih relatif sedikit untuk bekerja di
daerah terpencil, biaya pendidikan yang masih dianggap mahal oleh masyarakat,
serta kesadaran diri dari masyarakat untuk bersekolah menjadi beberapa penyebab
hal ini.
arang/briket/kayu

minyak tanah

listrik/gas

0.9%
15.7%
83.4%

Gambar 3 Persentase jenis bahan bakar yang digunakan untuk memasak
Sebagai salah satu provinsi yang belum melakukan program konversi
minyak tanah ke gas tentu saja penggunaan bahan bakar berupa minyak tanah
masih didominasi oleh minyak tanah yaitu sebesar 83.4%. Berdasarkan Gambar 3,
penggunaan gas masih sangat minim yaitu sebesar 0.9%, gas biasanya digunakan
oleh masyarakat yang tinggal di perkotaan dengan tingkat ekonomi diatas rata-rata.
tidak ada

bukan milik sendiri

milik sendiri

21.3%
64.2%

14.5%

Gambar 4 Persentase kepemilikan jamban tiap rumah tangga
Berdasarkan Gambar 4, kepemilikan jamban untuk tiap rumah tangga di
NTT masih sebanyak 21.3% rumah tangga yang tidak memiliki jamban dan
14.5% rumah tangga masih menggunakan jamban milik rumah tangga lain. Jenis
jamban di daerah pedesaan masih kurang layak digunakan, jamban biasanya
terbuat dari potongan-potongan kayu yang diletakkan diatas sebuah lubang. Hal

12
tersebut disebabkan oleh kemampuan ekonomi dan pengetahuan tentang sanitasi
yang masih minim dari penduduk di NTT.

Pengecekan Multikolinieritas
Dari 13 peubah bebas berskala ordinal tersebut dilakukan uji asumsi
multikolinieritas dengan melihat nilai korelasi spearman antar peubah. Dari nilai
korelasi spearman terdapat asosiasi atau hubungan cukup besar antara peubah
literasi dan pendidikan sebesar 0.553, antara pendidikan dan bahan bakar sebesar
0.434. Nilai asosiasi dapat dilihat pada Lampiran 4.

Analisis Komponen Utama Nonlinier
Analisis komponen utama nonlinier dilakukan terhadap seluruh peubah
kategorik untuk mereduksi jumlah peubah dan mentransformasi peubah tersebut
menjadi peubah baru (komponen utama) yang berskala rasio dan tidak saling
berkorelasi.
Pemilihan komponen utama yang akan digunakan dalam analisis gerombol
K-Means didasarkan pada persentase keragaman kumulatif yang ditunjukkan oleh
Tabel 2. Persentase keragaman dianggap cukup mewakili total keragaman data
sebesar 75% atau lebih (Morisson 1990).
Sebanyak 13 komponen utama yang dihasilkan dari AKUNL tidak
digunakan semua melainkan hanya 8 komponen utama saja. Hasil AKUNL
menunjukkan bahwa apabila dua komponen utama yang diambil berarti hanya
dapat menjelaskan 36% keragaman data awal. Untuk dapat mewakili keragaman
data dalam penelitian ini maka diambil 8 komponen utama dengan total
keragaman sebesar 77%. Hasil akhir AKUNL adalah skor komponen utama yang
digunakan untuk analisis gerombol K-Means yang telah berupa data bertipe
numerik. Skor komponen utama sebanyak 8 komponen utama dengan objek
sebanyak 10422 rumah tangga.
Tabel 2 Hasil analisis komponen utama nonlinier
Komponen utama
1
2
3
4
5
6
7
8
9
10
11
12
13

Akar
ciri
3.37
1.40
1.19
1.95
0.87
0.86
0.75
0.71
0.69
0.66
0.58
0.56
0.40

Keragaman
(%)
25.89
10.83
9.18
7.28
6.66
6.59
5.81
5.48
5.33
5.08
4.45
4.35
3.07

Keragaman kumulatif
(%)
25.89
36.72
45.90
53.18
59.84
66.43
72.24
77.72
83.05
88.13
92.58
96.93
100.00

13
Analisis Komponen Utama dengan Successive Interval
Data dengan 13 peubah berskala ukur ordinal ditransformasi menjadi data
berskala interval dengan menggunakan metode successive interval. Data hasil
successive interval dapat dilihat pada Lampiran 5. Data hasil successive interval
sebanyak 10422 objek dengan 13 peubah direduksi menggunakan analisis
komponen utama sehingga diperoleh peubah baru (komponen utama) yang tidak
saling berkorelasi.
Berdasarkan Tabel 3, hasil AKU menunjukkan bahwa apabila dua
komponen utama yang diambil berarti hanya dapat menjelaskan 36% keragaman
data awal. Untuk dapat mewakili keragaman data dalam penelitian ini maka
diambil 8 komponen utama dengan total keragaman sebesar 78%. Hasil akhir
AKU adalah skor komponen utama yang digunakan untuk analisis gerombol KMeans. Skor komponen utama sebanyak 8 komponen utama dengan objek
sebanyak 10422 rumah tangga.
Tabel 3 Hasil analisis komponen utama dari data hasil successive interval
Komponen utama
1
2
3
4
5
6
7
8
9
10
11
12
13

Akar
ciri
3.37
1.41
1.25
0.94
0.88
0.86
0.76
0.71
0.69
0.66
0.58
0.56
0.32

Keragaman
(%)
25.90
10.80
9.60
7.20
6.70
6.60
5.80
5.50
5.30
5.10
4.40
4.30
2.80

Keragaman kumulatif
(%)
25.90
36.70
46.30
53.50
60.20
66.80
72.60
78.10
83.40
88.50
92,90
97.20
100.0

Perbandingan Hasil Gerombol
Hasil penggerombolan yang baik apabila objek dalam gerombol yang sama
memiliki keragaman yang rendah sedangkan objek antar gerombol memiliki
tingkat keragaman yang tinggi. Dengan kata lain, objek dalam satu gerombol
memiliki tingkat kemiripan yang tinggi dan objek berbeda gerombol memiliki
tingkat kemiripan yang rendah (Serban & Grigoreta 2006).
Berdasarkan skor komponen utama yang diperoleh dari kedua metode maka
dilakukan analisis gerombol K-Means dengan 10422 objek rumah tangga dan 2
gerombol yang telah ditentukan terlebih dahulu.
Berikut jumlah objek rumah tangga yang terdapat pada gerombol pertama
dan kedua dari kedua metode dapat dilihat pada Tabel 4 dan Tabel 5.

14
Tabel 4 Jumlah objek rumah tangga disetiap gerombol untuk metode AKUNL
Gerombol

Jumlah objek rumah tangga
5042
5380
10422

1
2
Total

Dapat dilihat pada Tabel 4, jumlah rumah tangga untuk metode AKUNL
untuk gerombol 1 yaitu sebanyak 5042 rumah tangga dan untuk gerombol 2
sebanyak 5380 rumah tangga. Pada Tabel 5 terlihat bahwa jumlah rumah tangga
dari metode AKU dengan successive interval untuk gerombol 1 sebanyak 4860
rumah tangga dan untuk gerombol 2 sebanyak 5562 rumah tangga.
Tabel 5 Jumlah objek rumah tangga disetiap gerombol untuk metode AKU
dengan successive interval
Gerombol

Jumlah objek rumah tangga

1
2

4857
5565

Total

10422

Dari kedua metode masing-masing metode menghasilkan keragaman yang
berbeda, baik keragaman antar gerombol maupun keragaman dalam gerombol.
Perbandingan keragaman gerombol untuk setiap metode dapat dilihat pada Tabel
6.
Tabel 6 Keragaman antar gerombol dan dalam gerombol dua metode
Keragaman

Metode
AKUNL

Dalam gerombol
Antar gerombol
Rasio

7.25
7829.84
0.00093

AKU dengan successive
interval
7.94
23486.65
0.00033

Dari Tabel 6 terlihat bahwa keragaman dalam gerombol metode AKUNL
sebesar 7.25 dan keragaman antar gerombol sebesar 7829.84 sedangkan
keragaman dalam gerombol metode AKU dengan successive interval sebesar 7.94
dan keragaman dalam gerombol sebesar 23486.65. Ditinjau dari rasio keragaman
dalam gerombol dan antar gerombol dapat dilihat bahwa metode AKU dengan
data hasil successive interval menghasilkan rasio keragaman dalam gerombol dan
antar gerombol lebih kecil dibandingkan dengan AKUNL yaitu sebesar 0.00033.
Hal ini menjelaskan bahwa metode AKU dengan successive interval lebih baik
dibandingkan metode AKUNL untuk kasus menggunakan data kemiskinan
provinsi NTT tahun 2013.

15
Tabel 7 Hasil ANOVA analisis gerombol K-Means untuk metode AKU dengan
successive interval
Komponen
Utama
KU1
KU2
KU3
KU4
KU5
KU6
KU7
KU8

Mean Square
antar gerombol
23302.39
62.13
70.95
16.72
10.52
11.99
1.03
10.922

Mean square
dalam gerombol
1.13
1.40
1.24
0.94
0.88
0.87
0.76
0.71

F-hitung
20493.46
44.27
57.01
17.78
12.00
13.91
1.36
15.32

Nilai-p
0.00
0.00
0.00
0.00
0.01
0.00
0.24
0.00

Dari hasil ANOVA penggerombolan 10422 rumah tangga pada Tabel 7
diperoleh bahwa KU1, KU2, KU3, KU4, KU5, KU6, KU8 berpengaruh secara
signifikan dengan nilai-p kurang dari 0.05. Dari komponen-komponen utama yang
signifikan ini maka dilihat koefisien dari setiap komponen utama untuk melihat
peubah-peubah yang mendominasi pada setiap komponen utama tersebut.
Koefisien komponen utama adalah suatu skor yang menunjukkan besar
kecilnya nilai atau kontribusi dari setiap komponen utama terhadap masingmasing unit pengamatan. Nilai koefisien komponen utama dapat bernilai positif
maupun negatif. Nilai positif berarti suatu komponen utama memberi kontribusi
yang besar dan berpengaruh positif terhadap unit pengamatan demikian
sebaliknya (Handoyo & Setiawan 2009).
Tabel 8 Koefisien komponen utama metode AKU dengan successive interval
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12
X13

KU1
0.38
0.23
-0.24
0.32
0.32
0.27
0.25
0.33
-0.16
0.27
-0.05
0.23
0.33

KU2
0.26
-0.55
0.12
-0.20
-0.23
-0.27
0.04
0.28
-0.52
0.16
-0.05
0.22
-0.03

KU3
-0.31
0.01
-0.22
0.20
0.00
-0.12
0.10
0.23
-0.12
-0.56
-0.57
0.23
-0.09

KU4
0.08
0.12
-0.64
0.14
-0.11
-0.30
-0.56
0.06
-0.19
-0.01
0.19
-0.19
-0.03

KU5
-0.25
-0.01
-0.06
0.03
0.26
-0.11
0.43
-0.05
-0.40
-0.31
0.61
-0.09
0.02

KU6
-0.03
-0.15
-0.04
-0.09
0.28
-0.04
0.09
-0.16
-0.24
0.12
-0.44
-0.70
0.27

KU7
0.08
0.07
-0.30
-0.03
-0.10
-0.58
0.55
-0.09
0.36
0.26
-0.06
0.01
-0.13

KU8
-0.01
-0.27
-0.29
-0.11
-0.50
0.33
0.21
0.29
0.27
-0.20
0.13
-0.24
0.35

Berdasarkan koefisien komponen utama pada Tabel 8 diperoleh peubah
yang mendominasi tiap komponen utama yang berpengaruh signifikan. Untuk
KU1 yakni peubah X1 (pendidikan) sebesar 0.38, X4 (dinding) sebesar 0.32, dan
X8 (bahan bakar) sebesar 0.33, KU2 yaitu peubah X2 (luas lantai) sebesar -0.55
dan X9 (aset) sebesar -0.52, untuk KU3 terdapat peubah X10 (literasi) sebesar -0,56,
untuk KU4 yaitu peubah X3 (jenis lantai) sebesar -0.64 dan peubah X7 (air minum)
sebesar -0.56, untuk KU5 yaitu X11 (pekerjaan) sebesar 0.61, untuk KU6 yaitu
peubah X12 (raskin) sebesar -0.70, sedangkan untuk KU8 yaitu peubah X5 (atap)

16
sebesar -0.50 dan X13 (handphone) sebesar 0.35. Peubah-peubah yang
mendominasi sebagian besar berpengaruh positif terhadap unit pengamatan dalam
hal ini rumah tangga. Oleh karena itu, faktor-faktor yang perlu diperhatikan oleh
pemerintah Provinsi NTT untuk mengurangi masalah kemiskinan yaitu dari segi
bangunan tempat tinggal (luas lantai, jenis lantai, atap, dan dinding) yang dihuni
oleh masyarakat, dari segi kualitas sumber daya manusia (pendidikan, literasi, dan
pekerjaan), dari segi pemenuhan kebutuhan hidup (bahan bakar, air minum,
raskin), dari segi fasilitas (aset dan handphone) terkhususnya untuk masyarakat
yang jauh dari perkotaan.

5 SIMPULAN DAN SARAN
Simpulan
Berdasarkan penelitian yang telah dilakukan dapat disimpulkan bahwa:
1. Analisis komponen utama nonlinier dan analisis komponen utama dengan
successive interval menghasilkan 8 komponen utama dengan total keragaman
untuk AKUNL sebesar 77% dan untuk AKU dengan successive interval
sebesar 78%.
2. Pada analisis gerombol K-Means, AKU dengan successive interval
menghasilkan rasio keragaman dalam gerombol dan antar gerombol lebih kecil
dibandingkan dengan AKUNL yaitu sebesar 0.00033.
3. Faktor-faktor yang perlu diperhatikan oleh pemerintah Provinsi NTT untuk
mengurangi masalah kemiskinan yaitu dari segi bangunan tempat tinggal (luas
lantai, jenis lantai, atap, dan dinding) yang dihuni oleh masyarakat, dari segi
kualitas sumber daya manusia (pendidikan, literasi, dan pekerjaan), dari segi
pemenuhan kebutuhan hidup (bahan bakar, air minum, raskin), dari segi
fasilitas (aset dan handphone) terkhususnya untuk masyarakat yang jauh dari
perkotaan.
Saran
Beberapa hal yang dapat dikembangkan lebih lanjut dari penelitian ini yaitu:
1. Dapat membandingkan analisis komponen utama nonlinier dengan metode
analisis gerombol lainnya untuk data kategorik seperti analisis gerombol latent.
2. Dapat menggunakan kajian simulasi untuk penelitian lanjut.

DAFTAR PUSTAKA
Afandi W N. 2009. Identifikasi Karakteristik Rumah Tangga Miskin di Kabupaten
Padang Pariaman (Studi Kasus Nagari Malai V Suku) [tesis]. Padang (ID):
Universitas Andalas.

17
Ahzan H. 2010. Analisis Gerombol Berhirarki pada Data Kategorik. [skripsi].
Bogor(ID): Institut Pertanian Bogor.
Agresti A. 2002. An Introduction to Categorical Data Analysis. New York (US).
John Wiley and Sons.
Ar H. 2015. Peta Provinsi Nusa Tenggara Timur [Internet]. [diunduh 2015 Okt 23].
Tersedia pada http://harunarcom.blogspot.co.id/2011/02/peta-provinsi-nusatenggara-timur-ntt.html.
Azizah M, Soehono L, Solimun. 2014. Analisis Cluster Komponen Utama
Nonlinier dan Analisis Two Step Cluster untuk Data Berskala Campuran.
Jurnal Mahasiswa Statistik. 2(1):1-4
[BPS] Badan Pusat Statistik. 2014. Nusa Tenggara Timur dalam Angka 2014.
Kupang: BPS Nusa Tenggara Timur.
Gifi A. 1989. Nonlinear Multivariate Analysis. Chichester: John Wiley & Sons.
Hair JF, Black WC, Babin BJ, Anderson RE. 2010. Multivariate Data Analysis.
Seventh Edition. New Jersey: Prentice Hall International Inc.
Handoyo E, Setiawan A. 2009. Analisis Kebutuhan Perangkat Lunak menggunakan
Analisis Faktor pada Program Studi Ilmu Keperawatan UNDIP. Jurnal
Teknik. 30(1):30-38.
Hays WL. 1976. Quantification in Psychology. New Delhi: Prentice Hall.
Islamiyati A, Talangko L. 2010. Aplikasi Komponen Utama Non Linear (Princals)
pada Peningkatan Mutu Pendidikan Tinggi [skripsi]. Makassar (ID):
Universitas Hasanudin.
Johnson R, Wichern D. 2002. Applied Multivariate Statistical Analysis. New
Jersey: Prentice Hall
Kaufman L, Petter JR. 2005. Finding Groups in Data an Introduction to Cluster
Analysis. New York: John Wiley & Sons Inc.
Kuroda M, Mori Y, Masaya I, Sakakihara M. 2013. Alternating Least Squares in
Nonliniear Principal Components. Wires Computational Statistics. 5(6):
456-464.
Kusnadi D. 2012. Perubahan Status Kelembagaan dan Kualitas Pelayanan Rumah
Sakit. Jurnal Kesehatan Mayarakat Nasional. 7(2):63-67.
Morrison DF. 1990. Multivariate Statistical Methods Third Edition. New York:
McGraw-Hill Inc.
Rahmawati N, Astuti R, Ikasari DM. 2014. Analisis Pengaruh Motivasi dan
Lingkungan Kerja terhadap Kepuasan Kerja dan Kinerja Karyawan di PT.
Sinar Sosro Kantor Penjualan Wilayah (KPW) Waru, Sidoarjo-Jawa Timur.
Jurnal Lulusan TIP FTP UB. 1:1-12
Safitri D, Widiharih T, Wilandari Y, Saputra AH. 2012. Analisis Cluster pada
Kabupaten/Kota di Jawa Tengah berdasarkan Produksi Palawija. Jurnal
Media Statistika. 5(1):11-16.
Serban G, Grigoreta SM. 2006. A Comparison of Clustering Techniques in Aspect
Mining. Studia Univ. Babes Bolyai Informatica. L1(1):69-78.
Waryanto B, Millafati YA. 2006. Transformasi Data Skala Ordinal ke Interval
Menggunakan Makro Minitab. Jurnal Informatika Pertanian. 15:881-895.
Yunianto Y. 2011. Perbandingan Metode Penggerombolan dengan Komponen
Utama Nonlinier dan Gerombol Dua Langkah pada Data Campuran
[skripsi]. Bogor(ID): Institut Pertanian Bogor.

18

LAMPIRAN
Lampiran 1 Peubah kategorik awal yang digunakan
No

Peubah

1

Pendidikan (X1)

2

Lantai kap (X2)

Definisi label

Kategori

Jenjang pendidikan terakhir 1:Tidak tamat SD
kepala rumah tangga.
2:Tamat SD/sederajat
3:Tamat SMP/sederajat
4:Tamat SMA/sederajat
5:Tamat perguruan
tinggi/sederajat
2
Luas lantai per kapita (Luas
1:  8m / kap
lantai dibagi dengan jumlah
2
anggota rumah tangga)
2: 8  30m / kap

Skala
pengukuran
Ordinal

Ordinal

3: 31  50m / kap
2

4:  50m / kap
1:Tanah
2:Bukan tanah
1:Tembok
2:Bukan tembok
1:Seng/beton/genteng/
asbes
2:Sirap/ijuk/lainnya
1:Milik sendiri
2:Bukan milik sendiri
3:Tidak ada
1:Sumber terlindung
2:Sumber tidak
Terlindung
1:Listrik/gas
2:Minyak tanah
3:Arang/briket/kayu
1:Milik sendiri
2:Bukan milik sendiri
1:Tidak bisa bahasa latin
2: Bisa bahasa latin
1:Pertanian
2:Perikanan
3:Peternakan
4:Pertambangan/
penggalian
5:Industri pengolahan
6:Listrik/gas
7:Konstruksi
8:Perdagangan/hotel dan
rumah makan dan
akomodasi
9:Angkutan,
pergudangan,
komunikasi
2

3

Jenis lantai (X3)

Jenis lantai terluas yang
dihuni rumah tangga
Jenis dinding terluas dari
rumah yang dihuni
Jenis atap rumah

4

Dinding (X4)

5

Atap (X5)

6

Jamban (X6)

Fasilitas pembuangan air
besar

7

Air minum (X7)

8

Bahan bakar
(X8)

Sumber air minum yang
digunakan
sehari-hari
dalam rumah tangga
Jenis bahan bakar yang
digunakan untuk memasak

9

Aset (X9)

10

Literasi (X10)

11

Pekerjaan (X11)

Status kepemilikan rumah
tinggal
Kemampuan baca/tulis
kepala rumah tangga
Lapangan usaha utama
kepala rumah tangga

Nominal
Nominal
Nominal

Nominal

Nominal

Nominal

Nominal
Nominal
Nominal

19
No

Peubah

12

Raskin (X12)

13

Handphone
(X13)

Definisi label

Kategori

Skala
pengukuran

10:Jasa, keuangan, real
estate, persewaan
11:Jasa kemasyrakatan,
sosial
12:Lainnya
13:Tidak bekerja
1: Ya
2: Tidak
Nominal

Terdata pernah menerima
manfaat program beras
murah / beras miskin dari
pemerintah
Kepemilikan minimal satu 1: Ya
buah handphone dalam 2: Tidak
rumah tangga tersebut

Nominal

20
Lampiran 2 Peubah berskala ordinal
No

Peubah

Definisi label

Kategori

1

Pendidikan (X1)

2

Lantai kap (X2)

Jenjang pendidikan terakhir 1: Tidak tamat SD
kepala rumah tangga.
2: Tamat SD/sederajat
3: Tamat SMP/sederajat
4: Tamat SMA/sederajat
5: Tamat perguruan
tinggi/sederajat
2
Luas lantai per kapita (Luas
1:  8m / kap
lantai dibagi dengan jumlah
2
anggota rumah tangga)
2: 8  30m / kap

Skala
pengukuran
Ordinal

Ordinal

3: 31  50m / kap
2

4:  50m / kap
1: Bukan Tanah
2: Tanah
1: Bukan Tembok
2: Tembok
1: Bukan Seng/Genteng
2: Seng/Genteng
1: Tidak ada
2: Bukan milik sendiri
3: Milik endiri
1: Sumber tidak terlindung
2: Sumber terlindung
2

3

Jenis lantai (X3)

4

Dinding (X4)

5

Atap (X5)

6

Jamban (X6)

7

Air minum (X7)

8

9
10
11
12

13

Jenis lantai terluas yang
dihuni rumah tangga
Jenis dinding terluas dari
rumah yang dihuni
Jenis atap rumah
Fasilitas pembuangan air
besar

Sumber air minum yang
digunakan
sehari-hari
dalam rumah tangga
Bahan bakar (X8) Jenis bahan bakar yang 1: Arang/briket/kayu
digunakan untuk memasak
2: Minyak tanah
3: Listrik/gas
Aset (X9)
Status kepemilikan rumah 1: Bukan milik sendiri
tinggal
2: Milik sendiri
Literasi (X10)
Kemampuan baca/tulis
1:Tidak bisa bahasa latin
kepala rumah tangga
2: Bisa bahasa latin
Pekerjaan (X11)
Lapangan usaha utama
1: Tidak Bekerja
kepala rumah tangga
2: Bekerja
R