PENGELOMPOKAN KABUPATENKOTA DI PROVINSI JAWA TENGAH BERDASARKAN INDIKATOR KEMISKINAN DENGAN C-MEANS DAN FUZZY C-MEANS

TUGAS AKHIR – SS141501

PENGELOMPOKAN KABUPATEN/KOTA
DI PROVINSI JAWA TENGAH
BERDASARKAN INDIKATOR KEMISKINAN
DENGAN C-MEANS DAN FUZZY C-MEANS
CLUSTERING

ROHMAH MUSTAFIDAH
NRP 1315 105 028

Dosen Pembimbing
R. Mohamad Atok, Ph.D

PROGRAM STUDI SARJANA
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2017

Halanam JUd


TUGAS AKHIR – SS141501

PENGELOMPOKAN KABUPATEN/KOTA
DI PROVINSI JAWA TENGAH
BERDASARKAN INDIKATOR KEMISKINAN
DENGAN C-MEANS DAN FUZZY C-MEANS
CLUSTERING

ROHMAH MUSTAFIDAH
NRP 1315 105 028

Dosen Pembimbing
R. Mohamad Atok, Ph.D

PROGRAM STUDI SARJANA
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2017


Halanam JUd

FINAL PROJECT– SS141501

CLASSIFICATION OF THE REGENCIES/CITIES
IN CENTRAL JAVA PROVINCE
BASED ON THE POVERTY INDICATORS
USING C-MEANS AND FUZZY C-MEANS
CLUSTERING

ROHMAH MUSTAFIDAH
NRP 1315 105 028

Supervisor
R. Mohamad Atok, Ph.D

UNDERGRADUATE PROGRAMME
DEPARTMENT OF STATISTICS
FACULTY MATHEMATICS AND NATURAL SCIENCES

INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA 2017

PENGELOMPOKAN KABUPATEN/KOTA
DI PROVINSI JAWA TENGAH
BERDASARKAN INDIKATOR KEMISKINAN
DENGAN C-MEANS DAN FUZZYC-MEANS CLUSTERING
Nama Mahasiswa
NRP
Departemen
Dosen Pembimbing

:
:
:
:

Rohmah Mustafidah
1315 105 028
Statistika

R. Mohamad Atok, Ph.D

Abstrak
Kemiskinan di Indonesia merupakan salah satu persoalan yang
menjadi pusat perhatian pemerintah. Data menunjukkan jumlah
penduduk miskin pada September 2016 paling banyak berada di Pulau
Jawa yakni sebesar 14,38 juta orang atau 53%. Penelitian ini ingin
melakukan pengelompokan 35 kabupaten/kota di Provinsi Jawa Tengah
berdasarkan indikator kemiskinan pada tahun 2015. Metode yang
digunakan adalah c-means dan fuzzy c-means clustering. Data yang
digunakan yakni hasil Survey Sosial Ekonomi Nasional (SUSENAS).
Hasil dari pengelompokan terbaik dengan menggunakan 3 variabel
yang saling independen pada metode fuzzy c-means adalah 5 cluster.
Sedangkan untuk 9 dan 8 variabel yang saling dependen didapatkan
metode terbaik fuzzy c-means dengan cluster optimum adalah 4 cluster.
Perbedaan karakteristik hasil pengelompokan untuk 3 variabel adalah
pada pengeluaran rata-rata perkapita komoditi makanan. Berdasarkan
hasil penelitian ini maka disimpulkan bahwa hendaknya melakukan
analisis cluster dengan variabel yang saling independen. Karakteristik
pada kelompok 1 adalah tingginya sumber penerangan, kelompok 2

baiknya jenis atap yang digunakan, kelompok 3 rendahnya sumber
penerangan dan jenis atap, kelompok 4 rendahnya pengeluaran ratarata perkapita komoditi makanan, dan kelompok 5 tingginya
pengeluaran rata-rata komoditi makanan.
Kata Kunci: Cluster, independen, indikator kemiskinan, karakteristik.

v

(Halaman ini sengaja di kosongkan)

vi

CLASSIFICATION OF THE REGENCIES/CITIES
IN CENTRAL JAVA PROVINCE
BASED ON THE POVERTY INDICATORS
USING C-MEANS AND FUZZY C-MEANS CLUSTERING

Student Name
Student Number
Department
Supervisor


:
:
:
:

Rohmah Mustafidah
1315 105 028
Statistics
R. Mohamad Atok, Ph.D

Abstract
The poverty in Indonesia is one of the serious problems that
becomes the main attention for the goverment. The data shows that the
number of poor people in September 2016 mostly live in Java Island
with 14,38 million of poor people or 53% of it. This research purposed
to classify the 35 regencies/cities in Central Java Province based on the
poverty indicators in 2015. The method used for this research are cmeans and fuzzy c-means clustering, while the data used is the result of
National Economy and Social Survey (SUSENAS). The best
classification results on fuzzy c-means by using three independently

variables are 5 clusters, while the best method for fuzzy c-means using 9
and 8 dependently variables with optimum cluster is 4 clusters. The
characteristics difference on the results for 3 variables is on average
expenditure per capita of food commodities. Based on the resutls of this
study it is concluded that it should perform cluster analysis with
independently variables. Characteristics of the group 1 are the high of
lighting sources, group 2 the good type of roof used, group 3 the low of
lighting sources and type roof used, group 4 the low of average
expenditure per capita of food commodites, and group 5 the high of
average expenditure per capita of food commodites.
Keyword: Cluster, independent, poverty indicators, characteristics.

vii

(Halaman ini sengaja di kosongkan)

viii

KATA PENGANTAR
Puji syukur kehadirat Allah SWT atas limpahan rahmat,

ridho, dan karunia-Nya sehingga penulis dapat menyelesaikan
Tugas
Akhir
yang
berjudul
“PENGELOMPOKAN
KABUPATEN/KOTA DI PROVINSI JAWA TENGAH
BERDASARKAN INDIKATOR KEMISKINAN DENGAN
C-MEANS DAN FUZZY C-MEANS CLUSTERING”. Sholawat
serta salam semoga tetap terlimpahkan kepada suri tauladan
terbaik bagi seluruh ummat, Rasulullah SAW dan keluarganya.
Keberhasilan penyelesaian laporan tugas akhir ini, bukan
hanya karena usaha dari penulis, tetapi juga tidak terlepas dari
partisipasi dan dukungan berbagai pihak. Oleh karena itu, penulis
mengucapkan terima kasih kepada:
1. R. Mohamad Atok, Ph.D selaku dosen pembimbing atas
bimbingan dan pengarahannya selama penyelesaian tugas
akhir.
2. Santi Puteri Rahayu, Ph.D selaku dosen penguji sekaligus
dosen wali atas ilmu, saran, koreksi, dan bimbingan yang

telah diberikan.
3. Imam Safawi Ahmad, S.Si, M.Si selaku dosen penguji atas
ilmu, saran, masukan dan koreksian dari tugas akhir ini.
4. Dr. Suhartono selaku Kepala Departemen Statistika Fakultas
Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi
Sepuluh Nopember.
5. Dr. Sutikno, M.Si selaku Ketua Program Studi S1
Departemen Statistika Fakultas Matematika dan Ilmu
Pengetahuan Alam Institut Teknologi Sepuluh Nopember.
6. Bapak, Mamah, saudara dan keluarga besar tercinta atas
limpahan kasih, sayang, doa, dukungan, dan semangatnya
yang tiada henti untuk penulis.
7. Seluruh dosen dan karyawan Departemen Statistika FMIPAITS yang telah memberikan banyak ilmu dan bimbingan
selama perkuliahan.

ix

8. Teman-teman S1-LJ Statistika angkatan 2015 yang senantiasa
memberikan semangat dan doa sehingga laporan Tugas Akhir
ini dapat terselesaikan.

9. Dan seluruh pihak yang tidak dapat disebutkan satu per satu.
Penulis menyadari bahwa laporan ini masih jauh dari
sempurna. Oleh karena itu, kritik dan saran sangat diharapkan
untuk perbaikan yang membangun. Semoga informasi sekecil
apapun dalam tugas akhir ini dapat bermanfaat bagi semua pihak.
Surabaya, Juli 2017
Penulis

x

DAFTAR ISI

Halaman

HALAMAN JUDUL ....................................................................
LEMBAR PENGESAHAN ..........................................................
ABSTRAK ....................................................................................
ABSTRACT ...................................................................................
KATA PENGANTAR ..................................................................
DAFTAR ISI .................................................................................

DAFTAR GAMBAR .....................................................................
DAFTAR TABEL ........................................................................
DAFTAR LAMPIRAN ................................................................
BAB I PENDAHULUAN
1.1 Latar Belakang ...............................................................
1.2 Rumusan Masalah .........................................................
1.3 Tujuan Penelitian ..........................................................
1.4 Manfaat .........................................................................
1.5 Batasan Masalah ............................................................
BAB II TINJAUAN PUSTAKA
2.1 Staistika Deskriptif .........................................................
2.2 Analisis Faktor ...............................................................
2.2.1 Pemeriksaan Kecukupan Data (KMO) ....................
2.2.2 Distribusi Normal Multivariat ................................
2.2.3 Uji Bartlett Sphericity .............................................
2.3 Derajat Keanggotaan .....................................................
2.3.1 Representasi Linier ...................................................
2.3.2 Representasi Kurva Segitiga .....................................
2.3.3 Representasi Kurva Trapesium.................................
2.4 Analisis Cluster ..............................................................
2.4.1 C-Means Clustering..................................................
2.4.2 Fuzzy C-Means Clustering .......................................
2.5 Pseudo F-Statistic ..........................................................
2.6 Internal Cluster Dispertion Rate....................................
2.7 ANOVA (Analyze of Varians) .......................................
2.7.1 Kehomogenan Matriks Varians Kovarians ............
2.7.2 Uji Kolmogorov Smirnov ........................................

xi

i
iii
v
vii
ix
xi
xiii
xv
xvii
1
3
4
4
5
7
8
9
10
11
11
12
13
14
14
15
16
18
19
20
20
21

Halaman
2.7.3 One-way ANOVA ( Analyze of Varians) .................
2.8 Indikator Kemiskinan ......................................................
BAB III METODOLOGI PENELITIAN
3.1 Sumber Data dan Variabel Penelitian .............................
3.2 Langkah Analisis dan Diagram Alir ...............................
BAB IV ANALISA DATA DAN PEMBAHASAN
4.1 Deskriptif Indikator Kemiskinan ....................................
4.1.1 Deskriptif Jenis Dinding Terluas ..............................
4.1.2 Deskriptif Jenis Lantai Terluas .................................
4.1.3 Deskriptif Luas Lantai .............................................
4.1.4 Deskriptif Sumber Air Minum .................................
4.1.5 Deskriptif Fasilitas Tempat Buang Air Besar ...........
4.1.6 Deskriptif Sumber Penerangan .................................
4.1.7 Deskriptif Jenis Atap Terluas ...................................
4.1.8 Deskriptif Pengeluaran Rata-rata Perkapita
Komoditi Makanan ................................................
4.1.9 Deskriptif Pendidikan yang Di tamatkan oleh Lakilaki 10 Tahun Ke atas ...............................................
4.2 Pengelompokan Kabupaten/Kota di Provinsi Jawa
Tengah.............................................................................
4.2.1 Pengelompokan dengan Menggunakan 3 Variabel ...
4.2.2 Pengelompokan dengan Menggunakan 9 Variabel ...
4.2.3 Pengelompokan dengan Menggunakan 8 Variabel ...
4.3 Perbandingan Hasil Pengelompokan Metode C-Means
dan Fuzzy C-Means .........................................................
4.3.1 Perbandingan Kedua Metode dengan 3 Kategori ......
4.3.2 Perbedaan Karakteristik dengan One-way ANOVA .
4.4 Karakteristik Hasil Pengelompokan Fuzzy C-means ......
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan .....................................................................
5.2 Saran ...............................................................................
DAFTAR PUSTAKA ...................................................................
LAMPIRAN ..................................................................................
BIODATA PENULIS ....................................................................

xii

21
22
25
27
29
31
32
32
33
34
35
36
36
37
38
39
41
43
45
45
47
49
51
52
53
55
71

DAFTAR GAMBAR
Halaman
Representasi Linier Naik .................................
Representasi Linier Turun ...............................
Representasi Kurva Segitiga ............................
Representasi Kurva Trapesium ........................
Diagram Alir ....................................................
Deskripsi Jenis Dinding Terluas ......................
Deskripsi Jenis Lantai Terluas .........................
Deskripsi Luas Lantai ......................................
Deskripsi Sumber Air Minum .........................
Deskripsi Fasilitas Buang Air Besar ................
Deskripsi Sumber Penerangan .........................
Deskripsi Jenis Atas Terluas ............................
Deskripsi Pengeluaran Rata-rata Perkapita
Komoditi Makanan ..........................................
Gambar 4.9 Deskripsi Pendidikan yang ditamatkan Lakilaki Usia 10 Tahun Keatas ................................
Gambar 4.10 Hasil Pemetaan Indikator Kemiskinan
Metode Fuzzy C-means ....................................
Gambar 2.1
Gambar 2.2
Gambar 2.3
Gambar 2.4
Gambar 3.1
Gambar 4.1
Gambar 4.2
Gambar 4.3
Gambar 4.4
Gambar 4.5
Gambar 4.6
Gambar 4.7
Gambar 4.8

xiii

12
13
13
14
28
31
32
33
33
34
35
36
37
38
49

(Halaman ini sengaja dikosongkan)

xiv

DAFTAR TABEL
Halaman
Tabel 2.1
Tabel 2.2
Tabel 3.1
Tabel 3.2
Tabel 3.3
Tabel 4.1
Tabel 4.2
Tabel 4.3
Tabel 4.4
Tabel 4.5
Tabel 4.6
Tabel 4.7
Tabel 4.8
Tabel 4.9
Tabel 4.10
Tabel 4.11
Tabel 4.12
Tabel 4.13
Tabel 4.14
Tabel 4.15
Tabel 4.16
Tabel 4.17
Tabel 4.18

Kriteria KMO .......................................................
Pengujian one-way ANOVA ................................
Variabel Penelitian ...............................................
Objek Penelitian ...................................................
Struktur Data .......................................................
Deskriptif 9 Variabel Indikator Kemiskinan ........
Korelasi 9 Variabel Indikator Kemiskinan ...........
Pengelompokan Metode C-Means 3 Variabel ......
Nilai Pseudo f-statistic Metode C-means 3
Variabel ................................................................
Metode Fuzzy C-means 3 Variabel .......................
Nilai Pseudo F-statistics Metode Fuzzy
C-means 3 Variabel ..............................................
Pengelompokan Metode C-Means 9 Variabel ......
Nilai Pseudo f-statistic Metode C-means 9
Variabel ................................................................
Metode Fuzzy C-means 9 Variabel .......................
Nilai Pseudo F-statistics Metode Fuzzy
C-means 9 Variabel ..............................................
Pengelompokan Metode C-Means 8 Variabel ......
Nilai Pseudo f-statistic Metode C-means 8
Variabel ................................................................
Metode Fuzzy C-means 8 Variabel .......................
Nilai Pseudo F-statistics Metode Fuzzy
C-means 8 Variabel ..............................................
Nilai Icdrate untuk Kedua Metode .......................
Hasil Uji Levene’s Test .........................................
Hasil Uji Kolmogorov Smirnov ............................
Hasil Pengujian one-way ANOVA .......................

xv

9
22
25
26
26
30
30
40
40
41
41
42
42
43
43
44
44
45
45
46
47
47
48

(Halaman ini sengaja dikosongkan)

xvi

DAFTAR LAMPIRAN
Halaman
Lampiran 1 Surat Pernyataan Pengambilan Data ........
55
Lampiran 2 Data Indikator Kemiskinan di Provinsi
Jawa Tengah .............................................
56
Lampiran 3 Output Korelasi. .......................................
58
Lampiran 4 KMO, Bartlett’s sphericity, dan Analisis
Faktor ......................................................
59
Lampiran 5 Output Minitab Pengujian Distribusi
Normal......................................................
61
Lampiran 6 Syntax Fuzzy C-means Clustering ............
63
Lampiran 7 Matriks U dan Hasil Cluster FCM
dengan 3 Variabel.....................................
64
Lampiran 8 Matriks U dan Hasil Cluster FCM
dengan 9 Variabel ....................................
65
Lampiran 9 Matriks U dan Hasil Cluster FCM
dengan 8 Variabel ....................................
66
Lampiran 10 Syntax Pseudo F-Statictics .......................
67
Lampiran 11 Matriks Varians Kovarians, Normalitas,
dan ANOVA.............................................
68

xvii

(Halaman ini sengaja dikosongkan)

xviii

BAB I
PENDAHULUAN
1.1 Latar Belakang
Permasalahan kemiskinan di Indonesia merupakan salah satu
persoalan yang menjadi pusat perhatian pemerintah dalam
menyusun dan melaksanakan pembangunan setiap daerah.
Tingkat kemiskinan merupakan salah satu tolak ukur keberhasilan
pembangunan daerah. Program pembangunan berkelanjutan
Sustainable Development Goals (SDG’s) yang diterbitkan pada
akhir tahun 2015 menggantikan Millennium Development Goals
(MDG’s) memiliki tujuan pembangunan bersama sampai tahun
2030 yang disepakati oleh negara PBB. Program SDG’s ini
didalamnya mempunyai 17 tujuan yang menempati urutan
pertama adalah mengakhiri segala bentuk kemiskinan dimanapun
(Litbang & ILO, 2016). Badan Pusat Statistik (BPS) mencatat
jumlah penduduk miskin pada September 2016 paling banyak
berada di Pulau Jawa. Kepala BPS mengatakan sebagian besar
penduduk miskin berada di Jawa yakni sebesar 14,38 juta orang
atau 53%, sedangkan jumlah penduduk miskin terendah berada di
Kalimantan sebesar 970 ribu orang. Kepadatan penduduk di Pulau
Jawa yang menjadikan jumlah penduduk miskin semakin
meningkat (Databoks, 2017).
Menurut Sri Mulyani sebagai Menteri Keuangan saat ini
kemiskinan masih menjadi sorotan publik. Sri Mulyani bertekad
menurunkan tingkat kemiskinan di Indonesia tahun 2017 menjadi
satu digit angka. Menurut data dari BPS pada September 2016
angka kemiskinan masih berada di kisaran 10% dengan jumlah
orang miskin 27,76 juta jiwa (Ariyanti, 2017). Laporan Kajian
Ekonomi dan Keuangan Regional (KEKR) Provinsi Jawa Timur,
data dari BPS Jatim presentase penduduk miskin di Pulau Jawa
yang menempati urutan 3 teratas adalah Jawa Tengah (13,30%),
D.I Yogyakarta (13,20%) dan Jawa Timur (12,28%). Ketiga
provinsi tersebut melebihi presentase kemiskinan nasional yang
hanya 11,13% (KEKR, 2016) .

1

2
Definisi kemiskinan adalah kondisi dimana seseorang atau
sekelompok orang yang tidak mampu memenuhi hak-hak
dasarnya untuk mempertahankan dan mengembangkan kehidupan
yang bermanfaat (BPS, 2017). BPS mengukur kemiskinan dengan
menggunakan konsep kemampuan memenuhi kebutuhan dasar.
Suatu penelitian dalam mengelompokkan kabupaten/kota dapat
menunjang keberhasilan pelaksanaan program pembangunan
terutama yang berkaitan dengan penanggulangan kemiskinan.
Kabupaten/kota yang memiliki ciri-ciri/karakteristik indikator
kemiskinan yang homogen dimasukan ke dalam satu kelompok.
Hal semacam ini dilakukan dengan menggunakan analisis
pengelompokan atau analisis cluster.
Analisis cluster adalah analisis multivariat yang digunakan
untuk mengelompokkan objek-objek sehingga objek yang berada
dalam satu cluster adalah objek yang sangat mirip dan objek yang
berada di cluster lain berbeda. Analisis cluster dibedakan menjadi
2 yakni hierarchical dan non hierarchical (Everitt, et al., 2011).
Metode hierarchical digunakan ketika jumlah cluster yang
diinginkan belum diketahui, beberapa metodenya yakni complete
linkage, average linkage, single linkage, centroid linkage, dan
ward linkage. Sedangkan metode non hierarchical digunakan
ketika jumlah cluster yang diinginkan telah diketahui, diantara
metodenya yaitu c-means dan fuzzy c-means (Santosa, 2007). Cmeans yaitu metode non hierarchical yang paling sederhana.
Metode ini menempatkan keberadaan suatu objek ke dalam A
cluster, atau bukan anggota A cluster tersebut. Metode fuzzy cmeans adalah suatu teknik penggelompokkan data yang mana
keberadaan pada tiap-tiap data dalam suatu cluster ditentukan
oleh nilai keanggotaan. Fungsi keanggotaan adalah suatu kurva
yang menunjukkan pemetaan titik-titik input data ke dalam nilai
keanggotaan.
Beberapa studi sebelumnya mengenai kemiskinan telah
dilakukan oleh Putriana (2016) meneliti tentang Metode Cluster
Analysis untuk Pengelompokan Kabupaten/Kota di Provinsi Jawa
Tengah berdasarkan variabel yang mempengaruhi kemiskinan

3
pada tahun 2013. Hasilnya dengan menggunakan metode
complete linkage, average linkage, ward dan c-means terdapat 3
cluster dengan kabupaten/ kota dalam setiap clusternya berbedabeda. Nilai root mean square standard deviation (RMSSTD) dan
r-squared (RS) dari keempat metode diatas yang terbaik adalah
dengan menggunakan c-means. Saran yang ada pada penelitian
ini untuk membandingkan metode c-means dengan metode
pengelompokan lainnya. Pada penelitian ini belum diterapkan
metode fuzzy c-means maka penelitian selanjutnya menggunakan
metode tersebut. Studi lain dilakukan oleh Dewi (2015)
Pengelompokan Kabupaten/Kota di Provinsi Jawa Timur
Berdasarkan Indikator Kemiskinan Menggunakan Metode Cmean dan Fuzzy C-mean Clustering. Hasil metode c-means
terbentuk 2 cluster dengan nilai pseudo f-statistik terbesar 47,79
dan nilai icdrate 0,42. Studi yang lain oleh Komariyah (2011)
yakni Pengelompokan Kabupaten/Kota di Provinsi Jawa Timur
Berdasarkan Indikator Kemiskinan metode cluster analyze. Hasil
pengelompokan kabupaten/kota di Jawa Timur dengan metode
ward dibagi menjadi 3 kelompok kabupaen/kota. Oleh karena itu,
pada penelitian ini ingin melakukan pengelompokan di Provinsi
Jawa Tengah berdasarkan indikator kemiskinan pada tahun 2015
menggunakan metode c-mean dan fuzzy c-means clustering. Hasil
pengelompokan yang diperoleh kemudian dibandingkan dengan
jumlah cluster optimum, selanjutnya menentukan perbedaan
karakteristik indikator kemiskinan dengan pengujian one-way
Analysis of Variance (ANOVA). Hasil pengelompokan yang
terbentuk kemudian ditentukan karakteristik pada masing-masing
cluster.
1.2 Rumusan Masalah
Berdasarkan uraian latar belakang diatas maka diperlukan
pengelompokan terkait penanggulangan kemiskinan di Jawa
Tengah. Sebelum melakukan pengelompokan terlebih dahulu
dilakukan statistika deskriptif pada variabel indikator kemiskinan.
Kemudian mengelompokkan kabupaten/kota di Provinsi Jawa

4
Tengah dengan metode c-mean dan fuzzy c-means clustering yang
diperhatikan independensi antar variabel. Hasil pengelompokan
dibandingkan dengan melihat nilai pseudo f-statistic.
Perbandingan kedua metode c-mean dan fuzzy c-means clustering
dapat dilihat dari nilai idcrate, serta menentukan perbedaan
karakteristik indikator kemiskinan dengan melakukan pengujian
one-way Analysis of Variance (ANOVA). Serta, menentukan
karakteristik untuk masing-masing cluster.
1.3 Tujuan
Berdasarkan rumusan masalah, maka tujuan yang akan
diperoleh dari penelitian ini adalah
1. Mendeskripsikan variabel indikator kemiskinan melalui
statistika deskriptif.
2. Pengelompokan kabupaten/kota di Provinsi Jawa Tengah
dengan metode c-mean dan fuzzy c-means clustering
dengan dan tanpa memperhatikan independensi antar
variabel.
3. Perbandingan hasil pengelompokan pada metode c-mean
dan fuzzy c-means clustering.
4. Karakteristik pada masing-masing cluster yang terbentuk.
1.4 Manfaat
Manfaat yang didapatkan oleh peneliti dari hasil penelitian
ini adalah memberikan informasi tentang pengelompokan
kabupaten/kota di Provinsi Jawa Tengah berdasarkan indikator
kemiskinan dengan metode pengelompokan (cluster analyze)
yakni metode c-means dan fuzzy c-means clustering. Selain itu
memberikan informasi kepada pemerintah dan BPS Provinsi Jawa
tengah
mengenai
karakteristik
kelompok-kelompok
kabupaten/kota di Provinsi Jawa Tengah berdasarkan indikator
kemiskinan. Dapat pula menjadi masukan dalam menyusun
rencana pembangunan daerah agar berhasil dalam pelaksanaan
program pembangunan di Provinsi Jawa Tengah terutama
permasalahan penanggulangan kemiskinan.

5
1.5 Batasan Masalah
Batasan masalah dalam penelitian ini adalah analisis
pengelompokan dengan menggunakan dua metode yakni c-means
dan fuzzy c-means clustering. Kedua metode ini berdasarkan
saran dari penelitian yang telah dilakukan sebelumnya, dengan
objek penelitian 35 kabupaten /kota yang ada di Provinsi Jawa
Tengah, dan jumlah cluster yakni 2 sampai 5.

6

(Halaman ini sengaja di kosongkan)

BAB II
TINJAUAN PUSTAKA
Pada bab ini akan dibahas tentang beberapa landasan teori
yang digunakan untuk mencapai tujuan penelitian. Landasan teori
dalam penelitian ini meliputi statistika deskriptif, analisis faktor,
uji KMO, pemeriksaan normal multivariat, uji bartlett sphericity,
derajat keanggotaan, analisis cluster, c-means, fuzzy c-means,
pseudo f-statistic, internal cluster dispertion rate (icdrate),
asumsi kehomogenan matriks varians-kovarians, uji Kolmogorov
smirnov, one-way Analyze of Varians (ANOVA), dan indikator
kemiskinan.
2.1 Statistika Deskriptif
Statistika deskriptif adalah metode-metode yang berkaitan
dengan pengumpulan data penyajian suatu gugus data sehingga
memberikan informasi yang lebih bermakna. Statistika deskriptif
tidak mengambil kesimpulan tentang gugus data induknya (yang
lebih banyak), hanya penyusunan tabel, diagram, grafik, indeks,
dan besaran-besaran lainnya (Sumanto, 2014).
a.
Mean
Mean adalah nilai rata-rata dari beberapa buah data.
Definisi lain dari mean adalah jumlah seluruh data dibagi dengan
banyaknya data, maka mean dari data tersebut dapat dituliskan
sebagai berikut.
n

x

x
i 1

i

(2.1)

n

Keterangan: x  mean
xi  nilai x pada objek ke- i
n = Banyaknya data dalam ruang sampel
b.
Standar Deviasi dan Varians sampel
Salah satu teknik statistik yang digunakan untuk
menjelaskan homogenitas kelompok.Varians merupakan jumlah
kuadrat semua deviasi nilai-nilai individual terhadap rata-rata

7

8
kelompok. Sedangkan akar dari varians disebut dengan standar
deviasi atau simpangan baku.
n

2

Variasi sampel (S ),

S 
2

 (x
i 1

i

 x)2

n 1

(2.2)

Standart devasi (S),
(2.3)
s  s2
c.
Minimum dan Maksimum
Minimum adalah nilai terendah dari suatu data. Sedangkan
maksimum adalah nilai tertinggi dari suatu data.
2.2 Analisis Faktor
Analisis faktor merupakan suatu metode untuk menganalisis
adanya korelasi di antara sejumlah variabel dengan menetapkan
sekelompok variabel yang memiliki korelasi tinggi sebagai suatu
faktor (Hair, Black, Babin, & Anderson, 2010). Analisis faktor
pada penelitian ini digunakan untuk menentukan variabel dengan
bobot terbesar dari setiap faktor yang terbentuk sebagai variabel
pengelompokan.
Model analisis faktor menyatakan setiap variabel sebagai
kombinasi linier dari common factor F1, F2, ..., Fm. Adapun model
faktor adalah sebagai berikut:
X 1  1   11 F1   12 F2     1m Fm   1
X 2   2   21 F1   22 F2     2 m Fm   2
(2.4)




X p   p   p1 F1   p 2 F2     pm Fm   p

dimana:
 l  rata-rata variabel ke-l ;l =1,2,...,p

 i  faktor spesifik ke-l ; l =1,2,...,p
F j  common factor ke- j; j = 1,2,...,m

 ij  loading dari variabel ke-i pada faktor ke-j

9
atau dapat ditulis dalam notasi matrik sebagai berikut (Johnson &
Wichern, 2007):
(2.5)
X( p1)  μ ( p1)  L ( pm)  F( m1)  ε ( p1)
dengan X = (X1, X2,...,Xp)T ; µ= (µ 1, µ 2,..., µ p)T ; F = (F1, F 2,...,
Fm)T ; ε= (ε1, ε2,..., εp)T; dan

  11

  21
L



 p1

  1m 

  2m 
.
 

  pm 

 12
 21

 p2

(2.6)

2.2.1 Pemeriksaan Kecukupan Data (KMO)
Pemeriksaan yang digunakan untuk mengukur kecukupan
data adalah pemeriksaan Kaiser-Meyer-Olkin atau KMO
(Sharma, 1996). Adapun rumus dari pemeriksaan ini adalah
sebagai berikut (Rencher, 2002)
KMO 





2
i  j ij

r

r  i  j qij2

2
i  j ij

(2.7)

dimana:
rij2 = kuadrat elemen dari R
q ij2 =kuadrat



D  diag R

elemen



.

dari

Q;

dengan

Q  DR 1 D

dan

1
1 1 / 2

Meskipun tidak ada uji statistik pada pemeriksaan KMO,
berikut adalah kriteria yang disarankan oleh Kaiser dan Rice
(Sharma, 1996).
Nilai KMO
≥ 0.90
0.80+
0.70+

Tabel 2.1 Kriteria KMO
Rekomendasi
Nilai KMO
Marvelous
0.60+
Meritorious
0.50+
Middling
< 0.50

Rekomendasi
Mediocre
Miserable
Unacceptable

Nilai KMO yang lebih tinggi adalah sesuatu yang
diharapkan pada suatu analisis. Secara umum nilai dari

10
pemeriksaan diharapkan lebih besar dari 0.80, namun jika nilai
KMO sebesar 0.5 maka hal tersebut masih diperbolehkan.
2.2.2 Distribusi Normal Multivariat
Normal multivariat adalah suatu perluasan dari distribusi
normal univariat sebagai aplikasi pada variabel-variabel yang
berkorelasi. Dalam analisis multivariat, asumsi normal multivariat
harus diperiksa untuk memastikan data pengamatannya mengikuti
distribusi normal agar statistik inferensia dapat digunakan dalam
menganalisis data tersebut (Rencher, 2002).
Baik untuk kasus bivariat (p = 2) maupun multivariat (p ≥ 2),
dapat digunakan jarak umum kuadrat (squared generalized
distance) dengan rumus sebagai berikut (Johnson & Winchern,
2007).
d 2j  (x j  x)S 1 (x j  x) , j = 1,2,…, n
(2.8)
dengan x1, x2,…, xn adalah sampel pengamatan, p adalah
banyaknya variabel dan n adalah banyaknya sampel, dan S-1
adalah matriks varian kovarian.
Apabila populasi berdistribusi normal multivariat dan n
maupun n - p lebih besar dari 25 atau 30, setiap jarak kuadrat
d12 , d 22 ,..., d n2 harus seperti variabel acak berdistribusi chisquare. Walaupun jarak tersebut tidak independen ataupun benarbenar berdistribusi chi-square, hal ini membantu membuat plot
datanya. Plot yang dihasilkan tersebut disebut chi-square plot
atau gamma plot, karena distribusi chi-square adalah kasus
khusus dari distribusi gamma yang lebih umum. Plot yang
terbentuk harus mengikuti garis lurus dengan slope 1.
Untuk membuat chi-square plot dapat dilakukan langkah
sebagai berikut.
1) Menyusun jarak kuadrat (jarak mahalanobis) dari yang
terkecil hingga yang terbesar, sehingga d (21)  d (22)  ...  d (2n )
2) Membuat scatter-plot antara
qc , p ( j  (1 / 2)) / n 

q ( j  (1/ 2)) / n, d , dimana
c, p

2
( j)

adalah 100( j  (1 / 2)) / n kuantil dari distribusi

chi-squared dengan derajat bebas p.

11
Jika scatter-plot cenderung membentuk garis lurus dan berada
disekitar 0,5, maka H0 gagal ditolak artinya data berdistribusi
normal multivariat.
2.2.3 Uji Bartlett Sphericity
Uji bartlett sphericity merupakan pengujian statistik untuk
menguji persamaan korelsi antara dua atau lebih variabel
independen untuk dilihat nilai korelasinya (Rencher, 2002).
Hipotesis yang digunakan adalah sebagai berikut.
H0 : ρ = I (tidak terdapat korelasi multivariat)
H1 : ρ  I (ada korelasi multivariat)
Statistik uji yang digunakan dalam pengujian ini adalah sebagai
berikut.



2
 hitung
 (n  1) 

(2 j  5) 
ln | R |
6 

dimana :
n
: banyak objek
j
: banyak variabel
| R | : determinan dari matriks korelasi
2
Keputusan H0 di tolak jika nilai  hitung
 2

,

(2.9)

j ( j 1)
2

. Suatu matriks

korelasi dikatakan menyerupai matriks identitas bilamana nilai
determinannya mendekati 1 (Rencher, 2002).
2.3

Derajat Keanggotaan
Pengelompokan menggunakan metode fuzzy c-means
clustering (FCM) metode ini pertama perlu menentukan derajat
keanggotaan sesuai dengan fungsi keanggotaan yang akan
digunakan. Fungsi keanggotaan adalah suatu kurva yang
menunjukkan pemetaan titik-titik input data kedalam nilai
keanggotaan. Salah satu cara yang dapat digunakan untuk
mendapatkan niai keanggotaan adalah melalui pendekatan fungsi.
Beberapa fungsi keanggotaan yang paling sederahana dan bisa
digunakan yaitu representasi linier, kurva segitiga dan kurva
trapesium (Kusumadewi & Hartati, 2006).

12
2.3.1

Representasi Linier
Fungsi keanggotaan yang representasi linier yaitu
pemetaan input derajat keanggotaan (  ik ( x k )) digambarkan
sebagai suatu garis lurus. Bentuk ini paling sederhana dan
menjadi pilihan yang baik untuk mendekati suatu konsep yang
kurang jelas. Terdapat 2 macam fungsi keanggotaan representasi
linier yakni representasi linier naik dan turun (Taufiq, 2016).
a. Representasi Linier Naik
Ada 2 keadaan himpunan fuzzy yang linier, pertama kenaikan
himpunan dimulai pada nilai domain yang memiliki derajat
keanggotaan nol (0) bergerak ke kanan menuju domain yang
memiliki derajat keanggotaan lebih tinggi (Gambar 2.1).
1

( ( x))

0
a

domain

b

Gambar 2.1 Representasi Linier Naik

Derajat keanggotaan :


0; x  a


 ( x  a)

(2.10)
(  ( x))  
; a  x  b
(
b

a
)




1; x  b


b. Representasi Linier Turun
Fungsi keanggotaan linier yang kedua adalah kebalikan dari
yang pertama, yakni representasi turun. Garis lurus dimulai dari
nilai domain dengan derajat keanggotaan tertinggi pada sisi kiri,
kemudian bergerak menurun pada domain yang lebih rendah.
Derajat keanggotaan :

13

 (b  x)

; a  x  b

(  ( x))   (b  a)




x
b
0
;



(2.11)

1

( ( x))

0
a

domain

b

Gambar 2.2 Representasi Linier Turun

2.3.2

Representasi Kurva Segitiga
Fungsi keanggotaan dengan kurva segitiga merupakan
gabungan antara 2 garis linier, yang digambarkan sebagai berikut
(Taufiq, 2016).
1

( ( x))

0

a

b
domain
Gambar 2.3 Representasi Kurva Segitiga

c

Derajat keanggotaan :


0; x  a atau x  c 


 ( x  a)

(  ( x))  
; a xb

b
a
(
)


 (c  x ) ; b  x  c 
 (c  b )




(2.12)

14
2.3.3

Represenstasi Kurva Trapesium
Fungsi keanggotaan dengan kurva trapezium hampir
sama dengan kurva segitiga, hanya ada beberapa titik yang
memiliki nilai keanggotaan 1 (Taufiq, 2016).
1

( ( x))

0

a

b

c
d
domain
Gambar 2.4 Representasi Kurva Trapesium

Derajat keanggotaan :


0; x  a atau x  d 


( x  a)

; a xb


(  ( x))   (b  a )

 1; b  x  c



 (d  x) ; x  d 
 (d  c)




(2.13)

2.4 Analisis Cluster
Analisis cluster memiliki tujuan untuk partisi himpunan data
atau objek ke dalam cluster (himpunan bagian, kelompok, kelas).
Dalam melakukan partisi ini harus memiliki kriteria homogenitas
dalam cluster. Data yang akan dilakukan partisi hendaknya
memiliki kesamaan dalam satu cluster dan memiliki heterogenitas
pada cluster yang lain (Hoppner, et al., 1999). Analisis cluster
merupakan sebuah solusi untuk mengelompokkan objek-objek
pengamatan menjadi beberapa kelompok sehingga akan diperoleh
kelompok dimana objek-objek dalam satu kelompok memiliki
banyak kesamaan sedangkan dengan anggota kelompok lain
memiliki banyak perbedaan. Prosedur pengelompokan pada

15
dasarnya ada dua, yakni hierarchi, dan non hierarchi (Everitt, et
al., 2011). Lima metode pengelompokan yang termasuk ke
dalam metode hierarchi adalah single linkage, average linkage,
complete linkage, metode ward’s, dan metode centroid. Metode
nonhierarchi diantaranya ada dua yakni c-means, dan fuzzy cmeans.
2.4.1 C-Means Clustering
Analisis cluster dengan metode c-means merupakan
teknik pengelompokan yang paling sederhana. Pada teknik ini
pengelompokan objek ke dalam c kelompok atau c cluster. Untuk
melakukan pengelompokan, nilai c harus ditentukan terlebih
dahulu atau sudah diketahui sebelumnya (Santoso, 2014).
Metode c-means clustering merupakan metode yang
menggunakan alogaritma dengan mendeskripsikan bahwa pada
tiap-tiap objek yang dikelompokkan memiliki centroid atau ratarata jarak terdekat. Pengelompokan dengan metode c-means
menentukan jumlah inisialisasi c pusat. Menentukan rata-rata titik
pusat cluster pada variabel dengan rumus sebagai berikut.
nc

vcj 

x
i 1

ij

(2.14)

nc

Keterangan:
vcj = titik pusat (centroid/rata-rata) cluster ke-c variabel ke- j
nc

= jumlah objek yang menjadi anggota cluster ke-c

i = objek penelitian
j = variabel penelitian
xij = nilai objek ke- i yang ada di dalam cluster untuk variabel
ke- j .
Berikutnya mengelompokkan objek berdasarkan centroid
terdekat (jarak yang digunakan adalah jarak euclidean), dengan
rumusnya sebagai berikut.
Dci 

J

 (x
i 1

ij

 v cj ) 2

(2.15)

16
Keterangan
Dcj = jarak euclidean cluster ke-c objek ke- i

i = objek penelitian
j = variabel penelitian
xij = nilai objek ke-i yang ada di dalam cluster untuk variabel
ke-j
vcj = titik pusat (centroid/rata-rata) cluster ke-c variabel ke-j

Terakhir menghitung kembali centroid kelompok ketika
menerima item baru maupun item yang keluar, dan melakukan
iterasi 2 dan 3 hingga tidak terdapat lagi item yang bisa masuk
maupun keluar lagi dimana kriteria konvergensi terpenuhi.
2.4.2 Fuzzy C-means Clustering
Metode fuzzy c-means cluster diasumsikan memiliki
ukuran yang sama dengan setiap cluster diwakili oleh titik
pusatnya sehingga sesuai dengan cluster yang telah ditentukan
sebelumnya, karena sering dianggap sebagai wakil dari semua
data/objek cluster diukuran dengan jarak euclidean (Hoppner,
Klawonn, Kruse, & Runkler, 1999). Fuzzy c-means ini merupakan
pengembangan dari metode c-means yang mengandung fungsi
keanggotaan. Fungsi keanggotaan adalah suatu kurva yang
menunjukkan pemetaan titik-titk input data ke dalam nilai
keanggotaan. (Kusumadewi & Hartati, 2006). Berbeda dari cmeans dalam fuzzy c-means clustering setiap objek bisa menjadi
anggota dari beberapa cluster.
Fuzzy C-Means Cluster memiliki suatu variabel w yang
merupakan parameter pembobot dari fungsi keanggotaan dimana
w mempunyai nilai lebih besar dari 1 (w>1) dan nilai w yang
umum digunakan adalah 2 (w=2). Metode fuzzy c-means dengan
menentukan pusat cluster yang akan menandai lokasi rata-rata
untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster masih
belum akurat, atau dapat berubah. Setiap data memiliki derajat
keanggotaan untuk setiap cluster. Dengan memperbaiki pusat
cluster dan nilai keanggotaan secara berulang, maka dapat dilihat
bahwa pusat cluster akan menuju lokasi yang tepat. Perulangan

17
ini didasarkan pada minimalisasi fungsi objektif, yang
menggambarkan jarak dari titik data yang diberikan ke pusat
cluster yang terbobot oleh derajat jarak keanggotaan titik data
tersebut (Kusumadewi & Hartati, 2006). Pengelompokan dengan
metode fuzzy c-means pertama menentukan matriks, jumlah
cluster, dan pembobot. Kemudian melakukan iterasi maksisum
iterasi yang umum digunakan sebanyak 100. Kriteria dalam
penghentian threshold/ε = nilai positif yang sangat kecil, biasanya
digunakan sebanyak 10-6. Selanjutnya menentukan matriks partisi
awal U (derajat keanggotaan dalam cluster).
 11 ( x1 ) 12 ( x 2 )  1I ( x I ) 
  ( x )  ( x )   ( x )
(2.16)
22
2
2I
I 
 21 1
U

 

  c1 ( x1 )



 

 c 2 ( x 2 )   c1 ( x J ) 

Matriks ini biasanya disusun secara random namun dapat
juga disusun menggunakan pendekatan fungsi keanggotaan
berdasarkan persamaan (2.10) hingga (2.13).
Kemudian menghitung pusat cluster v untuk setiap cluster
nc

vcj 

 (U
i 1
nc

ci

 (U
i 1

) w xij
ci

(2.17)

)w

dan hitung fungsi obyektif pada iterasi ke-t,
n C  J


(2.18)
Pt     ( xij  v cj ) 2 (U ci ) w 


i 1 c 1   j 1


Keterangan:
vcj = titik pusat (centroid/rata-rata) cluster ke-c variabel ke- j

U ci = derajat keanggotaan cluster ke-c variabel ke- i
xij = nilai objek ke-i yang ada di dalam cluster tersebut untuk
variabel ke- j
n c = jumlah objek yang menjadi anggota cluster ke-c

18

i = objek penelitian
j = variabel penelitian
c = banyak kelompok
w = pembobot eksponen
memperbaiki derajat kenggotaan setiap data pada setiap cluster
(perbaiki matriks partisi)
1

w1
J
2
 xij  vcj  
j 1

U ci  
1
C  J
w1
2
 xij  vcj  

c 1  j 1


(2.19)

Keterangan :
w = Pembobot nilainya 2
i = objek penelitian
j = variabel penelitian
c = banyak kelompok
v cj = titik pusat (centroid/rata-rata) cluster ke-c variabel ke- j
xij = nilai objek ke-i yang ada di dalam cluster tersebut untuk

variabel ke- j
Terakhir menetukan kriteria penghentian iterasi, yaitu perubahan
matriks partisi pada iterasi sekarang dan iterasi sebelumnya.

  | U l  U l 1 |

(2.20)

Keterangan :
l = iterasi ke- t
U = derajat keanggotaan
Apabila Ʌ< ε maka iterasi diberhentikan. Tetapi jika tidak maka
kembali menghitung pusat cluster vcj .
2.5 Pseudo F-Statistic
Penentuan jumlah cluster optimum yang pembentukan cluster
ditentukan oleh jarak euclidean sesuai metode yang digunakan,
maka menggunakan pseudo f-statistic (Timm, 2002). Nilai pseudo

19
f-statistic tertinggi menunjukkan bahwa jumlah kelompok telah
optimal, dimana keragaman dalam kelompok sangat homongen
sedangkan antar kelompok sangat heterogen. Berikut merupakan
perhitungan yang digunakan untuk menghitung nilai pseudo fstatistic.
 R2 


Pseudo f-statistic =  c  1 
 1  R2 


 nc 

(2.21)

Dimana:
R 2  ( SST  SSW ) / SST
n

C

J

SST   ( x icj  x j ) 2

(2.22)

i 1 c 1 j 1
n

C

J

SSW   ( x icj  x cj ) 2
i 1 c 1 j 1

Keterangan:
SST = total jumlah dari kuadrat jarak terhadap rata-rata
keseluruhan (Sum Square Total)
SSW = total jumlah dari kuadrat jarak objek terhadap rata-rata
kelompoknya (Sum Square Within Total)
i
= objek penelitian
c = banyak kelompok
j = variabel penelitian
xicj = objek ke = i kelompok ke-c variabel ke- j

x j = rata-rata seluruh objek pada variabel ke- j
xcj

= rata-rata objek pada kelompok ke- c variabel ke- j

Internal Cluster Dispertion Rate (Icdrate)
Internal Cluster Dispertion Rate (Icdrate) merupakan
metode yang digunakan untuk membandingkan metode cluster
yang terbaik dengan mengevaluasi performansi algoritma dengan
menggunakan presentase rata-rata dari klasifikasi yang benar

2.6

20
(recovery rate). Nilai persebaran data-data dalam cluster (Icdrate)
dari hasil akhir pengelompokan (Mingoti & Lima, 2006). Nilai ini
didefinisikan dengan persamaan sebagai berikut.
Icdrate = 1 

SSB
SST  SSW
 1
 1  R2
SST
SST

(2.23)

Keterangan:
SST = Total jumlah dari kuadrat jarak terhadap rata-rata
keseluruhan (Sum Square Total)
SSW = Total jumlah dari kuadrat jarak objek terhadap rata-rata
kelompoknya (Sum Square Within Total)
SSB = Sum Square Between ( SST  SSW )

R2

= recovery rate ( SSB/ SST)

ANOVA (Analyze of Varians )
Sebelum dilakukan ANOVA (Analyze of Varians) metode
statistika ini sebelumnya dilakukan pemeriksaan asumsi. Asumsiasumsi dasar yang akan dilakukan adalah matriks varianskovarians yang homogen dan normalitas data.
2.7.1 Kehomogenan Matriks Varians-Kovarians
Uji levene’s test adalah uji kesamaan varians
(homogenitas). Tujuannya untuk melihat kategori didalam
variabel memiliki varians yang homogen atau tidak (Santoso,
2014). Langkah-langkah uji levene's test sebagai berikut.
1. Menentukan hipotesis
H0: Kedua varian adalah sama (varian kelompok A dan B
sama)
H1: Kedua varian adalah berbeda (varian kelompok A dan B
berbeda).
2. Daerah penolakan H0 ditolak, jika W > Ftabel (α; c-1,n-c), p value <
0,05
3. Statistik uji :
(2.24)
( n  c ) n ( Z  Z )
2.7

c

2

W

i
i 1
c ni

i.

..

(c  1) ( Z ij  Z i. )
i 1 j 1

21
Keterangan :
n = jumlah observasi
c = banyaknya kelompok

Z ij  | Yij  Yi. |
Yi. = rata-rata dari kelompok ke-i
Z i. = rata-rata kelompok dari Z i.

Z = rata-rata keseluruhan dari Z ij
Uji Kolmogorov Smirnov
Uji Kolmogorov-Smirnov merupakan salah satu uji
nonparametrik untuk satu sampel (one sample kolmogorovsmirnov). Uji ini dilakukan untuk menguji asumsi normalitas
data. Uji kolmogorov-smirnov dipergunakan untuk sampel besar
(Daniel, 1989). Hipotesis yang digunakan adalah berikut.
H0 : data sampel berasal dari distribusi normal
H1 : data sampel tidak berasal dari distribusi normal
Statistik uji:

2.7.2

D  Sup Fn ( x)  F0 ( x)

(2.25)

x

Keterangan :
D : nilai kritis dari tabel kolmogorov smirnov satu sampel.
Fn(x) : nilai distribusi kumulatif sampel
F0(x) : nilai distribusi kumulatif dibawah H0 P(Z