Model Regresi Nonparametrik Spline Truncated pada Data Indeks Pembangunan Manusia (IPM) di Indonesia - UNS Institutional Repository
MODEL REGRESI NONPARAMETRIK SPLINE TRUNCATED
PADA DATA INDEKS PEMBANGUNAN MANUSIA (IPM)
DI INDONESIA
oleh KORNELIUS RONALD DEMU M0113025 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar
Sarjana Sains Matematika FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA
2017
PERNYATAAN
Dengan ini saya menyatakan bahwa skripsi saya yang berjudul ”Model Re- gresi Nonparametrik Spline Truncated pada Data Indeks Pembangunan Manusia (IPM) di Indonesia” belum pernah diajukan untuk memperoleh gelar kesarjana- an pada suatu perguruan tinggi, dan sepanjang pengetahuan saya juga belum pernah ditulis atau dipublikasikan oleh orang lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka.
Surakarta, Juni 2017 Kornelius Ronald Demu
ABSTRAK
Kornelius Ronald Demu. 2017. MODEL REGRESI NONPARAMETRIK SPLINE TRUNCATED PADA DATA INDEKS PEMBANGUNAN MANUSIA (IPM) DI INDONESIA. Fakultas Matematika dan Ilmu Pengetahuan Alam.
Universitas Sebelas Maret.
Pembangunan manusia merupakan indikator penting dalam proses pemba- ngunan negara selain pertumbuhan ekonomi. Standar ukur pembangunan ma- nusia di suatu negara ditetapkan dalam Indeks Pembangunan Manusia (IPM). Menurut Badan Pusat Statistik (BPS), dalam beberapa tahun terakhir, IPM di Indonesia menunjukkan peningkatan. Empat faktor yang diduga memenga- ruhi hal tersebut adalah angka harapan hidup, produk domestik regional bruto (PDRB), jumlah penduduk miskin, dan persentase penduduk buta huruf. Penga- ruh faktor-faktor tersebut terhadap IPM dapat diketahui melalui model regresi. Model regresi memiliki dua pendekatan, yaitu parametrik dan nonparametrik. Pendekatan model regresi ditentukan berdasarkan pola datanya.
Apabila data IPM dan empat faktor tersebut diplotkan, maka menunjukkan pola data yang tidak mengikuti pola tertentu sehingga data IPM di Indonesia da- pat diterapkan pada model regresi pendekatan nonparametrik. Fungsi yang dapat digunakan pada model regresi nonparametrik adalah spline. Model regresi non- parametrik spline dapat dituliskan kembali dalam bentuk model regresi nonpa- rametrik spline truncated. Model regresi nonparametrik spline truncated terbaik dipengaruhi oleh pemilihan orde dan titik knot optimal. Pemilihan titik knot optimal berdasarkan nilai generalized cross validation (GCV ) minimum. Tujuan penelitian ini adalah menerapkan model regresi nonparametrik spline truncated orde satu dengan 3,4, dan 5 titik knot pada data IPM di Indonesia serta menen- tukan faktor yang memengaruhi IPM di Indonesia.
Berdasarkan hasil penelitian, diperoleh model regresi nonparametrik spline truncated terbaik pada data IPM di Indonesia dengan kombinasi 5-5-5-4 titik knot optimal. Angka harapan hidup dan persentase penduduk buta huruf me- rupakan faktor yang memengaruhi IPM di Indonesia. Selanjutnya, kelayakan 2 2 model regresi diukur berdasarkan koefisien determinasi (R ). Nilai R model re- gresi nonparametrik spline truncated terbaik pada data IPM di Indonesia adalah 0.9454. Hal tersebut mengindikasikan IPM di Indonesia dapat dijelaskan 94.54% oleh angka harapan hidup dan persentase penduduk buta huruf. Sisanya, 5.46% merupakan persentase faktor lainnya yang tidak teramati dalam penelitian.
Kata kunci : IPM, model regresi nonparametrik spline truncated, titik knot op- timal .
ABSTRACT
Kornelius Ronald Demu. 2017. NONPARAMETRIC TRUNCATED SPLINE REGRESSION MODEL ON THE DATA OF HUMAN DEVELOPMENT INDEX (HDI) IN INDONESIA. Faculty of Mathematics and Natural Science. Sebelas Maret University.
Human development is the essential indicator in the process of country’s de- velopment besides the economic progress. A Standard measurement of country’s development is Human Development Index (HDI). According to Badan Pusat Statistik (BPS), in past several years, the HDI in Indonesia has increased. Four factors that allegedly affect it are life expectancy, gross regional domestic product (GRDP), the number of poor people, and the percentage of an illiterate people. The affect of those factors to HDI can be determined by regression model. There are two approaches for regression model, such as parametric and nonparametric. The regression model approach is determined by data pattern.
If the data of HDI and those four factors is plotted, then a plot do not form a specific pattern, so the data of HDI in Indonesia can be applied with non- parametric regression model. The function that can be used in nonparametric regression model is spline. Nonparametric spline regression model could be writ- ten down in the form of nonparametric truncated spline regression model. The best nonparametric truncated spline regression model is affected by the selection of order and optimal knot point. The selection of optimal knot point is determi- ned by the minimum value of generalized cross validation (GCV). The purposes of this research are to apply nonparametric truncated spline regression model of first order with 3,4, and 5 knot point on the HDI’s data in Indonesia and also to determine the factor that affect the HDI in Indonesia.
Based on the result, nonparametric truncated spline regression model for the HDI’s data in Indonesia was obtained by the combination of 5-5-5-4 optimal knot point. Life expectancy and the percentage of an illiterate people affected the HDI of Indonesia. Furthermore, the appropriateness of regression model was 2 2 measured by coeffecient determination (R ). The value of R from nonparametric truncated spline regression model was 0.9454 that indicated the HDI in Indonesia could be explained in the amount of 94.54% by life expectancy and the percentage of an illiterate people while 5.46% was the percentage of another factors that not observed in the research. Keywords : HDI, nonparametric truncated spline regression model, optimal knot point .
MOTO
Bukan kesulitan yang membuat kita takut, tetapi ketakutanlah yang membuat kita sulit. Karena itu, jangan pernah mencoba untuk menyerah dan jangan pernah menyerah untuk mencoba.
2 Timotius 1 : 7
PERSEMBAHAN
Karya ini kupersembahkan untuk kedua orang tua dan kakak saya.
KATA PENGANTAR
Puji syukur ke hadirat Tuhan Yang Maha Kuasa atas limpahan berkat dan rahmat-Nya sehingga penulis dapat menyelesaikan skripsi ini. Penulis menya- dari bahwa dalam penulisan skripsi ini tidak lepas dari bantuan, dorongan, dan bimbingan berbagai pihak. Oleh karena itu penulis mengucapkan terima kasih kepada
1. Dr. Dewi Retno Sari Saputro, S.Si., M.Kom. sebagai Pembimbing I yang telah memberikan bimbingan materi, motivasi, dan arahan dalam proses penulisan skripsi ini.
2. Dra. Purnami Widyaningsih, M.App.Sc. sebagai Pembimbing II yang telah memberikan arahan dalam proses penyusunan alur penulisan skripsi, saran dan motivasi. Semoga skripsi ini bermanfaat.
Surakarta, Juni 2017 Penulis
DAFTAR ISI
HALAMAN JUDUL . . . . . . . . . . . . . . . . . . . . . . . . . . . . i PENGESAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii PERNYATAAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii ABSTRAK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v MOTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi PERSEMBAHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii KATA PENGANTAR . . . . . . . . . . . . . . . . . . . . . . . . . . . viii DAFTAR ISI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi DAFTAR TABEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xii DAFTAR GAMBAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii
I PENDAHULUAN 1 1.1 Latar Belakang Masalah . . . . . . . . . . . . . . . . . . . . . . .
1 1.2 Perumusan Masalah . . . . . . . . . . . . . . . . . . . . . . . . .
3 1.3 Tujuan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 1.4 Manfaat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 II LANDASAN TEORI 5 2.1 Tinjauan Pustaka . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 2.2 Teori Penunjang . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6 2.2.1 Model Regresi . . . . . . . . . . . . . . . . . . . . . . . . .
6 2.2.2 Model Regresi Nonparametrik . . . . . . . . . . . . . . . .
7 2.2.3 Spline Truncated . . . . . . . . . . . . . . . . . . . . . . .
8
2.2.4 Pemilihan Titik Knot Optimal . . . . . . . . . . . . . . . .
9 2.2.5 Estimasi Parameter . . . . . . . . . . . . . . . . . . . . . .
10 2.2.6 Pengujian Signifikansi Parameter . . . . . . . . . . . . . .
11 2.2.7 Pengujian Asumsi Sisaan . . . . . . . . . . . . . . . . . . .
13 2.2.8 Koefisien Determinasi . . . . . . . . . . . . . . . . . . . .
15 2.3 Kerangka Pemikiran . . . . . . . . . . . . . . . . . . . . . . . . .
16 III METODE PENELITIAN 17 3.1 Data dan Sumber . . . . . . . . . . . . . . . . . . . . . . . . . . .
17 3.2 Langkah-Langkah Penelitian . . . . . . . . . . . . . . . . . . . . .
17 IV HASIL DAN PEMBAHASAN
19 4.1 Deskripsi Data . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19 4.2 Pola Hubungan Variabel Respon dan Variabel Prediktor . . . . .
21
4.3 Model Regresi Nonparametrik Spline Truncated dengan 3,4, dan 5 Titik Knot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
4.4 Model Regresi Nonparametrik Spline Truncated Berdasarkan Titik Knot Optimal . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
4.5 Pengujian Signifikansi Parameter Model Berdasarkan Titik Knot Optimal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35 4.5.1 Uji Keseluruhan . . . . . . . . . . . . . . . . . . . . . . . .
35 4.5.2 Uji Parsial . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
4.6 Pengujian Asumsi Sisaan Model Berdasarkan Titik Knot Optimal
38 4.6.1 Asumsi Kenormalan . . . . . . . . . . . . . . . . . . . . .
38 4.6.2 Asumsi Independensi . . . . . . . . . . . . . . . . . . . . .
39 4.6.3 Asumsi Heteroskedastisitas . . . . . . . . . . . . . . . . . .
39 4.7 Model Regresi Nonparametrik Spline Truncated yang Sesuai . . .
41
4.8 Koefisien Determinasi Model Regresi Nonparametrik Spline Trun- cated yang Sesuai . . . . . . . . . . . . . . . . . . . . . . . . . . .
43 V PENUTUP 44 5.1 Kesimpulan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
5.2 Saran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44 DAFTAR PUSTAKA
46 DAFTAR TABEL
4.1 Nilai GCV untuk 3 titik knot pada masing-masing variabel prediktor .
23
4.2 Nilai GCV minimum berdasarkan banyaknya titik knot yang digunakan
31 4.3 Hasil estimasi parameter . . . . . . . . . . . . . . . . . . . . . . . .
33
4.4 Tabel ANAVA hasil uji F . . . . . . . . . . . . . . . . . . . . . . .
36
4.5 Nilai t hitung untuk masing-masing parameter . . . . . . . . . . . . . .
37 4.6 Tabel ANAVA hasil uji Glejser . . . . . . . . . . . . . . . . . . . . .
40 DAFTAR GAMBAR
4.1 Plot scatter (a)Y dan X 1 , (b)Y dan X 2 , (c)Y dan X 3 , (d)Y dan X 4 .
21
4.2 Pembagian wilayah berdasarkan angka harapan hidup (x 1 ) . . . . . .
42
4.3 Pembagian wilayah berdasarkan persentase buta huruf (x 4 ) . . . . . .
43