Pemodelan Klasifikasi Kesejahteraan Rumah Tangga dengan MARS, Suatu Studi Kasus di Kota Medan
PEMODELAN KLASIFIKASI KESEJAHTERAAN
RUMAH TANGGA DENGAN MARS
(Suatu Studi Kasus di Kota Medan)
SKRIPSI
SITI SHARAH
100803054
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2014
(2)
PEMODELAN KLASIFIKASI KESEJAHTERAAN
RUMAH TANGGA DENGAN MARS
(Suatu Studi Kasus di Kota Medan)
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
SITI SHARAH 100803054
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA
MEDAN 2014
(3)
PERSETUJUAN
Judul : Pemodelan Klasifikasi Kesejahteraan Rumah Tangga dengan MARS, Suatu Studi Kasus di Kota Medan
Kategori : SKRIPSI
Nama : Siti Sharah
Nomor Induk Mahasiswa : 100803054
Program Studi : Sarjana (S1) Matematika
Departemen : Matematika
Fakultas : Matematika dan Ilmu Pengetahuan Alam (FMIPA) Universitas Sumatera Utara
Diluluskan di Medan, Juli 2014 Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
Drs. Gim Tarigan, M.Si. Drs. Open Darnius, M.Sc. NIP. 195502021986011001 NIP. 196410141991031004
Diketahui/Disetujui oleh:
Departemen Matematika FMIPA USU Ketua,
Prof. Dr. Tulus, M.Si. NIP 196209011988031002
(4)
PERNYATAAN
PEMODELAN KLASIFIKASI KESEJAHTERAAN
RUMAH TANGGA DENGAN MARS
(Suatu Studi Kasus di Kota Medan)
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, Juli 2014
SITI SHARAH 1008003054
(5)
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Allah SWT yang Maha Pemurah dan Maha Penyayang, yang senantiasa memberikan segala rahmat dan hidayah-Nya, dan yang telah memberi kekuatan sehingga penulis dapat menyelesaikan skripsi ini dengan judul Pemodelan Klasifikasi Kesejahteraan Rumah Tangga dengan MARS, Suatu Studi Kasus di Kota Medan.
Terimakasih penulis sampaikan kepada Bapak Drs. Open darnius, M.Sc selaku pembimbing I dan Bapak Drs. Gim Tarigan, M.Si selaku pembimbing II yang telah meluangkan waktunya untuk membimbing dan memberikan pengarahan kepada saya sehingga penyusunan skripsi ini dapat diselesaikan. Terima kasih kepada Bapak Drs. Henry Rani Sitepu, M.Si dan Bapak Dr. Pasukat Sembiring, M.Si selaku dosen penguji saya, Bapak Prof. Dr. Tulus, M.Si dan Ibu Dr. Mardiningsih, M.Si selaku Ketua dan Sekretaris Departemen Matematika FMIPA USU, Bapak Dr. Sutarman, M.Sc selaku Dekan FMIPA USU, seluruh Staff dan Dosen Matematika FMIPA USU, dan pegawai Administrasi. Penulis juga mengucapkan terima kasih kepada kedua orang tua tercinta, ayah dan ibu, adik-adik dan keluarga besar yang telah memberikan dukungan, doa, dan semua bantuan yang diperlukan penulis. Akhirnya penulis juga mengucapkan terima kasih kepada seluruh teman-teman Matematika 2010 khususnya kesebelasan.
(6)
ABSTRAK
Penelitian ini bertujuan untuk melihat faktor-faktor yang menjadi penciri kesejahteraan rumah tangga di Medan dan bagaimana model ini dibangun agar ketepatan klasifikasinya cukup tinggi. Model yang digunakan adalah Bagging MARS. Hasil penelitian ini menunjukkan bahwa dari sembilan variabel yang diteliti, tujuh diantaranya memiliki kontribusi terhadap model, yaitu jumlah anggota rumah tangga, sumber air minum rumah tangga, pendidikan kepala rumah tangga, status pekerjaan kepala rumah tangga, jenis kelamin kepala rumah tangga, umur kepala rumah tangga, dan lapangan usaha utama kepala rumah tangga. Sedangkan ketepatan klasifikasi yang dihasilkan oleh metode MARS adalah 94.08%. Penerapan teknik bagging mampu meningkatkan klasifikasi sebesar 95.04%.
(7)
Classification Modeling Household Welfare. (A Case Study in Medan)
ABSTRACT
This study aims to look at the factors that become identifier in the field of household welfare and how these models are built to a high enough classification accuracy. The model used is Bagging MARS. The results of this study showed that of the nine variables studied, seven of which have contributed to the model, the number of household members, household drinking water sources, education of household head, employment status of household head, gender of household head, age of head of household stairs, and main industry of household heads. While the classification accuracy produced by MARS method is 94.08%. The application of bagging technique can improve the classification of 95.04%.
(8)
DAFTAR ISI
Halaman
Persetujuan i
Pernyataan ii
Penghargaan ii
Abstrak iv
Abstract v
Daftar Isi vi
Daftar Tabel viii
Daftar Gambar xi
Daftar Lampiran x
Bab 1 Pendahuluan
1.1 Latar Belakang 1
1.2 Perumusan Masalah 3
1.3 Batasan Masalah 3
1.4 Tinjauan Pustaka 3
1.5 Tujuan Penelitian 4
1.6 Kontribusi Penelitian 5
Bab 2 Landasan Teori
2.1 Kesejahteraan 6
2.2 Faktor-faktor yang Mempengaruhi Kesejahteraan 6
2.3 Statistika Deskriptif 7
2.4 Analisis Regresi 8
2.5 Regresi Nonparametrik 8
2.6 Regresi Spline 9
2.7 Suatu Fungsi Basis (Basis Function) 10
2.8 Recursive Partitioning (RP) 11
2.9 Multivariate Adaptive Regression Splines (MARS) 12
2.8.1 Metode MARS 13
2.8.2 Algoritma MARS 14
2.8.3 Uji Signifikansi Basis Fungsi Model MARS 16
2.8.4 Apparent Error Rate (APER) 18
2.10 Bootstrap Agregting (Bagging) 19
Bab 3 Metode Penelitian
3.1 Merumuskan Masalah 21
3.2 Studi Literatur 21
3.3 Pengamatan dan Pengumpulan Data 21
3.4 Membuat Landasan Teori 23
3.5 Analisis Data dengan Multivariate Adaptive Regression Spline 24 3.6 Analisis Data dengan Analisis Bootstrap Resampling 24
(9)
Bab 4 Pembahasan
4.1 Deskripsi Krakteristik Rumah Tangga di Medan 25
4.1.1 Kependudukan 27
4.1.2 Pendidikan 28
4.1.3 Ketenagakerjaan 30
4.1.4 Perumahan 34
4.2 Pengaruh dan Pola Hubungan Sebagai Fungsi Faktor-Faktor yang Memepengaruhi Kesejahteraan Rumah Tangga 36
4.2.1 Model Kesejahteran Rumah Tangga Menggunakan MARS 36 4.2.2 Interpretasi Koeifisien Fungsi Basis pada Model MARS 39 4.2.2 Uji Signifikannsi Fungsi Basis Model MARS 45 4.3 Klasifikasi Kesejahteraan Rumah Tangga di Medan 47 4.4 Ketepatan Klasifikasi dengan Pendekatan Bagging MARS 49 Bab 5 Kesimpulan dan Saran
5.1 Kesimpulan 51
5.2 Saran 52
Daftar Pustaka 53
(10)
DAFTAR TABEL
Nomor Judul Halaman
Tabel
2.1 Klasifikasi Apperant Error Rate (APER) 18
3.1 Variabel Penelitian 22
4.1 Statistika Deskriptif Kesejahteraan Rumah Tangga di Medan 26 4.2 Jumlah Sampel dan Proporsi Kelompok rumah Tangga Miskin
dan Rumah Tangga Tidak Miskin 26
4.3 Deskripsi Karakteristik Sosial Demografi Rumah tangga 1 27 4.4 Deskripsi Karakteristik Sosial Demografi Rumah tangga 2 28 4.5 Deskripsi Karakteristik Pendidikan Kepala rumah Tangga 29 4.6 Deskripsi Karakteristik Ketenagakerjaan Kepala Rumah Tangga 30 4.7 Deskripsi Karakteristik Perumahan Rumah Tangga 34 4.8 Trial and Error Penentuan Model Terbaik 36 4.9 Tingkat Kepetingan Variabel 44 4.10 Uji t Masing-Masing Fungsi Basis 46 4.11 Klasifikasi Kesejahteraan Rumah Tangga Miskin dan Tidak Miskin 48 4.12 Kesalahan Klasifikasi Untuk Setiap Data Set Tunggal 49 4.13 Perbandingan Tingkat Kesalahan Klasifikasi 49
(11)
DAFTAR GAMBAR
Nomor Judul Halaman Gambar
2.1 Knot Suatu Fungsi Spline 9
4.1 Distribusi Pengeluaran Perkapita Rumah Tangga Perbulan 25 4.2 Tingkat Pendidikan Kepala Rumah Tangga 30 4.3 Kegiatan Utama Kepala Rumah Tangga 32 4.4 Lapangan Usaha Kepala Rumah Tangga 33 4.5 Status Pekerjaan Utama Kepala Rumah Tangga 34 4.6 Sumber Air Minum Rumah Tangga Miskin dan Tidak Miskin 35
(12)
DAFTAR LAMPIRAN
Nomor Judul Halaman Lamp
1. Data Hasil Survey Sosial Ekonomi Nasional di Medan tahun 2012 55
2 Tabel Statistik f 80
(13)
ABSTRAK
Penelitian ini bertujuan untuk melihat faktor-faktor yang menjadi penciri kesejahteraan rumah tangga di Medan dan bagaimana model ini dibangun agar ketepatan klasifikasinya cukup tinggi. Model yang digunakan adalah Bagging MARS. Hasil penelitian ini menunjukkan bahwa dari sembilan variabel yang diteliti, tujuh diantaranya memiliki kontribusi terhadap model, yaitu jumlah anggota rumah tangga, sumber air minum rumah tangga, pendidikan kepala rumah tangga, status pekerjaan kepala rumah tangga, jenis kelamin kepala rumah tangga, umur kepala rumah tangga, dan lapangan usaha utama kepala rumah tangga. Sedangkan ketepatan klasifikasi yang dihasilkan oleh metode MARS adalah 94.08%. Penerapan teknik bagging mampu meningkatkan klasifikasi sebesar 95.04%.
(14)
Classification Modeling Household Welfare. (A Case Study in Medan)
ABSTRACT
This study aims to look at the factors that become identifier in the field of household welfare and how these models are built to a high enough classification accuracy. The model used is Bagging MARS. The results of this study showed that of the nine variables studied, seven of which have contributed to the model, the number of household members, household drinking water sources, education of household head, employment status of household head, gender of household head, age of head of household stairs, and main industry of household heads. While the classification accuracy produced by MARS method is 94.08%. The application of bagging technique can improve the classification of 95.04%.
(15)
BAB 1
PENDAHULUAN
1.1Latar belakang
Metode klasifikasi merupakan salah satu metode statistika untuk mengelompok atau mengklasifikasi suatu data yang disusun secara sistematis ke dalam suatu kelompok sehingga dapat diketahui suatu individu berada pada kelompok tertentu. Masalah klasifikasi ini muncul ketika terdapat sejumlah ukuran yang terdiri dari satu atau beberapa kategori yang tidak dapat didefinisikan secara langsung tetapi harus menggunakan suatu ukuran (Johnson dan Dean, 2007).
Metode statistik yang sering digunakan untuk menyelesaikan masalah pengklasifikasian adalah analisis diskriminan dan regresi logistik. Kedua metode tersebut bersifat parametrik karena membutuhkan beberapa asumsi, seperti harus mengikuti suatu distribusi tertentu baik untuk variabel respon maupun variabel prediktor, kenormalan data dan matrik kovarian yang homogen. Kedua metode ini seringkali disebut sebagai metode tradisional. Sayangnya metode tersebut tidak praktis digunakan dan penggunaannya terbatas pada penyelesaian masalah pengklasifikasian. Menurut Lewis (2000) kesulitan penggunaan metode statistik tradisional tersebut adalah : (1) umumnya ada banyak variabel prediktor sehingga sulit menentukan variabel yang paling berpengaruh, sehingga metode ini kurang sesuai untuk perbandingan ganda (multiple comparison), (2) variabel prediktor jarang sekali yang berdistribusi normal dan kelompok yang berbeda mungkin mempunyai nilai varians yang berbeda pula, (3) interaksi dan pola yang kompleks mungkin muncul dalam data, (4) hasil metode statistik tradisional ini sulit digunakan.
Multivariate Adaptive Regression Splines (MARS) adalah pendekatan untuk regresi multivariat nonparametrik yang diperkenalkan oleh Friedman
(16)
(1991). MARS merupakan metode yang tidak tergantung pada asumsi bentuk kurva tertentu, sehingga memberikan fleksibilitas yang lebih besar dalam penggunaannya. Kelebihan lain dari metode MARS adalah tidak dipengaruhi oleh volume data yang hilang. Hal ini dikarenakan MARS secara otomatis menciptakan suatu indikator nilai yang hilang untuk setiap variabel dengan nilai yang hilang. MARS juga dirancang untuk dapat menangkap order interaksi yang lebih tinggi atau untuk pemodelan data berdimensi tinggi (Friedman, 1991). Hidayat (2006) dalam penelitiannya menyimpulkan bahwa pengelompokkan dengan menggunakan metode MARS memiliki kesalahan pengelompokkan yang kecil, yaitu sebesar 5,1%.
Klasifikasi pada model MARS didasarkan pada pendekatan analisis regresi. Jika variable respon terdiri dari dua nilai, maka dikatakan sebagai regresi dengan binary response (Cox, dan Snell, 1989). Untuk menghitung ketepatan klasifikasi digunakan alat ukur apparent error rate (APER). Nilai APER menyatakan representasi proporsi sampel yang salah diklasifikasikan oleh fungsi klasifikasi (Johnson dan Wichern, 1992). Namun, nilai ketepatan klasifikasi tersebut dapat ditingkatkan dengan pendekatan bootstrap resampling (bagging). Metode bagging pertama kali digunakan oleh Breiman (1994) sebagai alat untuk membentuk klasifikasi yang lebih stabil.
Bagging predictor adalah metode untuk membangkitkan multiple version dari prediktor dan menggunakannya untuk aggregate predictor. Multiple version dibentuk dengan replikasi bootstrap dari sebuah data set. Data set real pada beberapa kasus bagging dapat meningkatkan akurasi. Ide dasar dari bagging adalah menggunakan bootstrap resampling untuk membangkitkan prediktor dengan banyak versi, dimana ketika dikombinasikan seharusnya hasilnya lebih baik dibandingkan dengan prediktor tunggal yang dibangun untuk menyelesaikan masalah yang sama.oleh karena itu, untuk memperoleh ketepatan klasifikasi yang lebih tinggi digunakan bagging MARS.
(17)
Kesejahteraan masyarakat merupakan salah satu tanggung jawab pemerintah negara. Salah satu permasalahan kesejahteraan adalah kemiskinan. Banyak program dan strategi yang dilakukan pemerintah untuk mengentaskan masyarakat dari kemiskinan. Agar program-program tersebut tepat sasaran, harus ada suatu cara untuk mengidentifikasi apakah suatu rumah tangga tersebut miskin atau tidak miskin. Selama ini rumah tangga miskin dikelompokkan berdasarkan pendapatan atau pengeluaran. Namun pendapatan atau pengeluaran tersebut kadang belum menggambarkan kondisi sesungguhnya dari suatu rumah tangga. Untuk itu, perlu digunakan cara lain untuk mengidentifikasi tingkat kesejahteraan. Salah satunya dengan melihat faktor-faktor yang dapat menjadi penciri tingkat kesejahteraan suatu rumah tangga. Pada penelitian ini akan diidentifikasi faktor-faktor tersebut. Hasilnya dapat digunakan untuk perencanaan pembangunan, sehingga pembangunan lebih terarah pada peningkatan kesejahteraan rumah tangga. Untuk mendeskripsikan karakteristik kesejahteraan rumah tangga dan melihat faktor yang paling berpengaruh pada suatu kelompok maka perlu dibuat suatu klasifikasi berdasarkan faktor-faktor yang mempengaruhinya. Metode klasifikasi tersebut adalah bagging MARS.
Dari latar belakang tersebut peneliti mengangkat sebuah judul yaitu, “Pemodelan Klasifikasi Kesejahteraan Rumah Tangga dengan MARS, Suatu Studi Kasus di Kota Medan “.
1.2Perumusan Masalah
Dalam membuat perencanaan terhadap penuntasan kemiskinan di kota Medan, diperlukan suatu model untuk melihat faktor-faktor yang mempengaruhi tingkat kesejahateraan rumah tangga dan bagaimana model ini dibangun agar ketepatan klasifikasi rumah tangga miskin dan tidak miskin berdasarkan faktor-faktor yang mempengaruhinya cukup tinggi, merupakan permasalahan yang akan dibahas dalam penelitian ini.
(18)
Kesejahteraan meliputi banyak aspek kehidupan. Untuk membatasi ruang lingkup penelitian dan menyederhanakan permasalahan maka kesejahteraan dalam penelitian ini difokuskan pada bidang kemiskinan dengan jumlah konsumsi/pengeluaran rumah tangga per bulan sebagai indikatornya.
1.4 Tinjauan Pustaka
Herlina Jusuf dalam tulisannya berjudul “pemodelan hibrid multivariate adaptive regression splines (MARS) arima untuk prediksi data series “ bahwa pada pemodelan MARS, pemilihan model digunakan metode stepwise. Forward stepwise dilakukan untuk mendapatkan fungsi dengan jumlah basis fungsi maksimum. Kriteria pemilihan basis fungsi pada forward adalah dengan meminimumkan Average Square Residual (ASR). Untuk memenuhi konsep parsemoni (model sederhana) dilakukan backward stepwise yaitu memilih basis fungsi yang dihasilkan dari forward stepwise dengan meminimumkan nilai Generalized Cross-Validation (GCV).
Sumarno dalam tulisannya yang berjudul “model klasifikasi menggunakan metode regresi logistik dan multivariate adaptive regression splines (MARS) pada kasus data survey biaya hidup kota Kediri bahwa dalam ketepatan klasifikasi, metode MARS memiliki ketepatan yang lebih baik jika dibandingkan dengan analisis regresi logistik sehingga untuk kasus mengklasifikasikan tempat berbelanja barang kebutuhan sandang rumah tangga di kota Kediri lebih tepat menggunakan metode MARS.
Een (2009) dalam tulisannya yang berjudul “klasifikasi kesejahteraan rumah tangga di Propinsi Jawa Tengah dengan pendekatan CART Arcing”, hasilnya merupakan gambaran karakteristik rumah tangga miskin di Jawa Tengah sebagai masukan perancanaan pembangunan daerah Jawa Tengah.
Kajian mengenai kesejahteraan telah banyak dilakukan antara lain pada tahun 1995 oleh Faturokhman dan Molo yang meneliti karakteristik rumah tangga miskin di Yogyakarta, Cahyat dkk (2007) mengkaji kemiskinan dan kesejahteraan rumah tangga dengan contoh dari Kutai Barat yang hasilnya merupakan sebuah
(19)
panduan pemantauan kemiskinan bagi pemerintah daerah, dan Suryadarma dkk (2005) mengkaji suatu obyektif kesejahteraan keluarga untuk penargetan kemiskinan dengan metode PCA (Principal Component Analysis)
1.5Tujuan Penelitian
Untuk membangun sebuah model guna melihat klasifikasi kesejahteraan rumah tangga di Medan berdasarkan faktor-faktor yang mempengaruhimya dengan menggunakan metode MARS dan menghitung ketepatan klasifikasi metode MARS dengan menggunakan bagging MARS.
1.6 Kontribusi Penelitian
Untuk memberikan informasi kepada pemerintah daerah Medan terkait kesejahteraan rumah tangga di Medan bedasarkan faktor-faktor yang mempengaruhinya, sehingga dapat dijadikan bahan pertimbangan pemerintah daerah setempat dalam mengambil kebijakan untuk menyusun perencanaan pembangunan yang lebih terarah pada peningkatan kesejahteraan masyarakat.
(20)
BAB 2
LANDASAN TEORI
2.1 Kesejahteraan
Kesejahteraan menurut Cahyat dkk (2007) merupakan kondisi dapat memenuhi kebutuhan dasar baik material maupun non-material yang mencakup aspek gizi dan kesehatan, pengetahuan, dan kekayaan materi. Kemiskinan sendiri merupakan bentuk ketidakmampuan untuk meraih kesejahteraan dipandang dari sisi ekonomi -dalam memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi pengeluaran. Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran perkapita perbulan dibawah garis kemiskinan (GK). Garis Kemiskinan merupakan Penjumlahan dari Garis Kemiskinan Makanan (GKM) dan Garis Kemiskinan Non Makanan (GKNM). Untuk tahun 2012, garis kemiskinan telah ditentukan oleh BPS yaitu Rp 286.649,00 (BPS, 2012). Penduduk yang memiliki rata-rata pengeluaran perkapita per bulan dibawah Garis Kemiskinan dikategorikan sebagai penduduk miskin.
Tingkat kesejahteraan masyarakat antara lain dapat diukur melalui besarnya pendapatan/pengeluaran. Pengeluaran untuk kebutuhan konsumsi dapat mencerminkan tingkat kemampuan ekonomi masyarakat, dan kemampuan daya beli masyarakat dapat memberikan gambaran tentang tingkat kesejahteraan masyarakat. Semakin tinggi daya beli masyarakat menunjukkan meningkatnya kemampuan dalam memenuhi kebutuhan hidupnya dan selanjutnya akan berdampak meningkatnya kesejahteraan masyarakat (BPS, 2012).
2.2 faktor-faktor yang Mempengaruhi Kesejahteraan
Dalam mengukur kesejahteraan rumah tangga diperlukan indikator moneter, indikator yang banyak digunakan adalah pendapatan dan pengeluaran (BPS, 2012, dan The World Bank, 2007). Indikator pengeluaran, dalam hal ini disebut juga konsumsi, dipilih karena sifatnya tetap dan relatif stabil terhadap berfluktuasinya
(21)
pendapatan dari tahun ke tahun. Suryadarma (2005) mengungkapkan variabel-variabel yang menjadi ciri kesejahteraan suatu keluarga antara lain: kepemilikan asset, kepemilikan binatang ternak, status perkawinan kepala rumah tangga, jenis kelamin kepala rumah tangga, tingkat pendidikan kepala rumah tangga dan pasangannya, anggota rumah tangga yang bekerja, sektor pekerjaan, akses terhadap rumah tangga, konsumsi makanan dan indikator kesehatan, indikator kesejahteraan lainnya serta partisipasi politik dan akses kepada informasi.
Jumlah anggota rumah tangga diduga mempunyai keterkaitan erat dengan kesejahteraan rumah tangga karena kemiskinan dihitung berdasarkan pengeluaran dan jumlah anggota rumah tangga. Makin besar jumlah anggota rumah tangga akan makin besar pula resiko untuk menjadi miskin apabila pendapatannya tidak meningkat (Faturochman dan Molo, 1995). Umur kepala rumah tangga juga berkaitan dengan kesejahteraan rumah tangga walaupun hubungannya tidak begitu jelas, akan tetapi ada kecenderungan bahwa kepala rumah tangga yang lebih sejahtera lebih tua dibandingkan kepala rumah tangga yang kurang sejahtera.
Jenis karakteristik lain adalah karakteristik jenis pekerjaan. Kemampuan mayoritas rumah tangga untuk keluar dari kemiskinan akan bergantung pada upah mereka dari pekerjaan yang dilakukan. Jadi penting untuk menguji hubungan antara kesejahteraan dengan jenis pekerjaan anggota rumah tangga yang berada dalam usia kerja.
2.3 Statistika Deskriptif
Statistika deskriptif merupakan metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna.
2.3Analisis Regresi
Istilah “regresi” pertama kali dikemukakan oleh Sir Francis Galton (1822-1911), seorang antropolog dan ahli meteorologi terkenal dari Inggris. Dalam makalahnya
(22)
dalam Journal of the Anthropological Institute, volume 15, halaman 246 sampai dengan 263, tahun 1885. Galton menjelaskan bahwa biji keturunan tidak cenderung menyerupai biji induknya dalam hal besarnya, namun lebih medioker (lebih mendekati rata-rata) lebih kecil daripada induknya
kalau induknya besar dan lebih besar daripada induknya kalau induknya sangat kecil (Draper dan Smith, 1972). Dalam analisis regresi, diperlukan suatu model yang digunakan untuk mengetahui hubungan antara variabel tidak bebas (respon) dengan satu atau lebih variabel bebas (prediktor) dan untuk melakukan peramalan terhadap variabel respon. Model regresi dapat diperoleh dengan melakukan estimasi terhadap parameter-parameternya menggunakan metode tertentu. Adapun metode yang dapat digunakan untuk mengestimasi parameter model regresi, khususnya parameter model regresi linier (sederhana dan berganda) adalah dengan metode kuadrat terkecil (least square) dan metode kemungkinan maksimum (maximum likelihood) (Kutner et.al, 2004).
2.4 Regresi Nonparametrik
Regresi nonparametrik merupakan suatu teknik analisis data dalam statistika yang dapat menjelaskan hubungan antara variabel predictor dengan variabel respon yang tidak diketahui bentuk fungsinya karena sebelumnya tidak ada informasi tentang bentuk fungsi tersebut dan hanya diasumsikan mulus (smooth) dalam arti termuat dalam suatu ruang fungsi tertentu sehingga regresi nonparametrik sangat mempertahankan fleksibilitasnya (Eubank, 1988). Secara umum bentuk model regresi nonparametrik dapat ditulis seperti pada persamaa (2.1) berikut ((Eubank 1988) dan (Wahba 1990)).
(2.1)
Dengan
= Variabel Respon
(23)
= Faktor gangguan yang tidak dapat dijelaskan oleh model yang disebut dengan error, yang diasumsikan sebagai variabel random dengan mean nol, variansi .
2.5 Regresi Spline
Regresi spline merupakan pendekatan regresi tersegmen dimana model regresi
terbentuk dengan terlebih dahulu membagi nilai-nilai peubah prediktor kedalam beberapa segmen dan model regresi yang berbeda dibentuk pada setiap segmen. Sifat tersegmen pada regresi spline memungkinkan model menyesuaikan diri
secara efektif terhadap karakteristik lokal dari data. Penggunaan spline difokuskan kepada adanya perilaku atau pola data, yang berbeda antara daerah tertentu dengan daerah yang lain (Friedman, 1991).
Nilai variabel prediktor yang menjadi batas antara segmen-segmen dinamakan knot. Knot merupakan nilai variabel prediktor ketika slope suatu garis
regresi mengalami perubahan nilai. Setiap garis regresi mendefinisikan satu segmen sehingga knot dapat didefinisikan sebagai akhir dari satu segmen
sekaligus merupakan awal dari segmen yang lain.
Bentuk model regresi spline berorde m adalah seperti pada persamaan (2) berikut (Eubank, 1988).
, (2.2) Untuk i = 1, 2, 3, …, n; j = 1, 2, 3, …, p dan k = 1, 2, 3, …,
(24)
dengan fungsi truncated adalah :
, , = Parameter model yang akan diestimasi, dan
= Intersep
= Slope pada variabel dengan orde ke-r
= Slope pada variabel truncated knot ke-k pada spline berorde m = Variabel prediktor ke-j
= Knot ke-k pada variabel
j = 1, 2, …, p dan k = 1, 2, …,
= Banyaknya knot dalam variabel prediktor ke-j
Jika j = 1, maka dari persamaan (2.2) diperoleh bentuk umum model regresi spline berorde m untuk satu variabel prediktor, yaitu seperti pada persamaan (2.3) berikut (Eubank 1988).
(2.3)
2.6 Suatu Fungsi Basis (Basis Function)
Satu fungsi basis adalah selang antar knot yang berurutan. Fungsi basis adalah kumpulan dari fungsi yang digunakan untuk mewakili informasi untuk menjelaskan hubungan antara variabel respon dan variabel prediktor. Fungsi basis ini bisa saja
(25)
terdiri dari satu atau lebih variabel. Pada umumnya fungsi basis yang dipilih berbentuk polinomial dengan derivatif yang kontinu pada setiap knot.
Fungsi basis dapat digambarkan sebagai fungsi truncated seperti berikut :
Dimana tk adalah letak titik knot, dan x adalah variabel prediktor. Sedangkan l
adalah derajat spline. Pada data yang bersifat kategorik, knotnya terletak pada
nilai kategorinya tersebut. Fungsi basisnya dapat dinyatakan sebagai berikut : BF =
2.7 Recursive Partitioning (RP)
Recursive partitioning merupakan pendugaan fungsi dengan cara melakukan
pemilahan iteratif pada daerah asal D menjadi himpunan bagian yang saling lepas. Dari persamaan :
,
misalkan terdapat n contoh dari y dan
x = (
dinotasikan dengan . Dengan daerah asal (domain) dari
persamaan diatas diambil dimana merupakan subregion (himpunan
(26)
Penduga fungsi f(x) dengan pendekatan Recursive partitioning adalah
(2.4) dengan :
= koefisien dalam subregion, = fungsi dari .
menunjukkan fungsi indikator yang mempunyai nilai 1(satu) jika pernyataan benar dan 0 (nol) jika pernyataan salah. Penentuan nilai setiap subregion
berdasarkan pada model terbaik bagi data, dimana nilai dipilih yang memberikan jumlah kuadrat sisaan terkecil (Friedman, 1991).
Recursive partitioning merupakan metode yang menjanjikan, tetapi secara
umum Recursive partitioning memiliki kekurangan dalam pemodelan regresi,
diantaranya (Friedman, 1991):
a. Model Recursive partitioning menghasilkan subregion yang saling lepas
dan diskontinu pada batas subregion.
b. Recursive partitioning tidak cukup mampu dalam menduga fungsi f(x)
linier atau aditif.
c. Sulit untuk menginterpretasikan model Recursive partitioning jika peubah prediktornya banyak.
2.8 Multivariate Adaptive Regression Spline (MARS)
Beberapa modifikasi dilakukan Friedman untuk mengatasi kelemahan metode Recursive partitioning. Untuk mengatasi kelemahan Recurrsive Partitionin dalam
(27)
mengidentifikasi fungsi linier dan aditif, Friedman mengusulkan untuk tidak menghapus fungsi basis awal atau induk (parent) selama pemilihan subregion
berlangsung. Jadi pada iterasi berikutnya parent dan pilahan subregion dapat
dipilah lebih lanjut, sehingga diperoleh subregion yang saling tumpah tindih.
Dengan modifikasi ini, recursive partitioning dapat menghasilkan model linier
dengan pemilihan berulang pada peubah prediktor yang berbeda. Disamping itu dihasilkan pula model yang lebih fleksibel. Untuk mengatasi adanya diskontinu pada titik knot yang disebabkan perkalian fungsi peubah tunggal H[η], Friedman mengusulkan untuk mengganti H[η] dengan regresi linier splines berordo satu dengan sisi kiri (-) dan sisi kanan (+) (Friedman, 1991).
2.8.1 Metode MARS
Fungsi basis dalam MARS dapat dinyatakan dengan
, (2.5)
dengan m jumlah pilahan himpunan bagian ke-m dari domain D, knot dari
peubah prediktor dan nilainya +1 jika knotnya terletak dikanan
subregion dan -1 jika terletak dikiri subregion.
Setelah modifikasi Friedman , model MARS menjadi :
, (2.6)
dengan :
= konstanta regresi dari fungsi basis
(28)
M = maksimum fungsi basis (nonconstant fungsi basis),
km = derajat interaksi,
Skm = ,
xv(k,m) = variabel prediktor ke-v, pilahan ke-k dan subregion ke –m
tkm = nilai knots dari variabel prediktor xv(k,m).
Model MARS juga dapat ditulis dalam bentuk sebagai berikut :
(2.7)
dengan :
= konstanta regresi dari fungsi basis
= koefisien dari fungsi basis ke-m, m= 1,…,M Bm = fungsi basis (basis function) ke-m, m= 1,…,M.
2.8.2 Algoritma MARS
Pembentukan model MARS (Multivariate Adaptive Regression Spline) diawali menentukan knot dan fungsi basis setiap variabel prediktor dengan cara mem-plot setiap variabel prediktor dengan variabel respon. Jumlah knot yang optimum akan menghasilkan model MARS yang baik sehingga kemudian dilakukan tahap maju (forward) dan tahap mundur (backward) algoritma recursive partitioning yang
dimodifikasi, dimana jumlah knot yang optimum disesuaikan dengan perilaku
data. Gambaran secara umum algoritma MARS adalah sebagai berikut (Friedman, 1991):
(29)
Pada tahap ini dimungkinkan untuk memasukkan fungsi basis baru ke dalam model. Maksimal fungsi basis yang akan masuk di dalam model ditentukan oleh peneliti. Berikut adalah langkah yang dilakukan dalam forward stepwise :
a. Misalkan B0 = 1 sebagai fungsi basis awal.
b. Tentukan pasangan fungsi basis dan yang
merupakan kombinasi prediktor xi dan knot sehingga model
memiliki jumlah kuadrat sisaan minimum. , dan .
Misalkan Bm adalah salah satu fungsi basis yang sudah ada didalam model
sebelumnya. Jika m fungsi basis telah dimasukkan, tentukan perkalian dari Bm
dengan atau sehingga jika Bm dan Bm
ditambahkan ke dalam model maka akan dihasilkan model dengan jumlah kuadrat sisaan terkecil.
c. Ulangi langkah (c) sehingga banyaknya fungsi basis dalam model lebih atau sama dengan maksimum banyaknya fungsi basis yang telah ditetapkan.
2. Backward stepwise
Prosedur forward seperti yang dijelaskan sebelumnya akan menghasilkan model dengan fungsi basis dengan jumlah yang sangat banyak. Dalam prakteknya, biasanya maksimum banyaknya fungsi basis yang akan digunakan dalam model dibatasi. Demikian juga dengan derajat interaksi, yang seringkali hanya dibatasi hanya sampai derajat tiga. Dengan pembatasan tersebut, prosedur forward tersebut tetap memberikan model dengan fungsi basis yang sangat banyak. Terkait dengan model yang kompleks ini, harus dilakukan penghapusan beberapa fungsi
(30)
basis, sehingga dapat dihasilkan model yang lebih sederhana. Prosedur backward
dilakukan untuk tujuan ini.
Prosedur backward dilakukan dengan tahap-tahap berikut:
a. Mulai dari model yang diperoleh pada tahap prosedur forward yang memiliki m fungsi basis.
b. Hapus salah satu fungsi basis tidak konstan yang memiliki kontribusi terkecil. Berdasarkan kriteria kuadrat terkecil, fungsi basis yang memiliki kontribusi terkecil adalah fungsi basis yang jika dihilangkan dari model sebelumnya akan menyebabkan terjadinya penurunan jumlah kuadrat sisaan terkecil.
c. Ulangi langkah (b), sampai model hanya mengandung fungsi basis konstan.
Prosedur backward ini menghasilkan sekuens model yang tersarang, fm
(m=1,2,…). Model terbaik ditentukan berdasarkan kriteria Generalized Cross Validation (GCV) yang diperkenalkan oleh Wahba pada tahun 1979. Fungsi GCV
didefinisikan sebagai berikut :
(2.8)
dengan :
M = jumlahfungsi basis
= variabel prediktor = variabel respon
(31)
Trace +1
2.8.3 Uji Signifikansi Basis Fungsi Model MARS
Pada model MARS dilakukan uji signifikansi Basis Fungsi yang meliputi uji secara bersamaan dan uji individu. Uji signifikansi yang dilakukan secara bersamaan terhadap basis fungsi-basis fungsi yang terdapat dalam model MARS ini bertujuan untuk mengetahui apakah secara umum model MARS terpilih merupakan model yang sesuai dan menunjukkan hubungan yang tepat antara variabel prediktor dengan variabel respon. Hipotesis yang digunakan adalah :
Statistik uji yang digunakan pada pengujian ini adalah statistik uji F yang diperoleh dari
Nilai Fhitung ini kemudian dibandingkan dengan yaitu nilai F dengan tingkat signifikansi α serta v1 = k dan v2 = dengan n adalah banyaknya
(32)
Jika Fhitung > Fα (v1,v2) maka H0 ditolak, artinya paling sedikit ada satu αj yang
tidak sama dengan nol.
Bila pada pengujian secara bersamaan disimpulkan untuk tolak H0,
selanjutnya akan dilakukan pengujian untuk masing-masing basis fungsi yang bertujuan untuk mengetahui apakah basis fungsi yang terbentuk mempunyai pengaruh signifikan terhadap model, selain itu ingin diketahui pula apakah model yang memuat parameter tersebut telah mampu menggambarkan keadaan data yang sebenarnya. Hipotesisnya adalah sebagai berikut :
: Tidak ada hubungan antara variabel Y dan variabel X : Ada hubungan antara variabel Y dan Variabel X
Nilai statistik hitung diperoleh dari
,
dengan merupakan standar error yang diperoleh dari
Nilai
ini
dibandingkan dengan nilai tabel distribusi t dengan derajat bebas dan tingkat signifikansi α. Jika daerah kritis|thitung| > t(α/2,v), maka H0 ditolak, artinya ada pengaruh variabel prediktor pada fungsi basis
tersebut terhadap variabel respon.
(33)
APER adalah ukuran evaluasi yang digunakan untuk melihat peluang kesalahan klasifikasi yang dihasilkan oleh suatu fungsi klasifikasi. Nilai APER ini menunjukkan proporsi observasi yang salah diklasifikasikan oleh fungsi klasifikasi. Dalam penelitian kali ini digunakan respon biner sehingga penentuan kesalahan klasifikasi dapat dihitung dari tabel Klasifikasi berikut :
Tabel 2.1Klasifikasi APER
kelas actual
kelas prediksi
kelas 1 kelas 2
kelas 1 n11 n12
kelas 2 n21 n22
Keterangan :
n11 = Jumlah kelas aktual 1 yang tepat diklasifikasikan sebagai kelompok 1.
n12 = Jumlah kelas aktual 1 yang salah diklasifikasikan sebagai kelompok 2.
n21 = Jumlah kelas aktual 2 yang salah diklasifikasikan sebagai kelompok 1 .
n22 = Jumlah kelas aktual 2 yang tepat diklasifikasikan sebagai kelompok 2.
Nilai APER dihitung sebagai berikut ,
(2.10)
2.9 Bootstrap Agregating (Bagging)
Metode bagging pertama kali digunakan oleh Breiman (1994) sebagai alat untuk membentuk pengklasifikasi yang lebih stabil. Bagging predictor adalah metode
untuk membangkitkan multiple version dari prediktor dan menggunakannya untuk agregate prediktor. Multiple versions dibentuk dengan replikasi bootstrap dari
(34)
perubahan yang signifikan sehingga bagging dapat meningkatkan akurasi. Ide
dasar dari bagging adalah menggunakan bootstrap resampling untuk
membangkitkan prediktor dengan banyak versi, dimana ketika dikombinasikan memberikan hasil yang lebih baik dibandingkan dengan prediktor tunggal yang dibangun untuk menyelesaikan masalah yang sama.
Misalkan sebuah data set £ terdiri dari . Dari data set tersebut, dilakukan pengambilan sampel berukuran n dengan pengembalian
sehingga didapatkan . Pengembalian sampel semacam ini dilakukan sebanyak B kali, sehingga didapatkan .
Penentuan besarnya jumlah replikasi B sangat variatif karena besar kecilnya B dapat memberikan hasil yang berbeda pada setiap tahapan analisis. Sutton (2005) merekomendasikan replikasi sebanyak 25 atau 50 kali. Sementara itu, Efron dan Tibshirani (1993) merekomendasikan nilai B yang kecil, misalnya 25 kali.
Algoritma bagging untuk MARS adalah sebagai berikut:
1. Mengambil sampel bootstrap sebanyak n dari data set£ dengan
pengulangan sebanyak n.
2. Memodelkan MARS dari data set hasil sampel bootstrap .
3. Mendapatkan nilai ketepatan klasifikasi pada setiap pengambilan sampel B replikasi bootstrap. Kesalahan klasifikasi pada langkah ini disebut . 4. Ulangi langkah (1-3) sebanyak B kali (replikasi bootstrap).
(35)
5. Mendapatkan ketepatan klasifikasi bagging dari rata-rata ketepatan
klasifikasi pada setiap pengambilan sampel B. sehingga kesalahan
(36)
BAB 3
METODOLOGI PENELITIAN
3.1 Merumuskan Masalah
Langkah awal pada penelitian ini adalah merumuskan masalah. Masalah yang dirumuskan berdasarkan pendahuluan yaitu bagaimanakah pola hubungan kesejahteraan rumah tangga di kota Medan dengan faktor-faktor yang mempengaruhinya berdasarkan pendekatan MARS dan bagaimana ketepatan klasifikasi kesejahteraan rumah tangga di kota Medan dengan pendekatan bagging MARS.
3.2 Studi Literatur
Studi literatur dilakukan dengan mengidentifikasi permasalahan, mengkaji dan menganalisis metode Multivariate Adaptive Regression Splines (MARS) dan Boostrap Resampling (Bagging). Penelusuran referensi ini bersumber dari buku, jurnal maupun penelitian yang telah ada sebelumnya mengenai hal-hal yang berhubungan dengan metode yang dipakai.
3.3 Pengamatan dan Pengumpulan Data
1. Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder, diambil dari hasil Survey Sosial Ekonomi Nasional (SUSENAS-2012) kota Medan.
2. Variabel Penelitian
Variabel respon y dan variabel prediktor x yang digunakan dalam
(37)
Tabel 3.1 Variabel Penelitian
Variabel Definisi
Operasional Kategori
Skala Y Kelompok rumah tangga Bedasarkan pengeluaran perkapita yang sudah dikonversikan bedasarkan garis kemiskinan
1. Rumah tangga miskin
2. Rumah tangga tidak miskin
Nominal x1 Jenis kelamin kepala rumah tangga 1. Laki-laki
2. perempuan Nominal
x2 Umur kepala rumah tangga, dihitung bedasarkan ulang tahun terakhir Rasio x3 Status perkawinan kepala rumah tangga 1. Kawin 2. Lainnya Nominal x4 Ijazah tertinggi kepala rumah tangga
1. Tidak mempunyai ijazah
2. Tamat SD/sederajat
3. Tamat SLTP/sederajat
4. Tamat SMA/sederajat
5. Tamat diatas SMA
Nominal x5 Kegiatan utama kepala rumah tangga 1. Bekerja
2. Pengangguran Nominal
x6 Lapangan usaha utama kepala rumah 1. Agriculture 2. Manufactur 3. Service Nominal
(38)
tangga x7 Status pekerjaan utama kepala rumah tangga
1. Berusaha Sendiri
2. Berusaha dibantu buruh
tidak tetap/buruh tidak bayar
3. Berusaha dibantu buruh
tetap/buruh dibayar
4. Buruh/karyawan/pegawai
5. Pekerja bebas
6. Pekerja keluarga/tidak
dibayar Nominal x8 Jumlah anggota rumah tangga Rasio X9 Sumber air minum
1. Air kemasan bermerek
2. Ledeng
3. Pompa
4. Sumur Terlindungi
5. Sumur tidak terlindungi
6. Mata air tidak
terlindungi
7. Mata air terlindungi
8. Air sungai/hujan
Nominal
6.4 Membuat Landasan Teori
Setelah mendapatkan data yang dimaksud, selanjutnya dilakukan pembahasan secara teoritis mengenai metode yang digunakan dalam penelitian berdasarkan hasil studi literatur. Hal ini dilakukan untuk mengetahui bagaimana metode yang digunakan dalam kajian teorinya sebelum digunakan dalam penelitian. Pembahasan ini terdapat dalam landasan teori.
6.5 Analisis Data dengan Multivariate Adaptive Regression
Splines (MARS)
(39)
1. Mengkombinasikan besarnya basis function (BF), Maximum Interaction (MI) dan Minimum observation (MO) pada data yang digunakan dengan cara :
Menentukan kemungkinan maksimum banyaknya basis function (BF) yaitu 2-4 kali jumlah prediktor yang akan digunakan. Kemungkinan maksimum banyaknya basis function pada penelitian ini adalah 18, 27, 36.
Menentukan jumlah maksimum interaksi (MI), yaitu 1,2 dan 3.
Menentukan minimal jumlah pengamatan setiap knots (MO), yaitu 0,1,2, dan 3.
vbcv
2. Menetapkan model terbaik dengan didasarkan pada nilai GCV minimum yang diperoleh dengan mengkombinasikan maksimum BF, MI dan MO.
3. Menduga koefisien model menggunakan metode kuadrat terkecil 4. Melakukan uji signifikansi basis function model MARS.
5. Mengelompokkan basis function bedasarkan variabel prediktor yang masuk dalam model
6. Menginterpretasikan tingkat kontribusi dan pengurangan GCV variabel yang mempunyai kepentingan dalam pengelompokkan variabel respon.
3.6 Analisis Data dengan Bootsrap Resampling (Bagging)
1. Melakukan bagging dari pasangan variabel respon dan variabel
prediktor yang signifikan dari model MARS terbaik untuk data set awal dengan lima belas, dua puluh, 25, dan tiga puluh
replikasi bootstrap.
2. Melakukan pemodelan MARS pada setiap pengambilan sampel B
replikasi bootstrap dengan jumlah BF, MI dan MO di antara knot
sama dengan jumlah BF, MI dan MO di antara knot pada model MARS terbaik untuk dataset tunggal.
3. Mendapatkan nilai tingkat misklasifikasi pada setiap
pengambilan sampel B replikasi bootstrap.
4. Mendapatkan nilai tingkat misklasifikasi bagging dari
(40)
5. Menguji keakurasian prediksi model MARS ketepatan klasikasi yang terbentuk dari data dengan menggunakan APER serta menghitung kestabilan klasikasi dengan statistik uji Press's Q.
Pengolahan data pada penelitian ini menggunakan software Salford Predictive Minerv.6.6, SPSS 16, dan Microsoft Excel 2007
(41)
BAB 4
PEMBAHASAN
4.1 Deskripsi Karakteristrik Kesejahteraan Rumah Tangga di Kota Medan
Deskripsi karakteristik kesejahteraan rumah tangga dalam penelitian ini ditinjau dari beberapa aspek yang mewakilkan kesembilan faktor-faktor yang digunakan dalam penelitian ini sebagai ciri kesejahteraan rumah tangga. Beberapa aspek tersebut antara lain adalah aspek kependudukan, pendidikan, perumahan. Untuk mendeskripsikan karakteristik kesejahteraan rumah tangga tersebut peneliti menggunakan alat bantu software yaitu software SPSS 17.0
Gambar 4.1 Distribusi Pengeluaran Perkapita Rumah Tangga Perbulan
Ditinjau dari pengeluaran perkapita per bulan rumah tangga untuk konsumsi sebagai landasan awal dalam klasifikasi kesejahteraan rumah tangga di kota Medan, dapat digolongkan sebagai rumah tangga miskin dan tidak miskin. Pengelompokkan dilakukan berdasarkan garis kemiskinan Rp. 286.649,00. Pada
(42)
gambar 4.1 dapat dilihat distribusi pengeluaran perkapita rumah tangga perbulan, dengan karakteristik pengeluaran perkapita sebagai berikut.
Tabel 4.1 Statistik deskriptif pengeluaran perkapita rumah tangga perbulan
Dari Tabel 4.1 dapat diketahui bahwa jenjang pengeluaran perkapita rumah tangga perbulan adalah dari Rp 170.338,10 hingga Rp 13.096.104,76. Rata-rata mean sebesar Rp 1.011.229,71 dan rata-rata median Rp 718.721,32 dengan deviasi standar 980.817,01.
Untuk tahun 2012, yaitu tahun pengambilan data yang digunakan pada penelitian ini, BPS menetapkan angka Rp 286.649,00 sebagai garis kemiskinan, bila pengeluaran perkapita perbulan suatu rumah tangga berada di bawah garis kemiskinan, maka rumah tangga tersebut digolongkan sebagai rumah tangga miskin, berlaku sebaliknya pula. Sehingga rumah tangga di Medan dapat dikelompokkan sebagai berikut.
Tabel 4.2 Jumlah sampel dan proporsi kelompok Rumah tangga miskin dan rumah tangga tidak miskin
Kelompok Rumah Tangga n P%
Miskin 34 3,77
Tidak Miskin 895 96,34
Total 929 100
Tabel 4.2 memberikan informasi mengenai proporsi rumah tangga miskin dan rumah tangga tidak miskin, yaitu bahwa 3,77% dari total rumah tangga di Medan termasuk dalam golongan miskin, dalam kata lain, pengeluaran perkapita per
Pengeluaran Per Kapita
N 929
Minimum Rp. 170.338,10
Maksimum Rp. 13.096.104,76
Mean Rp. 1.011.229,71
Std. Deviation Rp. 980.817,01
(43)
bulan keluarga tersebut berada di bawah garis kemiskinan. sedangkan 906,34% sisanya termasuk dalam golongan tidak miskin.
4.1.1 Kependudukan
Dalam aspek kependudukan, jumlah anggota rumah tangga dan umur kepala rumah tangga dapat dijadikan sebagai peninjau kesejahteraan rumah tangga (Faturochman dan Molo, 1995). Tabel 4.3 menunjukkan bahwa rata-rata rumah tangga miskin di Medan memiliki anggota rumah tangga sebanyak 6,47≈6 orang. Sementara itu rata-rata jumlah anggota rumah tangga tidak miskin sebesar 4,14≈4 orang. Hal ini menunjukkan bahwa rata-rata jumlah anggota rumah tangga miskin lebih tinggi dibandingkan dengan rumah tangga tidak miskin. Informasi ini dikuatkan dengan uji rata-rata dua populasi, dimana disimpulkan bahwa jumlah anggota rumah tangga antar dua kelompok signifikan berbeda pada α = 5 %. Standar deviasi pada kedua kelompok rumah tangga mengindikasikan bahwa sebaran data tidak terlalu besar.
Berdasarkan Tabel 4.3 juga diperoleh informasi bahwa rata-rata usia kepala rumah tangga miskin adalah 47,41 tahun, sedangkan rumah tangga tidak miskin yang memiliki rata-rata usia kepala rumah tangga 48,78 tahun. Hasil uji rata-rata dua populasi juga menunjukkan bahwa rata-rata usia kepala rumah
tangga miskin dan tidak miskin signifikan berbeda pada α = 5%. Tabel 4.3 Deskripsi Karakteristik Sosial Demografi Rumah Tangga di Medan tahun 2012
Variabel Sosial Demografi
Miskin Tidak miskin Mean Stdev Mean Stdev
Jumlah Anggota Rumah Tangga*
6,47 2,22 4,14 1,64
(44)
Tangga*
Keterangan : *Signifikan berbeda pada taraf α = 5%
Sumber : Data Susenas tahun 2012,diolah peneliti
Selain jumlah anggota rumah tangga dan umur kepala rumah tangga, jenis kelamin dan status perkawinan kepala rumah tangga juga dijadikan ciri kesejahteraan suatu keluarga. Dapat dilihat pada tabel 4.4
Tabel 4.4 Deskripsi Karakteristik Sosial Demografi Kepala Rumah Tangga di Medan tahun 2012
Variabel Sosial Demografi Proporsi (%)
Miskin Tidak Miskin
Jenis Kelamin Kepala Rumah Tangga
Laki-laki 82,4 82,5
Perempuan 17,6 17,5
Status Perkawinan Kepala Rumah Tangga
Kawin 79,4 78,5
Lainnya 20,6 21,5
Sumber : Data sekunder Susenas 2012, diolah peneliti
Pada tabel 4.4 persentase jenis kelamin kepala rumah tangga miskin yang laki-laki lebih tinggi dari perempuan begitu juga dengan rumah tangga tidak miskin Sementara itu, persentase kepala rumah tangga dengan status kawin lebih banyak ditemukan pada kelompok rumah tangga miskin. Informasi ini menunjukkan bahwa terdapat perbedaan antara kelompok rumah tangga miskin dan tidak miskin dalam hal jenis kelamin dan status perkawinan kepala rumah tangga.
4.1.2 Pendidikan
Salah satu ukuran untuk meninjau kesejahteraan rumah tangga dari aspek pendidikan adalah tingkat pendidikan tertinggi yang ditamatkan (ijazah tertinggi yang dimiliki) kepala rumah tangga (Suryadarma, 2005). Pendidikan tertinggi
(45)
yang ditamatkan merupakan indikator pokok kualitas SDM, semakin tinggi ijazah yang dimiliki oleh rata-rata penduduk suatu daerah mencerminkan tingkat intelektual penduduk daerah tersebut (BPS, 2012).
Tabel 4.5 menunjukkan deskripsi karakteristik pendidikan kepala rumah tangga di Medan tahun 2012. Dalam penelitian ini aspek pendidikan diwakili oleh ijazah terakhir kepala rumah tangga.
Tabel 4.5 Deskripsi Karakteristik Pendidikan Kepala Rumah Tangga di Medan tahun 2012
Kategori pendidikan Miskin Tidak Miskin Total
n P(%)* N P(%)*
1 3 5,8 49 94,2 52
2 17 11,5 131 88,5 148
3 6 3,3 174 96,7 180
4 6 1,5 401 98,5 407
5 2 1,4 140 98,6 142
Total 34 100 895 100 929
Keterangan :
* persen baris = n/(nmiskin+ntidak miskin) 1 : tidak punya ijazah
2 : SD.sederajat 3 : SMP/Sederajat 4 : SMA/Sederajat 5 : di atas SMA
Sumber : Data sekunder Susenas 2012, diolah peneliti
Untuk memperjelas interpretasi, proporsi baris divisualisasikan dalam diagram batang pada Gambar 4.2. Dari gambar tampak bahwa terbentuk pola meningkat dari batang-batang tingkat pendidikan rumah tangga tidak miskin, mulai dari kategori tidak pernah sekolah hingga kategori tamat di atas SLTA. Artinya,
(46)
kontribusi pada kelompok rumah tangga tidak miskin, peluang kepala rumah tangga menamatkan pendidikan setinggi mungkin semakin besar.
Gambar 4.2 Tingkat pendidikan tertinggi yang ditamatkan kepala rumah tangga miskin dan tidak miskin
Sebaliknya terjadi pada kelompok rumah tangga miskin, yaitu terbentuk pola menurun pada batang-batang tingkat pendidikan kepala rumah tangga, mulai dari kategori tidak pernah sekolah hingga kategori tamat di atas SLTA. Dengan penjelasan lain, pada kelompok rumah tangga miskin, peluang kepala rumah tangga menamatkan pendidikan setinggi mungkin semakin kecil.
4.1.3 Ketenagakerjaan
Tabel 4.6 Deskripsi Karakteristik Ketenagakerjaan Kepala Rumah Tangga
Karakteristik Miskin Tidak Miskin Total
N P(%)* N P(%0*
(47)
- Bekerja 27 3,7 699 96,3 726 - Pengangguran 7 3,4 196 96,6 203
Total 34 895 929
Lapangan Usaha Utama
- Agriculture 4 7,7 48 92,3 52 - Manufactur 13 3,8 326 96,2 339 - Service 17 3,2 561 96,8 578
Total 34 895 729
Status Pekerjaan Utama*
1 10 4,8 198 95,2 208
2 1 2,4 40 97,6 41
3 - - 60 100 60
4 10 2,7 367 97,3 377
5 13 5,4 228 94,6 241
6 - - 2 100 2
Total 34 895 929
*keterangan :
1 = Berusaha sendiri
2 = Berusaha dibantu buruh tidak tetap/buruh tidak dibayar 3 = Berusaha dibantu buruh tetap/buruh dibayar
4 = Buruh/karyawan/pegawai 5 = Pekerja bebas
6 = Pekerja keluarga
Proporsi baris pada kategori kegiatan utama divisualisasikan dengan diagram batang pada Gambar 4.3, sehingga tampak perbedaan pola batang antara kelompok rumah tangga miskin dan tidak miskin.
(48)
Gambar 4.3 Kegiatan utama kepala rumah tangga
Dapat dilihat kembali pada gambar 4.3 bahwa persentase kepala rumah tangga miskin yang bekerja lebih besar daripada yang pengangguran, dan kepala rumah tangga tidak miskin yang bekerja lebih besar daripada yang tidak bekerja. Sehingga dapat dikatakan bahwa peluang kepala rumah tangga miskin memiliki kegiatan utama bekerja lebih besar daripada tidak bekerja, dan peluang kepala rumah tangga tidak miskin memiliki kegiatan utama bekerja juga lebih besar daripada tidak bekerja.
Selanjutnya dapat diketahui lapangan pekerjaan utama dari kepala rumah tangga. Tabel 4.6 menunjukkan perbedaan lapangan usaha utama kepala rumah tangga antara rumah tangga miskin dan tidak miskin.
Perbedaan karakteristik antar kelompok rumah tangga dapat divisualisasi berdasarkan proporsi setiap kategori lapangan usaha utama kepala rumah tangga. Untuk mempermudah penjelasan, proporsi baris setiap kategori divisualisasikan pada Gambar 4.4
(49)
Gambar 4.4 Lapangan usaha utama kepala rumah tangga miskin dan tidak miskin
Dapat dilihat kembali pada gambar 4.4 bahwa persentase sektor service (Angkutan , perdagangan, keuangan, dan jasa) mendominasi pada kelompok rumah tangga miskin dan tidak miskin di kota Medan
(50)
Gambar 4.5 Status pekerjaan kepala rumah tangga miskin dan tidak miskin
Dapat dilihat pada gambar 4.5 status pekerjaan kelompok rumah tangga miskin yaitu sebagai pekerja bebas dan status pekerjaan kelompok rumah tangga tidak miskiin yaitu sebagai buruh/karyawan/pegawai.
4.1.3 Perumahan
Beberapa karakteristik rumah tangga berdasarkan aspek perumahan dideskripsikan dalam beberapa sub aspek, pada penelitian ini diambil hanya pada aspek fasilitas disajikan pada tabel berikut.
Tabel 4.7 Deskripsi karakteristik perumahan rumah tangga
Karakteristik Miskin Tidak Miskin Total
N P(%)* N P(%0*
(51)
- Air Kemasan 9 1,9 466 98,1 475 - Pompa 0 - 17 100 17 - Leding 17 4,4 369 95,6 386 - Sumur Terlindung 5 11,9 37 88,1 42 - Sumur Tidak
Terlindung
2 25,0 6 75,0 8
- Air sungai/Hujan 1 100 0 - 1
Total 34 100 895 100 929
Pada tabel 4.7 menunjukkan bahwa karakteristik rumah tangga miskin di Medan pada aspek sumber air minum menggunakan leding, dan karakteristik rumah tangga tidak miskin menggunakan air kemasan bermerek. Untuk melihat bagaimana visualisasi sumber air minum rumah tangga di medan telah disajikan pada gambar 4.6.
(52)
4.2 Pengaruh dan Pola Hubungan sebagai Fungsi Faktor-Faktor Yang Mempengaruhi Kesejahteraan Rumah Tangga terhadap Kesejahteraan Rumah Tangga di Medan
Untuk mengidentifikasi faktor-faktor mana saja yang mempengaruhi kesejahteraan rumah tangga di Medan, perlu dilakukan klasifikasi berdasarkan faktor-faktor yang diduga, yang mana variabel-variabel yang berkontribusi secara signifikan terhadap model tersebutlah yang didefinisikan sebagai faktor-faktor yang berpengaruh terhadap kesejahteraan rumah tangga di Medan nantinya. Pada penelitian ini, klasifikasi dilakukan dengan pendekatan MARS.
4.2.1 Model Kesejahteraan Rumah Tangga Menggunakan MARS
Pembentukan model MARS dilakukan dengan trial and error, dengan mengombinasikan beberapa kriteria model MARS, yaitu basis function (BF), maximum interaction (MI), dan minimum observation (MO), sampai diperoleh model terbaik dengan GCV minimum. Banyaknya BF yang akan digunakan dalam model MARS adalah 18, 27 dan 34 yaitu dua hingga empat kali banyak variabel prediktor dengan MI yang bernilai 1, 2 dan 3, dan MO yang bernilai 0, 1, 2 dan 3. MI dibatasi sampai 3 dengan asumsi jika > 3 akan menghasilkan model yang lebih kompleks, selain itu untuk menjaga keberartian dan kemudahan dalam menginterpretasikan model namun keakuratan hampir sama. Minimum observasi dibatasi sampai 3 karena minimum observasi yang semakin besar akan mengurangi fleksibelitas model. Dengan demikian dapat disimpulkan bahwa akan dilakukan pengkombinasian antara BF, MI dan MO adalah sebanyak 3 x 3 x 4 = 36 kali untuk mengetahui nilai GCV pada tiap kombinasinya.
Maka diperoleh hasil kombinasi dengan GCV minimum, yaitu sebagai berikut :
(53)
NO BF MI MO GCV R2 MSE NO BF MI MO GCV R2 MSE
1 18 1 0 0.03087 0.12624 0.02933 19 27 2 2 0.02549 0.27856 0.02329
2 18 1 1 0.03007 0.14895 0.02833 20 27 2 3 0.02553 0.27759 0.02305
3 18 1 2 0.03007 0.14895 0.02833 21 27 3 0 0.02517 0.28780 0.02299
4 18 1 3 0.03007 0.14895 0.14895 22 27 3 1 0.02433 0.31137 0.02183
5 18 2 0 0.02635 0.25422 0.02466 23 27 3 2 0.02382 0.32595 0.02215
6 18 2 1 0.02586 0.26816 0.02420 24 27 3 3 0.02482 0.29747 0.02251
7 18 2 2 0.02586 0.26816 0.02420 25 36 1 0 0.03093 0.12465 0.02915
8 18 2 3 0.02586 0.26816 0.02420 26 36 1 1 0.03005 0.14968 0.02785
9 18 3 0 0.02650 0.25013 0.02462 27 36 1 2 0.03005 0.14968 0.02785
10 18 3 1 0.02575 0.27132 0.02402 28 36 1 3 0.03036 0.14090 0.02796
11 18 3 2 0.02573 0.27132 0.02402 29 36 2 0 0.02547 0.27909 0.02266
12 18 3 3 0.02597 0.26490 0.26490 30 36 2 1 0.02541 0.28095 0.02260
13 27 1 0 0.03092 0.12499 0.02916 31 36 2 2 0.02523 0.28606 0.02244
14 27 1 1 0.03017 0.14612 0.02835 32 36 2 3 0.02517 0.28765 0.02239
15 27 1 2 0.03017 0.14612 0.02835 33 36 3 0 0.02475 0.29968 0.02224
16 27 1 3 0.03017 0.14612 0.02835 34 36* 3 1 0.02244 0.36484 0.01981
17 27 2 0 0.02561 0.27524 0.02331 35 36 3 2 0.02339 0.33807 0.02046
18 27 2 1 0.02549 0.27856 0.02329 36 36 3 3 0.02315 0.34491 0.02004
*) model terbaik
36 model pada Tabel 4.9 adalah kombinasi BF, MI, dan MO yang dilakukan dengan trial and error. Cara menentukan model terbaik adalah dengan mempertimbangkan GCV terkecil, bila bernilai sama, pertimbangan selanjutnya adalah memilih model dengan R2 terbesar, bila ternyata beberapa model tersebut
memiliki R2 yang sama, pertimbangan beralih kepada ketepatan klasifikasi (total corect) terbesar, bila masih belum dapat dipilih, pertimbangan beralih kepada
kombinasi BF/MI/MO terkecil. Model nomor 34 adalah model yang memiliki
(54)
Model MARS terbaik untuk memodelkan faktor-faktor yang mempengaruhi kesejahteraan rumah tangga di Medan dituliskan pada persamaan berikut:
Y = 0.985102 - 0.122221 * BF1 - 0.0185969 * BF3 - 0.0145971 * BF4 - 1.92828 * BF9 + 1.04909 * BF11 + 0.553926 * BF14 + 0.631825 * BF15 - 0.11567 * BF17 + 0.0605489 * BF20 - 0.0739558 * BF21 + 0.0193749 * BF23 + 0.178735 * BF25 + 0.102578 * BF27 + 0.170055 * BF29 - 0.0322769 * BF33 - 0.0568027 * BF34 + 0.267625 * BF35;
(4.1) Dengan :
BF1 = max(0, JUMLAH_ART - 6); BF3 = max(0, UMUR - 45) * BF1; BF4 = max(0, 45 - UMUR) * BF1; BF5 = ( PENDIDIKAN in “2”) * BF1;
BF7 = ( SUMBER AIR MINUM in “4” or “5” or “8” ); BF8 = (SUMBER AIR MINUM in “1” or “2” or “3” ); BF9 = ( STATUS PEKERJAAN in “2”or “5”) * BF7; BF11 = (PENDIDIKAN in “3” or “4” ) * BF9;
BF14 = max(0, 4 - JUMLAH_ART) * BF9; BF15 = max(0, JUMLAH_ART - 10) * BF8; BF17 = ( STATUS PEKERJAAN in “1” ) * BF5; BF20 = max(0, 66 - UMUR) * BF9;
BF21 = ( LAPANGAN USAHA in "1" )* BF5; BF23 = ( JENIS_KELAMIN in "1" ) * BF3;
BF25 = ( STATUS PEKERJAAN in “2” or “3” or “5” ) * BF1; BF26 = ( STATUS PEKERJAAN in “1” or “4” or “6”) * BF1; BF27 = ( PENDIDIKAN in “4” or “5” ) * BF26;
BF29 = (SUMBER AIR MINUM in “4” or “5”) * BF1; BF31 = ( PENDIDIKAN in “2” ) * BF7;
(55)
BF33 = max(0, UMUR - 51) * BF31; BF34 = max(0, 51 - UMUR) * BF31;
BF35 = ( LAPANGAN USAHA BARU in ( "3" )) * BF31;
4.2.2 Interpretasi Koefisien Fungsi Basis pada Model MARS
Model MARS pada persamaan (4.1) selain menggambarkan hubungan antar variabel prediktor dan variabel respon juga digunakan sebagai fungsi klasifikasi. Kontribusi setiap BF terhadap model MARS pada persamaan (4.1) dijelaskan sebagai berikut :
1. BF1 = max(0, JUMLAH_ART - 6);
Artinya, kontribusi 1 bermakna jika jumlah anggota rumah tangga lebih dari enam orang ( 8=6), namun jika jika jumlah anggota rumah tangga tidak
lebih dari enam orang ( 8≠6), maka 1 tidak bermakna. Bermaknanya kontribusi 1 mengurangi nilai ( ) sebesar 0.122221
2. BF3 = max(0, UMUR - 45) * BF1; BF1 = max(0, JUMLAH_ART - 6);
Artinya, kontribusi 3 bermakna jika umur kepala rumah tangga lebih dari 45 tahun ( 2=45), dan jumlah anggota rumah tanga lebih dari 6 orang, namun
jika kriteria tersebut tidak terdapat pada rumah tangga, maka 3 tidak bermakna. Bermaknanya kontribusi 2 mengurangi nilai ( ) sebesar 0.0185969
3. BF4 = max(0, 45 - UMUR) * BF1; BF1 = max(0, JUMLAH_ART - 6);
(56)
Artinya, kontribusi 4 bermakna jika umur kepala rumah tangga kurang dari 45 tahun ( 2=45), namun jika kriteria tersebut tidak terdapat pada rumah
tangga, maka 4 tidak bermakna. Bermaknanya kontribusi 4 mengurangi nilai ( ) sebesar 0.0145971.
4. BF9 = ( STATUS PEKERJAAN in “2” or “5”) * BF7;
BF7 = ( SUMBER AIR MINUM in “4” or “5” or “8” );
Artinya, kontribusi 9 bermakna jika status pekerjaan kepala rumah tangga berusaha dibantu buruh tidak tetap/buruh tidak dibayar atau pekerja bebas, dan sumber air minum rumah tangga adalah sumur terlindung atau sumur tidak terlindung atau air sungai/hujan, namun jika kriteria tersebut tidak terdapat pada rumah tangga tersebut maka 9 tidak bermakna. Bermaknanya kontribusi 9 mengurangi nilai ( ) sebesar 1.92828.
5. BF11 = (PENDIDIKAN in “3” or “4” ) * BF9;
BF9 = ( STATUS PEKERJAAN in “2” or “5”) * BF7; BF7 = ( SUMBER AIR MINUM in “4” or“5” or “8” );
Artinya, kontribusi 11 bermakna jika pendidikan kepa rumah tangga adalah tamat smp atau tamat sma dan status pekerjaan kepala rumah tangga adalah berusaha dibantu buruh tidak tetap/buruh tidak dibayar atau pekerja bebas dan sumber air minum rumah tangga adalah sumur terlindung atau sumur tak terlindung atau air sungai/hujan, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 11 tidak bermakna. Bermaknanya kontribusi 11 menambah nilai ( ) sebesar 1.04909.
6. BF14 = max(0, 4 - JUMLAH_ART) * BF9;
BF9 = ( STATUS PEKERJAAN in “2” or “5”) * BF7; BF7 = ( SUMBER AIR MINUM in “4” or “5” or “8” );
(57)
Artinya, kontribusi 14 bermakna jika jumlah anggota rumah tangga kurang dari 6 orang dan status pekerjaan kepala rumah tangga adalah berusaha dibantu buruh tidak tetap/buruh tidak dibayar atau pekerja bebas dan sumber air minum rumah tangga adalah sumur terlindung atau sumur tak terlindung atau air sungai/hujan, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 11 tidak bermakna. Bermaknanya kontribusi menambah ( ) sebesar 0.553926.
7. BF15 = max(0, JUMLAH_ART - 10) * BF8;
BF8 = (SUMBER AIR MINUM in “1” or “2” or “3” );
Artinya, kontribusi 15 bermakna jika jumlah anggota rumah tangga lebih dari 10 orang dan sumber air minum rumah tangga adalah air kemasan atau pompa atau leding, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 15 tidak bermakna. Bermaknanya kontribusi 15 menambah nilai ( ) sebesar 0.631825.
8. BF17 = ( STATUS PEKERJAAN in “1” ) * BF5; BF5 = ( PENDIDIKAN in “2”) * BF1;
BF1 = max(0, JUMLAH_ART - 6);
Artinya, kontribusi 17 bermakna jika status pekerjaan kepala rumah tangga adalah berusaha sendiri dan pendidikan kepala rumah tangga adalah tamat sd, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 17 tidak bermakna. Bermaknanya kontribusi 19 mengurangi nilai ( ) sebesar 0.11567.
9. BF20 = max(0, 66 - UMUR) * BF9;
(58)
BF7 = ( SUMBER AIR MINUM in “4” or “5” or “8” );
Artinya, kontribusi 20 bermakna jika jumlah anggota rumah tangga kurang dari 66 orang dan status pekerjaan kepala rumah tangga adalah berusaha dibantu buruh tidak tetap/buruh tidak dibayar atau pekerja bebas dan sumber air minum rumah tangga adalah sumur terlindung atau sumur tak terlindung atau air sungai/hujan, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 11 tidak bermakna. Bermaknanya kontribusi menambah ( ) sebesar 0.0605489.
10 BF21 = ( LAPANGAN USAHA in "1" )* BF5; BF5 = ( PENDIDIKAN in “2”) * BF1;
BF1 = max(0, JUMLAH_ART - 6);
Artinya, kontribusi 21 bermakna jika lapangan usaha kepala rumah tangga adalah agriculture dan pendidikan kepala rumah tangga adalah tamat sd, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 21 tidak bermakna. Bermaknanya kontribusi 21 mengurangi nilai ( ) sebesar 0.0739558,
11 .BF23 = ( JENIS_KELAMIN in "1" ) * BF3; BF3 = Max (0, UMUR - 45) * BF1;
BF1 = Max (0, JUMLAH_ART - 6);
Artinya, kontribusi 23 bermakna jika jenis kelamin kepala rumah tangga adalah laki-laki dan umur kepala rumah tangga lebih dari 45 tahun dan jumlah anggota kepala rumah tangga lebih dari 6 orang, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 23 tidak bermakna. Bermaknanya kontribusi 23 menambah nilai ( ) sebesar 0.0193749.
12. BF25 = ( STATUS PEKERJAAN in “2” or “3” or “5” ) * BF1; BF1 = max(0, JUMLAH_ART - 6);
(59)
Artinya, kontribusi 25 bermakna jika status pekerjaan kepala rumah tangga adalah berusaha dibantu buruh tidak tetap/buruh tidak dibayar atau berusaha dibantu buruh tetap/buruh dibayar atau pekerja bebas dan jumlah anggota rumah tangga melebihi 6 orang, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 25 tidak bermakna. Bermaknanya kontribusi 25 menambah nilai ( ) sebesar 0.178735.
13. BF27 = ( PENDIDIKAN in “4” or “5” ) * BF26;
BF26 = ( STATUS PEKERJAAN in “1” or “4” or “6”) * BF1; BF1 = Max (0, JUMLAH_ART - 6);
Artinya, kontribusi 27 bermakna pendidikan kepala rumah tangga adalah tamat sma atau tamat diatas sma, status pekerjaan kepala rumah tangga adalah berusaha sendiri atau buruh/karyawan/pegawai atau pekerja keluarga, dan jumlah anggota rumah tangga lebih dari 6 orang, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 27 tidak bermakna. Bermaknanya kontribusi 27 menambah nilai ( ) sebesar 0.102578.
14. BF29 = (SUMBER AIR MINUM in “4” or “5”) * BF1; BF1 = Max (0, JUMLAH_ART - 6);
Artinya, kontribusi 29 bermakna jika sumber air minum rumah tangga adalah sumur terlindung atau sumur terlindung dan jumlah anggota rumah tangga melebihi 6 orang, namun jika kriteria tersebut tidak terdapat pada rumah tangga, maka 29 tidak bermakna. Bermaknanya kontribusi 29 menambah nilai ( ) sebesar 0.170055.
(60)
BF31 = ( PENDIDIKAN in “2” ) * BF7;
BF 7 = ( SUMBER AIR MINUM in “4” or “5” or “8” );
Artinya, kontribusi 33 bermakna jika umur kepala rumah tangga melebihi 51 tahun dan pendidikan kepala rumah tangga adalah tamat SD dan sumber air minum adalah sumur terlindung atau sumur tidak terlindung atau air sungai/hujan, namun jika kriteria tersebut tidak terdapat pada rumah tangga tersebut maka 33 tidak bermakna. Bermaknanya kontribusi 33 mengurangi nilai ( ) sebesar 0.0322769.
16. BF34 = Max (0, 51 - UMUR) * BF31; BF31 = ( PENDIDIKAN in “2” ) * BF7;
BF 7 = ( SUMBER AIR MINUM in “4” or “5” or “8” );
Artinya, kontribusi 34 bermakna jika umur kepala rumah tangga kurang dari 51 tahun dan pendidikan kepala rumah tangga adalah tamat SD dan sumber air minum adalah sumur terlindung atau sumur tidak terlindung atau air sungai/hujan, namun jika kriteria tersebut tidak terdapat pada rumah tangga tersebut maka 34 tidak bermakna. Bermaknanya kontribusi 34 mengurangi nilai ( ) sebesar 0.0568027.
17. BF35 = ( LAPANGAN USAHA in ( "3" )) * BF31; BF31 = ( PENDIDIKAN in “2” ) * BF7;
BF 7 = ( SUMBER AIR MINUM in “4” or “5” or “8” );
Artinya, kontribusi 35 bermakna jika lapangan usaha utama kepala rumah tangga adalah service dan pendidikan kepala rumah tangga adalah tamat SD dan sumber air minum adalah sumur terlindung atau sumur tidak terlindung atau air sungai/hujan, namun jika kriteria tersebut tidak terdapat pada rumah tangga tersebut maka 34 tidak bermakna. Bermaknanya kontribusi 34 menambah nilai ( ) sebesar 0.267625.
(61)
Model MARS terbaik pada persamaan (4.1) dibentuk oleh tujuh variabel yang secara signifikan memberikan kontribusi pada model. Tingkat kepentingan masing-masing variabel prediktor terhadap model ditampilkan pada Tabel 4.9.
Tabel 4.9 Tingkat kepentingan variabel
Variabel Importance -GCV
X8 100,00 0.03099
X9 93.32 0.02989
X7 75.45 0.02731
X4 74.67 0.02721
X2 60.42 0.02556
X1 32.91 0.02337
X6 16.38 0.02267
X3 0.00 0.02244
X5 0.00 0.02244
Tingkat kepentingan dari setiap variabel ditaksir oleh kenaikan nilai GCV. Nilai
“-GCV” menunjukkan besarnya GCV yang berkurang apabila variabel tersebut dimasukkan dalam model.
Dengan diketahuinya variabel mana saja yang berkontribusi pada model MARS maka dapat didefinisikan faktor-faktor apa saja yang menjadi ciri suatu kesejahteraan rumah tangga.
4.2.3 Uji Signifikansi Fungsi Basis Model MARS
Pada model MARS yang telah diperoleh pada persamaan (4.1) dilakukan uji signifikansi yang meliputi uji fungsi basis secara keseluruhan (secara serempak/bersama) dan uji masing-masing fungsi basis. Uji signifikansi
(62)
(keberartian) yang dilakukan secara bersamaan untuk fungsi basis yang terdapat pada model MARS menggunakan hipotesis sebagai berikut:
Dengan j = 1, 3, 4, 9, 11, 14, 15, 17, 20, 21, 23, 25, 27, 29, 33, 34, dan 35.
Statistik uji yang digunakan pada pengujian ini adalah statistik uji F yang diperoleh dari
Berdasarkan hasil pengolahan MARS diperoleh nilai Fhitung = 41.80183. Dengan α
= 0,05, nilai v1 = k = 17 dan v2 = n – k – 1 = 929 – 17 – 1 = 911 diperoleh nilai F α (v1, v2)= F0.05(17,911) = 1,63. Karena Fhitung > 1,63, maka keputusan yang diambil
adalah menolak H0 yang berarti terdapat paling tidak satu yang tidak sama
dengan nol atau dengan kata lain terdapat paling tidak satu fungsi basis yang memuat variabel prediktor yang berpengaruh terhadap variabel respon.
Uji yang dilakukan secara individual terhadap setiap fungsi basis menggunakan hipotesis sebagai berikut :
H0 : Tidak ada hubungan antara variabel Y dan Variabel X
H1 : Ada hubungan antara variabel Y dan Variabel X
(63)
,
Dengan j = 1, 3, 4, 9, 11, 14, 15, 17, 20, 21, 23, 25, 27, 29, 33, 34, dan 35.
Dalam pengujian ini digunakan α = 0.05, v = n – k – 1 = 929 – 17 – 1 = 911 sehingga diperoleh dari tabel t yaitu t(α/2, v), = t(0,025;911) = 1,962
Daerah kritis :
Tabel 4.10 Uji t masing-masing fungsi basis
Parameter
Estimasi Fungsi
Basis
Standar
Error thitung Keputusan
Konstanta 0.98510 0.00488 201.99124 Tolak H0
BF1 -0.12222 0.01671 -7.31254 Tolak H0
BF3 -0.01860 0.00299 -6.22069 Tolak H0
BF4 -0.01460 0.00288 -5.06596 Tolak H0
BF9 -1.92829 0.18595 -10.36966 Tolak H0
BF11 1.04909 0.12275 8.54662 Tolah H0
BF14 0.55393 0.07023 7.88728 Tolak H0
BF15 0.63183 0.08303 7.60958 Tolak H0
BF17 -0.11567 0.01858 -6.22649 Tolak H0
BF20 0.06055 0.00888 6.81673 Tolak H0
BF21 -0.07396 0.02572 - 2.87547 Tolak H0
BF23 0.01937 0.00290 6.68112 Tolak H0
BF25 0.17874 0.02390 7.47891 Tolak H0
BF27 0.10258 0.02495 4.11179 Tolak H0
BF29 0.17006 0.03443 4.93959 Tolak H0
BF33 -0.03228 0.00687 -4.70018 Tolak H0
BF34 -0.05680 0.00670 -8.48255 Tolak H0
(64)
Dapat dilihat dari Tabel 4.7 bahwa uji untuk masing–masing fungsi basis menunjukkan bahwa semua menolak H0 yang berarti semua fungsi basis yang
terpilih dalam model MARS memiliki pengaruh terhadap variabel respon.
4.3 Klasifikasi Kesejahteraan Rumah Tangga di Medan
Untuk menghitung peluang kesalahan pendekatan MARS dalam mengklasifikasikan kesejahteraan rumah tangga di Medan digunakan APER (Aparent Error Rate). Nilai APER merupakan representasi persentase sampel yang salah diklasifikasikan oleh fungsi klasifikasi.
Dalam penelitian ini, pengelompokan kesejahteraan didasarkan oleh variabel respon biner, yaitu variabel respon yang terdiri dari dua kategori. Variabel respon y dikategorikan sebagai “1” untuk rumah tangga miskin, dan “2” untuk rumah tangga tidak miskin.
Tabel 4.11 Klasifikasi kesejahteraan rumah tangga miskin dan tidakmiskin
Kelas aktual
Kelas prediksi
Total actual
1 2
1 2
21 42
13 853
34 895
(65)
Tabel 4.10 menampilkan frekuensi sampel yang tepat diklasifikasikan dan yang salah diklasifikasikan. Dari 34 rumah tangga miskin, 21 di antaranya tepat diklasikasikan ke dalam kategori rumah tangga miskin, 13 rumah tangga miskin lainnya salah diklasifikasikan ke dalam kategori rumah tangga tidak miskin. Begitu juga dari 895 rumah tangga tidak miskin, 853 di antaranya tepat diklasifikasikan ke dalam kategori rumah tangga tidak miskin, sedangkan 42 rumah tangga tidak miskin lainnya salah diklasifikasikan ke dalam kategori rumah tangga miskin.
Berdasarkan informasi tersebut dapat dihitung tingkat ketepatan klasifikasi dan nilai APER sebagai berikut.
APER 100% 5.92%
929 42 13
Ketepatan Klasifikasi = 100% - 5.92% = 94.08%
Sehingga dapat disimpulkan bahwa ketepatan klasifikasi dari pendekatan MARS adalah sebesar 94.08% dengan tingkat kesalahan 5.92%.
4.4. Ketepatan Klasifikasi Kesejahteraan Rumah Tangga di Medan dengan Pendekatan Bagging MARS
Selanjutnya dilakukan pendekatan bagging untuk mengetahui akurasi klasifikasi
dari model MARS. Pasangan variabel respon dan variabel prediktor yang memberikan kontribusi pada model MARS terbaik yang ditunjukkan pada
(66)
persamaan (4.1) direplikasi sebanyak B dengan metode bootstrap. Replikasi
dilakukan sebanyak 15, 20, 25, 30, dan 35 kali. Pada setiap dataset baru {£(B)}
hasil replikasi dilakukan pemodelan MARS dengan kriteria BF, MI, dan MO yang sama dengan kriteria pembentuk model terbaik pada persamaan (4.1), yaitu BF=36, MI=3, dan MO=1. Didapatkan nilai tingkat kesalahan klasifikasi sebanyak B yang berasal dari pemodelan MARS untuk {£(B)}. Selanjutnya tingkat kesalahan klasifikasi baru tersebut dirata-rata sehingga menghasilksan nilai agregat kesalahan klasifikasiB.
Tabel 4.12 Kesalahan klasifikasi untuk setiap dataset {£(B)}
{£(B)} Kesalahan KlasifikasiB
15 20 25 30 35 0,0128 0,0135 0,0159 0,0178 0,0198
Untuk mengetahui efektifitas kinerja bagging, dapat dibandingkan tingkat kesalahan klasifikasi dari model MARS dataset tunggal dengan model MARS
dataset {£(B)}.
Tabel 4.12 Perbandingan tingkat kesalahan klasifikasi dari bagging dan dataset tunggal
{£(B)} Kesalahan KlasifikasiB
Kesalahan Klasifikasi model
MARS dataset
tunggal Penurunan kesalahan klasifikasi 15 20 25 30 0,0128 0,0138 0,0159 0,0178
0,0224
0,0096 0,0086 0,0065 0,0046(67)
35 0,0198 0,0026
Dari Tabel 4.12 dapat diketahui bahwa {£(B)} berhasil memberikan akurasi klasifikasi yang lebih baik daripada klasifikasi model MARS dataset tunggal.
Penurunan tingkat klasifikasi terbesar diberikan oleh {£(15)}. Sehingga dapat disimpulkan bahwa klasifikasi terbaik dengan pendekatan MARS bagging
(68)
BAB V
KESIMPULAN DAN SARAN
5.1Kesimpulan
Dari 9 variabel yang diteliti dalam penelitian ini didapatkan 7 variabel yang berkontribusi dalam model yaitu jumlah anggota rumah tangga (X8), sumber air
minum rumah tangga (X9), status pekerjaan kepala rumah tangga (X7), ijazah
tertinggi yang dimiliki kepala rumah tangga (X4), umur kepala rumah tangga (X2),
jenis kelamin kepala rumah tangga (X1), dan lapangan usaha utama kepala rumah
tangga (X6) dengan tingkat kepentingan masing-masing yaitu 100%, 93,32%,
75,45%, 74,67%, 60,42%, 32,91%, 16,38%. Variabel yang berkontribusi dalam model inilah yang didefinisikan sebagai faktor-faktor penciri tingkat kesejahteraan. Model yang menggambarkan pola hubungan faktor-faktor tersebut terhadap tingkat kesejahteraan rumah tangga adalah
Y = 0.985102 - 0.122221 * BF1 - 0.0185969 * BF3 - 0.0145971 * BF4 - 1.92828 * BF9 + 1.04909 * BF11 + 0.553926 * BF14 + 0.631825 * BF15 - 0.11567 * BF17 + 0.0605489 * BF20 - 0.0739558 * BF21 + 0.0193749 * BF23 + 0.178735 * BF25 + 0.102578 * BF27 + 0.170055 * BF29 - 0.0322769 * BF33 - 0.0568027 * BF34 + 0.267625 * BF35;
Dalam penelitian ini, pendekatan bagging dengan 15, 20, 25, 30 dan 35 replikasi
terbukti dapat menunjukkan akurasi klasifikasi dari model MARS karena menghasilkan tingkat kesalahan klasifikasi yang lebih kecil dari pada model MARS dengan data set tunggal. Penurunan tingkat klasifikasi diberikan oleh
(69)
model MARS bagging dengan 15 replikasi yaitu sebesar 0,96% dengan ketepatan klasifikasi sebesar 95.04%.
5.2 Saran
Untuk penelitian selanjutnya disarankan unutk membandingkan metode MARS dengan metode yang lain, Agar dapat dilihat ketepatan klasifikasi mana yang lebih besar dari kedua metode tersebut.
(70)
DAFTAR PUSTAKA
Badan Pusat Statistik. 2012. Berita Resmi Statistik: Profil Kemiskinan di Indonesia Maret 2012. BPS. Jakarta.
____. 2012. Hasil Survey Sosial Ekonomi Nasional Tahun 2012. Medan.
Buhlman, P., Yu, B. 2002. Analyzing Bagging, The Annals of Statistics, Vol. 30 no. 4, hal 927-961.
Cahyat, A., Gonner, C., dan Haug, M.. (2007). Mengkaji Kemiskinan dan Kesejahteraan Rumah Tangga : Sebuah Panduan dengan Contoh dari Kutai Barat, Indonesia. CIFOR. Bogor.
Cox, D.R. dan Snell, E.J.. (1989). Analysis of Binary Data. Second Edition. Chapman &
Hall. London
Dimas, Arvian P. P. (2011). Klasifikasi Kesejahteraan Rumah Tangga di Jawa Timur dengan Pendekatan Multivariate Adaptive Regression Spline – Bootstrap Aggregating (MARS Bagging). Tugas Akhir, Jurusan Statistika Institut Teknologi Sepuluh Nopember, Surabaya.
Draper and Smith, 1992, Analisis Regresi Terapan, PT Gramedia Pustaka Utama, Jakarta.
Aeni, Een Q.. (2009). Pendekatan CART Arcing untuk Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Tengah [Thesis]. Institut Teknologi Sepuluh Nopember. Surabaya.
Efron, B. dan Tibshirani, R.J.. (1993). An Introduction to the Bootstrap. Chapman Hall, New York.
Eubank, R. L. 1988. Spline Smoothing and Nonparametric Regression. Marcel Deker, New York.
Faturokhman, Molo dan Marcelinus. (1995). Kemiskinan dan Kependudukan di Pedesaan Jawa: Analisis data Susenas 1992. Yogyakarta : Pusat Penelitian Kependudukan Universitas Gadjah Mada.
Friedman, J.H. 1991. Multivariate Adaptive Regression Splines. The Annals of Statistics, Vol. 19 No. 1.
Johnson, R. A., Wichern, D. W.. (1992). Applied Multivariate Statistical Analysis. Prentice Hall. New Jersey
(71)
Kutner, M.H., Nachtsheim, C.J. dan Neter, J. 2004. Applied Linear Regression Models. New York: McGraw-Hill/Irwin.
Suryadarma, D., Akhmad, H., dan Nina, T. (2005). Ukuran Obyektif Kesejahteraan Keluarga untuk Penargetan Kemiskinan : Hasil Uji Coba Sistem Pemantauan Kesejahteraan oleh Masyarakat di Indonesia. SMERU. Jakarta.
The World Bank. (2006). Making The New Indonesia Work For The Poor. The World Bank. Jakarta.
Wahba, G., 1990, “Spline Models For Observational Data”. SIAM, CBMS-NSF Regional Conference Series in Applied mathematics, Philadelphia. Zhang. H and B.H. Singer. 2010. Recursive Partitioning and Applications ed.2th. New York : Springer.
(1)
(2)
(3)
(4)
(5)
(6)