I PENDAHULUAN
1.1 Latar Belakang
Salah satu tujuan suatu negara adalah untuk meningkatkan pembangunan manusia.
Untuk mengklasifikasikan
suatu negara
termasuk negara
maju atau
negara berkembang dapat digunakan sebuah ukuran
perbandingan yang
dinamakan Indeks
Pembangunan Manusia IPM. IPM terdiri atas 3 komponen utama, yaitu Pendidikan,
Kesehatan, dan Ekonomi. Namun pada pembahasan karya ilmiah ini dibatasi dalam
ruang lingkup komponen pendidikan dan kesehatan.
Pembangunan bidang
pendidikan bertujuan untuk meningkatkan kecerdasan
dan keterampilan manusia, sehingga kualitas sumber daya manusia sangat bergantung
pada kualitas
pendidikan. Sedangkan
pembangunan kesehatan antara lain bertujuan agar masyarakat memperoleh pelayanan
secara mudah, murah, dan merata. Dalam mengukur dimensi pendidikan dan kesehatan
penduduk digunakan beberapa indikator. Salah satu indikator yang digunakan untuk
menentukan derajat pendidikan adalah Angka Melek Huruf dan rata-rata lama sekolah.
Sedangkan indikator yang digunakan untuk
menentukan derajat
kesehatan penduduk adalah Angka Kematian Bayi dan
Angka Harapan Hidup Biro Pusat Statistik 2009.
Derajat pendidikan
dan kesehatan
penduduk dipengaruhi oleh banyak faktor. Namun dari sekian banyak faktor tersebut,
terdapat faktor
dominan yang
paling berpengaruh. Oleh karena itu diperlukan
suatu metode untuk menentukan faktor dominan yang paling berpengaruh. Salah-satu
upaya untuk mengatasi permasalahan tersebut adalah dengan menggunakan analisis regresi.
Analisis regresi merupakan sebuah teknik statistika yang digunakan untuk menyelidiki
dan memodelkan hubungan antara beberapa peubah. Dalam proses pemilihan peubah dan
model regresi terbaik digunakan suatu metode yang dinamakan metode variable selection
Montgomery Peck 1991.
Prinsip utama dari metode variable selection adalah menentukan peubah yang
dimasukkan ke dalam model regresi. Dalam metode ini juga dapat diketahui peubah yang
tidak perlu dimasukkan ke dalam model. Sehingga pada akhirnya diperoleh model
regresi dengan peubah yang lebih sedikit. Selain keuntungan secara teoritis yaitu
menghilangkan peubah yang tidak relevan, model ini memiliki daya tarik dari sisi
kesederhanaan serta keuntungan ekonomi Rawlings et al. 1998.
Metode variable
selection yang
digunakan pada karya ilmiah ini adalah metode semua kemungkinan regresi all
possible regression, regresi bertatar stepwise regression,
eliminasi langkah
mundur backward elimination, dan eliminasi langkah
maju forward substitution.
1.2 Tujuan
Tujuan dari penulisan karya ilmiah ini adalah : 1. Mempelajari teknik pemilihan peubah
dalam model regresi. 2. Menentukan
faktor dominan
yang berpengaruh terhadap pendidikan dan
kesehatan dengan menggunakan beberapa metode variable selection.
3. Memilih model
terbaik dari
faktor dominan yang mempengaruhi pendidikan
dan kesehatan.
II LANDASAN TEORI
Berikut ini akan dijelaskan beberapa definisi dan teori yang terkait dengan masalah
variable selection.
2.1 Pendidikan dan Kesehatan Definisi Pendidikan
Menurut Undang-undang RI No.2 tahun 1998, pendidikan adalah usaha sadar untuk
menyiapkan peserta didik melalui kegiatan bimbingan, pengajaran dan atau latihan untuk
peranannya di masa yang akan datang. Sedangkan pendidikan nasional menurut ayat
2 pasal 1 adalah pendidikan yang berakar pada kebudayaan bangsa Indonesia dan yang
berdasarkan pada Pancasila dan Undang- undang Dasar 1945. Selanjutnya pendidikan
nasional berfungsi untuk mengembangkan kemampuan
serta meningkatkan
mutu kehidupan dan martabat manusia Indonesia
dalam rangka upaya mewujudkan tujuan nasional.
Johansz et al. 1994
Definisi Kesehatan
Kesehatan adalah keadaan dinamis atau kondisi organisme manusia yang multidimensi
di alam, sumber daya untuk hidup, dan hasil dari interaksi dan adaptasi seseorang dengan
lingkungannya. Karena itu, kesehatan dapat berada dalam berbagai derajat dan spesifikasi
untuk setiap individu dan situasinya.
McKenzie et al. 2008
2.2 Peubah Bebas dan Peubah Terikat
Peubah bebas adalah peubah yang nilainya ditentukan dan diatur, atau nilainya dapat
diamati. Perubahan nilai peubah bebas dapat memberikan suatu efek atau pengaruh yang
diberikan kepada peubah lain. Peubah tersebut dinamakan peubah terikat.
Draper Smith 1985
2.3 Analisis Regresi Berganda
Analisis regresi berganda merupakan analisis regresi yang digunakan untuk mencari
hubungan fungsional dari dua peubah bebas atau lebih terhadap peubah terikat.
Misalkan terdapat n-pengamatan dan k peubah bebas dimana n k. Sedangkan
adalah peubah terikat pada amatan ke-i dan menunjukkan peubah bebas ke-j pada
amatan ke-i. Diasumsikan berdistribusi
normal N [0,
]
serta tidak berkorelasi. Selanjutnya dapat dibentuk model regresi
linear berganda, yaitu :
= +
+ + …+
+ =
+ +
dengan
= 1,2, …,
dan
= 1,2, …,
. Koefisien
, ,
, …,
disebut sebagai
koefisien regresi dari setiap peubah bebas Montgomery Peck 1991.
Koefisien adalah sebuah konstanta
yang menunjukkan nilai awal persamaan regresi. Sementara
β
1
, β
2,
… , β
k
menyatakan perubahan rata-rata peubah y untuk setiap
peubah
= 1,2, …,
sebesar satu satuan. Jika nilai koefisien regresi positif, maka nilai
y akan mengalami penambahan atau kenaikan. Sebaliknya jika koefisien regresi bernilai
negatif, maka nilai y akan mengalami penurunan.
Untuk menduga nilai dari koefisien regresi β
1
, β
2,
… , β
k
digunakan metode kuadrat terkecil. Misalkan koefisien b
1
,b
2,
… , b
k
adalah penduga bagi koefisien regresi tersebut. Menurut metode kuadrat terkecil,
penduga setiap koefisien regresi b
1
,b
2,
… , b
k
dapat diperoleh dengan meminimumkan bentuk kuadrat :
, ,…,
= =
−
=
−
+ .
Penduga kuadrat terkecil bagi β
, β
1,
… , β
k
dari persamaan tersebut diperoleh apabila : a.
| ,
,…, = 0
↔ −
2
−
+ = 0
b. |
, ,…,
= 0 ↔
−
2
−
+ = 0.
Penyederhanaan dari persamaan tersebut dapat disajikan dalam bentuk persamaan
normal :
+ +
+ …
+ =
+ +
+ … +
=
⋮ ⋮
⋮ ⋮
⋮
+ +
+ …
+ =
.
Pada pola persamaan tersebut terdapat
= + 1
persamaan dan untuk masing- masing persamaan telah diketahui koefisien
regresinya. Solusi dari persamaan tersebut akan menjadi penduga bagi b
1
, b
2,
… , b
k
. Jika dituliskan ke dalam bentuk notasi
matriks, maka akan terbentuk suatu model regresi sebagai berikut :
= +
dengan
y = ⋮ ,
= 1
… 1
…
⋮ ⋮
⋮ ⋮
1 …
=
⋮ ,
=
⋮ .
Menurut metode kuadrat terkecil, penduga setiap koefisien regresi dalam matriks dapat
diperoleh dengan meminimumkan :
=
∑
=
′
=
− −
=
− −
+ =
−
+
dengan adalah skalar dan memiliki
bentuk transpos ′
=
juga berupa skalar. Penduga kuadrat terkecil bagi
β diperoleh apabila :
| =
↔ −
′
+ =
↔
′
=
dengan
=
⎣ ⎢
⎢ ⎢
⎢ ⎢
⎢ ⎡
… …
⋮ ⋮
⋮
…
⎦ ⎥
⎥ ⎥
⎥ ⎥
⎥ ⎤
=
⎣ ⎢
⎢ ⎢
⎡
1 1
… 1
… …
⋮ ⋮
⋮
…
⎦ ⎥
⎥ ⎥
⎤ ⋮
=
⎣ ⎢
⎢ ⎢
⎢ ⎢
⎡ ⋮
⎦ ⎥
⎥ ⎥
⎥ ⎥
⎤
.
Jika
X’X
tak singular, maka dari persamaan
=
′ dapat diperoleh :
=
′
dimana adalah matriks invers dari
X’X
.
Montgomery Peck 1991
2.4 Koefisien Korelasi dan Korelasi Parsial Definisi Koefisien Korelasi
Koefisien korelasi adalah nilai yang menunjukkan besarnya korelasi antara dua
peubah atau lebih yang biasa dilambangkan dengan r. Koefisien korelasi ini digunakan
untuk menyatakan keeratan hubungan suatu peubah dengan peubah yang lainnya.
Korelasi merupakan bentuk pembakuan dari kovariansi S
xy
, yaitu dengan cara membaginya dengan simpangan baku masing-
masing peubah. Jika S
x
dan S
y
adalah
simpangan baku dari peubah x dan y, maka koefisien korelasi r antara x dan y adalah :
= =
∑ −
− ∑
− ∑
−
=
∑ −
∑ ∑
∑ −
∑ ∑
− ∑
=
∑ −
∑ ∑
∑ −
∑ ∑
− ∑
dengan i = 1,2,3,…, n.
Nilai r berkisar dari -1 sampai 1 atau dalam bentuk matematis dapat ditulis menjadi
-1 ≤ r ≤ 1. Semakin tinggi nilai mutlak r
maka semakin tinggi pula keeratan hubungan peubah tersebut. Tanda positif pada koefisien
korelasi menandakan bahwa hubungan kedua variabel adalah searah. Sedangkan tanda
negatif pada koefisien korelasi menandakan bahwa hubungan kedua peubah berlawanan.
Sembiring 1995
Definisi Korelasi Parsial
Korelasi parsial adalah korelasi antara dua peubah dengan mengontrol peubah lainnya.
Korelasi parsial digunakan untuk meneliti hubungan
antara dua
peubah yang
diasumsikan bahwa seluruh atau sebagian dipengaruhi oleh peubah ketiga. Dalam hal ini
peubah ketiga dijadikan tetap konstan. Misalkan terdapat peubah x,y, dan z. Korelasi
parsial antara x dan y jika z konstan didefinisikan sebagai:
.
=
−
1
−
1
−
.
Sembiring 1995
2.5 Analisis Variansi
Untuk menguraikan variansi berdasarkan unsurnya dapat digunakan dengan diagram
pencar. Bentuk diagram pencar untuk sebaran data acak
,
dapat dilihat sebagai
berikut :
= +
,
− −
−
̅
Gambar 1. Diagram pencar analisis regresi. dimana :
: Garis rata-rata regresi − : Deviasi residu
: Nilai rata-rata −
: Deviasi regresi : Nilai rata-rata
− : Deviasi total
Dari diagram pencar di atas dapat dilihat bahwa jumlah deviasi atau penyimpangan
total adalah akumulasi dari penyimpangan akibat regresi dan penyimpangan residual atau
sisa bagian yang tidak dapat diterangkan oleh regresi. Sehingga dapat dibentuk persamaan
sebagai berikut :
−
=
−
+
− dengan i = 1, 2, 3,…, n.
Jika ruas kiri dan kanan dikuadratkan dan kemudian dijumlahkan, maka diperoleh :
−
= {
−
+
−
} =
−
+
−
+ 2
− −
.
Pandang hasil perkalian silang pada suku ketiga persamaan ruas kanan di atas.
Persamaan tersebut dapat dituliskan sebagai :
2
− −
= 2
− −
2
−
.
Bagian kedua ruas kanan sama dengan nol karena berdasarkan pada syarat minimum
persamaan kuadrat terkecil bahwa : −
2
−
+ = 0
↔ −
−
= 0
↔ −
+ = 0
↔ −
= 0
↔ −
= 0.
Bagian pertama dari ruas kanan juga sama dengan nol, karena
−
= +
−
=
−
+
−
= 0 +
−
+ = 0
. Jadi persamaan deviasi total di atas dapat
ditulis sebagai berikut :
−
=
−
+
−
.
Persamaan di atas merupakan persamaan dasar dalam analisis regresi dan analisis
variansi. Ruas kiri disebut sebagai jumlah kuadrat total
atau jumlah variasi total. menyatakan jumlah penyimpangan
di sekitar nilai rata-ratanya. Bagian pertama ruas
kanan disebut jumlah kuadrat regresi atau regression sum of squares
, dan ini adalah variasi respons disekitar nilai rata-
ratanya
.
Bagian ini menyatakan pengaruh
regresi peubah x terhadap peubah respons y. Bagian kedua pada ruas kanan disebut jumlah
kuadrat galat atau residual sum of squares . Dengan demikian hubungan antara
, , dan
dapat ditulis sebagai :
= +
. Sembiring 1995
Jika x merupakan peubah bebas dan y
merupakan peubah
terikat dari
suatu persamaan regresi, maka jumlah kuadrat total
dapat dinyatakan sebagai :
=
−
=
−
2
−
=
−
2
−
=
−
2
∑ −
∑
=
−
2
∑ −
∑
=
2 = 1
− ∑
= 1 2
.
Dalam bentuk matriks dapat dituliskan sebagai berikut:
=
− ∑
.
Selanjutnya untuk mencari jumlah kuadrat sisa
dari suatu persamaan regresi adalah sebagai berikut :
= −
2 = 1
=
2 = 1
= ′ .
Substitusi
=
− ,
sehingga
=
−
′
−
=
− −
+ =
−
+
.
Karena
= ,
akibatnya
=
− .
Untuk mencari formula jumlah kuadrat regresi
dapat digunakan formula umum dari
, yaitu :
= +
maka
= +
=
− ∑
−
+
=
−
∑
. Montgomery Peck 1991
2.6 Hipotesis Statistik dan Taraf Nyata α