Bab 2 LANDASAN TEORI 2.1. Uji Kecukupan Sampel - Membentuk Persamaan Regaresi Berganda Dengan Menggunakan Metode Stepwise Tentang Jumlah Kriminilitas di Kepolisian Resor Tanah Karo
Bab 2 LANDASAN TEORI
2.1. Uji Kecukupan Sampel
Dalam melakukan penelitian yang berhubungan dengan kecukupan sampel maka langkah awal yang harus dilakukan adalah pengujian terhadap jumlah sampel. Pengujian ini dimaksudkan untuk mengetahui apakah data yang diperoleh dapat diterima sebagai sampel.
Hipotesis yang diuji adalah : H : Ukuran sampel telah memenuhi syarat H
1 : Ukuran sampel belum memenuhi syarat
Rumus yang digunakan untuk menentukan jumlah sampel adalah :
20 N ∑ Y
∑ Y N
∑ Y Dengan : N’ = ukuran sampel yang dibutuhkan
N = ukuran sampel percobaan Y = data aktual
t
t = 1,2,3,…, n Kriteria pengujian : H diterima jika : N` < N H ditolak jika : N`
≥ N
2.2. Pengertian Regresi Linier
Regresi linier adalah regresi yang variabel bebasnya (variabel X) berpangkat paling tinggi satu, Dalam regresi linier sederhana terdapat hanya satu variabel bebas X yang dihubungkan dengan satu variabel
1
- Y = a + bX
ε Sedangkan dalam regresi linier ganda terdapat sejumlah k buah variabel bebas (k
≥2) yang dihubungkan dengan Y linier atau pangkat satu dalam semua variabel bebas sehingga terbentuk model: Y=a+b +
X k i ε
1 X 1 +b
2 X 2 +…+b k
Analisa regresi mempelajari hubungan kausal antara variabel tak bebas dan variabel bebas.
2.3. Model Regresi Linier Ganda
Bentuk umum persamaan regresi linier ganda adalah Y b b X b X ⋯ b X ε Dimana: Y i = Variabel tak bebas X = Varibel bebas ke-k dan pengamatan ke-i
ik
k = 1, 2, 3, …, j i = 1, 2, 3, …, n b o = konstanta yang merupakan intersep (titik potong) antara garis dengan sumbu tegak Y b k = Parameter atau koefisien regresi yang akan ditaksir ε
i = Suatu bagian kesalahan taksiran untuk pengamatan ke-i
2 X
1 , b 2 , …, b k dan menyamakan nol.
metode kuadrat terkecil biasa , sehingga ∑ ε = minimum (terkecil). Hal ini diperoleh dengan jalan menurunkan secara parsial terhadap b , b
1 , b 2 , …, b k ditentukan dengan menggunakan
Untuk memperkirakan parameter b , b
. . . . . . . . . . . . . . N Y n X n1 X n2 X n3 … X nk
33 X 3k . . . . . . .
32 X
31 X
3 X
3 Y
23 X 2k
22 X
21 X
2 Y
Bentuk data yang akan diolah dari hasil pengamatan adalah sebagai berikut :
13 X 1k
12 X
11 X
1 X
1 Y
k
… X
3
2 X
1 X
X
No Observasi Variabel Tak Bebas (Y) Variabel Bebas
TABEL 2.1 BENTUK PENGOLAHAN DATADirumuskan sebagai berikut: ε Y Y ε Y b b X b X ⋯ b X
Mencari turunan parsial untuk b , b
1 , b
2 , …, b k
∂ ∑ ε
2 Y b b X b X ⋯ b X
1 ∂b
∂ ∑ ε
2 Y b b X b X ⋯ b X
X ∂b
∂ ∑ ε
2 Y b b X b X ⋯ b X
X ∂b
Sehingga diperoleh persamaan normal sebagai berikut : nb b X b X ⋯ b
X Y b X b X b
X X ⋯ b
X X
X Y b X b
X X b
X X ⋯ b
X X Y … … … . . 1
2.4 Model Regresi Linier Dengan Pendekatan Matriks
Matriks adalah kumpulan bilangan berbentuk persegi panjang yang disusun menurut baris dan kolom. Bilangan-bilangan yang terdapat di suatu matriks disebut dengan elemen atau anggota matriks. Dengan representasi matriks, perhitungan dapat dilakukan dengan lebih terstruktur. Pemanfaatannya misalnya dalam menjelaskan persamaan linier, transformasi koordinat, dan lainnya. Bentuk matriks :
A
- 1
Secara Umum, invers dari matriks persegi A atau ditulis A adalah sebagai berikut :
1
- 1
A = ( )
adj A
det( A ) dengan : det (A) = determinan matriks A dan Adj (A) adalah adjoin matriks A Adjoin matriks A = transpose dari matriks kofaktor A. Invers matriks digunakan untuk menyelesaikan persamaan matriks dan sistem persamaan linear. Seperti pada persamaan 1 akan lebih sederhana dengan menggunakan matriks: Y= Xb +
ε Dimana: e
Y
1 X X … X b e Y X … X
1 X b Y , X , b , ε
⋮ ⋮
⋮ ⋮ ⋮ ⋮ … ⋮ e
Y
X X … X b
1 Maka untuk mendapatkan penaksir kuadrat terkecil bagi b yang minimum
′
ε ε ε
′
= Y Xb Y Xb
′ ′ ′ ′ ′ ′
YY b
X Y Y Xb b
X Xb … … … … … … … … … … … … … … … … … … … … … 2
′ ′ ′ ′ ′
Berdasarkan sifat dari transpose matriks yaitu karena Xb X b b
X Y adalah suatu scalar (bilangan nyata = real number) maka sama dengan transposenya
′ ′
b
X Y Y′Xb Sehingga persamaan (2) menjadi :
′ ′ ′
ε YY Y Xb Y Xb b′X′Xb
′ ′
ε YY
2Y Xb b′X′Xb Dengan penurunan terhadap elemen-elemen: ∂ ∑ ε
′
2X Y 2X′Xb ∂b
Kemudian disamakan dengan nol, maka diperoleh
′
X X b X′Y (persamaan normal)………………………………………(3) b
X X X′Y , dengan syarat ada invers Bentuk penulisan persamaan (3) dalam matriks adalah
… ∑ X n ∑ X ∑ X b
∑ X X … ∑ X X ∑ X ∑ X b b ∑ X ∑ X X ∑ X … ∑ X X
⋮ ⋮ ⋮ ⋮
⋮ … b
∑ X ∑ X X ∑ X X ∑ X
∑ Y
1 1 1 … 1 X … X
X X ∑ Y …
…..(4)
X X
X X ∑ Y
… ⋮ ⋮ ⋮ ⋮ ⋮
X X X … X ∑ Y
Koefisien regresi b , b
1 , b 2 , …, b k adalah n ∑ X … ∑ X ∑ X b
∑ Y b ∑ X X … ∑ X X ∑ X ∑ X ∑ X Y b
∑ X X ∑ X Y ∑ X ∑ X ∑ X X
⋮ ⋮ ⋮ ⋮
⋮ ⋮ … b
∑ X Y ∑ X ∑ X X ∑ X
∑ X X …………………………….(5)
2.5 Metode Regresi Stepwise
Metode yang digunakan adalah Metode bertatar (Stepwise Forward). Metode ini digunakan untuk menentukan suatu persamaan regresi linier variabel respon (Y) terhadap variabel-variabel bebas (X) adalah dengan cara menyusupkan peubah satu demi satu sampai diperoleh persamaan regresi yang memuaskan. Urutan penyisipannya ditentukan dengan menggunakan koefisien korelasi parsial sebagai ukuran pentingnya peubah yang masih diluar persamaan. Prosedur dasarnya ,langkah pertama adalah memilih X yang paling berkorelasi dengan Y (misalkan X
3 ) kemudian
dihitung persamaan regresi linier antara Y dengan X Setelah itu diuji apakah peubah 3. tersebut nyata atau tidak. Jika tidak nyata proses berhenti dengan mengambil model Y =
Y sebagai yang terbaik. Jika peubah tersebut nyata, dicari peubah peramal kedua untuk dimasukkan kedalam peubah persamaan regresi. Untuk mencarinya, diperiksa koefisien korelasi parsial semua peubah peramal yang berada diluar persamaan regresi. Peubah X yang mempunyai koefisien korelasi parsial tertinggi dengan Y yang dipilih (misalkan X
8 ) dan selanjutnya persamaan regresi kedua antara Y, X 3 , dan X
8
dihitung. Kemudian persamaan regresi tersebut diuji. Dan nilai F parsial untuk kedua peubah yang ada dalam persamaan diuji. Nilai F parsial terendah (misalkan X
8 )
kemudian dibandingkan dengan nilai F tabel. Jika peubah tersebut nyata, dicari peubah peramal selanjutnya untuk dimasukkan kedalam peubah persamaan regresi. Namun jika tidak nyata proses diberhentikan dengan mengambil model regresi antara Y dengan X 3 sebagai persamaan regresi terbaik.
2.5.1 Membentuk Matriks Koefisien Korelasi
Koefisien korelasi yang dicari adalah koefisien korelasi linier sederhana antara Y dengan X i , dengan rumus: ∑ X
X Y Y r ∑ X X ∑ Y Y
Dengan : ∑ Y
Y n ∑ X
X n i = 1, 2, 3, …, n j = 1, 2, 3, …, k Bentuk matriks koefisien korelasi linier sederhana antara Y dan X :
i
X r X r X r r
⋮ ⋮ r
X
2.5.2 Membentuk Regresi Pertama (Persamaan Regresi Linier)
Variabel pertama yang diregresikan adalah variabel yang mempunyai harga mutlak koefisien korelasi yang terbesar antara Y dengan X i , misalkan X h . Dari variabel ini X , dengan cara sebagai berikut: + dibuat persamaan regresi linier Y=b +b
1 h i
ε
1 X n
X X 1 ′
X X
X ⋮
⋮
X X
X
1 Y Y
′ ∑ Y
Y
X Y ⋮
∑ X Y Y b
′ ′
β
X X . X Y b Keberartian regresi diuji dengan tabel analisa variansi (Anava) Perhitungan untuk membuat Anava adalah sebagai berikut:
′
Y . J. Y ∑ Y
′ ′
SSR β
X Y β
X Y n n
′
Y JY ∑ Y
′
SST Y Y Y n n Dengan : SSR =Sum Square Regresion (Jumlah Kuadrat Regresi) SST =Sum Square Total (Jumlah Kuadrat Total) 1 1 … 1
1 1 … 1 … n x n
J
1
1
1 …
⋮ ⋮ ⋮ …
1
1
1 J =Matriks berordo n x n dengan semua nilai adalah 1
SSE SST – SSR SSR MSR p 1
SSE MSE n p
SSE = Sum Square Error (Jumlah Kuadrat kesalahan) MSE = Mean Square Error (Rata-rata kuadrat Kesalahan)
Sehingga didapat harga standard error dari b, dengan rumus
′
S β MSE X
X S b S b
TABEL 2.2 ANALISA VARIANSI UNTUK UJI KEBERARTIAN REGRESI Source DF SS MS F uji Regresi (X h ) p-1 SSR MSR Residu n-p SSE MSE MSR/MSE Total SSTUji Hipotesa: H : Regresi antara Y dengan X h tidak signifikan H
1 : Regresi antara Y dengan X h signifikan
Keputusan: Bila F hitung < F tabel maka terima H Bila F maka tolak H
hitung tabel
≥ F Dengan :
F tabel =F (p-1,n-p,0,5)
2.5.3 Seleksi Variabel Kedua Diregresikan
Cara menyeleksi variabel yang kedua diregresikan adalah memilih parsial korelasi variabel sisa yang terbesar. Untuk menghitung harga masing-masing korelasi parsial bisa digunakan rumus:
SSR X , X SSR X r SSE X
Dimana:
X k merupakan variabel sisa
′ ′
SSR X B
X Y ∑Y /n SSE X SST SSR SSR X , X diperoleh dengan cara:
- 1
i. Mencari (X’X) , dan X’Y
(xh,xk) (xh,xk)
ii. Mencari harga B (xh,xk) , sehingga didapat B’ (xh,xk)
∑
iii. SSR (X – h ,X k ) = B’ (xh,xk) . X’Y (xh,xk)
2.5.4 Membentuk Regresi Kedua
Dengan memilih parsial korelasi variabel sisa terbesar untuk variabel tersebut masuk dalam regresi kedua dibuat X +b
X + Y = b + b
h k k k i
ε Dengan cara sebagai berikut : n
X X
1 X
X X
X 1 ′
X X
X X
X X X ⋮ ⋮ ⋮
X X
1 X
X X
X Y ∑ Y
Y
′
Y
X Y ∑ X Y ⋮
∑ X Y Y b
β X′X . X Y b b
Uji keberartian regresi dengan tabel anava sama dengan langkah kedua yaitu dengan menggunakan tabel 2.2. Berikutnya dicek apakah koefisien regresi b signifikan,
k
dengan hipotesa: H : b k = 0 H
1 : b k
≠ 0 b F
S b Sedangkan F tabel =F (1,n-p,0,05) Keputusan : Bila F < F terima H artinya b dianggap sama dengan nol, maka proses distop
hitung tabel k
dan persamaan yang terbaik Y=b + b h X h + e i . Bila F hitung tabel tolak H artinya b k ≥ F tidak sama dengan nol, maka variabel X k tetap di dalam penduga.
2.5.5. Seleksi Variabel Ketiga Diregresikan
Dipilih kembali harga parsial korelasi variabel sisa terbesar. Menghitung harga masing-masing parsial korelasi variabel sisa menggunakan langkah 3, dengan rumus : SSR X , X , X SSR X , X r X X
SSE X , X
2.5.6. Membentuk Persamaan Regresi Ketiga ( Regresi Ganda )
Dengan memilih parsial korelasi terbesar, persamaan regresi dibuat: Y b b X b X b X e Dimana X
1 adalah variabel sisa yang mempunyai parsial korelasi terbesar, dengan
cara sebagai berikut:
X X
1 X
X X
X
1 X ⋮ ⋮ ⋮ ⋮
X X
X
1 n
X X
X X
X X X
X X
X X
X X X
X X X
X X X
X X
X Y
X Y
X Y
X Y
X Y Untuk proses selanjutnya , dilakukan dengan cara yang sama seperti di atas.
2.5.7. Pembentukan Persamaan Penduga
Persamaan penduga adalah adalah semua variabel X yang Y b b X dimana masuk kedalam penduga (Faktor penduga) dan adalah koefisien regresi untuk .
2.5.8. Pertimbangan Terhadap Penduga
Sebagai pembahasan suatu penduga,untuk menanggapi kecocokan penduga yang diperoleh ada dua hal yang dipertimbangkan yakni:
2 a.
Pertimbangan berdasarkan R Suatu penduga sangat baik digunakan apabila persentase variabel yang
2
dijelaskan sangat besar atau bila R → 1.
- Y . . . Yn-
. . Y Y
Spearman (Spearman’s Rank Correlation Test) . Uji Spearman merupakan salah satu uji statistik non paramateris. Digunakan apabila ingin mengetahui kesesuaian antara 2 subjek dimana skala datanya adalah ordinal. Karena uji kesesuaian, maka jelas sifat
σ
j ) = varian (e k ) =
Varian (e
Rata-rata residu sama dengan nol (e 0 b.
Asumsi a.
∑ e /n
∑ e Rata-rata
Y Jumlah
3
Y Y
2 -
Y Y
1 -
. . Y Y Y Y .
b.
TABEL 2.3. RESIDUAnalisa Residu Suatu regresi adalah berarti dan model regresinya cocok (sesuai berdasarkan nilai observasi) apabila asumsi dibawah ini dipenuhi: e j
≈ N (0, σ
2
) berarti residu (e j ) mengikuti distribusi normal dengan mean (e) = 0 dan varian ( σ
2
) = konstanta Asumsi ini dibuktikan dengan analisa residu. Untuk langkah ini pertama-tama dihitung residu (sisa) dari penduga, yaitu selisih dari respon observasi terhadap hasil keluaran oleh penduga berdasarkan prediktor observasi. Dengan rumus : dimana tabelnya seperti dibawah ini :
No. Observasi Respon (Y) Penduga (
3 .
Y Residu ( e
1
2
3 . . . N Y
1 Y
2 Y
2 Keadaan ini dibuktikan dengan uji statistik dengan menggunakan uji korelasi Rank
hubungan kedua variabel adalah simetris, bukan resiprocal. Skala data jelas adalah nominal (2 subjek) dengan interval yang diubah menjadi peringkat .
Langkah-Langkah yang dilakukan dalam analisis korelasi Rank Spearman adalah sebagai berikut :
1.Hipotesis H : tidak ada hubungan antara variabel faktor-faktor yang mempengaruhi kriminalitas dengan jumlah kriminalitas H
1 : ada hubungan antara variabel faktor-faktor yang mempengaruhi kriminalitas
dengan jumlah kriminalitas
2. Kriteria Pengujian Hipotesis H ditolak bila harga hitung > dari tabel r r H diterima bila harga
hitung tabel
r ≤ dari r Untuk uji ini, data yang diperlukan adalah Rank (e j ) dan Rank (Y j ), dimana : d j = Rank (Y j ) – Rank (e j ). hal ini ditunjukkan dengan tabel berikut:
TABEL 2.4 RANK SPEARMAN2 No. Penduga Residu Rank Rank (e) d (r -r ) d y e
Observasi (Y j ) (e) (Y)
2
1 Y
1 e 1 r y1 r e1 d 1 d
1
2
2 Y
2 e 2 r y2 r e2 d 2 d
2
2
3 Y e r r d d
3 3 y3 e3
3
3 . . . . . . .
. . . . . . . . . . . . . .
2 Y n Y n e n r yn r en d n d n
Jumlah ∑ d
Koefisien korelasi Rank Spearman (r ) :
s
∑ d r 1 6 n n
1 = koefisien korelasi Rank Spearman r dj = beda antara dua pengamatan berpasangan N = total pengamatan
1.Tentukan nilai estimasi Y terhadap X untuk mendapat nilai residu n ε
2.Susun nilai nilai n dari X, menurut susunan menaik atau menurun (tanpa ε memperhatikan nilai (+) atau (-) dari karena kita mengambil nilai absolut untuk
n n
ε ε menghitung koefisien korelasi Rank Spearman. Untuk nilai ini data yang diperlukan adalah rank ( n ) dan Rank ( n ).
ε Ŷ
3.Lakukan pengujian koefisien rank spearman r s dengan uji t : r √n 2 t 1 r n = Banyaknya data observasi/ banyaknya individu atau pengamatan yang di rank-kan t- tabel = ; n-2 adalah derajat kebebasan dan
α adalah taraf nyata hipotesa t
, α
Dengan membandingkan test terhadap tabel, bila t hitung < t tabel maka, varian (e j ) = varian (e k ) dengan kata lain bila t test < t tabel , maka varian seluruh residu adalah sama. Bila terbukti varian (e ) = varian (e ) maka model yang digunakan yakni model linier
j k adalah cocok.