Pemilihan Model Terbaik Regresi linier

MAKALAH ANALISIS REGRESI TERAPAN

Pemilihan Model Regresi Terbaik Menggunakan Metode All Possible

Regression, Best Subset Regression, dan Sequensial Regression

Disusun oleh :

Moh. Aliamsyah

Andre Pratama

Suri Islamiah

Rifa Fitrianti

Kelas C JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS ISLAM INDONESIA YOGYAKARTA 2016

Pemilihan Model Regresi Terbaik Menggunakan Metode All Possible Regression, Best Subset Regression, dan Sequensial Regression

Andre Pratama, Nurinayah, Moh. Aliamsyah, Rifa Fitrianti, Suri Islamiah ( [email protected] ) Program Studi Statistika, Universitas Islam Indonesia, Yogyakarta

Abstrak

Analisis regresi seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal suatu variabel. Agar diperoleh hasil analisis yang optimal, maka diperlukan model regresi terbaik. Pemilihan model regresi terbaik adalah penentuan peubah bebas mana yang akan dimasukkan dalam model regresi sehingga model tersebut dapat menjelaskan perilaku peubah tak bebas dengan baik. Metode yang umum digunakan antara lain all possible regression, best subset regression, the backward elimination, the stepwise regression procedure dan lain- lain. Penelitian ini bertujuan mengkaji metode pemilihan model regresi terbaik yang dapat di terapkan dalam analisis regresi. Dari metode-metode yang dibahas, metode yang merupa kan metode terbaik adalah metode Stepwise. Kemudia n untuk metode yang cukup memuaskan untuk diaplikasikan adalah metode the backward elimination, karena metode ini jauh lebih menghemat waktu dan tenaga dibandingkan dengan metode all possible regression. Sedangkan pada metode best subset regression sendiri memiliki beberapa kelemahan, seperti cenderung menghasilkan persamaan regresi dengan terlalu banyak peubah peramal.

Kata-kata Kunci : analisis regresi, all possible regression, best subset regression, the backward elimination, the stepwise regression procedure.

I. PENDAHULUAN

1.1. Latar Belakang

Dalam menentukan model regresi, variabel bebas dapat masuk dalam model secara bersama-sama atau satu persatu. Jika variabel bebas masuk dalam model secara bersama-sama maka perhitungan akan ringkas, akan tetapi tidak akan kelihatan apa yang terjadi dalam perhitungan tersebut karena setiap variabel bebas yang masuk memberikan pengaruh yang berbeda, tergantung pada urutan variabel bebas tersebut yang masuk dalam model. Namun tidak berarti semua variabel yang masuk dalam model regresi menjadikan model tersebut model yang terbaik (Sembiring,1995). Model regresi terbaik adalah model yang dapat menjelaskan Dalam menentukan model regresi, variabel bebas dapat masuk dalam model secara bersama-sama atau satu persatu. Jika variabel bebas masuk dalam model secara bersama-sama maka perhitungan akan ringkas, akan tetapi tidak akan kelihatan apa yang terjadi dalam perhitungan tersebut karena setiap variabel bebas yang masuk memberikan pengaruh yang berbeda, tergantung pada urutan variabel bebas tersebut yang masuk dalam model. Namun tidak berarti semua variabel yang masuk dalam model regresi menjadikan model tersebut model yang terbaik (Sembiring,1995). Model regresi terbaik adalah model yang dapat menjelaskan

Untuk menentukan peubah bebas mana yang akan dimasukkan ke dalam model regresi, menurut Draper, ada dua kriteria yang saling bertentangan yaitu agar persamaannya bermanfaat untuk peramalan, biasanya ingin dimasukkan sebanyak mungkin peubah sehingga diperoleh nilai ramalan yang andal serta untuk memperoleh informasi dari banyak peubah serta pemantauannya sering kali diperlukan biaya yang tinggi, maka diinginkan persaman regresi yang mencakup sesedikit mungkin peubah. Kompromi diantara kedua kriteria itulah yang disebut pemilihan model regresi terbaik.

Untuk mengatasi kesulitan yang dihadapi dalam menentukan model terbaik dapat digunakan beberapa metode yaitu metode semua kombinasi yang mungkin (all possible regression), regresi himpunan bagian terbaik (best subset regression), prosedur eliminasi langkah mundur ( the backward elimination) dan prosedur regresi bertatar (the stepwise regression procedure) . Metode yang sering digunakan adalah metode semua kombinasi yang mungkin (all possible regression) . Namun metode yang biasanya direkomendasikan adalah metode the stepwise regression procedure, karena lebih menghemat waktu-komputer dibandingkan metode-

metode yang lain, dan juga untuk mencegah masuknya peubah X daripada yang diperlukan sambil memperbaiki persamaannya pada setiap tahap.

1.2. Rumusan Masalah

Berdasarkan latar belakang masalah diatas, maka permasalahan yang akan dibahas dalam penulisan ini adalah sebagai berikut:

a. Apa saja metode-metode yang dapat digunakan dalam pemilihan model regresi terbaik ?

b. Bagaimana langkah-langkah menggunakan metode tersebut agar diperoleh model regresi terbainya ?

c. Bagaimana penerapan metode-metode tersebut pada sebuah kasus?

1.3. Tujuan

Tujuan yang ingin dicapai dalam penulisan ini adalah sebagai berikut:

a. Untuk mengetahui metode-metode yang digunakan dalam pemilihan model regresi terbaik.

b. Untuk mengetahui langkah-langkah dalam menggunakan metode tersebut.

c. Untuk mengetahui penerapan metode-metode tersebut dalam sebuah kasus.

II. KAJIAN PUSTAKA

Penelitian mengenai pemilihan model terbaik dilakukan untuk mengetahui metode mana yang lebih mudah digunakan untuk memilih persamaan model terbaik dan bagaimana cara memilih persamaan model terbaik. Model regresi terbaik adalah model yang dapat menjelaskan perilaku peubah tak bebas dengan sebaik- baiknya dengan memilih peubah-peubah bebas dari sekian banyak peubah bebas yang tersedia dalam data. Pada tahap yang paling sederhana model bertujuan untuk pemerian, menerangkan suatu sistem, peubah apa saja yang besar pengaruhnya dalam sistem tersebut. Model juga berguna untuk tujuan prediksi maupun untuk pengendalian suatu sistem, serta penaksiran parameter regresi.

Kajian mengenai pemilihan model regresi terbaik antara lain dilakukan oleh Ferry Kondo Lembang. Hasil pen elitiannya yaitu “Analisis Regresi Berganda dengan Metode Stepwise pada Data HBAT”. Hasil penelitiannya menjelaskan bahwa kepuasan pelanggan secara signifikan dipengaruhi oleh tanggapan terhadap komplain, kualitas produk, image dari sales aktivitas e-commarce, dan product line.

Selain itu kajian menganai pemilihan model regresi terbaik juga dilakukan oleh Herlina Hanum. Hasil penelitiannya yaitu “Perbandingan Metode Stepwise , Best Subset Regression, dan Fraksi dalam Pemilihan Model Regresi Berganda Terbaik ” . Hasil penelitian tersebut menjelaskan bahwa pemilihan model regresi terbaik dengan metode Stepwise dan Best Subset Regression tidak mempertimbang- kan masalah moltikolinear. Akibatnya model terbaik pilihan kedua metode tersebut masih mengandung masalah multikolinear. Sementara metode fraksi lebih fokus untuk menghindari masalah multikolinear, sehingga menghasilkan model terbaik Selain itu kajian menganai pemilihan model regresi terbaik juga dilakukan oleh Herlina Hanum. Hasil penelitiannya yaitu “Perbandingan Metode Stepwise , Best Subset Regression, dan Fraksi dalam Pemilihan Model Regresi Berganda Terbaik ” . Hasil penelitian tersebut menjelaskan bahwa pemilihan model regresi terbaik dengan metode Stepwise dan Best Subset Regression tidak mempertimbang- kan masalah moltikolinear. Akibatnya model terbaik pilihan kedua metode tersebut masih mengandung masalah multikolinear. Sementara metode fraksi lebih fokus untuk menghindari masalah multikolinear, sehingga menghasilkan model terbaik

III. METODE PENELITIAN

Tulisan ini dibuat berdasarkan hasil analisis data menggunakan metode all possible regression, best subset regression, the backward elimination, forward selection dan the stepwise regression procedure. Dalam Kajian ini digunakan data Apendiks B , yang berasal dari buku A. Hald Statistical Theory with Engineering Application yang diterbitkan oleh Wiley, New York, Pada 1952 yang memiliki 4 peubah bebas. Data tersebut memilki korelasi tinggi antar peubah bebasnya. Agar terlihat jelas perbandingan dari hasil kelima metode tersebut, penyajian dilakukan untuk masing-masing metode. Kemudian dipilih model terbaik dengan mengguna- kan masing-masing metode. Kajian difokuskan pada bentuk dan sifat model terbaik yang dihasilkan dari kelima metode tersebut.

IV. LANDASAN TEORI

Pada bagian ini akan dijabarkan definisi maupun teorema sebagai dasar pengertian untuk mempermudah pembahasan pada bagian selanjutnya. Landasan teori yang digunakan adalah sebagai berikut:

4.1. Regresi Berganda

Menurut Sarwono (2006) analisis regresi linear berganda mengestimasikan besarnya koefisien-koefisien yang dihasilkan oleh yang bersifat linear yang melibatkan dua variabel bebas untuk digunakan sebagai alat prediksi besarnya nilai variabel tergantung. Analisis regresi berganda merupakan analisis data kuantitatif yang digunakan untuk mencari besar hubungan secara linear antara dua atau lebih

variabel independen (X 1 , X 2 ,…X n ) dengan variabel dependen (Y). Uji ini digunakan untuk mengetahui apakah variabel independen (X 1 ,X 2 ….X n ) secara variabel independen (X 1 , X 2 ,…X n ) dengan variabel dependen (Y). Uji ini digunakan untuk mengetahui apakah variabel independen (X 1 ,X 2 ….X n ) secara

+� [4.1] Keterangan:

Y = Variabel dependen (nilai yang diprediksikan)

X 1 ,X 2, X 3 = Variabel independen = Konstanta (nilai Y apabila X 1 ,X 2 …..X n = 0) = Koefisien regresi (nilai peningkatan ataupun penurunan) �

= Galat acak yang berdistribusi �,�

4.2. Variabel Dependen

Variabel dependen (variabel respon) yaitu variabel yang keberadaannya dipengaruhi oleh variabel lainnya dan dinotasikan dengan variabel Y .

4.3. Variabel Independen

Variabel independen disebut juga dengan variabel prediktor yaitu variabel yang bebas (tidak dipengaruhi oleh variabel lainnya) dan dinotasikan dengan X .

4.4. Nilai F

Dalam hal yang lebih umum, misal akan dibandingkan

[4.2] Keterangan: Y

= Variabel dependen (nilai yang diprediksikan)

X 1 ,X 2 = Variabel independen = Koefisien regresi (nilai peningkatan ataupun penurunan)

� = Galat acak yang berdistribusi �,� Dengan

= ∗ +∈ ∗ . Misalkan X1 dan X2 masing-masing matriks rancangan berukuran � × − dan � × > , dan misalkan JKS menyatakan jumlah kuadrat sisa dari model yang lebih lengkap (yang pertama) dan

JKS 1 menyatakan jumlah kuadrat sisa dari model yang lebih sederhana maka uji F untuk menguji bahwa

≠ berbentuk:

F hitung = Nilai F yang diperoleh dari proses matematis (hitung) JKS

= Jumlah kuadrat sisa (variansi karena sisa) � = Banyaknya sampel

= Banyaknya parameter dalam model = Banyaknya parameter dalam model

Dalam hal nilai F hitung besar, artinya lebih besar dari � ,−, yang diperoleh dari tabel- F, maka kita akan memilih model yang lengkap, sedangkan bila nilai F hitung kecil maka pilih model yang lebih sederhana.

4.5. Korelasi

Korelasi adalah derajat hubungan linear antara dua variabel atau lebih dari data hasil pengamatan. Dua variabel dikatakan berkorelasi apabila perubahan dalam satu variabel diikuti oleh perubahan variabel lain, baik yang searah maupun tidak. Berdasarkan hubungan antar variabel yang satu dengan variabel lainnya dinyatakan dengan koefisien korelasi yang disimbolkan dengan ” r ”. Besarnya korelasi berkisar antara − ≤ ≤ . Jika dua variabel berkorelasi negatif maka nilai koefisien korelasinya akan mendekati -1, jika dua variabel tidak berkorelasi maka nilai koefisien korelasinya akan mendekati 0, sedangkan jika dua variabel berkorelasi positif maka nilai koefisien korelasinya akan mendekati 1.

4.6. Nilai �̅ � Koefisien determinasi adalah untuk mengetahui proporsi keragaman total

dalam variabel tak bebas Y yang dapat dijelaskan atau diterangkan oleh variabel bebas yang ada di dalam model persamaan regresi linier berganda secara bersama-

sama. Koefisien determinasi dinyatakan dengan R 2 untuk pengujian regresi linier berganda yang mencakup lebih dari dua variabel. Jika nilai yang akan dibandingkan dua atau lebih model regresi dan yang satu bukan himpunan bagian dari yang lainnya, seperti model ̂ =�+� +�

dengan ̂ =�+� +� +

� , maka uji- F tidak lagi banyak menolong. Dalam hal ini penggunaan R 2 lebih sesuai. Hubungan yang lebih umum dari R 2 ditentukan dengan rumus:

Keterangan: = Nilai koefisien determinasi JKR

= Jumlah kuadrat regresi (variansi karena regresi)

JKT = Jumlah kuadrat total (variansi total) Salah satu kelemahan 2 R ialah bahwa besarnya dipengaruhi oleh banyaknya peubah bebas dalam model, R 2 membesar bersama banyaknya parameter dalam model, sehingga sulit menyatakan beberapa R 2 yang optimum. Akan tetapi bila model yang ingin dibandingkan mempunyai banyaknya parameter dalam model

yang sama maka 2 R 2 mudah digunakan, kemudian pilih model dengan R terbesar. Suatu cara mengatasi kelemahan R 2 tersebut diatas ialah dengan menggunakan apa

yang disebut dengan R 2 -disesuaikan, lambang ̅ . Penyesuaian dikerjakan dengan membagi JKS dan JKT masing-masing dengan derajat kebebasannya pada rumus R 2 . Nilai R 2 dapat dirumuskan sebagai berikut:

̅ = Nilai R 2 yang telah disesuaikan

R 2 = Nilai koefisien determinasi JKS

= Jumlah kuadrat sisa (variansi karena sisa) JKT

= Jumlah kuadrat total (variansi total) � = Banyaknya sampel = Banyaknya parameter dalam model

= Banyaknya parameter dalam model

4.7. Rataan Kuadrat Sisa, S 2 Salah satu patokan yang digunakan dalam menilai kecocokan suatu model

dengan data ialah dengan rataan kuadrat sisa , makin kecil nilai akan semakin baik model. Ukuran ini memperhitungkan banyaknya parameter dalam model melalui pembagian dengan derajat kebebasannya. Rataan kuadrat sisa, , mungkin membesar bila penuruanan dalam JKS akibat pemasukan suatu peubah tambahan kedalam model tidak dapat mengimbangi penurunan dalam derajat kebabasannya (sebesar 1). Penambahan peubah bebas ke dalam model akan menurunkan JKS dan derajat kebebasannya, keduanya menuju ke nol jika p menuju ke n . akan sulit mera- malkan apa tepatnya yang terjadi dengan

/ � − . Pada umumnya akan mengecil kesuatu minimum kemudian mungkin bergelombang di sekitar nilai tersebut bila 2 p membesar. berkaitan erat dengan ̅ , apabila

mengecil maka ̅ 2 membesar. Nilai dirumuskan sebagai berikut:

Keterangan: = Rataan kuadrat sisa (KTS) JKS

= Jumlah kuadrat sisa (variansi karena sisa) � = Banyaknya sampel = Banyaknya parameter dalam model

4.8. Metode R 2 Maksimum (MAXR)

Metode MAXR hampir sama dengan metode yang lain yaitu bertujuan untuk menemukan model yang terbaik dalam kelompok satu peubah, dalam kelompok dua peubah, dan seterusnya dengan patokan . Dalam metode MAXR

penggunaanya dimulai dengan satu peubah untuk menemukan terbesar dalam kelompok, selanjutnya ditambahkan peubah baru kedalam model sebelumnya. Model tersebut selanjutnya dibandingkan dengan model dua peubah lainnya yang diperoleh dari mengganti salah satu peubah dalam model tadi dengan peubah yang diluar model, lalu model yang memberikan

terbesar akan dipilih. Perbandingan tersebut dilakukan dengan setiap model yang dapat diperoleh dengan mengganti terbesar akan dipilih. Perbandingan tersebut dilakukan dengan setiap model yang dapat diperoleh dengan mengganti

terbesar adalah model terbaik dari kelompok model dengan dua peubah. Peubah ketiga kemudian dipilih yang memberikan

terbesar, dengan cara mengganti suatu peubah dalam model dengan yang lainnya yang berada diluar dipilih model tiga peubah yang memberikan

terbesar. Metode ini dilanjutkan sehingga diperoleh model dengan tiga peubah dengan

terbesar dan seterusnya.

4.9. Statistik Cp-Mallows Statistik Cp-Mallows merupakan nilai dugaan yang didapat dari persamaan

regesi berdasarkan sebagian peubah bebas pada umumnya bias. Model statistik Cp - Mallows dengan parameter adalah:

[4.7] Keterangan:

JKS p = Jumlah kuadrat sisaan dari model yang ditentukan = Estimasi variansi sisaan

� = Banyaknya observasi = Banyaknya parameter dalam model

Perhatikan bahwa pada persamaan (4.7) diambil dari model yang lengkap sehingga untuk model ini selalu diperoleh � = , seolah-olah model tersebut tidak bias. Nilai Cp berkaitan sangat erat dengan R 2 - disesuaikan, sehingga apabila R 2 - disesuaikan maka Cp juga dengan sendirinya dapt dihitung sehingga tidak ada tambahan informasi yang diberikan Cp. Jika ketiga patokan yang telah diberikan,

R 2 - disesuaikan, rataan kuadrat sisa dan Cp ternyata berkaitan erat satu sama lain sehingga sesungguhnya ketiganya memberikan informasi yang sama.

4.10. Identifikasi Model Regresi

Proses identifikasi dalam regresi menjadi salah langkah penting yang harus dilakukan dalam analisis regresi. Identifikasi dalam regresi dimaksudkan untuk mengetahui karakteristik data yang ada apakah dapat diregresikan atau tidak, mengetahui hubungan antara variabel independen terhadap variabel dependen, mengidentifikasi adanya data outlier serta faktor lain dari data yang dapat mempe- Proses identifikasi dalam regresi menjadi salah langkah penting yang harus dilakukan dalam analisis regresi. Identifikasi dalam regresi dimaksudkan untuk mengetahui karakteristik data yang ada apakah dapat diregresikan atau tidak, mengetahui hubungan antara variabel independen terhadap variabel dependen, mengidentifikasi adanya data outlier serta faktor lain dari data yang dapat mempe-

4.11. Estimasi Model Regresi

Metode yang digunakan untuk mengestimasi fungsi regresi adalah metode pendekatan kuadrat terkecil ( least square approach ). Melalui metode ini peneliti bermaksud memperkecil jumlah kuadrat error yang terjadi ( error total merupakan selisih antara nilai aktual dengan nilai yang diprediksi melalui model regresi). Estimasi model dimulai dengan menentukan variabel independen yang akan masuk dalam persamaan regresi. Salah satu pendekatan yang dapat dan sering digunakan dalam pemilihan model terbaik adalah pendekatan sequensial regression . Selain itu ada dua pendekatan lain yaitu all possible regression dan best subset regression. Metode-metode yang biasa digunakan dalam penentuan model regresi terbaik adalah sebagai berikut:

4.11.1. Semua Kemungkinan Regresi (All Possible Regression) Metode semua kombinasi yang mungkin adalah metode yang umumnya

digunakan. Di dalam metode tersebut ada beberapa kriteria yang digunakan yaitu R 2 yang disesuaikan, S 2 (rataan kuadrat sisa) dan Cp Mallows. Penentuan persamaan

mana yang terbaik untuk dipilih dilakukan melalui evaluasi pola-pola yang teramati. Pilih model terbaik diantara semua kemungkinan berdasarkan berbagai suatu kriteria tertentu. Untuk menentukan model yang terbaik dapat digunakan kombinasi dari beberapa kriteria. Namun prosedur ini cenderung tidak praktis karena harus memeriksa semua kemungkinan, itu juga berarti bahwa kita harus memeriksa sejumlah besar persamaan regresi yang ada.

4.11.2. Regresi “Himpunan Bagian Terbaik” (Best Subset Regression) Sekarang dengan sudah tersedia solusi komputer yang sangat cepat untuk

memilih himpunan bagian terbaik dari variabel-variabel peramal X i dalam analisis regresi berganda. Tiga kriteria dapat digunakan untuk menentukan himpunan

2 bagian terbaik yaitu nilai R 2 maksimum, nilai R terkoreksi maksimum dan statistik

C p Mallows. Prosedur Best Subset Regression memiliki beberapa kelemahan: (1) Cenderung menghasilkan persamaan regresi dengan terlalu banyak peramal. (2) Jika K diambil terlalu kecil, persamaan regresi yang paling masuk akal untuk dipilih mungkin malah tidak muncul dalam himpunan ‘K terbaik’, meskipun mengkin muncul ditempat lain. (3) Belum ada informasi tercetak yang dengan mudah dapat diperoleh mengenai bagaimana berbagai himpunan bagian tersebut diperoleh.

4.11.3. Prosedur Eliminasi Langkah Maju (Forward Elimination Procedure) Metode seleksi maju adalah langkah maju di mana peubah bebas

dimasukkan satu demi satu menurut urutan besar pengaruhnya terhadap model, dan berhenti bila semua yang memenuhi syarat telah masuk. Dimulai dengan memeriksa matriks korelasi kemudian mengambil peubah bebas yang menghasilkan koefisien korelasi maksimum, dan tidak dipersoalkan apakah korelasi positif atau negatif karena yang diperhatikan hanyalah eratnya hubungan antara suatu peubah bebas dengan Y sedangkan arah hubungan tidak menjadi

persoalan. Bila nilai F hitung lebih kecil dari yang ditetapkan untuk pemasukan peubah bebas ke dalam model maka

tidak jadi masuk, begitu juga sebaliknya. Persamaannya dari prosedur eliminasi langkah maju adalah sebagai berikut:

Keterangan: JKR = Jumlah kuadrat regresi = Rataan kuadrat sisa

, = Peubah bebas ke i dan ke j

4.11.4. Prosedur Eliminasi Langkah Mundur (The Backward Elimination) Metode eliminasi langkah mundur lebih ekonomis dibandingkan dengan

met ode ‘semua kemungkinan regresi’ dalam pengertian bahwa metode ini mencoba memeriksa hanya regresi terbaik yang mengandung sejumlah tertentu peubah primal. Langkah-langkah pokok dalam prosedur ini adalah sebagai berikut:

a. Menghitung persamaan regresi yang mengandung semua peubah peramal.

b. Menghitung nilai- F parsial untuk setiap peubah peramal, seolah-olah ia merupakan peubah terakhir yang dimasukan ke dalam persamaan regresi.

c. Membandingkan nilai- F parsial terendah, misalnya F L , dengan nilai- F bertaraf nyata dari tabel, misalnya F 0. Jika F L < F 0 , dibuang peubah Z L, yang menghasilkan F L dari persamaan regresi dan kemudian hitung kembali persamaan regresi tanpa menyertakan peubah tersebut; selanjutnya kembali ke langkah (b). Sedangkan jika F L > F 0 ambilah persamaan regresi itu.

4.11.4. Prosedur Regresi Bertatar (The Stepwise Reggression Procedure) Prosedur regresi Stepwise adalah salah satu metode untuk mendapatkan

model terbaik dari sebuah analisis regresi. Secara definisi adalah gabungan antara metode forward dan backward , variabel yang pertama kali masuk adalah variabel yang korelasinya tertinggi dan signifikan dengan variabel dependen, variabel yang masuk kedua adalah variabel yang korelasi parsialnya tertinggi dan masih signifikan, setelah variabel tertentu masuk ke dalam model maka variabel lain yang ada di dalam model dievaluasi, jika ada variabel yang tidak signifikan maka variabel tersebut dikeluarkan.

4.11.5. Metode PRESS ( Prediction Sum of Square) Metode PRESS ( Prediction Sum of Square) merupakan bentuk cross -

validasi yang digunakan dalam analisis regresi untuk memberikan ukuran ringkasan fit dari model untuk sampel pengamatan yang sendiri tidak digunakan untuk memperkirakan model. Hal ini dihitung sebagai jumlah kuadrat dari residual prediksi untuk pengamatan mereka. Penggunaan pengamatan dengan pengecualian pengamatan ke i untuk memprediksikan respons pengamatan ke i dan y i , selanjutnya selisih antara yi dengan prediksi dikuadratkan lalu jumlahkan untuk i = 1,2, ... , n (Allen,1974). Lambang PRESS P menyatakan bahwa model dengan p parameter yang digunakan. Adapun rumusnya yaitu:

2 PRESS p = ∑ �

− ̂ (i) )

Model yang baik adalah model yang menghasilkan PRESS P yang kecil dalam kelompok p parameter. Sesunggunya metode ini merupakan gabungan dari semua kombinasi yang mungkin, prediksi dan analisis sisa.

4.12. Validasi Model Regresi

a. Melakukan uji asumsi klasik

Uji asumsi klasik meliputi uji normalitas dengan mempertimbagkan hasil uji Kolmogorov Smirnov , uji autokorelasi dengan membertimbangkan nilai Durbin Watson (DW), uji heteroskedastisitas dengan melakukan uji glesjer , serta uji multikolinieritas dengan menghitung nilai Variance Inflating Factor (VIF).

b. Menerapkan model ini ke dalam sampel lainnya.

Sampel lainnya di sini dapat diperoleh dari sampel baru atau sampel yang diambil sebagai bagian dari sampel terdahulu. Jika data-data baru sukar untuk diperoleh, peneliti dapat menggunakan data awal dengan membagi dua data tersebut secara random. Dengan demikian, sebelum analisis regresi dilakukan akan terdapat dua set data. Set data pertama digunakan untuk membangun model, sedangkan set data kedua digunakan untuk menguji validitas model.

c. Membandingkan beberapa model regresi

Cara ini dilakukan dengan membandingkan suatu model regresi terhadap model-model regresi lainnya dengan jumlah variabel independen dan atau ukuran sampel yang berbeda. Perbandingan dilakukan berdasarkan nilai adjusted R 2 .

4.13. Interpretasi Model Regresi

Interpretasi dilakukan dengan menganalisis koefisien regresi yang terbentuk dari model regresi. Koefisien regresi dalam hal ini merupakan bobot yang dimiliki oleh setiap variabel independen dalam persamaan regresi. Akan tetapi, koefisien regresi yang besar pada suatu variabel tidak mengindikasikan bahwa variabel yang bersangkutan menjadi lebih penting. Untuk membandingkan tingkat kepentingan tersebut, peneliti harus menggunakan koefisien beta . Beta merupakan koefisien regresi yang sudah distandarisasikan. Hal ini berarti setiap koefisien tidak lagi mengandung satuan pengukuran variabel independennya, melainkan sudah memi- liki satuan pengukuran yang sama dan digunakan sebagai bahan perbandingan.

V. PEMBAHASAN

Dalam penelitian ini, data yang digunakan adalah data Apendiks B , yang berasal dari buku A. Hald Statistical Theory with Engineering Application yang diterbitkan oleh Wiley, New York, Pada 1952. Dimana data tersebut bertujuan untuk meneliti pengaruh beberapa senyawa kimia terhadap tingkat panas semen per

gram. Data tersebut memiliki empat peubah peramal (X 1 ,X 2 ,X 3 dan X 4 ). Masalah ini terutama dipilih karena mengilustrasikan beberapa kesulitan tipikal yang biasanya terjadi dalam masalah regresi. Oleh karenanya, pada bagian pembahasan ini, penulis akan menjabarkan bagaimana menentukan model regresi terbaik dari data yang ada dengan menggunakan beberapa metode pemilihan model regresi terbaik. Beberapa metode yang digunakan yaitu All Possible Regression, Best Subset Regression dan Sequensial Regression. Data Apendiks B termuat pada

Tabel 4.1 berikut:

Tabel 4.1 Data Penelitian Apendiks B

Dimana : X 1 = Kadar 3CaO.Al 2 O 3

X 2 = Kadar 3CaO.SiO 3

X 3 = Kadar 4CaO.Al 2 O 3. Fe 2 O 3

X 4 = Kadar 2CaO.SiO 3

Y = Panas /gr semen

5.1. Semua Kemungkinan Regresi (All Possible Regression) Metode ini mengharuskan pengecekan kombinasi peubah yang dapat dibuat. Pemilihan model regresi terbaik dengan metode All Possible Regression, tidak mungkin dilakukan tanpa bantuan komputer. Karena untuk dapat mengambil kesimpulan terhadap pemilihan model terbaik baru bisa dilakukan ketika kriteria- kriteria pada metode All Possible Regression sudah diperoleh nilainya. Dalam menilai kebaikan suatu kombinasi atau peubah bebas biasanya sering menggunakan

kriteria R 2 yang disesuaikan ( ̅ , kuadrat tengah galat ( s 2 ) dan C p dari Mallows. Setelah nilai dari setiap kriteria sudah didapatkan, penentuan model terbaik diperoleh dengan cara melakukan evaluasi seluruh kemungkinan model. Pilih model terbaik diantara semua kemungkinan berdasarkan berbagai suatu kriteria tertentu. Berdasarkan data tabel 4.1, nilai kriteria dari setiap peubah terlihat seperti Tabel 4.2 berikut:

Tabel 4.2 Kriteria All Possible Regression

Peubah dalam No

5 X 1 ,X 2 97,9

6 X 1 ,X 3 54,8

7 X 1 ,X 4 97,2

8 X 2 ,X 3 84,7

9 X 2 ,X 4 68,0

10 X 3 ,X 4 93,5

11 X 1 ,X 2 ,X 3 98,2

12 X 1 ,X 2 ,X 4 98,2

13 X 1 ,X 3 ,X 4 98,1

14 X 2 ,X 3 ,X 4 97,3

15 X 1 ,X 2 ,X 3 ,X 4 98,2

5,98 5,07 R 2 , R 2 s Berdasarkan tabel 4.2 terlihat nilai 2 adj, dan C p dari setiap peubah

dalam model. Untuk menentukan peubah mana yang masuk model, maka dilakukan evaluasi dari seluruh kemungkinan. Untuk menentukan peubah yang masuk pada R 2 R 2 R 2 R model berdasarkan kriteria 2 dan adj ditentukan dengan mencari nilai dan adj dalam model. Untuk menentukan peubah mana yang masuk model, maka dilakukan evaluasi dari seluruh kemungkinan. Untuk menentukan peubah yang masuk pada R 2 R 2 R 2 R model berdasarkan kriteria 2 dan adj ditentukan dengan mencari nilai dan adj

C p terkecil dari observasi yang ada. Pada tabel 4.2 dapat disimpulkan bahwa X 1 ,X 2 , dan X 4 adalah peubah-peubah yang masuk model berdasarkan metode All Possible Regression. Jadi, model terbaik dari data Apendiks B nantinya adalah model yang mengandung peubah X 1 ,X 2 , dan X 4 . Secara umum, analisis All Possible Regression sangat tidak dianjurkan. Karena harus memeriksa semua kemungkinan. Hal tersebut memerlukan waktu dan tenaga yang cukup banyak. Oleh sebab itu, penggunaan metode ini jarang dilakukan dalam memilih model regresi terbaik.

5.2. Regresi “Himpunan Bagian Terbaik” (Best Subset Regression) Pemilihan model regresi terbaik dengan menggunakan metode Best Subset Regression biasanya berdasarkan 3 (tiga) kriteria, yaitu nilai R 2 maksimum, nilai R 2 terkoreksi maksimum dan statistik C p - Mallows . Untuk menentukan himpunan mana yang termasuk pada model terbaik dapat dilakukan dengan menggunakan data yang diperoleh pada metode All Possible Regression, kemudian tentukan peubah yang masuk kriteria berdasarkan banyaknya peubah dalam model seperti Tabel 4.3 berikut:

Tabel 4.3 Kriteria Best Subset Regression

Banyak Peubah Peubah dalam

R 2 s 2 R 2 adj C p

dalam model

X 1, X 2 97.9 5.8 97.4 2.41

X 1, X 4 97.2 7.5 96.7 5.55

3 – Peubah

X 1, X 2 ,X 3 98.2 5.35 97.6 3.07

X 1, X 2, X 4 98.2 5.33 97.6 3.07

4 – Peubah

X 1 ,X 2 ,X 3 ,X 4 98.2 5.98 97.4 5.07

Setelah diperoleh peubah-peubah yang masuk ke dalam model berdasarkan himpunan banyaknya peubah, maka untuk menentukan peubah-peubah yang masuk model dapat dilakukan dengan melakukan evaluasi pada himpunan model yang telah terseleksi dari Tabel 4.2, untuk kemudian diringkas seperti yang terlihat pada

Tabel 4.3 diatas. Seperti halnya memilih persamaan regresi terbaik dengan menggunakan metode All Possible Regression, untuk menentukan peubah yang R 2 R masuk pada model berdasarkan kriteria 2 dan adj ditentukan dengan mencari nilai

R 2 dan R 2 adj terbesar dari seluruh observasi. Sedangkan untuk menentukan peubah yang masuk model berdasarkan kriteria s 2 dan C p ditentukan dengan cara mencari nilai 2 s dan C

p terkecil dari observasi yang ada. Pada Tabel 4.3 dapat disimpulkan bahwa ada 3 (tiga) peubah yang akan masuk model yaitu X 1 ,X 2 , dan X 4 berdasarkan metode Best Subset Regression.

5.3. Metode Sekuesial

Metode sekuesial pada memilihan model regresi terbaik memuat 3 (tiga) prosedur didalamnya. Ketiga prosedur sekuesial yang dimaksud yaitu prosedur eliminasi langkah maju (The Backward Elimination Procedure), prosedur eliminasi

langkah mundur (The Forward Elimination Procedure), dan prosedur regresi bertatar (The Stepwise Regression Procedure).

5.3.1. Prosedur Eliminasi Langkah Mundur (The Backward Elimination) Metode Backward bekerja dengan mengeluarkan satu per satu variabel

prediktor yang tidak signifikan dan dilakukan terus menerus sampai tidak ada variabel prediktor yang tidak signifikan. Untuk menentukan persamaan model terbaik dari data Apendiks B, peneliti mengujinya menggunakan metode Enter pada SPSS yang bertujuan agar dapat diketahui proses pemilihan variabel peubah mana saja yang masuk pada model regresi secara satu per satu. Variabel bebas yang memiliki nilai sigifikansi terbesar dan koefisien korelasi parsial terkecil akan diuji pertama kali apakah akan dieliminasi atau tetap dipertahankan di dalam model.

Gambar 4.1 Nilai Coefficients X 1 ,X 2 ,X 3 dan X 4

Berdasarkan Gambar 4.1 variabel yang dieliminasi pertama yaitu X 3 . Dengan demikian, untuk sementara variabel yang masih dipertahankan dalam Berdasarkan Gambar 4.1 variabel yang dieliminasi pertama yaitu X 3 . Dengan demikian, untuk sementara variabel yang masih dipertahankan dalam

Gambar 4.2 Tabel Anova X 1 ,X 2 , dan X 4

Hipotesis model regresi X 1 ,X 2 , dan X 4 :

1. Hipotesis

= H 0 :β 0 = β 1 =β 2 =β 4 =0

(model tidak signifikan)

H 1 : Ada minimal satu i dimana βi ≠ 0 ,

i = 1,2,4 (model signifikan)

2. Tingkat Signifikasi = 95% atau α = 0.05

3. Daerah Kritis = Tolak H 0 jika sig. ≤ α atau [F hitung >F tabel ]

4. Statistik Uji = F hitung = 166.832 > F tabel = 3.86 Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai F hitung >F tabel dan olak H 0 sig. < 0.05

maka keputusan tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa model regresi Y terhadap X 1,

X 2 dan X 3 signifikan. Hipotesis anova X 1 ,X 2 , dan X 4 menunjukan bahwa model yang terdiri dari variabel bebas X 1 , X 2 , dan X 4 merupakan model yang signifikan. Namun karena masih terdapat variabel yang memiliki nilai signifikansi terbesar diantara variabel bebas yang lain maka pemilihan model terbaik masih harus dilanjutkan. Nilai

coefficients dari X 1 ,X 2 , dan X 4 terlihat seperti Gambar 4.3 berikut:

Gambar 4.3 Nilai Coefficients X 1 ,X 2 , dan X 4

Setelah X 1 , X 2 , dan X 4 dilakukan analisis regresi, nilai coefficient- nya mengalami perubahan seperti yang terlihat pada Gambar 4.3. Berdasarkan Gambar 4.3 ternyata masih terdapat variabel bebas yang memiliki korelasi parsial

yang kecil, yaitu X 4 . Karena X 4 memiliki korelasi terkecil dan nilai signifikansi terbesar maka X 4 dieliminasi dari model regresi. Untuk melihat apakah apakah variabel X 1 dan X 2 signifikan maka dilakukan hipotesis berdasarkan tabel anova berikut:

Gambar 4.4 Tabel Anova X 1 , dan X 2

Hipotesis model regresi X 1 , dan X 2 :

1. Hipotesis = H 0 :β 0 = β 1 =β 2 = 0 (model tidak signifikan)

H 1 : Ada minimal satu i dimana βi ≠ 0

i = 1,2 (model signifikan)

2. Tingkat Signifikasi = 95% atau α = 0.05

3. Daerah Kritis = Tolak H 0 jika sig. ≤ α atau [F hitung >F tabel ]

4. Statistik Uji = F hitung = 229.504 > F tabel = 4.10 Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai F hitung >F tabel dan olak H 0 sig. < 0.05

maka keputusan tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa model regresi Y terhadap X 1

dan X 2 signifikan.

Nilai coefficient yang terbentuk setelah dilakukan analisis regresi Y terhadap X 1 dan X 2 , maka diperoleh hasil analisis seperti Gambar 4.5 berikut:

Gambar 4.5 Nilai Coefficients X 1 , dan X 2

Uji Konstanta β 0 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 0 = 0 (konstanta tidak signifikan)

H 1 : β 0 ≠ 0 (konstanta signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa konstanta model regresi adalah signifikan.

Uji Koefisien β 1 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 1 = 0 (koefisien X 1 tidak signifikan)

H 1 : β 1 ≠ 0 (koefisien X 1 signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 1 adalah

signifikan. Uji Koefisien β 2 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 2 = 0 (koefisien X 2 tidak signifikan)

H 1 : β 2 ≠ 0 (koefisien X 2 signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 2 adalah

signifikan.

Setelah X 3 dan X 4 dikeluarkan dari model regresi, ternyata model menjadi signifikan ketika model regresi hanya terdiri dari variabel bebas X 1 dan X 2 , dengan demikian model regresi terbaik yang diperoleh dengan Backward Elimination Procedure adalah sebagai berikut:

Nilai konstanta sebesar 52.577. Hal ini berarti bahwa jika jumlah kadar 3CaO.Al 2 O 3 (X 1 ) dan jumlah kadar 3CaO.SiO 2 (X 2 ) tetap atau tidak mengalami penambahan atau pengurangan, maka panas semen per gram (Y) memiliki nilai sebesar 52.577. Nilai koefisien jumlah kadar 3CaO.Al 2 O 3 (X 1 ) sebesar 1.468. Hal ini mengandung arti bahwa setiap kenaikan panas semen per gram (Y) akan naik sebesar 1.468 dengan asumsi bahwa variabel bebas yang lain dari model regresi

adalah tetap. Begitu halnya dengan nilai koefisien jumlah kadar 3CaO.SiO 2 (X 2 ) sebesar 0.662. Hal ini mengandung arti bahwa setiap kenaikan panas semen per gram (Y) akan naik sebesar 0.662 dengan asumsi bahwa variabel bebas yang lain dari model regresi adalah tetap.

5.3.2. Prosedur Eliminasi Langkah Maju (Forward Elimination Procedure)

Kebalikan dari metode Backward Elimination Procedure , metode Forward adalah pemodelan dimulai dari nol peubah (empty model), kemudian satu persatu peubah dimasukan sampai kriteria tertentu terpenuhi. Untuk menentukan variabel mana yang akan masuk pertama pada model, maka diuji korelasinya terlebih

dahulu. Hasil uji korelasi X 1 ,X 2 ,X 3 , dan X 4 terlihat seperti gambar berikut:

Gambar 4.6 Nilai Korelasi X 1 ,X 2 ,X 3 dan X 4

Dari hasil analisis korelasi diatas diketahui bahwa variabel bebas yang mempunyai korelasi paling besar dengan variabel dependen adalah X 4 , maka X 4 akan di regresikan dengan Y untuk menentukan apakah masuk dalam model atau tidak. Hasil uji regresi terlihat sebagai berikut:

Gambar 4.7 Tabel Anova dan Nilai Coefficient X 4 terhadap Y

Hipotesis model regresi X 4 berdasarkan tabel Anova :

1. Hipotesis = H 0 : β 4 = 0 (model tidak signifikan)

H i : β 4 ≠ 0 (model signifikan)

2. Tingkat Signifikasi = 95% atau α = 0.05

3. Daerah Kritis = Tolak H 0 jika sig. ≤ α atau [F hitung >F tabel ]

4. Statistik Uji = F hitung = 22.799 > F tabel = 4.92 Sig. (2-tiled) [0.010] < α (0.05)

5. Keputusan = Karena nilai F hitung > F tabel dan tolak H 0 sig. <

0.05 maka keputusan tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa model regresi Y terhadap X 4 signifikan, maka X 4 masuk dalam model.

Uji Konstanta β 0 berdasarkan nilai Coefficient :

1. Hipotesis = H0 : β 0 = 0 (konstanta tidak signifikan)

H 1 : β 0 ≠ 0 (konstanta signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa konstanta model regresi adalah signifikan.

Uji Koefisien β 4 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 4 = 0 (koefisien X 4 tidak signifikan)

H 1 : β 4 ≠ 0 (koefisien X 4 signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α

4. Statistik Uji = Sig. (2-tiled) [0.001] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 4 adalah

signifikan.

Kemudian proses pemilihan model regresi terbaik dari data Apendiks B dilanjutkan dengan menguji korelasi dengan X 4 sebagai variabel kontrol. Hasil uji korelasinya dalah sebagai berikut:

Gambar 4.8 Nilai Korelasi X 1 ,X 2 ,X 3 terhadap X 4 Variabel bebas yang memiliki korelasi terbesar adalah X 1 , dengan begitu

maka X 1 akan diregresikan dengan Y dan variabel bebas yang telah masuk sebelum- nya pada model X 4 . Hasil regresinya adalah berikut:

Gambar 4.9 Tabel Anova dan Nilai Coefficient X 1 dan X 4 terhadap Y Hipotesis model regresi X 1 dan X 4 berdasarkan tabel Anova:

1. Hipotesis = H 0 : βi = 0 (model tidak signifikan)

H i : Ada minimal satu i dimana βi ≠ 0

i = 1,4 (model signifikan)

2. Tingkat Signifikasi = 95% atau α = 0.05

3. Daerah Kritis = Tolak H 0 jika sig. ≤ α atau [F hitung >F tabel ]

4. Statistik Uji = F hitung = 176.672 > F tabel = 4.10 Sig. (2-tiled) [0.010] < α (0.05)

5. Keputusan = Karena nilai F hitung > F tabel dan tolak H 0 sig. <

0.05 maka keputusan tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa model regresi Y terhadap X 1 dan X 4 signifikan, maka X 1 dan X 4 masuk dalam

model. Uji Konstanta β 0 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 0 = 0 (konstanta tidak signifikan)

H 1 : β 0 ≠ 0 (konstanta signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α Gagal tolak H 0 jika sig. (2-tiled) >α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa konstanta model regresi adalah signifikan.

Uji Koefisien β 1 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 1 = 0 (koefisien X 1 tidak signifikan)

H 1 : β 1 ≠ 0 (koefisien X 1 signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α Gagal tolak H 0 jika sig. (2-tiled) >α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 1 adalah

signifikan. Uji Koefisien β 4 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 4 = 0 (koefisien X 2 tidak signifikan)

H 1 : β 4 ≠ 0 (koefisien X 2 signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α Gagal tolak H 0 jika sig. (2-tiled) >α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 4 adalah

signifikan.

Proses pengujian variabel akan terus berlangsung selama H 0 ditolak. Kemudian proses pemilihan model regresi terbaik dari data Apendiks B dilanjutkan lagi dengan menguji korelasi dengan X 1 dan X 4 sebagai variabel kontrol. Hasil uji korelasinya dalah sebagai berikut:

Gambar 4.10 Nilai Korelasi X 2 ,X 3 terhadap X 4 dan X 1 Dengan memperhatikan korelasi diatas, maka X 2 akan masuk pada

pengujian selanjutnya karena X 2 memiliki korelasi terbesar jika dibandingkan dengan X 3 . Berikut hasil pengujian regresi Y terhadap X 1 ,X 2 dan X 4 :

Gambar 4.11 Hasil Analisis Regresi Y terhadap X 1 ,X 2 , dan X 4 Hipotesis model regresi X 1 ,X 2 dan X 4 berdasarkan tabel Anova :

1. Hipotesis = H 0 : βi = 0 (model tidak signifikan)

H i : Ada minimal satu i dimana βi ≠ 0

i = 1,2,4 (model signifikan)

2. Tingkat Signifikasi = 95% atau α = 0.05

3. Daerah Kritis = Tolak H 0 jika sig. ≤ α atau [F hitung >F tabel ]

4. Statistik Uji = F hitung = 166.832 > F tabel = 3.86 Sig. (2-tiled) [0.010] < α (0.05)

5. Keputusan = Karena nilai F hitung > F tabel dan tolak H 0 sig. <

0.05 maka keputusan tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa model regresi Y terhadap X 1,

X 2 dan X 4 signifikan, maka X 1 ,X 2 dan X 4 masuk

dalam model.

Setelah X 1 , X 2 , dan X 4 dilakukan analisis regresi, nilai coefficient- nya mengalami perubahan seperti yang terlihat pada Gambar 4.11. Untuk mengetahui koefisien X 1 ,X 2 , dan X 4 signifikan terhadap model maka dilakukan analisis berikut:

Uji Konstanta β 0 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 0 = 0 (konstanta tidak signifikan)

H 1 : β 0 ≠ 0 (konstanta signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α Gagal tolak H 0 jika sig. (2-tiled) > α

4. Statistik Uji = Sig. (2-tiled) [0.001] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa konstanta model regresi adalah signifikan.

Uji Koefisien β 1 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 1 = 0 (koefisien X 1 tidak signifikan)

H 1 : β 1 ≠ 0 (koefisien X 1 signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α Gagal tolak H 0 jika sig. (2-tiled) > α

4. Statistik Uji = Sig. (2-tiled) [0.000] < α (0.05)

5. Keputusan = Karena nilai sig. < 0.05 maka tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 1 adalah

signifikan. Uji Koefisien β 2 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 2 = 0 (koefisien X 2 tidak signifikan)

H 1 : β 2 ≠ 0 (koefisien X 2 signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α Gagal tolak H 0 jika sig. (2-tiled) > α

4. Statistik Uji = Sig. (2-tiled) [0.052] > α (0.05)

5. Keputusan = Karena nilai sig. > 0.05 maka gagal tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 2 adalah

tidak signifikan. Uji Koefisien β 4 berdasarkan nilai Coefficient :

1. Hipotesis = H 0 : β 4 = 0 (konstanta tidak signifikan)

H 1 : β 4 ≠ 0 (konstanta signifikan)

2. Tingkat Signifikasi = 95% atau α = 5%

3. Daerah Kritis = Tolak H 0 jika sig. (2-tiled) ≤α Gagal tolak H 0 jika sig. (2-tiled) > α

4. Statistik Uji = Sig. (2-tiled) [0.205] > α (0.05)

5. Keputusan = Karena nilai sig. > 0.05 maka gagal tolak H 0

6. Kesimpulan = Jadi, dengan nilai signifikansi 0.05 didapatkan kesimpulan bahwa koefisien regresi X 4 adalah

tidak signifikan.

Dengan hasil diatas terlihat ketika X 2 masuk pada model regresi, nilai koefisien menjadi berubah dan membuat koefisien yang telah masuk sebelumnya menjadi tidak signifikan. Oleh sebab itu maka proses terhenti, sehingga tidak perlu

dilanjutkan untuk penguji variabel X 3. Jadi model terbaik dari data Apendiks B menurut metode Forward Regression adalah ̂=.

Nilai konstanta sebesar 71.6748. Hal ini berarti bahwa jika jumlah kadar 3CaO.Al 2 O 3 (X 1 ), jumlah kadar 3CaO.SiO 2 (X 2 ) dan jumlah kadar 2CaO.SiO 2 (X 4 ) tetap atau tidak mengalami penambahan atau pengurangan, maka panas semen per gram (Y) memiliki nilai sebesar 71.648. Nilai koefisien jumlah kadar 3CaO.Al 2 O 3 (X 1 ) sebesar 1.452. Hal ini mengandung arti bahwa setiap kenaikan panas semen Nilai konstanta sebesar 71.6748. Hal ini berarti bahwa jika jumlah kadar 3CaO.Al 2 O 3 (X 1 ), jumlah kadar 3CaO.SiO 2 (X 2 ) dan jumlah kadar 2CaO.SiO 2 (X 4 ) tetap atau tidak mengalami penambahan atau pengurangan, maka panas semen per gram (Y) memiliki nilai sebesar 71.648. Nilai koefisien jumlah kadar 3CaO.Al 2 O 3 (X 1 ) sebesar 1.452. Hal ini mengandung arti bahwa setiap kenaikan panas semen

kadar 3CaO.SiO 2 (X 2 ) sebesar 0.416. Hal ini mengandung arti bahwa setiap kenaikan panas semen per gram (Y) akan naik sebesar 0.416 dengan asumsi bahwa variabel bebas yang lain dari model regresi adalah tetap. Sedangkan nilai koefisien

untuk jumlah kadar 2CaO.SiO 2 (X 4 ) sebesar 0.237 dan bernilai negatif, hal ini menunjukan bahwa jumlah kadar 2CaO.SiO 2 (X 4 ) mempunyai hubungan yang berlawanan arah dengan variabel panas semen per gram (Y). Koefisien jumlah kadar 2CaO.SiO 2 (X 4 ) berarti bahwa setiap kenaikan panas semen per gram (Y) akan turun sebesar 0.237 dengan asumsi bahwa variabel bebas yang lain dari model regresi adalah tetap (konstan).

5.3.3. Prosedur Regresi Bertatar (The Stepwise Regression Procedure) Stepwise Regression Procedure dimulai dengan memasukan variabel bebas

yang mempunyai korelasi paling kuat dengan variabel dependen. Kemudian setiap kali pemasukan variabel bebas yang lain, dilakukan pengujian untuk tetap memasukan variabel bebas atau mengeluarkannya. Korelasi dari variabel dependen dan independen adalah sebagai berikut:

Gambar 4.12 Korelasi X 1 ,X 2 ,X 3 dan X 4

Bedasarkan Gambar 4.12, variabel yang pertama kali masuk adalah variabel X 4 karena memiliki korelasinya tertinggi dan signifikan dengan variabel dependen. Kemudian variabel X 4 diregresikan dengan variabel Y, hasil regresinya adalah sebagai berikut:

Gambar 4.13 Nilai Regresi X 4 terhadap Y Hipotesis model regresi X 4 berdasarkan tabel Anova :

1. Hipotesis = H 0 : β 4 = 0 (model tidak signifikan)

H 1 : β 4 ≠ 0 (model signifikan)

2. Tingkat Signifikasi = 95% atau α = 0.05

3. Daerah Kritis = Tolak H 0 jika sig. ≤ α atau [F hitung >F tabel ]

4. Statistik Uji = F hitung = 22.799 > F tabel = 4.75 Sig. (2-tiled) [0.001] < α (0.05)

5. Keputusan = Karena nilai F hitung >F tabel dan olak H 0 sig. < 0.05

maka keputusan tolak H 0