Penganalisisan Data
BAB 4 HASIL KAJIAN
4.1 Analisis Siri Masa Univariat
Pemerhatian terhadap plot bagi setiap pemboleh ubah dalam kajian ini [penyakit bawaan air dan makanan (PBA), baki klorin (BK), kolifom fekal (KF), gabungan baki klorin dan kolifom fekal (BK_KF) serta kekeruhan (KR)] lawan masa pada Rajah 4.1 menunjukkan bahawa, penyakit bawaan air dan makanan berkadar secara langsung dengan kandungan air minuman. Namun begitu, didapati secara keseluruhan tempoh kajian, setiap pemboleh ubah tersebut tidak menunjukkan tren peningkatan atau penurunan yang ketara. Bagi PBA, terdapat satu data pencilan iaitu bilangan pesakit berjumlah 63 orang di bulan April pada tahun 2004. Pada bulan seterusnya, didapati berlaku penurunan bilangan kes penyakit yang dikaji.
Setelah melaksanakan plot autokorelasi (ACF) menggunakan kaedah Box- Jenkins bukan bermusim, dapat disahkan bahawa data adalah pegun bagi kesemua pemboleh ubah memandangkan turus-turus terpangkas dengan pantas dan terletak dalam rantau pekali korelasi yang bernilai sifar. Situasi ini dipaparkan dalam Rajah
4.2 hingga Rajah 4.6. Sehubungan dengan itu, teknik-teknik yang memerlukan syarat kepegunan data sesuai digunakan untuk menganalisis data bagi kajian ini. Oleh yang 4.2 hingga Rajah 4.6. Sehubungan dengan itu, teknik-teknik yang memerlukan syarat kepegunan data sesuai digunakan untuk menganalisis data bagi kajian ini. Oleh yang
40 Fekal Kolifom (FK) Baki Klorin (BK) FK + BK Kekeruhan
30 Penyakit Bawaan Air dan Makanan (PBA)
Rajah 4.1: Plot Setiap Pemboleh ubah PBA, BK, KF, BK_KF dan Kekeruhan lawan Masa
Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 0.09563 | . |** . | 0.166667 2 0.05258 | . |* . | 0.168184 3 0.16182 | . |*** . | 0.168640 4 -.09602 | . **| . | 0.172899 5 0.15727 | . |*** . | 0.174374 6 0.09474 | . |** . | 0.178271 7 0.21779 | . |**** . | 0.179664 8 0.16202 | . |*** . | 0.186853 9 -.08638 | . **| . | 0.190716
"." marks two standard errors
Rajah 4.2: Plot Autokorelasi bagi Penyakit Bawaan Air Dan Makanan (PBA)
Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 0.06948 | . |* . | 0.166667 2 0.09947 | . |** . | 0.167469 3 -.24650 | . *****| . | 0.169102 4 -.05764 | . *| . | 0.178805 5 0.03077 | . |* . | 0.179321 6 -.04600 | . *| . | 0.179467 7 -.00037 | . | . | 0.179794 8 -.12084 | . **| . | 0.179794 9 -.03885 | . *| . | 0.182037
"." marks two standard errors
Rajah 4.3: Plot Autokorelasi bagi Baki Klorin (BK)
Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 0.24175 | . |***** . | 0.166667 2 0.06907 | . |* . | 0.176138 3 -.10493 | . **| . | 0.176889 4 -.16838 | . ***| . | 0.178609 5 -.08660 | . **| . | 0.182966 6 -.24157 | . *****| . | 0.184101 7 -.11252 | . **| . | 0.192705 8 -.11434 | . **| . | 0.194521 9 -.10066 | . **| . | 0.196380
"." marks two standard errors
Rajah 4.4: Plot Autokorelasi bagi Kolifom Fekal (KF)
Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 0.09470 | . |** . | 0.166667 2 0.37965 | . |******** | 0.168155 3 0.22053 | . |**** . | 0.190482 4 0.25188 | . |***** . | 0.197447 5 0.01436 | . | . | 0.206179 6 0.29219 | . |****** . | 0.206207 7 0.05586 | . |* . | 0.217403 8 0.15649 | . |*** . | 0.217802 9 -.04420 | . *| . | 0.220903
"." marks two standard errors
Rajah 4.5: Plot Autokorelasi bagi Gabungan Baki Klorin dan Kolifom Fekal (BK_KF)
Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 0.37301 | . |******* | 0.166667 2 -.09433 | . **| . | 0.188434 3 -.09843 | . **| . | 0.189741 4 -.15777 | . ***| . | 0.191154 5 -.09422 | . **| . | 0.194738 6 0.32252 | . |****** . | 0.196000 7 0.23826 | . |***** . | 0.210226 8 0.01063 | . | . | 0.217598 9 0.00709 | . | . | 0.217612
"." marks two standard errors
Rajah 4.6: Plot Autokorelasi bagi Kekeruhan
Jadual 4.1 memaparkan keputusan analisis menggunakan kaedah Box-Jenkins tanpa musim. Hasil penggunaan teknik ARIMA(1,0,1) ini, didapati plot autokorelasi (ACF) menunjukkan wujudnya siri masa pegun. Bagi kesemua pemboleh ubah yang dianalisis, plot ACF dan autokorelasi separa (PACF) tidak menunjukkan sebarang turus yang signifikan (rujuk Rajah 4.2 hingga Rajah 4.11). Pengujian terhadap parameter pula, menunjukkan tidak semua signifikan pada aras keertian 0.05 bagi setiap pemboleh ubah yang dikaji meskipun nilai ralat piawainya adalah agak kecil. Statistik Ljung-Box dan plot ACF bagi ralat (rujuk Rajah 4.12 hingga Rajah 4.16) memberi keputusan tiada korelasi antara ralat bagi semua pemboleh ubah yang dikaji.
Jadual 4.1: Keputusan ARIMA(1,0,1)
PBA BK KF BK_KF Kekeruhan Plot ACF
Tiada turus Tiada turus Tiada turus Tiada turus Tiada turus (Rajah 4.2 - yang
yang Rajah 4.6)
signifikan Kesimpulan
Nilai siri masa pegun
Plot PACF Tiada turus Tiada turus Tiada turus Tiada turus Tiada turus (Rajah 4.7 - yang
yang Rajah 4.11) signifikan
Ralat tidak berkorelasi
Plot ACF bagi ralat
Tiada turus (Rajah 4.12 yang
Tiada turus Tiada turus Tiada turus
Tiada turus
yang - Rajah
Ralat tidak berkorelasi
* Signifikan pada α = 0.05
Partial Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
4 -0.13059 | . ***| . | 5 0.17461 | . |*** . | 6 0.04392 | . |* . | 7 0.25090 | . |***** . | 8 0.04851 | . |* . |
9 -0.10402 | . **| . |
Rajah 4.7: Plot PACF bagi Penyakit Bawaan Air Dan Makanan (PBA)
Partial Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
3 -0.26300 | . *****| . | 4 -0.03138 | . *| . |
5 0.10012 | . |** . | 6 -0.12165 | . **| . | 7 -0.02878 | . *| . | 8 -0.07253 | . *| . | 9 -0.06179 | . *| . |
Rajah 4.8: Plot PACF bagi Baki Klorin (BK)
Partial Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
3 -0.13190 | . ***| . | 4 -0.12346 | . **| . | 5 -0.00757 | . | . | 6 -0.23571 | . *****| . | 7 -0.04223 | . *| . | 8 -0.09985 | . **| . | 9 -0.13064 | . ***| . |
Rajah 4.9: Plot PACF bagi Kolifom Fekal (KF)
Partial Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
Rajah 4.10: Plot PACF bagi Gabungan Baki Klorin dan Kolifom Fekal (BK_KF)
Partial Autocorrelations
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1
1 0.37301 | . |******* | 2 -0.27120 | . *****| . | 3 0.05951 | . |* . | 4 -0.20127 | . ****| . | 5 0.05196 | . |* . | 6 0.38051 | . |******** |
7 -0.14452 | . ***| . | 8 0.08444 | . |** . |
Rajah 4.11: Plot PACF bagi Kekeruhan
Autocorrelation Plot of Residuals
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 -.01801 | . | . | 0.166667 2 -.04885 | . *| . | 0.166721 3 0.09235 | . |** . | 0.167118 4 -.18729 | . ****| . | 0.168529 5 0.11042 | . |** . | 0.174215 6 0.04403 | . |* . | 0.176148 7 0.19443 | . |**** . | 0.176454 8 0.14772 | . |*** . | 0.182307 9 -.11490 | . **| . | 0.185602
"." marks two standard errors
Rajah 4.12: Plot ACF bagi Ralat Penyakit Bawaan Air Dan Makanan (PBA)
Autocorrelation Plot of Residuals
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 -.01029 | . | . | 0.166667 2 0.10543 | . |** . | 0.166684 3 -.25275 | . *****| . | 0.168526 4 -.04298 | . *| . | 0.178746 5 0.04173 | . |* . | 0.179033 6 -.04431 | . *| . | 0.179303 7 0.01519 | . | . | 0.179607 8 -.11946 | . **| . | 0.179643 9 -.04938 | . *| . | 0.181836
"." marks two standard errors
Rajah 4.13: Plot ACF bagi Ralat Baki Klorin (BK)
Autocorrelation Plot of Residuals
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 -.00098 | . | . | 0.166667 2 0.03924 | . |* . | 0.166667 3 -.09145 | . **| . | 0.166923 4 -.13571 | . ***| . | 0.168309 5 0.01034 | . | . | 0.171322 6 -.21862 | . ****| . | 0.171339 7 -.03077 | . *| . | 0.178920 8 -.07329 | . *| . | 0.179067 9 -.07763 | . **| . | 0.179898
"." marks two standard errors
Rajah 4.14: Plot ACF bagi Ralat Kolifom Fekal (KF)
Autocorrelation Plot of Residuals
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 -.22824 | . *****| . | 0.166667 2 0.17037 | . |*** . | 0.175134 3 0.02500 | . | . | 0.179679 4 0.09667 | . |** . | 0.179775 5 -.15438 | . ***| . | 0.181214 6 0.26248 | . |***** . | 0.184831 7 -.02874 | . *| . | 0.194910 8 0.14024 | . |*** . | 0.195028 9 -.09598 | . **| . | 0.197809
"." marks two standard errors
Rajah 4.15: Plot ACF bagi Ralat Gabungan Baki Klorin dan Kolifom Fekal
Autocorrelation Plot of Residuals
Lag Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error
0 1.00000 | |********************| 0 1 0.00057 | . | . | 0.166667 2 -.07161 | . *| . | 0.166667 3 -.06514 | . *| . | 0.167519 4 -.03806 | . *| . | 0.168221 5 -.22976 | . *****| . | 0.168460 6 0.38117 | . |******** | 0.176951 7 0.09946 | . |** . | 0.198452 8 -.02729 | . *| . | 0.199832 9 -.00023 | . | . | 0.199936
"." marks two standard errors
Rajah 4.16: Plot ACF bagi Ralat Kekeruhan
Seterusnya, pemilihan teknik terbaik bagi setiap pemboleh ubah dilakukan berdasarkan perbandingan nilai RMSE, MAD dan plot nilai asal dengan nilai ramalan lawan masa bagi setiap pemboleh ubah tersebut. Nilai-nilai tersebut ditunjukkan dalam Jadual 4.2 hingga Jadual 4.6 mengikut teknik yang digunakan. Bagi siri masa PBA, didapati kaedah ARIMA(1,0,1) merupakan teknik terbaik memandangkan nilai RMSE dan MAD yang dikira adalah paling rendah (Jadual 4.2). Plot nilai ramalan menggunakan kaedah ini juga didapati paling hampir dengan nilai asal (Rajah 4.17 Seterusnya, pemilihan teknik terbaik bagi setiap pemboleh ubah dilakukan berdasarkan perbandingan nilai RMSE, MAD dan plot nilai asal dengan nilai ramalan lawan masa bagi setiap pemboleh ubah tersebut. Nilai-nilai tersebut ditunjukkan dalam Jadual 4.2 hingga Jadual 4.6 mengikut teknik yang digunakan. Bagi siri masa PBA, didapati kaedah ARIMA(1,0,1) merupakan teknik terbaik memandangkan nilai RMSE dan MAD yang dikira adalah paling rendah (Jadual 4.2). Plot nilai ramalan menggunakan kaedah ini juga didapati paling hampir dengan nilai asal (Rajah 4.17
Jadual 4.2: Perbandingan Teknik yang Digunakan bagi PBA Pemboleh
Teknik
Teknik RMSE MAD
Penyakit Naïve 20.7385 11.4167 8 8.0000 bawaan air MA(3) 19.3415 11.8889 8 5.3333
dan SES 17.1748 8.9961 8 9.3067 makanan
masa (Jan-Dis 2004)
Rajah 4.17: Model Naïve, Plot PBA lawan Masa (Jan - Dis 2004)
masa (Jan-Dis 2004)
Rajah 4.18: Kaedah MA(3), Plot PBA lawan Masa (Jan - Dis 2004) Rajah 4.18: Kaedah MA(3), Plot PBA lawan Masa (Jan - Dis 2004)
Rajah 4.19: Kaedah SES, Plot PBA lawan Masa (Jan - Dis 2004)
masa (Jan-Dis 2004)
Rajah 4.20: Kaedah ARIMA(1,0,1), Plot PBA lawan Masa (Jan - Dis 2004)
Perbandingan bagi siri masa BK pula menunjukkan kaedah MA(3) adalah paling baik memandangkan nilai RMSE yang dikira adalah agak rendah dan nilai MAD adalah terendah (Jadual 4.3). Plot nilai ramalan menggunakan kaedah ini juga didapati paling hampir dengan nilai asal (Rajah 4.21 hingga Rajah 4.24). Menerusi kaedah ini, dijangka berlaku peningkatan baki klorin sebanyak 0.4667 unit pada bulan berikutnya.
Jadual 4.3: Perbandingan Teknik yang Digunakan bagi BK Pemboleh
Teknik
Teknik RMSE MAD
Naïve 1.3466 0.9167 0.8 0.8000 Baki
MA(3) 1.2233 0.8528 * 0.8 1.2667
Klorin SES
masa (Jan-Dis 2004)
Rajah 4.21: Model Naive, Plot BK lawan Masa (Jan - Dis 2004)
yhat 1
masa (Jan-Dis 2004)
Rajah 4.22: Kaedah MA(3), Plot BK lawan Masa (Jan - Dis 2004) Rajah 4.22: Kaedah MA(3), Plot BK lawan Masa (Jan - Dis 2004)
masa (Jan-Dis 2004)
Rajah 4.23: Kaedah SES, Plot BK lawan Masa (Jan - Dis 2004)
yhat 1
masa (Jan-Dis 2004)
Rajah 4.24: Kaedah ARIMA(1,0,1), Plot BK lawan Masa (Jan - Dis 2004)
Bagi siri masa KF juga menunjukkan kaedah MA(3) merupakan teknik yang terbaik memandangkan nilai RMSE dan MAD adalah rendah (Jadual 4.4). Plot nilai ramalan menggunakan kaedah ini juga didapati paling hampir dengan nilai asalnya (Rajah 4.25 hingga Rajah 4.28). Berdasarkan kaedah ini, dijangka berlaku peningkatan kolifom fekal sebanyak 0.1667 unit pada bulan berikutnya.
Jadual 4.4: Perbandingan Teknik yang Digunakan bagi KF
Pemboleh
Teknik
Teknik RMSE MAD
Naïve 0.5083 0.3167 0 0.0000 Kolifom
MA(3) 0.4176 0.3472 * 0 0.1667
fekal (KF) SES 0.6707 0.6358 0 0.7826 ARIMA(1,0,1) 0.6472 0.6154
Rajah 4.25: Model Naive, Plot KF lawan Masa (Jan - Dis 2004)
ma sa (Ja n-Dis 2004)
Rajah 4.26: Kaedah MA(3), Plot KF lawan Masa (Jan - Dis 2004)
ma sa (Ja n-Dis 2004)
Rajah 4.27: Kaedah SES, Plot KF lawan Masa (Jan - Dis 2004) Rajah 4.27: Kaedah SES, Plot KF lawan Masa (Jan - Dis 2004)
Rajah 4.28: Kaedah ARIMA(1,0,1), Plot KF lawan Masa (Jan - Dis 2004)
Bagi siri masa gabungan antara baki klorin dan kolifom fekal (BK_KF) pula, analisis yang paling sesuai digunakan ialah dengan menggunakan kaedah SES. Ini adalah kerana nilai RMSE dan MAD bagi kaedah ini adalah agak rendah (Jadual 4.5). Plot nilai ramalan menggunakan kaedah ini juga didapati paling hampir dengan nilai asal (Rajah 4.29 hingga Rajah 4.32). Kaedah ARIMA(1,0,1) tidak sesuai digunakan bagi siri ini walaupun nilai ralat yang dikira adalah terendah. Ini disebabkan model yang ditakrif oleh anggaran baru itu didapati tidak stabil dan tidak menumpu. Oleh yang demikian, nilai anggaran pada bulan berikutnya berdasarkan kaedah SES dijangka berlaku penurunan bagi gabungan di antara baki klorin dan kolifom fekal iaitu sebanyak 0.0021 unit.
Jadual 4.5: Perbandingan Teknik yang Digunakan bagi (BK_KF) Pemboleh
Teknik
Teknik RMSE MAD
Naïve 0.3719 0.3000 0.2 0.2000 MA(3) 0.3391 0.2500 0.2 0.1000
(BK_KF)
SES 0.2945 0.2174 * 0.2 0.1979
ARIMA(1,0,1) 0.2906 0.2015 0.2 0.1413 ARIMA(1,0,1) 0.2906 0.2015 0.2 0.1413
Rajah 4.29: Model Naive, Plot (BK_KF) lawan Masa (Jan - Dis 2004)
masa (Jan-Dis 2004)
Rajah 4.30: Kaedah MA(3), Plot (BK_KF) lawan Masa (Jan - Dis 2004)
masa (Jan-Dis 2004)
Rajah 4.31: Kaedah SES, Plot (BK_KF) lawan Masa (Jan - Dis 2004) Rajah 4.31: Kaedah SES, Plot (BK_KF) lawan Masa (Jan - Dis 2004)
Rajah 4.32: Kaedah ARIMA(1,0,1), Plot (BK_KF) lawan Masa (Jan - Dis 2004)
Jadual 4.6 menunjukkan kaedah MA(3) adalah paling sesuai bagi siri masa kekeruhan memandangkan nilai RMSE dan MAD yang dikira adalah rendah (Jadual 4.6). Plot nilai ramalan menggunakan kaedah ini juga didapati paling hampir dengan nilai asalnya (Rajah 4.33 hingga Rajah 4.36). Kaedah ini menunjukkan bahawa pada bulan berikutnya dijangka berlaku peningkatan kekeruhan sebanyak 0.8 unit.
Jadual 4.6: Perbandingan Teknik yang Digunakan bagi Kekeruhan Pemboleh
Teknik
Teknik RMSE MAD
y 48 ˆy 49
ubah terbaik (*)
Naïve 1.9468 1.2000 1.1 1.1000
MA(3) 1.8344 1.1528 * 1.1 1.9000
Kekeruhan SES
masa (Jan-Dis 2004)
Rajah 4.33: Model Naive, Plot Kekeruhan lawan Masa (Jan - Dis 2004) Rajah 4.33: Model Naive, Plot Kekeruhan lawan Masa (Jan - Dis 2004)
Rajah 4.34: Kaedah MA(3), Plot Kekeruhan lawan Masa (Jan - Dis 2004)
masa (Jan-Dis 2004)
Rajah 4.35: Kaedah SES, Plot Kekeruhan lawan Masa (Jan - Dis 2004)
masa (Ja n-Dis 2004)
Rajah 4.36: Kaedah ARIMA(1,0,1), Plot Kekeruhan lawan Masa (Jan - Dis 2004)
4.2 Analisis Regresi Linear Berganda
4.2.1 Pengecaman Data Berpengaruh
Pengecaman data berpengaruh amatlah penting dijalankan terlebih dahulu sebelum sesuatu proses analisis data dan kesimpulan dapat dilakukan. Ini adalah untuk mengelakkan daripada berlakunya sebarang kepincangan pada model atau memberi kesimpulan dan pentafsiran yang salah tentang masalah yang dikaji. Kajian ini menggunakan nilai Hat, Cook’s Distance dan COVRATIO bagi mengenal pasti data yang berpengaruh. Oleh kerana jumlah data bagi kajian ini adalah mengikut sampel yang bersaiz kecil iaitu n < 50. Maka, jika nilai Hat, Cook’s Distance dan COVRATIO adalah lebih besar atau kurang daripada nilai yang terdapat di dalam Jadual 4.7 maka data tersebut dikategorikan sebagai data yang berpengaruh.
Jadual 4.7: Pengiraan Data Berpengaruh Ukuran Statistik
Formula *
Nilai Hat > 3p/n = > 0.3125 Cook’s Distance
COVRATIO < 1 – 3p/n = < 0.6875 * p = bilangan pemboleh ubah bebas + pemalar
Berdasarkan Lampiran I, siri data yang ke-27 dan ke-40 merupakan data berpengaruh kerana terkeluar daripada batas yang digariskan (Jadual 4.7). Kedua-dua siri data ini tidak boleh dibuang terus daripada siri asal kerana ianya memberi kesan yang teruk kepada model regresi yang dibina. Begitu juga jika siri data yang ke-40 sahaja digugurkan daripada data asal ia akan memberi implikasi yang lebih teruk kepada model regresi tersebut. Perkara ini dapat dilihat daripada analisis regresi
(Lampiran II) seperti yang dipaparkan dalam Jadual 4.8. Ini mungkin siri data yang ke-40 mempunyai maklumat penting dalam kajian ini, ia dapat dilihat menerusi nilai
pekali penentu, R 2 yang sangat kecil iaitu 0.058 di mana hanya 5.8% sahaja variasi dalam penyakit bawaan air dan makanan yang dapat diterangkan oleh model regresi
yang dibina berbanding sebanyak 25.3% jika menggunakan kesemua data.
Walau bagaimanapun, jika siri data yang ke-27 digugurkan maka model regresi yang diperolehi adalah lebih baik kerana ia berjaya membaiki model yang
dibina. Perkara ini dapat dilihat menerusi nilai pekali penentu, R 2 yang lebih tinggi iaitu 28.5% manakala ralat piawai yang lebih kecil berbanding model asal yang
merangkumi kesemua data. Jika dilihat pada keberertian pemboleh ubah bebas pula, keempat-empat pemboleh ubah tersebut iaitu baki klorin, kolifom fekal, gabungan baki klorin dan kolifom fekal serta kekeruhan adalah bererti berbanding hanya tiga yang bererti di dalam model asal. Ini menunjukkan bahawa kesemua pemboleh ubah bebas tersebut dapat mempengaruhi pemboleh ubah bersandarnya.
Oleh yang demikian, analisis seterusnya adalah berdasarkan data tanpa siri data yang ke-27. Ini bermakna jumlah bilangan data yang terlibat di dalam kajian ini telah menjadi 47 siri.
Jadual 4.8: Perbandingan Regresi Asal dan Regresi Tanpa Data Berpengaruh
MODEL ASAL
SIRI DATA
SIRI DATA
RI DATA KE-40 KE-27 &
Pekali penentu, R 2
Pekali penentu terubahsuai, 2 R
Ralat piawai
Min kuasa dua ralat
Pengujian Hipotesis terhadap Pemboleh ubah Bebas
(Baki Klorin)
(Baki Klorin)
(Baki Klorin) (Baki Klorin)
(BK_KF)
(BK_KF)
(BK_KF)
(BK_KF)
(Kekeruhan) (Kekeruhan)
(Kekeruhan)
(Kekeruhan)
* Signifikan pada aras keertian 0.10
4.2.2 Pemilihan Pemboleh ubah Bebas
Di dalam kajian ini terdapat empat faktor bagi kandungan air minuman yang dipertimbangkan di mana faktor-faktor tersebut ialah baki klorin (BK), kolifom fekal (KF), gabungan baki klorin dan kolifom fekal (BK_KF) serta kekeruhan (KR) yang dijadikan sebagai pemboleh ubah bebas dan bilangan penyakit bawaan air dan Di dalam kajian ini terdapat empat faktor bagi kandungan air minuman yang dipertimbangkan di mana faktor-faktor tersebut ialah baki klorin (BK), kolifom fekal (KF), gabungan baki klorin dan kolifom fekal (BK_KF) serta kekeruhan (KR) yang dijadikan sebagai pemboleh ubah bebas dan bilangan penyakit bawaan air dan
PBA t = β 0 + β 1 BK t + β 2 KF t + β 3 (BK_KF) t + β 4 KR t + ε t
Apabila membina model, maka model terbaik adalah yang ingin dihasilkan di mana model tersebut mestilah mengambil kira aspek-aspek seperti mudah dihitung, boleh dan mudah ditafsirkan dan mengandungi pemboleh ubah-pemboleh ubah yang bermakna dan berkaitan dengan fenomena yang dikaji. Kita juga inginkan model yang dapat memberi gambaran dan ramalan yang tepat terhadap pemboleh ubah bersandar. Untuk mencapai matlamat tersebut, analisis regresi dengan menggunakan empat kaedah iaitu pemilihan dari hadapan, penghapusan dari belakang, kaedah langkah demi langkah serta kaedah semua regresi yang mungkin dijalankan bagi menentukan bilangan pemboleh ubah bebas yang patut dimasukkan ke dalam model.
Merujuk kepada Lampiran III yang menggunakan kaedah semua regresi yang mungkin, kajian mendapati gabungan (BK, KF, BK_KF dan KERUH) memberikan
nilai C 2 p yang paling rendah dan nilai R yang agak tinggi. Maka gabungan ini merupakan yang terbaik kerana berjaya menerangkan sebanyak 28.52% daripada
variasi dalam PBA berbanding dengan gabungan lain yang mempunyai nilai R 2 yang sangat rendah dan nilai C p yang lebih tinggi. Gabungan terbaik ini yang melibatkan
semua pemboleh ubah bebas kemudiannya dianalisis supaya dapat dibandingkan dengan kaedah-kaedah lain seperti yang ditunjukkan dalam Jadual 4.9.
Jadual 4.9: Pemilihan Pemboleh ubah Bebas berdasarkan Empat Kaedah
Semua regresi
dari
dari belakang demi langkah yang mungkin
hadapan
Pekali penentu, R 2
Pekali penentu terubahsuai, 2 R
Ralat piawai
Min kuasa dua ralat
0.006* Pengujian Hipotesis terhadap Pemboleh ubah Bebas
0.063* ( Baki Klorin ) (Baki Klorin) (Baki Klorin) (Baki Klorin)
(Kekeruhan) (Kolifom
(Kekeruhan) (Kolifom
(BK_KF)
(BK_KF)
(Kekeruhan) * Signifikan pada aras keertian 0.10
(Kekeruhan)
Berdasarkan Jadual 4.9, kaedah penghapusan dari belakang dan kaedah semua regresi yang mungkin memberi keputusan yang sama dan lebih baik. Ini adalah
2 kerana kedua-dua kaedah ini mempunyai nilai R 2 dan R
a yang lebih tinggi berbanding dua kaedah lagi. Di samping itu, kedua-dua kaedah ini mempunyai nilai
ralat piawai yang lebih rendah dan nilai min kuasa dua ralat yang jauh lebih kecil jika ralat piawai yang lebih rendah dan nilai min kuasa dua ralat yang jauh lebih kecil jika
4.2.3 Hubungan antara Pemboleh ubah Bersandar dan Pemboleh
ubah Bebas
Dalam analisis regresi, perhatian sering ditumpukan kepada hubungan di antara pemboleh ubah bersandar dengan beberapa pemboleh ubah bebas. Model (1) mengendalikan hubungan di antara pemboleh ubah bersandar dengan setiap pemboleh ubah bebas yang berbentuk linear. Jika keadaan ini tidak berlaku maka pemboleh ubah berkaitan perlu dijelmakan. Berdasarkan Lampiran IV, hubungan yang diperolehi adalah sangat bererti berasaskan nila-p (0.006) yang sangat kecil bagi model ini. Nilai yang kecil ini menunjukkan bahawa sekurang-kurangnya terdapat satu daripada empat pemboleh ubah bebas tersebut berhubungan secara linear dengan pemboleh ubah bersandar (PBA) iaitu Penyakit Bawaan Air Dan Makanan. Di dalam kes ini, didapati kesemua pemboleh ubah bebas iaitu baki klorin (nilai-p = 0.063), kolifom fekal (nilai-p = 0.077), gabungan baki klorin dan kolifom fekal (nilai-p = 0.062) serta kekeruhan (nilai-p = 0.014) mempunyai hubungan yang linear dengan PBA pada aras keertian 10% dan 5% seperti yang ditunjukkan oleh nilai-p masing- masing. Perkara ini dapat juga dilihat menerusi plot graf di dalam Rajah 4.37 yang menyokong kenyataan di atas.
Dependent Variable: Penyakit Bawaan Air (PBA) Dependent Variable: Penyakit Bawaan Air (PBA)
R Sq Linear = 0.08
ny e R Sq Linear = 0.072
0.0 0.5 1.0 1.5 Baki Klorin (BK) Kolifom Fekal (KF)
Dependent Variable: Penyakit Bawaan Air (PBA) Dependent Variable: Penyakit Bawaan Air (PBA)
R Sq Linear = 0.08
ny
0 R Sq Linear = 0.135
0 2 4 BK + KF Kekeruhan
Rajah 4.37: Hubungan antara Pemboleh ubah Bersandar dengan Setiap
Pemboleh ubah Bebas
4.2.4 Menguji Multikolineariti antara Pemboleh ubah Bebas
Keputusan analisis regresi yang dijalankan bagi mewakili model ditunjukkan pada Lampiran IV. Nilai faktor inflasi varians (VIF) bagi semua pemboleh ubah bebas adalah kurang dari 10, maka ini menunjukkan bahawa tiada masalah multikolinearan di dalam model regresi yang dibina.
Pemboleh ubah Bebas Nilai VIF
Baki Klorin
Kolifom Fekal
BK_KF
Kekeruhan
4.2.5 Ujian Autokorelasi bagi Sebutan Ralat
Statistik ujian Durbin-Watson (DW) ialah 1.301 (Jadual 4.10) manakala sifir DW memberikan had genting atas, d U = 1.72 dan had genting bawah, d L = 1.34 untuk p – 1 = 4, n = 45 (memandangkan jadual statistik ujian DW bagi n = 47 tidak disediakan). Oleh kerana d = 1.301 adalah lebih kecil daripada nilai had genting bawah maka adalah cukup bukti untuk menolak hipotesis nol dan ini bermakna wujud autokorelasi di dalam data yang dikaji.
Jadual 4.10: Ringkasan Model
Ralat Piawai Durbin - R
Pekali
Pekali Penentu
2 Penentu, R 2 Terubah suai, R
a Anggaran
Kewujudan autokorelasi boleh mengurangkan kecekapan penganggar kuasa dua terkecil bagi parameter model dan meninggikan kepincangan dalam ralat piawainya. Pendekatan Cochrane–Orcutt digunakan untuk menganggar parameter model regresi bagi menyelesaikan masalah autokorelasi yang wujud dan keputusannya adalah seperti yang ditunjukkan pada Lampiran V.
Berdasarkan Cochrane-Orcutt peringkat pertama, nilai Ĉ yang dianggarkan adalah bersamaan dengan 0.19699 [Lampiran V(a)]. Nilai Ĉ = 0.19699 ini kemudiannya digunakan untuk mendapatkan pemboleh ubah yang baru iaitu:
PBA *
t = PBA t
- 0.19699(PBA) t-1
BK *
= BK t
0.19699 (BK) t-1
KF *
= KF t
- 0.19699 (KF) t-1
(BK_KF) *
= (BK_KF) t - 0.19699 (BK_KF) t-1 KR *
= KR t - 0.19699 (KR) t-1
Selepas proses Cochrane-Orcutt peringkat pertama, analisis regresi dengan menggunakan model,
PBA
= β 0 + β 1 BK t + β 2 KF t + β 3 (BK_KF) t + β 4 KR t
dijalankan dan model yang dianggarkan [Lampiran V(b)] ialah:
PBA *
= 2.476 + 1.901BK t - 2.791KF t - 12.382(BK_KF) t
+ 1.987KR
Selepas menjalankan Cochrane-Orcutt peringkat pertama, hasil analisis menunjukkan bahawa masalah autokorelasi bagi sebutan ralat sudah tidak wujud lagi. Ini dapat dilihat melalui nilai DW, d = 1.792 yang lebih besar dari nilai had genting atas iaitu d u = 1.72. Plotan graf (Rajah 4.38) antara reja piawai dengan masa juga menunjukkan bahawa titik-titik berada dalam keadaan stabil iaitu terletak di sekitar sifar dan tidak mengikut sebarang corak tertentu. Ini bermakna, proses Cochrane- Orcutt peringkat pertama dapat menyelesaikan masalah autokorelasi di kalangan sebutan ralat.
1 3 I_CO 2
Masa (bulan)
Rajah 4.38: Plot Reja Piawai lawan Masa
Justeru itu, adalah perlu untuk menjelmakan balik model anggaran iaitu model (2) ke dalam bentuk pemboleh ubah yang asal. Proses penjelmaan dapat dilakukan dengan menggunakan formula seperti berikut:
Pemboleh ubah asal bagi pemboleh ubah bersandar boleh didapati melalui persamaan berikut:
PBA **
= 3.0834 + 1.901BK t - 2.791KF t - 12.382(BK_KF) t + 1.987KR
Pemboleh ubah-pemboleh ubah asal ini iaitu PBA ** t, BK t , KF t, (BK_KF) t dan KR t digunakan untuk analisis seterusnya.
4.2.6 Ujian Kestabilan Varians dan Kenormalan Ralat
Masalah ketidakstabilan varians ralat atau masalah heterokedastisiti dapat dilihat menerusi plot graf. Rajah 4.39 memberikan plot reja piawai lawan nilai anggaran
bagi pemboleh ubah PBA ** dan dapat diperhatikan bahawa corak varians bagi sebutan ralat adalah tetap. Titik-titik yang terhasil tidak menunjukkan sebarang corak tertentu bagi pemboleh ubah PBA ** dan dapat diperhatikan bahawa corak varians bagi sebutan ralat adalah tetap. Titik-titik yang terhasil tidak menunjukkan sebarang corak tertentu
ANGGARAN PBA**
Rajah 4.39: Plot Reja Piawai lawan Nilai Anggaran bagi Pemboleh ubah PBA **
-5.0 0.0 5.0 10.0 15.0 20.0 Penyakit Bawaan Air
-1.0 0.0 1.0 2.0 3.0 4.0 0.0 0.5 1.0 1.5 Baki Klorin 2.0 Kolifom Fekal
-0.2 0.0 0.2 0.4 0.6 0.8 0.0 1.0 2.0 3.0 4.0 5.0 (BK+KF) 6.0 Kekeruhan
Rajah 4.40: Plot Reja Piawai lawan Indikator Pemboleh ubah
Apabila ditinjau pada Rajah 4.41 dan Rajah 4.42 pula, memberi gambaran bahawa sebutan ralat telah mempunyai taburan yang normal.
Observed Value
Rajah 4.41: Plot Kebarangkalian Normal bagi Reja
Rajah 4.42: Plot Histogram
Seterusnya sekali lagi analisis regresi dijalankan dengan menggunakan pemboleh ubah-pemboleh ubah yang asal iaitu PBA **
t, BK t , KF t, (BK_KF) t dan KR t
dan model yang dianggarkan (Lampiran VI) ialah:
PBA´ t = 2.668 + 1.943BK t - 2.565KF t - 13.030(BK_KF) t
+ 1.840KR
Maka, dapatlah disimpulkan bahawa model anggaran (4) yang terhasil merupakan model yang terbaik berdasarkan kaedah-kaedah yang telah dijalankan kerana tidak lagi wujud masalah-masalah seperti multikekolineariti, autokorelasi dan heteroskedastisiti (Lampiran VI). Selain dari itu, semua pemboleh ubah bebas dalam model ini adalah sangat bererti dan ini bermakna setiap pemboleh ubah tersebut mempunyai hubungan linear dan dapat mempengaruhi pemboleh ubah bersandarnya.
Merujuk Jadual 4.11, jelas terbukti bahawa model akhir adalah lebih baik berbanding model sebelumnya. Ini dapat dilihat pada nilai pekali penentu, R 2 , model
ini berjaya menerangkan setinggi 96.5% daripada variasi dalam pemboleh ubah bersandar berbanding model asal yang menerangkan hanya 28.5% daripada variasi dalam pemboleh ubah bersandarnya.
Model ini juga mempunyai nilai min kuasa dua ralat yang jauh lebih kecil iaitu 0.891 berbanding 68.309 dalam model asal. Begitu juga dengan nilai ralat piawai di mana model ini mempunyai nilai tersebut yang lebih kecil jika dibandingkan dengan model asal. Selain dari itu, pengujian hipotesis terhadap semua pemboleh ubah bebas dalam model akhir juga adalah sangat bererti iaitu pada aras keertian 1%.
Oleh yang demikian, dapatlah disimpulkan bahawa model akhir merupakan model yang lebih baik dan terbaik kerana kesemua andaian model regresi telah dipenuhi setelah proses diagnostik dilakukan berdasarkan kajian yang dijalankan.
Jadual 4.11: Perbandingan antara Dua Model
Model Akhir Model Asal
2 R 2 = 0.965 R
a = 0.962
R a = 0.217
Ralat piawai = 0.944 Ralat piawai = 8.265
Min kuasa dua ralat = 0.891 Min kuasa dua ralat = 68.309
Nilai-p = 0.000**
Nilai-p = 0.006**
Pengujian Hipotesis Terhadap Pemboleh ubah Bebas
Malar = 0.000**
Malar = 0.339
Baki Klorin = 0.000**
Baki Klorin = 0.063*
Kolifom Fekal = 0.000** Kolifom Fekal = 0.077*
BK_KF = 0.000**
BK_KF = 0.062*
Kekeruhan = 0.000**
Kekeruhan = 0.014*
** Signifikan pada aras keertian 0.01 * Signifikan pada aras keertian 0.05 dan 0.10
4.2.7 Model Unjuran
Hasil daripada segala ujian yang telah dijalankan, satu model unjuran terbaik penyakit bawaan air dan makanan berdasarkan data bulanan dari Januari 2001 hingga Disember 2004 dapat dibentuk. Ia dapat diringkaskan seperti berikut:
PBA´ t = 2.668 + 1.943BK t - 2.565KF t - 13.030(BK_KF) t
+ 1.840KR
Interpretasi Model
Setelah pengujian hipotesis dijalankan, maka adalah wajar penerangan yang berkaitan dengan parameter anggaran bagi model terbaik dijelaskan. Berdasarkan model unjuran di atas, interpretasi bagi model terbaik ini dapat ditafsirkan seperti di bawah.
i) Secara purata setiap kenaikan 1 unit baki klorin dalam air minuman, bilangan pesakit akan meningkat sebanyak 2 orang dengan menetapkan nilai pemboleh ubah bebas yang lain.
ii) Secara purata setiap kenaikan 1 unit kandungan kolifom fekal dalam air minuman, akan menyebabkan bilangan pesakit menurun seramai 3 orang dengan menetapkan nilai pemboleh ubah bebas yang lain.
iii) Secara purata setiap kenaikan 1 unit gabungan baki klorin dan kolifom fekal, bilangan pesakit akan menurun seramai 13 orang dengan menetapkan nilai pemboleh ubah bebas yang lain.
iv) Secara purata setiap kenaikan 1 unit kekeruhan dalam air minuman, bilangan pesakit akan meningkat seramai 2 orang dengan menetapkan nilai pemboleh ubah bebas yang lain.
BAB 5 KESIMPULAN DAN CADANGAN