-0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 -0.5 973-991 REGRESI SPLINE TERPENALTI DENGAN PENDEKATAN MODEL LINEAR CAMPURAN

26

2.5.4. Hubungan antara Pencemar Udara dengan Faktor Meteorologis

Untuk mengetahui keeratan hubungan antara pencemar udara dengan faktor meteorologis digunakan plot CCF. Plot CCF antara konsentrasi PM 10 dengan suhu udara dan kecepatan angin disajikan pada Gambar 18, sedangkan untuk Ozon disajikan pada Gambar 19. Nilai CCF lag-k menunjukkan korelasi antara konsentrasi PM 10 pada waktu-t dengan suhu udara atau kecepatan angin pada waktu-t+k. -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-1 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-1 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-2 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-2 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-3 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-3 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-4 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-4 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-5 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-5 Gambar 18. a-e Plot CCF antara PM 10 dan suhu udara, f-j Plot CCF antara PM 10 dengan kecepatan angin pada tiap SUF 27 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-1 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-1 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-2 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-2 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-3 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-3 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-4 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-4 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-5 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 L A G

1.0 0.5

0.0 -0.5

-1.0 CC F SUF-5 Gambar 19. a-e Plot CCF antara Ozon dengan suhu udara, f-j Plot CCF antara Ozon dengan kecepatan angin pada setiap SUF Pada Gambar 18 tampak CCF antara PM 10 dengan suhu udara dan kecepatan angin pada setiap SUF mempunyai pola yang sama. Korelasi antara PM 10 dengan kecepatan angin lebih tinggi dari pada dengan suhu udara. Dengan demikian konsentrasi PM 10 lebih cenderung dipengaruhi oleh kecepatan angin dari pada suhu udara. Nilai korelasi antara konsentrasi PM 10 dengan kecepatan angin bernilai negatif dan korelasi tertinggi terjadi pada lag--2 atau lag--1, artinya peningkatan kecepatan angin pada waktu-t-2 atau waktu-t-1 cenderung 28 menurunkan konsentrasi PM 10 pada waktu-t. Pola hubungan ini disebabkan kecepatan angin bersama-sama dengan arah angin membantu penyebaran konsentrasi PM 10 dari satu lokasi ke lokasi lainnya Pada Gambar 19 tampak pola CCF antara Ozon dengan suhu udara dan kecepatan angin pada setiap SUF mempunyai pola yang sama. Berbeda dengan PM 10 , Ozon lebih besar dipengaruhi oleh suhu udara dari pada kecepatan angin. Hal ini tampak dari nilai CCF antara Ozon dengan suhu udara lebih tinggi dari pada dengan kecepatan angin. Suhu udara pada lag-0 paling berpengaruh terhadap konsentrasi Ozon, artinya suhu udara pada waktu-t berpengaruh positif terhadap konsentrasi Ozon waktu-t. Pola hubungan ini disebabkan sinar matahari berperan penting dalam proses pembentukan Ozon.

2.5.5. Hubungan Spatial antar Pencemar Udara

Plot CCF untuk PM 10 antar SUF disajikan pada Gambar 20 dan untuk Ozon disajikan pada Gambar 21. Pada kedua gambar tampak nilai CCF tertinggi terdapat pada lag-0, artinya konsentrasi PM 10 dan Ozon antar SUF memiliki hubungan yang erat pada waktu-t yang sama. Nilai CCF pada Ozon umumnya lebih tinggi dibandingkan pada PM 10 . Hal ini kemungkinan disebabkan Ozon berbentuk gas yang lebih mudah menyebar di udara dari pada PM 10 yang berbentuk partikel debu halus berukuran kurang dari 10 mikron. Jarak antara dua stasiun pemantau ditentukan dengan menggunakan jarak geodesi Smith dan Kolenikov 2004. Misalkan 1 1 , θ φ dan

2 2

, θ φ masing- masing adalah koordinat longitude, latitude dari dua stasiun pemantau, maka jarak antara kedua stasiun adalah : B arcsin 4 . 12732 Jarak = km, dengan

2 2

1 2

2 2

1 1

2 2

2 1 1 2 sin sin sin cos sin cos cos cos cos cos 4 θ θ φ θ φ θ φ θ φ θ − + − + − = B . Plot antara nilai CCF dengan jarak antar SUF dan persamaan garis regresinya untuk PM 10 disajikan pada Gambar 22a dan untuk Ozon disajikan pada Gambar 22b. Dari kedua Gambar ini tampak terdapat hubungan yang erat antara nilai CCF dengan jarak antar SUF, yaitu bila jarak antar SUF semakin jauh maka nilai CCF antar SUF semakin kecil. Dengan demikian konsentrasi PM 10 dan Ozon pada satu lokasi mempengaruhi konsentrasi pada lokasi lainnya atau 29 mempunyai hubungan spatial. Model yang terbaik untuk menerangkan hubungan spatial pada PM 10 dan Ozon adalah model eksponensial. 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-2 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-2 vs SUF-4 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-3 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-2 vs SUF-5 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-4 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-3 vs SUF-4 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-5 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-3 vs SUF-5 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-2 vs SUF-3 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-4 vs SUF-5 Gambar 20. Plot CCF konsentrasi PM 10 antar SUF 30 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-2 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-2 vs SUF-4 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-3 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-2 vs SUF-5 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-4 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-3 vs SUF-4 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-1 vs SUF-5 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-3 vs SUF-5 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-2 vs SUF-3 24 18 12 6 -6 -12 -18 -24 L A G

0.6 0.4

0.2 0.0

-0.2 -0.4 -0.6 C C F SUF-4 vs SUF-5 Gambar 21. Plot CCF konsentrasi Ozon antar SUF 31 a b Gambar 22. Plot antara CCF dengan jarak antar SUF dan persamaan garis regresinya untuk a PM 10 dan b Ozon

2.6. Simpulan

Pada data konsentrasi PM 10 dan Ozon terdapat korelasi temporal dengan model deret waktu AR2 dan mengandung pengaruh musiman dengan periode 24 jam. Di samping itu konsentrasi PM 10 dan Ozon pada waktu-t yang sama mempunyai hubungan spatial yang erat. Dengan demikian pada data PM 10 dan Ozon terdapat korelasi temporal dan korelasi spatial dan disebut sebagai data spatio-temporal. Konsentrasi PM 10 antar bulan beragam, pada musim hujan konsentrasinya lebih rendah dibandingkan pada musim kemarau. Konsentrasi PM 10 juga dipengaruhi oleh kecepatan angin pada lag--1 atau lag--2 dengan korelasinya bernilai negatif. Sedangkan konsentrasi Ozon dipengaruhi oleh suhu udara pada lag-0 dengan korelasinya bernilai positif. Sehingga faktor meteorologis berperan penting dalam menentukan konsentrasi PM 10 dan Ozon di suatu lokasi. Berdasarkan uraian di atas, maka pemodelan untuk PM 10 dan Ozon di kota Surabaya adalah menggabungkan model deret waktu dengan model spatial, dan menambahkan faktor meteorologis yang berpengaruh sebagai peubah penjelas. Model ini dapat digunakan untuk menduga PM 10 dan Ozon lokasi yang tidak terdapat stasiun pemantau kualitas udara pada waktu tertentu. y = 0.888e -0.103x R 2 = 0.5444 0.2 0.3 0.4 0.5 0.6 0.7 3 4 5 6 7 8 9 10 J a r a k C C F y = 1.133e -0.1877x R 2 = 0.7632 0.1 0.2 0.3 0.4 0.5 0.6 0.7 3 4 5 6 7 8 9 10 J a r a k C C F 32 Daftar Pustaka Biro Pusat Statistik. 2002. Surabaya dalam Angka 2002. Jakarta : Biro Pusat Statistik. Chamida. 2004. Strategi Pengendalian Pencemaran Udara berupa Kebijakan berdasarkan Pemanfaatan Model Matematik Pencemar Udara PM 10 di Kota Surabaya [tesis]. Surabaya : Pascasarjana Studi Teknik Lingkungan ITS. [Din LH Surabaya] Dinas Lingkungan Hidup Kota Surabaya. 2002. Laporan evaluasi : Hasil pemantauan kualitas udara ambien tahun 2001. Surabaya : Din LH Surabaya [Dinhub Surabaya] Dinas Perhubungan Kota Surabaya. 2002. Laporan kegiatan : Perhitungan dan analisa persimpangan yang dilengkapi dengan APILL maupun yang direncanakan. Surabaya : Dinhub Surabaya. [GTZ-SUTP]. GTZ-Sustainable Urban Transportation Project. 2000. Transportasi yang Berkelanjutan dan Kualitas Udara di Surabaya. Surabaya : Bappeda KMS. [KLH] Kementrian Lingkungan Hidup. 2002. Status Lingkungan Hidup Indonesia 2002 . Jakarta : KLH. [SARPEDAL KLH] Sarana Pengendalian Dampak Lingkungan Kementrian Lingkungan Hidup. 2003a. Indeks Standar Pencemar Udara ISPU 2001- 2003 . Jakarta : KLH. [SARPEDAL KLH] Sarana Pengendalian Dampak Lingkungan Kementrian Lingkungan Hidup. 2003b. Air Quality Monitoring 2003. Jakarta : KLH. Smith RL, Kolenikov S. 2004. Spatiotemporal modeling of PM 2.5 data with missing values . J Geophysical Research 108 STS :11-1 - 11-11. Soedomo M. 2001. Pencemaran Udara. Kumpulan Karya Ilmiah. Bandung : Penerbit ITB.

3. MODEL LINEAR CAMPURAN

3.1. Sejarah Komponen Ragam

Sejarah perkembangan komponen ragam diawali pada model dengan satu faktor. Formulasi pertama dari model efek acak dikemukakan oleh Airy pada tahun 1861. Airy melakukan pengamatan dengan teleskop pada fenomena yang sama untuk a malam dengan n i pengamatan pada malam-i. Airy menduga ragam galat untuk malam-i yang dinotasikan dengan 2 ,i σ , dan menghitung rataannya untuk untuk menduga 2 σ . Fakta ini juga menunjukkan bahwa ahli astronomi pada masa itu telah mengenal konsep derajat bebas. Pengguna kedua model efek acak adalah Chauvenet pada tahun 1863 yang menurunkan formula untuk ragam rataan umum .. var y , meskipun tanpa menuliskan modelnya Searle et al, 1992. Perkembangan komponen ragam antara tahun 1900 sampai 1939 dipelopori oleh Fisher. Kontribusi besar Fisher 1925 pada model komponen ragam adalah metode analisis ragam selanjutnya disebut metode ANOVA yaitu menyamakan jumlah kuadrat dari analisis ragam dengan nilai harapannya sesuai model acak atau campuran, sehingga menghasilkan satu gugus persamaan linear dalam komponen ragam yang akan diduga. Gagasan ini berasal dari pemakaian metode ANOVA untuk menurunkan penduga korelasi intra-kelas pada rancangan acak lengkap. Meskipun Fisher memperluas metode ANOVA satu faktor untuk data tak berimbang ke dalam model dua faktor dengan interaksi dan model-model yang kompleks, akan tetapi dalam papernya tidak pernah menggunakan operator E atau kalimat expected value untuk pendugaan komponen ragam Searle et al, 1992. Fisher 1935 menggunakan istilah component of variation yang dirangkai dalam istilah error component pada paper-nya, yang tanpa diragukan merupakan asal pemakaian dari istilah variance component. Istilah komponen ragam pertama kali digunakan oleh Daniels 1939. Tippett 1931 menjelaskan metode ANOVA untuk pendugaan komponen ragam pada data berimbang dan perluasannya pada rancangan dua faktor tanpa interaksi pada model acak. Tippett mengabaikan kemungkinan efek interaksi pada model linear, sedangkan Fisher 1925 tidak hanya menggunakan istilah interaksi tetapi juga menjelaskan interaksi antara dua faktor A dan B. Tippett pertama kali 34 menampilkan tabel ANOVA dengan nilai harapan dari kuadrat tengah Sahai dan Ageel, 2000. Komponen ragam untuk data tak berimbang pada model acak satu faktor dikemukakan oleh Cohran 1939. Perkembangan dari beragam model sangat intensif muncul antara 1940 sampai 1949. Eisenhart 1947 pertama kali menggunakan istilah Model I dan Model II untuk menyatakan model efek tetap dan model efek acak, dan juga memperhatikan kemungkinan dari model campuran. Sebelumnya Daniel 1939 dan Crump 1946 membahas tentang model acak, sedangkan Jackson 1939 membahas model campuran dua faktor tanpa interaksi. Crump juga menggunakan asumsi normal untuk pendugaan dengan metode ML. Kemudian diikuti Satterthwaite 1946 yang mengemukakan pendekatan pendugaan komponen ragam dengan sebaran contoh. Sedangkan Wald 1941 mengemukakan selang kepercayaan untuk ratio komponen ragam pada rancangan satu dan dua faktor pada data tak berimbang. Tahun 1950 sampai 1969 merupakan perkembangan terbesar dari metode pendugaan komponen ragam yang diawali dengan perluasan metode yg sudah ada dan diakhiri dengan pengukuhan metode baru berdasarkan ML atau kriteria norma minimum. Diawali Anderson dan Bancroft 1952 yang membahas komponen ragam pada data berimbang untuk model campuran dan model acak, data tak berimbang pada rancangan tersarang dan kelompok taklengkap. Dua tahun kemudian Bennett dan Franklin 1954 membahas nilai harapan kuadrat tengah dalam istilah komponen ragam. Henderson 1953 mengemukakan tentang pendugaan komponen ragam pada data tak berimbang. Paper ini dimotivasi oleh pekerjaan penulisnya yang berhubungan dengan analisis statistika pada perusahaan susu sapi. Paper ini mempresentasikan tiga metode yang berbeda dari penggunaan data tak berimbang pada model acak atau model campuran dengan sejumlah klasifikasi silang dan atau tersarang. Ketiga metode ini diadaptasi dari metode ANOVA dengan menyamaan untuk data berimbang jumlah kuadrat dengan nilai harapannya dan dikenal dengan Metode Henderson I, II, dan III. Pada tahun 1950-1969 banyak publikasi tentang sifat-sifat penduga dari metode ANOVA. Kelemahan penduga komponen ragam dengan metode ANOVA 35 pelan-pelan mulai disingkap. Hal ini tidak hanya karena metode Henderson I menghasilkan satu prosedur pendugaan komponen ragam untuk data tak berimbang yang sebelumnya tidak ada, tetapi juga ditunjang oleh kemajuan komputasi pada era awal komputer Diawali oleh Crump 1951 yang membahas metode ML untuk klasifikasi satu arah pada data berimbang dan tak berimbang, dan mendapatkan persamaan yang diselesaikan secara iteratif. Herbach 1959 menurunkan secara eksplisit penduga ML untuk model data berimbang. Kemudian diikuti Corbeil dan Searle 1976 yang menyarikan penduga ML pada sejumlah kasus data berimbang. Hartley dan Rao 1967 mengemukakan metode ML untuk model campuran dan model acak pada data berimbang atau tak berimbang. Kedatangan komputer dan perkembangan paket-paket komputasi sangat membantu dalam mengatasi permasalahan komputasi seperti prosedur iteratif metode ML. Miller 1973 meneliti sifat-sifat asimtotik dari penduga ML. Dengan demikian selang waktu antara penemuan metode ML oleh Fisher tahun 1925 dengan penerapannya pada pendugaan komponen ragam sekitar 40 tahun. Thompson 1962 juga mempelajari penduga ML dan mengenalkan gagasan maksimisasi pada bagian ML yang invarian terhadap parameter lokasi yaitu pada efek tetap dan dikenal dengan metode REML. Metode ini kemudian diterapkan untuk data tak berimbang oleh Patterson dan Thompson 1971. Kesulitan komputasi pada metode REML sama seperti pada metode ML, karena menurut Harville 1977 metode REML tidak lebih efektif dari metode ML. Hal yang menarik adalah solusi REML untuk data berimbang identik dengan penduga metode ANOVA. Berbeda dengan metode ML, metode REML memperhitungkan derajat bebas yang berhubungan dengan efek tetap. Metode lain dikemukakan oleh Rao 1972 yang dikenal dengan MINQUE minimum norm quadratic unbiased. Metode ini tidak memerlukan asumsi sebaran bagi efek acak dan tidak memerlukan iterasi. Dari beberapa metode pendugaan komponen ragam, metode ML dan REML lebih disukai khususnya pada data berimbang. 36

3.2. Model Linear Campuran

Bentuk umum model linear campuran adalah u Z X y + + = dengan R G u , ~ 1 dimana X adalah matriks desain dari efek tetap yang teramati, adalah vektor parameter pengaruh efek tetap yang tidak diketahui, Z adalah matriks desain efek acak yang teramati, u adalah vektor efek acak yang tidak diketahui, dan adalah vektor galat acak yang tidak diketahui. Sehingga nilaitengah dan matriks ragam- peragam untuk y adalah X y = E dan R ZGZ V y + = = var . Pendugaan Efek Tetap dan Efek Acak Persamaan model linear campuran didefinisikan sebagai : = + − − − − − − − y R Z y R X u G Z R Z X R Z Z R X X R X 1 1 1 1 1 1 1 2 Jika ˆ dan uˆ adalah solusi dari persamaan 2 maka baris kedua dari persamaaan 2 adalah [ ] y R Z u G Z R Z X R Z 1 1 1 1 ˆ ˆ − − − − = + + atau [ ] X y R Z G Z R Z u ˆ ˆ 1 1 1 1 − + = − − − − 3 Sedangkan baris pertama dari persamaan 2 adalah y R X u Z R X X R X 1 1 1 ˆ ˆ − − − = + 4 substitusi uˆ pada persamaan 4 menghasilkan [ ] y R X X y R Z G Z R Z Z R X X R X 1 1 1 1 1 1 1 ˆ ˆ − − − − − − − = − + + atau [ ] [ ] y R Z G Z R Z Z R X y R X X R Z G Z R Z Z R X X R X 1 1 1 1 1 1 1 1 1 1 1 1 ˆ ˆ − − − − − − − − − − − − + − = + − atau y V X X V X 1 -1 ˆ − = sehingga y V X X V X 1 1 1 - ˆ − − = 5 Penduga efek tetap ˆ adalah penduga GLS generalized least squares dan Xˆ adalah BLUE best linear unbiased estimator untuk X . Bila y mempunyai sebaran normal, maka ˆ adalah MLE maximum likelihood estimator. Penduga efek acak uˆ pada persamaan 3 dapat dinyatakan sebagai X y V GZ u ˆ ˆ 1 − = − 37 yang merupakan BLUP best linear unbiased prediction dari u Christensen, 1987. Salah satu cara yang paling sederhana untuk mendapatkan BLUP adalah menggunakan justifikasi Henderson Henderson’s justification dengan menggunakan asumsi sebaran, yaitu N ~ R Zu, X u y + dan , N ~ G u maksimisasi fungsi kemungkinan bersama y,u pada dan u yang tidak diketahui akan menghasilkan kriteria : u G u Zu X y R Zu X y 1 1 − − + − − − − 6 Suku pertama pada persamaan 6 adalah jumlah kuadrat tertimbang dan suku keduanya adalah penalti. Hal ini menunjukkan bahwa kriteria BLUP dari ,u terdiri dari GLS ditambah dengan satu suku penalti. BLUP dari ,u dapat ditulis sebagai y R C B C R C u 1 1 1 ˆ ˆ − − − + = dimana [ ] Z X C ≡ dan ≡ −1 G B sehingga y R C B C R C C u Z X y 1 1 1 ˆ ˆ BLUP − − − + = + = Pendugaan Komponen Ragam Metode yang paling banyak digunakan dalam pendugaan matriks ragam- peragam pada model linear campuran adalah metode ML dan REML, di samping metode lain seperti metode MINQUE dan MIVQUE minimum variance quadratic unbiased . Metode REML menghasilkan penduga takbias bagi parameter matriks ragam-peragam, sedangkan ML menghasilkan penduga yang bias. Penduga ML dari V ditentukan berdasarkan model sebaran N ~ V , Zu X y + Fungsi log-kemungkinan log-likelihood dari y berdasarkan model sebaran di atas adalah : { } 2 nlog log , 1 2 1 ML + − − + − = − X y V X y V V 7 MLE bagi , V diperoleh dengan memaksimumkan , ML V . Jika dilakukan optimasi terhadap dengan menganggap V tetap, maka akan diperoleh bahwa , ML V maksimum pada y V X X V X 1 1 1 - ˆ − − = , yang sama dengan 38 BLUE pada persamaan 5. Substitusi ˆ pada persamaan 7 menghasilkan profil log-kemungkinan profile log-likelihood untuk V yaitu : + − − + − = − 2 log n ˆ ˆ log 1 2 1 P X y V X y V V [ ] 2 log log 2 n 1 1 1 1 2 1 − − Ι + − = − − − − y V X X V X X V y V 8 Penduga ML bagi parameter-parameter dalam V dapat diperoleh dengan maksimisasi persamaan 8 terhadap parameter-parameternya. Prosedur iteratif pendugaan komponen ragam terdapat pada Searle et al 1992. Penurunan kriteria REML lebih rumit, yaitu meliputi maksimisasi fungsi kemungkinan dari kombinasi linear elemen y yang tidak tergantung pada . Uraian lengkap tentang metode REML dapat dijumpai pada Christensen 1987 dan Searle et al 1992. Fungsi kriteria dari REML adalah − + − − + + − = − − 2 log p n ˆ ˆ log log 1 1 2 1 REML X y V X y X V X V V 2 log log 2 p 1 2 1 P + − = − X V X V Keuntungan utama dari REML dibanding ML adalah REML memperhitungkan derajat bebas dari efek tetap dalam model linear campuran.

3.3 Pemulusan dengan Model Linear Campuran

Pada awalnya model linear campuran khususnya kasus model komponen ragam sukses diterapkan pada percobaan pemuliaan hewan yaitu untuk mengidentifikasi hewan yang mempunyai genetika unggul. Pada saat ini penerapan dalam bidang epidemiologi genetika lebih dikhususkan untuk tujuan tertentu pemuliaan hewan. Model linear campuran banyak diterapkan untuk analisa data longitudinal atau pengukuran berulang dimana galat acak berkorelasi Milliken dan Johnson, 1984. Suatu paradigma baru di bidang pemulusan adalah pendekatan model linear campuran untuk pemulusan Wand, 2003. Penerapan model linear campuran untuk metode pemulusan didorong oleh munculnya teori P-spline yang dikemukakan oleh Eiler dan Mark 1996 dan Ruppert dan Carroll 1997. Di samping itu, pendekatan ini juga ditunjang oleh munculnya paket program model linear campuran di SAS dan S-PLUS Pedan, 2003. 39 P-spline adalah regresi spline yang diduga dengan minimisasi jumlah kuadrat terpenalti. Misalkan hubungan fungsional antara peubah penjelas x dengan respon y dimodelkan sebagai i i i ε + = x s y dan fungsi mulus s dimodelkan sebagai regresi spline yang dinotasikan sebagai u Z X + = s dimana i bebas stokastik dengan nilaitengah nol dan ragam 2 , sedangkan p 1 , , , β β β = dan pK 1 p ,..., u u = u adalah vektor parameter, = p n 1 p 1 1 1 1 x x x x X dan − − − − = + + + + p K n p 1 n p K 1 p 1 1 κ κ κ κ x x x x Z adalah matriks desain, p p ≥ = + w w w adalah basis fungsi pangkat terpotong berderajat-p truncated power function , dan selanjutnya disingkat dengan FPT dengan 1 p ≥ adalah bilangan bulat positif, dan K 1 ... κ κ adalah simpul tetap. Jumlah kuadrat terpenalti pada P-spline didefinisikan sebagai u u u Z X y u Z X y λ + − − − − 9 Suku pertama pada persamaan 9 adalah jumlah kuadrat galat dan suku keduanya adalah penalti kekasaran, dan λ adalah parameter pemulus. Bila kriteria spline terpenalti dibagi dengan 2 σ dan λ σ σ

2 2

u = , maka akan diperoleh u u u Z X y u Z X y 2 u 2 1 1 σ σ + − − − − 10 Kriteria P-spline pada persamaan 10 sama dengan kriteria BLUP dari model linear campuran pada persamaan 6 bila matriks I R 2 u σ = dan I G 2 σ = . Efek samping yang menarik dari hubungan antara P-spline dengan model linear campuran adalah parameter pemulus P-spline merupakan rasio antara dua komponen ragam. Hubungan matematis antara P-spline dengan model linear campuran telah dibahas oleh beberapa peneliti antara lain Wang 1998, Fan dan Zhang 1998, Brumback et al 1999, Vebyla et al 1999, French et al 2001, dan Wand 2003. 40 Model linear campuran juga digunakan untuk prediksi spatial seperti yang dikemukakan oleh Diggle et al 1998 yaitu dengan mendesain komponen efek acak mempunyai fungsi ragam spatial variogram tertentu. Akhir-akhir ini juga banyak penelitian tentang prediksi spatial dimensi rendah untuk kriging dan spline-2 thin-plate spline dengan menggunakan model campuran. Pendekatan ini merupakan perluasan dari P-spline untuk data spatial yang dikemukakan oleh French et al 2001, Kamman dan Wand 2003, Ranalli et al 2005. Penerapan lainnya dari model linear campuran adalah untuk pendugaan area kecil small area estimation seperti yang dikemukakan oleh Kleinschmidt et al 2001 dan Opsomer 2005. Pada metode deret waktu, Tsimikas dan Ledolter 1997 merepresentasikan state-space dalam bentuk model linear campuran sehingga bisa diduga dengan metode REML. Pada saat ini banyak penelitian tentang pengembangan model linear campuran dengan menggabungkan pendekatan-pendekatan di atas seperti yang dikemukaan oleh Zhang et al 1997, Guo 2002, Wu dan Zhang 2002. Daftar Pustaka Anderson RL, Bancroft TL.1952. Statistical Theory in Research. New York : McGraw-Hill. Bennett CA, Franklin NL. 1954. Statistical Analysis in Chemistry and Chemical Industry . New York : John Wiley Sons. Brumback BA, Ruppert D, Wand MP. 1999. Comment on Variable selection and function estimation in additive nonparametric regression using a data-based prior by Shively, Kohn and Wood. J Amer Stat Ass 94:794-797. Christensen R. 1984. Plane Answers to Complex Questions. The Theory of Linear Models . New York : Springer-Verlag. Cohran WG. 1939. The use of analysis of variance in enumeration by sampling. J Amer Stat Ass 34: 492-510. Corbeil RR, Searle SR. 1976. A comparison of variance component estimators. Biometrics 32: 779-791. Crump SL. 1946. The estimation of variance components analysis of variance. Biometrics Bull 2: 7-11. Crump SL. 1951. The variance component analysis. Biometrics 7 : 1-16. Daniel HE. 1939. The estimation of component of variance. J R Stat Soc Suppl 6:186-197. 41 Diggle PJ, Tawn JA, Moyeed RA. 1998. Model-based geostatistics with discussion. Appl Stat 47:299-350. Eilers PHC, Marx BD. 1996. Flexible smoothing with B-splines and penalties with discussion. Stat Sci 11: 89-121. Eisenhart C. 1947. The assumptions underlying the analysis of variance. Biometrics 3:1-21. Fan J, Zhang JT. 1998. Comment on Smoothing spline models for the analysis of nested and crossed samples of curves by Brumback and Rice. J Amer Stat Ass 93: 961-994. Fisher RA.1925. Statistical Methods for Research Workers. 1 st edn. Edinburg and London: Olyver Boyd. Fisher RA.1935. Discussion of Neyman et al. J R Stat Soc, Series B 2:154-155. French JL, Kammann EE, Wand MP. 2001. Comment on Semiparametric nonlinear mixed-effects models and their applications by Ke and Wang. J Amer Stat Ass 96:1285-1288. Guo W. 2002. Functional mixed effects models. Biometrics, 58, 121-128. Hartley HO, Rao JNK. 1967. Maximum likelihood estimation for the mixed analysis of variance model. Biometrika 54:93-108. Harville DA.1977. Maximum likelihood approaches to variance component estimation and to related problems. J Amer Stat Ass 72:320-340. Henderson CR. 1953. Estimation of variance and covariance components. Biometrics 9:226-252. Herbach LH. 1959. Properties of Model II type of analysis of variance tests. An optimum nature of F-test for Model II in balanced case. Ann Math Stat 30:030-959. Jackson RWB. 1939 Reliability of mental tests. Brit. J Psycol 29:267-287. Kammann EE, Wand MP. 2003. Geoadditive models. Appl Stat 52:1-18. Kleinschmidt I, Sharp BL, Clarke GPY, Curtis B, Fraser C. 2001. Use of Generalized linear mixed models in the spatial analysis of small-area malaria incidence rates in KwaZulu Natal, South Africa. Amer J Epidemiology 15312: 1213-1221 Miller JJ. 1973. Asymptotic properties of maximum likelihood estimates in the mixed model of the analysis of variance. Ann Stat 5:746-762. Milliken GA, Johnson DE. 1984. Analysis of Messy Data, Volume I : Design Experiment . New York : Van Nostrand Reinhold Company. Opsomer JD. 2005. Small area estimation using penalized spline regression. International Biometric Society, Eastern North American Region meeting, Austin, TX, March 21, 2005. [terhubung berkala]. http:www.stat. colostate.edu~nsustarmapppsOpsomer.Spline_survey ENAR.pdf Pedan A. 2003. Smoothing with SAS PROC MIXED. SUGI 28: 268-28 42 Ranalli, MG, Breidt FJ, Wang H. 2005. Low-rank smoothing splines on complex domains. Seminar, Atlantic Ecology Division, EPA, Narragansett, RI. March 1, 2005. [terhubung berkala]. http:www.stat.colostate.edu~nsu starmap pps ranalli_epaaed_march1.pdf Rao CR. 1972. Estimation of variance and covariance component in linear models. J Amer Stat Ass 67:112-115. Ruppert D, Carroll RJ. 1997. Penalized regression splines. Unpublished manuscript. [terhubung berkala]. http:www.orie.cornell.edu~davidr papersIndex index.html Sahai H, Ageel, MI. 2000. The Analysis of Variance. Fixed, Random, and Mixed Models . Boston : Birkhäuser. Satterthwaite FE. 1946. An approximate distribution of estimates of variance components. Biometric Bull 2:110-114. Searle SR, Casella G, McCulloch CE. 1992. Variance Component. New York : John Wiley Sons. Thompson WA. 1962. The problem of negative estimates of variance components. Ann Math Stat 33:273-289. Tippett LHC. 1931. The Method of Statistics. 1 st edn. London : Williams and Norgate. Tsimikas JF, Ledolter J. 1997. Mixed model representation of state space models : New smoothing results and their application to REML estimation. Stat Sinica

7: 973-991

Verbyla AP, Cullis BR, Kenward, MG, Welham SJ. 1999. The analysis of designed experiments and longitudinal data by using smoothing splines with discussion. J R Stat Soc, Series C 48: 269-312. Wald A. 1941. On the analysis of variance in case of multiple classifications with unequal class frequencies. Ann Mathc Stat 12:346-350. Wand M. 2003. Smoothing and mixed models. Comp Stat 18 : 223–249. Wang Y, 1998. Mixed effects smoothing spline analysis of variance. J R Stat Soc, Series B 60:159-174. Wu H, Zhang JT. 2002 Local polynomial mixed-effects models for longitudinal data. J Amer Stat Ass 97:883-897. Zhang, D, Lin X, Raz, J, Sower MF. 1998. Semiparametric stochastic mixed models for longitudinal data. J Amer Stat Ass 93:710-719.

4. REGRESI SPLINE TERPENALTI DENGAN PENDEKATAN MODEL LINEAR CAMPURAN

Abstrak Regresi spline terpenalti, atau P-spline, adalah regresi yang ditentukan dengan kuadrat terkecil dan penalti kekasaran. P-spline dapat direpresentasikan dalam bentuk model linear campuran dengan komponen ragam mengontrol tingkat ketidaklinearan dari penduga fungsi mulus. Pendugaan P-spline dengan pendekatan model linear campuran mempunyai tiga keuntungan. Keuntungan pertama adalah P-spline dapat diduga dengan metode ML atau dengan metode REML. Keuntungan kedua adalah komputasi lebih cepat karena menggunakan basis pemulus berdimensi rendah. Keuntungan ketiga adalah P-spline dapat dikembangkan menjadi model aditif. Kata kunci : spline terpenalti, P-spline, pemulus spline, parameter pemulus, penalti kekasaran, model linear campuran, REML, komponen ragam Abstract Penalized splines, or P-splines, are regression splines that fit by least squares with a roughness penalty. P-spline models can be presented as a simple form of linear mixed model in which variance components control the non- linearity degree in the smooth function estimator. The mixed model formulation of P-spline has three advantages. The fist advantage is that P-spline can be estimated by restricted maximum likelihood. The second advantage is that computation of P-spline is fast since they use a low-rank dimension of smoothing basis. The third advantage is that P-spline can be extended into additive models. Key words : penalized spline, P-spline, smoothing spline, smoothing parameter, roughness penalty, mixed model, REML, variance component 44 Pendahuluan Analisis regresi digunakan untuk memodelkan hubungan antara peubah respon dengan satu atau lebih peubah penjelas. Metode ini berkembang dari model parametrik sampai dengan model nonparametrik. Regresi parametrik memerlukan asumsi yang ketat, sebaliknya regresi nonparametrik tidak memerlukan asumsi. Sehingga regresi nonparametrik bersifat fleksibel dan menghasilkan model yang berbasis data. Beberapa metode regresi nonparametrik antara lain metode kernel, regresi spline, pemulus spline, dan ekspansi deret wavelet dan Fourier. Pendekatan model nonparametrik dengan spline ada dua macam yaitu regresi spline dan pemulus spline. Regresi spline memerlukan jumlah simpul yang relatif sedikit dan dapat diduga dengan metode kuadrat terkecil. Pemulus spline memerlukan jumlah simpul yang banyak dan kemulusan kurva ditentukan oleh parameter pemulus dan fungsi penalti. Eilers dan Mark 1996, Ruppert dan Carroll 1997 menggabungkan kedua pendekatan spline di atas menjadi P-spline regresi spline terpenalti. P-spline menggabungkan dua keuntungan, yaitu dari pendugaan parametrik pada regresi spline dan penyesuaian yang fleksibel terhadap tingkat kehalusan kurva yang dihasilkan dari penalti kekasaran pada pemulus spline. Hubungan matematis antara regresi spline terpenalti dengan model linear campuran telah dibahas oleh Fan dan Zhang 1998, Brumback dan Rice 1998, Wang 1998, Brumback et al 1999, Vebyla et al 1999, French et al 2001, Kamman dan Wand 2003, dan Wand 2003. Regresi spline terpenalti dapat diformulasikan sebagai penduga kemungkinan maksimum dalam kerangka model linear campuran. Efek samping yang menarik dari hubungan ini adalah parameter pemulus berhubungan dengan komponen ragam dari model linear campuran. Hubungan antara pemulusan dengan model linear campuran terbuka setelah munculnya paket program model linear campuran di SAS dan S-PLUS. Pada Bab ini akan dibahas kajian teori dan empiris tentang pendugaan regresi spline terpenalti dengan model linear campuran. 45 Regresi Spline Terpenalti Misalkan i i , y x adalah pengukuran pada peubah penjelas x dan peubah respon y untuk n i 1 ≤ ≤ . Misalkan hubungan fungsional antara x dengan y dimodelkan sebagai i i i ε + = x s y 11 dengan s adalah fungsi mulus, i bebas stokastik dengan ragam 2 . Model 11 adalah bentuk regresi nonparametrik yang paling sederhana dan banyak metode pendekatan yang dapat digunakan seperti yang dibahas oleh Eubank 1988, Green dan Silverman 1994, dan Simonoff 1996. Misalkan fungsi mulus s diduga dengan model regresi spline yaitu : = + − + + + + = K 1 k p k pk p p 1 ... ; κ β β β x u x x s x 12 dengan pK 1 p p ,..., , ,..., u u β β = adalah vektor koefisien regresi spline, 1 p ≥ adalah bilangan bulat positif, p p ≥ = + w w w adalah FPT, dan K 1 ... κ κ adalah simpul tetap. Untuk peubah tunggal, selain basis FPT dapat juga digunakan basis natural kubik spline, atau basis B-spline, sedangkan untuk peubah ganda umumnya digunakan fungsi basis radial. Penduga parameter ˆ ditentukan dengan minimisasi jumlah kuadrat terpenalti, yaitu Js yang didefinisikan sebagai : D = + − = n 1 2 i i ; J i x s y s λ 13 dengan λ adalah parameter pemulus, dan , diag K 1 p 1 D + = . Suku pertama pada Js adalah jumlah kuadrat galat dan suku keduanya adalah penalti kekasaran. Kriteria penentuan model pada persamaan 13 merupakan gabungan antara kriteria pada model regresi dengan kriteria pada pemulus spline. Sehingga minimisasi Js pada nilai λ tertentu akan memberikan kompromi antara kebaikan pengepasan dengan kemulusan kurva. Model aditif degan kriteria pendugaan ini disebut juga dengan regresi spline terpenalti Ruppert dan Carroll, 1997. Parameter pemulus ≥ λ menggambarkan tingkat pertukaran antara jumlah kuadrat galat dengan keragaman lokal. Bila λ bernilai besar maka 46 komponen utama dalam Js adalah penalti kekasaran sehingga kurva s akan tampak mulus. Sebaliknya bila λ bernilai kecil maka komponen utama dalam Js adalah komponen jumlah kuadrat galat sehingga kurva s akan tampak kasar. Misalkan T adalah matriks desain untuk regresi spline dengan baris ke-i dari matriks T yaitu p K i p 1 i p i i i ... , , ... , , 1 + + − − = κ κ x x x x T , maka dalam notasi matriks Js dapat dinyatakan sebagai D T y T y + − − 14 Minimisasi persamaan 14 menghasilkan penduga bagi parameter yaitu y T D T T 1 ˆ − + = sehingga penduga regresi spline terpenalti adalah y T D T T T T y 1 ˆ ˆ − + = = 15 Hubungan antara Regresi Spline Terpenalti dengan Model Linear Campuran Hubungan antara pemulus spline dengan model linear campuran telah dibahas oleh banyak peneliti, seperti Vebyla et al 1999 yang menghubungkan antara pemulus spline dari Green dan Silverman 1994 dengan BLUP dari model linear campuran. Sedangkan hubungan antara regresi spline terpenalti dengan model linear campuran antara lain diuraikan oleh Brumback dan Rice 1998, Fan dan Zhang 1998, Wang 1998, Brumback et al 1999, French et al 2001, Kamman dan Wand 2003, dan Wand 2003. Kunci hubungan antara regresi spline terpenalti dengan model linear campuran adalah memperlakukan koefisien u pk pada model 12 ekivalen dengan efek acak pada model linear campuran pada persamaan 1. Misalkan didefinisikan vektor parameter p 1 , , , β β β = , pK 1 p ,..., u u = u , dan matriks desain = p n 1 p 1 1 1 1 x x x x X dan − − − − = + + + + p K n p 1 n p K 1 p 1 1 κ κ κ κ x x x x Z . Kriteria spline terpenalti pada persamaan 14 jika dibagi dengan 2 σ dapat ditulis sebagai u u u Z X y u Z X y

2 2

1 σ λ σ + − − − − 16 47 Persamaan 16 sama dengan kriteria BLUP dari model linear campuran pada persamaan 7 dengan memperlakukan u sebagai koefisien dari efek acak dengan I u 2 u cov σ = dimana λ σ σ

2 2

u = . Dengan demikian formulasi regresi spline terpenalti dalam bentuk model linear campuran adalah u Z X y + + = , dengan = u

2 2

u cov σ σ , sehingga BLUP untuk fungsi n 1 ,..., x s x s s = x diberikan oleh u Z X y ˆ ˆ ˆ + = 17 dimana y Z Z X X Z Z X 1 -

2 2

u 1 1 -

2 2

u ˆ σ σ σ σ + + = − dan 1 2 2 u 2 u ˆ ˆ X y Z Z Z u − + = − σ σ . Solusi yˆ pada persamaan 17 dapat dinyatakan dalam bentuk y C D C C C y 1 ˆ − + = 18 dimana [ ] Z X C = , , diag K 1 p 1 D + = dan 2 u 2 σ σ λ = . Persamaan 18 ekivalen dengan solusi regresi spline terpenalti pada persamaan 15. Bukti ini menunjukkan bahwa BLUP untuk x s pada model linear campuran ekivalen dengan penduga regresi spline terpenalti Djuraidah dan Aunuddin, 2006a. Penerapan pada Data Pencemar PM 10 dan Ozon Untuk memberikan ilustrasi tentang pendugaan regresi spline terpenalti dengan pendekatan model linear campuran digunakan data konsentrasi PM 10 dan Ozon gm 3 di SUF-1 pada bulan Mei 2002 sampai Agustus 2002. Data lebih dulu ditransformasi logaritma agar bentuk sebarannya simetrik. Pola konsentrasi PM 10 dan Ozon terhadap jam dimodelkan dengan regresi spline terpenalti untuk selanjutnya disebut P-spline dan pemulus kubik spline. Derajat dari basis FPT yang digunakan pada P-spline adalah 1, 2, dan 3. Jumlah simpul yang digunakan pada P-spline sebesar 36 mengikuti aturan Ruppert 2002. Pendugaan model P-spline menggunakan pendekatan model linear 48 campuran. Pada pemulus kubik spline, penduga parameter diseleksi berdasarkan nilai GCV general cross validation yang paling kecil. Hasil pendugaan model untuk PM 10 disarikan pada Tabel 1. Pada ketiga model P-spline tampak kecenderungan nilai penalti kekasaran semakin kecil dengan bertambahnya derajat basis P-spline. Perbedaan nilai parameter pemulus antara P-spline dengan pemulus kubik spline tidak terlalu besar. Penalti kekasaran pada P-spline berderajat 3 bernilai terkecil, sedangkan pada pemulus kubik spline bernilai terbesar. Hal ini berarti P-spline derajat 3 mempunyai kurva paling mulus, sedangkan pemulus kubik spline mempunyai kurva paling kasar. Diantara ketiga model P-spline tampak P-spline berderajat 1 mempunyai nilai AIC terkecil dan nilai penalti kekasaran terbesar. Tabel 1. Nilai parameter pemulus, penalti kekasaran, dan MSE dari pemulus kubik spline dan P-spline untuk PM 10 P-spline Basis Berderajat Penduga 1 2 3 Pemulus Kubik Spline Parameter Pemulus 2.1227 2.2651 2.8293 1.7504 Penalti kekasaran 6.3664 5.9948 5.3733 8.4919 MSE 0.1943 0.1952 0.1949 0.1927 AIC 3678.0 3734.7 3770.9 - Akaike Information Criteria Kurva P-spline untuk PM 10 dengan basis FPT berderajat 1, 2, dan 3, masing-masing disajikan pada Gambar 23, 24, dan 25, sedangkan kurva pemulus kubik spline disajikan pada Gambar 26. Secara umum kurva pada Gambar 23 sampai Gambar 26 mempunyai pola yang sangat mirip. Perbedaan antara ketiga model P-spline untuk PM 10 terdapat pada lengkungan ujung-ujung kurva. Kurva P-spline berderajat-1 mempunyai ujung lengkungan yang lancip, sedangkan kurva pada P-spline berderajat-2 dan P-spline berderajat-3 mempunyai ujung lengkungan kurva tumpul. Di antara ketiga model P-spline untuk PM 10 , tampak kurva P-spline berderajat-3 paling mulus, karena mempunyai nilai penalti kekasaran yang paling kecil. 4 9 J a m K o n se n tr a si P M -1 ln 2 4 1 2 1 6 5 4 3 2 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 23. Kurva P-spline berderajat-1 untuk PM 10 J a m K o n se n tr a si P M -1 ln 2 4 1 2 1 6 5 4 3 2 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 24. Kurva P-spline berderajat-2 untuk PM 10 J a m K o n se n tr a si P M -1 ln 2 4 1 2 1 6 5 4 3 2 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 25. Kurva P-spline berderajat-3 untuk PM 10 J a m K o n se n tr a si P M -1 ln 2 4 1 2 1 6 5 4 3 2 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 26. Kurva pemulus kubik spline untuk PM 10 Hasil pendugaan model untuk Ozon disarikan pada Tabel 2. Pada ketiga model P-spline tampak kecenderungan nilai penalti kekasaran semakin kecil dengan bertambahnya derajat basis P-spline. Pada Tabel 2 tampak perbedaan nilai parameter pemulus antara P-spline dengan pemulus kubik spline tidak terlalu besar. Penalti kekasaran pada P-spline berderajat 3 bernilai terkecil, sedangkan pada pemulus kubik spline bernilai terbesar. Hal ini berarti P-spline derajat 3 mempunyai kurva paling mulus, sedangkan pemulus spline mempunyai kurva paling kasar. Diantara ketiga model P-spline tampak P-spline berderajat 1 mempunyai nilai AIC terkecil dan nilai penalti kekasaran terbesar. Tabel 2. Nilai parameter pemulus, penalti kekasaran, dan MSE dari pemulus kubik spline dan P-spline untuk Ozon P-spline Basis Berderajat Penduga 1 2 3 Pemulus Kubik Spline Parameter Pemulus 1.5369 1.2397 1.4424 1.2589 Penalti kekasaran 11.4398 7.4324 7.1350 13.6775 MSE 0.2069 0.2213 0.2138 0.2069 AIC 4060.1 4173.9 4143.1 - Kurva P-spline untuk Ozon dengan basis FPT berderajat 1, 2, dan 3, masing-masing disajikan pada Gambar 27, 28, dan 29, sedangkan kurva pemulus kubik spline disajikan pada Gambar 30. Secara umum kurva pada Gambar 27 sampai Gambar 30 tampak mempunyai pola yang sangat mirip. Seperti halnya pada PM 10 , perbedaan antara ketiga model P-spline terdapat pada lengkungan ujung-ujung kurva. Kurva P-spline berderajat-1 mempunyai ujung lengkungan yang lancip, sedangkan kurva P-spline berderajat-2 dan P-spline berderajat-3 mempunyai ujung lengkungan kurva yang tumpul. Di antara tiga model P-spline, kemulusan kurva P-spline berderajat-2 dan P-spline berderajat-3 hampir sama. Hal ini tercermin dari nilai penalti kekasaran kedua model yang hampir sama. 5 1 J a m K o n se n tr a si O zo n ln 2 4 1 2 1 6 5 4 3 2 1 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 27. Kurva P-spline berderajat-1 untuk Ozon J a m K o n se n tr a si O zo n ln 2 4 1 2 1 6 5 4 3 2 1 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 28. Kurva P-spline berderajat-2 untuk Ozon J a m K o n se n tr a si O zo n ln 2 4 1 2 1 6 5 4 3 2 1 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 29. Kurva P-spline berderajat-3 untuk Ozon J a m K o n se n tr a si O zo n ln 2 4 1 2 1 6 5 4 3 2 1 2 4 1 2 1 2 4 1 2 1 2 4 1 2 1 B L N = 5 B L N = 6 B L N = 7 B L N = 8 Gambar 30. Kurva pemulus kubik spline untuk Ozon Simpulan Perbedaan nilai parameter pemulus antara P-spline dengan pemulus kubik spline tidak terlalu besar, meskipun P-spline menggunakan basis berdimensi rendah. P-spline menghasilkan kurva yang lebih mulus dibandingkan dengan pemulus kubik spline. P-spline dengan basis berderajat 1 mempunyai nilai AIC terkecil. Pendekatan P-spline dengan model linear campuran memberikan kemudahan dalam pendugaan model dengan komputasi yang cepat. Model P-spline dapat dikembangkan untuk memodelkan respon dengan peubah penjelas lebih dari satu atau model aditif. Daftar Pustaka Brumback BA, Rice JA. 1998. Smoothing spline models for the analysis of nested and crossed samples of curves with discussion. J Amer Stat Ass 93: 961-994. Brumback BA, Ruppert D, Wand MP. 1999. Comment on Variable selection and function estimation in additive nonparametric regression using a data-based prior by Shively, Kohn and Wood. J Amer Stat Ass 94: 794-797. Christensen R. 1984. Plane Answers to Complex Questions. The Theory of Linear Models. New York : Springer-Verlag. Djuraidah A, Aunuddin. 2006. Pendugaan Regresi Spline Terpenalti dengan Pendekatan Model Linear Campuran. Statistika Jurnal Statistika FMIPA- UNISBA 6: 39-46. Eilers PHC, Marx BD. 1996. Flexible smoothing with B-splines and penalties with discussion. Stat Sci 11: 89-121. Eubank RL. 1988. Spline Smoothing and Nonparametric Regression. New York : Marcel Deker . Fan J, Zhang JT. 1998. Comment on Smoothing spline models for the analysis of nested and crossed samples of curves by Brumback and Rice. J Amer Stat Ass 93: 961-994. French JL, Kammann EE, Wand MP. 2001. Comment on Semiparametric nonlinear mixed-effects models and their applications by Ke and Wang. J Amer Stat Ass 96:1285-1288. Green PJ, Silverman BW. 1994. Nonparametric Regression and Generalized Linear Models : a Roughness Penalty Approach . London: Chapman Hall. Kammann EE, Wand MP. 2003. Geoadditive models. Appl Stat 52:1-18. Ruppert D, Carroll RJ. 1997. Penalized regression splines. Unpublished manuscript. [terhubung berkala]. http:www.orie.cornell.edu~davidr papersIndex index.html Ruppert D. 2002. Selecting the number of knots for penalized splines. J Comp Graph Stat 11: 735–757. Searle SR, Casella G, McCulloch CE. 1992. Variance Component. New York : John Wiley Sons. Simonoff JS. 1996. Smoothing Methods in Statistics. New York : Springer- Verlag. Wand M. 2003. Smoothing and mixed models. Comp Stat 18:223–249. Wang Y. 1998. Mixed effects smoothing spline analysis of variance. J R Stat Soc, Series B 60:159-174. Verbyla AP, Cullis BR, Kenward, MG, Welham SJ. 1999. The analysis of designed experiments and longitudinal data by using smoothing splines with discussion. J R Stat Soc, Series C 48: 269-312.

5. MODEL ADITIF DERET WAKTU DENGAN