Development of robustness on additive Main Effect – Multiplicative Interaction (AMMI) Models

(1)

PENGEMBANGAN KEKEKARAN MODEL

ADDITIVE MAIN

EFFECT

MULTIPLICATIVE INTERACTION

(AMMI)

ALFIAN FUTUHUL HADI

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2012


(2)

(3)

iii

PERNYATAAN MENGENAI DISERTASI DAN

SUMBER INFORMASI

Dengan ini saya menyatakan bahwa disertasi berjudul Pengembangan Kekekaran Model Additive Main Effect Multiplicative Interaction (AMMI)

adalah karya saya sendiri dengan arahan komisi pembimbing dan belum pernah diajukan dalam bentuk apapun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun yang tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini.

Bogor, Maret 2012

Alfian Futuhul Hadi


(4)

(5)

v

ABSTRACT

Alfian Futuhul Hadi. Development of Robustness on Additive Main Effect –

Multiplicative Interaction (AMMI) Models. Supervised by AHMAD ANSORI MATTJIK, I MADE SUMERTAJAYA, I WAYAN MANGKU, and AAN ANDANG DARADJAT.

AMMI model for interactions in two-way table provide the major mean for studying stability and adaptability through GEI, which modeled by full interaction model. Eligibility of AMMI model depends on the assumption of normally independent distributed error with a constant variance. Nowadays, AMMI models have been developed for any condition of MET data i.e the violence of normality and homegeneity assumptions. We can mention in this class of modelling as MAMMI for Mixed AMMI model and GAMMI for Generalized AMMI model. GAMMI model handles non-normality i.e categorical response variables using an algorithm of alternating regression. While handling the non-homogeneity in mixed-models sense, one may use a model called factor analytic multiplicative for a MAMMI models. Outlier might be found in the data coincides with non-homogeneity variance. A method of handling outlier in additive and multiplicative modeling by applying Robust Alternating Regression (RAR) in FANOVA model. RAR FANOVA model was downweighting outlying scores and loadings in the k-dimensional spaces of scores and loadings, and robust estimator will be minimized under the constraints that are consistent with robust approach of the median of parameters.

Application of GAMMI was found in several distribution of exponential family. The most interesting here is Poisson distribution which it has a unique property of equal mean and variance. Many zero observations make some dificulties and fatal consequence in Poisson modeling. We consider to facilitates an analysis of two-way tables of count with many zero observations in AMMI model. We develop GAMMI model for Poisson with zeroes problem, by a statistical framework of RCAM. Some link function apply to the mean of a cell equalling a row effect plus a column effect plus interaction terms are modelled as a reduced-rank regression with rank of 2, then it will be visualized by Biplot through SVD reparameterization. The ZIP-GAMMI model handle the excess-zero and also the overdispersion at once. The interaction structures are extracted from the non-zero cell. ZIP model provide us the probability become zero and the fitted value of the Poisson. The modelling scheme involves two important things: (1) the distribution (and link-function) and (2) the rank of model. Both are confounded, especially if there is overdispersion or excess-zero. Best-model fit can be provided by proper link function with respect to data’s distribution, at the same time it’s also possible

by the rank of the model in decomposing the interaction terms. In this case the likelihood ratio test provides us the hypothesis testing.

Keywords: AMMI, GAMMI, MAMMI, FANOVA, Robust Alternating Regression, ZIP, Row-Column Association Models (RCAM), SVD Reparameterization. Multi-Environment Trial (MET)


(6)

(7)

vii

RINGKASAN

Alfian Futuhul Hadi. Pengembangan Kekekaran Model Additive Main Effect – Multiplicative Interaction (AMMI). Dibimbing oleh AHMAD ANSORI MATTJIK, I MADE SUMERTAJAYA, I WAYAN MANGKU, dan AAN ANDANG DARADJAT.

Statistika telah lama berkontribusi terhadap penelitian pemuliaan tanaman, terutama dalam pendekatan biometrika bidang genetika kuantitatif. Lebih jauh, model AMMI telah lama digunakan secara luas untuk menganalisis Interaksi Genotipe × Lingkungan (IGL) dalam percobaan multi lokasi. Kesahihan model AMMI bergantung pada kenormalan dan kehomogenan ragam galat. Adanya pencilan (pada satu arah tertentu) kemungkinan dapat mempengaruhi pengujian kenormalan. Masalah ketaknormalan data pada pemodelan aditif-multiplikatif (bilinear) disebabkan oleh dua faktor utama yaitu: (i) karena terdapatnya pengamatan pencilan dan (ii) oleh sebaran data itu sendiri, termasuk di dalamnya pencatatan cacahan. Penelitian ini memfokuskan perhatian pada kekekaran model AMMI terhadap pencilan pada sebaran normal dan kekekaran model terhadap ketaknormalan data cacahan khususnya pada masalah nilai nol.

Pada data numerik yang mengikuti sebaran normal, keberadaan pencilan pada satu sisi tertentu akan menimbulkan kemenjuluran (skewnesss) yang cenderung terdeteksi sebagai ketaknormalan. Model AMMI sebagaimana model-model lain yang menggunakan penguraian nilai singular (singular value decompoition/SVD) seperti Analisis Komponen Utama dan Analisis Faktor, rentan terhadap adanya pencilan, karena SVD berbasis kuadrat terkecil. Padahal dalam upaya mendapatkan varietas yang unggul, pencilan justru menjadi sesuatu yang berharga. Oleh karena itu, mengabaikan keberadaannya tidaklah bijaksana. Untuk itu diperlukan upaya pengembangan model AMMI yang relatif ”kekar”

terhadap adanya pencilan.

Saat ini, model AMMI telah dikembangkan untuk setiap kondisi data percobaan multilokasi yang mengalami pelanggaran asumsi kenormalan dan kehomogenan ragam. Kita dapat menyebutkan dalam kelas ini pemodelan sebagai MAMMI untuk model AMMI campuran (Mixed AMMI model) dan GAMMI untuk model AMMI terampat (Generalized AMMI model). GAMMI menangani ketaknormalan peubah respon yang kategorik, menggunakan algoritma regresi bolak-balik. Sementara dalam menangani ketakhomogenan ragam dalam model campuran, kita dapat menggunakan model yang disebut model faktor analitik ganda. Pengembangan model AMMI dimaksudkan untuk menangani pencilan yang mungkin ditemukan bersamaan dengan ketakhomogenan ragam. Sebuah metode penanganan pencilan pada model aditif multiplikatif dibangun dengan menerapkan regresi bolak-balik yang kekar (Robust Alternating Regression, RAR) pada model faktor-analisis ragam (factor analysis of variance, FANOVA). Model RAR FANOVA menurunkan bobot (downweighting) nilai pencilan pada skor dan loading dalam ruang berdimensi k. Penduga parameter (dalam hal ini yang kekar) diperoleh dengan meminimumkan simpangan mutlak di bawah kendala dengan statistik median yang konsisten dengan pendekatan robust.


(8)

viii

Sementara pada data kategorik, sejauh ini beberapa penggunaan model AMMI terampat telah dilakukan pada distribusi Poisson dan beberapa sebaran keluarga eksponensial. Secara khusus sebaran Poisson menarik untuk dikaji karena memiliki sifat yang unik yaitu memiliki nilai ragam yang sama dengan rataannya. Banyak pengamatan nol membuat beberapa kesulitan dan konsekuensi yang fatal dalam pemodelan Poisson dan interpretasinya. Kami mempertimbangkan untuk memfasilitasi analisis tabel dua arah yang berisi cacahan (counting) dalam bidang pertanian dengan pengamatan nol yang berlebih, misalnya, cacahan populasi atau serangan hama/penyakit pada tanaman. Tanaman yang tidak memiliki tanda-tanda serangan, dapat terjadi karena dua hal: karena ia tahan, atau hanya karena tidak ada serangan (tidak ada endemi). Keduanya adalah nol struktural dan nol sampling yang terjadi menurut sebuah proses acak.

Kami mengembangkan model AMMI yang mampu mengakomodasi nilai nol yang berlebih melalui kerangka kerja statistika yang melibatkan model asosiasi baris-kolom (RCAM) bagi data cacahan, kemudian memberlakukannya pada data cacahan tabel dua arah dengan beberapa pengamatan nol. RCAM dengan fungsi hubung logaritma untuk rataan sel, yang setara dengan pengaruh baris ditambah pengaruh kolom ditambah pengaruh interaksi dimodelkan sebagai regresi reduksi dimensi dengan rank 2, kemudian akan divisualisasikan oleh Biplot.

Model GAMMI ZIP mampu menangani masalah nol-berlebih dan overdispersi sekaligus memberikan nilai peluang sel untuk menjadi nol pada pengamatan nol yang acak, dan memberikan nilai dugaan Poisson pada sel tak nol. Dengan model ini struktur interaksi dipertahankan melalui sel-sel tak nol. Adanya sel nol-struktural dapat memaksa kita untuk menggunakan model ZIP, selain model ZIP memberikan keuntungan lain. Diagnosis pemilihan model menyangkut dua hal yaitu (1) pilihan sebaran dan fungsi hubung yang berkenaan dengan sebaran data dan interpretasi serta (2) penentuan rank dalam menjelaskan stuktur interaksi. Keduanya hampir tak terpisahkan (confounded) apalagi bila terjadi overdispersi ataupun nol-berlebih. Model yang pas dapat diperoleh dari sebaran dan fungsi hubung yang tepat, pada saat yang sama dapat pula oleh derajat penguraian interaksi (rank model). Dalam hal ini uji nisbah kemungkinan memberikan jalan keluar bagi pemilihan model.

Kata kunci : AMMI, GAMMI, MAMMI, model faktor analitik, FANOVA, model multiplikatif, regresi-bolak-balik, Robust Alternating Regression, Zero Inflated Poisson (ZIP), Row-Column Association Models (RCAM), SVD Reparameterization.


(9)

ix

©Hak Cipta Milik Institut Pertanian Bogor, Tahun 2012 Hak cipta dilindungi Undang-Undang

1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan atau menyebutkan sumbernya.

a. Pengutipan hanya untuk kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan, penulisan kritik atau tinjauan suatu masalah

b. Pengutipan tersebut tidak merugikan kepentingan IPB yang wajar. 2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya tulis


(10)

(11)

xi

PENGEMBANGAN KETERAMPATAN PADA MODEL

ADDITIVE MAIN EFFECT

MULTIPLICATIVE

INTERACTION

(AMMI)

ALFIAN FUTUHUL HADI

Disertasi

sebagai salah satu syarat untuk memperoleh gelar Doktor

pada Departeman Statistika

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2012


(12)

xii

Penguji pada Ujian Tertutup : Prof. Dr. Ir. Aunuddin, MSc.

Dr. Ir. M. Syukur, MS.

Penguji pada Ujian Terbuka : Prof. (Em.) Ir. Achmad Baihaki, MSc. PhD.


(13)

xiii

Judul Disertasi : Pengembangan Kekekaran Model Additive Main Effect – Multiplicative Interaction (AMMI)

Nama Mahasiswa : Alfian Futuhul Hadi

NIM : G161070021

Disetujui Komisi Pembimbing

Prof. Dr. Ir. A. A. Mattjik, MSc. Ketua

Dr. Ir. I M. Sumertajaya, MS. Anggota

Dr. Ir. I W. Mangku, MSc. Anggota

Dr. Ir. A. A. Daradjat, MS. Anggota

Diketahui Ketua Program Studi

Statistika

Dr. Ir. Aji Hamim Wigena, MSc.

Dekan Sekolah Pascasarjana Institut Pertanian Bogor

Dr. Ir. Dahrul Syah, MSc.Agr.


(14)

(15)

xv

PRAKATA

Puji syukur penulis panjatkan kehadirat Allah SWT karena hanya atas rahmat dan karunia-Nya, disertasi ini dapat terselesaikan. Tulisan ini merupakan salah satu syarat untuk memperoleh gelar Doktor pada Program Studi Statistika di Institut Pertanian Bogor.

Penulis menyadari bahwa penyelesaian tulisan ini tidak lepas dari bantuan banyak pihak. Penulis menyampaikan terima kasihkepada para pembimbing, Prof. Dr. Ir. A. A. Mattjik, MSc., Dr. Ir. I Made Sumertajaya, MS., Dr. Ir. I Wayan Mangku, MSc. dan Dr. Ir. Aan A. Daradjat, MS. atas curahan waktu, bimbingan, arahan, nasihat dan dorongan moral kepada penulis dari awal hingga selesainya disertasi ini. Penulis juga tidak lupa menyampaikan terima kasih kepada para penguji yang telah memberikan masukan dan saran bagi disertasi ini.

Penghargaan dan ucapan terima kasih penulis sampaikan kepada Balai Penelitian Tanaman Kacang-kacangan dan Umbi-umbian (Balitkabi), di Malang Jawa Timur, juga kepada Balai Besar Penelitian Tanaman Padi (BB Padi), di Sukamandi, Subang Jawa Barat atas kesempatan yang diberikan kepada penulis selama melakukan penelitian. Secara khusus ucapan terima kasih penulis sampaikan kepada Dr. Ir. Rudi Iswanto, MP. (Balitkabi), Trias Sitaresmi, SP. dan Cucu Gunarsih, SP. MP. (BB Padi), Dr. Thomas W. Yee (Department of Statistics, The University of Auckland, New Zealand), Dr. Peter Filzmoser (Vienna University of Technology, Austria) juga Prof. F.A. van Eeuwijk (Depatment of Statistics, University of Wageningen) serta L.C.P. Keizer (Centre for Plant Breeding and Reproduction Research, Wageningen) atas waktu, pengetahuan, pengalaman dan informasi yang diberikan kepada penulis.

Terima kasih penulis sampaikan kepada Direktorat Jenderal Pendidikan Tinggi Kementrian Pendidikan Nasional atas dukungan dana beasiswa BPPS, beasiswa SandwichLike dan Hibah Disertasi Doktor yang telah diberikan.

Rasa hormat dan terima kasih penulis sampaikan kepada kedua orang tua, Ayahanda Abdul Muchith Muzadi dan Ibunda Siti Faridah (alm) atas do’a restu


(16)

xvi

Djauhari sekeluarga dan mas Arif Musaddad, atas dukungan fasilitas terutama tempat tinggal selama di Bogor sehingga penulis dapat menyelesaikan studi S3.

Penulis mengucapkan penghargaan dan kebanggaan kepada istri tercinta adinda Halimatus Sa’diyah serta ananda Hasna Adibah dan Azzam Muzadi atas

ketulusan, pengertian, kesabaran, dan pengorbanan yang terus-menerus diberikan kepada penulis selama menempuh S3. Demikian juga kepada papa Abdul Wahid dan mama Indah Purwati.

Penulis juga menyampaikan penghargaan dan terima kasih kepada saudara kembar penulis, Mumtaz D. Ahmadi atas segala dukungannya juga kepada mas Edi M. Rosjadi, mbak Inayati Sya’roni, mbak Eni Nur’aini dan mas Wahyuddin, mbak Ida Haidaroh dan mas Nafi, serta bulik Hanifah Muzadi yang selalu

memberikan dorongan dan do’a sehingga penulis dapat menyelesaikan disertasi. Secara khusus penghargaan yang setinggi-tingginya penulis sampaikan kepada Prof. Dr. Ir. A. A. Mattjik, MSc. sebagai guru, teladan, dan rekan kerja. Tidak hanya statistika dan disertasi ini yang penulis peroleh tapi jauh lebih dari itu, banyak teladan dan pelajaran berharga, bahkan pelajaran terbesar justru penulis dapatkan dari beliau saat penulis masih di Tingkat Persiapan Bersama IPB 19 tahun silam. Semoga akan terus bermanfaat pada masa mendatang.

Kepada rekan-rekan mahasiswa S2 dan S3 Statistika IPB, penulis menyampaikan terima kasih atas kebersamaan selama menempuh studi, utamanya Tim Hibah Pascasarjana di bawah asuhan Prof. Mattjik. Secara khusus, penulis menyampaikan penghargaan kepada Suluh Nusantoro atas bantuan akses jurnal, Bagus Sartono dan Dr. Toni Baktiar atas jurnal dan diskusinya, juga mas Fuad atas kebersamaannya selama penyelesaian disertasi, mas Anton, mas Arif, mbak Ida, bunda Diyah, Nada dan Firdaus (KMNU) atas koreksi ejaannya. Terima kasih kepada senior-senior di UNEJ, Prof. Dr. Ir. Rudi Wibowo, dan Ir. Sumadi, MS. atas rekomendasi dan motivasinya untuk melajutkan studi.

Penulis menyadari bahwa disertasi ini masih jauh dari kesempurnaan, namun besar harapan penulis bahwa hasil penelitian ini bermanfaat. Semoga.

Bogor, Maret 2012

Alfian Futuhul Hadi


(17)

xvii

RIWAYAT HIDUP

Penulis dilahirkan di Jember, Jawa Timur pada tanggal 19 Juli 1974, sebagai sepasang anak kembar dari Bapak Abdul Muchith Muzadi dan Ibu Siti Faridah (alm). Penulis adalah putra bungsu dari delapan bersaudara. Pendidikan Sarjana ditempuh di Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor pada tahun 1993 – 1998. Pada tahun 2006, penulis memperoleh gelar Magister Sains dari Program Studi Statistika, Sekolah Pascasarjana Institut Pertanian Bogor (SPS-IPB) dibawah bimbingan Prof Dr. Ir. A. A. Mattjik, MSc. dan Dr. Ir. I Made Sumertajaya, MS. Sejak tahun 2007 penulis menempuh Program Doktor pada Program Studi Statistika, SPS-IPB dengan Beasiswa Program Pascasarjana (BPPS) dari Direktorat Jenderal Pendidikan Tinggi (DIKTI) Kementrian Pendidikan Nasional Republik Indonesia.

Dalam kegiatan perkuliahan Program Doktor, penulis telah memfokuskan perhatian pada pemodelan statistika pada bidang pemuliaan tanaman dengan menempuh beberapa matakuliah penunjang pemuliaan tanaman, antara lain, Pemuliaan Tanaman, Metode Penelitian (Kuantitatif) Pemuliaan Tanaman dan Genetika Kuantitatif. Sejak 2008 penulis bergabung dengan payung penelitian (research group) biometrika di bawah asuhan Prof. Dr. Ir. A. A. Mattjik, MSc. Selama mengikuti pendidikan Program Doktor beberapa karya ilmiah penulis bersama pembimbing dan rekan-rekan dalam research group biometrika telah dipresentasikan dalam seminar internasional atau dipublikasikan dalam jurnal ilmiah, bahkan sebagian telah dibukukan dalam sebuah buku riset bersama Prof. Dr. Ir. A. A. Mattjik, MSc., Dr. Ir. I Made Sumertajaya, MS. dan Gusti Ngurah Adhi Wibawa, MSi. Pada tahun 2010 penulis berkesempatan mengikuti program Sandwich-Like DIKTI dan melakukan sebagian penelitian disertasi di Departement of Statistics, The University of Auckland, New Zealand, dibawah bimbingan Dr. Thomas W. Yee. Bersama beliau penulis menyelesaikan satu artikel ilmiah yang pada seminar internasional dan telah disubmit pada jurnal internasional.


(18)

xviii

Karya-karya ilmiah yang merupakan bagian dari Program Doktor penulis, antara lain adalah sebagai berikut:

1. Yee, T. W & Hadi A F. 2011. Row – Column Association Models, 26th International Workshop on Statistical Modelling (IWSM2011) Universitat de València, Spain, July 11-15th , 2011. Submited to the R Journal, January 2012.

2. Hadi, A F, Sumertajaya I M, & Iswanto R.. Zero-Inflated Poisson Row-Column Association Models in Agricultural Trial: towards ZIP-AMMI Models. International Conference on Mathemathics and Sciences, The Sepuluh November Institute of Technology, Surabaya, Indonesia, October 12

– 14th 2011.

3. Hadi, A F & Mattjik A A. 2011. Handling Outlier Observation Two-Ways Table by Robust Alternating Regression of Fanova Models: Towards Robust AMMI Models. Jurnal Ilmu Dasar (Terakreditasi). Vol. 12 No. 2, p. 123-131 .

4. Hadi, A F & Mattjik A A. 2010. Generalized AMMI Models For Assessing the Endurance of Soybean to Leaf Pest. Jurnal Ilmu Dasar (Terakreditasi). Vol. 11 No. 2, p. 151-159 .

5. Mattjik, A A, Sumertajaya I M., Hadi A F, & Wibawa G N A (ed.), 2011 Model AMMI: Kini dan yang Akan Datang. IPB Press. Bogor.


(19)

xix

DAFTAR ISI

DAFTAR GAMBAR ... xxiii

DAFTAR TABEL ... xxv

DAFTAR LAMPIRAN ... xxvii

DAFTAR ISTILAH ... xxix

BAB I. PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Perumusan Masalah ... 2

1.3 Tujuan ... 5

1.4 Kerangka Pemikiran ... 5

1.5 Kebaruan Penelitian (novelty) ... 6

BAB II. REVIEW PEMODELAN INTERAKSI DAN TOPIK TERKAIT ... 9

2.1 Pengantar ... 9

2.2 Konsep Dasar Stabitilitas Genotipe ... 9

2.3 Model AMMI ... 10

2.3.1 Langkah Pemodelan AMMI ... 11

2.3.2 Perhitungan Jumlah Kuadrat dan Penguraian Derajat Bebas .... 13

2.3.3 Nilai Komponen AMMI dan Penentuan Banyaknya Komponen AMMI ... 13

2.3.4 Interpretasi Biplot AMMI ... 14

2.4 Model Faktor Analitik untuk Model AMMI Campuran ... 16

2.5 Konsep Dasar Model Linear Terampat ... 17

2.6 Model AMMI Terampat (Generalized AMMI model) ... 19

2.6.1 Algoritma Pengepasan Model AMMI Terampat ... 19

2.6.2 Penentuan Banyaknya Suku Multiplikatif ... 22

2.6.3 Diagnostik Sisaan ... 22

2.6.4 Penyajian Interaksi melalui Biplot Model GAMMI ... 24

2.7 Model Baris-kolom Goodman ... 25

2.8 Pendekatan Regresi Reduksi Dimensi (Reduce Rank Regrssion) ... 25

2.9 Kesesuaian Dua Konfigurasi Matriks: Metode Procrustes ... 26

2.10 Uji Nisbah Kemungkinan (Likelihood Ratio Test) ... 30

BAB III. PENANGANAN PENGAMATAN PENCILAN PADA MODEL AMMI ... 31

3.1 Pengantar ... 31

3.2 Antisipasi Pengaruh Pencilan pada Model AMMI ... 32

3.3 Model Faktor Analitik dan Model AMMI ... 32

3.3.1 Model Faktor Analitik ... 33


(20)

xx

3.4 Pengembangan Kekekaran pada Model AMMI ... 35

3.4.1 Penduga Regresi Bolak-balik yang Kekar terhadap Pencilan .. 36

3.4.2 Pengepasan Model melalui FANOVA dengan Penduga RAR . 39 3.4.3 Algoritma Kekar untuk Regresi Bolak-balik (Robust Alternating Regression Algorithm) ... 40

3.5 Kajian Kekekaran Model FANOVA terhadap Tambahan Nilai Ekstrim ... 44

3.5.1 Data dengan Tambahan Nilai Ekstrim ... 44

3.5.2 Kekekaran Model FANOVA terhadap Tambahan Nilai Ekstrim ... 44

3.6 Penerapan Model FANOVA pada Data Riil ... 48

3.7 Penutup... 51

BAB IV. MODEL AMMI UNTUK DATA CACAHAN SEBARAN POISSON ... 53

4.1 Pengantar ... 53

4.2 Model AMMI Terampat pada Sebaran Poisson ... 54

4.2.1 Representasi Odds Ratio pada Biplot GAMMI Poisson ... 56

4.3 Pendekatan Transformasi Kenormalan pada Model AMMI untuk Sebaran Poisson ... 57

4.3.1 Transformasi Box-Cox ... 58

4.4 Penerapan Model GAMMI Poisson ... 59

4.4.1 Langkah Penerapaan Model GAMMI Poisson ... 60

4.4.2 Penerapan pada Percobaan dengan Inokulasi: Ketahanan Genotipe Kedelai terhadap Hama Daun ... 62

4.4.3 Penerapan pada Percobaan Lapangan Tanpa Inokulasi: Ketahanan Genotipe Kacang Hijau terhadap Penyakit Bercak Daun ... 65

4.5 Penggunaan Transformasi Box-Cox pada Data Cacahan Berdistribusi Poisson... 69

4.5.1 Transformasi Data Populasi Hama Daun pada Kedelai ... 70

4.5.2 Transformasi Data Serangan Penyakit Bercak Daun pada Kacang Hijau ... 73

4.5.3 Perbandingan Matriks Interaksi dengan Procrustes ... 75

4.6 Penutup... 78

BAB V. MODEL AMMI DATA CACAHAN DENGAN MASALAH NILAI NOL... 81

5.1 Pengantar ... 81

5.2 Zero-inflation dan Konsekuensinya ... 82

5.3 Penanganan Zero-inflation pada Model Aditif ... 83

5.4 Pengembangan Model GAMMI untuk Zero-Inlfated Poisson ... 85


(21)

xxi

5.4.2 Regresi Reduksi Dimensi Terampat (RR-VGLM) ... 88

5.4.3 Model Asosiasi Baris-Kolom (RCAM) untuk Data Cacahan dalam RR-VGLM ... 89

5.4.4 Model Zero-Inflated Poisson dalam RR-VGLM ... 91

5.4.5 Reparameterisasi – SVD pada RCAM untuk model GAMMI .. 92

5.4.6 Perhitungan Derajat Bebas Model GAMMI-ZIP ... 93

5.5 Penerapan Model GAMMI-ZIP... 93

5.5.1 Data Serangan Penyakit Karat Daun pada Kacang Hijau ... 93

5.5.2 Ketahanan Genotipe Kacang Hijau terhadap Penyakit Karat Daun ... 95

5.6 Perbandingan Model GAMMI ZIP dengan Model GAMMI Poisson ... 98

5.6.1 Skenario Perbandingan Model ZIP dengan Model Poisson ... 98

5.6.2 Kajian Perbandingan Model GAMMI – ZIP dan model GAMMI Poisson ... 98

5.7 Penutup ... 100

BAB VI. PEMBAHASAN UMUM ... 103

BAB VII. KESIMPULAN DAN SARAN ... 109

7.1 Kesimpulan ... 109

7.2 Saran ... 110

DAFTAR PUSTAKA ... 113


(22)

(23)

xxiii

DAFTAR GAMBAR

Gambar 1.1 Kerangka pikir penelitian ... 6 Gambar 3.1 Boxplot pengaruh pencilan baris dan kolom pada

penambahan masing-masing sebuah nilai ekstrim atas pada

baris dan kolom ... 46 Gambar 3.2 Boxplot pengaruh pencilan baris dan kolom pada

penambahan masing-masing 4 buah nilai ekstrim atas pada

baris dan kolom ... 46 Gambar 3.3 Perubahan R-kuadrat Procrustes dari matrkis interaksi dugaan

model AMMI dan FANOVA kekar menurut persentase

tambahan nilai ekstrimnya ... 48 Gambar 3.4 Boxplot pengaruh baris (Genotipe) dan kolom (Lingkungan)

data konsorsium padi ... 50 Gambar 3.5 Biplot IGL model FANOVA kekar (faktor 1 49.43%,

kumulatif 2 faktor 53.76%) ... 50 Gambar 4.1 Tinjauan geometris tentang odds (A) dan odds ratio (B) ... 56 Gambar 4.2 Algoritma pengepasan model GAMMI ... 61 Gambar 4.3 Plot residual untuk data hama kedelai: plot residual terhadap

nilai dugaan model gammi-2 log-link (kiri); plot working

variate terhadap prediktor linear (kanan) ... 64 Gambar 4.4 Biplot GAMMI-2 dengan fungsi hubung logaritma data

serangan hama daun pada kedelai ... 65 Gambar 4.5 Plot sisaan terhadap nilai dugaan model GAMMI-2 untuk

IGL pengamatan penyakit bercak daun pada tanaman kacang hijau ... 67 Gambar 4.6 Biplot GAMMI-2 untuk IGL pengamatan penyakit bercak

daun pada tanaman kacang hijau ... 68 Gambar 4.7 Kerangka analisis penggunaan transformasi kenormalan

pemodelan AMMI pada sebaran Poisson (a) dan kajian

perbandingannya dengan model GAMMI Poisson (b) ... 69 Gambar 4.8 Plot log-likelihood transformasi box-cox data populasi hama

daun ... 70 Gambar 4.9 Plot Uji kenormalan hasil transformasi box-cox data populasi

hama daun ... 71 Gambar 4.10 Plot sisaan model AMMI2 data populasi hama daun dengan


(24)

xxiv

Gambar 4.11 Biplot AMMI 2 data populasi hama daun yang ditransformasi dengan Box-Cox ... 73 Gambar 4.12 Plot sisaan model AMMI 2 data kacang hijau terserang

bercak daun dengan transformasi Box-Cox. ... 74 Gambar 4.13 Biplot AMMI 2 data serangan penyakit bercak daun pada

kacang hijau yang ditransformasi dengan Box-Cox ... 75 Gambar 4.14 Matriks interaksi (a) model AMMI dengan transformasi

Box-Cox, (b) model GAMMI Poisson pada data hama daun

kedelai ... 76 Gambar 4.15 Matriks interaksi (a) model AMMI dengan transformasi

Box-Cox, (b) model GAMMI Poisson pada data penyakit bercak

daun pada kacang hijau ... 77 Gambar 5.1 Kerangka pengembangan model GAMMI-ZIP ... 86 Gambar 5.2 Tahapan analisis model GAMMI-ZIP ... 95 Gambar 5.3 Biplot bagian log dari GAMMI-ZIP ... 97 Gambar 6.1 Keterkaitan hasil pengembangan pemodelan

aditif-multiplikatif yang kekar terhadap ketaknormalan dan


(25)

xxv

DAFTAR TABEL

Tabel 2.1 Fungsi hubung (kanonik) dalam model linear terampat ... 18 Tabel 3.1 Pembobot bagi pengaruh pengungkit pada penambahan nilai

ekstrim ... 45 Tabel 3.2 Pembobot bagi pengaruh pengungkit pada penambahan nilai

ekstrim baris dan kolom sekaligus ... 45 Tabel 3.3 Banyaknya pengaruh pencilan dan pengungkit serta

R-kuadrat Procrustes matriks interaksi dugaan model AMMI

dan FANOVA kekar menurut tambahan nilai ekstrimnya ... 47 Tabel 3.4 Daftar galur-galur padi sawah pada data multilokasi

konsursium Padi ... 49 Tabel 3.5 Kode lingkungan data multilokasi konsursium Padi ... 49 Tabel 3.6 Pembobot bagi pengaruh baris dan kolom terhadap pencilan ... 49 Tabel 4.1 Populasi lima jenis hama daun pada empat genotipe kedelai... 63 Tabel 4.2 Analisis devians untuk data populasi hama daun ... 63 Tabel 4.3 Uji log-likelihood untuk data populasi hama daun ... 64 Tabel 4.4 Banyaknya tanaman kacang hijau terserang penyakit bercak

daun ... 66 Tabel 4.5 Uji log-likelihood model GAMMI Poisson untuk data

penyakit bercak daun pada kacang hijau ... 66 Tabel 4.6 Nilai lambda dugaan dan log-likelihood transformasi

Box-Cox data populasi hama daun ... 70 Tabel 4.7 Analisis ragam untuk populasi hama daun ternormalkan ... 72 Tabel 4.8 Nilai lambda dugaan dan log-likelihood transformasi

Box-Cox data penyakit bercak daun pada kacang hijau ... 73 Tabel 4.9 Analisis ragam untuk data penyakit bercak daun yang

dinormalkan ... 74 Tabel 5.1 Banyaknya tanaman kacang hijau yang terserang penyakit

karat daun ... 94 Tabel 5.2 Diagnostik pemilihan rank untuk model GAMMI ZIP dengan

uji nisbah kemungkinan (likelihood ratio test) ... 95 Tabel 5.3 Nilai peluang menjadi nol, untuk model GAMMI – ZIP

rank = 2 ... 96 Tabel 5.4 Nilai dugaan model GAMMI – ZIP rank = 2 ... 97 Tabel 5.5 Uji log likelihood model GAMMI ZIP dan model GAMMI


(26)

xxvi

Tabel 5.6 Uji log-likelihood model GAMMI ZIP dan GAMMI Poisson untuk data bercak daun ... 100 Tabel 5.7 Uji log-likelihood Model GAMMI ZIP dan GAMMI Poisson

untuk data hama daun ... 100


(27)

xxvii

DAFTAR LAMPIRAN

Lampiran 1. Matriks Interaksi Dugaan Model AMMI dan FANOVA

Kekar ... 121 Lampiran 2. Matriks Interaksi. Median Genotipe dan Median Lingkungan

Data Konsorsium Padi ... 126 Lampiran 3. Biplot AMMI1: KUI1 vs rataan populasi hama daun

ternormalkan ... 127 Lampiran 4. Data hama daun hasil transformasi BoxCox ... 127 Lampiran 5. Data serangan penyakit bercak daun hasil transformasi

BoxCox ... 127 Lampiran 6. Sebaran Zero-inflated Poisson sebagai sebaran campuran

antara Poisson dan Bernouli ... 128 Lampiran 7. Fungsi Massa Peluang (FMP), nilai harapan, dan ragam

peubah acak X yang menyebar Poisson ... 129 Lampiran 8. Fungsi Massa Peluang (FMP), nilai harapan, dan ragam


(28)

(29)

xxix

DAFTAR ISTILAH

AMMI = Singkatan dari Additive Main effect and Multiplicative Interaction

Terampat = Generalized

IGL = Interaksi Genotipe × Lingkungan

Pengepasan = fitting

Pencilan = Pengamatan yang nilainya jauh dari sesamanya, terjemahan dari outlier

GLM = Generalized Linear Models

MLT = Model Linear Terampat terjemahan dari

Generalized Linear Models

Robust = Kekar, tidak mudah terpengaruh oleh adanya pencilan. Sebuah pendekatan statistika yang memperhatikan sifat kekekaran terhadap pencilan FANOVA = Singkatan dari Factor Analysis of Variance Alternating Regression = Regresi bolak-balik (baris dan kolom)

RAR = Singkatan dari Robust Alternating Regression, regresi bolak-balik yang kekar terhadap pencilan

MAD = Median Absolute Deviation

Data cacahan = Data yang berisi hitungan frekuensi (banyaknya) terjemahan dari counting data

Least Square = Metode Kuadrat Terkecil, metode pendugaan parameter model yang meminimumkan jumlah kuadrat dari simpangan terhadap rataan

IRLS = Singkatan dari Iterative Reweighted Least Square. Pendugaan parameter dengan metode kuadrat terkecil terboboti yang dilakukan secara iteratif. SVD = Singkatan dari Singular Value Decomposition,

penguraian matriks menjadi matriks yang ortonormal dengan mengekstraksi nilai singular matriksnya

GBM = Singkatan dari Generalized Bilinear Models GAMMI = Singkatan dari Generalized AMMI

RCAM = Singkatan dari Row-Column Association Models VGLM = Singkatan dari Vector Generalized Linear Models Reduce Rank Regression = Diterjemahkan sebagai Regresi Reduksi Dimensi RR-VGLM = Singkatan dari Reduce Rank Vector Generalized


(30)

xxx

GRC = Goodman’s Row-Column Models, adalah model

baris-kolom yang diusulkan oleh Goodman

Corner constrain = Diterjemahkan sebagai Kendala Sudut, adalah salah satu kendala dalam pemodelan yang meng-nol-kan suku kiri atas matriks kendala

SVD Reparameterization = Parameterisasi ulang model menurut kendala yang ortonormal dengan memanfaatkan SVD

Model GAMMI ZIP = Model GAMMI untuk sebaran ZIP

Link function = Diterjemahkan sebagai Fungsi Hubung, fungsi transformasi peluang pada GLM

VGAM = Paket R yang dibuat oleh Thomas W. Yee untuk beberapa model termasuk RR-VGLM, RCAM


(31)

1

BAB I. PENDAHULUAN

1.1 Latar Belakang

Kecukupan pangan (ketahanan dan keamanan) dunia sampai saat ini kuncinya terletak pada peningkatan efisiensi dalam penggunaan sumberdaya. Efisiensi tersebut dapat dilakukan melalui peningkatan produktivitas yang di dalamnya termasuk pengetahuan yang berkembang dalam mengeksplorasi interaksi antara genotipe dan lingkungan (Mattjik 2005). Pembangunan pertanian Indonesia harus dilakukan melalui pengembangan sumberdaya genetik yang mendukung pemenuhan pangan dengan mempertahankan kemandirian, serta mengurangi ketergantungan penyediaan benih dari luar negeri. Penyediaan benih yang demikian menuntut dilakukannya riset pemuliaan tanaman yang memanfaatkan sumberdaya genetik lokal untuk menghasilkan varietas-varietas baru yang memiliki stabilitas yang lebih baik (atau adaptabilitas spesifik) dari sisi produksi maupun ketahanan terhadap hama/penyakit.

Untuk menjamin tersedianya pangan yang berkualitas perlu dilakukan berbagai upaya termasuk di antaranya adalah kajian tentang daya adaptasi berbagai genotipe tanaman pada berbagai kondisi yang tersedia, yang sering dikenal dengan sebutan uji multi lokasi (multi environments trial atau MET). Uji multi lokasi melibatkan dua faktor utama yaitu genotipe tanaman dan kondisi lingkungan. Lingkungan dapat berupa tempat/lokasi (site), musim, ataupun perlakuan agronomis/agronomic treatment). Dari uji multi lokasi diharapkan mampu memilah pengaruh utama (genotipe dan lingkungan) dan pengaruh Interaksi antara Genotipe dengan Lingkungan (IGL). Dari pengaruh interaksi tersebut dapat dipilah genotipe-genotipe yang mampu beradaptasi pada berbagai kondisi lingkungan (genotipe stabil) dan genotipe-genotipe yang hanya sesuai pada lingkungan tertentu (genotipe spesifik lokasi). Untuk mampu memilah kedua pengaruh ini dengan baik dibutuhkan pendekatan analisis yang tepat.

Pendekatan analisis yang berkembang sampai saat ini untuk percobaan lingkungan ganda antara lain analisis kestabilan Eberhart & Russel, analisis regresi linear terhadap pengaruh lingkungan dan Additive Main effect and Multiplicative Interaction (AMMI). Dari beberapa penelitian yang telah dilakukan


(32)

2

diketahui bahwa pendekatan AMMI lebih baik dalam mengkaji struktur interaksi antara genotipe dengan lingkungan. Model AMMI mampu menjelaskan interaksi dengan baik melalui model interaksi lengkap atau dikenal sebagai suku multiplikatif/bilinear (Sumertajaya 1998). Groenen & Koning (2004a) menunjukkan penggunaan biplot pada model bilinear sebagai cara baru memvisualisasi interaksi pada model Analysis of Variance (ANOVA). Struktur interaksi diuraikan dari matriks sisaan komponen aditif dengan memanfaatkan sifat matematis penguraian nilai singular (Singular Value Decomposition, SVD). SVD merupakan pendekatan kuadrat terkecil dengan reduksi dimensi (pangkat matriks) data yang terbaik dan menyediakan penyajian secara grafis yang dikenal secara luas dengan nama Biplot.

1.2 Perumusan Masalah

Seiring dengan permasalahan riil pada pemuliaan tanaman, beberapa hal dari pendekatan AMMI perlu dikembangkan untuk memperluas cakupan analisisnya. Hal ini dimaksudkan sebagai upaya optimalisasi penggunaan model AMMI dalam mendekomposisi IGL dalam rangka pemenuhan pangan.

Pada dua dasawarsa terakhir, metode seleksi adaptabilitas genotipe melalui percobaan multilokasi telah banyak menggunakan model AMMI. Model AMMI pada dasarnya adalah model tetap (fixed model) yang mengasumsikan genotipe dan lingkungan ditentukan secara subyektif oleh peneliti dan kesimpulan yang diharapkan hanya terbatas pada genotipe dan lingkungan yang dicobakan saja. Namun telah pula berkembang model campuran, campuran antara faktor tetap dan acak (Mixed/Random AMMI). Model ini memperluas cakupan kesimpulan, dimana faktor lingkungan bersifat acak dan kesimpulan untuk faktor lingkungan berlaku untuk populasi lingkungan, dalam hal ini lokasi budidaya tanaman yang lebih luas. Sementara itu, untuk data kualitatif telah berkembang pula model kategorik (GLM-AMMI/Generalized Linear Model AMMI) yaitu jika respon yang diamati bersifat kategorik (van Eeuwijk 1995, Groenen & Koning 2004b, Hadi et al. 2010, Hadi et al. 2008).

Suatu percobaan multi lokasi membutuhkan biaya yang tidak sedikit. Di samping melibatkan begitu banyak genotipe, ia juga dilakukan pada berbagai


(33)

3 lingkungan budidaya di Indonesia. Desain percobaan di tiap-tiap lokasi haruslah sama. Beberapa asumsi dan kaidah perancangan percobaan ada kalanya tidak dapat dipenuhi, seperti kebebasan antar pengamatan, termasuk di dalamnya asumsi sebaran data. Masalah utama yang akan muncul dalam analisis seleksi adaptabilitas melalui model AMMI adalah masalah ketaknormalan data.

Dalam kasus data tidak menyebar normal, kelayakan model AMMI menjadi tidak terpenuhi. Data yang berdistribusi tidak normal cenderung memiliki ketakhomogenan ragam di dalamnya, dan bila dimodelkan dengan AMMI, ketakhomogenan ragam tidak dapat ditangani dengan baik, sehingga dapat berakibat buruk dalam pendugaan dan pengujian, karena membesarnya dugaan galat model.

Kadangkala ada alasan kuat untuk tetap memodelkan data pada skala pengamatan, sekalipun skala pengamatan ini cenderung menimbulkan masalah ketaknormalan dan ketakhomogenan ragam. Kehomogenan ragam dapat diatasi dengan menambahkan satu atau lebih suku multiplikatif interaksi (van Eeuwijk 1995). Ketika tidak ada alasan untuk memaksa pemodelan tetap pada skala pengamatan, maka transformasi terhadap peubah respon dapat dilakukan untuk mengurangi masalah ini. Model linear atau bilinear dikenakan pada data tertransformasi dan sifat sebaran sisaan diasumsikan memenuhi sebaran normal.

Pada data numerik yang mengikuti sebaran normal, keberadaan pencilan pada satu sisi tertentu akan menimbulkan kemenjuluran (skewnesss) yang cenderung terdeteksi sebagai ketaknormalan. Kita perlu mendeteksi suatu pengamatan sebagai pencilan dari suatu sebaran normal atau sebaran simetrik, ataukah pengamatan tersebut menjadi bagian dari suatu sebaran tertentu yang tidak simetrik. Oleh karena itu, pada penelitian ini penulis memfokuskan pada masalah ketaknormalan data pada model AMMI dalam dua sebab utama yaitu: (i) karena terdapatnya pengamatan pencilan dan (ii) oleh sebaran data itu sendiri, termasuk di dalamnya pencatatan kualitatif/kategorik.

Model AMMI sebagaimana model-model lain yang menggunakan SVD seperti Analisis Komponen Utama (Principal Component Analysis, PCA) dan Analisis Faktor, rentan terhadap adanya pencilan, karena SVD berbasis Least Square. Sedangkan dalam upaya mendapatkan varietas yang unggul, pencilan


(34)

4

justru menjadi sesuatu yang berharga, karenanya mengabaikan keberadaannya tidaklah bijaksana. Untuk itu diperlukan metode yang relatif “kekar” terhadap adanya pencilan.

Ketaknormalan pun dapat terjadi karena pencatatan peubah itu sendiri. Beberapa pengamatan tingkat adaptasi adakalanya dicatat secara kualitatif. Pencatatan data serangan hama/penyakit dalam bentuk cacahan/counting merupakan salah satu contoh fenomena ini. Analisis stabilitas dapat digunakan untuk mengidentifikasi ketahanan terhadap hama dan penyakit. Jika ada interaksi antara kultivar dan patogen, maka perlu untuk mengidentifikasi suatu kultivar yang memiliki resistensi umum dan resistensi spesifik. Namun untuk kajian ini (ketahanan terhadap penyakit dan kejadian serangan hama pada tanaman misalnya), kelayakan model AMMI dengan galat yang normal dan ragam konstan tidak selalu dapat dipenuhi.

Sebagian peneliti melakukan pencatatan menggunakan cacahan kemudian menganalisisnya sebagai intensitas serangan dalam persentase. Dengan data persentase ini kemudian ia melakukan transformasi sehingga asumsi-asumsi yang diperlukan (kenormalan dan kehomogenan ragam) terpenuhi. Selama transformasi berhasil mengatasinya maka cara ini ciukup memadai. Sayangnya menemukan transformasi yang sesuai seringkali tidak mudah.

Sementara itu, pada pemodelan aditif telah dikenal luas apa yang disebut dengan Generalized Linear Models (GLM) atau Model Linear Terampat (MLT) sebuah kelas pemodelan yang menangani data berdistribusi tidak normal. Model multiplikatif menjembatani kesenjangan antara model pengaruh utama (pada ANOVA atau GLM) dan model interaksi lengkap dengan sebuah parameter interaksi untuk setiap sel dalam tabel dua arah. Model ini pun memberikan visualisasi corak utama interaksi melalui biplot. Karenanya pengembangan teori GLM dengan mengakomodasi komponen multiplikatif untuk interaksi sangat diperlukan. Sejauh ini beberapa penggunaan model AMMI terampat pada distribusi Poisson dan Binomial telah banyak dilakukan sebagaimana yang dilakukan oleh van Eeuwijk (1995), Groenen & Koning (2004b), Hadi et al. (2008), dan Hadi et al. (2010).


(35)

5 Beberapa masalah dalam pemodelan Poisson muncul akibat kekhususan sebaran Poisson yang memiliki nilai tengah dan ragam yang sama. Akibat kekhususan ini adanya nilai ekstrim pada pengamatan cacahan akan menyebabkan penyimpangan dari sebaran Poisson yang murni. Nilai ekstrim ini termasuk pengamatan dengan nilai nol. Sebaran Poisson dengan rataan besar selalu diikuti dengan keragaman yang besar pula. Sebaliknya Poisson dengan nilai tengah yang rendah akan menghadapi masalah pada banyaknya pengamatan dengan nilai nol.

1.3 Tujuan

Berdasarkan permasalahan yang dihadapi pada pemodelan IGL, pada disertasi ini penulis memfokuskan tujuan pada pengembangan kekekaran model AMMI terutama terhadap (1) pengamatan pencilan, dan (2) data cacahan dengan masalah nilai nol.

1.4 Kerangka Pemikiran

Permasalahan pokok yang dikaji dalam penelitian ini bertolak dari pemikiran bahwa model AMMI menghadapai masalah ketaknormalan. Dalam kerangka pikir disertasi ini ketaknormalan dipandang dalam dua perspektif yaitu ketaknormalan karena terdapatnya pengamatan pencilan atau ketaknormalan oleh sebaran data itu sendiri, termasuk di dalamnya pencatatan kualitatif/kategorik. Pada masalah pertama, pencilan akan ditangani dengan mengembangkan model AMMI yang kekar pencilan, melalui model Faktor Analitik dengan pendekatan regresi kekar. Sedangkan pada masalah kedua, disertasi ini mengkhususkan pada data kategorik yang bersifat cacahan atau yang menyebar Poisson. Masalah data Poisson pada model AMMI ini telah dipelajari sebelumnya dan pengembangannnya akan menemui masalah nilai nol. Penanganan masalah nilai nol ini dilakukan melalui pendekatan regresi reduksi dimensi. Gambar 1.1 menunjukkan kerangka pikir penelitian disertasi ini.


(36)

6

Gambar 1.1 Kerangka pikir penelitian

1.5 Kebaruan Penelitian (novelty)

Hasil pengembangan kekekaran model AMMI pada pengaruh pencilan dan masalah nilai nol data cacahan diharapkan menjadi kebaruan dalam penelitian. Setidaknya dapat disebutkan dua kebaruan dalam disertasi ini yaitu:

1. Penanganan pencilan dalam kajian IGL menggunakan model Faktor Analitik yang kekar pencilan, melalui pendekatan regresi bolak-balik yang kekar. Meskipun telah dikenal sebelumnya pada analisis peubah ganda berdimensi besar namun pengembangan pada analisis interaksi, khususnya IGL, baru diperkenalkan pada penelitian ini.

Model AMMI yang kekar terhadap pencilan

Model GAMMI Poisson Zero Inflated Poisson Kajian Teori

Ketaknormalan Akibat Pengamatan Pencilan

Pengamatan Data Cacahan Pengembangan

Model Aditif-Multiplikatif Ketaknormalan pada

Model AMMI

Model Faktor Analitik, Regresi Kekar Pencilan

(L1 Regression) Projection Pursuit

Model Umum Interaksi Baris Kolom (RCAM), Model Regresi RRVGLM

Model GAMMI Masalah Pencilan pada

Sebaran Normal

Masalah Nilai Nol pada Sebaran POISSON

Penerapan Pemodelan pada Data Riil

Implementasi Komputasi

Pendugaan parameter logit, pengepasan model & Uji Diagnostik

Kesesuaian Model Identifikasi pencilan,

downweighting, pengepasan Model


(37)

7 2. Penanganan masalah nilai nol pada data cacahan sebaran Poisson untuk analisis interaksi menggunakan model GAMMI Zero-Inflated Poisson yang dikembangkan melalui pendekatan RR-VGLM menjadi satu hal yang baru.

Sebuah penjelasan keterkaitan di antara kedua pengembangan ini bermuara pada sebuah algoritma regresi bolak-balik dengan perbedaan pada kriteria fungsi tujuan regresi dan fungsi pembatas (kendala/konstrain) yang digunakan. Penjelasan ini memperkaya khasanah pengajaran teori model linear.


(38)

(39)

9

BAB II. REVIEW PEMODELAN INTERAKSI

DAN TOPIK TERKAIT

2.1 Pengantar

Fenotipe dari suatu individu ditentukan oleh genotipe dan lingkungan, kedua pengaruh ini tidak selalu didapati dalam bentuk aditif. Hal ini menunjukkan adanya Interaksi Genotipe × Lingkungan (IGL). Adanya IGL membuat keragaan dua atau beberapa genotipe tidak konsisten antar lingkungan yang berbeda. Pengaruh IGL yang signifikan ditunjukkan oleh perubahan pada perbedaan pengaruh (magnitude) antara dua atau beberapa genotipe pada dua atau beberapa lingkungan yang berbeda (Falconer 1952). IGL membuat kesulitan pada pemilihan genotipe terbaik dan paling stabil. Kesulitan oleh adanya IGL ini menjadi perhatian penting pada bidang pemuliaan tanaman terutama untuk menduga dan menyeleksi genotipe-genotipe yang berpenampilan stabil pada berbagai lingkungan berbeda atau beradaptasi spesifik pada lingkungan tertentu.

2.2 Konsep Dasar Stabitilitas Genotipe

Dalam pemuliaan tanaman, konsep stabilitas meliputi dua pengertian, yaitu

stabilitas biologis dan stabilitas agronomis (Romagosa & Fox 1993). Lin et al. (1986) mengidentifikasi tiga konsep ketabilan, yaitu:

Tipe 1: Suatu genotipe dikatakan stabil bila memiliki ragam antar lingkungan yang rendah. Kestabilan ini disebut juga stabilitas statis atau stabilitas biologis.

Genotipe yang stabil memiliki keragaan yang tidak berubah meskipun ditanam pada kondisi lingkungan yang berbeda. Konsep ini berguna bagi sifat kualitatif (qualitative traits), ketahanan penyakit (diasese resistance), atau pun untuk karakter cekaman. Statistik yang umum digunakan pada stabilitas tipe ini adalah koefisien keragaman (Coefficient of Variation) untuk setiap genotipe ( ) dan ragam genotipe antar lingkungan ( ).

Tipe 2: Suatu genotipe dikatakan stabil bila ia memiliki respon lingkungan yang paralel terhadap rataan respon semua genotipe dalam percobaan. Stabilitas ini disebut stabilitas dinamis atau stabilitas agronomis. Genotipe yang stabil tidak


(40)

10

memiliki respon yang menyimpang dari respon semua genotipe secara umum sehingga mengikuti prediksi respon pada lingkungan.

Tipe 3: Genotipe dikatakan stabil bila ia memiliki sisaan yang kecil dalam model regresi pada indeks lingkungan. Indeks lingkungan diperoleh dari rataan dari genotipe pada masing-masing genotipe dikurangi rataan umum semua genotipe pada semua lingkungan. Tipe 3 ini merupakan bagian dari stabilitas dinamis atau agronomis.

2.3 Model AMMI

Model AMMI merupakan model yang digunakan sebagai teknik analisis data bagi percobaan dua faktor perlakuan dengan pengaruh utama perlakuan bersifat aditif sedangkan pengaruh interaksi dimodelkan dengan model bilinear. Model multiplikatif (bilinear) menjembatani kesenjangan antara model pengaruh utama (pada ANOVA) dan model interaksi lengkap dengan parameter interaksi untuk tiap-tiap sel dalam tabel dua arah. Model AMMI biasa digunakan untuk menganalisis percobaan multi lokasi.

Pada dasarnya analisis AMMI menggabungkan analisis ragam aditif bagi pengaruh utama dengan analisis komponen utama ganda dengan pemodelan bilinear bagi pengaruh interaksi yang memanfaatkan SVD pada matriks interaksi (Mattjik 2005). Model AMMI merepresentasikan observasi ke dalam komponen sistematik yang terdiri dari pengaruh utama (main effect) dan pengaruh interaksi melalui suku-suku multiplikatif (multiplicative interactions), di samping komponen acak sisaan atau galat. Model AMMI adalah model dengan galat yang normal dengan ragam yang konstan.

Model AMMI telah banyak digunakan seiring dengan penerapannya dalam konteks model tetap (Crossa et al. 1990). Dalam modelnya, AMMI mengkombinasikan komponen aditif untuk pengaruh utama (Genotipe dan Lingkungan) dan komponen multiplikatif untuk pengaruh interaksi IGL. Model AMMI menggunakan teknik peubah tunggal, ANOVA, untuk efek utama dan teknik peubah ganda, PCA, untuk efek IGL. Teknik peubah ganda untuk analisis IGL ini menggunakan pemodelan bilinear dengan SVD terhadap matriks interaksi (Mattjik & Sumertajaya 2006, Mattjik 2005). Crossa et al. (1990) menyatakan


(41)

11 bahwa penggunaan teknik peubah ganda memungkinkan diperolehnya informasi yang lebih baik dari metode regresi biasa. Model ini juga memberikan gambaran pola sistematik melalui Biplot. Kekuatan model AMMI adalah kemampuannya menggambarkan pola interaksi menggunakan Biplot.

Secara umum model AMMI untuk peubah acak dari baris ke-i dan kolom ke-j adalah:

∑ √

(2.1)

dengan  adalah rataan umum, pengaruh aditif (utama) baris ke-i,

dan pengaruh aditif kolom ke-j, . Pada pendugaannya kedua pengaruh utama ini diidentifikasi dengan kendala berupa jumlah yang sama dengan nol (Mattjik & Sumertajaya 2006, van Eeuwijk 1995).

Parameter suku multipikatif pengaruh interaksi untuk baris dinotasikan dengan adalah juga skor baris sumbu ke-k dan genotipe ke-i. Skor lingkungan ke-j pada sumbu ke-k dinotasikan dengan . Nilai singular yang berpadanan dengan sumbu ke-k yang direpresentasi oleh k adalah ukuran asosiasi antara skor baris dan kolom. Nilai yang diperoleh dari SVD ini mengindikasikan tingkat kepentingan sumbu. Kuadrat dari nilai singular, yaitu nilai akar ciri sama dengan jumlah kuadrat sumbu yang bersangkutan. Kendala untuk parameter suku multiplikatif meliputi jumlah yang sama dengan nol (terpusatkan), perkalian silangnya sama dengan nol dan jumlah kuadratnya sama dengan satu. Dua kendala ini sering disebut kendala ortogonal dan norma satu (ortonormal).

2.3.1 Langkah Pemodelan AMMI

Pemodelan bilinear bagi pengaruh IGL ( ) pada analisis ini adalah sebagai berikut :

Langkah pertama menyusun pengaruh interaksi dalam bentuk matriks baris × kolom, dengan baris adalah genotipe, dan kolom adalah lokasi, sehingga matriks ini berukuran G × E.


(42)

12

{( )} [

]

Langkah selanjutnya dilakukan penguraian bilinear terhadap matriks pengaruh interaksi:

∑ √

√ √ √ (2.2) Model AMMI sebagaimana pada persamaan (2.1) mempunyai sebutan lain yang menunjuk pada struktur model tersebut, seperti model bilinear atau model biaditif. Pengaruh interaksi (2.2) dimodelkan sebagai jumlah dari suku multiplikatif, yang banyaknya sama atau kurang dari pangkat matriks sisa dari pengaruh aditif. Model AMMI secara lengkap dapat dituliskan sebagai berikut :

∑ √

√ √ √

(2.3)

dengan: ; ; k nilai singular untuk komponen bilinear ke-k (kadalah akar ciri ZTZ) dan Z matriks dari peubah yang

distandardisasi, atau zijyijyi.y.jy.. sedangkan 12 ....K;

adalah pengaruh ganda genotipe ke-i melalui komponen bilinear ke-k, pengaruh ganda lokasi ke-j melalui komponen bilinear ke-k, ,

� �

Dengan kendala identifikasi (identification constrains): 1. , untuk dan

2. untuk , simpangan dari pemodelan

bilinear bila (2.4)


(43)

13

2.3.2 Perhitungan Jumlah Kuadrat dan Penguraian Derajat Bebas

Pada pemodelan ini pengaruh aditif genotipe dan lingkungan serta jumlah kuadrat dan kuadrat tengahnya dihitung sebagaimana umumnya pada analisis ragam, tetapi dengan menggunakan data rataan per genotipe  lokasi.

Pengaruh ganda genotipe dan lingkungan pada interaksi diduga dengan

..

. . y y y

y

zijijij  sehingga jumlah kuadrat interaksi dapat diturunkan sebagai berikut :

 

( )2

 

.

.. . . 2 T j i ij ij

ij r y y y y r teras ZZ

z r GE

JK

   

dengan dan R adalah banyaknya ulangan.

Berdasarkan teorema pada aljabar matriks bahwa teras dari suatu matriks sama dengan jumlah seluruh akar ciri matriks tersebut: maka jumlah kuadrat untuk pengaruh interaksi komponen ke-k adalah akar ciri ke-k pada pemodelan bilinear tersebut ( ), jika analisis ragam dilakukan terhadap data rataan per genotipe  lingkungan. Untuk analisis ragam yang dilakukan terhadap data sebenarnya, jumlah kuadratnya adalah banyaknya ulangan dikalikan akar ciri ke-k ( ). Pengujian masing-masing komponen ini dilakukan dengan membandingkannya terhadap kuadrat tengah galat gabungan. Derajat bebas untuk setiap komponen tersebut adalah a + b – 1 – 2k. Besaran derajat bebas ini diperoleh dari jumlah p parameter yang diduga dikurangi dengan jumlah k kendala. Banyaknya parameter yang diduga adalah a + b – 1 sedangkan banyak kendala untuk komponen ke-k adalah 2k. Kendala yang dipertimbangkan adalah kendala keortogonalan antar komponen dan bernorma satu seperti pada persamaan (2.4).

2.3.3 Nilai Komponen AMMI dan Penentuan Banyaknya Komponen AMMI

Secara umum nilai komponen ke-k untuk genotipe ke-g adalah lksgn sedangkan nilai komponen utama untuk lokasi ke-e adalah 1 .

en s k

l   Dengan mendefinisikan Ls (0s1) sebagai matriks diagonal yang elemen-elemen diagonalnya adalah


(44)

14

G=ULs serta H=AL1-s maka penguraian nilai singular tersebut dapat ditulis: Z=GH T.

Dengan demikian skor komponen untuk genotipe adalah kolom-kolom matriks G sedangkan skor komponen untuk lingkungan adalah kolom-kolom

matriks H. Nilai s yang digunakan pada analisis AMMI adalah ½ .

Jika beberapa kolom pertama matriks G dan H telah dapat menghasilkan

penduga Z dengan baik maka banyak kolom matriks G dan H dapat dikurangi.

Gauch (1988) dan kemudian Crossa (1990) mengemukakan dua metode penentuan banyaknya sumbu komponen utama yang sudah cukup untuk penduga, yaitu postdictive success dan predictive success.

Postdictive success berhubungan dengan kemampuan suatu model yang tereduksi untuk menduga data yang digunakan dalam membangun model tersebut. Salah satu penentuan banyaknya komponen berdasarkan Postdictive success adalah berdasarkan banyaknya sumbu tersebut yang nyata pada uji F analisis ragam. Metode ini diusulkan oleh Gollob (1968) dan direkomendasikan oleh Gauch (1988).

Predictive success berhubungan dengan kemampuan suatu model dugaan untuk memprediksi data lain yang sejenis tetapi tidak digunakan dalam membangun model tersebut (data validasi). Penentuan banyak sumbu komponen utama berdasarkan predictive success ini dilakukan dengan validasi silang, yaitu membagi data menjadi dua kelompok, satu kelompok untuk membangun model dan kelompok lain digunakan untuk validasi (menentukan jumlah kuadrat sisaan). Hal ini dilakukan berulang-ulang, pada setiap ulangan dibangun model dengan berbagai sumbu komponen utama. Banyaknya komponen utama yang terbaik adalah rataan akar kuadrat tengah sisa (RMSPD=Root Mean Square Predictive Different) dari data validasi paling kecil.

2.3.4 Interpretasi Biplot AMMI

Alat yang digunakan untuk menginterpretasi hasil dari metode AMMI adalah Biplot. Pada dasarnya metode ini merupakan upaya untuk memberikan peragaan grafik dari suatu matriks dalam suatu plot dengan menumpangtindihkan vektor-vektor dalam ruang berdimensi dua. Vektor-vektor-vektor yang dimaksud yaitu vektor-vektor


(45)

15 yang mewakili nilai skor komponen lingkungan dan vektor yang mewakili genitipe..

Biplot adalah plot antara satu kolom G dengan kolom G yang lain yang

ditampilkan secara bersama-sama dengan plot kolom H dengan kolom H yang

lain yang bersesuaian dengan kolom G yang diplot. Sebagian statistikawan

membuat plot antar kolom U dan antar kolom H secara bersamaan. Sebagian

peneliti pertanian (pemuliaan tanaman) bahkan membuat plot antara kolom-kolom tersebut dengan nilai rataan data asli per peubah amatan yang sesuai.

Biplot pada analisis AMMI biasanya berupa Biplot antara nilai komponen utama pertama dengan rataan respon (Biplot AMMI1). Biplot antara komponen utama kedua dan nilai komponen pertama (Biplot AMMI2) bisa ditambahkan jika komponen utama kedua ini nyata. Interpretasi Biplot AMMI1 adalah bagi titik-titik yang sejenis, jarak titik-titik-titik-titik amatan berdasarkan sumbu datar (rataan respon) menunjukkan perbedaan pengaruh utama amatan-amatan tersebut. Sedangkan jarak titik-titik amatan berdasarkan sumbu tegak (KUI1) menunjukkan perbedaan pengaruh interaksinya atau perbedaan kesensitifannya terhadap lokasi. Biplot AMMI1 menunjukkan bahwa genotipe dikatakan mempunyai daya adaptasi baik pada suatu lingkungan jika genotipe dan lingkungan bertanda sama (berinteraksi positif).

Biplot AMMI2 menggambarkan pengaruh interaksi antara genotipe dan lingkungan. Titik-titik amatan yang mempunyai arah yang sama berarti titik-titik amatan tersebut berinteraksi positif (saling menunjang) sedangkan titik-titik yang berbeda arah menunjukkan bahwa titik-titik tersebut berinteraksi negatif. Biplot AMMI2 dapat digunakan untuk menggambarkan kestabilan genotipe. Semakin stabil suatu genotipe maka titik koordinatnya akan semakin mendekati titik pusat. Dari biplot AMMI2 dapat pula diperoleh gambaran adaptabilitas genotipe yang berinteraksi khas dengan lokasi tertentu. Makin dekat jarak lokasi dengan genotipe, atau semakin kecil sudut diantara keduanya, maka makin kuat interaksinya (Hadi & Sa’diyah, 2004).

Pada pengamatan hasil (yeild), genotipe yang digambarkan oleh Biplot AMMI2 sebagai genotipe yang stabil dan memiliki posisi yang dekat dengan titik pusat, memiliki dua makna stabil. Stabil yang pertama, yaitu stabil yang baik


(46)

16

karena gonetipe ini berdaya hasil tinggi pada hampir seluruh lokasi. Sedangkan kemungkinan lain genotipe tersebut mungkin juga merupakan genotipe yang stabil karena memiliki hasil yang rendah dan merata pada seluruh lokasi. Stabil yang demikian disebut stabil yang buruk karena tidak diinginkan. Namun karena skema usaha pemuliaan sangat ketat untuk komponen daya hasil, hal ini sangat jarang ditemui.

2.4 Model Faktor Analitik untuk Model AMMI Campuran

Model Faktor Analitik dengan k buah faktor, disebut model FA-k, dan berkenaan dengan percobaan multi lokasi yang melibatkan sebanyak G genotipe pada sebanyak L lingkungan dapat dituliskan sebagai berikut:

+

dengan adalah pengaruh genotipe ke-i, adalah pengaruh lingkungan ke-j, adalah galat model. Untuk memodelkan IGL dengan model multiplikatif untuk efek keragaman dalam masing-masing lokasi. Smith et al. (2001) menggunakan pendekatan dengan analisis faktor. Analisis faktor biasa digunakan untuk struktur kovarian model dari p pengamatan x1,…,xp. Tujuan yang ingin dicapai adalah menghitung kovarian dari x dalam dimensi yang lebih kecil.

Dalam konteks data percobaan multilokasi, pendekatan analisis faktor dapat digunakan untuk memberikan sebuah struktur kelas dari matriks interaksi yang acak. Model dari efek keragaman untuk interaksi yang acak disusun sebagai

dimana :

adalah efek untuk keragaman l dalam lingkungan j adalah score untuk keragaman l dalam faktor r berhubungan dengan loading untuk lingkungan j


(47)

17 Model di atas dapat dituliskan dalam notasi vektor sebagai berikut :

= (Im)fδ (2.6)

dimana :

k = {jk}berukuran p x 1,

fk = {flk} berukuran m x 1,

 = {ij} berukuran mp x 1,

 = [1…k] berukuran p × k,

f = (

f

1

,…,

f

k

)’.

Dalam hal ini, pendekatan analisis faktor dapat digunakan untuk menyajikan struktur ragam-peragam dari matriks IGL dalam sebuah model dengan mempostulatkan sebuah suku pengaruh genotipe tak-teramati (latent) dalam lingkungan yang berbeda (Smith et al., 2001).

2.5 Konsep Dasar Model Linear Terampat

Model linear klasik mempunyai karakteristik: galat atau peubah respon mengikuti sebaran Normal dengan ragam konstan, ragam bebas dari rataan dan galat atau peubah respon saling bebas. Pada kelas pemodelan yang lebih luas, karakteristiknya tidak lagi terikat dengan asumsi tersebut. Nelder dan Wedderburn (1972) mengenalkan Model Linear Terampat (MLT) atau Generalized Linear Model (GLM) yang tidak bergantung pada karakteristik atau asumsi model linear klasik, tetapi bergantung hanya pada sifat fungsi penghubung (link function) yang menghubungkan antara i (rataan) dan i (prediktor linear atau linear predictor)

dari model sebaran peluang yang digunakan.

Peubah respon yi (i1,,n) merupakan nilai-nilai pengamatan peubah acak Y yang diasumsikan menyebar mengikuti sebaran tertentu (keluarga eksponensial) dengan nilai tengah . Pada kenyataannya, suatu fungsi ragam dari nilai tengah, , yang mungkin menyertakan parameter dispersi, memenuhi asumsi distribusi. dengan merupakan parameter dispersi (skala) dan adalah fungsi ragam. Nilai tengah berhubungan dengan prediktor linear, i

nj1jxij atau η dimana xij peubah penjelas


(48)

18

yang diketahui, sedang j adalah parameter, yang nilainya tidak diketahui

melalui suatu fungsi hubung: . Walaupun setiap pengamatan mungkin mempunyai fungsi penghubung yang berbeda, tetapi hal ini sangatlah jarang sehingga indeks i dalam fungsi gi dapat dihilangkan atau tereduksi

menjadi . Tabel 2.1 menyajikan beberapa fungsi hubung kanonik dan sifat hubungannya.

Pendugaan parameter j dalam vektor β dilakukan melalui prosedur

iterasi regresi linear terboboti dari fungsi hubung yang terlinearisasi dan dikenakan kepada pengamatan (y) pada peubah penjelas(x). Fungsi hubung

terlinearisasi atau fungsi hubung yang disesuaikan atau dalam GLIM dikenal dengan sebutan working variate, z, mempunyai bentuk zη(yμ)ημ atau

) )(

( 

   

i i i

i g y

z (McChullagh & Nelder 1989, van Eeuwijk 1995, de Falguerolles 1996). Setiap pengamatan juga mempunyai pembobot awal (prior weight) wi [Var(zi)]1, atau w(μη)2 V(μ). Pada setiap putaran iterasi nilai x dan z akan diperbaharui. Metode ini dikenal dengan Iterative Reweighted Least Square disingkat IRLS.

Tabel 2.1 Fungsi hubung (kanonik) dalam model linear terampat

SEBARAN RESPON NAMA SIFAT HUBUNGAN

Normal Identitas

Poisson Log g()log()

Binomial Logit

Binomial Negatif Log

Gamma Kebalikan

Secara umum, model linear terampat mempunyai karakteristik:

1. Peubah respon, Y , mempunyai sebaran dalam keluarga sebaran eksponensial.

2. Komponen linear atau sistematik yang menghubungkan prediktor linear ηke perkalian antara matriks rancangan X dan parameter β, ηXβ.

   g( )

             1 log ) ( g          k g   

 ( ) log

  g( ) 1


(49)

19 3. Fungsi penghubung (link function) g() –yang mengaitkan prediktor linear

dengan nilai-nilai dugaan model (fitted values)– mempunyai sifat monotonik dan diferensiabel. g() ini mendeskripsikan bagaimana rataan respon yang

diharapkan dihubungkan dengan η, misalnya ηXβ dan μg1(η)E(Y). 4. Peubah respon boleh mempunyai ragam tidak konstan yang nilainya berubah

dengan berubahnya nilai rataannya, i2 f(i).

2.6 Model AMMI Terampat (Generalized AMMI model)

Dalam suatu percobaan, respon yang diamati terkadang berupa data kategorik. Hal ini mengakibatkan pendekatan model AMMI menjadi tidak relevan sehingga perlu dilakukan analisis dengan menggunakan pendekatan lain. Untuk kasus ini, metode AMMI juga telah dikembangkan untuk menangani kasus-kasus yang lebih general. Model pendekatannya dikenal dengan nama model Generalized AMMI disingkat GAMMI (van Eeuwijk 1995) atau Generalized Bilinear Models disingkat GBM (de Falguerolles 1996, Gabriel 1998). Model GAMMI dapat dituliskan sebagai berikut:

∑ √

Model AMMI adalah model GAMMI dengan link identitas dan ragam konstan. Dengan menetapkan nilai j dan kj mereduksi model menjadi GLM

sepanjang baris, sedang menetapkan nilai i dan ki menjadi GLM sepanjang

kolom. Karakteristik dari model GAMMI ini dapat menjadi dasar untuk menentukan prosedur pendugaan parameter. Prosedur pendugaan parameter pada GLM lainnya, biasanya menggunakan metode kuadrat terkecil terboboti secara iteratif.

2.6.1 Algoritma Pengepasan Model AMMI Terampat

Pengepasan Model AMMI Terampat dilakukan secara iteratif dengan beberapa tahapan sebagai berikut (Van Eeuwijk, 1995):


(50)

20

Ketika suatu model GAMMI dengan sumbu K akan disesuaikan dan tidak ada hasil yang didapat dari penyesuaian dengan sumbu M < K

1. Modelkan pengaruh utama sebagai berikut: ij = v + i + j

2. Simpan pendugaan ˆj dari efek utama kolom

3. Pilih skor kolom, ˆkj, untuk sumbu 1 sampai K (skor-skor ini tidak harus sama semua, dan sebaiknya telah distandarisasi dan diortonormalisasi;

,

ˆ

,

ˆ 0 1

1 2 1  

  J j kj J j kj

 untuk k = 1, ..., K,

,

ˆ

ˆ '0

kjkj untuk kk’).

Ketika pendugaan parameter dapat digunakan untuk model GAMMI dengan sumbu M < K, nilai dari ˆj dan ˆkj, maka sekarang dengan k mulai dari 1, ..., M, dapat digunakan sebagai nilai awal untuk GLM pada tahap selanjutnya. Untuk nilai ˆkj yang dimiliki sumbu M + 1, M + 2, ..., K, nilai dapat dipilih lagi.

(ii) Pendugaan pengaruh utama dan interaksi baris

Tentukan bj ˆj dan dkj ˆkj, dan modelkan regresi baris

     K k kj ki j i

ij v b d

1

 

keterangan:

bj diharapkan telah diketahui dan tidak harus diduga

dkj menggambarkan peubah pengiring (concomitant variable) pada

faktor kolom.

Parameter i dan 1i, 2i, ..., Ki adalah intersep dan slope untuk regresi dari

entri baris i pada vektor variabel d1, d2, ..., dK. Pengaruh utama baris, ˆi, tidak perlu dipusatkan dalam proses iterasi, ini mungkin sebaiknya hanya dilakukan setelah konvergen.

(iii) Pemusatan dan pengortogonalan pengaruh interaksi baris

  I i ki ˆ 1 0


(51)

21

I

i ki k'i

ˆ ˆ

1

0

, untuk k k.’

(iv) Pendugaan efek utama dan interaksi kolom

Tentukan ai ˆi dan cki ˆki, dan modelkan regresi kolom

     K k kj ki j i

ij v a c

1

 

keterangan:

ai membentuk offset, ketika nilai cki menunjukkan peubah pengiring

(concomitant variable) pada faktor baris.

 Parameter j dan 1j, 2j, ..., Kj adalah intersep dan slope untuk regresi

pada entri kolom j pada vektor variabel c1, c2, ..., cK. Tidak perlu

memusatkan efek utama kolom, j, dalam prosedur ini.

(v) Standarisasi dan pengortonormalan pengaruh interaksi kolom Standarisasi dan ortonormalisasi:

, ˆ ,

ˆ 0 1

1 2 1  

  J j kj J j kj

 untuk k = 1, ..., K

,

ˆ

ˆ ' 0

kjkj untuk kk’.

Jika tidak terpenuhi maka lanjutkan prosesnya, bj ˆj dan dkj

ˆkj, dan kita lakukan regresi baris,

. 1

     K k kj ki j i

ij vbd

Perubahan dari deviansi dari salah satu atau kedua regresi baris dan kolom dapat digunakan sebagai kriteria konvergen, atau perubahan dalam pendugaan dari salah satu atau kedua parameter baris dan kolom. Jika kriteria kekonvergenan terpenuhi maka deviansi sisaan dari regresi baris akan menjadi sama dengan deviansi sisaan dari regresi kolom. Pada saat konvergen maka

K I i ki ˆ   

1 2 .

Parameter

K menunjukkan suatu parameter asosiasi general, suatu nilai singular general. Kecuali untuk kasus model AMMI, pada model GAMMI tidak


(52)

22

akan ada hubungan sederhana antara banyaknya deviansi yang bersesuaian dengan sumbu k dan kuadrat dari nilai singular.

2.6.2 Penentuan Banyaknya Suku Multiplikatif

Banyaknya unsur multiplikatif dalam model GAMMI dapat ditetapkan melalui generalisasi uji pada model AMMI, yaitu:

1) Uji rasio likelihood untuk akar ciri pertama, untuk akar ciri kedua jika diketahui yang pertama, dan untuk akar ciri berikutnya. Uji ini membandingkan persentase yang diterangkan oleh suku tertentu dengan jumlah total yang tetap akan diterangkan, dan tidak memerlukan suatu pendugaan untuk galat.

2) Uji F tidak membutuhkan tabel khusus dan mudah dalam perhitungannya. Suatu pendugaan bebas dari galat (over/under dispersi) diperlukan dan mungkin akan menyebabkan masalah.

3) Uji sederhana dengan atribut derajat bebas (I – 1) + (J – 1) – (2k – 1) kepada akar ciri bersesuaian dengan sumbu k, menjadi perbedaan antara banyaknya parameter yang akan diduga dan banyaknya konstrain identifikasi yang dikenakan. Kuadrat tengah yang bersesuaian kemudian diuji terhadap penduga galat (over/under dispersi). Uji ini diusulkan oleh Gollob (Gollob 1968, van Eeuwijk 1995). Ketika akar ciri pertama relatif cukup besar terhadap akar ciri selanjutnya, penggunaan atribut derajat bebas yang mengikuti Gollob aman digunakan dengan mengumpulkan suku berikutnya untuk suatu pendugaan galat (over/under dispersi). Aplikasi sekuensial dari prosedur ini, menguji akar ciri suksesif melawan pendugaan galat terkumpul.

Penambahan komponen multiplikatif lainnya untuk model GAMMI membutuhkan perhitungan kembali pada suku yang telah dimasukkan. Hal ini disebabkan perbedaan pada bobot tiap-tiap sel, tidak seperti model AMMI dengan bobot sel yang sama.

2.6.3 Diagnostik Sisaan

Sisaan untuk tujuan diagnostik, setelah konvergen, dapat diperoleh dari regresi baris sebaik regresi kolom. Sisaan regresi baris dan kolom akan sedikit


(53)

23 menyimpang dari sesamanya, karena perhitungan dari sisaan regresi baris mengasumsikan bahwa parameter kolom telah diketahui dengan ditetapkan sebelumnya dan bukan diduga, demikian juga untuk sisaan regresi kolom pendugaan dari parameter baris diabaikan. Kemungkinan lainnya adalah untuk membuat peregresi dari hasil parameter interaksi baris dan kolom dalam jalan yang sama dengan uji satu-derajat bebas untuk ketakaditifan yang dapat memberikan suatu interpretasi regresi, dan mencocokkan suatu model dengan efek utama dan peregresi-peregresinya. Sisaan dari model ini adalah suatu kompromi antara sisaan dari regresi baris dan regresi kolom.

Diagnostik sisaan yang dilakukan untuk menilai kelayakan model, diadopsi dari kelas GLM. Kelayakan model dapat diperiksa secara informal melalui plot sisaan terhadap suatu fungsi dari nilai dugaan model (fitted value). Dalam penilaian kelayakan model secara umum, pemeriksaan disarankan menggunakan sisaan devians terbakukan (standardized deviance residual) untuk diplot terhadap prediktor linear (linear predictor) ataupun terhadap nilai dugaan model (fitted value) yang ditransformasi menjadi konstanta skala informasi bagi sebaran galat. Transformasi fitted value untuk beberapa sebaran galat antara lain

̂ untuk galat berdistribusi Normal, � √ ̂ untuk galat berdistribusi Binomial,

√ ̂ untuk galat berdistribusi Poisson, � ̂ untuk galat berdistribusi Gamma dan seterusnya.

Kelayakan model ditunjukkan oleh pola sisaan yang menyebar secara acak dengan kisaran konstan di sekitar nilai tengah nol. Penyimpangan sistematik pada plot ini dapat berupa (i) bentuk kurva atau (ii) adanya perubahan kisaran dengan berubahnya fitted value. Bentuk kurva dapat disebabkan salah satunya oleh penggunaan fungsi hubung yang salah. Sehingga jika plot ini tidak mengandung penyimpangan dapat kita katakan fungsi hubung yang digunakan tepat (model sesuai). Hal yang sama dapat kita peroleh pula dari plot sisaan dengan prediktor linear. Catatan: Plot ini tidak bermakna bagi data biner (Bernouli). Beberapa plot sisaan lain digunakan secara khusus untuk memeriksa fungsi ragam dan fungsi hubung yang digunakan (McChullagh & Nelder, 1989).

Plot antara nilai mutlak sisaan terhadap nilai dugaan model (fitted value) memberikan pemeriksaan informal tentang kelayakan fungsi ragam yang


(54)

24

diasumsikan. Kelayakan fungsi ragam yang diasumsikan ditunjukkan oleh tebaran titik-titik yang membentang kostan secara horisontal, tidak mengindikasikan suatu tren atau pola tertentu. Ketidaksesuaian fungsi ragam ditunjukkan oleh tren pada nilai tengah, tren positif menunjukkan fungsi ragam yang digunakan saat ini meningkat lambat dengan meningkatnya nilai tengah. Kecenderungan negatif mengindikasikan sebaliknya. Pemeriksaan informal untuk kesesuaian fungsi hubung yang digunakan dapat diperiksa melalui plot antara working variate terhadap prediktor linear, tetapi ini tidak berlaku umum, untuk sebaran Bernouli terutama, plot ini tidak bermakna.

2.6.4 Penyajian Interaksi melalui Biplot Model GAMMI

Biplot sangat baik dalam memperlihatkan interaksi multiplikatif dalam model AMMI. Dalam biplot, baris dan kolom digambarkan oleh titik dalam dua atau tiga-ruang dimensi. Koordinat dari titik didapatkan dari skor baris dan kolom. Nilai singular ditempatkan ke skor baris dan kolom dalam cara yang berbeda tergantung pada yang diperhatikan apakah hubungan antar baris, antar kolom, atau antara baris dan kolom. Dengan skor baris

ki

ki

k diplotkan, jarak antara titik baris adalah proporsional pada banyaknya interaksi antarbaris. Memplotkan

’kj, dengan kj kjk mentransfer hubungan ini ke titik kolom. Dengan titik

baris dan kolom sebagai titik akhir dari vektor yang dimulai dari titik pangkal, geometri sederhana dapat memperlihatkan bahwa banyaknya interaksi, atau ketakaditifan, antara sebuah baris dan kolom dapat didekati oleh inner product antara vektornya dari dalam biplot. Inner product ini dapat dihasilkan dengan memproyeksikan salah satu dari vektor baris atau kolom ke lainnya, dan kemudian mengalikan panjang dari proyeksi dengan panjang dari vektor tempat di mana proyeksi itu berada. Model GAMMI memungkinkan untuk memvisualisasi interaksi dengan menggunakan Biplot, tetapi interpretasinya tergantung pada fungsi hubung tertentu (Hadi et al., 2008).


(1)

Lampiran 6. Sebaran Zero-inflated Poisson sebagai sebaran campuran antara Poisson dan Bernouli

Pada dasarnya sebaran Zero-inflated Poisson adalah perkalian antara Poisson dan Bernouli

Poisson Bernouli Zero Infated Poisson

X1 P(X1) X2 P(X2) Y=X1X2 P(Y)

X1=0 X2 = 0 Y=0

X1=0 X2 = 1 Y = 0

X1 1, 2, 3, …

X2=0 Y = 0 ∑

( )

X1 1,2,3, …

X2=1 Y 1,2,3,…

[

]

{


(2)

129

Lampiran 7. Fungsi Massa Peluang (FMP), nilai harapan, dan ragam peubah acak X yang menyebar Poisson

Anggaplah peubah acak X menyebar Poisson dengan parameter  FMP peubah acak :

,

Menurut deret Taylor, ∑ sehingga

Nilai harapan:

dengan menempatkan sebagai faktor diluar tanda jumlah, dan menuliskan

dapat dperoleh

Tampak bahwa

adalah fmp bagi peubah acak Poisson Z dan suku

bernilai 1, sehingga

Ragam:

Untuk memperoleh kita dapat menggunakan fungsi pembangkit momen, yaitu


(3)

dan menurut deret Taylor diperoleh

Sedangkan

sehingga

Dari dan dapat kita peroleh beberapa kesamaan,

[

]

Sehingga


(4)

131

Lampiran 8. Fungsi Massa Peluang (FMP), nilai harapan, dan ragam peubah acak Y yang menyebar ZIP

Peubah acak Y menyebar menurut sebaran ZIP dengan parameter , : FMP bagi

{

dengan 0 dan

A. Bukti bahwa total peluang ZIP untuk semua kejadian Y adalah satu

[ ]

[ ] ∑

[ ]

menurut deret Taylor, ∑ = sehingga, ∑ =

[ ]

(1


(5)

B. Nilai Harapan dan Ragam bagi

∑ ∑

[ ] ∑

Bila kita perthatikan disebelah tanda sama dengan, maka jumlahan tersebut setara dengan nilai harapan peubah acak Poisson dengan pembobot atau dapat ditulis bahwa ∑ sehingga

. Sementara itu,

∑ [ ( ) ]

dan menurut (L.6.1) ∑ sehingga , maka

sedangkan dari diperoleh

sehingga

[ ] [ ]


(6)

133

C. Likelihood bagi Contoh Acak dari Populasi ZIP

Untuk contoh acak pengamatan { } fungsi likelihoodnya adalah

∏[ ] [ ]

Dan Log-likelihoodnya adalah:

∑ { [ ]