Antisipasi Pengaruh Pencilan pada Model AMMI Penerapan Model FANOVA pada Data Riil

33 3.3.1 Model Faktor Analitik Model Faktor Analitik dengan k buah faktor, disebut model-k Faktor Analitik, dan berkenaan dengan percobaan multi lokasi yang melibatkan sebanyak G genotipe pada sebanyak E lingkungan dapat dituliskan sebagai berikut: ̅ ∑  dimana: = adalah pengaruh genotipe ke-i = adalah pengaruh lingkungan ke-j = adalah loading untuk faktor ke-k pada genotipe ke-i = adalah skor untuk lingkungan ke-j pada faktor ke-k = adalah galat jika tidak semua faktor digunakan = 1, 2, . . . , G dan j = 1, 2, . . . , E Analisis faktor sendiri adalah analisis peubah ganda yang bertujuan untuk mempelajari dan menyarikan struktur korelasi dari peubah pengamatan X 1, X 2 , ... , X p . Untuk itu, diasumsikan terdapat sebanyak k p peubah laten tak teramati F 1, F 2 , ... , F k yang disebut faktor. Misal vektor acak X dengan p komponen memiliki rataan μ dan matriks peragam Σ. Menurut Johnson dan Winchern 1998, pada umumnya model analisis faktor adalah: X 1 =  11 F 1 +  12 F 2 + … +  1k F k + ε 1 X 2 =  21 F 1 +  22 F 2 + … +  2k F k + ε 2 : : : : : : : : X p =  p1 F 1 + l p2 F 2 + … +  pk F k + ε p. Atau dalam bentuk matriks menjadi X = Lf + . 3.1 Prosedur analisis faktor berdasarkan suatu dekomposisi dari matriks peragam dari X, yaitu matriks  dan dengan penguraian matriks X pada 3.1 diperoleh . Dengan asumsi: EF=0, E=0, CovF = EFF T = I, dan Cov  = E T = Ψ = diagΨ1, …., Ψp, dengan  i adalah faktor spesifik untuk lingkungan ke-i. Vektor f dan  saling bebas atau, Cov ,F = E ,F ’ 0. Sedangkan adalah koleksi dari loading  ij dengan 1 ik, dan 1jp. Dalam konteks data percobaan multi lokasi, analisis faktor digunakan untuk mendekomposisi struktur ragam-peragam dari matriks IGL yang berisi ge ij dalam sebuah model dengan mempostulatkan sebuah suku pengaruh genotipe tak- teramati latent dalam lingkungan yang berbeda Smith et al. 2001. Sedangkan Resende dan Thompson 2004 menyebut postulat itu sebagai ketergantungan pada segugus faktor hipotetik yang bersifat acak. Hal yang membedakan persamaan pada analisis faktor dengan regresi berganda yang biasa adalah, pada analisis faktor baik kovariat maupun koefisien regresi sama-sama tidak diketahui, sehingga harus diduga dari data, sedangkan pada regresi berganda hanya koefisien yang regresi yang tidak diketahui. Modelnya adalah sebuah model multiplikatif dari koefisien lingkungan skor faktor dan koefisien genotipe disebut loading. Ini analog dengan model AMMI. Perbedaan utamanya adalah pada model multiplikatif untuk interaksi, model faktor mengakomodasi pengaruh acak, sedangkan pada model AMMI mengakomodasi pengaruh tetap. Sehubungan dengan itu, model faktor analitik disebut juga sebagai model AMMI random.

3.3.2 Keterkaitan Model Faktor Analitik dan Model AMMI

Smith et al. 2001 menyebutkan bahwa model AMMI sangat populer untuk memodelkan data percobaan multilokasi. Model ini terdiri dari model aditif pada pengaruh utama untuk varietas dan lingkungan, sedangkan model multiplikatif untuk efek IGL. Model Multiplikatif diperoleh dengan menggunakan SVD dari matriks IGL. Misal U melambangkan matriks IGL berukuran G × E. Dalam AMMI, maka U didekomposisi sebagai U ALB’, dimana A adalah matriks berukuran G × K dan B matriks berukuran E × K serta memenuhi kondisi A’A I k B’ B, L = diag l 1, …,l K , K adalah pangkat dari matriks U. Definisikan B=BL, sehingga dekomposisi dari U dapat dituliskan ke dalam bentuk : U = AB T = T k K k k b a  1 . 3.2 Kolom dari A a k berukuran G × 1 disebut sebagai skor keragaman sedangkan kolom dari B b k berukuran E × 1 adalah loading untuk lingkungan. 35 Seperti halnya analisis faktor, tujuan dari AMMI adalah memperoleh struktur efek genetik dengan menggunakan sebanyak k ’ komponen yang minimum. Jika persamaan 3.2 dipecah dengan memperhatikan k ’ faktor pertama, maka persamaan 3.2 menjadi : U = T k k k k b a   1 + T k K k k k b a    1 = T B A 1 1 + T B A 2 2 3.3 dimana A 1 adalah matriks berukuran G × k ’ dan B 2 adalah matriks berukuran E × k ’. Dalam model AMMI, pengaruh IGL dimodelkan sebagai : u = B 1  I G a + e 3.4 dimana a= vec[A 1 ] = T a 1 … T G a T berukuran Gk ’ × 1 dan e adalah sisaan dari IGL yang mengingatkan bahwa tidak semua komponen dalam SVD digunakan. Uraian di atas menjelaskan bahwa terdapat hubungan antara persamaam 3.3 dengan model k faktor analitik untuk pengaruh IGL. Model tersebut dapat dituliskan : u =  I G f + . Terdapat hubungan yang jelas antara loading lingkungan untuk dua model B 1 dan  dan skor keragaman a dan f. Model k faktor analitik pada persamaan 3.1 analog dengan efek acak pada model AMMI. Di sinilah terletak keserupaan dengan model AMMI. Smith et al. 2001, Resende Thompson 2004. Dalam sejarah perkembangannya, mula-mula Gollob 1968 memperkenalkan model faktor-analisis ragam factor analysis of variance, disebut FANOVA yang menggabungkan aspek analisis ragam dan faktor analisis. Sedangkan Gabriel dan Zamir 1978 mendiskusikan beberapa model yang mirip dengan FANOVA dengan pendugaan parameter menggunakan metode kuadrat terkecil. Model AMMI kemudian berkembang dan dikenal sesudah itu. Cornelius et al . 1996 menuliskan bahwa Gaugh dan Zobel memberi nama lain pada model FANOVA yang diusulkan Gollob sebagai model AMMI.

3.4 Pengembangan Kekekaran pada Model AMMI

Sebagaimana disebutkan sebelumnya bahwa pada dasarnya model AMMI adalah model tetap. Di samping ketaknormalan, isu ketakhomogenan ragam telah banyak mendapat perhatian para peneliti. Mengatasi ketakhomogenan ragam pada AMMI dalam konteks model campuran dapat digunakan model yang disebut faktor analitik multiplikatif Smith et al. 2001. Smith et al. 2001 menyimpulkan bahwa model faktor analitik serupa dengan AMMI model campuran. Seiring dengan perkembangan dekomposisi matriks telah pula dikenal “robust” Principal Component Analysis Jolliffe 1986, dan “robust” Faktor Croux Filzmoser 1998 yang relatif kekar terhadap pengamatan pencilan, maka dalam kelas model faktor analitik ini berkembang pula model faktor analitik yang kekar. Pengembangan model AMMI juga dilakukan untuk menangani pencilan yang seringkali muncul secara bersamaan dengan kondisi ketakhomogenan ragam dalam data.

3.4.1 Penduga Regresi Bolak-balik yang Kekar terhadap Pencilan

Sebagaimana lazimnya, matriks data Y berukuran G  E digunakan untuk melambangkan catatan yang berisi peubah pengamatankarakteristik pada kolom atas beberapa individu objekcase pada barisnya. Dengan peubah- peubah tersebut yang sudah distandarisasi sehingga mempunyai nilai tengah nol dan ragam 1. Suatu skor faktor dicatat sebagai f il . Dengan vektor skor ke-i diberikan sebagai f i = f i1 , . . . , f ik T , sedangkan loading vektor ke-j adalah  j =  j1 , . . . ,  jk T keduanya tidak diketahui. Vektor dari seluruh loading dan skor faktor dilambangkan dengan  = f 1 T , . . . , f n T ,  1 T , . . . ,  p T , dan ̂ ∑ adalah nilai dugaan fitted value bagi y ij . Dengan memilih  sedemikian sehingga nilai dugaan dan nilai aktual dari matriks sangat dekat, kita mendefinisikan nilai dugaan vektor skor ̂ dan ̂ sebagai nilai dugaan vektor loading. Nilai dugaan matriks data ̂ dapat didekomposisi menjadi ̂ ̂ ̂ dengan baris-baris dari ̂ adalah nilai dugaan skor dan baris-baris dari ̂ adalah nilai dugaan loading. Perhatikan bahwa rank dari ̂ sebesar-besarnya adalah k p, sedangkan rank dari Y adalah sebesar E. Pendekatan metode kuadrat terkecil least squares, 37 selanjutnya tulis sebagai LS dalam indeks adalah meminimumkan jumlah kuadrat sisaan: ̂ � ∑ ∑ ̂ dan menghasilkan nilai dugaan ̂ yang dapat dilihat sebagai pendekatan “terbaik” dalam kacamata kuadrat terkecil terhadap matriks data Y oleh matriks dengan rank = k. Teorema Eckart-Young Gower Hand 1996 menyebutkan bahwa aproksimasi terbaik ini dapat diperoleh melalui dekomposisi nilai singular SVD terhadap matriks data Y = UDV T . Dengan mengganti seluruh nilai singular dalam matriks D dengan nol, kecuali untuk k buah nilai singular terbesar pertama, dapat diperoleh D k dan akhirnya ̂ = UD k V T . Dan dengan menyatakan ̂ √� dan ̂ √� ⁄ kita memperoleh apa yang disebut solusi komponen utama untuk masalah faktor analisis Johnson Wichern 1998. Selanjutnya, matriks peragam contoh dari vektor skor dugaan adalah ̂ ̂ dimana hal ini konsisten dengan asumsi awal yaitu CovF = I k . Penting untuk kita catat bahwa nilai dugaan ̂ dan ̂ hanya dinyatakan secara khusus untuk suatu transformasi linear. Dan karena ̂ ̂ ̂ untuk sembarang matriks T non-singular berukuran k × k, maka ̂ dan ̂ mendapat nilai yang sama bagi fungsi tujuan ̂ . Meski demikian nilai dugaan ̂ yang diperoleh bersifat unik. Selanjutnya, jika kita menambahkan kendala bahwa dugaan matriks peragam bagi vektor skor adalah matriks satuan, maka dugaan ̂ dan ̂ menjadi suatu transformasi orthogonal, sehingga matriks ̂ ̂ juga unik. Karena kriteria kuadrat terkecil memberikan pembobot yang berlebih kepada sisaan yang bernilai besar, gagasan awal mengatasinya adalah menggunakan kriteria simpangan mutlak terkecil Least Absolute Deviations atau disebut kriteria L1, yang memberikan penduga aditif bagi tabel dua arah yang robust Terbeck Davies, 1998. Kriteria L1 ini menghasilkan penduga yang meminimumkan simpangan mutlak ̂ � ∑ ∑ ̂ . Untuk memperoleh ̂ dan ̂ yang optimal, haruslah dipenuhi bahwa nilai dugaan ̂ meminimumkan ∑ | ̂| dan ̂ meminimumkan ∑ | ̂ | . Oleh karena itu, pendekatan ini tidaklah meminimumkan kedua jumlah mutlak pada kriteria L1 secara bersamaan, melainkan dengan menetapkan indeks j dan skor f i kemudian mencari  j yang meminimumkan ∑ | | . Masalah ini sekarang bukan lagi masalah bilinear tetapi regresi linear dengan algoritma simpangan mutlak terkecil. Sehubungan dengan hal tersebut, segera dapat kita lihat bahwa meminimumkan ∑ | | dilakukan satu persatu untuk setiap j = 1, . . , p berkenaan dengan kriteria L1 untuk skor yang ditetapkan. Analog dengan itu, untuk loading  j yang ditetapkan, mencari f i yang meminimumkan ∑ | | untuk setiap i = 1, . . . , G bergantian berkenaan dengan meminimumkan kriteria L1 pada nilai loadings yang diberikan. Bergantian bolak-balik pada peminimuman ∑ | ̂ | dan ∑ | | membawa kita pada skema pendugaan iteratif yang disebut alternating regression regresi bolak-balik. Catatlah bahwa nilai kriteria L1 menurun pada setiap langkah iteratif itu. Algoritma yang serupa, tetapi berbasis pada regresi kuadrat terkecil klasik yang bolak-balik, dilakukan oleh de Falguerolles dan Francis 1992, sedangkan Gabriel 1998 menggunakan regresi bolak-balik dengan basis GLM untuk GBM. Sayangnya, regresi L1 sensitif terhadap pengamatan pengungkit leverage points . Jika terdapat skor atau loading yang memencil maka regresi L1 dapat sangat terpengaruh olehnya. Dengan memberikan pembobot yang bernilai lebih rendah downweighting terhadap pengamatan tersebut kita mendapatkan regresi L1 terboboti weighted L1 regression, dan menghasilkan penduga sebagai berikut : ̂ � ∑ ∑ ̂ Satu fungsi objektif tunggal menduga ̂ dan ̂ secara simultan dari baris-baris dan kolom-kolom matriks Y. Untuk mendapatkan nilai dugaan ̂ digunakan regresi bolak-balik robust Robust Alternating Regressions, disingkat RAR. Penduga ̂ tidak akan salah arah mislead oleh adanya pengamatan pencilan. Pembobot bagi baris, didefinisikan oleh � untuk i = 1, . . . , G dimana  2 k ;0.95 adalah batas atas bagi nilai kritis 5 sebaran 39 khi-kuadrat dengan derajat bebas k, dan jarak kekar robust distance √ untuk i = 1, . . . , G adalah jarak yang dihitung dari koleksi vektor skor { } pada ruang berdimensi k Rousseeuw van Zomeren, 1990. Dan analog dengan itu, segugus pembobot bagi kolom v j didefinisikan dengan cara yang sama menggunakan vektor loading. Catatlah bahwa karena loading dan skor yang sebenarnya tidak teramati, w i dan v j bergantung pada vektor parameter  yang tidak diketahui.

3.4.2 Pengepasan Model melalui FANOVA dengan Penduga RAR

Secara umum model untuk tabel dua arah genotipe × lingkungan pada model ANOVA dapat dituliskan sebagai ij j i ij e g y      μ dengan rata-rata umum, g i merepresentasi pengaruh genotipe baris dan e j pengaruh lingkungan kolom. Pada ANOVA biasa, pengaruh baris dan kolom diasumsikan memiliki rataan nol. Suku  ij dapat dipandang sebagai sisaan dari model pengaruh utama, atau suku interaksi antara baris dan kolom. Ekspresi ini disebut model aditif. Meski demikian, pada model aditif ini masih mungkin untuk mengekspresikan suku  ij dalam komponen sistematik oleh struktur pada model faktor: ∑ Sehingga keseluruhan model dituliskan sebagai: ∑ Ide awal pengepasan model ini, dilakukan secara sequensial dengan menduga model aditif terlebih dahulu, dan kemudian melakukan dekomposisi pada suku sisaan dengan analisis faktor. Namun pengepasan yang lebih baik diperoleh dengan menduga seluruh parameter secara bersamaan. Pada pendugaan dengan metode kuadrat terkecil, pengepasan secara sequensial maupun bersamaan simultan tidak memberikan hasil yang berbeda. Tetapi untuk model robust dengan kriteria least absolute kesamaan tersebut tidak lagi berlaku. Pendekatan robust akan menduga suku-suku aditif dan multiplikatif secara simultan. Penduga RAR untuk model FANOVA dapat didefinisikan sebagaimana subbab sebelumnya. Anggap  sebagai vektor merupakan koleksi dari semua parameter, yaitu scores, loadings, pengaruh baris dan kolom, juga rataan umum, µ. Untuk menduga sebanyak k + 1 G + E + 1 elemen dari  yang tidak diketahui, dari sebanyak GE data yang tersedia akan digunakan penduga RAR sebagaimana subbab 3.4.1: ̂ � ∑ ∑ ̂ Pembobot w i dan v j sebagaimana juga pada 3.4.1 adalah pembobot yang menurunkan downweighting scores dan loadings yang “memencil” dalam ruang dimensi k dari vektor scores dan loadings. Untuk mengidentifikasi secara unik parameter-parameter dalam y ij , fungsi penduga ̂ diminimumkan dengan kendala median median constraints: i g j e d � il f jl  � Kendala ini konsisten dengan pendekatan robust. Algoritma untuk menghitung penduga RAR dalam model FANOVA didasarkan pada regresi bolak-balik alternating regressions sebagaimana disajikan dalam Croux et al. 2003. Perbedaan dengan model multiplikatif pada subab 3.4.1 adalah bahwa regresi pada model robust-FANOVA bukan lagi regresi melalui titik asal, melainkan regresi dengan intersep.

3.4.3 Algoritma Kekar untuk Regresi Bolak-balik Robust Alternating

Regression Algorithm Penduga RAR dapat didekati melalui algoritma bolak-balik alternating sebagai berikut Croux et al. 2003: Langkah 0: Inisialisasi. Data terlebih dahulu ditransformasi mengikuti ukuran yang kekar yaitu: dengan MAD adalah Median Absolute Deviation. Sifat keortogonalan dan ragam yang sama dengan satu tidak diperlukan 41 dalam model faktor. Standarisasi awal ini bersesuaian dengan matriks korelasi yang berbasis Faktor Analitik. Langkah 1: Nilai awal. Pertama, dilakukan analisis komponen utama yang kekar, robust principal component analysis PCA. Skor komponen utama dijadikan sebagai nilai awal ̂ untuk skor faktor. Kemudian kita gunakan Projection Pursuit PP berbasis pada estimator yang diimplementasi dalam Croux dan Ruiz-Gazen 1996. Metode yang berbasis pada PP ini dapat menangani kondisi G E, dan sangat kekar. Dengan pendekatan ini kita dapat mencukupkan perhitungan hanya sampai sejumlah k-komponen pertama yang diperlukan saja, sehingga dapat lebih cepat. Menggunakan PCA biasa pada langkah ini dapat memperlambat tercapainya kekonvergenan, bahkan dapat memberikan hasil yang tidak kekar bila terdapat banyak pencilan. Langkah 2: Proses iterasi. Anggaplah iterasi sekarang pada langkah ke –t t  1 dan ̂ telah diperoleh Pertama dihitung pembobot bagi baris w i t , yang menjadi downweight bagi pencilan pada gugus skor dugaan { ̂ | } � . Kemudian dihitung ̂ � ∑ ̂ untuk j = 1, . . . , E: Pada bagian ini kita mengepas regresi L1 sebanyak E kali dan akan selalu diulang pada setiap langkah iterasi. Kita perhatikan bahwa nilai loadings juga diduga pada saat yang sama, sehingga memudahkan dalam implementasi algoritma ini. Untungnya, telah terdapat algoritma regresi L1 yang sangat efisien, sehingga menghemat waktu. Pembobot w i t , hanya perlu dihitung sekali dalam setiap langkah iterasi. Perhitungan pembobot kolom v j t analog dengan pembobot baris. Pembobot kolom ini akan menurunkan bobot pencilan pada gugus dugaan vector loading { ̂ | } � . Kemudian dihitung ̂ � ∑ ̂ untuk i = 1, . . ., G. Nilai dari fungsi tujuan yang dioptimasi telah dihitung untuk penduga ̂ yang diperoleh pada langkah ke t 1 dan langkah ke t dibandingkan. Jika tidak ada perbedaan yang esensial, maka proses iterasi dihentikan dan kita memperoleh ̂ ̂ untuk dan ̂ ̂ dengan . Jika tidak maka Langkah 2 diulang. Langkah 3: Orthogonalisasi. Langkah terakhir ini adalah pilihan, dapat dilakukan dapat pula tidak, karena tidak akan mengubah nilai dugaan fitted values ̂ ̂ ̂ . Kemudian kita hitung penduga robust bagi matriks peragam ̂ dari skor dugaan { ̂ | }. Karena skor hanya memiliki dimensi sebanyak k yang kecil, maka matriks ̂ dapat dihitung degan cepat. Sedangkan ̂ dihitung berdasarkan penduga Minimum Covariance Determinant MCD terboboti reweighted MCD estimator dengan nilai breakdown value 25, melalui algoritma FAST-MCD milik Rousseeuw dan van Driessen 1999. Kita memilih nilai breakdown sebesar 25 pada MCD untuk mendapatkan kombinasi sifat kekekaran robustness dan efisiensi pada penduganya sebagaimana disarankan oleh Croux dan Haesbroeck 2000. Setelah itu, kita transformasi ̂ ̂ ̂ dan ̂ ̂ ̂ sehingga matriks peragam yang kekar robust covariance matrix bagi nilai dugaan skor sekarang adalah matriks identitas, yang sesuai dengan syarat model � ̂ . Pengaruh lainnya adalah bahwa biplot yang merepresentasi pengamatan, pada Langkah 4 43 tidak akan menunjukkan struktur korelasi, dalam praktik ini merupakan hal umum terjadi Gower Hand 1996. Langkah 4: Sisaan, uniquenesses, biplot. Nilai sisaan diperoleh ̂ ̂ ̂ ̂ dan dapat diplot terhadap indeks baris-kolom i, j pada plot 2 dimensi. Plot ini berguna untuk deteksi pencilan. Dari sisaan ini nilai uniquenesses dapat diduga sebagai ̂ ̂ . Dan pada umumnya digunakan dimesi dua, k = 2, dapat diperoleh representasi observasi oleh ̂ , ̂ dan peubah oleh ̂ , ̂ secara tumpang tindih pada satu plot 2 dimensi yang sama yang disebut biplot. Hal ini juga memungkinkan untuk melakukan regresi bolak-balik menggunakan penduga regresi lainnya, seperti penduga-M M-estimator dan penduga median kuadrat terkecil Least Median Square estimator, selanjutnya disingkat LMS. Hal ini bahkan mungkin untuk menjalankan algoritma dengan penduga regresi Kuadrat Terkecil tak-robust, menghasilkan hasil yang sama dengan pendekatan klasik Gabriel 1978 yang berbasis pada dekomposisi nilai singular. Regresi bolak-balik menggunakan algoritma LMS telah dipertimbangkan oleh Ukkelberg dan Borgen 1993. Namun, dengan menggunakan LMS menghasilkan algoritma yang sangat memakan waktu. Courx et al. 2003 menunjukkan bahwa penduga RAR memberikan metode faktor analisis yang paling memuaskan sehubungan dengan waktu komputasi, robustness, dan konvergensi algoritma yang stabil. Meskipun tidak ada bukti konvergensinya, banyak simulasi dan contoh telah menunjukkan kinerja yang baik secara numerik dan statistika. Prosedur RAR memerlukan pemilihan beberapa penduga kekar pelengkap dan fungsi pembobotan. 3.5 Kajian Kekekaran Model FANOVA terhadap Tambahan Nilai Ekstrim 3.5.1 Data dengan Tambahan Nilai Ekstrim Kajian ini dilakukan dengan memberikan tambahan nilai ekstrim pada data yang berasal dari salah satu percobaan BB Padi dalam rangka mengembangkan beras fungsional kaya Fe melalui program biofortifikasi Fe yang dilakukan bekerjasama dengan IRRI. Percobaan ini dilakukan di 7 lokasi pada musim tanam 2007 melibatkan 8 galur hasil pemuliaan dan 2 varietas pembanding. Penambahan pencilan dilakukan pada arah baris dan kolom pada tabel dua arah matriks IGL, karena penambahan pencilan pada ulangan tidak memberikan pengaruh terhadap analisis kestabilan IGL sebagaimana dilaporkan oleh Zulhayana et al. 2011. Banyaknya nilai ekstrim yang ditambahkan adalah sebanyak 2, 5 dan 10 masing-masing dengan 2 ulangan, satu ulangan pada baris dan yang lain pada kolom. Nilai ekstrim yang diberikan adalah nilai ekstrim pada arah kananatas, nilai ekstrim arah kiri dianggap sama karena distribusi normal yang simetrik. Penambahan ini dilakukan secara acak pada baris-baris atau kolom-kolom, namun tambahan nilai sebesar 3 kali simpangan baku diberikan pada sel dengan nilai tertinggi pada bariskolom terpilih.

3.5.2 Kekekaran Model FANOVA terhadap Tambahan Nilai Ekstrim

Nilai ekstrim diberikan sebanyak 2, 5 dan 10 atau 1, 4 dan 8 buah dengan tambahan sebesar 3 kali simpangan baku menurut bariskolom diberikan pada sel dengan nilai tertinggi pada bariskolom terpilih. Hal ini dilakukan untuk memberikan pencilan pada bariskolom yang berbeda. Penambahan pada pengamatan ekstrim baris belum tentu teridentifikasi pencilan pada pengaruh baris, karena bisa jadi pengaruh yang lebih besar justru dirasakan oleh kolom bila baris-baris lain lebih rendah, atau mungkin juga pengaruhnya hilang oleh pengamatan pada sel-sel lain. Penambahan satu buah sel nilai ekstrim, baik pada baris maupun kolom memberikan hasil pendugaan model kekar yang memberikan pembobot pada suatu pengamatan sebagai pengamatan pengungkit, meskipun tidak terdeteksi sebagai pengaruh pencilan. Sedangkan pada penambahan pencilan sebanyak 4 buah 5 pada kolom teridentifikasi satu pengaruh pencilan dan satu pengukit 45 yaitu pada baris ke-8. Sedangkan penambahan 8 buah pencilan 10 pada baris menghasilkan identifikasi 1 pencilan yang berpengaruh pada sisi baris, sebaliknya pada 10 pencilan pada kolom Tabel 3.1 Pembobot bagi pengaruh pengungkit pada penambahan nilai ekstrim Penambahan nilai Ekstrim 10 pada baris Pembobot Baris G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 1 1 1 1 1 1 1 1 1 1 Pembobot Kolom L1 L2 L3 L4 L5 L6 L7 L8 0.0502064 1 1 1 1 1 1 1 Penambahan nilai Ekstrim 10 pada Kolom Pembobot Baris G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 1 1 1 0.24275 1 1 1 1 1 1 Pembobot Kolom L1 L2 L3 L4 L5 L6 L7 L8 1 1 1 1 1 1 1 1 Bila kita menambahkan nilai ekstrim pada baris dan kolom sekaligus, maka model akan mendeteksi lebih banyak pencilan. Namun suatu bariskolom dapat memiliki pencilan pada dua sisi atas dan bawah. Hal ini terjadi pada penambahan 1 nilai ekstrim pada baris dan 1 pada kolom. Gambar 3.1 menunjukkan boxplot bagi pengaruh baris dan kolom model FANOVA Kekar. Dua nilai ekstrim yang ditambahkan terdeteksi sebagai pengaruh pencilan kolom dalam dua arah, atas dan bawah. Keduanya juga merupakan pengamatan pengungkit yang kemudian diboboti dengan lebih rendah. Tabel 3.2 Pembobot bagi pengaruh pengungkit pada penambahan nilai ekstrim baris dan kolom sekaligus Penambahan nilai Ekstrim 10 pada baris dan kolom Pembobot Baris G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 1 1 1 0.28777 1 1 1 1 1 1 Pembobot Kolom L1 L2 L3 L4 L5 L6 L7 L8 1 1 1 1 1 0.7517 1 1 Gambar 3.1 Boxplot pengaruh pencilan baris dan kolom pada penambahan masing-masing sebuah nilai ekstrim atas pada baris dan kolom Gambar 3.2 Boxplot pengaruh pencilan baris dan kolom pada penambahan masing-masing 4 buah nilai ekstrim atas pada baris dan kolom Hal yang serupa terjadi pada penambahan 10 nilai ekstrim, 4 buah pada baris dan 4 buah pada kolom. Hanya bedanya nilai ekstrim ini terdeteksi sebagai satu pengaruh pencilan masing-masing pada baris dan kolom Gambar 3.2. Keduanya juga merupakan pengamatan pengungkit yang kemudian diboboti dengan lebih rendah. Tabel 3.2 menunjukkan pembobot yang lebih rendah bagi pengamatan pengungkit pada tambahan nilai ekstrim baris dan kolom sekaligus. Kekekaran juga ditunjukan oleh hasil perbandingan konfigurasi matriks dugaan interaksi pada model FANOVA dari data dengan dan tanpa penambahan nilai ekstrim. Perbandingan dilakukan dengan membandingkan R-kuadrat procrustes. Model FANOVA Kekar mempertahankan matriks interaksi dugaan dari pengaruh tambahan nilai ekstrim. Tambahan nilai ekstrim tunggal pada bariskolom belum terdeteksi sebagai pencilan dan model FANOVA memberikan matrika dugaan yang sangat mirip dengan matriks interaksi yang diperoleh dari data asal. -1 .0 -0 .5 .0 .5 1 .0 Row Effects -0 .6 -0 .4 -0 .2 .0 .2 .4 Column Effects -1 1 2 Row Effects -0 .8 -0 .6 -0 .4 -0 .2 .0 .2 Column Effects 47 Hal ini ditunjukkan oleh nilai R-kuadrat yang besar 96.029 dan 93.012. Makin banyaknya nilai ekstrim yang ditambahkan terlihat bahwa R- kuadrat dari model ini mulai menurun namun masih diatas 80 untuk nilai ekstrim sebanyak 20. Penurunan ini bukan semata karena ketidakmampuan model FANOVA Kekar untuk mempertahankan struktrur interaksi dari pengaruh pencilan namun juga karena struktur data pada konteks interaksi baris kolom mulai berbeda dari data asal akibat banyaknya sel yang berubah oleh tambahan nilai ekstrim. Perbandingan dengan matriks interaksi dugaan oleh model AMMI memberikan informasi penting tentang kekekaran model FANOVA Kekar. Hal ini ditunjukkan oleh nilai R-kuadrat procrustes model FANOVA Kekar yang selalu lebih tinggi dari model AMMI. Dengan tambahan satu nilai ekstrim saja, matriks interaksi dugaan model AMMI telah berbeda dari matriks interaksi asalnya Hal ini ditunjukkan oleh nilai R-kuadrat yang hanya berkisar diantara 80 Tabel 3.3. Tabel 3.3 Banyaknya pengaruh pencilan dan pengungkit serta R-kuadrat Procrustes matriks interaksi dugaan model AMMI dan FANOVA kekar menurut tambahan nilai ekstrimnya Banyaknya Tambahan Nilai Ekstrim Banyaknya Pengaruh R-kudrat Procrustes Pencilan Pengungkit Baris Kolom Total Persen Baris Kolom Baris Kolom AMMI FANOVA Kekar 1 - 1 2 - - - - 79.891 96.029 - 1 1 2 - - 1 - 83.548 93.012 1 1 2 3 1 2 2 - 77.123 94.096 4 - 4 5 1 - 1 - 71.021 88.588 - 4 4 5 - 1 - 1 79.559 85.071 4 4 8 10 1 1 1 1 76.904 86.911 8 - 8 10 - 1 - 1 80.254 86.957 - 8 8 10 1 - 1 - 76.194 89.339 8 8 16 20 2 1 2 - 79.396 80.685 Model AMMI tampak tidak dapat mempertahankan pola interaksi dengan adanya nilai ekstrim. Berbeda dengan model FANOVA Kekar, model AMMI tidak menunjukkan perubahan besar dengan bertambahnya nilai ekstrim. Adanya tambahan nilai ekstrim baik 2, 3, 5 pada data telah membuat matriks interaksi dugaan model AMMI berbeda dari matriks interaksi dari data asal. Gambar 3.3 Perubahan R-kuadrat Procrustes dari matrkis interaksi dugaan model AMMI dan FANOVA kekar menurut persentase tambahan nilai ekstrimnya Gambar 3.3 menunjukkan bahwa secara umum model FANOVA Kekar lebih baik dalam mempertahankan struktur matriks interaksi dugaan dari pengaruh nilai ekstrim dibandingkan model AMMI. Meski nilai R-kuadrat Procrustes model FANOVA Kekar terus menurun dengan bertambahnya persentase nilai ekstrim, namun selalu lebih tinggi dari model AMMI. Model FANOVA Kekar baru mengalami hal yang sama buruknya dengan model AMMI ketika terdapat nilai ekstrim sebanyak 20 yang telah mengubah struktur interaksi dari data asalnya. Selengkapnya pendugaan matriks interaksi disajikan pada Lampiran 1.

3.6 Penerapan Model FANOVA pada Data Riil

Penerapan pada data riil dilakukan pada data dari Konsorsium Padi Nasional yang dihimpun oleh BB Padi. Percobaan yang dilakukan pada tahun 2008 ini bertujuan untuk mengevaluasi performa galur padi pada 20 lingkungan budidaya yang berbeda. Melibatkan 11 genotipe yang terdiri dari 3 genotipe dari BATAN, 4 dari BB Padi, 2 dari Biogen, dan 2 dari IPB, dengan 3 varietas pembanding yaitu Ciherang, Inpari1, dan Cimelati. Respon yang diukur adalah hasil produksi padi tonha. Percobaan menggunakan Rancangan Acak Kelompok pada petak berukuran 4 m × 5 m. Tabel 3 adalah genotipe yang diamati dalam percobaan dan kode penggalurannya, sedangkan Tabel 4 adalah lingkungan yang dilibatkan dalam percobaan. Kode genotipe dan kode lingkungan digunakan untuk memudahkan pembahasan. 0.65 0.75 0.85 0.95 5 10 15 20 R k u ad rat Pr o cr u ste s Persentase Tambahan Nilai Ekstrim Robust FANOVA AMMI 49 Tabel 3.4 Daftar galur-galur padi sawah pada data multilokasi konsursium Padi Kode GALUR ASAL G1 IPB-3 IPB97-F-20-2-1 IPB G2 BIO-1-AC-BLBBLAS-05 BIOGEN G3 B10531E-KN-14-3-0-LR-B376-1 BB-PADI G4 OBS 1735PSJ BATAN G5 BP11252-2-PN-12-2-2-2-1-7-MR-6 BB-PADI G6 BIO-8-AC-BLB-05 BIOGEN G7 OBS 1740PSJ BATAN G8 IPB-6 IPB107-F-8-3 IPB G9 BP3300-2C-2-3 BB-PADI G10 OBS 1739PSJ BATAN G11 B10531E-KN-14-1-0-LR-B375-12 BB-PADI G12 CIHERANG Public G13 INPARI 1 Public G14 CIMELATI Public Tabel 3.5 Kode lingkungan data multilokasi konsursium Padi Kode Lingkungan Kode Lingkungan L1 Bantaeng1 L11 Tabanan2 L2 Narmada1 L12 Ngawi2 L3 Bantul1 L13 Narmada2 L4 Purworejo1 L14 Pesawaran2 L5 Tabanan1 L15 Probolinggo2 L6 Ngawi1 L16 Purworejo2 L7 Pusakanagara1 L17 Pusakanagara2 L8 Pasar miring1 L18 Rangkasbitung2 L9 Asahan1 L19 Takalar2 L10 Bantul2 L20 Taman Bogo2 Ket: 1=musim tanam pertama; 2=musim tanam kedua Kita akan menggunakan matriks IGL yang berupa tabel dua arah yang selnya berisi median dari 3 ulangan percobaan. Dengan algoritma sebagaimana pada subab 3.4.3 diperoleh hasil pengepasan model FANOVA Kekar terhadap data riil yang menunjukkan bahwa sebuah pengaruh pencilan terdeteksi pada pengaruh kolom lingkungan sebagaimana pada boxplot Gambar 3.4. Tabel 3.6 Pembobot bagi pengaruh baris dan kolom terhadap pencilan Pembobot Baris: G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 G11 G12 G13 G14 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Pembobot Kolom: L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 L12 L13 L14 L15 L16 L17 L18 L19 L20 1 1 1 0.6989 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Gambar 3.4 Boxplot pengaruh baris Genotipe dan kolom Lingkungan data konsorsium padi Gambar 3.5 Biplot IGL model FANOVA kekar faktor 1 49.43, kumulatif 2 faktor 53.76 Biplot pada Gambar 3.5 menunjukkan bahwa di Purworejo pada musim tanam 1 L4 memiliki keragaman hasil yang relatif besar. Hal ini terjadi karena G1 memiliki median yang sangat besar yaitu 10.32 tomha Lampiran 2, yang berarti G1 sangat baik di L4. Genotipe-genotipe yang dekat dengan titik asal adalah genotipe yang relatif stabil yaitu G12 CIHERANG, G14 CIMELATI, G4 OBS 1735PSJ dari BATAN dengan median yang lebih tinggi, sedangkan G3 BB-PADI dan G8 IPB-6 adalah genotipe stabil dengan median yang lebih rendah. Gambar 3.4 dan Tabel 3.6 menunjukkan bahwa hanya satu pengamatan yang ditengarai sebagai pencilan pada pengaruh kolom yaitu pada L4 dan padanya telah diberikan bobot yang rendah dalam perhitungan. -1 .0 -0 .5 0. 0. 5 Row Effects -0 .8 -0 .6 -0 .4 -0 .2 0. 0. 2 0. 4 Column Effects -4 -3 -2 -1 1 2 obs[,1] -4 -3 -2 -1 1 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 L1 L2 L3 L4 L5 L6 L7 L8 L9 L10 L11 L12 L13 L14 L15 L16 L17 L18 L19 L20 51

3.7 Penutup

Model FANOVA Gollob 1968 menggabungkan aspek analisis ragam dan analisis faktor, pendugaan parameternya menggunakan kriteria least square. Model AMMI kemudian dikembangkan sesudah itu, Gaugh dan Zobel memberi nama lain pada model FANOVA yang diusulkan Gollob sebagai model AMMI. Ketika kita menangani ketakhomogenan ragam dengan model campuran, kita dapat memodelkan data menggunakan model faktor analitik. Model faktor analitik ekuivalen dengan model AMMI. Keduanya menggunakan prinsip dekomposisi matriks interaksi yang berbasis kriteria least square. Kkekekaran terhadap pencilan pada model ini diperoleh dengan memberikan bobot yang lebih rendah terhadap pengamatan pencilan dan kemudian menduga parameternya dengan meminimumkan galat dengan kendala atau kriteria yang konsisten dengan pendekatan robust yaitu least absolute. Pendugaan parmeter pada model aditif-multiplikatif umumnya dilakukan secara berurutan pendugaan pengaruh model aditif terlebih dahulu dan kemudian melakukan analisis faktor yang kekar pada sisaannya. Tapi ini tidak lagi berlaku untuk mendapatkan pendugaan model multiplikatif yang kekar. Oleh karena itu kita akan menduga pengaruh aditif dan multiplikatif secara bersamaan dengan menerapkan Regresi Bolak-balik yang kekar melalui model FANOVA. Model FANOVA Kekar menurunkan bobot downweighting pencilan pada skor dan loading dalam ruang dimensi k, dan secara unik mengidentifikasi parameter dalam y ij , fungsi ̂ akan diminimalkan di bawah kendala yang konsisten dengan pendekatan kekar yaitu median. Ketika tidak ada pencilan sama sekali metode ini memberikan hasil yang hampir sama dari kuadrat terkecil. Secara umum model FANOVA Kekar lebih baik dalam mempertahankan struktur matriks interaksi dugaan dari pengaruh nilai ekstrim dibandingkan model AMMI. 53

BAB IV. MODEL AMMI UNTUK DATA CACAHAN SEBARAN POISSON

4.1 Pengantar

Model AMMI merepresentasikan observasi ke dalam komponen sistematik yang terdiri dari pengaruh utama main effect dan pengaruh interaksi melalui suku- suku multiplikatif multiplicative interactions, di samping komponen acak sisaan atau galat. Komponen acak pada model ini diasumsikan menyebar Normal dengan ragam konstan. Pada dasarnya analisis AMMI menggabungkan analisis ragam aditif bagi pengaruh utama perlakuan dengan analisis komponen utama ganda dengan pemodelan bilinear bagi pengaruh interaksi Sumertajaya 1998, Mattjik 2005. Struktur interaksi pada model AMMI diuraikan dari matriks sisaan komponen aditif dengan memanfaatkan sifat matematis penguraian nilai singular atau SVD. SVD merupakan pendekatan kuadrat terkecil dengan reduksi dimensi pangkat matriks data yang terbaik dan menyediakan penyajian secara grafis yang dikenal secara luas dengan nama Biplot. Groenen dan Koning 2004a menunjukkan penggunaan biplot pada model bilinear sebagai cara baru memvisualisasi interaksi. Dalam konteks pemuliaan tanaman --khususnya kajian stabilitas genetik pada komponen daya hasil-- komponen acak pada model ini seringkali diasumsikan berdistribusi normal. Model ini telah berhasil memberikan informasi tentang stabilitas dan adaptasi spesifik suatu genotipe terhadap lingkungan, karena dilengkapi dengan visualisasi matriks IGL melalui Biplot. Jika matriks data bersebaran normal dengan ragam konstan, penduga kemungkinan maksimum tereduksi menjadi SVD. Jika sebarannya non- normal binomial atau Poisson misalnya makan kesamaan ini tidak lagi berlaku de Falguerolles 1996. Pada kajian stabilitas ketahanan terhadap penyakit dan kejadian serangan hama pada tanaman misalnya, asumsi model AMMI dengan galat yang normal dan ragam konstan tidak selalu dapat dipenuhi. Pencatatan data populasi hama dalam bentuk cacahan counting dan banyaknya buah polonggabah yang terserang penyakit misalnya, merupakan contoh fenomena ini. Lingkungan dalam hal ini adalah lingkungan biotik yang direpresentasi oleh