33
3.3.1 Model Faktor Analitik
Model Faktor Analitik dengan k buah faktor, disebut model-k Faktor Analitik, dan berkenaan dengan percobaan multi lokasi yang melibatkan sebanyak G genotipe
pada sebanyak E lingkungan dapat dituliskan sebagai berikut: ̅
∑
dimana: = adalah pengaruh genotipe ke-i
= adalah pengaruh lingkungan ke-j = adalah loading untuk faktor ke-k pada genotipe ke-i
= adalah skor untuk lingkungan ke-j pada faktor ke-k = adalah galat jika tidak semua faktor digunakan
= 1, 2, . . . , G dan j = 1, 2, . . . , E Analisis faktor sendiri adalah analisis peubah ganda yang bertujuan untuk
mempelajari dan menyarikan struktur korelasi dari peubah pengamatan X
1,
X
2
, ... , X
p
. Untuk itu, diasumsikan terdapat sebanyak k p peubah laten tak teramati F
1,
F
2
, ... , F
k
yang disebut faktor. Misal vektor acak X dengan p komponen memiliki
rataan
μ dan matriks peragam Σ. Menurut Johnson dan Winchern 1998, pada umumnya model analisis faktor adalah:
X
1
=
11
F
1
+
12
F
2
+ … +
1k
F
k
+ ε
1
X
2
=
21
F
1
+
22
F
2
+ … +
2k
F
k
+ ε
2
: :
: :
: :
: :
X
p
=
p1
F
1
+ l
p2
F
2
+ … +
pk
F
k
+ ε
p.
Atau dalam bentuk matriks menjadi
X = Lf +
.
3.1 Prosedur analisis faktor berdasarkan suatu dekomposisi dari matriks
peragam dari X, yaitu matriks dan dengan penguraian matriks X pada 3.1
diperoleh . Dengan asumsi: EF=0, E=0, CovF = EFF
T
= I,
dan Cov = E
T
=
Ψ = diagΨ1, …., Ψp, dengan
i
adalah faktor spesifik
untuk lingkungan ke-i. Vektor f dan saling bebas atau, Cov ,F = E ,F
’ 0.
Sedangkan
adalah koleksi dari loading
ij
dengan 1 ik, dan 1jp. Dalam konteks data percobaan multi lokasi, analisis faktor digunakan
untuk mendekomposisi struktur ragam-peragam dari matriks IGL yang berisi ge
ij
dalam sebuah model dengan mempostulatkan sebuah suku pengaruh genotipe tak- teramati latent dalam lingkungan yang berbeda Smith et al. 2001. Sedangkan
Resende dan Thompson 2004 menyebut postulat itu sebagai ketergantungan pada segugus faktor hipotetik yang bersifat acak. Hal yang membedakan
persamaan pada analisis faktor dengan regresi berganda yang biasa adalah, pada analisis faktor baik kovariat maupun koefisien regresi sama-sama tidak diketahui,
sehingga harus diduga dari data, sedangkan pada regresi berganda hanya koefisien yang regresi yang tidak diketahui. Modelnya adalah sebuah model multiplikatif
dari koefisien lingkungan skor faktor dan koefisien genotipe disebut loading. Ini analog dengan model AMMI. Perbedaan utamanya adalah pada model
multiplikatif untuk interaksi, model faktor mengakomodasi pengaruh acak, sedangkan pada model AMMI mengakomodasi pengaruh tetap. Sehubungan
dengan itu, model faktor analitik disebut juga sebagai model AMMI random.
3.3.2 Keterkaitan Model Faktor Analitik dan Model AMMI
Smith et al. 2001 menyebutkan bahwa model AMMI sangat populer untuk memodelkan data percobaan multilokasi. Model ini terdiri dari model aditif pada
pengaruh utama untuk varietas dan lingkungan, sedangkan model multiplikatif untuk efek IGL. Model Multiplikatif diperoleh dengan menggunakan SVD dari
matriks IGL. Misal U melambangkan matriks IGL berukuran G × E. Dalam AMMI, maka U
didekomposisi sebagai U ALB’, dimana A adalah matriks berukuran G × K dan B matriks berukuran E × K serta memenuhi
kondisi A’A I
k
B’ B, L = diag l
1,
…,l
K
, K adalah pangkat dari matriks U. Definisikan B=BL, sehingga dekomposisi dari U dapat dituliskan ke dalam
bentuk : U = AB
T
=
T k
K k
k
b a
1
. 3.2
Kolom dari A a
k
berukuran G × 1 disebut sebagai skor keragaman sedangkan
kolom dari B b
k
berukuran E × 1 adalah loading untuk lingkungan.
35 Seperti halnya analisis faktor, tujuan dari AMMI adalah memperoleh
struktur efek genetik dengan menggunakan sebanyak k ’ komponen yang
minimum. Jika persamaan 3.2 dipecah dengan memperhatikan k ’ faktor pertama,
maka persamaan 3.2 menjadi :
U =
T k
k k
k
b a
1
+
T k
K k
k k
b a
1
=
T
B A
1 1
+
T
B A
2 2
3.3 dimana A
1
adalah matriks berukuran G × k ’ dan B
2
adalah matriks berukuran E × k
’. Dalam model AMMI, pengaruh IGL dimodelkan sebagai :
u
= B
1
I
G
a + e 3.4
dimana a= vec[A
1
] =
T
a
1
…
T G
a
T
berukuran Gk
’ × 1 dan e adalah sisaan dari IGL
yang mengingatkan bahwa tidak semua komponen dalam SVD digunakan. Uraian di atas menjelaskan bahwa terdapat hubungan antara persamaam
3.3 dengan model k faktor analitik untuk pengaruh IGL. Model tersebut dapat dituliskan :
u
= I
G
f + .
Terdapat hubungan yang jelas antara loading lingkungan untuk dua model B
1
dan
dan skor keragaman a dan f. Model k faktor analitik pada persamaan 3.1
analog dengan efek acak pada model AMMI. Di sinilah terletak keserupaan dengan model AMMI. Smith et al. 2001, Resende Thompson 2004.
Dalam sejarah
perkembangannya, mula-mula
Gollob 1968
memperkenalkan model faktor-analisis ragam factor analysis of variance, disebut FANOVA yang menggabungkan aspek analisis ragam dan faktor analisis.
Sedangkan Gabriel dan Zamir 1978 mendiskusikan beberapa model yang mirip dengan FANOVA dengan pendugaan parameter menggunakan metode kuadrat
terkecil. Model AMMI kemudian berkembang dan dikenal sesudah itu. Cornelius et al
. 1996 menuliskan bahwa Gaugh dan Zobel memberi nama lain pada model FANOVA yang diusulkan Gollob sebagai model AMMI.
3.4 Pengembangan Kekekaran pada Model AMMI
Sebagaimana disebutkan sebelumnya bahwa pada dasarnya model AMMI adalah model tetap. Di samping ketaknormalan, isu ketakhomogenan ragam telah banyak
mendapat perhatian para peneliti. Mengatasi ketakhomogenan ragam pada AMMI dalam konteks model campuran dapat digunakan model yang disebut faktor
analitik multiplikatif Smith et al. 2001. Smith et al. 2001 menyimpulkan bahwa model faktor analitik serupa dengan AMMI model campuran.
Seiring dengan perkembangan dekomposisi matriks telah pula dikenal “robust” Principal Component Analysis Jolliffe 1986, dan “robust” Faktor
Croux Filzmoser 1998 yang relatif kekar terhadap pengamatan pencilan, maka
dalam kelas model faktor analitik ini berkembang pula model faktor analitik yang kekar. Pengembangan model AMMI juga dilakukan untuk menangani pencilan
yang seringkali muncul secara bersamaan dengan kondisi ketakhomogenan ragam dalam data.
3.4.1 Penduga Regresi Bolak-balik yang Kekar terhadap Pencilan
Sebagaimana lazimnya, matriks data Y berukuran G E digunakan untuk
melambangkan catatan yang berisi peubah pengamatankarakteristik pada kolom atas beberapa individu objekcase pada barisnya. Dengan peubah-
peubah tersebut yang sudah distandarisasi sehingga mempunyai nilai tengah nol dan ragam 1. Suatu skor faktor dicatat sebagai f
il
. Dengan vektor skor ke-i diberikan sebagai f
i
= f
i1
, . . . , f
ik T
, sedangkan loading vektor ke-j adalah
j
=
j1
, . . . ,
jk T
keduanya tidak diketahui. Vektor dari seluruh loading dan skor faktor dilambangkan dengan
= f
1 T
, . . . , f
n T
,
1 T
, . . . ,
p T
, dan ̂
∑ adalah nilai dugaan fitted value bagi y
ij
. Dengan memilih sedemikian
sehingga nilai dugaan dan nilai aktual dari matriks sangat dekat, kita mendefinisikan nilai dugaan vektor skor
̂ dan
̂ sebagai nilai dugaan vektor
loading. Nilai dugaan matriks data ̂ dapat didekomposisi menjadi ̂ ̂ ̂
dengan baris-baris dari ̂ adalah nilai dugaan skor dan baris-baris dari ̂
adalah nilai dugaan loading.
Perhatikan bahwa rank dari ̂ sebesar-besarnya adalah k p, sedangkan rank dari
Y adalah sebesar E. Pendekatan metode kuadrat terkecil least squares,
37 selanjutnya tulis sebagai LS dalam indeks adalah meminimumkan jumlah kuadrat
sisaan: ̂
� ∑
∑ ̂
dan menghasilkan nilai dugaan ̂ yang dapat dilihat sebagai pendekatan “terbaik”
dalam kacamata kuadrat terkecil terhadap matriks data Y oleh matriks dengan rank = k. Teorema Eckart-Young Gower Hand 1996 menyebutkan bahwa
aproksimasi terbaik ini dapat diperoleh melalui dekomposisi nilai singular SVD terhadap matriks data Y = UDV
T
. Dengan mengganti seluruh nilai singular dalam matriks D dengan nol, kecuali untuk k buah nilai singular terbesar pertama, dapat
diperoleh D
k
dan akhirnya ̂ = UD
k
V
T
. Dan dengan menyatakan ̂ √� dan
̂ √�
⁄ kita memperoleh apa yang disebut solusi komponen utama untuk masalah faktor analisis Johnson Wichern 1998. Selanjutnya, matriks peragam
contoh dari vektor skor dugaan adalah ̂
̂ dimana hal ini konsisten dengan
asumsi awal yaitu CovF = I
k
. Penting untuk kita catat bahwa nilai dugaan ̂ dan
̂ hanya dinyatakan secara khusus untuk suatu transformasi linear. Dan karena
̂ ̂ ̂
untuk sembarang matriks T non-singular berukuran k × k, maka
̂ dan
̂ mendapat nilai yang sama bagi fungsi tujuan
̂ . Meski
demikian nilai dugaan ̂ yang diperoleh bersifat unik. Selanjutnya, jika kita
menambahkan kendala bahwa dugaan matriks peragam bagi vektor skor adalah matriks satuan, maka dugaan
̂ dan ̂ menjadi suatu transformasi orthogonal,
sehingga matriks ̂ ̂
juga unik. Karena kriteria kuadrat terkecil memberikan pembobot yang berlebih
kepada sisaan yang bernilai besar, gagasan awal mengatasinya adalah menggunakan kriteria simpangan mutlak terkecil Least Absolute Deviations atau
disebut kriteria L1, yang memberikan penduga aditif bagi tabel dua arah yang robust Terbeck Davies, 1998. Kriteria L1 ini menghasilkan penduga yang
meminimumkan simpangan mutlak ̂
� ∑
∑ ̂
. Untuk memperoleh
̂ dan ̂ yang optimal, haruslah dipenuhi bahwa nilai dugaan
̂ meminimumkan
∑ | ̂|
dan ̂
meminimumkan ∑ |
̂ |
. Oleh karena itu, pendekatan ini tidaklah meminimumkan kedua jumlah mutlak pada
kriteria L1 secara bersamaan, melainkan dengan menetapkan indeks j dan skor f
i
kemudian mencari
j
yang meminimumkan ∑ |
| . Masalah ini
sekarang bukan lagi masalah bilinear tetapi regresi linear dengan algoritma simpangan mutlak terkecil.
Sehubungan dengan hal tersebut, segera dapat kita lihat bahwa meminimumkan
∑ | |
dilakukan satu persatu untuk setiap j = 1, . . , p berkenaan dengan kriteria L1 untuk skor yang ditetapkan. Analog dengan itu,
untuk loading
j
yang ditetapkan, mencari f
i
yang meminimumkan ∑ |
| untuk setiap i = 1, . . . , G bergantian berkenaan dengan meminimumkan kriteria L1 pada nilai loadings yang diberikan. Bergantian bolak-balik pada
peminimuman ∑ |
̂ |
dan ∑ |
| membawa kita pada skema
pendugaan iteratif yang disebut alternating regression regresi bolak-balik. Catatlah bahwa nilai kriteria L1 menurun pada setiap langkah iteratif itu.
Algoritma yang serupa, tetapi berbasis pada regresi kuadrat terkecil klasik yang bolak-balik, dilakukan oleh de Falguerolles dan Francis 1992, sedangkan
Gabriel 1998 menggunakan regresi bolak-balik dengan basis GLM untuk GBM. Sayangnya, regresi L1 sensitif terhadap pengamatan pengungkit leverage
points . Jika terdapat skor atau loading yang memencil maka regresi L1 dapat
sangat terpengaruh olehnya. Dengan memberikan pembobot yang bernilai lebih rendah downweighting terhadap pengamatan tersebut kita mendapatkan regresi
L1 terboboti weighted L1 regression, dan menghasilkan penduga sebagai berikut :
̂ �
∑ ∑
̂ Satu fungsi objektif tunggal menduga
̂ dan ̂ secara simultan dari baris-baris
dan kolom-kolom matriks Y. Untuk mendapatkan nilai dugaan ̂
digunakan regresi bolak-balik robust Robust Alternating Regressions, disingkat RAR.
Penduga ̂
tidak akan salah arah mislead oleh adanya pengamatan pencilan. Pembobot bagi baris,
didefinisikan oleh �
untuk i = 1, . . . , G dimana
2 k
;0.95 adalah batas atas bagi nilai kritis 5 sebaran
39 khi-kuadrat dengan derajat bebas k, dan jarak kekar robust distance
√ untuk i = 1, . . . , G adalah jarak yang
dihitung dari koleksi vektor skor {
} pada ruang berdimensi k Rousseeuw van Zomeren, 1990. Dan analog dengan itu, segugus pembobot
bagi kolom v
j
didefinisikan dengan cara yang sama menggunakan vektor loading. Catatlah bahwa karena loading dan skor yang sebenarnya tidak teramati, w
i
dan v
j
bergantung pada vektor parameter yang tidak diketahui.
3.4.2 Pengepasan Model melalui FANOVA dengan Penduga RAR
Secara umum model untuk tabel dua arah genotipe × lingkungan pada model ANOVA dapat dituliskan sebagai
ij j
i ij
e g
y
μ
dengan rata-rata umum,
g
i
merepresentasi pengaruh genotipe baris dan e
j
pengaruh lingkungan kolom. Pada ANOVA biasa, pengaruh baris dan kolom diasumsikan memiliki rataan nol.
Suku
ij
dapat dipandang sebagai sisaan dari model pengaruh utama, atau suku interaksi antara baris dan kolom. Ekspresi ini disebut model aditif. Meski
demikian, pada model aditif ini masih mungkin untuk mengekspresikan suku
ij
dalam komponen sistematik oleh struktur pada model faktor: ∑
Sehingga keseluruhan model dituliskan sebagai: ∑
Ide awal pengepasan model ini, dilakukan secara sequensial dengan menduga model aditif terlebih dahulu, dan kemudian melakukan dekomposisi
pada suku sisaan dengan analisis faktor. Namun pengepasan yang lebih baik diperoleh dengan menduga seluruh parameter secara bersamaan. Pada pendugaan
dengan metode kuadrat terkecil, pengepasan secara sequensial maupun bersamaan simultan tidak memberikan hasil yang berbeda. Tetapi untuk model robust
dengan kriteria least absolute kesamaan tersebut tidak lagi berlaku. Pendekatan robust
akan menduga suku-suku aditif dan multiplikatif secara simultan.
Penduga RAR untuk model FANOVA dapat didefinisikan sebagaimana subbab sebelumnya. Anggap
sebagai vektor merupakan koleksi dari semua parameter, yaitu scores, loadings, pengaruh baris dan kolom, juga rataan umum,
µ. Untuk menduga sebanyak k + 1 G + E + 1 elemen dari yang tidak
diketahui, dari sebanyak GE data yang tersedia akan digunakan penduga RAR sebagaimana subbab 3.4.1:
̂ �
∑ ∑
̂ Pembobot w
i
dan v
j
sebagaimana juga pada 3.4.1 adalah pembobot yang menurunkan downweighting scores dan loadings
yang “memencil” dalam ruang dimensi k dari vektor scores dan loadings. Untuk mengidentifikasi secara unik
parameter-parameter dalam y
ij
, fungsi penduga ̂
diminimumkan dengan kendala median median constraints:
i
g
j
e
d �
il
f
jl
�
Kendala ini konsisten dengan pendekatan robust. Algoritma untuk menghitung penduga RAR dalam model FANOVA didasarkan pada regresi bolak-balik
alternating regressions sebagaimana disajikan dalam Croux et al. 2003. Perbedaan dengan model multiplikatif pada subab 3.4.1 adalah bahwa regresi
pada model robust-FANOVA bukan lagi regresi melalui titik asal, melainkan regresi dengan intersep.
3.4.3 Algoritma Kekar untuk Regresi Bolak-balik Robust Alternating
Regression Algorithm
Penduga RAR dapat didekati melalui algoritma bolak-balik alternating sebagai berikut Croux et al. 2003:
Langkah 0: Inisialisasi. Data terlebih dahulu ditransformasi mengikuti ukuran yang kekar yaitu:
dengan MAD adalah Median Absolute Deviation. Sifat keortogonalan dan ragam yang sama dengan satu tidak diperlukan
41 dalam model faktor. Standarisasi awal ini bersesuaian dengan
matriks korelasi yang berbasis Faktor Analitik. Langkah 1: Nilai awal. Pertama, dilakukan analisis komponen utama yang
kekar, robust principal component analysis PCA. Skor komponen utama dijadikan sebagai nilai awal
̂ untuk skor
faktor. Kemudian kita gunakan Projection Pursuit PP berbasis pada estimator yang diimplementasi dalam Croux dan Ruiz-Gazen
1996. Metode yang berbasis pada PP ini dapat menangani kondisi G E, dan sangat kekar. Dengan pendekatan ini kita dapat
mencukupkan perhitungan hanya sampai sejumlah k-komponen pertama yang diperlukan saja, sehingga dapat lebih cepat.
Menggunakan PCA biasa pada langkah ini dapat memperlambat tercapainya kekonvergenan, bahkan dapat memberikan hasil yang
tidak kekar bila terdapat banyak pencilan. Langkah 2: Proses iterasi. Anggaplah iterasi sekarang pada langkah ke
–t t 1 dan
̂ telah diperoleh
Pertama dihitung pembobot bagi baris w
i t
, yang menjadi downweight
bagi pencilan
pada gugus
skor dugaan
{ ̂ | } �
. Kemudian dihitung
̂ �
∑ ̂
untuk j = 1, . . . , E: Pada bagian ini kita mengepas regresi L1 sebanyak E kali dan akan selalu diulang pada setiap langkah
iterasi. Kita perhatikan bahwa nilai loadings juga diduga pada saat yang sama, sehingga memudahkan dalam implementasi algoritma
ini. Untungnya, telah terdapat algoritma regresi L1 yang sangat efisien, sehingga menghemat waktu. Pembobot w
i t
, hanya perlu dihitung sekali dalam setiap langkah iterasi.
Perhitungan pembobot kolom v
j t
analog dengan pembobot baris. Pembobot kolom ini akan menurunkan bobot pencilan pada gugus
dugaan vector loading { ̂
| } � . Kemudian dihitung
̂ �
∑ ̂
untuk i = 1, . . ., G. Nilai dari fungsi tujuan yang dioptimasi telah dihitung untuk
penduga ̂
yang diperoleh pada langkah ke t 1 dan langkah ke t
dibandingkan. Jika tidak ada perbedaan yang esensial, maka proses iterasi dihentikan dan kita memperoleh
̂ ̂
untuk dan
̂ ̂
dengan . Jika tidak maka Langkah 2
diulang. Langkah 3: Orthogonalisasi. Langkah terakhir ini adalah pilihan, dapat
dilakukan dapat pula tidak, karena tidak akan mengubah nilai dugaan fitted values
̂ ̂ ̂ . Kemudian kita hitung penduga
robust bagi matriks peragam ̂
dari skor dugaan { ̂
| }. Karena skor hanya memiliki dimensi sebanyak k yang kecil, maka
matriks ̂
dapat dihitung degan cepat. Sedangkan ̂
dihitung berdasarkan penduga Minimum Covariance Determinant MCD
terboboti reweighted MCD estimator dengan nilai breakdown value
25, melalui algoritma FAST-MCD milik Rousseeuw dan van Driessen 1999. Kita memilih nilai breakdown sebesar 25
pada MCD untuk mendapatkan kombinasi sifat kekekaran robustness dan efisiensi pada penduganya sebagaimana
disarankan oleh Croux dan Haesbroeck 2000. Setelah itu, kita transformasi
̂ ̂ ̂ dan
̂ ̂ ̂ sehingga matriks peragam yang kekar robust covariance matrix
bagi nilai dugaan skor sekarang adalah matriks identitas, yang sesuai dengan syarat model
� ̂ . Pengaruh lainnya adalah
bahwa biplot yang merepresentasi pengamatan, pada Langkah 4
43 tidak akan menunjukkan struktur korelasi, dalam praktik ini
merupakan hal umum terjadi Gower Hand 1996. Langkah 4: Sisaan, uniquenesses, biplot. Nilai sisaan diperoleh
̂ ̂
̂ ̂
dan dapat diplot terhadap indeks baris-kolom i, j pada plot 2 dimensi. Plot ini berguna untuk deteksi pencilan. Dari
sisaan ini nilai uniquenesses dapat diduga sebagai ̂
̂ . Dan pada umumnya digunakan dimesi dua, k = 2,
dapat diperoleh representasi observasi oleh ̂
, ̂
dan peubah oleh
̂ ,
̂ secara tumpang tindih pada satu plot 2 dimensi yang
sama yang disebut biplot. Hal ini juga memungkinkan untuk melakukan regresi bolak-balik
menggunakan penduga regresi lainnya, seperti penduga-M M-estimator dan penduga median kuadrat terkecil Least Median Square estimator, selanjutnya
disingkat LMS. Hal ini bahkan mungkin untuk menjalankan algoritma dengan penduga regresi Kuadrat Terkecil tak-robust, menghasilkan hasil yang sama
dengan pendekatan klasik Gabriel 1978 yang berbasis pada dekomposisi nilai singular. Regresi bolak-balik menggunakan algoritma LMS telah dipertimbangkan
oleh Ukkelberg dan Borgen 1993. Namun, dengan menggunakan LMS menghasilkan algoritma yang sangat memakan waktu. Courx et al. 2003
menunjukkan bahwa penduga RAR memberikan metode faktor analisis yang paling memuaskan sehubungan dengan waktu komputasi, robustness, dan
konvergensi algoritma yang stabil. Meskipun tidak ada bukti konvergensinya, banyak simulasi dan contoh telah menunjukkan kinerja yang baik secara numerik
dan statistika. Prosedur RAR memerlukan pemilihan beberapa penduga kekar pelengkap dan fungsi pembobotan.
3.5 Kajian Kekekaran Model FANOVA terhadap Tambahan Nilai Ekstrim 3.5.1 Data dengan Tambahan Nilai Ekstrim
Kajian ini dilakukan dengan memberikan tambahan nilai ekstrim pada data yang berasal dari salah satu percobaan BB Padi dalam rangka mengembangkan
beras fungsional kaya Fe melalui program biofortifikasi Fe yang dilakukan bekerjasama dengan IRRI. Percobaan ini dilakukan di 7 lokasi pada musim tanam
2007 melibatkan 8 galur hasil pemuliaan dan 2 varietas pembanding. Penambahan pencilan dilakukan pada arah baris dan kolom pada tabel dua
arah matriks IGL, karena penambahan pencilan pada ulangan tidak memberikan pengaruh terhadap analisis kestabilan IGL sebagaimana dilaporkan oleh
Zulhayana et al. 2011. Banyaknya nilai ekstrim yang ditambahkan adalah sebanyak 2, 5 dan 10 masing-masing dengan 2 ulangan, satu ulangan pada
baris dan yang lain pada kolom. Nilai ekstrim yang diberikan adalah nilai ekstrim pada arah kananatas, nilai ekstrim arah kiri dianggap sama karena distribusi
normal yang simetrik. Penambahan ini dilakukan secara acak pada baris-baris atau kolom-kolom, namun tambahan nilai sebesar 3 kali simpangan baku diberikan
pada sel dengan nilai tertinggi pada bariskolom terpilih.
3.5.2 Kekekaran Model FANOVA terhadap Tambahan Nilai Ekstrim
Nilai ekstrim diberikan sebanyak 2, 5 dan 10 atau 1, 4 dan 8 buah dengan tambahan sebesar 3 kali simpangan baku menurut bariskolom diberikan pada sel
dengan nilai tertinggi pada bariskolom terpilih. Hal ini dilakukan untuk memberikan pencilan pada bariskolom yang berbeda. Penambahan pada
pengamatan ekstrim baris belum tentu teridentifikasi pencilan pada pengaruh baris, karena bisa jadi pengaruh yang lebih besar justru dirasakan oleh kolom bila
baris-baris lain lebih rendah, atau mungkin juga pengaruhnya hilang oleh pengamatan pada sel-sel lain.
Penambahan satu buah sel nilai ekstrim, baik pada baris maupun kolom memberikan hasil pendugaan model kekar yang memberikan pembobot pada
suatu pengamatan sebagai pengamatan pengungkit, meskipun tidak terdeteksi sebagai pengaruh pencilan. Sedangkan pada penambahan pencilan sebanyak 4
buah 5 pada kolom teridentifikasi satu pengaruh pencilan dan satu pengukit
45 yaitu pada baris ke-8. Sedangkan penambahan 8 buah pencilan 10 pada baris
menghasilkan identifikasi 1 pencilan yang berpengaruh pada sisi baris, sebaliknya pada 10 pencilan pada kolom
Tabel 3.1 Pembobot bagi pengaruh pengungkit pada penambahan nilai ekstrim
Penambahan nilai Ekstrim 10 pada baris Pembobot Baris
G1 G2
G3 G4
G5 G6
G7 G8
G9 G10
1 1
1 1
1 1
1 1
1 1
Pembobot Kolom L1
L2 L3
L4 L5
L6 L7
L8 0.0502064
1 1
1 1
1 1
1 Penambahan nilai Ekstrim 10 pada Kolom
Pembobot Baris G1
G2 G3
G4 G5
G6 G7
G8 G9
G10 1
1 1
0.24275 1
1 1
1 1
1 Pembobot Kolom
L1 L2
L3 L4
L5 L6
L7 L8
1 1
1 1
1 1
1 1
Bila kita menambahkan nilai ekstrim pada baris dan kolom sekaligus, maka model akan mendeteksi lebih banyak pencilan. Namun suatu bariskolom
dapat memiliki pencilan pada dua sisi atas dan bawah. Hal ini terjadi pada penambahan 1 nilai ekstrim pada baris dan 1 pada kolom. Gambar 3.1
menunjukkan boxplot bagi pengaruh baris dan kolom model FANOVA Kekar. Dua nilai ekstrim yang ditambahkan terdeteksi sebagai pengaruh pencilan kolom
dalam dua arah, atas dan bawah. Keduanya juga merupakan pengamatan pengungkit yang kemudian diboboti dengan lebih rendah.
Tabel 3.2 Pembobot bagi pengaruh pengungkit pada penambahan nilai ekstrim baris dan kolom sekaligus
Penambahan nilai Ekstrim 10 pada baris dan kolom Pembobot Baris
G1 G2
G3 G4
G5 G6
G7 G8
G9 G10
1 1
1 0.28777
1 1
1 1
1 1
Pembobot Kolom L1
L2 L3
L4 L5
L6 L7
L8 1
1 1
1 1
0.7517 1
1
Gambar 3.1 Boxplot pengaruh pencilan baris dan kolom pada penambahan masing-masing sebuah nilai ekstrim atas pada baris dan kolom
Gambar 3.2 Boxplot pengaruh pencilan baris dan kolom pada penambahan masing-masing 4 buah nilai ekstrim atas pada baris dan kolom
Hal yang serupa terjadi pada penambahan 10 nilai ekstrim, 4 buah pada baris dan 4 buah pada kolom. Hanya bedanya nilai ekstrim ini terdeteksi sebagai
satu pengaruh pencilan masing-masing pada baris dan kolom Gambar 3.2. Keduanya juga merupakan pengamatan pengungkit yang kemudian diboboti
dengan lebih rendah. Tabel 3.2 menunjukkan pembobot yang lebih rendah bagi pengamatan pengungkit pada tambahan nilai ekstrim baris dan kolom sekaligus.
Kekekaran juga ditunjukan oleh hasil perbandingan konfigurasi matriks dugaan interaksi pada model FANOVA dari data dengan dan tanpa penambahan
nilai ekstrim. Perbandingan dilakukan dengan membandingkan R-kuadrat procrustes. Model FANOVA Kekar mempertahankan matriks interaksi dugaan
dari pengaruh tambahan nilai ekstrim. Tambahan nilai ekstrim tunggal pada bariskolom belum terdeteksi sebagai pencilan dan model FANOVA memberikan
matrika dugaan yang sangat mirip dengan matriks interaksi yang diperoleh dari data asal.
-1 .0
-0 .5
.0 .5
1 .0
Row Effects
-0 .6
-0 .4
-0 .2
.0 .2
.4
Column Effects
-1 1
2
Row Effects
-0 .8
-0 .6
-0 .4
-0 .2
.0 .2
Column Effects
47 Hal ini ditunjukkan oleh nilai R-kuadrat yang besar 96.029 dan
93.012. Makin banyaknya nilai ekstrim yang ditambahkan terlihat bahwa R- kuadrat dari model ini mulai menurun namun masih diatas 80 untuk nilai
ekstrim sebanyak 20. Penurunan ini bukan semata karena ketidakmampuan model FANOVA Kekar untuk mempertahankan struktrur interaksi dari pengaruh
pencilan namun juga karena struktur data pada konteks interaksi baris kolom mulai berbeda dari data asal akibat banyaknya sel yang berubah oleh tambahan
nilai ekstrim. Perbandingan dengan matriks interaksi dugaan oleh model AMMI
memberikan informasi penting tentang kekekaran model FANOVA Kekar. Hal ini ditunjukkan oleh nilai R-kuadrat procrustes model FANOVA Kekar yang
selalu lebih tinggi dari model AMMI. Dengan tambahan satu nilai ekstrim saja, matriks interaksi dugaan model AMMI telah berbeda dari matriks interaksi
asalnya Hal ini ditunjukkan oleh nilai R-kuadrat yang hanya berkisar diantara 80 Tabel 3.3.
Tabel 3.3 Banyaknya pengaruh pencilan dan pengungkit serta R-kuadrat Procrustes matriks interaksi dugaan model AMMI dan FANOVA
kekar menurut tambahan nilai ekstrimnya
Banyaknya Tambahan Nilai Ekstrim
Banyaknya Pengaruh R-kudrat Procrustes
Pencilan Pengungkit
Baris Kolom Total Persen Baris Kolom Baris Kolom AMMI
FANOVA Kekar 1
- 1
2 -
- -
- 79.891
96.029 -
1 1
2 -
- 1
- 83.548
93.012 1
1 2
3 1
2 2
- 77.123
94.096 4
- 4
5 1
- 1
- 71.021
88.588 -
4 4
5 -
1 -
1 79.559
85.071 4
4 8
10 1
1 1
1 76.904
86.911 8
- 8
10 -
1 -
1 80.254
86.957 -
8 8
10 1
- 1
- 76.194
89.339 8
8 16
20 2
1 2
- 79.396
80.685
Model AMMI tampak tidak dapat mempertahankan pola interaksi dengan adanya nilai ekstrim. Berbeda dengan model FANOVA Kekar, model AMMI
tidak menunjukkan perubahan besar dengan bertambahnya nilai ekstrim. Adanya tambahan nilai ekstrim baik 2, 3, 5 pada data telah membuat matriks
interaksi dugaan model AMMI berbeda dari matriks interaksi dari data asal.
Gambar 3.3 Perubahan R-kuadrat Procrustes dari matrkis interaksi dugaan model AMMI dan FANOVA kekar menurut persentase tambahan nilai
ekstrimnya Gambar 3.3 menunjukkan bahwa secara umum model FANOVA Kekar
lebih baik dalam mempertahankan struktur matriks interaksi dugaan dari pengaruh nilai ekstrim dibandingkan model AMMI. Meski nilai R-kuadrat Procrustes
model FANOVA Kekar terus menurun dengan bertambahnya persentase nilai ekstrim, namun selalu lebih tinggi dari model AMMI. Model FANOVA Kekar
baru mengalami hal yang sama buruknya dengan model AMMI ketika terdapat nilai ekstrim sebanyak 20 yang telah mengubah struktur interaksi dari data
asalnya. Selengkapnya pendugaan matriks interaksi disajikan pada Lampiran 1.
3.6 Penerapan Model FANOVA pada Data Riil
Penerapan pada data riil dilakukan pada data dari Konsorsium Padi Nasional yang dihimpun oleh BB Padi. Percobaan yang dilakukan pada tahun 2008 ini bertujuan
untuk mengevaluasi performa galur padi pada 20 lingkungan budidaya yang berbeda. Melibatkan 11 genotipe yang terdiri dari 3 genotipe dari BATAN, 4 dari
BB Padi, 2 dari Biogen, dan 2 dari IPB, dengan 3 varietas pembanding yaitu Ciherang, Inpari1, dan Cimelati. Respon yang diukur adalah hasil produksi padi
tonha. Percobaan menggunakan Rancangan Acak Kelompok pada petak berukuran 4 m × 5 m. Tabel 3 adalah genotipe yang diamati dalam percobaan dan
kode penggalurannya, sedangkan Tabel 4 adalah lingkungan yang dilibatkan dalam percobaan. Kode genotipe dan kode lingkungan digunakan untuk
memudahkan pembahasan.
0.65 0.75
0.85 0.95
5 10
15 20
R k
u ad
rat Pr
o cr
u ste
s
Persentase Tambahan Nilai Ekstrim
Robust FANOVA AMMI
49 Tabel 3.4 Daftar galur-galur padi sawah pada data multilokasi konsursium Padi
Kode GALUR
ASAL G1
IPB-3 IPB97-F-20-2-1 IPB
G2 BIO-1-AC-BLBBLAS-05
BIOGEN G3
B10531E-KN-14-3-0-LR-B376-1 BB-PADI
G4 OBS 1735PSJ
BATAN G5
BP11252-2-PN-12-2-2-2-1-7-MR-6 BB-PADI
G6 BIO-8-AC-BLB-05
BIOGEN G7
OBS 1740PSJ BATAN
G8 IPB-6 IPB107-F-8-3
IPB G9
BP3300-2C-2-3 BB-PADI
G10 OBS 1739PSJ
BATAN G11
B10531E-KN-14-1-0-LR-B375-12 BB-PADI
G12 CIHERANG
Public G13
INPARI 1 Public
G14 CIMELATI
Public
Tabel 3.5 Kode lingkungan data multilokasi konsursium Padi
Kode Lingkungan
Kode Lingkungan
L1 Bantaeng1
L11 Tabanan2
L2 Narmada1
L12 Ngawi2
L3 Bantul1
L13 Narmada2
L4 Purworejo1
L14 Pesawaran2
L5 Tabanan1
L15 Probolinggo2
L6 Ngawi1
L16 Purworejo2
L7 Pusakanagara1
L17 Pusakanagara2
L8 Pasar miring1
L18 Rangkasbitung2
L9 Asahan1
L19 Takalar2
L10 Bantul2
L20 Taman Bogo2
Ket: 1=musim tanam pertama; 2=musim tanam kedua
Kita akan menggunakan matriks IGL yang berupa tabel dua arah yang selnya berisi median dari 3 ulangan percobaan. Dengan algoritma sebagaimana
pada subab 3.4.3 diperoleh hasil pengepasan model FANOVA Kekar terhadap data riil yang menunjukkan bahwa sebuah pengaruh pencilan terdeteksi pada
pengaruh kolom lingkungan sebagaimana pada boxplot Gambar 3.4. Tabel 3.6 Pembobot bagi pengaruh baris dan kolom terhadap pencilan
Pembobot Baris: G1
G2 G3
G4 G5
G6 G7
G8 G9
G10 G11
G12 G13
G14 1
1 1
1 1
1 1
1 1
1 1
1 1
1 Pembobot Kolom:
L1 L2
L3 L4
L5 L6
L7 L8
L9 L10
L11 L12
L13 L14
L15 L16
L17 L18
L19 L20
1 1
1 0.6989
1 1
1 1
1 1
1 1
1 1
1 1
1 1
1 1
Gambar 3.4 Boxplot pengaruh baris Genotipe dan kolom Lingkungan data konsorsium padi
Gambar 3.5 Biplot IGL model FANOVA kekar faktor 1 49.43, kumulatif 2 faktor 53.76
Biplot pada Gambar 3.5 menunjukkan bahwa di Purworejo pada musim tanam 1 L4 memiliki keragaman hasil yang relatif besar. Hal ini terjadi karena
G1 memiliki median yang sangat besar yaitu 10.32 tomha Lampiran 2, yang berarti G1 sangat baik di L4. Genotipe-genotipe yang dekat dengan titik asal
adalah genotipe yang relatif stabil yaitu G12 CIHERANG, G14 CIMELATI, G4 OBS 1735PSJ dari BATAN dengan median yang lebih tinggi, sedangkan
G3 BB-PADI dan G8 IPB-6 adalah genotipe stabil dengan median yang lebih rendah. Gambar 3.4 dan Tabel 3.6 menunjukkan bahwa hanya satu pengamatan
yang ditengarai sebagai pencilan pada pengaruh kolom yaitu pada L4 dan padanya telah diberikan bobot yang rendah dalam perhitungan.
-1 .0
-0 .5
0. 0.
5
Row Effects
-0 .8
-0 .6
-0 .4
-0 .2
0. 0.
2 0.
4
Column Effects
-4 -3
-2 -1
1 2
obs[,1] -4
-3 -2
-1 1
2
1 2
3 4
5 6
7 8
9
10
11 12
13 14
-0.8 -0.6
-0.4 -0.2
0.0 0.2
0.4 0.6
-0.8 -0.6
-0.4 -0.2
0.0 0.2
0.4 0.6
L1 L2
L3 L4
L5 L6
L7
L8 L9
L10 L11
L12
L13 L14
L15 L16
L17
L18 L19
L20
51
3.7 Penutup
Model FANOVA Gollob 1968 menggabungkan aspek analisis ragam dan analisis faktor, pendugaan parameternya menggunakan kriteria least square.
Model AMMI kemudian dikembangkan sesudah itu, Gaugh dan Zobel memberi nama lain pada model FANOVA yang diusulkan Gollob sebagai model AMMI.
Ketika kita menangani ketakhomogenan ragam dengan model campuran, kita dapat memodelkan data menggunakan model faktor analitik. Model faktor
analitik ekuivalen dengan model AMMI. Keduanya menggunakan prinsip dekomposisi matriks interaksi yang berbasis kriteria least square. Kkekekaran
terhadap pencilan pada model ini diperoleh dengan memberikan bobot yang lebih rendah terhadap pengamatan pencilan dan kemudian menduga parameternya
dengan meminimumkan galat dengan kendala atau kriteria yang konsisten dengan pendekatan robust yaitu least absolute.
Pendugaan parmeter pada model aditif-multiplikatif umumnya dilakukan secara berurutan pendugaan pengaruh model aditif terlebih dahulu dan kemudian
melakukan analisis faktor yang kekar pada sisaannya. Tapi ini tidak lagi berlaku untuk mendapatkan pendugaan model multiplikatif yang kekar. Oleh karena itu
kita akan menduga pengaruh aditif dan multiplikatif secara bersamaan dengan menerapkan Regresi Bolak-balik yang kekar melalui model FANOVA. Model
FANOVA Kekar menurunkan bobot downweighting pencilan pada skor dan loading dalam ruang dimensi k, dan secara unik mengidentifikasi parameter dalam
y
ij
, fungsi ̂
akan diminimalkan di bawah kendala yang konsisten dengan pendekatan kekar yaitu median.
Ketika tidak ada pencilan sama sekali metode ini memberikan hasil yang hampir sama dari kuadrat terkecil. Secara umum model FANOVA Kekar lebih
baik dalam mempertahankan struktur matriks interaksi dugaan dari pengaruh nilai ekstrim dibandingkan model AMMI.
53
BAB IV. MODEL AMMI UNTUK DATA CACAHAN SEBARAN POISSON
4.1 Pengantar
Model AMMI merepresentasikan observasi ke dalam komponen sistematik yang terdiri dari pengaruh utama main effect dan pengaruh interaksi melalui suku-
suku multiplikatif multiplicative interactions, di samping komponen acak sisaan atau galat. Komponen acak pada model ini diasumsikan menyebar Normal dengan
ragam konstan. Pada dasarnya analisis AMMI menggabungkan analisis ragam aditif bagi pengaruh utama perlakuan dengan analisis komponen utama ganda
dengan pemodelan bilinear bagi pengaruh interaksi Sumertajaya 1998, Mattjik 2005.
Struktur interaksi pada model AMMI diuraikan dari matriks sisaan komponen aditif dengan memanfaatkan sifat matematis penguraian nilai singular
atau SVD. SVD merupakan pendekatan kuadrat terkecil dengan reduksi dimensi pangkat matriks data yang terbaik dan menyediakan penyajian secara grafis
yang dikenal secara luas dengan nama Biplot. Groenen dan Koning 2004a menunjukkan penggunaan biplot pada model bilinear sebagai cara baru
memvisualisasi interaksi. Dalam konteks pemuliaan tanaman --khususnya kajian stabilitas genetik pada komponen daya hasil-- komponen acak pada model ini
seringkali diasumsikan berdistribusi normal. Model ini telah berhasil memberikan informasi tentang stabilitas dan adaptasi spesifik suatu genotipe terhadap
lingkungan, karena dilengkapi dengan visualisasi matriks IGL melalui Biplot. Jika matriks data bersebaran normal dengan ragam konstan, penduga
kemungkinan maksimum tereduksi menjadi SVD. Jika sebarannya non- normal binomial atau Poisson misalnya makan kesamaan ini tidak lagi berlaku de
Falguerolles 1996. Pada kajian stabilitas ketahanan terhadap penyakit dan kejadian serangan hama pada tanaman misalnya, asumsi model AMMI dengan
galat yang normal dan ragam konstan tidak selalu dapat dipenuhi. Pencatatan data populasi hama dalam bentuk cacahan counting dan banyaknya buah
polonggabah yang terserang penyakit misalnya, merupakan contoh fenomena ini. Lingkungan dalam hal ini adalah lingkungan biotik yang direpresentasi oleh