Algoritma Kekar untuk Regresi Bolak-balik Robust Alternating
41 dalam model faktor. Standarisasi awal ini bersesuaian dengan
matriks korelasi yang berbasis Faktor Analitik. Langkah 1: Nilai awal. Pertama, dilakukan analisis komponen utama yang
kekar, robust principal component analysis PCA. Skor komponen utama dijadikan sebagai nilai awal
̂ untuk skor
faktor. Kemudian kita gunakan Projection Pursuit PP berbasis pada estimator yang diimplementasi dalam Croux dan Ruiz-Gazen
1996. Metode yang berbasis pada PP ini dapat menangani kondisi G E, dan sangat kekar. Dengan pendekatan ini kita dapat
mencukupkan perhitungan hanya sampai sejumlah k-komponen pertama yang diperlukan saja, sehingga dapat lebih cepat.
Menggunakan PCA biasa pada langkah ini dapat memperlambat tercapainya kekonvergenan, bahkan dapat memberikan hasil yang
tidak kekar bila terdapat banyak pencilan. Langkah 2: Proses iterasi. Anggaplah iterasi sekarang pada langkah ke
–t t 1 dan
̂ telah diperoleh
Pertama dihitung pembobot bagi baris w
i t
, yang menjadi downweight
bagi pencilan
pada gugus
skor dugaan
{ ̂ | } �
. Kemudian dihitung
̂ �
∑ ̂
untuk j = 1, . . . , E: Pada bagian ini kita mengepas regresi L1 sebanyak E kali dan akan selalu diulang pada setiap langkah
iterasi. Kita perhatikan bahwa nilai loadings juga diduga pada saat yang sama, sehingga memudahkan dalam implementasi algoritma
ini. Untungnya, telah terdapat algoritma regresi L1 yang sangat efisien, sehingga menghemat waktu. Pembobot w
i t
, hanya perlu dihitung sekali dalam setiap langkah iterasi.
Perhitungan pembobot kolom v
j t
analog dengan pembobot baris. Pembobot kolom ini akan menurunkan bobot pencilan pada gugus
dugaan vector loading { ̂
| } � . Kemudian dihitung
̂ �
∑ ̂
untuk i = 1, . . ., G. Nilai dari fungsi tujuan yang dioptimasi telah dihitung untuk
penduga ̂
yang diperoleh pada langkah ke t 1 dan langkah ke t
dibandingkan. Jika tidak ada perbedaan yang esensial, maka proses iterasi dihentikan dan kita memperoleh
̂ ̂
untuk dan
̂ ̂
dengan . Jika tidak maka Langkah 2
diulang. Langkah 3: Orthogonalisasi. Langkah terakhir ini adalah pilihan, dapat
dilakukan dapat pula tidak, karena tidak akan mengubah nilai dugaan fitted values
̂ ̂ ̂ . Kemudian kita hitung penduga
robust bagi matriks peragam ̂
dari skor dugaan { ̂
| }. Karena skor hanya memiliki dimensi sebanyak k yang kecil, maka
matriks ̂
dapat dihitung degan cepat. Sedangkan ̂
dihitung berdasarkan penduga Minimum Covariance Determinant MCD
terboboti reweighted MCD estimator dengan nilai breakdown value
25, melalui algoritma FAST-MCD milik Rousseeuw dan van Driessen 1999. Kita memilih nilai breakdown sebesar 25
pada MCD untuk mendapatkan kombinasi sifat kekekaran robustness dan efisiensi pada penduganya sebagaimana
disarankan oleh Croux dan Haesbroeck 2000. Setelah itu, kita transformasi
̂ ̂ ̂ dan
̂ ̂ ̂ sehingga matriks peragam yang kekar robust covariance matrix
bagi nilai dugaan skor sekarang adalah matriks identitas, yang sesuai dengan syarat model
� ̂ . Pengaruh lainnya adalah
bahwa biplot yang merepresentasi pengamatan, pada Langkah 4
43 tidak akan menunjukkan struktur korelasi, dalam praktik ini
merupakan hal umum terjadi Gower Hand 1996. Langkah 4: Sisaan, uniquenesses, biplot. Nilai sisaan diperoleh
̂ ̂
̂ ̂
dan dapat diplot terhadap indeks baris-kolom i, j pada plot 2 dimensi. Plot ini berguna untuk deteksi pencilan. Dari
sisaan ini nilai uniquenesses dapat diduga sebagai ̂
̂ . Dan pada umumnya digunakan dimesi dua, k = 2,
dapat diperoleh representasi observasi oleh ̂
, ̂
dan peubah oleh
̂ ,
̂ secara tumpang tindih pada satu plot 2 dimensi yang
sama yang disebut biplot. Hal ini juga memungkinkan untuk melakukan regresi bolak-balik
menggunakan penduga regresi lainnya, seperti penduga-M M-estimator dan penduga median kuadrat terkecil Least Median Square estimator, selanjutnya
disingkat LMS. Hal ini bahkan mungkin untuk menjalankan algoritma dengan penduga regresi Kuadrat Terkecil tak-robust, menghasilkan hasil yang sama
dengan pendekatan klasik Gabriel 1978 yang berbasis pada dekomposisi nilai singular. Regresi bolak-balik menggunakan algoritma LMS telah dipertimbangkan
oleh Ukkelberg dan Borgen 1993. Namun, dengan menggunakan LMS menghasilkan algoritma yang sangat memakan waktu. Courx et al. 2003
menunjukkan bahwa penduga RAR memberikan metode faktor analisis yang paling memuaskan sehubungan dengan waktu komputasi, robustness, dan
konvergensi algoritma yang stabil. Meskipun tidak ada bukti konvergensinya, banyak simulasi dan contoh telah menunjukkan kinerja yang baik secara numerik
dan statistika. Prosedur RAR memerlukan pemilihan beberapa penduga kekar pelengkap dan fungsi pembobotan.
3.5 Kajian Kekekaran Model FANOVA terhadap Tambahan Nilai Ekstrim 3.5.1 Data dengan Tambahan Nilai Ekstrim
Kajian ini dilakukan dengan memberikan tambahan nilai ekstrim pada data yang berasal dari salah satu percobaan BB Padi dalam rangka mengembangkan
beras fungsional kaya Fe melalui program biofortifikasi Fe yang dilakukan bekerjasama dengan IRRI. Percobaan ini dilakukan di 7 lokasi pada musim tanam
2007 melibatkan 8 galur hasil pemuliaan dan 2 varietas pembanding. Penambahan pencilan dilakukan pada arah baris dan kolom pada tabel dua
arah matriks IGL, karena penambahan pencilan pada ulangan tidak memberikan pengaruh terhadap analisis kestabilan IGL sebagaimana dilaporkan oleh
Zulhayana et al. 2011. Banyaknya nilai ekstrim yang ditambahkan adalah sebanyak 2, 5 dan 10 masing-masing dengan 2 ulangan, satu ulangan pada
baris dan yang lain pada kolom. Nilai ekstrim yang diberikan adalah nilai ekstrim pada arah kananatas, nilai ekstrim arah kiri dianggap sama karena distribusi
normal yang simetrik. Penambahan ini dilakukan secara acak pada baris-baris atau kolom-kolom, namun tambahan nilai sebesar 3 kali simpangan baku diberikan
pada sel dengan nilai tertinggi pada bariskolom terpilih.