Comparison Robust Biweight Midcovariance and Minimum Covariance Determinant Methods in Canonical Correlation Analysis

PERBANDINGAN METODE KEKAR BIWEIGHT
MIDCOVARIANCE DAN MINIMUM COVARIANCE
DETERMINANT DALAM ANALISIS KORELASI KANONIK

FREZA RIANA

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012

i

PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakaan bahwa tesis “Perbandingan Metode Kekar
Biweight Midcovariance dan Minimum Covariance Determinant dalam Analisis
Korelasi Kanonik” adalah karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun.
Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan mau pun
tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan

dalam Daftar Pustaka di bagian akhir tesis ini.

Bogor, Agustus 2012
Freza Riana
NRP G152100051

ii

ABSTRACT
FREZA RIANA. Comparison Robust Biweight Midcovariance and Minimum
Covariance Determinant Methods in Canonical Correlation Analysis. Supervised
by ERFIANI and AJI HAMIM WIGENA.
Canonical Correlation Analysis (CCA) is a multivariate linear used to identify and
quantify associations between two sets of random variables. Its standard
computation is based on sample covariance matrices, which are however very
sensitive to outlying observations. The robust methods are needed. There are two
robust methods, i.e robust Biweight Midcovariance (BICOV) and Minimum
Covariance Determinant (MCD) methods. The objective of this research is to
compare the performance of both methods based on mean square error. The data
simulations are generated from various conditions. The variation data consists of

the proportion of outliers, and the kind of outliers: shift, scale, and radial outlier.
The performance of robust BICOV method in CCA is the best compared to MCD
and Classic.

Keywords : Robust, Canonical Correlation Analysis, Outlier, Biweight
Midcovariance, Minimum Covariance Determinant.

iii

RINGKASAN
FREZA RIANA. Perbandingan Metode Kekar Biweight Midcovariance dan
Minimum Covariance Determinant dalam Analisis Korelasi Kanonik. Dibimbing
oleh ERFIANI dan AJI HAMIM WIGENA.
Analisis korelasi kanonik (AKK) merupakan suatu metode peubah ganda
yang memiliki tujuan untuk mengidentifikasi dan mengukur hubungan antara dua
gugus peubah. AKK berdasarkan pada matriks peragam dan membentuk suatu
kombinasi linier dari setiap gugus peubah sedemikian sehingga korelasi di antara
kedua gugus peubah tersebut menjadi maksimum. Namun matriks peragam pada
AKK sangat sensitif terhadap pengamatan pencilan.
Ada beberapa jenis pengamatan pencilan, pertama, shift outlier yaitu

pengamatan pencilan dari sebaran rata-ratanya berbeda dengan sebaran dasarnya
(tanpa pencilan) tetapi peragamnya sama. Jenis kedua, scale outlier yaitu
pengamatan pencilan yang peragamnya berbeda tetapi kedua sebarannya sama.
Jenis ketiga, radial outlier yaitu pengamatan pencilan yang mucul dari sebaran
dengan rata-rata dan peragam berbeda. Pencilan tersebut dapat mengakibatkan
sebaran data menjadi tidak normal, sehingga matriks peragamnya tidak efisien dan
sifat penduganya menjadi berbias.
Salah satu pendekatan untuk mengatasi pengamatan pencilan yaitu dengan
menggunakan metode kekar. Beberapa metode kekar yang dikembangkan dalam
AKK, diantaranya Minimum Covariance Determinant, Projection Pursuit,
Alternating Regression, Sign Test, dan Biweight Midcovariance. Matriks peragam
yang dihasilkan dari metode-metode tersebut menjadi alternatif sebagai pengganti
matriks peragam klasik.
Tujuan dari penelitian ini adalah: 1) Menentukan metode kekar yang
terbaik antara BICOV dan MCD dalam AKK melalui data simulasi dengan
berbagai kondisi pencilan dan proporsi pencilan; 2) Menerapkan AKK dengan
metode kekar yang terbaik untuk kasus data struktur ekonomi dan kesejahteraan
rakyat yang didapat dari data Survey Ekonomi Nasional (SUSENAS) dan Survey
Penduduk Antar Sensus (SUPAS) tahun 1995.
Data dalam penelitian ini terdiri dari dua sumber yaitu data simulasi dan

data sekunder. Data simulasi berupa data bangkitan yang berguna untuk mengukur
kinerja metode BICOV dan MCD dalam AKK. Data sekunder dalam penelitian
ini terbitan Badan Pusat Statistik (BPS) tahun 1996. Data sekunder tersebut
sebagai penerapan contoh kasus untuk mengidentifikasi dan mengukur keeratan
hubungan antara struktur ekonomi dan kesejahteraan rakyat.
Data simulasi yang dibangkitkan yaitu: 1) Data populasi yang
, untuk gugus X dan gugus Y
dibangkitkan dengan sebaran normal ganda
5000; 2) Data contoh tanpa pencilan (Gugus XY) yang berukuran
dengan
nc=50 dan 100, dibangkitkan secara acak sebanyak M = 500 kali, mengikuti
sebaran seperti data populasi; 3) Data cotoh dengan pencilan didapatkan dengan
mengubah data Gugus XY sejumlah proporsi pencilan ( dengan berbagai jenis
kondisi pencilan. Selanjutnya, kinerja metode kekar BICOV dan MCD dalam
AKK diukur melalui berbagai data simulasi, berdasarkan pada: perbedaan jumlah
pengamatan, proporsi pencilan, jenis pencilan terdiri dari shift outlier, scale
outlier, radial outlier, gugus data pencilan yaitu Gugus X*Y dan Gugus X*Y*.

iv


Data sekunder dalam penelitian terdiri dari dua gugus peubah yaitu gugus
peubah struktur ekonomi dan gugus peubah kesejahteraan rakyat. Gugus peubah
struktur ekonomi terdiri dari empat peubah, yaitu Persentase PDRB dari sektor
pertanian, persentase pekerja di sektor pertanian, persentase pekerja dengan jenis
pekerjaan utama 1 (tenaga profesional, teknisi dan yang sejenis), atau 2 (tenaga
kepemimpinan dan ketatalaksanaan, atau 3 (tenaga usaha dan yang sejenis,
persentase pekerja dengan status pekerja utama sebagai pekerja keluarga. Gugus
peubah kesejahteraan rakyat terdiri dari enam peubah, yaitu persentase penduduk
dengan pengeluaran di atas UMR per kapita per bulan, persentase rumah tangga
dengan penerangan listrik/petromak, persentase rumah tangga yang memiliki
TV/Video/Laserdisc, persentase rumah tangga dengan jenis bahan bakar untuk
memasak minyak tanah/kayu, persentase penduduk tertinggi lulus SMA atau
perguruan tinggi, persentase angka kelahiran total (TFR) tahun (1990-1995).
Berdasarkan hasil simulasi pada kondisi shift outlier menunjukkan bahwa
metode BICOV mampu meminimumkan nilai mean square error (MSE) dengan
pola grafik yang konsisten mulai dari data dengan proporsi pencilan 2% sampai
dengan 12 %, baik untuk gugus X*Y maupun gugus X*Y*. Sebaliknya metode
MCD dan klasik menghasilkan pola grafik yang tidak konsisten, dengan nilai
MSE yang berubah-ubah untuk proporsi pencilan yang berbeda.
Pada kondisi pencilan scale outlier menunjukkan bahwa metode klasik

yang paling buruk dengan nilai MSE paling maksimum dan pola grafik yang
berubah-ubah. Metode MCD merupakan metode yang lebih baik dibandingkan
klasik, dengan menghasilkan nilai MSE lebih rendah dibandingkan klasik. Akan
tetapi, nilai MSE yang paling rendah dan pola grafik yang konsisten untuk setiap
proporsi pencilan yang berbeda ditunjukkan oleh metode BICOV.
Pada kasus data dengan kondisi radial outlier, tidak satupun keseluruhan
hasil simulasi data menunjukkan metode klasik lebih baik daripada metode MCD.
Namun dibandingkan MCD, metode BICOV memberikan nilai MSE paling
minimum untuk setiap proporsi pencilan 12% untuk gugus X*Y dan gugus X*Y*.
Hasil dari kedua gugus data yaitu gugus struktur ekonomi dan kesejahteraan
rakyat terdapat delapan pengamatan yang teridentifikasi sebagai pencilan. Kedua
gugus struktur tersebut mempunyai keeratan hubungan sebesar 0.96, artinya
gugus struktur ekonomi berkorelasi dengan gugus kesejahteraan rakyat dengan
korelasi 0.96.
Kata Kunci : Analisis Korelasi Kanonik, Pencilan, Biweight Midcovariance,

Minimum Covariance Determinant.

v


© Hak Cipta milik IPB, tahun 2012
Hak Cipta dilindungi Undang-undang

Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan
sumbernya. Pengutipan hanya untuk
kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan
laporan, penulisan kritik, atau tinjauan suatu masalah dan pengutipan
tersebut tidak merugikan kepentingan yang wajar bagi IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh Karya tulis
dalam bentuk apa pun tanpa izin IPB.

vi

PERBANDINGAN METODE KEKAR
BIWEIGHT MIDCOVARIANCE DAN MINIMUM COVARIANCE
DETERMINANT DALAM ANALISIS KORELASI KANONIK

FREZA RIANA


Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Program Studi Statistika Terapan

SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
vii

Penguji Luar Komisi pada Ujian Tesis: Dr. Anang Kurnia

viii

Judul Tesis

: Perbandingan Metode Kekar Biweight Midcovariance dan
Minimum Covariance Determinant dalam Analisis Korelasi
Kanonik


Nama

: Freza Riana

NRP

: G152100051

Disetujui
Komisi Pembimbing

Dr. Ir. Erfiani, M.Si
Ketua

Dr. Ir. Aji Hamim Wigena, M.Sc
Anggota

Diketahui,


Ketua Program Studi Statistika Terapan

Dekan Sekolah Pascasarjana

Dr. Ir. Anik Djuraidah, MS

Dr. Ir. Dahrul Syah, M.Sc.Agr

Tanggal Ujian: 09 Agustus 2012

Tanggal Lulus:

ix

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat
dan karunia-Nya, sehingga karya ilmiah yang berjudul “Perbandingan Metode
Kekar Biweight Midcovariance dan Minimum Covariance Determinant dalam
Analisis Korelasi Kanonik” ini dapat diselesaikan.

Terima kasih penulis sampaikan kepada
1. Ibu Dr. Ir. Erfiani, M.Si selaku pembimbing I dan Bapak Dr. Ir. Aji
Hamim Wigena, M.Sc selaku pembimbing II, yang telah banyak
memberikan bimbingan dan saran dalam penyusunan karya ilmiah ini.
2. Ibu Dr. Ir. Anik Djuraidah, M.S selaku ketua Program Studi
Pascasarjana Statistika Terapan, yang telah memberikan motivasi untuk
selalu gigih dan sabar selama masa perkuliahan.
3. Bapak Dr. Anang Kurnia selaku penguji luar komisi pada ujian tesis,
yang telah memberikan kritik dan saran dalam perbaikan penyusunan
karya ilmiah ini.
4. Kedua orangtua, Papa (Umar Surya Sudira) dan Ibu (Nurimah) serta
kedua adik penulis (Dwi Febrina dan Rajab Febriantoro) yang telah
memberikan dukungan, doa dan kasih sayang setiap saat.
5. Mb Mariana, Yani Quarta, dan Sahabat HIMASTER IPB 2010
(Statistika Terapan dan Statistika) atas kebersamaannya.
Penulis menyadari masih banyak kekurangan dalam penulisan karya ilmiah
ini. Untuk itu kritik dan saran yang membangun sangat diperlukan oleh penulis
untuk penulisan karya ilmiah selanjutnya. Semoga karya ilmiah ini dapat
bermanfaat.

Bogor, Agustus 2012

Freza Riana

x

RIWAYAT HIDUP
Penulis dilahirkan di Palembang pada tanggal 28 September 1987 dari
pasangan Bapak Umar Surya Sudira dan Ibu Nurimah. Penulis merupakan putri
sulung dari tiga bersudara. Penulis menyelesaikan pendidikan SLTA di SMA
Negeri 10 Palembang, kemudian melanjutkan perkuliahan di jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sriwijaya, dan
lulus pada tahun 2009. Tahun 2010 penulis diterima di Program Studi Statistika
Terapan pada Sekolah Pascasarjana IPB.

xi

DAFTAR ISI
Halaman
DAFTAR TABEL………………………………………………………………...xiii
DAFTAR GAMBAR……………………………………………………….....….xiv
DAFTAR LAMPIRAN…………………………………………………………...xv
PENDAHULUAN…………………………………………………………………..1
Latar Belakang ....................................................................................................... 1
Tujuan Penelitian .................................................................................................... 2
TINJAUAN PUSTAKA ............................................................................................ 3
Analisis Korelasi Kanonik...................................................................................... 3
Biweight Midcovariance ........................................................................................ 5
Minimum Covariance Determinant ........................................................................ 6
Pencilan .................................................................................................................. 8
Pendeteksian Pencilan ............................................................................................ 9
METODOLOGI ....................................................................................................... 11
Data ...................................................................................................................... 11
Data Simulasi ....................................................................................................... 11
Data Sekunder ...................................................................................................... 11
Metode .................................................................................................................. 12
HASIL DAN PEMBAHASAN ................................................................................ 17
Simulasi ................................................................................................................ 17
Kinerja Metode .................................................................................................... 17
Kondisi Shift Outlier ............................................................................................ 17
Kondisi Scale Outlier .......................................................................................... 19
Kondisi Radial Outlier ........................................................................................ 22
Penerapan Metode BICOV ................................................................................. 25
SIMPULAN DAN SARAN .................................................................................... 27
Simpulan ............................................................................................................... 27
Saran ..................................................................................................................... 27
DAFTAR PUSTAKA .............................................................................................. 29
LAMPIRAN ............................................................................................................ 31

xii

DAFTAR TABEL
Halaman
1 Statistik deskriptif gugus data struktur ekonomi……………….......

25

2 Statistik deskriptif gugus data kesejahteraan rakyat…………...........

25

3 Nilai jarak Mahalanobis kekar....…....................................................

26

xiii

DAFTAR GAMBAR
Halaman
1 Diagram Alir FAST-MCD..........……………………..........................

8

2 Diagram Alir Tahapan I Penelitian……………...................................

16

3 Diagram Alir Tahapan II Penelitian……….....…………….................

16

4 Grafik nilai MSE dengan kondisi shift outlier
, nc=50
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y* ……………………

18

5 Grafik nilai MSE dengan kondisi shift outlier
, nc=50
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*……………………...

18

6 Grafik nilai MSE dengan kondisi shift outlier
, nc=100
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y* ……………………..

19

7 Grafik nilai MSE dengan kondisi shift outlier
, nc=100
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y* ……………………..

19

8 Grafik nilai MSE dengan kondisi scale outlier K1=100, nc=50
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*………………………

20

9 Grafik nilai MSE dengan kondisi scale outlier K2=144, nc=50
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*………………………

20

10 Grafik nilai MSE dengan kondisi scale outlier K1=100, nc=100
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*……………………..

22

11 Grafik nilai MSE dengan kondisi scale outlier K2=144, nc=100
pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*…………………….

22

K1=100,
12 Grafik nilai MSE dengan kondisi radial outlier
nc=50 pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*……………..

23

K2=144,
13 Grafik nilai MSE dengan kondisi radial outlier
nc=50 pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*…………….

23

14 Grafik nilai MSE dengan kondisi radial outlier
dan
K1=100, nc=100 pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*….

24

dan K2=144,
15 Grafik nilai MSE dengan kondisi radial outlier
nc=100 pengamatan: (a) Gugus X*Y, (b) Gugus X*Y*….

24

xiv

DAFTAR LAMPIRAN
Halaman
1 Gugus data peubah struktur ekonomi…….........................................

31

2 Gugus data peubah kesejahteraan rakyat .…….…….........................

32

3 Nilai MSE dengan jumlah pengamatn nc=50.....................................

33

4 Nilai MSE dengan jumlah pengamatn nc=100….….….....................

34

xv

1

PENDAHULUAN
Latar Belakang
Analisis korelasi kanonik (AKK) merupakan suatu metode peubah ganda
untuk mengidentifikasi dan mengukur hubungan antara dua gugus peubah. AKK
berdasarkan pada matriks peragam (Dehon et al. 2000) dan membentuk suatu
kombinasi linier dari setiap gugus peubah sedemikian sehingga korelasi di antara
kedua gugus peubah tersebut menjadi maksimum (Johnson dan Wichern 2002).
Namun matriks peragam pada AKK sangat sensitif terhadap pengamatan pencilan
(Romanazzi 1992). AKK dapat diaplikasikan dalam berbagai bidang seperti
pemasaran,

transportasi,

kedokteran,

meteorologi,

perbankan,

pertanian,

pendidikan, dan perekonomian.
Hawkins dan McLachlan (1997) menyatakan bahwa ada dua jenis
pengamatan pencilan. Pertama, shift outlier yaitu pengamatan pencilan dari
sebaran rata-ratanya berbeda dengan sebaran dasarnya (tanpa pencilan) tetapi
peragamnya sama. Kedua, scale outlier yaitu pengamatan pencilan yang
peragamnya berbeda tetapi kedua sebarannya sama. Hubert dan Van Driessen
(2004) menggabungkan keduanya yaitu pengamatan pencilan yang mucul dari
sebaran dengan rata-rata dan peragam berbeda, yang dikenal sebagai radial
outlier. Pencilan tersebut dapat mengakibatkan sebaran data menjadi tidak normal,
sehingga matriks peragamnya tidak efisien dan sifat penduganya menjadi berbias
(Yohai 2006).
Salah satu pendekatan untuk mengatasi pengamatan pencilan yaitu dengan
menggunakan metode kekar (Rancher 2002). Beberapa metode kekar yang
dikembangkan dalam AKK, diantaranya Minimum Covariance Determinant,
Projection

Pursuit,

Alternating

Regression,

Sign

Test,

dan

Biweight

Midcovariance. Dehon et al. (2000) membangkitkan data simulasi dengan
proporsi pencilan 10% pada kondisi scale outlier, untuk membandingkan metode
Minimum Covariance Determinant (MCD), Projection Pursuit,

Alternating

Regression, dan Sign Test. Hasil simulasinya menunjukkan bahwa MCD
memberikan nilai Mean Square Error (MSE) paling minimum. Cannon dan Hsieh
(2008)

menggunakan

metode

Biweight

Midcovariance

(BICOV)

yang

dikembangkan oleh Wilcox pada tahun 1997, untuk mengatasi pencilan pada
peramalan curah hujan.

2

Pada penelitian ini akan dibandingkan kinerja metode BICOV dan MCD
melalui data simulasi, dan selanjutnya metode kekar terbaik yang diperoleh
diterapkan pada data bidang perekonomian untuk mengetahui korelasi antara
gugus struktur ekonomi dan kesejahteraan rakyat.

Tujuan Penelitian
Tujuan dari penelitian ini adalah:
1. Menentukan metode kekar yang terbaik antara BICOV dan MCD dalam
AKK melalui data simulasi dengan berbagai kondisi pencilan dan proporsi
pencilan.
2. Menerapkan AKK dengan metode kekar yang terbaik untuk kasus data
struktur ekonomi dan kesejahteraan rakyat yang didapat dari data Survey
Ekonomi Nasional (SUSENAS) dan Survey Penduduk Antar Sensus
(SUPAS) tahun 1995.

3

TINJAUAN PUSTAKA
Analisis Korelasi Kanonik
Analisis korelasi kanonik (AKK) yang diperkenalkan oleh Hotelling pada
tahun 1936, bertujuan untuk mengidentifikasi dan menghitung hubungan linier
antara dua gugus peubah. Perhitungan AKK berfokus pada korelasi antara
kombinasi linier dari dua gugus peubah. Ide utama dari AKK adalah mencari
pasangan dari kombinasi linier yang memiliki korelasi terbesar. Pasangan
kombinasi linier ini disebut peubah kanonik dan korelasinya disebut korelasi
kanonik (Johnson dan Wichern 2002).
Misalkan gugus peubah pertama
, dengan

dan gugus kedua

. Karakteristik dari vektor peubah acak X dan

Y sebagai berikut:

Vektor rataan:

dengan

adalah rata-rata peubah X dan

adalah rata-rata peubah Y.

Matriks peragam dapat disusun sebagai berikut:

(1)
Matriks peragam pada persamaan (1), selanjutnya disebut sebagai matriks
peragam klasik, dengan:
adalah matriks peragam peubah X berukuran (

)

adalah matriks peragam peubah Y berukuran (

)

adalah matriks peragam peubah X dan peubah Y berukuran (

)

adalah matriks peragam peubah Y dan peubah X berukuran (

)

Kombinasi linier kedua gugus peubah dapat dituliskan sebagai berikut:

4

=
=
=
Vektor

koefisien

didapatkan

dengan

dari matriks
vektor ciri

mencari

akar

yang berpadanan dengan

Sedangkan untuk vektor koefisien

didapatkan dengan

dari matriks

mencari akar ciri

ciri

berpadanan dengan vektor ciri

yang

, sehingga vektor koefisien

dan

adalah sebagai berikut:

dengan:
adalah vektor pembobot kanonik U ke-i
adalah vektor pembobot kanonik V ke-i
adalah vektor ciri U ke-i
adalah vektor ciri V ke-i
adalah min

, i=

Selanjutya korelasi kanonik didapatkan dari:

Nilai koefisien korelasi kanonik berada pada kisaran

dan kuadrat

korelasi kanonik merupakan proporsi keragaman peubah kanonik U yang dapat
dijelaskan oleh peubah kanonik V (Johnson dan Wichern 2002).

Metode Kekar
Perhitungan AKK berdasarkan matriks peragam klasik sangat sensitif
terhadap pencilan (Romanazzi 1992), sehingga diperlukan metode kekar untuk
mengatasi pencilan (Rancher 2002). Beberapa metode kekar telah dikembangkan
seperti Biweight Midcovariance dan Minimum Covariance Determinat. Kedua

5

matriks peragam yang dihasilkan dari kedua metode tersebut menjadi alternatif
sebagai pengganti matriks peragam klasik.

Biweight Midcovariance
Korelasi Pearson merupakan hubungan antara dua peubah yang bisa
dipengaruhi oleh keberadaan suatu pengamatan pencilan (Wilcox 2004). Biweight
midcorrelation merupakan alternatif sebagai pengganti dari korelasi Pearson.
Biweight berasal dari pembobot Tukey’s bisquare yaitu:

Misalkan

adalah jumlah pengamatan,

median dari y, sehingga pembobot untuk

adalah median dari x, dan
dan

adalah median dari

dengan

adalah

adalah:

dan

adalah median dari

.
Peragam Biweight Midcovariance dari x dan y:

dengan:
jika

, selainnya

jika

, selainnya

Peragam Biweight Midvariance dari x:

Peragam Biweight Midvariance dari y:

Matriks peragam BICOV sebagai berikut:
(3)

6

Sehingga didapatkan Biweight Midcorrelation adalah:

Nilai korelasi pada Biweight Midcorrelation sama dengan nilai korelasi Pearson
yaitu berada pada kisaran -1 ≤

≤ +1.

Matriks peragam BICOV juga dapat digunakan dalam AKK yaitu dengan
menggantikan matriks peragam klasik, sehingga didapatkan nilai korelasi kanonik
sebagai berikut:

Minimum Covariance Determinant
Minimum Covariance Determinant (MCD) diperkenalkan oleh Rousseeuw
pada tahun 1985. Metode MCD bertujuan mencari submatriks H yang berisi
unsur-unsur matriks sejumlah h elemen yang matriks peragamnya memiliki
determinan terkecil (Rousseeuw 1999). Pada prinsipnya metode MCD adalah
mencari submatriks H berukuran

yang dipilih secara acak sejumlah h

elemen dari matriks X berukuran

, dengan h merupakan bilangan bulat

. Kemungkinan banyaknya submatriks H yang dapat

terkecil dari

dipilih secara acak dari matriks X yaitu sebanyak kombinasi h dari n yang
berbeda,

. Submatriks H digunakan untuk memperoleh dugaan vektor rataan

dan matriks peragam. Jika n kecil, maka penduga MCD relatif mudah dan cepat
untuk diperoleh, tetapi jika n besar, maka perlu waktu lama dan banyak sekali
kombinasi submatriks yang harus diperoleh untuk mendapatkan penduga MCD.
Keterbatasan tersebut dapat diatasi dengan pendekatan FAST-MCD dengan
algoritma C-Step yang dikembangkan oleh Rousseeuw dan Vandriessen (1999).
, dengan

Misalkan
dari matriks

berukuran

merupakan submatriks berukuran

. Hitung vektor rataan dan matriks peragam:

(5)
Jika det(

, maka definisikan jarak relatif, yaitu:

7

, dengan i=1,2,..n.
Urutkan jarak untuk setiap pengamatan, dengan
Selanjutnya, sejumlah h pengamatan yang menghasilkan jarak terkecil
menjadi

unsur

sedemikian

matriks

. Kemudian, hitung
, dengan det(

det(

Penjelasan
det(

di

atas

sehingga
dan

berdasarkan matriks

.

mensyaratkan

det(

,

karena

jika

maka nilai objektif minimum untuk mendapatkan determinan

terkecil telah ditemukan. Selain itu, jika det(

, penggunaan formulasi

yang det(

di atas akan menghasilkan

det(

. Dalam

FAST-MCD akan digunakan algoritma C-Step, ada pun algoritma dari C-Step
sebagai berikut:
1. Tetapkan H(old), hitung
2. Hitung jarak relatif

mcd(old)

mcd(old)(i)

dan

mcd(old).

untuk i=1, 2, …, n

3. Urutkan jarak relatif hasil permutasi dari
d(old)

d(old)

dengan d(old)

.

4. Tentukan H(new)
5. Hitung

mcd(new)

dan

mcd new)

.

6. Pengulangan algoritma C-Step akan menghasilkan sejumlah proses iterasi.
Proses
det(
7.

iterasi
det(

akan

berhenti,

jika

det(

atau

.

Jika kondisi di atas belum terpenuhi, maka proses iterasi akan terus
berlangsung hingga menghasilkan sejumlah h amatan yang memiliki nilai
determinan terkecil dan konvergen.

8

Diagram alir FAST-MCD dapat dilihat pada Gambar 1:
Misalkan didefinisikan
X=[x1,x2,…xp]
Tentukan H(1) dari X yang terdiri dari
h elemen h=(n+p+1)/2

Iterasi berhenti, dan didapatkan
matriks peragam (

Hitung rataan (t mcd (1)), peragam( mcd (1))
dan Det( mcd (1)) dari H(1)

Ya
Tidak

Det( mcd (2))
Hasil korelasi kanonik pertama dari gugus peubah struktur ekonomi dan
kesejahteraan rakyat sebesar 0.96. Nilai korelasi tersebut menjelaskan bahwa ada
hubungan antara kedua gugus peubah tersebut sebesar 0.96. Nilai tersebut hampir
sama dengan nilai korelasi kanonik pertama yang dihasilkan dengan
menggunakan peragam klasik sebesar 0.98.

27

SIMPULAN DAN SARAN
Simpulan
Biweight Midcovariance merupakan metode kekar terbaik yang memberikan
nilai mean square error paling minimum dibandingkan metode klasik dan metode
kekar Minimum Cov