Data ini terdiri dari 26 amatan dengan empat peubah bebas dan tiga kelompok. Wilayah yang
termasuk ke dalam 26 amatan ini dapat dilihat pada Lampiran 6, sedangkan macam-macam
kelompok dan peubah bebas dapat dilihat pada Tabel 2 dan Tabel 3.
Tabel 2 Tabel Keterangan Skor Diskriminan. Peubah Keterangan
Y
1
Divisi Regional A. Y
2
Divisi Regional B. Y
3
Divisi Regional C. Tabel 3 Tabel Keterangan Peubah Bebas.
Peubah Keterangan X
1
Produksi beras tontahun. X
2
Pengadaan tontahun.
X
3
Raskin tontahun.
X
4
Jumlah Penduduk jiwa.
Metode Penelitian
Tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut :
A. Metode Simulasi
1. Menetapkan parameter
μ
1,
μ
2, 1,
2
dan
Σ μ
1
=1,2,3,
μ
2
=6,7,8,
1
=21,22,23,
2
=23,21,22 dan
Σ=diag3,3,3 dengan
nilai ragam=3 dan peragam=0. 2. Membangkitkan
X
1
~MN μ
1
, Σ
dan
X
2
~MN μ
2
, Σ untuk kelompok-1 dan
kelompok-2 berukuran nxp dengan n=95 dan p=3 dengan kondisi antar peubahnya
tidak saling berkorelasi, untuk lebih jelasnya dapat dilihat pada Lampiran 1.
3. Membangkitkan data pencilan multivariat 5 untuk kelompok-1 dan kelompok-2
X
pencilan1
~MN
1
, Σ dan X
pencilan2
~MN
2
, Σ berukuran nxp dengan n=5
dan p=3 dengan kondisi antar peubah bebasnya tidak saling berkorelasi, untuk
yang lain dapat dilihat pada Lampiran 1. 4. Menggabungkan matriks data kelompok-1
beserta pencilannya dan matriks data kelompok-2 beserta pencilannya kedalam
satu gugus data lalu uji kenormalan ganda dengan menggunakan plot kuantil khi-
kuadrat.
5. Melakukan pengelompokan menggunakan analisis diskriminan dengan penduga kekar
MCD dan MLE. 6. Melakukan perhitungan tingkat kesalahan
klasifikasi. 7. Mengulangi langkah di atas sebanyak 100
kali ulangan. 8. Ulangi langkah satu sampai tujuh dengan
ukuran contoh dan proporsi pencilan sesuai dengan Lampiran 1.
B. Penerapan Pada Data Riil
1. Melakukan eksplorasi data. 2. Melakukan uji kesamaan vektor rataan
antar kelompok : H
:
μ
1
= μ
2
= μ
3
H
1
: sedikitnya ada dua kelompok dimana
μ
i
≠μ
j
untuk i ≠j dengan i dan j= 1,2,…p
diharapkan dari uji ini adalah H ditolak,
sehingga kita mempunyai informasi awal bahwa peubah yang sedang diteliti memang
membedakan antar kelompok. 3. Melakukan uji kehomogenan matriks
ragam-peragam dengan uji Box’s M. 4. Melakukan pengelompokan menggunakan
analisis diskriminan dengan penduga kekar MCD dan MLE.
5. Melakukan perhitungan tingkat kesalahan klasifikasi.
HASIL DAN PEMBAHASAN Karakteristik Data Simulasi
Pembangkitan data yang dilakukan dalam penelitian ini adalah pembangkitan data dengan
dua kelompok yang mengikuti sebaran normal ganda dengan cara pembangkitan data yang telah
dijelaskan dalam metode penelitian. Data simulasi yang digunakan adalah data yang mewakili ketiga
ukuran data yaitu kecil, sedang dan besar. D a t a d e n g a n u k u r a n k e c i l d i w a k i l i o l e h
n = 2 0 , d a t a u k u r a n s e d a n g o l e h n = 4 0 d a n d a t a u k u r a n b e s a r o l e h n = 2 0 0 . Data
dibangkitkan secara acak mengikuti sebaran normal ganda yang kemudian dikontaminasi
dengan proporsi pencilan sebesar 0, 5, 10, 15 dan 20 dari jumlah amatan masing masing
kelompok. Pembangkitan data ini dilakukan sebanyak 100 kali ulangan dengan seluruh
kombinasi ukuran data beserta proporsi pencilannya.
Vektor rata-rata dan matriks ragam-peragam disesuaikan dengan asumsi yang digunakan pada
analisis diskriminan linier. Asumsi pertama adalah peubah penjelas mampu membedakan kedua
kelompok dengan baik, oleh sebab itu diberikanlah vektor rata-rata kelompok-1 sebesar
μ
1
=1,2,3 dan vektor rata-rata kelompok-2 sebesar
μ
2
=6,7,8 agar dapat membedakan kedua kelompok. Asumsi lain yang dibutuhkan pada
analisis diskriminan linier adalah kehomogenan ragam. Agar asumsi tersebut terpenuhi maka
matriks ragam-peragam yang digunakan untuk semua kelompok dan pencilan bernilai sama yaitu
sebesar
Σ=diag3,3,3.
Σ=diag3,3,3 =
Ruang lingkup masalah yang dibahas pada penelitian ini hanya menggunakan peubah
penjelas dan kelompok yang berjumlah sedikit yaitu dengan tiga peubah penjelas dan dua
kelompok. Ragam yang diberikan pada proses simulasi hanya mewakili satu ukuran ragam yaitu
dengan ragam=3.
Pencilan Peubah Ganda
Pemberian proporsi pencilan pada data dilakukan ketika data bangkitan kelompok-1 dan
kelompok-2 telah terbentuk dan memenuhi semua asumsi yang dibutuhkan. Data simulasi yang telah
digabungkan antara data kelompok-1 dan kelompok-2 beserta pencilannya untuk masing-
masing kelompok disebut dengan data awal. Pendeteksian pencilan pada data awal berguna
untuk memberi informasi bahwa jika terdapat pencilan dalam data maka solusi yang dapat
diberikan untuk melakukan pengelompokkan adalah dengan menggunakan penduga MCD. Hal
ini dikarenakan penduga MCD memiliki vektor rata-rata dan matriks ragam-peragam yang kekar
terhadap pencilan.
Pembangkitan pencilan dilakukan dengan memberikan nilai vektor rata-rata yang sangat
jauh dari nilai vektor rata-rata kedua kelompok, proporsi pencilan yang diberikan terdiri dari 0-
20 dari jumlah amatan setiap kelompok. Pencilan ini dapat diidentifikasikan dengan
menggunakan jarak Mahalanobis.
Jarak Mahalanobis pada data awal berbeda dengan jarak Mahalanobis pada penduga MCD
dan MLE. Jarak Mahalanobis pada data awal menggunakan vektor rata-rata yang berasal dari
gabungan kedua kelompok, sedangkan jarak Mahalanobis penduga MCD dan MLE
menggunakan vektor rata-rata yang sudah dipisahkan kedalam dua kelompok. Kekurangan
dari jarak Mahalanobis penduga MLE ini adalah tidak mampu mengidentifikasikan pencilan yang
terdapat pada masing-masing kelompok sehingga vektor rata-rata yang dihasilkan masih
terkontaminasi oleh pencilan. Berbeda dengan penduga MLE, jarak Mahalanobis pada penduga
MCD mempunyai vektor rata-rata yang kekar terhadap pencilan sehingga vektor rata-rata yang
dihasilkan untuk setiap kelompok sudah terbebas dari pengaruh pencilan.
Amatan yang diduga sebagai pencilan oleh masing-masing nilai jarak Mahalanobis pada
penduga MLE dan MCD di beri bobot=0 sedangkan amatan yang tidak diduga sebagai
pencilan diberi bobot=1. Hasil yang lebih lengkap mengenai pencilan ini dapat dilihat pada
Lampiran 2.
Vektor Rata-Rata Penduga MCD dan MLE
Hasil dari pengelompokkan dengan menggunakan penduga MCD dan MLE
menghasilkan nilai vektor rata-rata masing- masing penduga. Gambar 1 dan 2 menampilkan
hasil dari selisih vektor rata-rata penduga MCD dan MLE dengan vektor rata-rata awalnya.
Gambar 1 Grafik Selisih Rata-rata Vektor Rataan MCD dengan Vektor Rata-Rata Awal.
Pembangkitan data pada penelitian ini membangkitkan vektor rata-rata kelompok-1
sebesar
μ
1
=1,2,3 dan vektor rata-rata kelompok- 2 sebesar
μ
2
=6,7,8 dengan vektor rata-rata pencilan sebesar
1
=21,22,23 dan
2
=23,21,22. Gambar 1 merupakan hasil dari selisih rata-rata vektor rataan penduga MCD
dengan vektor rata-rata awal untuk semua ukuran contoh dari berbagai proporsi pencilan. Hasil
tersebut menunjukkan bahwa pada proporsi pencilan pada rentang 0 sampai 20 memiliki
selisih hampir mendekati nilai nol, hal ini mengindikasikan bahwa vektor rata-rata penduga
MCD memiliki nilai yang hampir sama dengan nilai vektor rata-rata awal. Lampiran 3, 4 dan 5
memberikan hasil yang lebih lengkap mengenai vektor rata rata masing-masing penduga. Jika
membandingkan vektor rata-rata penduga MCD dari semua ukuran contoh hasil yang diperoleh
tidak jauh berbeda, namun dapat dilihat bahwa semakin besar ukuran contoh maka vektor rata-
ratanya semakin dekat dengan vektor rata-rata awal meskipun hanya terdapat perbedaan yang
sedikit dari ukuran contoh yang lainnya. Hal tersebut terjadi karena semakin besar ukuran
contoh yang diberikan maka model yang dihasilkan akan semakin tepat dan mendekati
pendugaan parameternya Purwadi. Kelompok
1 Kelompok
2
Vektor rata-rata penduga MCD memiliki nilai yang hampir sama dengan vektor rata-rata awal
dari masing-masing kelompok karena penduga MCD memiliki sifat kekar terhadap pencilan
sehingga mampu mengidentifikasikan pencilan yang terdapat pada masing-masing kelompok.
Amatan yang diidentifikasikan sebagai pencilan diberi bobot=0 sedangkan yang tidak
teridentifikasikan sebagai pencilan diberi bobot=1. Setelah seluruh amatan sudah terboboti,
maka kita dapat membedakan amatan yang merupakan pencilan atau bukan pencilan.
Vektor rata-rata penduga MCD untuk kelompok-1 dan kelompok-2 dihasilkan dari nilai
rata-rata amatan yang memiliki bobot=1 yang terdapat pada masing-masing kelompok
sedangkan vektor rata-rata penduga MLE untuk kelompok-1 dan kelompok-2 dihasilkan dari nilai
rata-rata seluruh amatan pada masing-masing kelompok tanpa memisahkan amatan yang
mengandung pencilan.
Gambar 2 Grafik Selisih Rata-rata Vektor Rataan MLE dengan Vektor Rata-Rata Awal.
Gambar 2 menampilkan hasil dari selisih rata- rata vektor rataan penduga MLE dengan vektor
rata-rata awalnya. Vektor rata-rata penduga MLE menghasilkan nilai yang sama baiknya dengan
penduga MCD pada data yang tidak terkontaminasi oleh pencilan 0. Hal tersebut
dapat dilihat pada selisih vektor rataan penduga MLE pada proporsi pencilan 0 yang mendekati
nilai nol. Seiring bertambahnya proporsi pencilan, maka vektor rata-rata yang dihasilkan semakin
jauh dari vektor rata-rata awal. Hal ini terlihat dari grafik proporsi pencilan 5-20 yang makin
menjauhi nilai nol.
Nilai vektor rata-rata penduga MLE untuk semua ukuran contoh memiliki karakteristik yang
sama seperti yang terlihat pada Lampiran 2. Banyaknya ukuran contoh tidak mempengaruhi
nilai vektor rata-ratanya tetapi semakin banyak proporsi pencilan yang diberikan maka nilai
vektor rata-rata penduga MLE semakin jauh dari nilai vektor rata-rata awal untuk masing-masing
kelompok.
Penduga MLE tidak mampu mengidenifikasikan pencilan dengan baik. Hal
tersebut dapat dilihat pada Lampiran 2 dimana pada amatan 11, 18, 32, 39 dan 40 penduga MLE
tidak mampu mengidentifikasikannya sebagai suatu pencilan. Ketidakmampuan pendeteksian
pencilan tersebut diakibatkan oleh jarak Mahalanobis pada penduga MLE yang dibangun
berdasarkan nilai vektor rata-rata yang masih terdapat pencilan didalamnya.
Matriks Ragam-PeragamPenduga MCD dan MLE
Asumsi kehomogenan ragam adalah salah satu asumsi yang harus terpenuhi pada analisis
diskriminan linier, karena itu penelitian ini menggunakan matriks ragam-peragam yang sama
untuk semua kelompok dan pencilan. Tabel 4 menunjukkan bahwa nilai matriks ragam-peragam
yang dihasilkan penduga MCD untuk berbagai proporsi pencilan mendekati dengan nilai ragam
peragam yang diberikan pada awal proses simulasi. Hasil matriks ragam-peragam untuk
semua ukuran dapat dilihat pada Lampiran 3, 4 dan 5.
Tabel 4 Nilai Rata-rata Matriks Ragam-Peragam
Penduga MCD dari Semua Ukuran Data. Pencilan
Matriks Ragam-Peragam MCD .
. .
. .
. .
. .
5 .
. .
. .
. .
. .
10 .
. .
. .
. .
. .
15 .
. .
. .
. .
. .
20 .
. .
. .
. .
. .
Nilai matriks ragam-peragam penduga MCD untuk semua ukuran contoh memiliki karakteristik
yang sama dimana besarnya ukuran contoh pada data tidak mempengaruhi nilai matriks ragam-
‐1 1
2 3
4 5
1 2
3 4
5 6
pencilan pencilan
5 pencilan
10 pencilan
15 pencilan
20 Kelompok 1
Kelompok 2
peragam yang dihasilkan. Masing masing ukuran memiliki matriks ragam-peragam yang hampir
mendekati matriks ragam-peragam awal seperti yang terlihat pada Lampiran 3, 4 dan 5
Sama halnya dengan mencari nilai vektor rata- rata penduga MCD, matriks ragam-peragam ini
didapat melalui perhitungan dari amatan yang hanya diidentifikasikan bukan sebagai pencilan
dengan bobot Bbt=1. Nilai vektor rata-rata dan matriks ragam-peragam diperoleh melalui proses
algoritma FAST-MCD sehingga mendapatkan himpunan dengan determinan matriks ragam-
peragam terkecil.
Vektor rata-rata dan matriks ragam-peragam pada masing-masing penduga digunakan untuk
menghitung nilai jarak Mahalanobis. Jarak Mahalanobis ini berfungsi untuk
mengidentifikasikan amatan yang termasuk ke dalam pencilan atau bukan pencilan. Pada
penduga MCD jarak Mahalanobis dibangun berdasarkan vektor rata-rata dan matriks ragam-
peragam yang kekar terhadap pencilan sehingga disebut juga dengan jarak Mahalanobis kekar.
Sifat inilah yang membuat penduga MCD mampu mengidentifikasi suatu pencilan.
Tabel 5 Nilai Rata-rata Matriks Ragam-Peragam
Penduga MLE Dari Semua Ukuran Data. Pencilan
Matriks Ragam-Peragam MLE .
. .
. .
. .
. .
5 .
. .
. .
. .
. .
10 .
. .
. .
. .
. .
15 .
. .
. .
. .
. .
20 .
. .
. .
. .
. .
Tabel 5 memberikan informasi bahwa penduga MLE memiliki kelemahan dalam
mengidentifikasikan pencilan yang akan berpengaruh terhadap hasil matriks ragam-
peragam yang nilainya jauh berbeda dengan nilai yang diberikan pada proses awal simulasi. Seperti
yang terlihat dalam matriks ragam-peragam pada proporsi pencilan 5, 10, 15 dan 20.
Semuanya memiliki nilai matriks ragam-peragam yang jauh dari nilai matriks ragam-peragam yang
diberikan pada awal proses simulasi. Matriks ragam-peragam yang dihasilkan penduga MLE
tidak seperti penduga MCD karena dalam proses perhitungannya masih terdapat amatan yang
mengandung pencilan. Besarnya ukuran pada data juga tidak mempengaruhi nilai matriks ragam-
peragam yang dihasilkan oleh penduga MLE, tetapi semakin besar proporsi pencilan yang
diberikan maka nilai ragam dan peragamnya juga akan semakin besar.
Skor Diskriminan Penduga MCD dan MLE
Amatan yang teridentifikasikan sebagai pencilan oleh penduga MCD merupakan amatan
yang di duga terdapat pada kelompok yang tidak tepat. Misalkan pada amatan ke-32, 39 dan 40
Tabel 6, kelompok-1 memiliki vektor rata-rata yang lebih kecil dari kelompok-2. Jika salah satu
amatan pada data yang terdapat pada kelompok-2 memiliki nilai peubah penjelas yang jauh lebih
besar dari nilai vektor rata-rata kelompok-2 maka jarak Mahalanobis kekar akan
mengidentifikasikan amatan tersebut sebagai pencilan tetapi skor diskriminannya tetap
mengelompokkan amatan tersebut ke dalam kelompok-2. Pada contoh yang lain pada amatan
ke-19 Tabel 6, jika suatu amatan yang terdapat pada kelompok-1 memiliki nilai peubah penjelas
yang jauh lebih besar dari nilai vektor rata-rata kelompok-2 maka jarak Mahalanobis kekar akan
mengidentifikasikan amatan tersebut sebagai pencilan dan skor diskriminan akan
mengelompokkan kembali amatan tersebut menjadi kelompok-2.
Tabel 6
Contoh Pengelompokkan Kembali Amatan Pencilan dengan Skor
Diskriminan MCD. Data Bangkitan
JMK Bbt KA MCD No x
1
x
2
x
3
11 0.1 2.8 -0.1 13.6 0 1 1 18 1.3 2.4 -0.2 12.5 0 1 1
19 21.3 24.6 21.6 915.8 0 1 2
20 18.9 21 24.1 865.5 0 1 2
32 3.8 10.3 12.2 20.6 0 2 2
39 22.3 23 21.1 482.4 0 2 2
40 20.7 19.7 22.4 425.6 0 2 2
Keterangan: JMK = Jarak Mahalanobis Kekar.
Bbt = Bobot. KA = Kelompok Awal.
Amatan yang digaris bawahi adalah amatan yang salah klasifikasi.
Tabel 6 dan 7 adalah tabel yang memberikan informasi tentang pengelompokkan kembali
amatan yang mengandung pencilan ke kelompok yang sebenarnya dengan menggunakan skor
diskriminan penduga MCD. Tabel ini merupakan contoh kasus pada ukuran contoh data dengan
nilai n=40 kelompok-1=20 dan kelompok-2=20. Dalam proses pembangkitan data, tidak semua
data yang dihasilkan sesuai dengan nilai vektor rata-rata awal yang diberikan. Ada amatan yang
memiliki nilai peubah penjelas yang berbeda dari vektor rata-rata awal yang diberikan pada masing-
masing kelompok. Amatan 11, 18 dan 32 adalah contoh amatan pencilan yang bukan berasal dari
pemberian pencilan yang dilakukan oleh peneliti. Amatan tersebut diidentifikasikan sebagai
pencilan karena memiliki nilai peubah penjelas yang jauh berbeda dari vektor rata-rata awal
masing-masing kelompoknya.
Pencilan amatan 11, 18 dan 32 ini kemudian dikelompokkan kembali dengan menggunakan
skor diskriminan penduga MCD. Hasil pengelompokkan tersebut ternyata sama dengan
kelompok awal KA, hal tersebut dapat dilihat secara eksplorasi bahwa amatan 11 dan 18
memang memiliki vektor rata-rata yang kecil sehingga dikelompokkan ke dalam kelompok-1,
hal ini terjadi karena kelompok-1 memang disimulasikan memiliki vektor rata-rata yang lebih
kecil dari kelompok-2, sedangkan amatan 32 yang memiliki vektor rata-rata lebih besar
dikelompokkan ke kelompok-2.
Amatan 19, 20, 39 dan 40 adalah amatan pencilan yang sengaja peneliti berikan di awal
simulasi. Pada Lampiran 1 dapat dilihat bahwa penduga MLE mampu mendeteksi amatan 19 dan
20 sebagai pencilan tetapi tidak mampu mengidentifikasikan amatan 39 dan 40 sebagai
pencilan. Berbeda dengan penduga MLE, pada Tabel 6 terlihat bahwa penduga MCD mampu
mendeteksi semua pencilan yang diberikan oleh peneliti. Amatan pencilan tersebut kemudian
dikelompokkan kembali dengan menggunakan skor diskriminan penduga MCD. Amatan 19 dan
20 berubah kelompok menjadi kelompok-2, hal tersebut dapat dibuktikan secara eksplorasi bahwa
vektor rata-rata amatan 19 dan 20 memiliki vektor rata-rata yang besar sehingga diklasifikasikan ke
dalam kelompok-2 yang memiliki nilai vektor rata-rata lebih besar dari kelompok-1. Amatan 39
dan 40 tidak mengalami perubahan kelompok karena memang secara eksplorasi amatan tersebut
memiliki vektor rata-rata yang besar sehingga dikelompokkan ke kelompok-2.
Tabel 7 merupakan sebagian data amatan yang berasal dari Lampiran 2. Tabel ini memberikan
informasi tentang pengidentifikasian pencilan dan kesalahan pengklasifikasian oleh penduga MLE.
Amatan yang dapat diidentifikasikan sebagai pencilan pada penduga MLE hanya amatan 19 dan
20 sedangkan pencilan yang terdapat pada data juga ada pada amatan 11, 18, 32, 39 dan 40.
Kelemahan dari penduga MLE ini adalah vektor rata-rata dan matriks ragam-peragamnya yang
tidak kekar terhadap pencilan. Bandingkan dengan Tabel 6 dimana penduga MCD mampu
mengidentifikasikan pencilan dengan lebih optimal.
Tabel 7
Contoh Pengelompokkan Kembali Amatan Pencilan dengan Skor
Diskriminan MLE. Data Bangkitan
JM Bbt KA
MLE No x
1
x
2
x
3
19 21.3 24.6 21.6 915.8 0 1 2
20 18.9 21 24.1 865.5 0 1 2
27 8.01 7.03 7.65 1.505 1 2 1
30 7.32 7.94 5.67 3.19 1 2 1
38 7.48 4.86 8.94 2.726 1 2 1
Keterangan: JM = Jarak Mahalanobis
Bbt = Bobot KA = Kelompok Awal
Kekurangan lain dari penduga MLE ini adalah adanya kesalahan pengklasifikasian. Amatan 27,
30 dan 38 yang seharusnya masuk ke kelompok-2 tetapi di klasifikasikan oleh penduga MLE ke
kelompok-1. Secara eksplorasi kita sudah dapat mengetahui bahwa vektor rata-rata ketiga amatan
tersebut mendekati kategori nilai vektor rata-rata kelompok 2. Hal tersebut juga dapat diuji dengan
menggunaan rumus skor diskriminan pada penduga MCD. Ukuran contoh yang diberikan
pada Tabel 6 dan 7 berlaku secara umum untuk ukuran yang berbeda tetapi semakin banyak
ukuran contoh yang dibangkitkan maka peluang terjadinya kesalahn klasifikasi oleh penduga MCD
juga semakin besar.
Hasil Salah Klasifikasi Penduga MCD dan MLE
Tahapan terakhir dari penelitian ini adalah dengan mencari nilai salah klasifikasi pada kedua
penduga. Dibawah ini disajikan tabel salah klasifikasi untuk ketiga ukuran dengan berbagai
proporsi pencilan yang diberikan. Tabel 8 Nilai Rata-rata Salah Klasifikasi n=20.
pencilan nilai salah klasifikasi
MLE MCD 0 0.05 0
10 20.83 0 20 30.35 0
Tabel 9 Nilai Rata-rata Salah Klasifikasi n=40. pencilan
nilai salah klasifikasi MLE MCD
0 0.33 0 5 10.25 0
10 20.08 0 15 29 0
20 33.08 0 Tabel 10 Nilai Rata-rata Salah Klasifikasi n=200.
pencilan nilai salah klasifikasi
MLE MCD 0 0.67
0.05 5 6.75
0.09 10 17.01 0.12
15 29.75 0.14 20 35.7 0.23
Hasil dari ketiga tabel menunjukkan bahwa penduga MLE dan MCD pada data yang tidak
mengandung pencilan menghasilkan nilai salah klasifikasi yang hampir sama baiknya dari kedua
penduga. Seiring bertambahnya proporsi pencilan penduga MLE menghasilkan nilai salah klasifikasi
yang semakin besar sedangkan penduga MCD menghasilkan nilai salah klasifikasi yang
cenderung tetap.
Semakin besar ukuran contoh yang dibangkitkan maka kemungkinan terjadinya
kesalahan klasifikasi oleh penduga MCD semakin dapat terjadi meskipun dalam persentase yang
kecil. Tabel 11 akan memberikan penjelasan mengenai hal ini.
Tabel 11 Kesalahan Klasifikasi Penduga MCD.
Data Bangkitan JMK Bbt KA MCD
No x
1
x
2
x
3
… … … … … … … …
33 2.09 6.15 5.12 8.87 1 1 2
… … … … … … … …
150 3.3 3.58 5.99 8.21 1 2 1
… … … … … … … …
Tabel 11 diambil dari ukuran contoh besar dengan n=200 n1=100, n2=100. Dalam
pembangkitan data simulasi, semakin besar contoh data yang dibangkitkan maka akan
semakin banyak juga berbagai bentuk amatan yang dihasilkan. Ada amatan yang sesuai dengan
nilai vektor rata-rata awal, ada yang menyimpang jauh dan ada juga yang terletak diantara nilai
vektor rata-rata kelompok-1 dan kelompok-2. Amatan 33 adalah contoh amatan kelompok 1
yang diklasifikasikan menjadi kelompok-2 oleh penduga MCD sedangkan amatan 150 adalah
amatan kelompok-2 yang diklasifikasikan menjadi kelompok-1. Kedua amatan ini tidak
diidentifikasikan sebagai pencilan oleh penduga MCD terlihat dari bobot Bbt yang dihasilkan
berniali satu. Secara eksplorasi jika melihat masing-masing peubah penjelas kedua amatan
tersebut maka nilainya terletak diantara nilai vektor rata-rata awal kedua kelompok. Amatan
seperti ini adalah contoh amatan yang menyebabkan kesalahan klasifikasi oleh penduga
MCD. Kemungkinan terjadinya amatan tersebut dalam simulasi hanya sedikit, yaitu ketika
membangkitkan data dengan ukuran contoh yang besar. Hal tersebut dapat terlihat pada Tabel 10
yang merupakan proses simulasi dengan ukuran contoh yang besar dengan ulangan sebanyak 100
kali. Hasil dari Tabel 10 menunjukkan bahwa semakin besar proporsi pencilan yang diberikan
maka kemungkinan terjadinya kesalahan klasifikasi oleh penduga MCD semakin besar
meskipun dalam persentase yang relative kecil.
Fungsi utama dari penduga MCD adalah mengidentifikasikan pencilan pada data untuk
kemudian amatan yang diidentifikasikan sebagai pencilan tersebut di kelompokkan kembali ke
dalam kelompok yang sebenarnya dengan menggunakan skor diskrimananya. Skor
diskriminan ini dibangun berdasarkan vektor rata- rata dan matriks ragam-peragam penduga MCD
yang kekar terhadap pencilan. Hal inilah yang tidak terdapat pada penduga MLE sehingga
penduga tersebut tidak optimal ketika digunakan pada data yang mengandung pencilan.
B. Penerapan Pada Data Riil