Biplot dengan Matriks Koragam Biasa dan Kekar untuk Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB
BIPLO
OT DENG
GAN MAT
TRIKS KO
ORAGAM
M BIASA DAN
D
KEKAR
R UNTUK PEMETA
AAN PRO
OVINSI BE
ERDASAR
RKAN
RESTASI MAHASIISWA IPB
B
PR
TINA TR
RIHANURAW
WATI
SE
EKOLAH PASCASARJANA
A
INST
TITUT PE
ERTANIA
AN BOGO
OR
B
BOGOR
2009
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis berjudul Biplot dengan Matriks
Koragam Biasa dan Kekar untuk Pemetaan Provinsi Berdasarkan Prestasi
Mahasiswa IPB adalah karya saya sendiri dengan arahan dan bimbingan dari komisi
pembimbing serta belum pernah diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan oleh pihak lain telah penulis sebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2009
Tina Trihanurawati
NRP G551070201
ABSTRACT
TINA TRIHANURAWATI.
Biplot with Ordinary and Robust
Covariance Matrix for Province Mapping Based on IPB Students
Achievement. Supervised by SISWADI and N. K. KUTHA ARDANA.
Biplot is based on the idea that any data matrix nXp can be represented
approximately in r dimensions (r usually 2 or 3) as the product of two
matrices, nGr (which represents rows of X) and pHr (which represents
columns of X). Biplot can be constructed, among other things, through
ordinary and robust covariance matrix to get configuration of multivariate
data used for mapping. Biplot with ordinary covariance matrix is often
highly influenced by outliers or extreme data. Therefore, robust covariance
matrix used to construct the biplot, as an alternative, is needed. The data
used in this study for province mapping are IPB students achievement in
2007/2008 academic year. Some data apparently can be classified as
outliers according to box-plot. The biplots resulted from both covariance
matrices are quite similar. The outliers seem to have no effect in province
mapping. If some extreme data are then given, biplot with ordinary
covariance matrix is affected, while biplot with robust covariance matrix is
not influenced due to the little weights attached to the extreme data.
Therefore, biplot with robust covariance matrix could generally be applied
to data with or without extreme ones.
Keywords: Biplot, ordinary and robust covariance matrix, outliers, extreme
data, weights.
RINGKASAN
TINA TRIHANURAWATI. Biplot dengan Matriks Koragam Biasa dan Kekar
untuk Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB. Dibimbing
oleh SISWADI and N. K. KUTHA ARDANA.
Analisis biplot merupakan salah satu bentuk Analisis Peubah Ganda
(APG) yang dapat memberikan gambaran secara grafik tentang keragaman
peubah, kedekatan antar objek serta keterkaitan peubah dengan objek yang
dapat digunakan untuk menggambarkan sebuah tabel ringkasan dengan banyak
peubah agar lebih menarik, lebih informatif, lebih komunikatif dan artistik.
Analisis biplot telah terbukti sebagai alat yang sangat ampuh untuk
menganalisis berbagai macam bentuk data berpeubah ganda.
Dari suatu contoh data seringkali ditemukan adanya data pencilan
(outlier). Dampak keberadaan data pencilan biasa diduga akan mengganggu
dalam proses analisis data, dalam hal ini analisis biplot. Pengamatan ekstrim
(data pencilan ekstrim) mungkin berpengaruh sekali pada struktur matriks
koragam biasa dari contoh, karenanya perlu dicari sebuah alternatif biplot
yang kekar (robust) terhadap pengaruh data pencilan biasa dan ekstrim.
Analisis biplot kekar dapat dilakukan antara lain dengan menggantikan
vektor rataan dan matriks koragam biasa dengan rataan dan matriks koragam
yang menggunakan metode kekar, salah satunya dengan metode pendugaan-M
peubah ganda yang dapat dilihat dari rataan terboboti dan matriks koragam
terboboti di mana bobot tiap-tiap data bergantung pada seberapa jauh lokasi
pendugaan.
Ketepatan pendekatan matriks data, matriks peubah dan matriks objek
dalam biplot ditelusuri menggunakan ukuran kesesuaian dari Gabriel (2002),
sedangkan kesesuaian konfigurasi objek data asal dengan konfigurasi proyeksi
objek terhadap vektor peubah tertentu pada biplot ditelusuri berdasarkan
kesesuaian peringkat objek serta koefisien korelasi Pearson dan Spearman.
Data penelitian yang digunakan adalah data tentang provinsi asal
sekolah menengah dan data nilai mutu mata kuliah yang diikuti bersama serta
IPK mahasiswa TPB IPB tahun akademik 2007/2008. Provinsi sebagai objek
penelitian dibagi atas jenis seleksi masuk IPB, yaitu antara BUD (24 provinsi)
dan non BUD (30 provinsi), sedangkan mata kuliah dan IPK sebagai peubah
penelitian sebanyak 15. Sehingga diperoleh matriks data peubah ganda
berukuran 54 x 15.
Informasi yang didapat dari interpretasi biplot dengan matriks koragam
biasa tidak jauh berbeda dengan interpretasi biplot dengan matriks koragam
kekar, walaupun pada matriks data asal ini terdapat data pencilan seperti
tergambar jelas pada diagram kotak garis maupun biplot. Posisi objek dan
peubah, keragaman peubah, serta hubungan objek dan peubah tidak jauh
berbeda. Dengan demikian hal ini tidak dapat memberikan kesimpulan bahwa
biplot dengan matriks koragam kekar dapat menjadi metode yang bisa
menganalisis data lebih baik dan konsisten dibanding dengan biplot dengan
matriks koragam biasa.
Provinsi Kalimantan Selatan, Lampung BUD, Jawa Tengah BUD,
Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Gorontalo, Papua
BUD, Bengkulu, dan Nusa Tenggara Timur merupakan provinsi yang berada
pada peringkat sepuluh besar tertinggi nilai IPK dengan provinsi Kalimantan
Selatan pada peringkat pertama.
Provinsi Bali, Sulawesi Tenggara, Sulawesi Selatan, Sulawesi Selatan
BUD, Nanggroe Aceh Darussalam, Sulawesi Utara, Sumatera Barat BUD,
Sumatera Utara BUD, Kalimantan Tengah BUD dan Maluku Utara BUD
merupakan provinsi yang berada pada peringkat sepuluh besar terendah nilai
IPK dengan provinsi Maluku Utara BUD pada peringkat terendah.
Provinsi DKI Jakarta BUD, DI Yogyakarta BUD, Jawa Tengah, dan
Jawa Timur mempunyai prestasi yang unggul pada mata kuliah Fisika,
Kalkulus, Pengantar Matematika, dan Kimia tetapi kurang di bidang mata
kuliah Pengantar Kewirausahaan, Agama, dan Sosiologi Umum.
Provinsi Sulawesi Tenggara BUD dan Sulawesi Tengah, Sulawesi
Tengah BUD mempunyai prestasi yang unggul pada mata kuliah Pengantar
Kewirausahaan, Agama, dan Sosiologi Umum tetapi kurang pada mata kuliah
Fisika, Kalkulus, Pengantar Matematika, dan Kimia.
Untuk menelusuri kekekaran biplot dengan matriks koragam kekar,
diperlukan penelusuran dengan memberikan data asal dengan pencilan yang
cukup ekstrim (besar). Biplot dengan matriks koragam biasa memperlihatkan
perubahan pemetaan objek dan peubah, sehingga menimbulkan distorsi yang
cukup besar. Gambaran yang diperlihatkan oleh biplot dengan matriks
koragam kekar menghasilkan pemetaan yang relatif tetap, sehingga secara
umum sebaiknya menggunakan biplot dengan matriks koragam kekar agar
diperoleh hasil yang konsisten dalam mengantisipasi adanya data pencilan
biasa dan ekstrim.
Kata Kunci: biplot, matriks koragam biasa dan kekar, data pencilan, pencilan
ekstrim, pembobot, ukuran kesesuaian.
©Hak cipta milik Institut Pertanian Bogor, tahun 2009
Hak cipta dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik dan
tinjauan suatu masalah.
b. Pengutipan tidak merugikan kepentingan yang wajar Institut
Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh
karya tulis ini dalam bentuk apapun tanpa izin Institut Pertanian
Bogor.
BIPLOT DENGAN MATRIKS KORAGAM BIASA
DAN KEKAR UNTUK PEMETAAN PROVINSI
BERDASARKAN PRESTASI MAHASISWA IPB
TINA TRIHANURAWATI
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Departemen Matematika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Endar H. Nugrahani, MS
Judul Tesis
Nama
NRP
: Biplot dengan Matriks Koragam Biasa dan Kekar untuk
Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB
: Tina Trihanurawati
: G551070201
Disetujui
Komisi Pembimbing
Dr. Ir. Siswadi, M. Sc
Ketua
Ir. N. K. Kutha Ardana, M. Sc
Anggota
Diketahui
Ketua Program Studi
Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S
Dekan Sekolah Pascasarjana IPB
Prof. Dr. Ir. Khairil A. Notodiputro, M.S
KATA PENGANTAR
Puji dan syukur penulis panjatkan ke hadirat Allah SWT yang telah
melimpahkan rahmat dan hidayah-Nya sehingga karya ilmiah ini berhasil
diselesaikan. Shalawat dan salam semoga senantiasa tercurahkan kepada
Rasullallah SAW dan para sahabat, serta seluruh umat manusia yang mengikuti
petunjuk dan ajaran beliau.
Ungkapan terima kasih penulis sampaikan kepada kedua orang tua,
suami, anak-anak dan seluruh keluarga yang telah memberikan dukungan,
pengertian, doa dan kasih sayangnya. Selanjutnya penulis sampaikan terima
kasih kepada:
1.
Dr. Ir. Siswadi,
M. Sc dan
Ir. N.K. Kutha Ardana, M. Sc selaku
pembimbing yang ikhlas dan sabar dalam membimbing
2.
Dr. Ir. Endar H. Nugrahani, M.S selaku penguji yang telah memberikan
saran dan kritiknya
3.
Departemen Agama RI yang telah memberikan fasilitas beasiswa dan
kesempatan untuk yang kedua kalinya.
4.
Direktorat TPB IPB yang telah memberikan bantuan data mahasiswa
TPB IPB tahun akademik 2007/2008.
5.
Semua pihak yang telah membantu penulis, yang tidak dapat penulis
sebutkan satu persatu.
Penulis menyadari bahwa karya ilmiah ini masih jauh dari sempurna,
untuk itu saran yang membangun sangat penulis harapkan. Semoga karya
ilmiah ini bermanfaat.
Bogor, Agustus 2009
Tina Trihanurawati
BIPLO
OT DENG
GAN MAT
TRIKS KO
ORAGAM
M BIASA DAN
D
KEKAR
R UNTUK PEMETA
AAN PRO
OVINSI BE
ERDASAR
RKAN
RESTASI MAHASIISWA IPB
B
PR
TINA TR
RIHANURAW
WATI
SE
EKOLAH PASCASARJANA
A
INST
TITUT PE
ERTANIA
AN BOGO
OR
B
BOGOR
2009
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis berjudul Biplot dengan Matriks
Koragam Biasa dan Kekar untuk Pemetaan Provinsi Berdasarkan Prestasi
Mahasiswa IPB adalah karya saya sendiri dengan arahan dan bimbingan dari komisi
pembimbing serta belum pernah diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan oleh pihak lain telah penulis sebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2009
Tina Trihanurawati
NRP G551070201
ABSTRACT
TINA TRIHANURAWATI.
Biplot with Ordinary and Robust
Covariance Matrix for Province Mapping Based on IPB Students
Achievement. Supervised by SISWADI and N. K. KUTHA ARDANA.
Biplot is based on the idea that any data matrix nXp can be represented
approximately in r dimensions (r usually 2 or 3) as the product of two
matrices, nGr (which represents rows of X) and pHr (which represents
columns of X). Biplot can be constructed, among other things, through
ordinary and robust covariance matrix to get configuration of multivariate
data used for mapping. Biplot with ordinary covariance matrix is often
highly influenced by outliers or extreme data. Therefore, robust covariance
matrix used to construct the biplot, as an alternative, is needed. The data
used in this study for province mapping are IPB students achievement in
2007/2008 academic year. Some data apparently can be classified as
outliers according to box-plot. The biplots resulted from both covariance
matrices are quite similar. The outliers seem to have no effect in province
mapping. If some extreme data are then given, biplot with ordinary
covariance matrix is affected, while biplot with robust covariance matrix is
not influenced due to the little weights attached to the extreme data.
Therefore, biplot with robust covariance matrix could generally be applied
to data with or without extreme ones.
Keywords: Biplot, ordinary and robust covariance matrix, outliers, extreme
data, weights.
RINGKASAN
TINA TRIHANURAWATI. Biplot dengan Matriks Koragam Biasa dan Kekar
untuk Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB. Dibimbing
oleh SISWADI and N. K. KUTHA ARDANA.
Analisis biplot merupakan salah satu bentuk Analisis Peubah Ganda
(APG) yang dapat memberikan gambaran secara grafik tentang keragaman
peubah, kedekatan antar objek serta keterkaitan peubah dengan objek yang
dapat digunakan untuk menggambarkan sebuah tabel ringkasan dengan banyak
peubah agar lebih menarik, lebih informatif, lebih komunikatif dan artistik.
Analisis biplot telah terbukti sebagai alat yang sangat ampuh untuk
menganalisis berbagai macam bentuk data berpeubah ganda.
Dari suatu contoh data seringkali ditemukan adanya data pencilan
(outlier). Dampak keberadaan data pencilan biasa diduga akan mengganggu
dalam proses analisis data, dalam hal ini analisis biplot. Pengamatan ekstrim
(data pencilan ekstrim) mungkin berpengaruh sekali pada struktur matriks
koragam biasa dari contoh, karenanya perlu dicari sebuah alternatif biplot
yang kekar (robust) terhadap pengaruh data pencilan biasa dan ekstrim.
Analisis biplot kekar dapat dilakukan antara lain dengan menggantikan
vektor rataan dan matriks koragam biasa dengan rataan dan matriks koragam
yang menggunakan metode kekar, salah satunya dengan metode pendugaan-M
peubah ganda yang dapat dilihat dari rataan terboboti dan matriks koragam
terboboti di mana bobot tiap-tiap data bergantung pada seberapa jauh lokasi
pendugaan.
Ketepatan pendekatan matriks data, matriks peubah dan matriks objek
dalam biplot ditelusuri menggunakan ukuran kesesuaian dari Gabriel (2002),
sedangkan kesesuaian konfigurasi objek data asal dengan konfigurasi proyeksi
objek terhadap vektor peubah tertentu pada biplot ditelusuri berdasarkan
kesesuaian peringkat objek serta koefisien korelasi Pearson dan Spearman.
Data penelitian yang digunakan adalah data tentang provinsi asal
sekolah menengah dan data nilai mutu mata kuliah yang diikuti bersama serta
IPK mahasiswa TPB IPB tahun akademik 2007/2008. Provinsi sebagai objek
penelitian dibagi atas jenis seleksi masuk IPB, yaitu antara BUD (24 provinsi)
dan non BUD (30 provinsi), sedangkan mata kuliah dan IPK sebagai peubah
penelitian sebanyak 15. Sehingga diperoleh matriks data peubah ganda
berukuran 54 x 15.
Informasi yang didapat dari interpretasi biplot dengan matriks koragam
biasa tidak jauh berbeda dengan interpretasi biplot dengan matriks koragam
kekar, walaupun pada matriks data asal ini terdapat data pencilan seperti
tergambar jelas pada diagram kotak garis maupun biplot. Posisi objek dan
peubah, keragaman peubah, serta hubungan objek dan peubah tidak jauh
berbeda. Dengan demikian hal ini tidak dapat memberikan kesimpulan bahwa
biplot dengan matriks koragam kekar dapat menjadi metode yang bisa
menganalisis data lebih baik dan konsisten dibanding dengan biplot dengan
matriks koragam biasa.
Provinsi Kalimantan Selatan, Lampung BUD, Jawa Tengah BUD,
Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Gorontalo, Papua
BUD, Bengkulu, dan Nusa Tenggara Timur merupakan provinsi yang berada
pada peringkat sepuluh besar tertinggi nilai IPK dengan provinsi Kalimantan
Selatan pada peringkat pertama.
Provinsi Bali, Sulawesi Tenggara, Sulawesi Selatan, Sulawesi Selatan
BUD, Nanggroe Aceh Darussalam, Sulawesi Utara, Sumatera Barat BUD,
Sumatera Utara BUD, Kalimantan Tengah BUD dan Maluku Utara BUD
merupakan provinsi yang berada pada peringkat sepuluh besar terendah nilai
IPK dengan provinsi Maluku Utara BUD pada peringkat terendah.
Provinsi DKI Jakarta BUD, DI Yogyakarta BUD, Jawa Tengah, dan
Jawa Timur mempunyai prestasi yang unggul pada mata kuliah Fisika,
Kalkulus, Pengantar Matematika, dan Kimia tetapi kurang di bidang mata
kuliah Pengantar Kewirausahaan, Agama, dan Sosiologi Umum.
Provinsi Sulawesi Tenggara BUD dan Sulawesi Tengah, Sulawesi
Tengah BUD mempunyai prestasi yang unggul pada mata kuliah Pengantar
Kewirausahaan, Agama, dan Sosiologi Umum tetapi kurang pada mata kuliah
Fisika, Kalkulus, Pengantar Matematika, dan Kimia.
Untuk menelusuri kekekaran biplot dengan matriks koragam kekar,
diperlukan penelusuran dengan memberikan data asal dengan pencilan yang
cukup ekstrim (besar). Biplot dengan matriks koragam biasa memperlihatkan
perubahan pemetaan objek dan peubah, sehingga menimbulkan distorsi yang
cukup besar. Gambaran yang diperlihatkan oleh biplot dengan matriks
koragam kekar menghasilkan pemetaan yang relatif tetap, sehingga secara
umum sebaiknya menggunakan biplot dengan matriks koragam kekar agar
diperoleh hasil yang konsisten dalam mengantisipasi adanya data pencilan
biasa dan ekstrim.
Kata Kunci: biplot, matriks koragam biasa dan kekar, data pencilan, pencilan
ekstrim, pembobot, ukuran kesesuaian.
©Hak cipta milik Institut Pertanian Bogor, tahun 2009
Hak cipta dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik dan
tinjauan suatu masalah.
b. Pengutipan tidak merugikan kepentingan yang wajar Institut
Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh
karya tulis ini dalam bentuk apapun tanpa izin Institut Pertanian
Bogor.
BIPLOT DENGAN MATRIKS KORAGAM BIASA
DAN KEKAR UNTUK PEMETAAN PROVINSI
BERDASARKAN PRESTASI MAHASISWA IPB
TINA TRIHANURAWATI
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Departemen Matematika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Endar H. Nugrahani, MS
Judul Tesis
Nama
NRP
: Biplot dengan Matriks Koragam Biasa dan Kekar untuk
Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB
: Tina Trihanurawati
: G551070201
Disetujui
Komisi Pembimbing
Dr. Ir. Siswadi, M. Sc
Ketua
Ir. N. K. Kutha Ardana, M. Sc
Anggota
Diketahui
Ketua Program Studi
Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S
Dekan Sekolah Pascasarjana IPB
Prof. Dr. Ir. Khairil A. Notodiputro, M.S
KATA PENGANTAR
Puji dan syukur penulis panjatkan ke hadirat Allah SWT yang telah
melimpahkan rahmat dan hidayah-Nya sehingga karya ilmiah ini berhasil
diselesaikan. Shalawat dan salam semoga senantiasa tercurahkan kepada
Rasullallah SAW dan para sahabat, serta seluruh umat manusia yang mengikuti
petunjuk dan ajaran beliau.
Ungkapan terima kasih penulis sampaikan kepada kedua orang tua,
suami, anak-anak dan seluruh keluarga yang telah memberikan dukungan,
pengertian, doa dan kasih sayangnya. Selanjutnya penulis sampaikan terima
kasih kepada:
1.
Dr. Ir. Siswadi,
M. Sc dan
Ir. N.K. Kutha Ardana, M. Sc selaku
pembimbing yang ikhlas dan sabar dalam membimbing
2.
Dr. Ir. Endar H. Nugrahani, M.S selaku penguji yang telah memberikan
saran dan kritiknya
3.
Departemen Agama RI yang telah memberikan fasilitas beasiswa dan
kesempatan untuk yang kedua kalinya.
4.
Direktorat TPB IPB yang telah memberikan bantuan data mahasiswa
TPB IPB tahun akademik 2007/2008.
5.
Semua pihak yang telah membantu penulis, yang tidak dapat penulis
sebutkan satu persatu.
Penulis menyadari bahwa karya ilmiah ini masih jauh dari sempurna,
untuk itu saran yang membangun sangat penulis harapkan. Semoga karya
ilmiah ini bermanfaat.
Bogor, Agustus 2009
Tina Trihanurawati
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 28 Februari 1967 dari ayah H.
USD. Permana dan ibu Hj. Ratnasih. Penulis sebagai anak ketiga dari lima
bersaudara.
Tahun 1986 penulis lulus SMA Negeri I Bogor jurusan IPA, kemudian
melanjutkan pendidikan sarjana pada Jurusan Tadris Matematika Fakultas
Tarbiyah IAIN Sunan Gunung Djati Bandung lulus tahun 1991.
Tahun 1991 penulis masuk Pegawai Negeri Sipil di Departemen Agama
Republik Indonesia, sebagai staf pengajar di Madrasah Aliyah Negeri I Kota
Bogor sampai dengan sekarang.
Tahun 2000/2001 penulis mengikuti Program Kerjasama Departemen
Agama dan IPB Diklat Master Teacher. Pada tahun 2007 penulis melanjutkan
pendidikan jenjang magister dengan Beasiswa Departemen Agama RI pada
Program Studi Matematika Terapan Sekolah Pascasarjana Institut Pertanian
Bogor, lulus tahun 2009.
DAFTAR ISI
Halaman
DAFTAR TABEL…………………………………………………………… xi
DAFTAR GAMBAR………………………………………………………....xii
DAFTAR LAMPIRAN………………………………………………………xiii
PENDAHULUAN
Latar Belakang .................................................................................................1
Tujuan dan Manfaat Penelitian ........................................................................3
TINJAUAN PUSTAKA
Analisis Biplot Biasa........................................................................................5
Data Pencilan..................................................................................................10
Analisis Biplot dengan Matriks Koragam Kekar.............................................11
Ukuran Kesesuaian Biplot...............................................................................15
Provinsi sebagai Objek Pemetaan...................................................................15
METODE PENELITIAN
Sumber Data....................................................................................................17
Peubah Penelitian............................................................................................17
Objek Penelitian…………………………………………………………….18
Analisis............................................................................................................19
HASIL DAN PEMBAHASAN
Eksplorasi Data………………………………………………………………22
Gambaran Umum Provinsi………………………………………………..…26
Analisis Biplot dengan Matriks Koragam Biasa dan Kekar…………………27
Perbandingan Biplot dengan Matriks Koragam Biasa dan Kekar……………35
KESIMPULAN DAN SARAN…………………………………………………41
DAFTAR PUSTAKA...........................................................................................43
LAMPIRAN…………………………………………………………………….45
DAFTAR TABEL
Halaman
1
Objek penelitian ………………………………………………………………….
2
Konversi huruf mutu………………………………………………………………
3
Sebaran nilai akhir mata kuliah TPB IPB tahun akademik 2007/2008……………
4
Matriks korelasi Pearson data asal…………………………………………..……..
5
Matriks korelasi Spearman data asal ………………………………………..…….
6
Peringkat provinsi berdasarkan IPK……………………………………………….
7
8
Ukuran kesesuaian biplot (%) data asal……………………………………………………………
Matriks korelasi Pearson data ekstrim
……………………………………………………………………………..
9
Matriks korelasi Spearman data ekstrim …………………………………………..……………………
10 Ukuran kesesuaian biplot (%) data ekstrim…………………………………………………………..
PENDAHULUAN
Latar Belakang
Ada dua cara yang biasa digunakan oleh seseorang untuk menyajikan
hasil dari sebuah studi kuantitatif. Cara yang pertama adalah membeberkan
angka-angka dalam sebuah tabel atau daftar, dan cara yang kedua adalah
menyajikannya dalam grafik. Di samping lebih menarik dari segi warna dan
bentuknya, dalam banyak hal penggunaan grafik juga lebih informatif. Untuk
data yang lebih kompleks yaitu data yang melibatkan banyak peubah atau
peubah ganda (multivariate), tentunya sulit untuk diinterpretasikan secara
langsung, sehingga perlu dilakukan tahap pereduksian dimensi data terlebih
dahulu. Dalam statistika dikenal suatu analisis data yang menggunakan peubah
amatan lebih dari satu dan dianalisis secara serempak, yaitu Analisis Peubah
Ganda (APG). Salah satu teknik yang digunakan dalam APG adalah
pereduksian dimensi data peubah ganda (Siswadi dan Suharjo, 1999)
Analisis biplot merupakan salah satu bentuk APG yang dapat
memberikan gambaran secara grafik tentang keragaman peubah, kedekatan
antar objek serta keterkaitan peubah dengan objek yang dapat digunakan untuk
menggambarkan sebuah tabel ringkasan dengan banyak peubah agar lebih
menarik, informatif, komunikatif dan artistik. Dengan analisis biplot, data
berpeubah ganda dapat direpresentasikan dalam ruang berdimensi kecil.
Perbedaan hasil analisis biplot dengan kenyataan yang sebenarnya dapat saja
terjadi.
Hal ini mungkin karena pada dasarnya representasi data dengan
analisis biplot merupakan pendekatan terhadap data yang berdimensi besar ke
dalam dimensi dua, sehingga ada informasi yang hilang. Namun ini bukanlah
masalah serius selama informasi yang penting dapat diperoleh. Analisis biplot
telah terbukti sebagai alat yang sangat ampuh untuk menganalisis berbagai
macam bentuk data peubah ganda (Aitchison dan Greenacre, 2001).
Dari suatu contoh data seringkali ditemukan adanya data pencilan
(outlier) yang dapat disebabkan oleh kesalahan pada saat pengambilan data,
pencatatan atau beberapa faktor alamiah, seperti penyimpangan genetik.
Dampak keberadaan data pencilan diduga akan mengganggu dalam proses
analisis data, dalam hal ini analisis biplot. Oleh karena itu perlu ditelusuri
dalam sebuah matriks data yang memuat data pencilan serta menganalisisnya
menggunakan analisis biplot dengan matriks koragam biasa atau alternatifnya,
misalnya dengan matriks koragam kekar (robust).
Pemetaan provinsi berdasarkan prestasi siswanya merupakan suatu
proses untuk memperoleh gambaran perbandingan mutu suatu provinsi
dengan provinsi yang lainnya.
dikaitkan dengan prestasi
Prestasi siswa antar provinsi ini dapat
yang dicapai siswanya di TPB IPB.
Hasil
pemetaan provinsi berdasarkan prestasi mahasiswa TPB IPB diharapkan dapat
digunakan untuk mengevaluasi kinerja pemerintah masing-masing provinsi
serta perencanaan dan target peningkatan mutu lulusan sekolah menengah.
Suatu analisis diperlukan untuk memperoleh gambaran yang lebih terinci
dalam pemetaan provinsi sehingga informasi yang diperoleh merupakan
gambaran mutu pendidikan di sekolah menengah masing-masing provinsi
berdasarkan prestasi mahasiswa TPB IPB. Pengamatan lebih dari satu peubah
(peubah ganda) dianalisis secara serempak menggunakan Analisis Peubah
Ganda (APG), salah satunya adalah dengan Analisis Biplot.
Institut Pertanian Bogor (IPB) sebagai salah satu perguruan tinggi
negeri adalah salah satu perguruan tinggi yang dipercaya mendidik dan
mempersiapkan bibit-bibit unggul anak bangsa dari seluruh provinsi di
Indonesia tanpa kecuali.
Mahasiswa IPB yang mewakili hampir seluruh
provinsi di Indonesia, diharapkan mampu memberi gambaran standar kualitas
pendidikan yang relevan dengan tuntutan zaman.
Perekrutan mahasiswa IPB dengan berbagai jalur penerimaan, yaitu
(1) USMI yang merupakan undangan kepada mahasiswa melalui jalur
mahasiswa berprestasi dari tiap daerah tanpa ujian, hanya dengan
pertimbangan nilai rapor selama mahasiswa tersebut bersekolah di SMTA
(Sekolah Menengah Tingkat Atas), (2) UMPTN/SPMB/SNMPTN
yang
merupakan penerimaan mahasiswa melalui saringan ujian tertulis yang diikuti
pula oleh siswa lulusan SMTA dari seluruh provinsi, dan (3) PIN/BUD yang
merupakan undangan kepada mahasiswa melalui beasiswa utusan daerah.
Dari ketiga jalur penerimaan mahasiswa tersebut, jelas terlihat bahwa
mahasiswa yang menuntut ilmu di IPB dapat sangat beragam, baik latar
belakang sosial ekonomi ataupun latar belakang kualitas pendidikannya.
Maka perlu diadakannya standarisasi kualitas input (mahasiswa baru) dengan
mengadakan pendidikan secara komprehensif di tingkat awal. IPB melalui
Direktorat Pendidikan Tingkat Persiapan Bersama membentuk program
Tingkat Persiapan Bersama (TPB) pada tahun 1973 sebagai wujud kepedulian
IPB terhadap pembangunan bangsa yang dilakukan melalui penerimaan
mahasiswa baru dengan undangan ke sekolah menengah di seluruh pelosok
tanah air.
Tugas ini tentulah tidak mudah, karena memang pemerataan kualitas
pendidikan di sekolah menengah seluruh provinsi di Indonesia tidaklah sama,
walaupun pemerintah sudah menerapkan Ujian Nasional sebagai alat
standarisasi mutu pendidikan secara nasional. Hal ini bisa dilihat dari hasil
prestasi mahasiswa TPB IPB pada tahun akademik 2007/2008 yang juga
memberikan hasil yang beragam.
Dalam penelitian ini, rumusan masalahnya ialah:
1 Bagaimana memperoleh gambaran pemetaan provinsi berdasarkan prestasi
mahasiswa TPB IPB menggunakan analisis biplot dengan matriks koragam
biasa dibandingkan dengan matriks koragam kekar?
2 Bagaimana memperoleh gambaran pemetaan provinsi berdasarkan prestasi
mahasiswa TPB IPB dengan adanya data pencilan yang ekstrim
menggunakan analisis biplot dengan matriks koragam biasa dibandingkan
dengan matriks koragam kekar?
Tujuan dan Manfaat Penelitian
Berdasarkan latar belakang masalah, tujuan dari penelitian ini (dalam
studi kasus mahasiswa TPB IPB tahun akademik 2007/2008) ialah:
membandingkan analisis biplot dengan matriks koragam biasa dan kekar untuk
pemetaan provinsi berdasarkan prestasi mahasiswa TPB IPB sebagai data asal
serta memperoleh gambaran kekekaran analisis biplot dengan matriks koragam
kekar dengan pencilan ekstrim.
Penelitian ini diharapkan dapat menjadi masukan bagi pemerintah
daerah dan pemerintah pusat dalam membuat kebijakan sektor pendidikan
terutama dalam standarisasi mutu lembaga pendidikan dan pemerataan dana
pendidikan. IPB sebagai tempat mahasiswa menuntut ilmu diharapkan pula
untuk lebih selektif dalam penerimaan mahasiswa baru.
TINJAUAN PUSTAKA
Analisis Biplot Biasa
Analisis Biplot (Gabriel, 1971) merupakan upaya untuk memberikan
peragaan secara grafik dari matriks data X dalam suatu plot dengan
menumpangtindihkan vektor-vektor baris matriks X (gambaran objek) dengan
vektor-vektor yang mewakili kolom matriks X (gambaran peubah).
Dari
peragaan ini diharapkan diperoleh gambaran tentang objek, misalnya
kedekatan antar objek, gambaran tentang peubah dan keterkaitan antara objekpeubah. Tampilan objek dalam Analisis Komponen Utama (AKU) merupakan
kasus khusus dari analisis biplot dan penghitungan dalam analisis biplot
didasarkan pada Dekomposisi Nilai Singular (DNS) suatu matriks (Siswadi
dan Suharjo, 1997).
Dengan peragaan secara grafik dari analisis biplot diharapkan dapat
diperoleh antara lain informasi tentang:
1 Kedekatan antar objek, yaitu objek mempunyai kemiripan dengan objek
lain yang ditunjukkan dengan posisi objek-objek tersebut.
2 Keragaman peubah, yaitu dengan membandingkan panjang vektor peubah.
Peubah dengan keragaman kecil digambarkan dengan vektor yang pendek,
sebaliknya jika keragamannya besar digambarkan dengan vektor yang
panjang.
3 Korelasi antar peubah, dalam hal ini peubah digambarkan sebagai vektor.
Dua peubah yang berkorelasi positif digambarkan sebagai dua vektor
dengan arah yang sama atau membentuk sudut lancip. Sedangkan dua
peubah yang berkorelasi negatif digambarkan sebagai dua vektor dengan
arah berlawanan atau membentuk sudut tumpul.
Apabila sudut yang
dibentuk siku-siku, maka dua peubah tersebut tidak saling berkorelasi.
4 Keterkaitan peubah dengan objek. Objek yang letaknya sepihak dengan
arah vektor peubah, menunjukkan objek tersebut nilainya di atas rata-rata,
jika berlawanan berarti nilainya di bawah rata-rata, jika hampir di tengahtengah berarti nilainya mendekati rata-rata.
Analisis Biplot adalah peragaan secara grafik dari baris dan kolom
sebuah matriks data nXp *, dengan baris mewakili objek dan kolom mewakili
peubah.
Dalam
setiap
aplikasi,
analisis
biplot
dimulai
dengan
mentransformasikan matriks X* sebagai matriks data asal terhadap nilai rataratanya menjadi matriks X yang akan digambarkan (Aitchison dan Greenacre,
2001).
X = X* -
1
( 1 X*)
n
(1.1)
dengan 1 adalah matriks yang semua unsurnya bernilai 1.
Matriks koragam (S) dari matriks X adalah :
′ (1.2)
Misalnya matriks R =
, i = 1,2, . . . , n ; j = 1,2, . . . , p adalah matriks
korelasi dari matriks X, maka matriks tersebut dapat ditulis :
/
di mana
⎛ 1
1
1
= diag ⎜
,
,....,
⎜ s11 s 22
s pp
⎝
/
/
(1.3)
⎞
⎟ adalah matriks diagonal dengan
⎟
⎠
unsur diagonal utama 1 s ii ; i = 1,2, . . ., p (Johnson dan Wichern, 2002).
Unsur rij juga merupakan kosinus sudut θ antara vektor peubah ke-i dan ke-j :
cos
(1.4)
.
, maka:
.
.
Misalnya matriks
jarak Euclid antara objek ke-i dan ke-j adalah:
,
,
(1.5)
dan jarak Mahalanobis antara objek ke-i dan ke-j adalah:
,
.
(1.6)
Teorema Eckart-Young (Aitchison dan Greenacre, 2001) menyatakan
bahwa jika matriks n
p
dihitung dengan
r * nilai singular pertama dan vektor
singular yang berkorespondensi, misalnya untuk
r * = 2 :
=
(1.7)
kemudian karena matriks n
p
sebagai pendekatan terbaik bagi nXp maka :
menjadi minimum, di mana ...
∑ ∑
F
(1.8)
merupakan notasi dari norm matriks
Frobenius.
berpangkat r (r ≤ p ≤ n) maka dengan menggunakan DNS
Apabila matriks
diperoleh:
nXp
Matriks
U dan
=
nU rL r
(1.9)
p
A adalah matriks
ortonormal kolom,
dengan
= Ir (matriks identitas berdimensi r). Matriks U adalah matriks
yang kolom-kolomnya merupakan eigenvektor-eigenvektor yang berpadanan
dengan eigennilai-eigennilai tak nol dari matriks
,
,
,…,
(1.10)
matriks A adalah matriks yang kolom-kolomnya merupakan eigenvektor yang
berpadanan dengan eigennilai tak nol dari matriks
, dan matriks L adalah
matriks diagonal yang unsur diagonal-diagonalnya merupakan akar dari
eigennilai-eigennilai tak nol matriks
(
,
,...,
) , di mana
nilai singular.
atau matriks
. . .
, yaitu L = diag
> 0 dan
disebut
Dalam Jolliffe (2002), dengan mendefinisikan G = ULα dan H’ = L1- α
, maka untuk α
[0,1]:
X =UL
= U Lα L1- α
=
dan elemen ke-( , ) dari matriks
dapat ditulis:
,
merupakan vektor baris ke-i
dari matriks
merupakan vektor baris ke-j dari matriks
dan
(1.11)
(1.12)
, i = 1, 2, …, n dan
, j = 1, 2, …, p; di mana vektor
mempunyai r elemen.
Untuk menggambarkan
pada ruang dimensi k < r , dapat didekati
menggunakan matriks berpangkat k,
=
=
(1.13)
Biasanya digunakan k = 2, sehingga koordinat-koordinat G dan H dapat
digambarkan dalam ruang berdimensi 2 (Lipkovich dan Smith, 2002).
Pengambilan nilai α tertentu berimplikasi penting dalam interpretasi
biplot. Secara umum untuk setiap nilai α yang digunakan, penumpangtindihan
vektor g dan h yang diplot pada ruang yang sama diperoleh nilai amatan
peubah ke-j pada objek ke-i yang telah dikoreksi terhadap nilai tengahnya yaitu
= gi’hj. Nilai amatan tersebut bertanda positif bila kedua vektor tersebut
searah, yaitu sudut kedua vektor tersebut ada dalam [0, ), bertanda negatif bila
kedua vektor tersebut berlawanan arah, yaitu sudut kedua vektor tersebut ada
dalam ( ,
]. Posisi relatif titik-titik gi dan hj akan memberikan informasi
tentang objek-objek yang mempunyai nilai relatif besar, rataan, atau kecil dari
peubah-peubah yang diamati.
a. Jika α = 0, maka G = U dan H’ = LA’ , akibatnya :
(1.14)
diperoleh:
, di mana
-
adalah koragam peubah ke-i dan ke-j,
dan penggandaan titik antara vektor
dan
akan memberikan
gambaran koragam antara peubah ke-i dan ke-j.
-
=√
,
=
, menggambarkan keragaman peubah ke-i.
- Korelasi antara peubah ke-i
antara
dan
dan ke-j dijelaskan oleh kosinus sudut
(misal : θ), yaitu :
cos
=
(1.15)
=
=
Berdasarkan sudut yang dibentuk antara vektor
dan
, korelasi
peubah ke-i dan ke-j dapat dijelaskan sebagai berikut:
1 semakin besar korelasi positifnya jika θ mendekati 0, dan korelasi
sama dengan 1 jika θ = 0,
2 semakin besar korelasi negatifnya jika θ mendekati π, dan korelasi
sama dengan -1 jika θ = π, dan
3 semakin kecil korelasi positif dan negatifnya jika θ mendekati π/2,
dan tidak berkorelasi apabila θ = π/2.
- Jika X berpangkat p maka
, di mana S
adalah matriks koragam dari X.
vektor
dan
Berarti kuadrat jarak Euclid antara
pada biplot sebanding dengan kuadrat jarak
Mahalanobis antara vektor
dan
Siswadi dan Suharjo, 999 .
b. Jika α = 1 , maka G = UL dan H’ = A’, atau H = A; H’H = A’A = I
akibatnya :
(1.16)
atau
, artinya kuadrat jarak
Euclid antara
dan
dan
akan sama dengan kuadrat jarak Euclid antara
.
Dari interpretasi biplot di atas, dekomposisi X = GH' tidak bersifat
khas, jika α = 1 maka g-plot diperoleh dengan memisalkan G = UL dan H =
A, baris ke-i matriks G akan digunakan untuk merepresentasikan baris ke-i
matriks X, yang berarti merepresentasikan objek ke-i, sedangkan baris ke-j
matriks H akan digunakan untuk merepresentasikan kolom ke-j matriks X,
yang berarti merepresentasikan peubah ke-j. Sedangkan jika α = 0 maka h-plot
diperoleh dengan memisalkan H = AL dan G = U yang merupakan gambaran
ragam dan korelasi di dalam grafik.
Pengamatan ekstrim mungkin berpengaruh sekali pada struktur
koragam contoh. Hal ini berpengaruh pula pada h-plot, yang menghubungkan
antara peubah yang tidak representatif pada struktur utama himpunan data.
Maka perlu dicari sebuah alternatif untuk biplot biasa yang kekar terhadap
pengaruh data pencilan (Daigle dan Rivest,1992).
Dalam analisis biplot biasa, perhitungannya didasarkan pada matriks
koragam contoh (S) biasa yaitu :
=
∑
.............................(1.17)
dengan j = 1, 2, . . ., p ; k = 1, 2, , . . ., p sebagai elemen matriks S,
adalah
rataan data.
Data Pencilan
Data pencilan didefinisikan sebagai pengamatan yang menjadi bagian
di dalam nilai yang diduga berasal dari populasi yang berbeda atau hasil dari
pengukuran yang salah (William dan Johnson, 1993). Sementara Jollife (2002)
mengatakan bahwa data pencilan dalam data biasanya hasil pengamatan yang
mempunyai jarak yang jauh dari kumpulannya atau tidak konsisten dengan
data lainnya.
Untuk menentukan batasan pencilan dari sebuah analisis, dapat
menggunakan diagram kotak garis (boxplot). Metode ini merupakan yang
paling umum yakni dengan mempergunakan nilai kuartil dan jangkauan.
Kuartil 1, 2, dan 3 akan membagi sebuah urutan data menjadi 4 bagian.
Jangkauan (IQR, Interquartile Range) didefinisikan sebagai selisih kuartil 1
terhadap kuartil 3, atau IQR = Q3 – Q1. Data pencilan dapat ditentukan dengan
melihat nilai yang kurang dari 1.5 * IQR terhadap kuartil 1 dan nilai yang lebih
dari 1.5 * IQR terhadap kuartil 3. Informasi yang dapat diperoleh selain dari
data pencilan adalah kesimetrikan penyebaran data, dapat dilihat dari apakah
kotak terbagi dua oleh garis median sama besar atau tidak dan apakah ‘ekor’
bawah dan ‘ekor’ atas sama panjang atau tidak (Mattjik dan Sumertajaya,
2006).
Bentuk dan ukuran data peubah ganda diukur dengan matriks koragam.
Seperti telah diketahui, ukuran jarak yang menggunakan perhitungan matriks
koragam adalah jarak Mahalanobis. Jarak Mahalanobis untuk p-dimensi
peubah ganda,
(i=1,..., n) didefinisikan :
=
/
(2.1)
untuk i=1, …, n, di mana μ menyatakan dugaan vektor rata-rata dan Σ
menyatakan matriks koragam. MD i pada (2.1) disebut juga jarak kekar (JK),
dan apabila kuadrat dari JK lebih besar dari χ p2 ;0.975 dapat dinyatakan sebagai
data pencilan (Filzmoser, 2004).
Analisis Biplot dengan Matriks Koragam Kekar
Dalam segugus data mungkin terdapat data yang salah atau data
pencilan, yang biasa dan ekstrim karena itu ditawarkan metode baru untuk
mengeksplorasi data tersebut dengan analisis biplot kekar. Pendekatan ini
menggantikan unsur vektor rataan matriks koragam (biasa) dengan rata-rata
dan matriks koragam yang menggunakan metode kekar. Analisis biplot kekar
dipilih sebagai salah satu alternatif analisis yang diharapkan dapat memberikan
pemetaan provinsi berdasarkan prestasi mahasiswa TPB IPB dalam gambaran
yang lebih konsisten.
Hubert et al. (2002) menyatakan bahwa matriks koragam biasa sangat
sensitif terhadap adanya pengamatan yang mengandung data pencilan. Untuk
mengantisipasinya digunakan pendugaan matriks koragam kekar, salah satunya
dengan metode pendugaan-M peubah ganda, sebagai solusi untuk masalah
meminimumkan fungsi tertentu dari data, misalkan meminimumkan jarak
antara matriks data dan matriks pendekatannya.
Pendugaan-M peubah ganda vektor lokasi dan sebaran matriks peubahp contoh {yi , i = 1, …, n} dapat dilihat dari rataan terboboti dan matriks
koragam terboboti di mana bobot tiap-tiap data tergantung pada seberapa jauh
lokasi pendugaan, yi
adalah vektor objek ke-i dengan p-peubah.
Dalam
penghitungan pendugaan-M, masing-masing objek diboboti, pada data pencilan
mendapat pembobot yang semakin kecil. Pembobot-pembobot inilah yang
membangun biplot kekar. Dengan pendugaan-M,
dan
didefinisikan sebagai
solusi persamaan sistem non linear yang merupakan rataan kekar dan matriks
koragam kekar .
∑
= ,
∑
(3.1)
∑
(3.2)
di mana
(3.3)
h adalah sembarang fungsi pembobot positif dalam (0,∞), dan C adalah
konstanta yang menormalkan. Pada kasus ini dipilih fungsi pembobot Huber,
dipilih,
min ,
√
. Daigle dan Rivest (1992), menunjukkan untuk h yang
didapat jika:
√
√ ⁄
√
(3.4)
Untuk mengkonstruksi biplot kekar, matriks diagonal W berukuran
n x n dengan elemen
yaitu
pembobot yang dinormalkan seperti
didefinisikan oleh (3.3) dengan
dan
. Jika peubah memiliki
ukuran atau skala berbeda, dapat distandarisasi dengan matriks diagonal V dari
invers ragam ⁄
.
Dengan adanya data pencilan, sebaiknya bobot yang kecil diberikan
pada data ekstrim dalam penghitungan pendekatan pangkat rendah pada
matriks data Z yang berukuran (n x p) dengan pangkat . Didefinisikan
matriks X dengan ukuran (n x p) dan berpangkat
sebagai matriks dengan
kuadrat norma perbedaan terkecilnya terboboti adalah
dengan
∑
∑
(3.5)
didefinisikan oleh (3.3). Solusinya dapat ditulis dalam DNS dari
,
(3.6)
W adalah matriks diagonal dengan
sebagai elemennya,
dan
masing
masing matriks berukuran n x s dan p x s dengan kolom saling ortonormal, dan
. Karena
adalah matriks diagonal nilai singular
matriks Z merupakan matriks pendekatan dengan pangkat yang lebih rendah
dari pangkat matriks X maka,
(3.7)
adalah matriks diagonal dari r nilai singular pertama dari matriks
dan
dibuat dari r kolom pertama dari
singular
dan
adalah akar kuadrat eigennilai
, dan
. Sebagai catatan, nilai
dan
adalah matriks
eigenvektor .
X = GHT pada (1.11) menjadi X pada (3.7). Ambil
dan
dan
baris
dari matriks G; dua baris berisi koordinat biplot yang mewakili
pengamatan ke- dan ke- . Jarak kuadrat Euclid antara dua pengamatan,
adalah sama dengan
-2
+
Jika GGT sedekat mungkin ke ZZT , maka matriks G dan H pada (1.11)
menjadi
G=
dan H =
(3.8)
diperoleh pula
=
(3.9)
Untuk sebuah gambaran yang penuh makna dari struktur ragam dan
koragam dengan h-plot, yaitu
dengan
dengan memilih H yang sedekat mungkin
. Panjang dari vektor menggambarkan sebuah peubah yang secara
proposional didekati oleh standar deviasi kekar, sementara itu sudut antara dua
peubah adalah dengan pendekatan sama dengan korelasi kekar. Untuk hal ini
matriks G dan H menjadi:
dan H =
G=
(3.10)
diperoleh pula
(3.11)
Sebagai catatan, h-plot dari biplot ini adalah sebuah versi kekar seperti
digambarkan Corsten dan Gabriel (1976) dalam Daigle dan Rivest (1992).
Jarak antara titik-titik data dapat diinterpretasikan dalam jarak Mahalanobis
kekar, karenanya perkalian
dapat ditulis sebagai
X
dalam pendekatan lain diperoleh :
XT
(3.12)
X
XT
Z
ZT
(3.13)
Jadi, jarak kuadrat antara pengamatan ke- titik data dan
adalah sebuah
pendekatan dari
(3.14)
yaitu jarak Mahalanobis kekar pada pendugaan lokasi. Dalam kasus biasa,
ukuran untuk membandingkan pengamatan adalah ukuran Mahalanobis biasa
dihitung dengan matriks koragam contoh seperti disebutkan Gabriel 1971;
Jollife 1986; Campbell 1980 dalam Daigle dan Rivest (1992), bahwa
perbandingan dari dua jarak ini menunjukkan bahwa bentuk kekar adalah
salah satu bentuk yang lebih baik untuk mendeteksi data pencilan.
Ukuran Kesesuaian Biplot
Menurut Gabriel (2002), biplot tidak hanya sebagai pendekatan matriks
data X dengan menggunakan matriks
, tetapi juga koragam dan korelasi
antar peubah, serta kemiripan antar objek.
′
matriks
′ sebagai pendekatan dari
terkait pada matriks ragam koragam dan korelasi antar peubah,
sedangkan matriks
′ sebagai pendekatan bagi
′
, terkait pada ukuran
kemiripan objek. Selanjutnya Gabriel mengemukakan ukuran kesesuaian biplot
(Goodness of Fit of Biplot) sebagai ukuran pendekatan, dalam bentuk sebagai
berikut :
1 Kesesuaian data :
GF
2 Kesesuaian peubah :
GF
3 Kesesuaian objek :
GF
,
(4.1)
,
,
(4.2)
(4.3)
Makin besar nilai ukuran kesesuaian untuk memperoleh gambaran
layak tidaknya analisis biplot dalam ruang dimensi r dengan matriks
sebagai matriks pendekatan terbaik berpangkat r, makin layak analisis biplot
digunakan untuk penarikan kesimpulan (Siswadi dan Suharjo, 1999).
Provinsi sebagai Objek Pemetaan
Saatt ini, Indoneesia terdiri daari 33 provinnsi. Dari 333 provinsi tersebut, 5
di antaranyya memilikii status khuusus sebagaai Daerah K
Khusus atauu Daerah
Istimewa yaaitu: Aceh, Jakarta,
J
Yoggyakarta, Pappua dan Papuua Barat. Peembagian
provinsi berrdasarkan wilayah
w
terlihhat dalam petta berikut.
Gaambar 1 Peeta provinsi di
d Indonesia
Provinsi teersebut adaalah Nangggroe Aceh Darussalam
m, Sumateraa Utara,
Sumatera Barat,
B
Riau, Kepulauan Riau, Jambbi, Sumateraa Selatan, Beengkulu,
Lampung, Kepulauan Bangka Belitung, Baanten, Daeraah Khusus Ibukota
Jakarta, Jaw
wa Barat, Jaw
wa Tengah, Daerah Istim
mewa Yogyyakarta, Jawaa Timur,
Bali, Nusaa Tenggara Barat, Nuusa Tenggaara Timur, Kalimantann Barat,
Kalimantan
n Tengah, Kalimantan
K
S
Selatan
, Kaliimantan Tim
mur, Sulawessi Utara,
Sulawesi Tengah,
T
Sulaawesi Selatann, Sulawesi Tenggara, G
Gorontalo, Sulawesi
S
Barat, Maluuku, Malukuu Utara, Papuua Barat, Pappua (Wikipeddia, 2009).
Darii posisi proovinsi dalam
m peta terllihat kedekaatan antar provinsi
dengan lokaasi IPB sebaagai tempat mahasiswa sebagai objeek penelitiann berada
(Bogor Jaw
wa Barat). Hal
H ini akaan berpengaaruh pada kuantitas
k
maahasiswa
masing-massing provinssi yang kuliah di IPB. Pemerintahh sebagai peengambil
kebijakan dalam
d
pendidikan akann melihat peemetaan kuantitas dan kualitas
mahasiswa masing-massing provinssi berdasarkaan prestasi m
mahasiswa TPB
T
IPB
yang tergaambarkan seecara komprrehensif dengan analissis biplot, sehingga
s
diharapkan dapat memb
buat kebijakaan yang efek
ktif dan efisiien.
METODE PENELITIAN
Sumber Data
Data penelitian yang digunakan adalah data yang diperoleh dari
Direktorat Pendidikan Tingkat Persiapan Bersama Institut Pertanian Bogor
(TPB IPB), yang terdiri atas data tentang provinsi asal sekolah menengah dan
data nilai mutu mata kuliah yang diikuti bersama serta IPK mahasiswa TPB
IPB tahun akademik 2007/2008. Objek penelitian adalah provinsi yang diteliti
terdiri dari 30 provinsi (3 provinsi tidak ada mahasiswa TPB yang
mewakilinya)
tersebar pada 3001 mahasiswa yang dikelompokkan
berdasarkan hasil seleksi masuk IPB melalui jalur BUD (24 provinsi) dan non
BUD (30 provinsi).
Peubah yang diamati ialah nilai mutu mata kuliah yang
meliputi 14 mata kuliah yang diikuti mahasiswa TPB IPB pada semester ganjil
dan genap serta Indeks Prestasi Kumulatif (IPK) mahasiswa TPB IPB tahun
akademik 2007/2008. Jadi, diperoleh matriks data peubah ganda berukuran
54 x 15 yang menunjukkan 30 provinsi asal daerah mahasiswa non BUD dan
24 provinsi asal daerah mahasiswa BUD dengan 15 peubah yang diamati.
Data yang diolah adalah data agregat, yaitu data yang diperoleh dari
rata-rata nilai mutu masing-masing provinsi.
Peubah Penelitian
Peubah-peubah yang digunakan dalam penelitian ini adalah :
AG : Nilai Mutu Mata Kuliah Agama
Peubah ini terdiri dari mata kuliah agama Islam, agama Protestan, agama
Katolik, agama Hindu dan agama Budha, dipilih berdasarkan agama dan
keyakinan masing-masing mahasiswa.
BI : Nilai Mutu Mata Kuliah Biologi
EK: Nilai Mutu Mata Kuliah Ekonomi Umum
FI : Nilai Mutu Mata Kuliah Fisika
ID : Nilai Mutu Mata Kuliah Bahasa Indonesia
IG : Nilai Mutu Mata Kuliah Bahasa Inggris
KA : Nilai Mutu Mata Kuliah Kalkulus
KI : Nilai Mutu Mata Kuliah Kimia
KW: Nilai Mutu Mata Kuliah Pengantar Kewirausahaan
MA: Nilai Mutu Mata Kuliah Pengantar Matematika
OS: Nilai Mutu Mata Kuliah Olah Raga dan Seni
PP : Nilai Mutu Mata Kuliah Pengantar Ilmu Pertanian
PK : Nilai Mutu Mata Kuliah Pendidikan Pancasila dan Kewarganegaraan
SU : Nilai Mutu Mata Kuliah Sosiologi Umum
IP : Indeks Prestasi Kumulatif (IPK)
Objek Penelitian
Objek penelitian adalah provinsi yang terwakili oleh mahasiswa TPB
IPB tahun akademik 2007/2008 yang berjumlah 30 provinsi asal mahasiswa
non BUD dan 24 provinsi asal mahasiswa BUD seperti disajikan dalam
Tabel 1.
Tabel 1 Objek penelitian
Kode
Provinsi
Jalur
seleksi
Kode
Provinsi
Jalur
seleksi
1
2
3
4
5
6
7
N A D1
N A D2
Sumatera Utara1
Sumatera Utara2
Sumater
OT DENG
GAN MAT
TRIKS KO
ORAGAM
M BIASA DAN
D
KEKAR
R UNTUK PEMETA
AAN PRO
OVINSI BE
ERDASAR
RKAN
RESTASI MAHASIISWA IPB
B
PR
TINA TR
RIHANURAW
WATI
SE
EKOLAH PASCASARJANA
A
INST
TITUT PE
ERTANIA
AN BOGO
OR
B
BOGOR
2009
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis berjudul Biplot dengan Matriks
Koragam Biasa dan Kekar untuk Pemetaan Provinsi Berdasarkan Prestasi
Mahasiswa IPB adalah karya saya sendiri dengan arahan dan bimbingan dari komisi
pembimbing serta belum pernah diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan oleh pihak lain telah penulis sebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2009
Tina Trihanurawati
NRP G551070201
ABSTRACT
TINA TRIHANURAWATI.
Biplot with Ordinary and Robust
Covariance Matrix for Province Mapping Based on IPB Students
Achievement. Supervised by SISWADI and N. K. KUTHA ARDANA.
Biplot is based on the idea that any data matrix nXp can be represented
approximately in r dimensions (r usually 2 or 3) as the product of two
matrices, nGr (which represents rows of X) and pHr (which represents
columns of X). Biplot can be constructed, among other things, through
ordinary and robust covariance matrix to get configuration of multivariate
data used for mapping. Biplot with ordinary covariance matrix is often
highly influenced by outliers or extreme data. Therefore, robust covariance
matrix used to construct the biplot, as an alternative, is needed. The data
used in this study for province mapping are IPB students achievement in
2007/2008 academic year. Some data apparently can be classified as
outliers according to box-plot. The biplots resulted from both covariance
matrices are quite similar. The outliers seem to have no effect in province
mapping. If some extreme data are then given, biplot with ordinary
covariance matrix is affected, while biplot with robust covariance matrix is
not influenced due to the little weights attached to the extreme data.
Therefore, biplot with robust covariance matrix could generally be applied
to data with or without extreme ones.
Keywords: Biplot, ordinary and robust covariance matrix, outliers, extreme
data, weights.
RINGKASAN
TINA TRIHANURAWATI. Biplot dengan Matriks Koragam Biasa dan Kekar
untuk Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB. Dibimbing
oleh SISWADI and N. K. KUTHA ARDANA.
Analisis biplot merupakan salah satu bentuk Analisis Peubah Ganda
(APG) yang dapat memberikan gambaran secara grafik tentang keragaman
peubah, kedekatan antar objek serta keterkaitan peubah dengan objek yang
dapat digunakan untuk menggambarkan sebuah tabel ringkasan dengan banyak
peubah agar lebih menarik, lebih informatif, lebih komunikatif dan artistik.
Analisis biplot telah terbukti sebagai alat yang sangat ampuh untuk
menganalisis berbagai macam bentuk data berpeubah ganda.
Dari suatu contoh data seringkali ditemukan adanya data pencilan
(outlier). Dampak keberadaan data pencilan biasa diduga akan mengganggu
dalam proses analisis data, dalam hal ini analisis biplot. Pengamatan ekstrim
(data pencilan ekstrim) mungkin berpengaruh sekali pada struktur matriks
koragam biasa dari contoh, karenanya perlu dicari sebuah alternatif biplot
yang kekar (robust) terhadap pengaruh data pencilan biasa dan ekstrim.
Analisis biplot kekar dapat dilakukan antara lain dengan menggantikan
vektor rataan dan matriks koragam biasa dengan rataan dan matriks koragam
yang menggunakan metode kekar, salah satunya dengan metode pendugaan-M
peubah ganda yang dapat dilihat dari rataan terboboti dan matriks koragam
terboboti di mana bobot tiap-tiap data bergantung pada seberapa jauh lokasi
pendugaan.
Ketepatan pendekatan matriks data, matriks peubah dan matriks objek
dalam biplot ditelusuri menggunakan ukuran kesesuaian dari Gabriel (2002),
sedangkan kesesuaian konfigurasi objek data asal dengan konfigurasi proyeksi
objek terhadap vektor peubah tertentu pada biplot ditelusuri berdasarkan
kesesuaian peringkat objek serta koefisien korelasi Pearson dan Spearman.
Data penelitian yang digunakan adalah data tentang provinsi asal
sekolah menengah dan data nilai mutu mata kuliah yang diikuti bersama serta
IPK mahasiswa TPB IPB tahun akademik 2007/2008. Provinsi sebagai objek
penelitian dibagi atas jenis seleksi masuk IPB, yaitu antara BUD (24 provinsi)
dan non BUD (30 provinsi), sedangkan mata kuliah dan IPK sebagai peubah
penelitian sebanyak 15. Sehingga diperoleh matriks data peubah ganda
berukuran 54 x 15.
Informasi yang didapat dari interpretasi biplot dengan matriks koragam
biasa tidak jauh berbeda dengan interpretasi biplot dengan matriks koragam
kekar, walaupun pada matriks data asal ini terdapat data pencilan seperti
tergambar jelas pada diagram kotak garis maupun biplot. Posisi objek dan
peubah, keragaman peubah, serta hubungan objek dan peubah tidak jauh
berbeda. Dengan demikian hal ini tidak dapat memberikan kesimpulan bahwa
biplot dengan matriks koragam kekar dapat menjadi metode yang bisa
menganalisis data lebih baik dan konsisten dibanding dengan biplot dengan
matriks koragam biasa.
Provinsi Kalimantan Selatan, Lampung BUD, Jawa Tengah BUD,
Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Gorontalo, Papua
BUD, Bengkulu, dan Nusa Tenggara Timur merupakan provinsi yang berada
pada peringkat sepuluh besar tertinggi nilai IPK dengan provinsi Kalimantan
Selatan pada peringkat pertama.
Provinsi Bali, Sulawesi Tenggara, Sulawesi Selatan, Sulawesi Selatan
BUD, Nanggroe Aceh Darussalam, Sulawesi Utara, Sumatera Barat BUD,
Sumatera Utara BUD, Kalimantan Tengah BUD dan Maluku Utara BUD
merupakan provinsi yang berada pada peringkat sepuluh besar terendah nilai
IPK dengan provinsi Maluku Utara BUD pada peringkat terendah.
Provinsi DKI Jakarta BUD, DI Yogyakarta BUD, Jawa Tengah, dan
Jawa Timur mempunyai prestasi yang unggul pada mata kuliah Fisika,
Kalkulus, Pengantar Matematika, dan Kimia tetapi kurang di bidang mata
kuliah Pengantar Kewirausahaan, Agama, dan Sosiologi Umum.
Provinsi Sulawesi Tenggara BUD dan Sulawesi Tengah, Sulawesi
Tengah BUD mempunyai prestasi yang unggul pada mata kuliah Pengantar
Kewirausahaan, Agama, dan Sosiologi Umum tetapi kurang pada mata kuliah
Fisika, Kalkulus, Pengantar Matematika, dan Kimia.
Untuk menelusuri kekekaran biplot dengan matriks koragam kekar,
diperlukan penelusuran dengan memberikan data asal dengan pencilan yang
cukup ekstrim (besar). Biplot dengan matriks koragam biasa memperlihatkan
perubahan pemetaan objek dan peubah, sehingga menimbulkan distorsi yang
cukup besar. Gambaran yang diperlihatkan oleh biplot dengan matriks
koragam kekar menghasilkan pemetaan yang relatif tetap, sehingga secara
umum sebaiknya menggunakan biplot dengan matriks koragam kekar agar
diperoleh hasil yang konsisten dalam mengantisipasi adanya data pencilan
biasa dan ekstrim.
Kata Kunci: biplot, matriks koragam biasa dan kekar, data pencilan, pencilan
ekstrim, pembobot, ukuran kesesuaian.
©Hak cipta milik Institut Pertanian Bogor, tahun 2009
Hak cipta dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik dan
tinjauan suatu masalah.
b. Pengutipan tidak merugikan kepentingan yang wajar Institut
Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh
karya tulis ini dalam bentuk apapun tanpa izin Institut Pertanian
Bogor.
BIPLOT DENGAN MATRIKS KORAGAM BIASA
DAN KEKAR UNTUK PEMETAAN PROVINSI
BERDASARKAN PRESTASI MAHASISWA IPB
TINA TRIHANURAWATI
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Departemen Matematika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Endar H. Nugrahani, MS
Judul Tesis
Nama
NRP
: Biplot dengan Matriks Koragam Biasa dan Kekar untuk
Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB
: Tina Trihanurawati
: G551070201
Disetujui
Komisi Pembimbing
Dr. Ir. Siswadi, M. Sc
Ketua
Ir. N. K. Kutha Ardana, M. Sc
Anggota
Diketahui
Ketua Program Studi
Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S
Dekan Sekolah Pascasarjana IPB
Prof. Dr. Ir. Khairil A. Notodiputro, M.S
KATA PENGANTAR
Puji dan syukur penulis panjatkan ke hadirat Allah SWT yang telah
melimpahkan rahmat dan hidayah-Nya sehingga karya ilmiah ini berhasil
diselesaikan. Shalawat dan salam semoga senantiasa tercurahkan kepada
Rasullallah SAW dan para sahabat, serta seluruh umat manusia yang mengikuti
petunjuk dan ajaran beliau.
Ungkapan terima kasih penulis sampaikan kepada kedua orang tua,
suami, anak-anak dan seluruh keluarga yang telah memberikan dukungan,
pengertian, doa dan kasih sayangnya. Selanjutnya penulis sampaikan terima
kasih kepada:
1.
Dr. Ir. Siswadi,
M. Sc dan
Ir. N.K. Kutha Ardana, M. Sc selaku
pembimbing yang ikhlas dan sabar dalam membimbing
2.
Dr. Ir. Endar H. Nugrahani, M.S selaku penguji yang telah memberikan
saran dan kritiknya
3.
Departemen Agama RI yang telah memberikan fasilitas beasiswa dan
kesempatan untuk yang kedua kalinya.
4.
Direktorat TPB IPB yang telah memberikan bantuan data mahasiswa
TPB IPB tahun akademik 2007/2008.
5.
Semua pihak yang telah membantu penulis, yang tidak dapat penulis
sebutkan satu persatu.
Penulis menyadari bahwa karya ilmiah ini masih jauh dari sempurna,
untuk itu saran yang membangun sangat penulis harapkan. Semoga karya
ilmiah ini bermanfaat.
Bogor, Agustus 2009
Tina Trihanurawati
BIPLO
OT DENG
GAN MAT
TRIKS KO
ORAGAM
M BIASA DAN
D
KEKAR
R UNTUK PEMETA
AAN PRO
OVINSI BE
ERDASAR
RKAN
RESTASI MAHASIISWA IPB
B
PR
TINA TR
RIHANURAW
WATI
SE
EKOLAH PASCASARJANA
A
INST
TITUT PE
ERTANIA
AN BOGO
OR
B
BOGOR
2009
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI
Dengan ini saya menyatakan bahwa tesis berjudul Biplot dengan Matriks
Koragam Biasa dan Kekar untuk Pemetaan Provinsi Berdasarkan Prestasi
Mahasiswa IPB adalah karya saya sendiri dengan arahan dan bimbingan dari komisi
pembimbing serta belum pernah diajukan dalam bentuk apa pun kepada perguruan
tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang
diterbitkan maupun tidak diterbitkan oleh pihak lain telah penulis sebutkan dalam teks
dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2009
Tina Trihanurawati
NRP G551070201
ABSTRACT
TINA TRIHANURAWATI.
Biplot with Ordinary and Robust
Covariance Matrix for Province Mapping Based on IPB Students
Achievement. Supervised by SISWADI and N. K. KUTHA ARDANA.
Biplot is based on the idea that any data matrix nXp can be represented
approximately in r dimensions (r usually 2 or 3) as the product of two
matrices, nGr (which represents rows of X) and pHr (which represents
columns of X). Biplot can be constructed, among other things, through
ordinary and robust covariance matrix to get configuration of multivariate
data used for mapping. Biplot with ordinary covariance matrix is often
highly influenced by outliers or extreme data. Therefore, robust covariance
matrix used to construct the biplot, as an alternative, is needed. The data
used in this study for province mapping are IPB students achievement in
2007/2008 academic year. Some data apparently can be classified as
outliers according to box-plot. The biplots resulted from both covariance
matrices are quite similar. The outliers seem to have no effect in province
mapping. If some extreme data are then given, biplot with ordinary
covariance matrix is affected, while biplot with robust covariance matrix is
not influenced due to the little weights attached to the extreme data.
Therefore, biplot with robust covariance matrix could generally be applied
to data with or without extreme ones.
Keywords: Biplot, ordinary and robust covariance matrix, outliers, extreme
data, weights.
RINGKASAN
TINA TRIHANURAWATI. Biplot dengan Matriks Koragam Biasa dan Kekar
untuk Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB. Dibimbing
oleh SISWADI and N. K. KUTHA ARDANA.
Analisis biplot merupakan salah satu bentuk Analisis Peubah Ganda
(APG) yang dapat memberikan gambaran secara grafik tentang keragaman
peubah, kedekatan antar objek serta keterkaitan peubah dengan objek yang
dapat digunakan untuk menggambarkan sebuah tabel ringkasan dengan banyak
peubah agar lebih menarik, lebih informatif, lebih komunikatif dan artistik.
Analisis biplot telah terbukti sebagai alat yang sangat ampuh untuk
menganalisis berbagai macam bentuk data berpeubah ganda.
Dari suatu contoh data seringkali ditemukan adanya data pencilan
(outlier). Dampak keberadaan data pencilan biasa diduga akan mengganggu
dalam proses analisis data, dalam hal ini analisis biplot. Pengamatan ekstrim
(data pencilan ekstrim) mungkin berpengaruh sekali pada struktur matriks
koragam biasa dari contoh, karenanya perlu dicari sebuah alternatif biplot
yang kekar (robust) terhadap pengaruh data pencilan biasa dan ekstrim.
Analisis biplot kekar dapat dilakukan antara lain dengan menggantikan
vektor rataan dan matriks koragam biasa dengan rataan dan matriks koragam
yang menggunakan metode kekar, salah satunya dengan metode pendugaan-M
peubah ganda yang dapat dilihat dari rataan terboboti dan matriks koragam
terboboti di mana bobot tiap-tiap data bergantung pada seberapa jauh lokasi
pendugaan.
Ketepatan pendekatan matriks data, matriks peubah dan matriks objek
dalam biplot ditelusuri menggunakan ukuran kesesuaian dari Gabriel (2002),
sedangkan kesesuaian konfigurasi objek data asal dengan konfigurasi proyeksi
objek terhadap vektor peubah tertentu pada biplot ditelusuri berdasarkan
kesesuaian peringkat objek serta koefisien korelasi Pearson dan Spearman.
Data penelitian yang digunakan adalah data tentang provinsi asal
sekolah menengah dan data nilai mutu mata kuliah yang diikuti bersama serta
IPK mahasiswa TPB IPB tahun akademik 2007/2008. Provinsi sebagai objek
penelitian dibagi atas jenis seleksi masuk IPB, yaitu antara BUD (24 provinsi)
dan non BUD (30 provinsi), sedangkan mata kuliah dan IPK sebagai peubah
penelitian sebanyak 15. Sehingga diperoleh matriks data peubah ganda
berukuran 54 x 15.
Informasi yang didapat dari interpretasi biplot dengan matriks koragam
biasa tidak jauh berbeda dengan interpretasi biplot dengan matriks koragam
kekar, walaupun pada matriks data asal ini terdapat data pencilan seperti
tergambar jelas pada diagram kotak garis maupun biplot. Posisi objek dan
peubah, keragaman peubah, serta hubungan objek dan peubah tidak jauh
berbeda. Dengan demikian hal ini tidak dapat memberikan kesimpulan bahwa
biplot dengan matriks koragam kekar dapat menjadi metode yang bisa
menganalisis data lebih baik dan konsisten dibanding dengan biplot dengan
matriks koragam biasa.
Provinsi Kalimantan Selatan, Lampung BUD, Jawa Tengah BUD,
Kalimantan Barat, Kalimantan Tengah, Kalimantan Timur, Gorontalo, Papua
BUD, Bengkulu, dan Nusa Tenggara Timur merupakan provinsi yang berada
pada peringkat sepuluh besar tertinggi nilai IPK dengan provinsi Kalimantan
Selatan pada peringkat pertama.
Provinsi Bali, Sulawesi Tenggara, Sulawesi Selatan, Sulawesi Selatan
BUD, Nanggroe Aceh Darussalam, Sulawesi Utara, Sumatera Barat BUD,
Sumatera Utara BUD, Kalimantan Tengah BUD dan Maluku Utara BUD
merupakan provinsi yang berada pada peringkat sepuluh besar terendah nilai
IPK dengan provinsi Maluku Utara BUD pada peringkat terendah.
Provinsi DKI Jakarta BUD, DI Yogyakarta BUD, Jawa Tengah, dan
Jawa Timur mempunyai prestasi yang unggul pada mata kuliah Fisika,
Kalkulus, Pengantar Matematika, dan Kimia tetapi kurang di bidang mata
kuliah Pengantar Kewirausahaan, Agama, dan Sosiologi Umum.
Provinsi Sulawesi Tenggara BUD dan Sulawesi Tengah, Sulawesi
Tengah BUD mempunyai prestasi yang unggul pada mata kuliah Pengantar
Kewirausahaan, Agama, dan Sosiologi Umum tetapi kurang pada mata kuliah
Fisika, Kalkulus, Pengantar Matematika, dan Kimia.
Untuk menelusuri kekekaran biplot dengan matriks koragam kekar,
diperlukan penelusuran dengan memberikan data asal dengan pencilan yang
cukup ekstrim (besar). Biplot dengan matriks koragam biasa memperlihatkan
perubahan pemetaan objek dan peubah, sehingga menimbulkan distorsi yang
cukup besar. Gambaran yang diperlihatkan oleh biplot dengan matriks
koragam kekar menghasilkan pemetaan yang relatif tetap, sehingga secara
umum sebaiknya menggunakan biplot dengan matriks koragam kekar agar
diperoleh hasil yang konsisten dalam mengantisipasi adanya data pencilan
biasa dan ekstrim.
Kata Kunci: biplot, matriks koragam biasa dan kekar, data pencilan, pencilan
ekstrim, pembobot, ukuran kesesuaian.
©Hak cipta milik Institut Pertanian Bogor, tahun 2009
Hak cipta dilindungi Undang-undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik dan
tinjauan suatu masalah.
b. Pengutipan tidak merugikan kepentingan yang wajar Institut
Pertanian Bogor.
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh
karya tulis ini dalam bentuk apapun tanpa izin Institut Pertanian
Bogor.
BIPLOT DENGAN MATRIKS KORAGAM BIASA
DAN KEKAR UNTUK PEMETAAN PROVINSI
BERDASARKAN PRESTASI MAHASISWA IPB
TINA TRIHANURAWATI
Tesis
Sebagai salah satu syarat untuk memperoleh gelar
Magister Sains pada
Departemen Matematika
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2009
Penguji Luar Komisi pada Ujian Tesis: Dr. Ir. Endar H. Nugrahani, MS
Judul Tesis
Nama
NRP
: Biplot dengan Matriks Koragam Biasa dan Kekar untuk
Pemetaan Provinsi Berdasarkan Prestasi Mahasiswa IPB
: Tina Trihanurawati
: G551070201
Disetujui
Komisi Pembimbing
Dr. Ir. Siswadi, M. Sc
Ketua
Ir. N. K. Kutha Ardana, M. Sc
Anggota
Diketahui
Ketua Program Studi
Matematika Terapan
Dr. Ir. Endar H. Nugrahani, M.S
Dekan Sekolah Pascasarjana IPB
Prof. Dr. Ir. Khairil A. Notodiputro, M.S
KATA PENGANTAR
Puji dan syukur penulis panjatkan ke hadirat Allah SWT yang telah
melimpahkan rahmat dan hidayah-Nya sehingga karya ilmiah ini berhasil
diselesaikan. Shalawat dan salam semoga senantiasa tercurahkan kepada
Rasullallah SAW dan para sahabat, serta seluruh umat manusia yang mengikuti
petunjuk dan ajaran beliau.
Ungkapan terima kasih penulis sampaikan kepada kedua orang tua,
suami, anak-anak dan seluruh keluarga yang telah memberikan dukungan,
pengertian, doa dan kasih sayangnya. Selanjutnya penulis sampaikan terima
kasih kepada:
1.
Dr. Ir. Siswadi,
M. Sc dan
Ir. N.K. Kutha Ardana, M. Sc selaku
pembimbing yang ikhlas dan sabar dalam membimbing
2.
Dr. Ir. Endar H. Nugrahani, M.S selaku penguji yang telah memberikan
saran dan kritiknya
3.
Departemen Agama RI yang telah memberikan fasilitas beasiswa dan
kesempatan untuk yang kedua kalinya.
4.
Direktorat TPB IPB yang telah memberikan bantuan data mahasiswa
TPB IPB tahun akademik 2007/2008.
5.
Semua pihak yang telah membantu penulis, yang tidak dapat penulis
sebutkan satu persatu.
Penulis menyadari bahwa karya ilmiah ini masih jauh dari sempurna,
untuk itu saran yang membangun sangat penulis harapkan. Semoga karya
ilmiah ini bermanfaat.
Bogor, Agustus 2009
Tina Trihanurawati
RIWAYAT HIDUP
Penulis dilahirkan di Bogor pada tanggal 28 Februari 1967 dari ayah H.
USD. Permana dan ibu Hj. Ratnasih. Penulis sebagai anak ketiga dari lima
bersaudara.
Tahun 1986 penulis lulus SMA Negeri I Bogor jurusan IPA, kemudian
melanjutkan pendidikan sarjana pada Jurusan Tadris Matematika Fakultas
Tarbiyah IAIN Sunan Gunung Djati Bandung lulus tahun 1991.
Tahun 1991 penulis masuk Pegawai Negeri Sipil di Departemen Agama
Republik Indonesia, sebagai staf pengajar di Madrasah Aliyah Negeri I Kota
Bogor sampai dengan sekarang.
Tahun 2000/2001 penulis mengikuti Program Kerjasama Departemen
Agama dan IPB Diklat Master Teacher. Pada tahun 2007 penulis melanjutkan
pendidikan jenjang magister dengan Beasiswa Departemen Agama RI pada
Program Studi Matematika Terapan Sekolah Pascasarjana Institut Pertanian
Bogor, lulus tahun 2009.
DAFTAR ISI
Halaman
DAFTAR TABEL…………………………………………………………… xi
DAFTAR GAMBAR………………………………………………………....xii
DAFTAR LAMPIRAN………………………………………………………xiii
PENDAHULUAN
Latar Belakang .................................................................................................1
Tujuan dan Manfaat Penelitian ........................................................................3
TINJAUAN PUSTAKA
Analisis Biplot Biasa........................................................................................5
Data Pencilan..................................................................................................10
Analisis Biplot dengan Matriks Koragam Kekar.............................................11
Ukuran Kesesuaian Biplot...............................................................................15
Provinsi sebagai Objek Pemetaan...................................................................15
METODE PENELITIAN
Sumber Data....................................................................................................17
Peubah Penelitian............................................................................................17
Objek Penelitian…………………………………………………………….18
Analisis............................................................................................................19
HASIL DAN PEMBAHASAN
Eksplorasi Data………………………………………………………………22
Gambaran Umum Provinsi………………………………………………..…26
Analisis Biplot dengan Matriks Koragam Biasa dan Kekar…………………27
Perbandingan Biplot dengan Matriks Koragam Biasa dan Kekar……………35
KESIMPULAN DAN SARAN…………………………………………………41
DAFTAR PUSTAKA...........................................................................................43
LAMPIRAN…………………………………………………………………….45
DAFTAR TABEL
Halaman
1
Objek penelitian ………………………………………………………………….
2
Konversi huruf mutu………………………………………………………………
3
Sebaran nilai akhir mata kuliah TPB IPB tahun akademik 2007/2008……………
4
Matriks korelasi Pearson data asal…………………………………………..……..
5
Matriks korelasi Spearman data asal ………………………………………..…….
6
Peringkat provinsi berdasarkan IPK……………………………………………….
7
8
Ukuran kesesuaian biplot (%) data asal……………………………………………………………
Matriks korelasi Pearson data ekstrim
……………………………………………………………………………..
9
Matriks korelasi Spearman data ekstrim …………………………………………..……………………
10 Ukuran kesesuaian biplot (%) data ekstrim…………………………………………………………..
PENDAHULUAN
Latar Belakang
Ada dua cara yang biasa digunakan oleh seseorang untuk menyajikan
hasil dari sebuah studi kuantitatif. Cara yang pertama adalah membeberkan
angka-angka dalam sebuah tabel atau daftar, dan cara yang kedua adalah
menyajikannya dalam grafik. Di samping lebih menarik dari segi warna dan
bentuknya, dalam banyak hal penggunaan grafik juga lebih informatif. Untuk
data yang lebih kompleks yaitu data yang melibatkan banyak peubah atau
peubah ganda (multivariate), tentunya sulit untuk diinterpretasikan secara
langsung, sehingga perlu dilakukan tahap pereduksian dimensi data terlebih
dahulu. Dalam statistika dikenal suatu analisis data yang menggunakan peubah
amatan lebih dari satu dan dianalisis secara serempak, yaitu Analisis Peubah
Ganda (APG). Salah satu teknik yang digunakan dalam APG adalah
pereduksian dimensi data peubah ganda (Siswadi dan Suharjo, 1999)
Analisis biplot merupakan salah satu bentuk APG yang dapat
memberikan gambaran secara grafik tentang keragaman peubah, kedekatan
antar objek serta keterkaitan peubah dengan objek yang dapat digunakan untuk
menggambarkan sebuah tabel ringkasan dengan banyak peubah agar lebih
menarik, informatif, komunikatif dan artistik. Dengan analisis biplot, data
berpeubah ganda dapat direpresentasikan dalam ruang berdimensi kecil.
Perbedaan hasil analisis biplot dengan kenyataan yang sebenarnya dapat saja
terjadi.
Hal ini mungkin karena pada dasarnya representasi data dengan
analisis biplot merupakan pendekatan terhadap data yang berdimensi besar ke
dalam dimensi dua, sehingga ada informasi yang hilang. Namun ini bukanlah
masalah serius selama informasi yang penting dapat diperoleh. Analisis biplot
telah terbukti sebagai alat yang sangat ampuh untuk menganalisis berbagai
macam bentuk data peubah ganda (Aitchison dan Greenacre, 2001).
Dari suatu contoh data seringkali ditemukan adanya data pencilan
(outlier) yang dapat disebabkan oleh kesalahan pada saat pengambilan data,
pencatatan atau beberapa faktor alamiah, seperti penyimpangan genetik.
Dampak keberadaan data pencilan diduga akan mengganggu dalam proses
analisis data, dalam hal ini analisis biplot. Oleh karena itu perlu ditelusuri
dalam sebuah matriks data yang memuat data pencilan serta menganalisisnya
menggunakan analisis biplot dengan matriks koragam biasa atau alternatifnya,
misalnya dengan matriks koragam kekar (robust).
Pemetaan provinsi berdasarkan prestasi siswanya merupakan suatu
proses untuk memperoleh gambaran perbandingan mutu suatu provinsi
dengan provinsi yang lainnya.
dikaitkan dengan prestasi
Prestasi siswa antar provinsi ini dapat
yang dicapai siswanya di TPB IPB.
Hasil
pemetaan provinsi berdasarkan prestasi mahasiswa TPB IPB diharapkan dapat
digunakan untuk mengevaluasi kinerja pemerintah masing-masing provinsi
serta perencanaan dan target peningkatan mutu lulusan sekolah menengah.
Suatu analisis diperlukan untuk memperoleh gambaran yang lebih terinci
dalam pemetaan provinsi sehingga informasi yang diperoleh merupakan
gambaran mutu pendidikan di sekolah menengah masing-masing provinsi
berdasarkan prestasi mahasiswa TPB IPB. Pengamatan lebih dari satu peubah
(peubah ganda) dianalisis secara serempak menggunakan Analisis Peubah
Ganda (APG), salah satunya adalah dengan Analisis Biplot.
Institut Pertanian Bogor (IPB) sebagai salah satu perguruan tinggi
negeri adalah salah satu perguruan tinggi yang dipercaya mendidik dan
mempersiapkan bibit-bibit unggul anak bangsa dari seluruh provinsi di
Indonesia tanpa kecuali.
Mahasiswa IPB yang mewakili hampir seluruh
provinsi di Indonesia, diharapkan mampu memberi gambaran standar kualitas
pendidikan yang relevan dengan tuntutan zaman.
Perekrutan mahasiswa IPB dengan berbagai jalur penerimaan, yaitu
(1) USMI yang merupakan undangan kepada mahasiswa melalui jalur
mahasiswa berprestasi dari tiap daerah tanpa ujian, hanya dengan
pertimbangan nilai rapor selama mahasiswa tersebut bersekolah di SMTA
(Sekolah Menengah Tingkat Atas), (2) UMPTN/SPMB/SNMPTN
yang
merupakan penerimaan mahasiswa melalui saringan ujian tertulis yang diikuti
pula oleh siswa lulusan SMTA dari seluruh provinsi, dan (3) PIN/BUD yang
merupakan undangan kepada mahasiswa melalui beasiswa utusan daerah.
Dari ketiga jalur penerimaan mahasiswa tersebut, jelas terlihat bahwa
mahasiswa yang menuntut ilmu di IPB dapat sangat beragam, baik latar
belakang sosial ekonomi ataupun latar belakang kualitas pendidikannya.
Maka perlu diadakannya standarisasi kualitas input (mahasiswa baru) dengan
mengadakan pendidikan secara komprehensif di tingkat awal. IPB melalui
Direktorat Pendidikan Tingkat Persiapan Bersama membentuk program
Tingkat Persiapan Bersama (TPB) pada tahun 1973 sebagai wujud kepedulian
IPB terhadap pembangunan bangsa yang dilakukan melalui penerimaan
mahasiswa baru dengan undangan ke sekolah menengah di seluruh pelosok
tanah air.
Tugas ini tentulah tidak mudah, karena memang pemerataan kualitas
pendidikan di sekolah menengah seluruh provinsi di Indonesia tidaklah sama,
walaupun pemerintah sudah menerapkan Ujian Nasional sebagai alat
standarisasi mutu pendidikan secara nasional. Hal ini bisa dilihat dari hasil
prestasi mahasiswa TPB IPB pada tahun akademik 2007/2008 yang juga
memberikan hasil yang beragam.
Dalam penelitian ini, rumusan masalahnya ialah:
1 Bagaimana memperoleh gambaran pemetaan provinsi berdasarkan prestasi
mahasiswa TPB IPB menggunakan analisis biplot dengan matriks koragam
biasa dibandingkan dengan matriks koragam kekar?
2 Bagaimana memperoleh gambaran pemetaan provinsi berdasarkan prestasi
mahasiswa TPB IPB dengan adanya data pencilan yang ekstrim
menggunakan analisis biplot dengan matriks koragam biasa dibandingkan
dengan matriks koragam kekar?
Tujuan dan Manfaat Penelitian
Berdasarkan latar belakang masalah, tujuan dari penelitian ini (dalam
studi kasus mahasiswa TPB IPB tahun akademik 2007/2008) ialah:
membandingkan analisis biplot dengan matriks koragam biasa dan kekar untuk
pemetaan provinsi berdasarkan prestasi mahasiswa TPB IPB sebagai data asal
serta memperoleh gambaran kekekaran analisis biplot dengan matriks koragam
kekar dengan pencilan ekstrim.
Penelitian ini diharapkan dapat menjadi masukan bagi pemerintah
daerah dan pemerintah pusat dalam membuat kebijakan sektor pendidikan
terutama dalam standarisasi mutu lembaga pendidikan dan pemerataan dana
pendidikan. IPB sebagai tempat mahasiswa menuntut ilmu diharapkan pula
untuk lebih selektif dalam penerimaan mahasiswa baru.
TINJAUAN PUSTAKA
Analisis Biplot Biasa
Analisis Biplot (Gabriel, 1971) merupakan upaya untuk memberikan
peragaan secara grafik dari matriks data X dalam suatu plot dengan
menumpangtindihkan vektor-vektor baris matriks X (gambaran objek) dengan
vektor-vektor yang mewakili kolom matriks X (gambaran peubah).
Dari
peragaan ini diharapkan diperoleh gambaran tentang objek, misalnya
kedekatan antar objek, gambaran tentang peubah dan keterkaitan antara objekpeubah. Tampilan objek dalam Analisis Komponen Utama (AKU) merupakan
kasus khusus dari analisis biplot dan penghitungan dalam analisis biplot
didasarkan pada Dekomposisi Nilai Singular (DNS) suatu matriks (Siswadi
dan Suharjo, 1997).
Dengan peragaan secara grafik dari analisis biplot diharapkan dapat
diperoleh antara lain informasi tentang:
1 Kedekatan antar objek, yaitu objek mempunyai kemiripan dengan objek
lain yang ditunjukkan dengan posisi objek-objek tersebut.
2 Keragaman peubah, yaitu dengan membandingkan panjang vektor peubah.
Peubah dengan keragaman kecil digambarkan dengan vektor yang pendek,
sebaliknya jika keragamannya besar digambarkan dengan vektor yang
panjang.
3 Korelasi antar peubah, dalam hal ini peubah digambarkan sebagai vektor.
Dua peubah yang berkorelasi positif digambarkan sebagai dua vektor
dengan arah yang sama atau membentuk sudut lancip. Sedangkan dua
peubah yang berkorelasi negatif digambarkan sebagai dua vektor dengan
arah berlawanan atau membentuk sudut tumpul.
Apabila sudut yang
dibentuk siku-siku, maka dua peubah tersebut tidak saling berkorelasi.
4 Keterkaitan peubah dengan objek. Objek yang letaknya sepihak dengan
arah vektor peubah, menunjukkan objek tersebut nilainya di atas rata-rata,
jika berlawanan berarti nilainya di bawah rata-rata, jika hampir di tengahtengah berarti nilainya mendekati rata-rata.
Analisis Biplot adalah peragaan secara grafik dari baris dan kolom
sebuah matriks data nXp *, dengan baris mewakili objek dan kolom mewakili
peubah.
Dalam
setiap
aplikasi,
analisis
biplot
dimulai
dengan
mentransformasikan matriks X* sebagai matriks data asal terhadap nilai rataratanya menjadi matriks X yang akan digambarkan (Aitchison dan Greenacre,
2001).
X = X* -
1
( 1 X*)
n
(1.1)
dengan 1 adalah matriks yang semua unsurnya bernilai 1.
Matriks koragam (S) dari matriks X adalah :
′ (1.2)
Misalnya matriks R =
, i = 1,2, . . . , n ; j = 1,2, . . . , p adalah matriks
korelasi dari matriks X, maka matriks tersebut dapat ditulis :
/
di mana
⎛ 1
1
1
= diag ⎜
,
,....,
⎜ s11 s 22
s pp
⎝
/
/
(1.3)
⎞
⎟ adalah matriks diagonal dengan
⎟
⎠
unsur diagonal utama 1 s ii ; i = 1,2, . . ., p (Johnson dan Wichern, 2002).
Unsur rij juga merupakan kosinus sudut θ antara vektor peubah ke-i dan ke-j :
cos
(1.4)
.
, maka:
.
.
Misalnya matriks
jarak Euclid antara objek ke-i dan ke-j adalah:
,
,
(1.5)
dan jarak Mahalanobis antara objek ke-i dan ke-j adalah:
,
.
(1.6)
Teorema Eckart-Young (Aitchison dan Greenacre, 2001) menyatakan
bahwa jika matriks n
p
dihitung dengan
r * nilai singular pertama dan vektor
singular yang berkorespondensi, misalnya untuk
r * = 2 :
=
(1.7)
kemudian karena matriks n
p
sebagai pendekatan terbaik bagi nXp maka :
menjadi minimum, di mana ...
∑ ∑
F
(1.8)
merupakan notasi dari norm matriks
Frobenius.
berpangkat r (r ≤ p ≤ n) maka dengan menggunakan DNS
Apabila matriks
diperoleh:
nXp
Matriks
U dan
=
nU rL r
(1.9)
p
A adalah matriks
ortonormal kolom,
dengan
= Ir (matriks identitas berdimensi r). Matriks U adalah matriks
yang kolom-kolomnya merupakan eigenvektor-eigenvektor yang berpadanan
dengan eigennilai-eigennilai tak nol dari matriks
,
,
,…,
(1.10)
matriks A adalah matriks yang kolom-kolomnya merupakan eigenvektor yang
berpadanan dengan eigennilai tak nol dari matriks
, dan matriks L adalah
matriks diagonal yang unsur diagonal-diagonalnya merupakan akar dari
eigennilai-eigennilai tak nol matriks
(
,
,...,
) , di mana
nilai singular.
atau matriks
. . .
, yaitu L = diag
> 0 dan
disebut
Dalam Jolliffe (2002), dengan mendefinisikan G = ULα dan H’ = L1- α
, maka untuk α
[0,1]:
X =UL
= U Lα L1- α
=
dan elemen ke-( , ) dari matriks
dapat ditulis:
,
merupakan vektor baris ke-i
dari matriks
merupakan vektor baris ke-j dari matriks
dan
(1.11)
(1.12)
, i = 1, 2, …, n dan
, j = 1, 2, …, p; di mana vektor
mempunyai r elemen.
Untuk menggambarkan
pada ruang dimensi k < r , dapat didekati
menggunakan matriks berpangkat k,
=
=
(1.13)
Biasanya digunakan k = 2, sehingga koordinat-koordinat G dan H dapat
digambarkan dalam ruang berdimensi 2 (Lipkovich dan Smith, 2002).
Pengambilan nilai α tertentu berimplikasi penting dalam interpretasi
biplot. Secara umum untuk setiap nilai α yang digunakan, penumpangtindihan
vektor g dan h yang diplot pada ruang yang sama diperoleh nilai amatan
peubah ke-j pada objek ke-i yang telah dikoreksi terhadap nilai tengahnya yaitu
= gi’hj. Nilai amatan tersebut bertanda positif bila kedua vektor tersebut
searah, yaitu sudut kedua vektor tersebut ada dalam [0, ), bertanda negatif bila
kedua vektor tersebut berlawanan arah, yaitu sudut kedua vektor tersebut ada
dalam ( ,
]. Posisi relatif titik-titik gi dan hj akan memberikan informasi
tentang objek-objek yang mempunyai nilai relatif besar, rataan, atau kecil dari
peubah-peubah yang diamati.
a. Jika α = 0, maka G = U dan H’ = LA’ , akibatnya :
(1.14)
diperoleh:
, di mana
-
adalah koragam peubah ke-i dan ke-j,
dan penggandaan titik antara vektor
dan
akan memberikan
gambaran koragam antara peubah ke-i dan ke-j.
-
=√
,
=
, menggambarkan keragaman peubah ke-i.
- Korelasi antara peubah ke-i
antara
dan
dan ke-j dijelaskan oleh kosinus sudut
(misal : θ), yaitu :
cos
=
(1.15)
=
=
Berdasarkan sudut yang dibentuk antara vektor
dan
, korelasi
peubah ke-i dan ke-j dapat dijelaskan sebagai berikut:
1 semakin besar korelasi positifnya jika θ mendekati 0, dan korelasi
sama dengan 1 jika θ = 0,
2 semakin besar korelasi negatifnya jika θ mendekati π, dan korelasi
sama dengan -1 jika θ = π, dan
3 semakin kecil korelasi positif dan negatifnya jika θ mendekati π/2,
dan tidak berkorelasi apabila θ = π/2.
- Jika X berpangkat p maka
, di mana S
adalah matriks koragam dari X.
vektor
dan
Berarti kuadrat jarak Euclid antara
pada biplot sebanding dengan kuadrat jarak
Mahalanobis antara vektor
dan
Siswadi dan Suharjo, 999 .
b. Jika α = 1 , maka G = UL dan H’ = A’, atau H = A; H’H = A’A = I
akibatnya :
(1.16)
atau
, artinya kuadrat jarak
Euclid antara
dan
dan
akan sama dengan kuadrat jarak Euclid antara
.
Dari interpretasi biplot di atas, dekomposisi X = GH' tidak bersifat
khas, jika α = 1 maka g-plot diperoleh dengan memisalkan G = UL dan H =
A, baris ke-i matriks G akan digunakan untuk merepresentasikan baris ke-i
matriks X, yang berarti merepresentasikan objek ke-i, sedangkan baris ke-j
matriks H akan digunakan untuk merepresentasikan kolom ke-j matriks X,
yang berarti merepresentasikan peubah ke-j. Sedangkan jika α = 0 maka h-plot
diperoleh dengan memisalkan H = AL dan G = U yang merupakan gambaran
ragam dan korelasi di dalam grafik.
Pengamatan ekstrim mungkin berpengaruh sekali pada struktur
koragam contoh. Hal ini berpengaruh pula pada h-plot, yang menghubungkan
antara peubah yang tidak representatif pada struktur utama himpunan data.
Maka perlu dicari sebuah alternatif untuk biplot biasa yang kekar terhadap
pengaruh data pencilan (Daigle dan Rivest,1992).
Dalam analisis biplot biasa, perhitungannya didasarkan pada matriks
koragam contoh (S) biasa yaitu :
=
∑
.............................(1.17)
dengan j = 1, 2, . . ., p ; k = 1, 2, , . . ., p sebagai elemen matriks S,
adalah
rataan data.
Data Pencilan
Data pencilan didefinisikan sebagai pengamatan yang menjadi bagian
di dalam nilai yang diduga berasal dari populasi yang berbeda atau hasil dari
pengukuran yang salah (William dan Johnson, 1993). Sementara Jollife (2002)
mengatakan bahwa data pencilan dalam data biasanya hasil pengamatan yang
mempunyai jarak yang jauh dari kumpulannya atau tidak konsisten dengan
data lainnya.
Untuk menentukan batasan pencilan dari sebuah analisis, dapat
menggunakan diagram kotak garis (boxplot). Metode ini merupakan yang
paling umum yakni dengan mempergunakan nilai kuartil dan jangkauan.
Kuartil 1, 2, dan 3 akan membagi sebuah urutan data menjadi 4 bagian.
Jangkauan (IQR, Interquartile Range) didefinisikan sebagai selisih kuartil 1
terhadap kuartil 3, atau IQR = Q3 – Q1. Data pencilan dapat ditentukan dengan
melihat nilai yang kurang dari 1.5 * IQR terhadap kuartil 1 dan nilai yang lebih
dari 1.5 * IQR terhadap kuartil 3. Informasi yang dapat diperoleh selain dari
data pencilan adalah kesimetrikan penyebaran data, dapat dilihat dari apakah
kotak terbagi dua oleh garis median sama besar atau tidak dan apakah ‘ekor’
bawah dan ‘ekor’ atas sama panjang atau tidak (Mattjik dan Sumertajaya,
2006).
Bentuk dan ukuran data peubah ganda diukur dengan matriks koragam.
Seperti telah diketahui, ukuran jarak yang menggunakan perhitungan matriks
koragam adalah jarak Mahalanobis. Jarak Mahalanobis untuk p-dimensi
peubah ganda,
(i=1,..., n) didefinisikan :
=
/
(2.1)
untuk i=1, …, n, di mana μ menyatakan dugaan vektor rata-rata dan Σ
menyatakan matriks koragam. MD i pada (2.1) disebut juga jarak kekar (JK),
dan apabila kuadrat dari JK lebih besar dari χ p2 ;0.975 dapat dinyatakan sebagai
data pencilan (Filzmoser, 2004).
Analisis Biplot dengan Matriks Koragam Kekar
Dalam segugus data mungkin terdapat data yang salah atau data
pencilan, yang biasa dan ekstrim karena itu ditawarkan metode baru untuk
mengeksplorasi data tersebut dengan analisis biplot kekar. Pendekatan ini
menggantikan unsur vektor rataan matriks koragam (biasa) dengan rata-rata
dan matriks koragam yang menggunakan metode kekar. Analisis biplot kekar
dipilih sebagai salah satu alternatif analisis yang diharapkan dapat memberikan
pemetaan provinsi berdasarkan prestasi mahasiswa TPB IPB dalam gambaran
yang lebih konsisten.
Hubert et al. (2002) menyatakan bahwa matriks koragam biasa sangat
sensitif terhadap adanya pengamatan yang mengandung data pencilan. Untuk
mengantisipasinya digunakan pendugaan matriks koragam kekar, salah satunya
dengan metode pendugaan-M peubah ganda, sebagai solusi untuk masalah
meminimumkan fungsi tertentu dari data, misalkan meminimumkan jarak
antara matriks data dan matriks pendekatannya.
Pendugaan-M peubah ganda vektor lokasi dan sebaran matriks peubahp contoh {yi , i = 1, …, n} dapat dilihat dari rataan terboboti dan matriks
koragam terboboti di mana bobot tiap-tiap data tergantung pada seberapa jauh
lokasi pendugaan, yi
adalah vektor objek ke-i dengan p-peubah.
Dalam
penghitungan pendugaan-M, masing-masing objek diboboti, pada data pencilan
mendapat pembobot yang semakin kecil. Pembobot-pembobot inilah yang
membangun biplot kekar. Dengan pendugaan-M,
dan
didefinisikan sebagai
solusi persamaan sistem non linear yang merupakan rataan kekar dan matriks
koragam kekar .
∑
= ,
∑
(3.1)
∑
(3.2)
di mana
(3.3)
h adalah sembarang fungsi pembobot positif dalam (0,∞), dan C adalah
konstanta yang menormalkan. Pada kasus ini dipilih fungsi pembobot Huber,
dipilih,
min ,
√
. Daigle dan Rivest (1992), menunjukkan untuk h yang
didapat jika:
√
√ ⁄
√
(3.4)
Untuk mengkonstruksi biplot kekar, matriks diagonal W berukuran
n x n dengan elemen
yaitu
pembobot yang dinormalkan seperti
didefinisikan oleh (3.3) dengan
dan
. Jika peubah memiliki
ukuran atau skala berbeda, dapat distandarisasi dengan matriks diagonal V dari
invers ragam ⁄
.
Dengan adanya data pencilan, sebaiknya bobot yang kecil diberikan
pada data ekstrim dalam penghitungan pendekatan pangkat rendah pada
matriks data Z yang berukuran (n x p) dengan pangkat . Didefinisikan
matriks X dengan ukuran (n x p) dan berpangkat
sebagai matriks dengan
kuadrat norma perbedaan terkecilnya terboboti adalah
dengan
∑
∑
(3.5)
didefinisikan oleh (3.3). Solusinya dapat ditulis dalam DNS dari
,
(3.6)
W adalah matriks diagonal dengan
sebagai elemennya,
dan
masing
masing matriks berukuran n x s dan p x s dengan kolom saling ortonormal, dan
. Karena
adalah matriks diagonal nilai singular
matriks Z merupakan matriks pendekatan dengan pangkat yang lebih rendah
dari pangkat matriks X maka,
(3.7)
adalah matriks diagonal dari r nilai singular pertama dari matriks
dan
dibuat dari r kolom pertama dari
singular
dan
adalah akar kuadrat eigennilai
, dan
. Sebagai catatan, nilai
dan
adalah matriks
eigenvektor .
X = GHT pada (1.11) menjadi X pada (3.7). Ambil
dan
dan
baris
dari matriks G; dua baris berisi koordinat biplot yang mewakili
pengamatan ke- dan ke- . Jarak kuadrat Euclid antara dua pengamatan,
adalah sama dengan
-2
+
Jika GGT sedekat mungkin ke ZZT , maka matriks G dan H pada (1.11)
menjadi
G=
dan H =
(3.8)
diperoleh pula
=
(3.9)
Untuk sebuah gambaran yang penuh makna dari struktur ragam dan
koragam dengan h-plot, yaitu
dengan
dengan memilih H yang sedekat mungkin
. Panjang dari vektor menggambarkan sebuah peubah yang secara
proposional didekati oleh standar deviasi kekar, sementara itu sudut antara dua
peubah adalah dengan pendekatan sama dengan korelasi kekar. Untuk hal ini
matriks G dan H menjadi:
dan H =
G=
(3.10)
diperoleh pula
(3.11)
Sebagai catatan, h-plot dari biplot ini adalah sebuah versi kekar seperti
digambarkan Corsten dan Gabriel (1976) dalam Daigle dan Rivest (1992).
Jarak antara titik-titik data dapat diinterpretasikan dalam jarak Mahalanobis
kekar, karenanya perkalian
dapat ditulis sebagai
X
dalam pendekatan lain diperoleh :
XT
(3.12)
X
XT
Z
ZT
(3.13)
Jadi, jarak kuadrat antara pengamatan ke- titik data dan
adalah sebuah
pendekatan dari
(3.14)
yaitu jarak Mahalanobis kekar pada pendugaan lokasi. Dalam kasus biasa,
ukuran untuk membandingkan pengamatan adalah ukuran Mahalanobis biasa
dihitung dengan matriks koragam contoh seperti disebutkan Gabriel 1971;
Jollife 1986; Campbell 1980 dalam Daigle dan Rivest (1992), bahwa
perbandingan dari dua jarak ini menunjukkan bahwa bentuk kekar adalah
salah satu bentuk yang lebih baik untuk mendeteksi data pencilan.
Ukuran Kesesuaian Biplot
Menurut Gabriel (2002), biplot tidak hanya sebagai pendekatan matriks
data X dengan menggunakan matriks
, tetapi juga koragam dan korelasi
antar peubah, serta kemiripan antar objek.
′
matriks
′ sebagai pendekatan dari
terkait pada matriks ragam koragam dan korelasi antar peubah,
sedangkan matriks
′ sebagai pendekatan bagi
′
, terkait pada ukuran
kemiripan objek. Selanjutnya Gabriel mengemukakan ukuran kesesuaian biplot
(Goodness of Fit of Biplot) sebagai ukuran pendekatan, dalam bentuk sebagai
berikut :
1 Kesesuaian data :
GF
2 Kesesuaian peubah :
GF
3 Kesesuaian objek :
GF
,
(4.1)
,
,
(4.2)
(4.3)
Makin besar nilai ukuran kesesuaian untuk memperoleh gambaran
layak tidaknya analisis biplot dalam ruang dimensi r dengan matriks
sebagai matriks pendekatan terbaik berpangkat r, makin layak analisis biplot
digunakan untuk penarikan kesimpulan (Siswadi dan Suharjo, 1999).
Provinsi sebagai Objek Pemetaan
Saatt ini, Indoneesia terdiri daari 33 provinnsi. Dari 333 provinsi tersebut, 5
di antaranyya memilikii status khuusus sebagaai Daerah K
Khusus atauu Daerah
Istimewa yaaitu: Aceh, Jakarta,
J
Yoggyakarta, Pappua dan Papuua Barat. Peembagian
provinsi berrdasarkan wilayah
w
terlihhat dalam petta berikut.
Gaambar 1 Peeta provinsi di
d Indonesia
Provinsi teersebut adaalah Nangggroe Aceh Darussalam
m, Sumateraa Utara,
Sumatera Barat,
B
Riau, Kepulauan Riau, Jambbi, Sumateraa Selatan, Beengkulu,
Lampung, Kepulauan Bangka Belitung, Baanten, Daeraah Khusus Ibukota
Jakarta, Jaw
wa Barat, Jaw
wa Tengah, Daerah Istim
mewa Yogyyakarta, Jawaa Timur,
Bali, Nusaa Tenggara Barat, Nuusa Tenggaara Timur, Kalimantann Barat,
Kalimantan
n Tengah, Kalimantan
K
S
Selatan
, Kaliimantan Tim
mur, Sulawessi Utara,
Sulawesi Tengah,
T
Sulaawesi Selatann, Sulawesi Tenggara, G
Gorontalo, Sulawesi
S
Barat, Maluuku, Malukuu Utara, Papuua Barat, Pappua (Wikipeddia, 2009).
Darii posisi proovinsi dalam
m peta terllihat kedekaatan antar provinsi
dengan lokaasi IPB sebaagai tempat mahasiswa sebagai objeek penelitiann berada
(Bogor Jaw
wa Barat). Hal
H ini akaan berpengaaruh pada kuantitas
k
maahasiswa
masing-massing provinssi yang kuliah di IPB. Pemerintahh sebagai peengambil
kebijakan dalam
d
pendidikan akann melihat peemetaan kuantitas dan kualitas
mahasiswa masing-massing provinssi berdasarkaan prestasi m
mahasiswa TPB
T
IPB
yang tergaambarkan seecara komprrehensif dengan analissis biplot, sehingga
s
diharapkan dapat memb
buat kebijakaan yang efek
ktif dan efisiien.
METODE PENELITIAN
Sumber Data
Data penelitian yang digunakan adalah data yang diperoleh dari
Direktorat Pendidikan Tingkat Persiapan Bersama Institut Pertanian Bogor
(TPB IPB), yang terdiri atas data tentang provinsi asal sekolah menengah dan
data nilai mutu mata kuliah yang diikuti bersama serta IPK mahasiswa TPB
IPB tahun akademik 2007/2008. Objek penelitian adalah provinsi yang diteliti
terdiri dari 30 provinsi (3 provinsi tidak ada mahasiswa TPB yang
mewakilinya)
tersebar pada 3001 mahasiswa yang dikelompokkan
berdasarkan hasil seleksi masuk IPB melalui jalur BUD (24 provinsi) dan non
BUD (30 provinsi).
Peubah yang diamati ialah nilai mutu mata kuliah yang
meliputi 14 mata kuliah yang diikuti mahasiswa TPB IPB pada semester ganjil
dan genap serta Indeks Prestasi Kumulatif (IPK) mahasiswa TPB IPB tahun
akademik 2007/2008. Jadi, diperoleh matriks data peubah ganda berukuran
54 x 15 yang menunjukkan 30 provinsi asal daerah mahasiswa non BUD dan
24 provinsi asal daerah mahasiswa BUD dengan 15 peubah yang diamati.
Data yang diolah adalah data agregat, yaitu data yang diperoleh dari
rata-rata nilai mutu masing-masing provinsi.
Peubah Penelitian
Peubah-peubah yang digunakan dalam penelitian ini adalah :
AG : Nilai Mutu Mata Kuliah Agama
Peubah ini terdiri dari mata kuliah agama Islam, agama Protestan, agama
Katolik, agama Hindu dan agama Budha, dipilih berdasarkan agama dan
keyakinan masing-masing mahasiswa.
BI : Nilai Mutu Mata Kuliah Biologi
EK: Nilai Mutu Mata Kuliah Ekonomi Umum
FI : Nilai Mutu Mata Kuliah Fisika
ID : Nilai Mutu Mata Kuliah Bahasa Indonesia
IG : Nilai Mutu Mata Kuliah Bahasa Inggris
KA : Nilai Mutu Mata Kuliah Kalkulus
KI : Nilai Mutu Mata Kuliah Kimia
KW: Nilai Mutu Mata Kuliah Pengantar Kewirausahaan
MA: Nilai Mutu Mata Kuliah Pengantar Matematika
OS: Nilai Mutu Mata Kuliah Olah Raga dan Seni
PP : Nilai Mutu Mata Kuliah Pengantar Ilmu Pertanian
PK : Nilai Mutu Mata Kuliah Pendidikan Pancasila dan Kewarganegaraan
SU : Nilai Mutu Mata Kuliah Sosiologi Umum
IP : Indeks Prestasi Kumulatif (IPK)
Objek Penelitian
Objek penelitian adalah provinsi yang terwakili oleh mahasiswa TPB
IPB tahun akademik 2007/2008 yang berjumlah 30 provinsi asal mahasiswa
non BUD dan 24 provinsi asal mahasiswa BUD seperti disajikan dalam
Tabel 1.
Tabel 1 Objek penelitian
Kode
Provinsi
Jalur
seleksi
Kode
Provinsi
Jalur
seleksi
1
2
3
4
5
6
7
N A D1
N A D2
Sumatera Utara1
Sumatera Utara2
Sumater