Data Multivariate
14. Data Multivariate
Dalam perihal-perihal tertentu ternyata para pakar telah membuat pembedaan antara "variable" dan "variate". Suatu "variable" adalah "kuantita yang mempunyai nilai berbeda untuk individu yang berbeda, atau mempunyai nilai berbeda untuk individu yang sama pada kondisi yang berbeda". Sedangkan suatu "variate" didefinisikan sebagai "suatu kuantita yang dapat mempunyai salah satu nilai dari gugus nilai tertentu yang mempunyai frekuensi relatif atau peluang tertentu". "Variate" ini kadangkala juga dipandang sebagai peubah-acak, tetapi harus dipandang bukan hanya nilainya saja, tetapi juga harus dilibatkan fungsi peluangnya.
Tabel 9. Tabel kontingensi tiga arah _________________________________________________________
Kelinci A Kelinci B Total
Sehat Sakit Sehat Sakit
_________________________________________________________ Kelinci A
Kelinci B
Dalam bidang ekologi atau ilmu lingkungan, seringkali suatu model analisis harus mampu menangkap perilaku lebih dari satu variate. Model-model seperti ini secara kolektif disebut "multivariate", dan teknik analisisnya disebut "multivariate analysis". Pada hakekatnya analisis ini adalah analiis data multi variate dalam pengertian bahwa setiap anggota mempunyai nilai-nilai p variates. Teladan data seperti ini disajikan dalam Tabel 10.
Tabel 10. Karakteristik tanah dari beberapa lokasi
_________________________________________________________ No. Kadar Fosfor Nitrogen Kepadatan Kerikil Tanah air _________________________________________________________
14.1. Model-model deskriptif
Model-model ini tidak melibatkan pendugaan variate degan menggu-nakan variate lainnya.
(a). Analisis Komponen Utama ("Principal Component Analysis, PCA")
Model ini merupakan bentuk yang cukup sederhana untuk mempelajari variasi
multivariate. Analisis ini dapat digunakan untuk menganalisis data yang memenuhi syarat sbb:
1. Untuk setiap individu unit contoh diukur dan dicatat peubah- peubah yang sama. Dengan demikian semua pengukuran harus dilakukan untuk setiap individu unit pengamatan,
2. Peubah-peubah yang dipilih untuk analisis harus kontinyu atau kalau diskrit maka intervalnya harus cukup kecil sehingga dapat dianggap kontinyu
3. Tidak ada manipulasi peubah orisinal untuk membentuk peubah baru yang juga dilibatkan dalam analisis.
Metode analisis ini dilakukan untuk mencapai tujuan :
1. Pemeriksaan korelasi antara peubah-peubah yang separate
2. Reduksi dimensi variabilitas yang diekspresikan oleh unit-unit sampling individual hingga menjadi paling sedikit tetapi masih bermakna
3. Eliminasi peubah-peubah yang sumbangan informasinya kecil
4. Pemeriksaan pengelompokkan unit-unit sampling yang paling informatif
5. Penentuan pembobot obyektif bagi peubah-peubah dalam rangka untuk menyusun indeks variasi
6. Identifikasi unit-unit samling yang meragukan asal-usulnya Metode analisis ini pada hakekatnya melibatkan ekstraksi eigenvalue dan eigenvector
dari matriks koefisien korelasi peubah-peubah orisinalnya.
(b). Analisis Gerombol ("cluster analysis")
Analisis ini pada hakekatnya melibatkan berbagai macam teknik untuk menemukan
struktur dari gugusan data yang sangat kompleks. Persyaratan database sama dengan struktur dari gugusan data yang sangat kompleks. Persyaratan database sama dengan
14.2. Model Prediktif
(a). Fungsi diskriminan
Model klasik Fisher tentang fungsi diskriminan berkaitan dengan permasalahan bagaimana mendiskriminasikan antara dua kelompok "a priori", dimana setiap individu anggota dalam kelompok mempunyai beberapa peubah yang telah diukur. Model ini menyediakan fungsi linear dari pengukuran setiap peubah sedemikian rupa sehingga individu dapat dimasukkan ke dalam salah satu kelompok dengan tepat.
Fungsi diskriminan ini ditulis sbb:
z = a1x1 + a2x2 + .......+ amxm
dimana a adalah vektor koefisien diskriminan dan x adalah vektor pengukuran yang dilaukan pada individu yang harus dimasukkan ke dalam salah satu kelompok.
(b). Canonical Variate
Kalau kelompok (gerombol) yang dilibatkan lebih dari dua, maka analisis di atas perlu dikembangkan lebih lanjut dengan membentuk lebih dari satu fungsi diskriminan. Metode analisis seperti ini dikenal dengan nama "Canonical variate". Dengan demikian tujuannya adalah menderivasikan seperangkat fungsi deskriminan yang berbentuk:
d = a1x1 + a2x2 + a3x3 + ............. + apxp
dimana a1,a2,a3, ..... ap adalah koefisien deskriminan yang dihitung sedemikian rupa untuk meminimumkan konfuse di antara satu gerombol dengan gerombol lainnya.