Pengelompokkan dengan Distribusi Normal Multivariat

9 = jumlah pengamatan pada kelompok ke-i = vektor rataan total b. Wilk’s Lambda, statistik uji yang digunakan apabila terdapat lebih dari dua kelompok variabel independen dan asumsi homogenitas matriks varians kovarians terpenuhi. Nilai uji statistik Wilk’s Lambda semakin rendah, maka pengaruh terhadap model semakin besar. Nilai Wilk’s Lambda berkisar antara 0-1. Statistik uji Wilk’s Lambda dirumuskan sebagai, = | | | | 2.14 c. Hotelling’s Trace, statistik uji yang digunakan jika hanya terdapat dua kelompok variabel independen, semakin tinggi nilai statistik Hotelling’s Trace, pengaruh terhadap model semakin besar. Nilai Hotelling’s Trace Pillai’s Trace. Statistik uji Hotelling’s Trace dirumuskan sebagai, = 2.15 d. Roy’s largest Root, uji statistik ini hanya digunakan apabila asumsi homogenitas varians kovarians terpenuhi, semakin tinggi nilai statistik Roy’s largest Root maka pengaruh terhadap model semakin besar. Nilai Roy’s Largest Root Hotelling’s Trace Pillai’s Trace. Statistik uji Roy’s Largest Root dirumuskan sebagai, = akar karakteristik maksimum dari Rini, 2010

2.4 Pengelompokkan dengan Distribusi Normal Multivariat

Misalkan populasi , = 1,2, …, dengan adalah fungsi kepadatan peluang yang berhubungan. Jika distribusi data sampel normal multivariat, maka adalah fungsi kepadatan peluang untuk data berdistribusi normal multivariat dimana vektor mean dan matriks kovarians dengan bentuk, = ⁄ | | ⁄ exp − − − , = 1,2, …, 2.16 10 Jika adalah peluang prior dari populasi , = 1,2, …, dan | adalah besarnya resiko salah mengelompokkan suatu data anggota populasi , padahal data ini berasal dari untuk , = 1,2, …, . Apabila adalah himpunan semua x yang dikelompokkan sebagai maka peluang salah pengelompokkan dapat dinotasikan dengan | adalah peluang bersyarat mengelompokkan suatu data sebagai , padahal data tersebut berasal dari , yaitu, | = ∫ 2.17 untuk ≠ ; , = 1,2, …, dengan | = 1 − ∑ | 2.18 Nilai harapan bersyarat dari salah mengelompokkan Expected Cost of Misclassification = ECM suatu data x yang berasal dari yang dikelompokkan ke dalam , atau , …, atau adalah ECM1 = 2|1 2|1 + 3|1 3|1 + ⋯ + |1 |1 = ∑ |1 |1 2.19 Dengan cara yang sama dapat diperoleh nilai harapan bersyarat dari salah mengelompokkan ECM2, ECM3, …, ECMg. Setiap ECM bersyarat dikalikan dengan peluang priornya dan dijumlahkan menghasilkan ECM total, ECM = ECM 1 + ECM 2 + ⋯ + ECM = ∑ |1 |1 + ∑ |2 |2 + ⋯ + ∑ | | = ∑ ∑ | | 2.20 Daerah pengelompokkan yang meminimumkan ECM total diperoleh dengan mengalokasikan x ke dalam , dengan ∑ | yang terkecil, Anderson, 1958. 11 Andaikan resiko salah mengelompokkan sama dimisalkan nilainya sama dengan 1, sehingga menggunakan hasil tersebut, dapat dikelompokkan x ke dalam populasi , = 1,2, …, , dimana ∑ terkecil. Akibatnya, jika resiko salah pengelompokkan nilainya sama untuk semua populasi sehingga | = 0, | = 1; ≠ , maka aturan pengelompokkan objek dalam populasi didasarkan pada pengelompokkan terhadap populasi apabila, atau ln ln ; ≠ 2.21 sehingga menurut persamaan 2.21, ln = ln − ln 2 − ln| | − − − = max ln 2.22 konstanta ln 2 dapat diabaikan karena bernilai sama untuk semua kelompok, maka persamaan 2.22 menjadi, ln = ln − ln| | − − − = max ln 2.23 Rachmatin dan Sawitri, 2010

2.5 Analisis Diskriminan Bertatar Stepwise Discriminant Analysis