Klasifikasi dengan Analisis Diskriminan Fisher, Jarak Mahalanobis, dan Analisis Biplot

KLASIFIKASI DENGAN ANALISIS DISKRIMINAN FISHER,
JARAK MAHALANOBIS, DAN ANALISIS BIPLOT

EVY MUFLIKHAH YUNI

DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2013

PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi dengan
Analisis Diskriminan Fisher, Jarak Mahalanobis, dan Analisis Biplot adalah benar
karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam
bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang
berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari
penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di
bagian akhir skripsi ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut

Pertanian Bogor.
Bogor, Desember 2013
Evy Muflikhah Yuni
NIM G54090018

ABSTRAK
EVY MUFLIKHAH YUNI. Klasifikasi dengan Analisis Diskriminan Fisher,
Jarak Mahalanobis, dan Analisis Biplot. Dibimbing oleh SISWADI dan N. K.
KUTHA ARDANA.
Pengklasifikasian suatu objek baru ke dalam suatu kelompok diharapkan
dapat diperoleh dengan kesalahan minimum. Analisis diskriminan Fisher, jarak
Mahalanobis (baik dengan matriks koragam terpisah maupun gabungan), dan
analisis biplot digunakan dalam pengklasifikasian objek. Data yang digunakan
adalah data Iris dan data bangkitannya untuk simulasi. Jarak Mahalanobis dengan
matriks koragam terpisah memberikan salah klasifikasi minimum. Namun, jika
pengklasifikasian suatu objek baru ke dalam suatu kelompok tidak hanya dilihat
berdasarkan salah klasifikasi yang minimum tetapi juga berdasarkan visualisasi
data, analisis diskriminan Fisher memberikan hasil terbaik.
Kata kunci: analisis diskriminan Fisher, biplot, jarak Mahalanobis, salah
klasifikasi


ABSTRACT
EVY MUFLIKHAH YUNI. Classification with Fisher Discriminant Analysis,
Mahalanobis Distance, and Biplot Analysis. Supervised by SISWADI and N. K.
KUTHA ARDANA.
The classification of a new object into a group is expected to be solved with
minimum error. Fisher discriminant analysis, Mahalanobis distance (either with
separate or pooled covariance matrix), and biplot analysis are used for
classification. The data being used are the Iris and the generated data for
simulation. Mahalanobis distance with separate covariance matrix gives the
minimum classification error. However, if the classification of a new object into a
group is not only based on the minimum classification error but also based on the
visualization of the data, Fisher discriminant analysis gives the best result.
Keywords: Fisher
classification error

discriminant

analysis,


biplot,

Mahalanobis

distance,

KLASIFIKASI DENGAN ANALISIS DISKRIMINAN FISHER,
JARAK MAHALANOBIS, DAN ANALISIS BIPLOT

EVY MUFLIKHAH YUNI

Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Matematika
pada
Departemen Matematika

DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR

BOGOR
2013

Judul Skripsi: Klasifikasi dengan Analisis Diskriminan Fisher, Jarak Mahalanobis,
dan Analisis Biplot
Nama
: Evy Muflikhah Yuni
NIM
: G54090018

Disetujui oleh

Prof Dr Ir Siswadi, MSc
Pembimbing I

Ir N. K. Kutha Ardana, MSc
Pembimbing II

Diketahui oleh


Dr Toni Bakhtiar, MSc
Ketua Departemen

Tanggal Lulus:

Judul Skripsi: Klasifikasi dengan Analisis Diskriminan Fisher, J arak Mahalanobis,
dan Analisis Biplot
: Evy Muflikhah Yuni
Nama
: 054090018
NIM

Disetujui oleh

Ir N. K. Kutha Ardana, MSc
Pembimbing II

Prof Dr Ir Siswadi. MSc
Pembimbing I


セ]Z[NM

Tanggal Lulus:

3 1 DEC 2013

, a Departemen

PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Judul karya
ilmiah ini adalah Klasifikasi dengan Analisis Diskriminan Fisher, Jarak
Mahalanobis, dan Analisis Biplot.
Terima kasih penulis ucapkan kepada Bapak Prof Dr Ir Siswadi, MSc selaku
dosen pembimbing I dan Bapak Ir Ngakan Komang Kutha Ardana, MSc selaku
dosen pembimbing II atas segala ilmu, motivasi, dan bantuannya selama penulisan
skripsi ini, serta Bapak Dr Ir Hadi Sumarno, MS yang telah banyak memberi
saran. Ungkapan terima kasih juga disampaikan kepada Bapak, Mama, Retry,
Syai, Mbah Wakijan (Alm), Mbah Rakidah, dan seluruh keluarga atas segala doa,
kesabaran, dukungan, kepercayaan, dan kasih sayangnya. Penulis juga ingin

mengucapkan terima kasih kepada seluruh dosen, tenaga kependidikan, semua
teman-teman Math 46 khususnya Fitria, Dedew, Randita, Nur Lasmini, Nurul,
Fenny yang sudah menjadi sahabat yang baik dan banyak membantu dalam proses
belajar, Nia yang sudah menjadi teman seperjuangan yang baik dan banyak
membantu dalam menyelesaikan skripsi, kakak-kakak Math 45 khususnya Kak
Devita dan Kak Rika Putra yang sudah membantu dalam menyelesaikan skripsi,
Math 47, teman-teman Wisma Shinta, serta teman-teman di Institut Pertanian
Bogor.
Semoga karya ilmiah ini bermanfaat.

Bogor, Desember 2013
Evy Muflikhah Yuni

DAFTAR ISI
DAFTAR TABEL

vi

DAFTAR GAMBAR


vi

DAFTAR LAMPIRAN

vi

PENDAHULUAN

1

Latar Belakang

1

Tujuan

2

TINJAUAN ANALISIS


2

METODE PENELITIAN

7

Sumber Data

7

Prosedur Analisis Data

8

HASIL DAN PEMBAHASAN

10

Eksplorasi Data


10

Analisis Diskriminan Fisher

12

Jarak Mahalanobis

14

1 Jarak Mahalanobis dengan Matriks Koragam Terpisah

14

2 Jarak Mahalanobis dengan Matriks Koragam Gabungan

15

Analisis Biplot
SIMPULAN DAN SARAN


15
17

Simpulan

17

Saran

17

DAFTAR PUSTAKA

18

LAMPIRAN

19

RIWAYAT HIDUP

25

DAFTAR TABEL
1
2
3
4
5
6
7
8
9
10
11

Format data untuk analisis diskriminan
Tabel klasifikasi kelompok
Rataan data tanaman Iris
Matriks koragam data tanaman Iris setosa
Matriks koragam data tanaman Iris versicolor
Matriks koragam data tanaman Iris virginica
Matriks koragam gabungan kelompok data tanaman Iris
Koefisien kanonik fungsi diskriminan
Nilai sentroid fungsi diskriminan
Hasil pengklasifikasian kelompok dengan analisis diskriminan Fisher
Hasil pengklasifikasian kelompok menggunakan jarak Mahalanobis
dengan matriks koragam terpisah
12 Hasil pengklasifikasian kelompok menggunakan jarak Mahalanobis
dengan matriks koragam gabungan
13 Hasil pengklasifikasian kelompok dengan analisis biplot

2
9
10
11
11
11
11
13
13
14
14
15
16

DAFTAR GAMBAR
1 Plot pencar data tanaman Iris dengan panjang sepal (sumbu-x) dan lebar
sepal (sumbu-y)
2 Plot pencar data tanaman Iris dengan panjang sepal (sumbu-x) dan
panjang petal (sumbu-y)
3 Plot pencar data tanaman Iris dengan panjang sepal (sumbu-x) dan
lebar petal (sumbu-y)
4 Plot pencar data tanaman Iris dengan lebar sepal (sumbu-x) dan
panjang petal (sumbu-y)
5 Plot pencar data tanaman Iris dengan lebar sepal (sumbu-x) dan lebar
petal (sumbu-y)
6 Plot pencar data tanaman Iris dengan panjang petal (sumbu-x) dan lebar
petal (sumbu-y)
7 Hasil pengklasifikasian menggunakan dua fungsi diskriminan dari data
tanaman Iris
8 Biplot dengan data asal tanaman Iris
9 Hasil pengklasifikasian menggunakan biplot dengan jarak Euclid

11
11
12
12
12
12
13
16
16

DAFTAR LAMPIRAN
1 Data tanaman Iris
2 Data bangkitan untuk simulasi

19
21

PENDAHULUAN
Latar Belakang
Pada ilmu statistika, terdapat suatu analisis yang membahas masalah
pengklasifikasian suatu objek baru ke dalam suatu kelompok. Dalam
mengklasifikasikan suatu objek baru tersebut diperlukan beberapa peubah penciri
yang dapat membedakan antara satu kelompok dengan kelompok lainnya. Pada
umumnya pengklasifikasian suatu objek baru ke dalam suatu kelompok sering
terjadi salah klasifikasi (classification error) karena suatu objek baru yang
seharusnya masuk ke dalam kelompok tersebut diklasifikasikan ke dalam
kelompok lainnya, sehingga diperlukan suatu analisis guna meminimumkan salah
klasifikasi. Masalah pengklasifikasian suatu objek baru tersebut dapat diselesaikan
antara lain dengan analisis diskriminan, jarak Mahalanobis (dengan menggunakan
matriks koragam terpisah dan matriks koragam gabungan), serta analisis biplot.
Analisis diskriminan merupakan teknik statistika yang digunakan untuk
memisahkan suatu objek dan mengalokasikan objek baru ke dalam suatu
kelompok yang telah didefinisikan sebelumnya (Johnson dan Wichern 2007).
Tujuan dari analisis diskriminan ialah mendapatkan fungsi diskriminan yang
digunakan untuk memisahkan kelompok yang dapat digambarkan secara grafik
pada dimensi tiga atau lebih rendah dan dari fungsi diskriminan tersebut dapat
juga digunakan untuk mengklasifikasikan objek baru ke dalam kelompok yang
sudah didefinisikan sebelumnya (Johnson dan Wichern 2007).
Fungsi diskriminan merupakan fungsi atau kombinasi linear peubah-peubah
asal yang akan menghasilkan cara terbaik dalam pemisahan kelompok (Rencher
2002). Fungsi ini memberikan nilai sedekat mungkin bagi objek-objek dalam
kelompok yang sama dan sejauh mungkin bagi objek-objek antarkelompok.
Metode fungsi diskriminan pada awalnya diperkenalkan oleh Ronald A. Fisher
pada tahun 1936, sehingga fungsi diskriminan yang terbentuk itu sering pula
disebut sebagai fungsi diskriminan linear Fisher. Selain menggunakan analisis
diskriminan Fisher, jarak Mahalanobis dapat pula digunakan untuk
mengklasifikasikan suatu objek baru ke dalam suatu kelompok dengan cara yang
paling sederhana yaitu menghitung jarak terdekat dari objek tersebut dengan
vektor rataan setiap kelompok.
Seperti halnya analisis diskriminan Fisher dan jarak Mahalanobis, analisis
biplot dapat pula digunakan untuk mengklasifikasikan suatu objek baru ke dalam
suatu kelompok. Analisis biplot pertama kali diperkenalkan oleh Gabriel pada
tahun 1971. Analisis biplot merupakan salah satu teknik peubah ganda yang
antara lain dapat memberikan gambaran secara grafik dalam ruang berdimensi
rendah dua (atau tiga) tentang kedekatan antarobjek, keragaman peubah, korelasi
antarpeubah, serta keterkaitan peubah dengan objek. Pengklasifikasian suatu
objek baru ke dalam suatu kelompok dengan analisis biplot dapat dilihat
berdasarkan kedekatan objek dengan rataan kelompok menggunakan jarak Euclid.
Dalam karya ilmiah ini akan dibahas masalah salah klasifikasi
menggunakan analisis diskriminan Fisher, jarak Mahalanobis (dengan
menggunakan matriks koragam terpisah dan matriks koragam gabungan), serta
analisis biplot.

2
Tujuan
1

2

Tujuan penulisan karya ilmiah ini ialah:
Mendapatkan gambaran salah klasifikasi suatu objek baru ke dalam suatu
kelompok menggunakan analisis diskriminan Fisher, jarak Mahalanobis
(dengan matriks koragam terpisah dan matriks koragam gabungan), dan
analisis biplot.
Membandingkan hasil salah klasifikasi dari empat analisis tersebut guna
diperoleh analisis terbaik yang menghasilkan salah klasifikasi minimum.

TINJAUAN ANALISIS
Analisis Diskriminan Fisher
Dalam Johnson dan Wichern (2007) dinyatakan bahwa tujuan utama analisis
diskriminan Fisher adalah membentuk fungsi diskriminan yang digunakan untuk
pemisahan kelompok dan juga digunakan untuk klasifikasi. Asumsi yang
digunakan yaitu g kelompok tidak perlu menyebar normal ganda, tetapi memunyai
berukuran p x p.
matriks koragam sama (homogen)
Andaikan ada n objek dari g kelompok dengan masing-masing ukuran
contoh n1, n2, …, ng, dan dari masing-masing objek diamati p peubah, seperti
diberikan dalam Tabel 1.
Tabel 1 Format data untuk analisis diskriminan
Objek
1
2
.
n1

X1
x11
x21
.
xn11

X2
x12
x22
.
xn12







Xp
x1p
x2p
.
xn1p

n1 + 1
n1 + 2
.
n1 + n2
.

xn1 + 11
xn1 + 21
.
xn1 + n21
.

xn1 + 12
xn1 + 22
.
xn1 + n22
.







xn1 + 1p
xn1 + 2p
.
xn1 + n2p
.

Kelompok 1

Kelompok 2


.
n

.
xn1

.
xn2



.
xnp

Kelompok g

Misalkan adalah objek amatan i untuk peubah j dengan i pada masingmasing kelompok k = 1, 2, …, g didefinisikan sebagai
adalah rataan dari peubah j dalam kelompok k, yaitu
banyaknya objek dari kelompok k dengan
keseluruhan dari peubah j untuk j = 1, 2, …, p yaitu

, dan

,

adalah

merupakan rataan
. Selanjutnya

3
diperoleh matriks jumlah kuadrat dan hasil kali data dalam kelompok W
, dengan
adalah matriks jumlah kuadrat dan hasil kali dalam
untuk j,j’ = 1, 2, …, p, dan
kelompok k, untuk k = 1, 2, …, g, yaitu
didefinisikan oleh:
(1)
Matriks jumlah kuadrat dan hasil kali antar kelompok dapat ditulis sebagai:
(2)

B

dan T = W + B.
Jika x merupakan vektor amatan suatu objek dan bila fungsi diskriminan
, maka yang akan dicari adalah vektor yang
yang terbentuk adalah
merupakan vektor koefisien dari fungsi diskriminan sehingga

(3)
bernilai maksimum, dengan kendala
.
yang akan dimaksimumkan merupakan rasio ragam antar
Fungsi
kelompok dengan ragam dalam kelompok. Vektor
diperoleh dengan
terhadap
dan menyamakannya dengan nol, sehingga
menurunkan
diperoleh

dengan menyederhanakan persamaan di atas diperoleh

Karena
ada

-

maka
sehingga

Jika W matriks tidak singular, maka

-

Dengan menyelesaikan persamaan

-

akan diperoleh nilai

eigen tidak nol
yang berpadanan dengan vektor eigen tidak nol yang bebas
linear, i = 1, 2, …, s, sehingga banyaknya nilai eigen tidak nol
tidak lebih dari
Fungsi diskriminan yang diperoleh dari contoh yaitu
merupakan kombinasi linear pertama,
merupakan kombinasi linear
kedua,
merupakan kombinasi linear ke-r, dengan
(Johnson dan
Wichern 2007).
Dalam Johnson dan Wichern (2007) dijelaskan bahwa untuk
mengklasifikasikan suatu objek baru hasil amatan dari p peubah acak ke dalam
salah satu kelompok, maka hal yang pertama dilakukan ialah memasukkan objek
ke dalam fungsi diskriminan yang terbentuk yang
baru

4
disebut skor diskriminan
kemudian dari skor diskriminan yang diperoleh
dibandingkan terhadap sentroid fungsi diskriminan masing-masing kelompok.
Objek
dialokasikan ke kelompok k untuk k = 1, 2, …, g dengan r fungsi
dengan mencari nilai minimum dari
diskriminan yang terbentuk yakni
persamaan
(4)
merupakan vektor ciri yang memaksimumkan persamaan (3),
dengan
merupakan sentroid fungsi diskriminan j
merupakan skor diskriminan j, dan
untuk kelompok k dengan

.

Jarak Mahalanobis
Jarak Mahalanobis dengan Matriks Koragam Terpisah
Andaikan ada g kelompok contoh acak dengan masing-masing berukuran n1,
n2, …, ng dengan p peubah yang diamati, X1, X2, …, Xp. Vektor rataan dari g
contoh tersebut
dapat dianggap sebagai dugaan vektor rataan
populasi. Andaikan pula dugaan matriks koragam kelompok k adalah Sk. Jarak
Mahalanobis suatu objek dapat dihitung terhadap g vektor rataan tersebut dan
dapat diklasifikasikan pada suatu kelompok yang terdekat terhadap vektor
rataannya (Siswadi dan Suharjo 1999). Jarak Mahalanobis antara suatu objek baru
terhadap vektor rataan kelompok k diduga oleh
-

Sehingga aturan klasifikasinya ialah objek

masuk

ke dalam ke kelompok k jika
(5)
Jarak Mahalanobis dengan Matriks Koragam Gabungan
Andaikan ada g kelompok contoh acak dengan masing-masing berukuran n1,
n2, …, ng dengan p peubah yang diamati, X1, X2, …, Xp. Vektor rataan dari g
contoh tersebut
dapat dianggap sebagai dugaan vektor rataan
populasi. Andaikan pula dugaan matriks koragam gabungan kelompok adalah Sgab
dengan

. Jarak Mahalanobis suatu objek

dapat dihitung terhadap g vektor rataan tersebut dan dapat diklasifikasikan pada
suatu kelompok yang terdekat terhadap vektor rataannya (Siswadi dan Suharjo
1999). Jarak Mahalanobis antara suatu objek
terhadap
-

Sehingga
vektor rataan kelompok k diduga oleh
aturan klasifikasinya ialah objek masuk ke dalam ke kelompok k jika
(6)

5
Analisis Biplot
Analisis biplot pertama kali diperkenalkan oleh Gabriel pada tahun 1971.
Analisis biplot merupakan salah satu teknik peubah ganda yang antara lain dapat
memberikan gambaran secara grafik tentang kedekatan antarobjek, keragaman
peubah, korelasi antarpeubah, serta keterkaitan peubah dengan objek dari matriks
X dalam suatu plot dengan menumpangtindihkan vektor-vektor dalam ruang
berdimensi rendah, biasanya dua atau tiga yang mewakili vektor-vektor baris
matriks X (gambaran objek) dan vektor-vektor kolom matriks X ( gambaran
peubah). Informasi yang dapat diperoleh dari analisis biplot, antara lain:
1 Kedekatan antarobjek.
Dua objek yang memiliki karakteristik relatif sama akan digambarkan sebagai
dua titik yang posisinya saling berdekatan.
2 Keragaman peubah.
Peubah dengan keragaman kecil digambarkan dengan vektor yang pendek,
sedangkan peubah dengan keragaman besar digambarkan dengan vektor yang
panjang.
3 Korelasi antarpeubah.
Peubah digambarkan sebagai vektor. Jika sudut antara dua peubah lancip
maka korelasinya positif. Jika sudut antara dua peubah tumpul maka
korelasinya negatif. Sedangkan jika sudut antara dua peubah siku-siku maka
tidak saling berkorelasi.
4 Keterkaitan peubah dengan objek.
Karakteristik suatu objek dapat dilihat dari posisi relatifnya terhadap peubah.
Jika objek letaknya searah dengan arah vektor peubah maka objek tersebut
nilainya di atas rataan, jika berlawanan arah maka nilainya di bawah rataan,
dan jika hampir di tengah-tengah maka nilainya mendekati rataan.
Analisis biplot dikembangkan atas dasar Dekomposisi Nilai Singular (DNS)
atau Singular Value Decomposition (SVD). Misalkan nXp* adalah matriks data
dikoreksi terhadap
asal dengan n objek dan p peubah. Selanjutnya matriks
rataannya sehingga diperoleh matriks X,
(7)
dengan 1 adalah vektor berukuran n x 1 yang semua elemennya bernilai 1.
Matriks koragam
yang diperoleh dari matriks X adalah
(8)
dan matriks korelasi

= (rij)
-

dengan

-

(9)

-

Misalkan matriks X = [x1, x2, …, xn]’, maka jarak Euclid antara objek ke-i
dan ke-j dapat didefinisikan sebagai
(10)

6
Jarak Mahalanobis antara objek ke-i dan ke-j adalah
-

Matriks X berpangkat

(11)

dapat diuraikan dengan SVD menjadi:
nXp = nUr Lr Ap’

(12)

dengan U dan A yang merupakan matriks-matriks ortonormal kolom, sehingga
Matriks U adalah matriks yang kolom-kolomnya merupakan
vektor eigen-vektor eigen yang berpadanan dengan nilai eigen-nilai eigen positif
dari matriks

yaitu U

L adalah matriks diagonal yang

elemen diagonal utamanya adalah akar dari nilai eigen-nilai eigen positif matriks
atau
,
yaitu
L
dengan
dan
disebut nilai singular dari matriks X, dan A
adalah matriks yang kolom-kolomnya terdiri dari vektor eigen yang bepadanan
dengan nilai eigen positif dari matriks
yaitu A
Dalam Jolliffe (2002), persamaan (12) dapat diuraikan menjadi
(13)
dengan mendefinisikan

dan

-

maka persamaan (13) menjadi
(14)

X

Dengan demikian setiap elemen ke-(i,j) unsur matriks X dapat dinyatakan
sebagai
. Vektor merepresentasikan objek ke-i matriks X , dan vektor
merepresentasikan peubah ke-j matriks X. Jika X berpangkat dua maka baris
dan vektor kolom dapat digambarkan dalam ruang berdimensi dua. Namun,
apabila matriks X berpangkat lebih dari dua maka dapat didekati dengan matriks
sebagai

pendekatan

terbaik

bagi

nXp

maka


menjadi minimum, dengan
merupakan notasi
dari norma Frobenius dalam teorema Eckart - Young (Aitchison dan Greenacre
dengan
dan
masing-masing
2001), sehingga dapat ditulis
mengandung dua unsur pertama vektor dan , sehingga dengan matriks X
dapat disajikan dalam ruang berdimensi dua.
Pengambilan nilai tertentu dapat berimplikasi penting dalam interpretasi
biplot. Nilai yang digunakan merupakan nilai sebarang dari
a Jika
maka G = U dan H = AL, akibatnya:
X’X = (GH’)’(GH’)
= HG’GH’
= HU’UH’
= HH’,
sehingga diperoleh:
dengan adalah koragam peubah ke-i dan ke-j.

7
dengan
artinya panjang vektor yang
menggambarkan keragaman peubah ke-i.
Korelasi antara peubah ke-i dan ke-j dijelaskan oleh kosinus sudut antara
dan (misal : ), yaitu:

Jika X berpangkat p maka
artinya kuadrat jarak Mahalanobis antara dan sebanding dengan kuadrat
jarak Euclid antara
dan , dengan S adalah matriks koragam yang
diperoleh dari X.

b

Jika
maka G = UL dan H = A, akibatnya
XX’ = (GH’)(GH’)’
= GH’HG’
= GA’AG’
= GG’,
sehingga diperoleh:
artinya kuadrat jarak Euclid antara
dan sama dengan kuadrat jarak Euclid antara dan
Posisi
dalam plot akan sama dengan posisi objek ke-i dengan
menggunakan r komponen utama.
Vektor kolom sama dengan vektor yang merupakan koefisien untuk
komponen utama ke-j.

METODE PENELITIAN
Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder sebagai data
asal yang diperoleh dari buku Johnson dan Wichern (2007) dan data simulasi yang
diperoleh dari hasil membangkitkan data yang menyebar normal ganda. Data
sekunder tersebut merupakan data populasi tanaman Iris dengan 3 kelompok
masing-masing terdiri atas 50 objek yaitu Iris setosa, Iris versicolor, dan Iris
virginica dengan 4 peubah yang sama pada masing-masing kelompok yaitu
panjang sepal (X1), lebar sepal (X2), panjang petal (X3), dan lebar petal (X4).
Sedangkan data simulasi diperoleh dengan membangkitkan data menyebar normal
ganda yang banyaknya kelompok dan peubah sama dengan data asal tanaman Iris.
dan
Pembangkitan data tersebut diperoleh dengan mengacu pada rataan
matriks koragam (Sk) masing-masing kelompok yang dihasilkan dari data tanaman
Iris. Data tanaman Iris dan data hasil bangkitan disajikan pada Lampiran 1 dan
Lampiran 2.

8
Prosedur Analisis Data
1

Langkah-langkah dalam penelitian ini ialah:
Mengeksplorasi data
a Data asal
Data asal merupakan data sekunder dari data tanaman Iris yang digunakan
untuk mencari rataan
dan matriks koragam (Sk) masing-masing
kelompok, matriks koragam gabungan (Sgab), fungsi diskriminan, sentroid
fungsi diskriminan yang terbentuk pada masing-masing kelompok, serta
gambaran plot pencar dari data tanaman Iris.
b Data simulasi
Langkah-langkah membangkitkan data untuk data simulasi ialah:
Bangkitkan 100 data Z =
~ N4(0,I) yang masing-masing
diperoleh dari Z1, Z2, Z3, Z4
N(0,1), sehingga diperoleh data
sebanyak 400 dari peubah acak normal baku.
Gunakan nilai matriks koragam
masing-masing kelompok dari data
tanaman Iris yang menjadi acuan untuk mendapatkan Dekomposisi
dengan

Spektrum
Tentukan

2

dengan
mencari
nilai
yang merupakan matriks
koragam dan rataan kelompok data tanaman Iris untuk k = 1, 2, 3.
Membuat aturan klasifikasi dari analisis diskriminan Fisher, jarak
Mahalanobis dengan matriks koragam terpisah dan matriks koragam gabungan,
serta analisis biplot.
a Analisis Diskriminan Fisher
Klasifikasi dilakukan dengan memasukkan objek baru
dari data simulasi ke dalam fungsi diskriminan
yang terbentuk yang disebut skor diskriminan
kemudian dari skor
diskriminan yang diperoleh bandingkan terhadap sentroid fungsi
diskriminan masing-masing kelompok. Objek
masuk ke dalam
kelompok k dengan fungsi diskriminan yang terbentuk adalah r = 2 jika
diperoleh nilai minimum dari persamaan
b

data

dan

simulasi

Jarak Mahalanobis
i. Jarak Mahalanobis dengan Matriks Koragam Terpisah (Sk)
Gunakan matriks koragam (Sk) untuk mencari invers matriks koragam
pada masing-masing kelompok dari data tanaman Iris.
Klasifikasi dilakukan dengan menghitung nilai dari jarak objek baru
dari data simulasi dengan rataan
dan
-

invers matriks koragam
rumus
kelompok k jika

pada masing-masing kelompok dengan

-

dan objek
.

masuk ke dalam

9
ii. Jarak Mahalanobis dengan Matriks Koragam Gabungan (Sgab)
Gunakan matriks koragam gabungan (Sgab) untuk mencari invers
dari data tanaman Iris.
matriks koragam gabungan
Klasifikasi dilakukan dengan menghitung nilai dari jarak objek baru
dari data simulasi dengan rataan
dan
invers

matriks

koragam
-

c

-

gabungan
dan objek

dengan

rumus

masuk ke dalam kelompok

k jika
Analisis Biplot
Misalkan 150Xa4 adalah matriks data asal tanaman Iris. Selanjutnya
matriks 150Xa4 dikoreksi terhadap rataannya sehingga diperoleh matriks X,
X = 150Xa4 15011 ( 1’150Xa4).


Pilih nilai

diperoleh nilai

ambil 2 komponen pertama sehingga nilai G =
. Karena data tanaman Iris terdiri atas 3 kelompok
maka nilai rataan yang diperoleh dalam bentuk dua dimensi pada
dengan k = 1, 2, 3.
masing-masing kelompok ialah
Menentukan matriks data baru dari data simulasi yang terkoreksi
terhadap rataan dari data tanaman Iris, yaitu
= 300Xs4 30011 (
1’150Xa4).
Ambil
2
komponen
pertama
dari
sehingga
nilai
Klasifikasi dilakukan dengan menghitung nilai dari jarak objek baru
menggunakan 2 komponen utama dari data simulasi
terhadap rataan data tanaman Iris kelompok 1
kelompok 2
yang
dirumuskan
menjadi
dan
kelompok
3
. Objek
3

masuk ke dalam kelompok k jika

Mengevaluasi hasil klasifikasi.
Evaluasi hasil klasifikasi dapat diperoleh dengan menghitung jumlah
salah klasifikasi dari semua kelompok seperti yang diberikan pada Tabel 2.

Kelompok asal

Tabel 2 Tabel klasifikasi kelompok
Kelompok prediksi
n11
n21
n31
n.1

n12
n22
n32
n.2

n13
n23
n33
n.3

Total
n1.
n2.
n3.
n = n..

, dengan
= banyaknya anggota
Salah klasifikasi
kelompok k yang diklasifikasikan menjadi anggota kelompok j.

10
4

Simpulan perbandingan hasil salah klasifikasi dari analisis diskriminan Fisher,
jarak Mahalanobis dengan matriks koragam terpisah dan matriks koragam
gabungan, serta analisis biplot.

HASIL DAN PEMBAHASAN
Eksplorasi Data
Data yang digunakan dalam penelitian ini adalah data sekunder sebagai data
asal yang diperoleh dari buku Johnson dan Wichern (2007) yakni data tanaman
Iris dan data simulasi hasil pembangkitan data menyebar normal ganda yang
diberikan dalam Lampiran 1 dan Lampiran 2. Data tanaman Iris digunakan untuk
mencari rataan
dan matriks koragam (Sk) pada masing-masing kelompok,
matriks koragam gabungan (Sgab), serta fungsi diskriminan dan nilai sentroid dari
fungsi diskriminan yang terbentuk pada masing-masing kelompok. Matriks
koragam (Sk) yang diperoleh digunakan untuk mencari invers matriks koragam
masing-masing kelompok dan dari matriks koragam gabungan kelompok
Sedangkan data
(Sgab) dapat diperoleh invers matriks koragam gabungan
bangkitan digunakan untuk simulasi guna menggambarkan hasil ketepatan
pengklasifikasian suatu objek baru ke dalam suatu kelompok yang sudah
didefinisikan sebelumnya dari data tanaman Iris. Adapun hasil eksplorasi data
tanaman Iris disajikan pada Tabel 3 sampai dengan Tabel 7.
Tabel 3 Rataan data tanaman Iris
Kelompok
Peubah
Rataan
Panjang sepal
5.006
Lebar sepal
3.428
Iris setosa
Panjang petal
1.462
Lebar petal
0.246
Panjang sepal
5.936
Lebar sepal
Iris
2.770
versicolor
Panjang petal
4.260
Lebar petal
1.326
Panjang sepal
6.588
Lebar sepal
2.974
Iris virginica
Panjang petal
5.552
Lebar petal
2.026

11
Tabel 4 Matriks koragam data tanaman Iris setosa
Panjang sepal Lebar sepal Panjang petal Lebar petal
Panjang sepal
0.124
0.099
0.016
0.010
Lebar sepal
0.099
0.144
0.012
0.009
Panjang petal
0.016
0.012
0.030
0.006
Lebar petal
0.010
0.009
0.006
0.011
Tabel 5 Matriks koragam data tanaman Iris versicolor
Panjang sepal Lebar sepal Panjang petal Lebar petal
Panjang sepal
0.266
0.085
0.183
0.056
Lebar sepal
0.085
0.098
0.083
0.041
Panjang petal
0.183
0.083
0.221
0.073
Lebar petal
0.056
0.041
0.073
0.039
Tabel 6 Matriks koragam data tanaman Iris virginica
Panjang sepal Lebar sepal Panjang petal Lebar petal
Panjang sepal
0.404
0.094
0.303
0.049
Lebar sepal
0.094
0.104
0.071
0.048
Panjang petal
0.303
0.071
0.305
0.049
Lebar petal
0.049
0.048
0.049
0.075
Tabel 7 Matriks koragam gabungan kelompok data tanaman Iris
Panjang sepal Lebar sepal Panjang petal Lebar petal
Panjang sepal
0.265
0.093
0.168
0.038
Lebar sepal
0.093
0.115
0.055
0.033
Panjang petal
0.168
0.055
0.185
0.043
Lebar petal
0.038
0.033
0.043
0.042
Selain hasil yang diperoleh di atas, data tanaman Iris juga dapat
digambarkan dalam bentuk plot pencar. Hasil plot pencar dari data tanaman Iris
disajikan pada Gambar 1 sampai dengan Gambar 6.

Gambar 1

Plot pencar data tanaman Gambar 2 Plot pencar data tanaman
Iris dengan panjang sepal
Iris dengan panjang sepal
(sumbu-x) dan lebar sepal
(sumbu-x) dan panjang
(sumbu-y)
petal (sumbu-y)

12

Gambar 3

Plot pencar data tanaman Gambar 4 Plot pencar data tanaman
Iris dengan panjang sepal
Iris dengan lebar sepal
(sumbu-x) dan lebar petal
(sumbu-x) dan panjang
(sumbu-y)
petal (sumbu-y)

Gambar 5

Plot pencar data tanaman Gambar 6 Plot pencar data tanaman
Iris dengan lebar sepal
Iris dengan panjang petal
(sumbu-x) dan lebar petal
(sumbu-x) dan lebar petal
(sumbu-y)
(sumbu-y)

Secara umum hasil plot pencar dari Gambar 1 sampai dengan Gambar 6
dapat memberi gambaran pemisahan antara kelompok Iris setosa, Iris versicolor,
dan Iris virginica. Namun, pada Gambar 1 terlihat antara kelompok Iris versicolor
dan Iris virginica banyak data yang saling tumpangtindih sehingga terlihat
bergabung membentuk satu kelompok.

Analisis Diskriminan Fisher
Klasifikasi objek baru menggunakan analisis diskriminan Fisher dapat
dilakukan dengan mencari fungsi diskriminan Fisher dan sentroid fungsi
diskriminan masing-masing kelompok dari tanaman Iris yang disajikan pada
Tabel 8 dan Tabel 9.

13

Tabel 8 Koefisien kanonik fungsi diskriminan
Fungsi
Peubah
1
2
Panjang sepal
-0.829
0.024
Lebar sepal
-1.534
2.165
Panjang petal
2.201
-0.932
Lebar petal
2.810
2.389
(Konstanta)
-2.105
-6.661
Tabel 8 menunjukkan koefisien angka penyusun fungsi diskriminan yaitu:
i. Fungsi diskriminan 1 (lihat pada kolom koefisien fungsi 1)
y1 = 2.105 0.829 x1 1.534 x2 + 2.201 x3 + 2.810 x4
ii. Fungsi diskriminan 2 (lihat pada kolom koefisien fungsi 2)
y2 = 6.661 + 0.024 x1 + 2.165 x2 0.932 x3 + 2.839 x4
Tabel 9 Nilai sentroid fungsi diskriminan
Fungsi
Kelompok
1
2
-7.608
Iris setosa
0.215
Iris versicolor
1.825
-0.728
Iris virginica
5.783
0.513
Sentroid adalah rataan fungsi skor y dari setiap objek yang ada dalam
kelompok. Kegunaan sentroid untuk mengetahui bagaimana penyebaran data dari
setiap kelompok dan kedekatan antar sentroid dari masing-masing kelompok.
Nilai sentroid fungsi diskriminan disajikan pada Tabel 9 terlihat bahwa titik
sentroid untuk kelompok 1 adalah -7.608 pada fungsi 1 dan 0.215 pada fungsi 2,
titik sentroid untuk kelompok 2 adalah 1.825 pada fungsi 1 dan -0.728 pada fungsi
2, titik sentroid untuk kelompok 3 adalah 5.783 pada fungsi 1 dan 0.513 pada
fungsi 2.
Hasil klasifikasi kelompok pada analisis diskriminan Fisher dapat
digambarkan dalam ruang dimensi dua dengan menggunakan dua fungsi
diskriminan dari data tanaman Iris yang disajikan pada Gambar 7.
Keterangan :
Sentroid Iris setosa
Sentroid Iris versicolor
Sentroid Iris virginica

Gambar 7 Hasil klasifikasi menggunakan dua fungsi diskriminan dari data
tanaman Iris

14
Gambar 7 memberikan informasi gambaran secara visual dari Tabel 10
tentang hasil klasifikasi objek baru ke dalam kelompok Iris setosa, kelompok Iris
versicolor, dan kelompok Iris virginica dengan menggunakan dua fungsi
diskriminan. Klasifikasi objek baru ke dalam kelompok Iris setosa terlihat benar
semua karena terpisah dengan jelas dari kelompok Iris versicolor dan Iris
virginica. Sedangkan untuk klasifikasi objek baru ke dalam kelompok Iris
versicolor dan kelompok Iris virginica terlihat adanya salah klasifikasi, karena
ada data yang saling tumpangtindih dan sentroid antara kedua kelompok tersebut
saling berdekatan sehingga memungkinkan terjadinya salah klasifikasi di antara
kedua kelompok tersebut. Hasil numerik klasifikasi objek baru
dari data simulasi ke dalam suatu kelompok menggunakan
analisis diskriminan Fisher disajikan pada Tabel 10.
Tabel 10 Hasil klasifikasi kelompok dengan analisis diskriminan Fisher
Kelompok prediksi
Kelompok
Total
asal
Iris setosa Iris versicolor Iris virginica
100
0
0
100
Iris setosa
0
96
4
100
Iris versicolor
0
4
96
100
Iris virginica
Tabel 10 memberikan informasi berapa banyak objek dengan salah
klasifikasi pada masing-masing kelompok. Kelompok Iris setosa yang terdiri atas
100 objek baru dapat diklasifikasikan benar semua, sementara pada kelompok Iris
versicolor terjadi salah klasifikasi sebanyak 4 objek yang diklasifikasikan ke
kelompok Iris virginica, dan sebanyak 4 objek dari kelompok Iris virginica terjadi
salah klasifikasi yang diklasifikasikan ke kelompok Iris versicolor. Dari hasil
klasifikasi tersebut, diperoleh hasil salah klasifikasi sebesar 2.67% atau ketepatan
klasifikasi kelompok sebesar 97.33%.

Jarak Mahalanobis
Jarak Mahalanobis dengan Matriks Koragam Terpisah
Klasifikasi objek baru
dari data simulasi ke dalam
suatu kelompok menggunakan jarak Mahalanobis dengan rataan masing-masing
kelompok dan matriks koragam terpisah dari data tanaman Iris diperoleh hasil
yang disajikan pada Tabel 11.
Tabel 11

Hasil klasifikasi kelompok menggunakan jarak Mahalanobis
dengan matriks koragam terpisah
Kelompok prediksi
Kelompok
Total
asal
Iris setosa Iris versicolor Iris virginica
100
0
0
100
Iris setosa
0
97
3
100
Iris versicolor
0
2
98
100
Iris virginica

Tabel 11 memberikan informasi berapa banyak objek dengan salah
klasifikasi pada masing-masing kelompok. Kelompok Iris setosa yang terdiri atas
100 objek baru dapat diklasifikasikan benar semua, sementara pada kelompok Iris

15
versicolor terjadi salah klasifikasi sebanyak 3 objek yang diklasifikasikan ke
kelompok Iris virginica, dan sebanyak 2 objek dari kelompok Iris virginica terjadi
salah klasifikasi yang diklasifikasikan ke kelompok Iris versicolor. Dari hasil
klasifikasi tersebut, diperoleh hasil salah klasifikasi sebesar 1.67% atau ketepatan
klasifikasi kelompok sebesar 98.33%.
Jarak Mahalanobis dengan Matriks Koragam Gabungan
Klasifikasi objek baru
dari data simulasi ke dalam
suatu kelompok menggunakan jarak Mahalanobis dengan rataan masing-masing
kelompok dan matriks koragam gabungan dari data tanaman Iris diperoleh hasil
yang disajikan pada Tabel 12.
Tabel 12 Hasil klasifikasi kelompok menggunakan jarak Mahalanobis dengan
matriks koragam gabungan
Kelompok prediksi
Kelompok asal
Total
Iris setosa Iris versicolor Iris virginica
100
0
0
100
Iris setosa
0
96
4
100
Iris versicolor
0
3
97
100
Iris virginica
Tabel 12 memberikan informasi berapa banyak objek dengan salah
klasifikasi pada masing-masing kelompok. Kelompok Iris setosa yang terdiri atas
100 objek baru dapat diklasifikasikan benar semua, sementara pada kelompok Iris
versicolor terjadi salah klasifikasi sebanyak 4 objek yang diklasifikasikan ke
kelompok Iris virginica, dan sebanyak 3 objek dari kelompok Iris virginica terjadi
salah klasifikasi yang diklasifikasikan ke kelompok Iris versicolor. Dari hasil
klasifikasi tersebut, diperoleh hasil salah klasifikasi sebesar 2.33% atau ketepatan
klasifikasi kelompok sebesar 97.67%.

Analisis Biplot
Analisis biplot diperoleh dengan menggunakan paket Biplot Ver. 4.1.0 dan
memilih
(Ardana 2011) dengan software Mathematica 7.0 untuk data asal
tanaman Iris dengan GF = 95.81% yang disajikan pada Gambar 8 dan hasil
klasifikasi objek baru
dengan dua komponen utama dari data
simulasi ke dalam suatu kelompok menggunakan jarak Euclid disajikan pada
Gambar 9.

16

Gambar 8 Biplot dengan data asal tanaman Iris
Keterangan:
Sentroid Iris setosa
Sentroid Iris versicolor
Sentroid virginica

Gambar 9 Hasil klasifikasi menggunakan biplot dengan jarak Euclid
Gambar 9 memberikan informasi gambaran secara visual dari Tabel 13
tentang hasil klasifikasi objek baru ke dalam kelompok Iris setosa, kelompok Iris
versicolor, dan kelompok Iris virginica. Klasifikasi objek baru ke dalam
kelompok Iris setosa terlihat terpisah dengan kelompok Iris versicolor dan
kelompok Iris virginica. Sedangkan hasil klasifikasi objek baru ke dalam
kelompok Iris versicolor dan kelompok Iris virginica terlihat ada beberapa objek
yang saling tumpangtindih dan sentroid antara kedua kelompok tersebut saling
berdekatan dengan objek dari kelompok lainnya sehingga memungkinkan
terjadinya salah klasifikasi di antara kedua kelompok tersebut.
dengan dua komponen
Hasil numerik klasifikasi objek baru
utama dari data simulasi ke dalam suatu kelompok menggunakan jarak Euclid
dengan menghitung jarak terdekat dari objek baru tersebut terhadap rataan
masing-masing kelompok data tanaman Iris yang disajikan pada Tabel 13.
Tabel 13 Hasil klasifikasi kelompok dengan analisis biplot
Kelompok prediksi
Kelompok asal
Total
Iris setosa Iris versicolor Iris virginica
100
0
0
100
Iris setosa
0
67
33
100
Iris versicolor
0
24
76
100
Iris virginica

17
Terkait dengan salah klasifikasi kelompok, kelompok Iris setosa yang terdiri
atas 100 objek baru diklasifikasikan secara benar semua, sementara pada
kelompok Iris versicolor terjadi salah klasifikasi sebanyak 33 objek yang
diklasifikasikan ke kelompok Iris virginica dan sebanyak 24 objek dari kelompok
Iris virginica terjadi salah klasifikasi yang diklasifikasikan ke kelompok Iris
versicolor. Dari hasil klasifikasi tersebut, diperoleh hasil salah klasifikasi sebesar
19% atau ketepatan klasifikasi kelompok sebesar 81%. Hasil salah klasifikasi
yang diperoleh menggunakan analisis biplot nilainya lebih besar dibandingkan
dengan hasil salah klasifikasi dengan analisis diskriminan Fisher, jarak
Mahalanobis (dengan matriks koragam terpisah dan matriks koragam gabungan).
Hal ini dimungkinkan karena adanya reduksi dimensi pada analisis biplot yakni
dari ruang berdimensi empat ke dalam ruang berdimensi dua, sehingga
mengakibatkan adanya informasi yang hilang. Salah satu bentuk informasi yang
hilang yakni hasil salah klasifikasi objek baru ke dalam suatu kelompok yang
bernilai besar.

SIMPULAN DAN SARAN
Simpulan
Gambaran salah klasifikasi suatu objek baru ke dalam suatu kelompok
menggunakan analisis diskriminan Fisher, jarak Mahalanobis (dengan matriks
koragam terpisah dan matriks koragam gabungan), serta analisis biplot dapat
dilihat berdasarkan tabel klasifikasi kelompok. Salah klasifikasi menggunakan
analisis diskriminan Fisher sebesar 2.67%, jarak Mahalanobis dengan matriks
koragam terpisah sebesar 1.67%, jarak Mahalanobis dengan matriks koragam
gabungan sebesar 2.33%, dan analisis biplot sebesar 19%.
Berdasarkan hasil salah klasifikasi tersebut dapat disimpulkan bahwa untuk
mengklasifikasikan suatu objek baru ke dalam suatu kelompok yang sudah
didefinisikan sebelumnya menggunakan jarak Mahalanobis dengan matriks
koragam terpisah menghasilkan salah klasifikasi minimum. Namun, jika
klasifikasi suatu objek baru ke dalam suatu kelompok tidak hanya dilihat
berdasarkan salah klasifikasi yang bernilai minimum tetapi juga berdasarkan
visualisasi data, analisis diskriminan Fisher memberikan hasil terbaik.

Saran
Berdasarkan hasil karya ilmiah ini disarankan dalam mengklasifikasikan
suatu objek baru ke dalam suatu kelompok yang sudah didefinisikan sebelumnya
dengan menggunakan karakteristik data menyebar normal ganda sebaiknya
menggunakan jarak Mahalanobis dengan matriks koragam terpisah. Namun, jika
klasifikasi suatu objek baru ke dalam suatu kelompok tidak hanya dilihat
berdasarkan salah klasifikasi tetapi juga berdasarkan visualisasi data, sebaiknya
menggunakan analisis diskriminan Fisher. Selain itu, disarankan jika ingin
mendapatkan gambaran salah klasifikasi lainnya dapat ditelusuri dengan
menggunakan karakteristik data yang berbeda.

18

DAFTAR PUSTAKA
Aitchison J, Greenacre M. 2001. Biplot of Compositional Data. Applied Statistics.
51 : 375-392.
Ardana NKK. 2011. BiplotPack Ver.4.1.0 – A Mathematica Package for
Multivariate Data Visualization. Bogor: Departemen Matematika FMIPA IPB.
Gabriel KR. 1971. The Biplot Graphic Display of Matrices with Application to
Principal Component Analysis. Biometrika. 89: 423-436.
Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis. 6th
Edition. New Jersey: Prentice Hall.
Jolliffe IT. 2002. Principal Component Analysis. 2nd Edition. New York:
Springer-Verlag.
Rencher AC. 2002. Methods of Multivariate Analysis. 2nd Edition. New York:
Wiley.
Siswadi, Suharjo B. 1999. Analisis Eksplorasi Data Peubah Ganda. Bogor:
Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Lampiran 1 Data tanaman Iris

No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

Panjang
sepal
(X1)
5.1
4.9
4.7
4.6
5.0
5.4
4.6
5.0
4.4
4.9
5.4
4.8
4.8
4.3
5.8
5.7
5.4
5.1
5.7
5.1
5.4
5.1

π1 : Iris setosa
Lebar Panjang
sepal
petal
(X2)
(X3)
3.5
1.4
3.0
1.4
3.2
1.3
3.1
1.5
3.6
1.4
3.9
1.7
3.4
1.4
3.4
1.5
2.9
1.4
3.1
1.5
3.7
1.5
3.4
1.6
3.0
1.4
3.0
1.1
4.0
1.2
4.4
1.5
3.9
1.3
3.5
1.4
3.8
1.7
3.8
1.5
3.4
1.7
3.7
1.5

Lebar
petal
(X4)
0.2
0.2
0.2
0.2
0.2
0.4
0.3
0.2
0.2
0.1
0.2
0.2
0.1
0.1
0.2
0.4
0.4
0.3
0.3
0.3
0.2
0.4

Panjang
sepal
(X1)
7.0
6.4
6.9
5.5
6.5
5.7
6.3
4.9
6.6
5.2
5.0
5.9
6.0
6.1
5.6
6.7
5.6
5.8
6.2
5.6
5.9
6.1

π2 : Iris versicolor
Lebar Panjang
sepal
petal
(X2)
(X3)
3.2
4.7
3.2
4.5
3.1
4.9
2.3
4.0
2.8
4.6
2.8
4.5
3.3
4.7
2.4
3.3
2.9
4.6
2.7
3.9
2.0
3.5
3.0
4.2
2.2
4.0
2.9
4.7
2.9
3.6
3.1
4.4
3.0
4.5
2.7
4.1
2.2
4.5
2.5
3.9
3.2
4.8
2.8
4.0

Lebar
petal
(X4)
1.4
1.5
1.5
1.3
1.5
1.3
1.6
1.0
1.3
1.4
1.0
1.5
1.0
1.4
1.3
1.4
1.5
1.0
1.5
1.1
1.8
1.3

Panjang
sepal
(X1)
6.3
5.8
7.1
6.3
6.5
7.6
4.9
7.3
6.7
7.2
6.5
6.4
6.8
5.7
5.8
6.4
6.5
7.7
7.7
6.0
6.9
5.6

π3 : Iris virginica
Lebar
Panjang
sepal
petal
(X2)
(X3)
3.3
6.0
2.7
5.1
3.0
5.9
2.9
5.6
3.0
5.8
3.0
6.6
2.5
4.5
2.9
6.3
2.5
5.8
3.6
6.1
3.2
5.1
2.7
5.3
3.0
5.5
2.5
5.0
2.8
5.1
3.2
5.3
3.0
5.5
3.8
6.7
2.6
6.9
2.2
5.0
3.2
5.7
2.8
4.9

Lebar
petal
(X4)
2.5
1.9
2.1
1.8
2.2
2.1
1.7
1.8
1.8
2.5
2.0
1.9
2.1
2.0
2.4
2.3
1.8
2.2
2.3
1.5
2.3
2.0
19

2
20

23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

4.6
5.1
4.8
5.0
5.0
5.2
5.2
4.7
4.8
5.4
5.2
5.5
4.9
5.0
5.5
4.9
4.4
5.1
5.0
4.5
4.4
5.0
5.1
4.8
5.1
4.6
5.3
5.0

3.6
3.3
3.4
3.0
3.4
3.5
3.4
3.2
3.1
3.4
4.1
4.2
3.1
3.2
3.5
3.6
3.0
3.4
3.5
2.3
3.2
3.5
3.8
3.0
3.8
3.2
3.7
3.3

1.0
1.7
1.9
1.6
1.6
1.5
1.4
1.6
1.6
1.5
1.5
1.4
1.5
1.2
1.3
1.4
1.3
1.5
1.3
1.3
1.3
1.6
1.9
1.4
1.6
1.4
1.5
1.4

Sumber: Johnson dan Wichern (2007)

0.2
0.5
0.2
0.2
0.4
0.2
0.2
0.2
0.2
0.4
0.1
0.2
0.2
0.2
0.2
0.1
0.2
0.2
0.3
0.3
0.2
0.6
0.4
0.3
0.2
0.2
0.2
0.2

6.3
6.1
6.4
6.6
6.8
6.7
6.0
5.7
5.5
5.5
5.8
6.0
5.4
6.0
6.7
6.3
5.6
5.5
5.5
6.1
5.8
5.0
5.6
5.7
5.7
6.2
5.1
5.7

2.5
2.8
2.9
3.0
2.8
3.0
2.9
2.6
2.4
2.4
2.7
2.7
3.0
3.4
3.1
2.3
3.0
2.5
2.6
3.0
2.6
2.3
2.7
3.0
2.9
2.9
2.5
2.8

4.9
4.7
4.3
4.4
4.8
5.0
4.5
3.5
3.8
3.7
3.9
5.1
4.5
4.5
4.7
4.4
4.1
4.0
4.4
4.6
4.0
3.3
4.2
4.2
4.2
4.3
3.0
4.1

1.5
1.2
1.3
1.4
1.4
1.7
1.5
1.0
1.1
1.0
1.2
1.6
1.5
1.6
1.5
1.3
1.3
1.3
1.2
1.4
1.2
1.0
1.3
1.2
1.3
1.3
1.1
1.3

7.7
6.3
6.7
7.2
6.2
6.1
6.4
7.2
7.4
7.9
6.4
6.3
6.1
7.7
6.3
6.4
6.0
6.9
6.7
6.9
5.8
6.8
6.7
6.7
6.3
6.5
6.2
5.9

2.8
2.7
3.3
3.2
2.8
3.0
2.8
3.0
2.8
3.8
2.8
2.8
2.6
3.0
3.4
3.1
3.0
3.1
3.1
3.1
2.7
3.2
3.3
3.0
2.5
3.0
3.4
3.0

6.7
4.9
5.7
6.0
4.8
4.9
5.6
5.8
6.1
6.4
5.6
5.1
5.6
6.1
5.6
5.5
4.8
5.4
5.6
5.1
5.1
5.9
5.7
5.2
5.0
5.2
5.4
5.1

2.0
1.8
2.1
1.8
1.8
1.8
2.1
1.6
1.9
2.0
2.2
1.5
1.4
2.3
2.4
1.8
1.8
2.1
2.4
2.3
1.9
2.3
2.5
2.3
1.9
2.0
2.3
1.8

3

Lampiran 2 Data bangkitan untuk simulasi

No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

Panjang
sepal
(X11)
4.7
4.4
5.2
4.6
5.3
4.9
5.3
4.9
4.8
5.0
5.3
4.9
5.2
5.6
4.9
5.7
5.5
4.8
5.0
4.9
5.2
5.1

π1 : Iris setosa
Lebar Panjang
sepal
petal
(X12)
(X13)
3.3
1.4
3.0
1.5
3.6
1.4
3.6
1.4
3.5
1.7
3.2
1.4
3.8
1.1
3.4
1.6
3.5
1.1
3.5
1.4
3.6
1.7
3.2
1.4
3.9
1.4
3.5
1.3
3.4
1.7
3.5
1.3
4.0
1.6
3.4
1.2
3.5
1.4
3.4
1.4
3.7
1.6
3.4
1.7

Lebar
petal
(X14)
0.2
0.3
0.3
0.4
0.2
0.3
0.2
0.2
0.0
0.1
0.3
0.4
0.3
0.1
0.3
0.1
0.3
0.2
0.1
0.2
0.5
0.2

Panjang
sepal
(X21)
5.4
5.1
6.2
5.2
6.6
5.8
5.9
5.9
5.3
5.8
6.5
5.8
6.0
6.6
5.9
6.8
6.6
5.4
5.8
5.7
6.4
6.4

π2 : Iris versicolor
Lebar
Panjang
sepal
petal
(X22)
(X23)
2.7
4.0
2.5
4.0
2.9
4.3
3.0
4.0
2.9
4.9
2.6
4.1
2.8
3.5
2.8
4.5
2.6
3.3
2.7
4.0
3.0
4.8
2.6
4.2
3.2
4.2
2.6
4.1
2.9
4.7
2.6
4.0
3.2
4.7
2.7
3.6
2.7
4.1
2.7
4.0
3.1
4.9
2.8
4.9

Lebar
petal
(X24)
1.2
1.3
1.4
1.5
1.4
1.3
1.1
1.3
0.9
1.1
1.5
1.5
1.5
1.1
1.5
1.0
1.5
1.2
1.2
1.2
1.7
1.3

Panjang
sepal
(X31)
6.0
5.6
6.9
5.6
7.5
6.4
6.4
6.7
5.8
6.4
7.3
6.4
6.6
7.4
6.6
7.5
7.3
5.8
6.4
6.3
7.1
7.3

π3 : Iris virginica
Lebar
Panjang
sepal
petal
(X32)
(X33)
2.9
5.2
2.7
5.2
3.1
5.5
3.2
5.0
3.0
6.4
2.8
5.4
3.1
4.8
2.9
5.9
2.9
4.5
2.9
5.3
3.2
6.2
2.8
5.4
3.4
5.3
2.8
5.7
3.1
5.9
2.8
5.6
3.4
6.0
2.9
4.8
2.9
5.4
2.9
5.3
3.3
6.1
2.9
6.4

Lebar
petal
(X34)
1.9
2.1
2.2
2.4
2.0
2.1
1.8
1.8
1.5
1.7
2.1
2.3
2.3
1.6
2.2
1.6
2.2
1.9
1.7
1.9
2.6
1.8
21

4
22

23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

5.6
5.5
5.5
5.4
4.8
5.0
5.6
4.4
5.0
5.2
5.3
5.3
4.9
4.7
4.9
5.1
4.7
5.3
5.4
5.6
4.6
4.7
5.6
4.4
4.5
5.3
5.4
4.5

3.8
3.4
3.8
3.2
3.2
3.3
3.7
2.8
3.2
3.6
3.4
3.8
3.7
3.3
3.5
3.8
3.2
3.9
3.8
4.0
3.5
3.1
3.9
2.6
2.6
4.2
3.3
3.0

2.1
1.4
1.5
1.5
1.6
1.5
1.8
1.3
1.3
1.7
1.5
1.5
1.5
1.5
1.8
1.4
1.6
1.5
1.5
1.5
1.5
1.6
1.9
1.3
1.4
1.5
1.5
1.6

0.2
0.4
0.4
0.4
0.3
0.3
0.5
0.3
0.3
0.4
0.3
0.3
0.2
0.2
0.3
0.1
0.4
0.2
0.3
0.3
0.1
0.1
0.1
0.2
0.4
0.1
0.3
0.2

7.3
6.7
6.7
6.6
5.9
6.1
7.2
5.1
6.0
6.4
6.4
6.3
5.7
5.5
6.1
5.9
5.6
6.3
6.4
6.8
5.3
5.7
7.0
5.2
5.5
6.1
6.6
5.4

3.2
2.7
3.1
2.6
2.7
2.7
3.2
2.3
2.6
3.1
2.8
3.0
3.0
2.7
3.0
2.9
2.8
3.1
3.1
3.2
2.8
2.5
3.2
2.1
2.2
3.4
2.6
2.5

5.9
4.3
4.7
4.5
4.5
4.5
5.4
3.8
4.0
5.0
4.6
4.4
4.3
4.2
5.0
4.0
4.4
4.5
4.4
4.7
4.0
4.3
5.4
3.7
4.1
4.4
4.5
4.3

1.6
1.4
1.6
1.5
1.5
1.4
1.9
1.3
1.3
1.7
1.4
1.5
1.4
1.2
1.5
1.1
1.6
1.3
1.4
1.5
1.2
1.2
1.4
1.1
1.4
1.3
1.4
1.3

8.5
7.5
7.4
7.4
6.5
6.8
8.1
5.6
6.6
7.2
7.2
7.0
6.3
6.1
6.9
6.5
6.2
7.0
7.1
7.6
5.8
6.4
8.1
5.7
6.1
6.8
7.4
6.0

3.2
2.9
3.3
2.8
2.9
2.9
3.3
2.6
2.8
3.3
3.0
3.2
3.2
2.9
3.1
3.1
3.0
3.3
3.3
3.4
3.0
2.7
3.3
2.3
2.4
3.6
2.8
2.7

7.6
5.7
6.1
5.9
5.7
5.8
6.8
4.9
5.3
6.3
6.0
5.7
5.5
5.4
6.4
5.3
5.6
5.9
5.7
6.1
5.2
5.7
7.0
4.9
5.3
5.7
5.9
5.5

1.9
2.2
2.4
2.3
2.3
2.1
2.7
2.2
2.1
2.5
2.1
2.2
2.0
1.9
2.1
1.6
2.4
1.9
2.1
2.2
1.8
1.6
1.8
1.7
2.3
1.8
2.1
1.9

5

51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78

4.9
5.2
5.1
5.4
5.1
5.2
4.7
5.1
4.7
4.9
4.2
5.4
4.6
4.8
5.3
5.0
4.7
5.2
4.9
5.3
4.3
5.1
5.7
5.3
4.7
5.0
4.9
5.0

3.4
3.7
3.7
3.4
3.4
3.2
3.3
3.3
2.9
3.4
3.0
3.7
3.4
3.1
4.0
3.8
3.2
3.7
2.9
3.9
3.0
3.5
4.1
3.7
3.0
3.1
3.1
3.3

1.3
1.4
1.4
1.6
1.3
1.7
1.5
1.4
1.3
1.7
1.1
1.3
1.6
1.2
1.6
1.5
1.5
1.1
1.7
1.5
1.5
1.5
1.7
1.5
1.2
1.4
1.4
1.4

0.4
0.2
0.4
0.2
0.1
0.2
0.4
0.4
0.3
0.4
0.2
0.3
0.2
0.3
0.4
0.2
0.3
0.1
0.3
0.2
0.2
0.2
0.3
0.1
0.5
0.3
0.3
0.3

5.6
6.1
5.9
6.6
5.9
6.5
5.5
6.1
5.5
6.1
4.5
6.2
5.4
5.6
6.3
5.8
5.7
5.8
6.3
6.3
5.0
6.0
6.9
6.3
5.4
6.0
6.0
6.0

2.8
2.9
3.0
2.7
2.6
2.6
2.8
2.7
2.4
2.9
2.4
2.8
2.8
2.5
3.4
3.1
2.7
2.7
2.5
3.1
2.5
2.8
3.4
2.9
2.5
2.5
2.5
2.7

4.0
4.1
4.2
4.6
3.9
4.8
4.4
4.2
3.8
5.0
3.2
4.0
4.3
3.6
4.8
4.4
4.3
3.4
4.7
4.5
4.0
4.3
5.2
4.4
3.8
4.1
4.2
4.2

1.4
1.3
1.5
1.3
1.1
1.3
1.5
1.5
1.3
1.7
1.1
1.3
1.3
1.3
1.7
1.4
1.4
1.0
1.5
1.4
1.2
1.3
1.6
1.2
1.5
1.4
1.3
1.3

6.1
6.7
6.4
7.5
6.6
7.4
6.1
6.7
6.1
6.9
4.8
6.9
5.9
6.1
7.0
6.5
6.3
6.3
7.0
7.0
5.5
6.7
7.8
7.1
5.9
6.7
6.6
6.6

3.1
3.2
3.3
2.9
2.8
2.8
3.0
3.0
2.6
3.1
2.6
3.1
3.0
2.7
3.6
3.3
2.9
3.0
2.6
3.4
2.7
3.0
3.5
3.1
2.8
2.7
2.7
2.9

5.1
5.4
5.3
6.1
5.3
6.3
5.5
5.4
5.0
6.2
4.1
5.3
5.5
4.8
6.0
5.6
5.6
4.6
6.2
5.9
5.2
5.6
6.6
5.9
4.8
5.4
5.5
5.5

2.4
2.1
2.4
2.0
1.8
1.8
2.3
2.4
2.2
2.5
2.0
2.0
1.9
2.2
2.5
2.0
2.2
1.7
2.2
2.0
1.9
1.9
2.3
1.7
2.6
2.2
2.1
2.0
23

6
24

79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

4.7
5.6
5.4
5.0
4.8
4.6
5.0
5.3
5.4
4.9
4.6
5.6
4.8
5.2
5.5
4.8
4.7
5.7
5.6
4.7
5.1
4.4

3.1
4.1
3.4
3.1
3.2
3.1
3.6
3.6
3.9
3.3
2.8
4.3
3.4
3.3
3.6
3.0
2.9
4.4
3.9
3.1
3.0
2.9

1.2
1.5
1.4
1.5
1.7
1.3
1.2
1.4
1.8
1.4
1.4
1.2
1.4
1.4
1.7
1.6
1.5
1.4
1.6
1.5
1.4
1.4

0.3
0.3
0.2
0.2
0.2
0.1
0.3
0.1
0.3
0.1
0.1
0.3
0.3
0.4
0.2
0.3
0.4
0.2
0.1
0.1
0.3
0.2

5.4
6.5
6.5
6.0
5.9
5.3
5.7
6.3
6.7
5.7
5.6
6.2
5.5
6.2
6.7
6.0
5.7
6.6
6.7
5.6
6.3
5.1

2.5
3.3
2.6
2.4
2.7
2.4
2.8
2.8
3.3
2.6
2.2
3.3
2.7
2.7
2.9
2.6
2.5
3.4
3.1
2.5
2.4
2.4

3.6
4.5
4.2
4.2
4.8
3.7
3.8
4.2
5.2
3.9
4.0
3.9
3.9
4.2
4.9
4.6
4.3
4.3
4.7
4.2
4.3
3.9

1.3
1.5
1.2
1.2
1.3
1.0
1.3
1.2
1.6
1.1
1.0
1.3
1.3
1.5
1.4
1.4
1.5
1.3
1.3
1.2
1.3
1.1

5.8
7.2
7.3
6.7
6.7
5.8
6.1
7.0
7.6
6.3
6.3
6.7
6.0
6.8
7.6
6.7
6.3
7.3
7.6
6.3
7.0
5.7

2.7
3.5
2.8
2.6
2.8
2.6
3.1
3.0
3.4
2.8
2.3
3.7
3.0
2.9
3.1
2.7
2.7
3.6
3.2
2.7
2.6
2.5

4.7
5.8
5.6
5.6
6.2
5.0
4.9
5.6
6.6
5.2
5.4
5.0
5.1
5.5
6.4
5.9
5.5
5.7
6.2
5.5
5.7
5.1

2.2
2.3
1.8
1.8
1.8
1.6
2.2
1.8
2.3
1.7
1.6
2.2
2.1
2.4
1.9
2.1
2.3
2.0
1.7
1.7
2.1
1.8

RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 10 Juni 1991 dari bapak H.
Kustadi, SE dan ibu Hj. Warniti. Penulis merupakan anak pertama dari tiga
bersaudara, penulis memunyai dua adik benama Retry Dwi Rahma dan Achmad
Nur Kuswardana Al Isya’i.
Pendidikan formal yang ditempuh yaitu TK Islam Kemerdekaan lulus pada
1997, SD Negeri 1 Bageng-Jawa Tengah lulus pada tahun 2003, SMP Negeri 4
Jakarta lulus pada tahun 2006. Tahun 2009 penulis lulus dari SMAN 1 Jakarta dan
pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor (IPB)
melalui jalur Undangan Seleksi Masuk IPB (USMI) dan diterima di Departemen
Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam.
Selama mengikuti perkuliahan, penulis aktif mengajar mata kuliah Landasan
Matematika, Pengantar Matematika, dan Kalkulus di bimbingan belajar dan privat
GUMATIKA dan Math-Tricks. Di samping kegiatan akademis, penulis pernah
berkecimpung dalam himpunan profesi yaitu Gugus Mahasiswa Matematika
(Gumatika) dalam divisi Keilmuan sebagai Bendahara Divisi tahun 2010-2011.
Penulis pernah memegang amanah sebagai Bendahara pada Kegiatan Matematika
Ria tahun 2011.