PENGKLASIFIKASIAN DATA MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM

ABSTRACT
DATA CLASSIFICATION
USING QUADRATIC DISCRIMINANT ANALYSIS
WITH EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM

By
SEPRIA HERDYANSAH

Discriminant analysis is multivariate analysis method that purpose grouping an
object to which one of some population that different based on observations of
object characters. The purposes of the research were reviewing theoretically
quadratic discriminant analysis model that minimize Expected Cost of
Misclassification (ECM). Then, applied on two data population that generated using
the R program. Based on these studies, showed that classification rule on quadratic
discriminant analysis with Expected Cost of Misclassification (ECM) minimum
influenced by probability density function ratio, cost of misclassification ratio, and
prior probability ratio. ECM is minimized if �1 that contains �1 , … , �� such that
the integrand is negative.
Keywords : quadratic discriminant analysis, classification, expected cost
of misclassification


ABSTRAK
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM

Oleh
SEPRIA HERDYANSAH

Analisis diskriminan merupakan metode analisis multivariat yang bertujuan
mengelompokkan suatu individu ke salah satu dari beberapa populasi berbeda yang
ada berdasarkan pengamatan pada beberapa karakter individu. Penelitian ini
bertujuan untuk mengkaji secara teori model analisis diskriminan kuadratik dengan
Expected Cost of Misclassification (ECM) minimum, kemudian diterapkan pada
dua populasi data simulasi yang dibangkitkan menggunakan software R.
Berdasarkan kajian tersebut diperoleh bahwa kaidah klasifikasi pada Analisis
Diskriminan Kuadratik dengan Expected Cost of Misclassification (ECM)
minimum bergantung pada rasio fungsi kepekatan peluang, rasio biaya kesalahan
klasifikasi, dan rasio peluang prior. ECM dikatakan minimum jika �1 yang memuat
�1 , … , �� sedemikian sehingga fungsi dari integralnya bernilai negatif.


Kata Kunci : analisis diskriminan kuadratik, klasifikasi, minimize expected cost
of misclassification

PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM

(Skripsi)

Oleh
SEPRIA HERDYANSAH

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2016

ABSTRACT

DATA CLASSIFICATION
USING QUADRATIC DISCRIMINANT ANALYSIS
WITH EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM

By
SEPRIA HERDYANSAH

Discriminant analysis is multivariate analysis method that purpose grouping an
object to which one of some population that different based on observations of
object characters. The purposes of the research were reviewing theoretically
quadratic discriminant analysis model that minimize Expected Cost of
Misclassification (ECM). Then, applied on two data population that generated using
the R program. Based on these studies, showed that classification rule on quadratic
discriminant analysis with Expected Cost of Misclassification (ECM) minimum
influenced by probability density function ratio, cost of misclassification ratio, and
prior probability ratio. ECM is minimized if �1 that contains �1 , … , �� such that
the integrand is negative.
Keywords : quadratic discriminant analysis, classification, expected cost
of misclassification


ABSTRAK
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM

Oleh
SEPRIA HERDYANSAH

Analisis diskriminan merupakan metode analisis multivariat yang bertujuan
mengelompokkan suatu individu ke salah satu dari beberapa populasi berbeda yang
ada berdasarkan pengamatan pada beberapa karakter individu. Penelitian ini
bertujuan untuk mengkaji secara teori model analisis diskriminan kuadratik dengan
Expected Cost of Misclassification (ECM) minimum, kemudian diterapkan pada
dua populasi data simulasi yang dibangkitkan menggunakan software R.
Berdasarkan kajian tersebut diperoleh bahwa kaidah klasifikasi pada Analisis
Diskriminan Kuadratik dengan Expected Cost of Misclassification (ECM)
minimum bergantung pada rasio fungsi kepekatan peluang, rasio biaya kesalahan
klasifikasi, dan rasio peluang prior. ECM dikatakan minimum jika �1 yang memuat
�1 , … , �� sedemikian sehingga fungsi dari integralnya bernilai negatif.


Kata Kunci : analisis diskriminan kuadratik, klasifikasi, minimize expected cost
of misclassification

PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM

Oleh
SEPRIA HERDYANSAH

Skripsi
Sebagai salah satu syarat untuk mencapai gelar
SARJANA SAINS
Pada
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2016

RIWAYAT HIDUP

Penulis dilahirkan di Banjar Baru, Way Kanan pada 5 September 1992, merupakan
anak kedua dari tiga bersaudara, dari Bapak Sukisman, S.Pd. dan Ibu Mujiati.
Penulis menempuh pendidikan taman kanak-kanak di TK Dharma Wanita Baradatu
pada tahun 1998-1999, sekolah dasar diselesaikan di SDN Banjar Baru pada tahun
2005, lalu pendidikan selanjutnya di SMPN 1 Baradatu pada tahun 2008, dan
pendidikan menengah atas di SMAN 9 Bandar Lampung pada tahun 2011.
Pada tahun 2011 penulis terdaftar sebagai mahasiswa S1 Matematika Fakultas
Matematika dan Ilmu Pengetahuan Alam Universitas Lampung (FMIPA Unila).
Selama menjadi mahasiswa, penulis aktif di beberapa organisasi kampus seperti
Rohani Islam FMIPA Unila 2012/2013, Himpunan Mahasiswa Jurusan Matematika
FMIPA Unila 2012/2013 sebagai anggota Bidang Eksternal, UKMF Natural
FMIPA Unila 2012/2013 sebagai Kepala Biro Usaha dan sebagai Pimpinan Umum
UKMF Natural pada periode 2013/2014 serta Badan Eksekutif Mahasiswa FMIPA
Unila 2014/2015 sebagai Kepala Departemen Media dan Informasi.

Pada tahun 2014 penulis melakukan Kerja Praktik (KP) di Kantor Pengelolaan
Kekayaan Negara dan Lelang (KPKNL) dan pada tahun 2015 melaksanakan Kuliah
Kerja Nyata (KKN) di Desa Marga Mulya Kecamatan Kelumbayan Barat
Kabupaten Tanggamus, Lampung.

PERSEMBAHAN

Dengan mengucap puji dan syukur kehadirat Allah SWT kupersembahkan karya
kecilku ini untuk:

Bapak dan Ibu tersayang yang telah menjadi motivasi terbesarku selama ini

Dosen Pembimbing dan Penguji yang sangat berjasa, seluruh sahabat-sahabatku
dan Almamaterku Universitas Lampung

SANWACANA

Puji syukur kehadirat Allah SWT atas rahmat dan karunia-Nya sehingga skripsi
ini dapat diselesaikan.
Skripsi dengan judul “Pengklasifikasian Data Menggunakan Analisis Diskriminan

Kuadratik dengan Expected Cost of Misclassification (ECM) Minimum” disusun
sebagai salah satu syarat memperoleh gelar Sarjana Sains (S.Si.) di Universitas
Lampung.
Dengan ketulusan hati penulis ingin mengucapkan terima kasih banyak kepada:
1. Ibu yang tak pernah berhenti berdoa untuk kesuksesanku dan tak hentinya
menasehati untuk terus bermunajat kepada-Nya. Ayah yang selalu
mendukung dan sabar menanti kelulusanku, serta kakakku Dwi Arso
Munandar, S.Si. dan adikku Rina Diana Sari, Amd.KL.
2. Widiarti, S.Si., M.Si. selaku Dosen Pembimbing I, terima kasih untuk
bimbingan dan kesedian waktunya selama penyusunan skripsi ini.
3. Drs. Rudi Ruswandi, M.Si. selaku Dosen Pembimbing II, terima kasih
untuk bantuan dan masukannya selama penyusunan skripsi.
4. Dian Kurniasari, S.Si., M.Sc. selaku Dosen Penguji, terima kasih atas
kesediannya untuk menguji, memberikan saran dan kritik yang
membangun dalam penyelesaian skripsi ini.

5. Ibu Dra. Dorrah Aziz, M.Si. selaku Pembimbing Akademik, terima kasih
atas bimbingan dan nasihatnya selama ini.
6. Bapak Drs. Tiryono Ruby, M.Sc., Ph.D. selaku Ketua Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung.

7. Bapak Prof. Suharso, Ph.D. selaku Dekan FMIPA Universitas Lampung.
8. Seluruh dosen dan karyawan Jurusan Matematika.
9. Bunda Lusiana, Pak Drajat, dan staf TU Matematika lainnya.
10. Teman seatap dan seperjuangan Dias, Asmawi, Helmi, Sigit, Kak Udin,
Wahyu, dan Irul. Terima kasih atas kebersamaanya.
11. Erick, Jordian, Nova, Meri, Wesly, Reno, Bram, dan sahabat matematika
2011 lainnya.
12. Mbak Reny dan Kak Ridho yang selalu memberikan semangat.
13. Keluarga Besar UKMF Natural terima kasih atas ilmu, kekeluargaan, dan
kebersamaan sedari awal perkuliahan sampai saat ini. Natural itu kita, kita
itu Natural. We are family. Salam Pers.
14. Keluarga Besar BEM FMIPA 2014/2015 yang telah menyelipkan
kenangan berharga pada masa akhir perkuliahan ini.
15. Himatika FMIPA Universitas Lampung.
16. Semua pihak yang telah membantu dalam penyusunan skripsi ini.
17. Almamater tercinta Universitas Lampung.
Terima kasih, semoga skripsi ini dapat bermanfaat bagi banyak pihak.
Bandar Lampung, Januari 2016
Penulis


Sepria Herdyansah

DAFTAR ISI

Halaman
DAFTAR TABEL .......................................................................................... xiv
DAFTAR GAMBAR ...................................................................................... xv
I.

PENDAHULUAN ................................................................................. 1
1.1.
1.2.
1.3.
1.4.

II.

Latar Belakang ..............................................................................
Perumusan Masalah.......................................................................
Tujuan Penelitian...........................................................................

Manfaat Penelitian.........................................................................

1
4
4
5

TINJAUAN PUSTAKA ....................................................................... 6
2.1
2.2
2.3
2.4

2.5
2.6
2.7

Konsep Matriks .............................................................................
Analisis Peubah Ganda..................................................................
Distribusi Normal Multivariat ......................................................
Parameter Distribusi Normal Multivariat .....................................
2.4.1 Vektor Rataan .......................................................................
2.4.2 Matriks Varian Kovarian ......................................................
Metode Kemungkinan Maksimum Likelihood .............................
Analisis Diskriminan .....................................................................
2.6.1 Analisis Diskriminan Kuadratik ...........................................
Asumsi Analisis Diskriminan Kuadratik.......................................
2.7.1 Uji Distribusi Normal Multivariat ........................................
2.7.2 Uji Homogenitas Matriks Varian Kovarian .........................

6
8
9
10
10
11
12
13
16
18
18
19

III. METODOLOGI PENELITIAN .......................................................... 21
3.1
3.2
3.3

Waktu dan Tempat Penelitian ...................................................... 21
Data Penelitian .............................................................................. 21
Metode Penelitian .......................................................................... 22

IV. HASIL DAN PEMBAHASAN ............................................................. 27
4.1
4.2

Fungsi Diskriminan Kuadratik ...................................................... 27
Analisis Diskriminan Kuadratik .................................................... 29

4.3
4.4
4.5

4.6
4.7

V.

Pendugaan Parameter µ dan ∑ ......................................................
Aplikasi Analisis Diskriminan Kuadratik pada Data Simulasi .....
Uji Asumsi Analisis Diskriminan .................................................
4.5.1 Uji Normal Multivariat ........................................................
4.5.2 Uji Homogenitas Matriks Varian Kovarian .........................
Nilai Dugaan Vektor Nilai Tengah dan Matriks Varian
Kovarian ........................................................................................
Analisis Diskriminan Kuadratik ....................................................
4.7.1 Analisis Diskriminan Kuadratik untuk �1 = � dan
� | = � | .................................................................
4.7.2 Analisis Diskriminan Kuadratik untuk �1 < � dan
� | < � | .................................................................
4.7.3 Analisis Diskriminan Kuadratik untuk �1 > � dan
� | > � | .................................................................

34
38
38
39
40
40
42
42
44
45

KESIMPULAN ..................................................................................... 48

DAFTAR PUSTAKA ..................................................................................... 49
LAMPIRAN .................................................................................................... 50
Program R ........................................................................................................ 51
Tabel 6-9 .......................................................................................................... 55

DAFTAR TABEL

Tabel

Halaman

1. Struktur Data pada Analisis Diskriminan .........................................

22

2. Data Penelitian ..................................................................................

38

3. Hasil Klassifikasi untuk �1 = � dan �

|

=�

|

..................

43

..................

45

5. Hasil Klassifikasi untuk �1 > � dan �

|

>�

|

..................

46

6. Data Awal Bangkitan ........................................................................

55

7. Data Hasil Klassifikasi untuk �1 = � dan �

|

=�

|

9. Data Hasil Klassifikasi untuk �1 > � dan �

|

>�

|

4. Hasil Klassifikasi untuk �1 < � dan �

|

8. Data Hasil Klassifikasi untuk �1 < � dan �

� sehingga � > � .

j.

simulasi dengan jumlah data tiap kelompok yaitu � > � .

Membentuk model fungsi diskriminan kuadratik berdasarkan data

Mengklasifikasi data menggunakan aturan klasifikasi analisis diskriminan
kuadratik.

Secara garis besar langkah-langkah penelitian yang dilakukan dapat dilihat pada
diagram alir dalam Gambar 1.

25

Mulai

Terdapat 2
kelompok data

Apakah data
berdistribusi
normal?

Ya

Analisis
diskriminan
linear

Ya

Tidak

Apakah
ragamnya
homogen?

Apakah
ragamnya
homogen?

Tidak

Ya

Analisis
diskriminan
kuadratik

Analisis
diskriminan fisher

Menghitung
nilai rata-rata

Menghitung matriks
varian kovarian

Menghitung persamaan
diskriminan

A

Tidak

Analisis
diskriminan
nonparametrik

26

A

Kriteria Klasifikasi
≥ �[




|
|

Ya


( )]


Tidak

Kelompok 1

Kelompok 2

Selesai

Gambar 1. Diagram Alir Pengklasifikasian Data (2 kelompok) Menggunakan
Analisis Diskriminan Kuadratik

V. KESIMPULAN

Adapun kesimpulan yang diperoleh dari hasil penelitian sebagai berikut:
1. Kaidah klasifikasi pada Analisis Diskriminan Kuadratik dengan Expected Cost
of Misclassification (ECM) minimum bergantung pada rasio fungsi kepekatan
peluang, rasio biaya kesalahan klasifikasi, dan rasio peluang prior sehingga
diperoleh persamaan diskriminan kuadratik sebagai berikut:
� = − �′ (∑− − ∑− )� + (�′ ∑− − �′ ∑− )� −

≥ �[




|



]



|

2. ECM minimum jika � yang memuat � , … , �� sedemikian sehingga fungsi
dari integralnya bernilai negatif, yaitu �

| � � � −�

| � � � <

3. Berdasarkan data simulasi, diperoleh aturan klasifikasi sebagai berikut:


� = − �′ −

[−

,
,
,
,
,

6
+ [− ,

− ln ,

− ,
,
− ,
,
− ,

6 − ,
− ,
, 6
66
,
6 6
,

− ,





,

,

6



− ,
,
,
,
,

�[

,

66
6

6

� |
� |

− ,
− , 6 6

,
,
6
,
6 ]
, 6


]


6

]�

DAFTAR PUSTAKA

Alva, J. A. V. & Estrada, E. G. 2009. A Generalization of Shapiro–Wilk’s Test for
Multivariate Normality. Communications in Statistics - Theory and
Methods. Vol. 38. No. 11. Page 1870-1883.
Anton, H. & Rorres, C. 2010. Elementary Linear Algebra. Tenth Edition.
New York: John Wiley & Son, Inc.
Everitt, B.S. 2005. An R and S-PLUS Companion to Multivariate Analysis.
London: Springer.
Giri, N.C. 2004. Multivariate Statistical Analysis. Second Edition.
New York: Marcel Dekker, Inc.
Izenman, A.J. 2008. Modern Multivariate Statistical Techniques.
Philadelphia: Springer.
Johnson, R. A. & Wichern, D. W. 2007. Applied Multivariate Statistical Analysis.
Sixth Edition. New York: Prentice-Hall, Inc.
Mattjik, A. & Sumertajaya, I.M. 2011. Sidik Peubah Ganda Menggunakan SAS.
Bogor: IPB Press.
Raykov, T. & Marcoulides, G.A. An Introduction to Applied Multivariat Analysis.
New York: Taylor and Fracis Group.
Rencher, A.C. 2002. Methods of Multivariate Analysis. Second Edition.
New York: John Wiley & Son, Inc.
Sartono, B. dkk. 2003. Analisis Peubah Ganda. Bogor: Institut Pertanian Bogor.