PENGKLASIFIKASIAN DATA MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM
ABSTRACT
DATA CLASSIFICATION
USING QUADRATIC DISCRIMINANT ANALYSIS
WITH EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM
By
SEPRIA HERDYANSAH
Discriminant analysis is multivariate analysis method that purpose grouping an
object to which one of some population that different based on observations of
object characters. The purposes of the research were reviewing theoretically
quadratic discriminant analysis model that minimize Expected Cost of
Misclassification (ECM). Then, applied on two data population that generated using
the R program. Based on these studies, showed that classification rule on quadratic
discriminant analysis with Expected Cost of Misclassification (ECM) minimum
influenced by probability density function ratio, cost of misclassification ratio, and
prior probability ratio. ECM is minimized if �1 that contains �1 , … , �� such that
the integrand is negative.
Keywords : quadratic discriminant analysis, classification, expected cost
of misclassification
ABSTRAK
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
Oleh
SEPRIA HERDYANSAH
Analisis diskriminan merupakan metode analisis multivariat yang bertujuan
mengelompokkan suatu individu ke salah satu dari beberapa populasi berbeda yang
ada berdasarkan pengamatan pada beberapa karakter individu. Penelitian ini
bertujuan untuk mengkaji secara teori model analisis diskriminan kuadratik dengan
Expected Cost of Misclassification (ECM) minimum, kemudian diterapkan pada
dua populasi data simulasi yang dibangkitkan menggunakan software R.
Berdasarkan kajian tersebut diperoleh bahwa kaidah klasifikasi pada Analisis
Diskriminan Kuadratik dengan Expected Cost of Misclassification (ECM)
minimum bergantung pada rasio fungsi kepekatan peluang, rasio biaya kesalahan
klasifikasi, dan rasio peluang prior. ECM dikatakan minimum jika �1 yang memuat
�1 , … , �� sedemikian sehingga fungsi dari integralnya bernilai negatif.
Kata Kunci : analisis diskriminan kuadratik, klasifikasi, minimize expected cost
of misclassification
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
(Skripsi)
Oleh
SEPRIA HERDYANSAH
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2016
ABSTRACT
DATA CLASSIFICATION
USING QUADRATIC DISCRIMINANT ANALYSIS
WITH EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM
By
SEPRIA HERDYANSAH
Discriminant analysis is multivariate analysis method that purpose grouping an
object to which one of some population that different based on observations of
object characters. The purposes of the research were reviewing theoretically
quadratic discriminant analysis model that minimize Expected Cost of
Misclassification (ECM). Then, applied on two data population that generated using
the R program. Based on these studies, showed that classification rule on quadratic
discriminant analysis with Expected Cost of Misclassification (ECM) minimum
influenced by probability density function ratio, cost of misclassification ratio, and
prior probability ratio. ECM is minimized if �1 that contains �1 , … , �� such that
the integrand is negative.
Keywords : quadratic discriminant analysis, classification, expected cost
of misclassification
ABSTRAK
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
Oleh
SEPRIA HERDYANSAH
Analisis diskriminan merupakan metode analisis multivariat yang bertujuan
mengelompokkan suatu individu ke salah satu dari beberapa populasi berbeda yang
ada berdasarkan pengamatan pada beberapa karakter individu. Penelitian ini
bertujuan untuk mengkaji secara teori model analisis diskriminan kuadratik dengan
Expected Cost of Misclassification (ECM) minimum, kemudian diterapkan pada
dua populasi data simulasi yang dibangkitkan menggunakan software R.
Berdasarkan kajian tersebut diperoleh bahwa kaidah klasifikasi pada Analisis
Diskriminan Kuadratik dengan Expected Cost of Misclassification (ECM)
minimum bergantung pada rasio fungsi kepekatan peluang, rasio biaya kesalahan
klasifikasi, dan rasio peluang prior. ECM dikatakan minimum jika �1 yang memuat
�1 , … , �� sedemikian sehingga fungsi dari integralnya bernilai negatif.
Kata Kunci : analisis diskriminan kuadratik, klasifikasi, minimize expected cost
of misclassification
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
Oleh
SEPRIA HERDYANSAH
Skripsi
Sebagai salah satu syarat untuk mencapai gelar
SARJANA SAINS
Pada
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2016
RIWAYAT HIDUP
Penulis dilahirkan di Banjar Baru, Way Kanan pada 5 September 1992, merupakan
anak kedua dari tiga bersaudara, dari Bapak Sukisman, S.Pd. dan Ibu Mujiati.
Penulis menempuh pendidikan taman kanak-kanak di TK Dharma Wanita Baradatu
pada tahun 1998-1999, sekolah dasar diselesaikan di SDN Banjar Baru pada tahun
2005, lalu pendidikan selanjutnya di SMPN 1 Baradatu pada tahun 2008, dan
pendidikan menengah atas di SMAN 9 Bandar Lampung pada tahun 2011.
Pada tahun 2011 penulis terdaftar sebagai mahasiswa S1 Matematika Fakultas
Matematika dan Ilmu Pengetahuan Alam Universitas Lampung (FMIPA Unila).
Selama menjadi mahasiswa, penulis aktif di beberapa organisasi kampus seperti
Rohani Islam FMIPA Unila 2012/2013, Himpunan Mahasiswa Jurusan Matematika
FMIPA Unila 2012/2013 sebagai anggota Bidang Eksternal, UKMF Natural
FMIPA Unila 2012/2013 sebagai Kepala Biro Usaha dan sebagai Pimpinan Umum
UKMF Natural pada periode 2013/2014 serta Badan Eksekutif Mahasiswa FMIPA
Unila 2014/2015 sebagai Kepala Departemen Media dan Informasi.
Pada tahun 2014 penulis melakukan Kerja Praktik (KP) di Kantor Pengelolaan
Kekayaan Negara dan Lelang (KPKNL) dan pada tahun 2015 melaksanakan Kuliah
Kerja Nyata (KKN) di Desa Marga Mulya Kecamatan Kelumbayan Barat
Kabupaten Tanggamus, Lampung.
PERSEMBAHAN
Dengan mengucap puji dan syukur kehadirat Allah SWT kupersembahkan karya
kecilku ini untuk:
Bapak dan Ibu tersayang yang telah menjadi motivasi terbesarku selama ini
Dosen Pembimbing dan Penguji yang sangat berjasa, seluruh sahabat-sahabatku
dan Almamaterku Universitas Lampung
SANWACANA
Puji syukur kehadirat Allah SWT atas rahmat dan karunia-Nya sehingga skripsi
ini dapat diselesaikan.
Skripsi dengan judul “Pengklasifikasian Data Menggunakan Analisis Diskriminan
Kuadratik dengan Expected Cost of Misclassification (ECM) Minimum” disusun
sebagai salah satu syarat memperoleh gelar Sarjana Sains (S.Si.) di Universitas
Lampung.
Dengan ketulusan hati penulis ingin mengucapkan terima kasih banyak kepada:
1. Ibu yang tak pernah berhenti berdoa untuk kesuksesanku dan tak hentinya
menasehati untuk terus bermunajat kepada-Nya. Ayah yang selalu
mendukung dan sabar menanti kelulusanku, serta kakakku Dwi Arso
Munandar, S.Si. dan adikku Rina Diana Sari, Amd.KL.
2. Widiarti, S.Si., M.Si. selaku Dosen Pembimbing I, terima kasih untuk
bimbingan dan kesedian waktunya selama penyusunan skripsi ini.
3. Drs. Rudi Ruswandi, M.Si. selaku Dosen Pembimbing II, terima kasih
untuk bantuan dan masukannya selama penyusunan skripsi.
4. Dian Kurniasari, S.Si., M.Sc. selaku Dosen Penguji, terima kasih atas
kesediannya untuk menguji, memberikan saran dan kritik yang
membangun dalam penyelesaian skripsi ini.
5. Ibu Dra. Dorrah Aziz, M.Si. selaku Pembimbing Akademik, terima kasih
atas bimbingan dan nasihatnya selama ini.
6. Bapak Drs. Tiryono Ruby, M.Sc., Ph.D. selaku Ketua Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung.
7. Bapak Prof. Suharso, Ph.D. selaku Dekan FMIPA Universitas Lampung.
8. Seluruh dosen dan karyawan Jurusan Matematika.
9. Bunda Lusiana, Pak Drajat, dan staf TU Matematika lainnya.
10. Teman seatap dan seperjuangan Dias, Asmawi, Helmi, Sigit, Kak Udin,
Wahyu, dan Irul. Terima kasih atas kebersamaanya.
11. Erick, Jordian, Nova, Meri, Wesly, Reno, Bram, dan sahabat matematika
2011 lainnya.
12. Mbak Reny dan Kak Ridho yang selalu memberikan semangat.
13. Keluarga Besar UKMF Natural terima kasih atas ilmu, kekeluargaan, dan
kebersamaan sedari awal perkuliahan sampai saat ini. Natural itu kita, kita
itu Natural. We are family. Salam Pers.
14. Keluarga Besar BEM FMIPA 2014/2015 yang telah menyelipkan
kenangan berharga pada masa akhir perkuliahan ini.
15. Himatika FMIPA Universitas Lampung.
16. Semua pihak yang telah membantu dalam penyusunan skripsi ini.
17. Almamater tercinta Universitas Lampung.
Terima kasih, semoga skripsi ini dapat bermanfaat bagi banyak pihak.
Bandar Lampung, Januari 2016
Penulis
Sepria Herdyansah
DAFTAR ISI
Halaman
DAFTAR TABEL .......................................................................................... xiv
DAFTAR GAMBAR ...................................................................................... xv
I.
PENDAHULUAN ................................................................................. 1
1.1.
1.2.
1.3.
1.4.
II.
Latar Belakang ..............................................................................
Perumusan Masalah.......................................................................
Tujuan Penelitian...........................................................................
Manfaat Penelitian.........................................................................
1
4
4
5
TINJAUAN PUSTAKA ....................................................................... 6
2.1
2.2
2.3
2.4
2.5
2.6
2.7
Konsep Matriks .............................................................................
Analisis Peubah Ganda..................................................................
Distribusi Normal Multivariat ......................................................
Parameter Distribusi Normal Multivariat .....................................
2.4.1 Vektor Rataan .......................................................................
2.4.2 Matriks Varian Kovarian ......................................................
Metode Kemungkinan Maksimum Likelihood .............................
Analisis Diskriminan .....................................................................
2.6.1 Analisis Diskriminan Kuadratik ...........................................
Asumsi Analisis Diskriminan Kuadratik.......................................
2.7.1 Uji Distribusi Normal Multivariat ........................................
2.7.2 Uji Homogenitas Matriks Varian Kovarian .........................
6
8
9
10
10
11
12
13
16
18
18
19
III. METODOLOGI PENELITIAN .......................................................... 21
3.1
3.2
3.3
Waktu dan Tempat Penelitian ...................................................... 21
Data Penelitian .............................................................................. 21
Metode Penelitian .......................................................................... 22
IV. HASIL DAN PEMBAHASAN ............................................................. 27
4.1
4.2
Fungsi Diskriminan Kuadratik ...................................................... 27
Analisis Diskriminan Kuadratik .................................................... 29
4.3
4.4
4.5
4.6
4.7
V.
Pendugaan Parameter µ dan ∑ ......................................................
Aplikasi Analisis Diskriminan Kuadratik pada Data Simulasi .....
Uji Asumsi Analisis Diskriminan .................................................
4.5.1 Uji Normal Multivariat ........................................................
4.5.2 Uji Homogenitas Matriks Varian Kovarian .........................
Nilai Dugaan Vektor Nilai Tengah dan Matriks Varian
Kovarian ........................................................................................
Analisis Diskriminan Kuadratik ....................................................
4.7.1 Analisis Diskriminan Kuadratik untuk �1 = � dan
� | = � | .................................................................
4.7.2 Analisis Diskriminan Kuadratik untuk �1 < � dan
� | < � | .................................................................
4.7.3 Analisis Diskriminan Kuadratik untuk �1 > � dan
� | > � | .................................................................
34
38
38
39
40
40
42
42
44
45
KESIMPULAN ..................................................................................... 48
DAFTAR PUSTAKA ..................................................................................... 49
LAMPIRAN .................................................................................................... 50
Program R ........................................................................................................ 51
Tabel 6-9 .......................................................................................................... 55
DAFTAR TABEL
Tabel
Halaman
1. Struktur Data pada Analisis Diskriminan .........................................
22
2. Data Penelitian ..................................................................................
38
3. Hasil Klassifikasi untuk �1 = � dan �
|
=�
|
..................
43
..................
45
5. Hasil Klassifikasi untuk �1 > � dan �
|
>�
|
..................
46
6. Data Awal Bangkitan ........................................................................
55
7. Data Hasil Klassifikasi untuk �1 = � dan �
|
=�
|
9. Data Hasil Klassifikasi untuk �1 > � dan �
|
>�
|
4. Hasil Klassifikasi untuk �1 < � dan �
|
8. Data Hasil Klassifikasi untuk �1 < � dan �
� sehingga � > � .
j.
simulasi dengan jumlah data tiap kelompok yaitu � > � .
Membentuk model fungsi diskriminan kuadratik berdasarkan data
Mengklasifikasi data menggunakan aturan klasifikasi analisis diskriminan
kuadratik.
Secara garis besar langkah-langkah penelitian yang dilakukan dapat dilihat pada
diagram alir dalam Gambar 1.
25
Mulai
Terdapat 2
kelompok data
Apakah data
berdistribusi
normal?
Ya
Analisis
diskriminan
linear
Ya
Tidak
Apakah
ragamnya
homogen?
Apakah
ragamnya
homogen?
Tidak
Ya
Analisis
diskriminan
kuadratik
Analisis
diskriminan fisher
Menghitung
nilai rata-rata
Menghitung matriks
varian kovarian
Menghitung persamaan
diskriminan
A
Tidak
Analisis
diskriminan
nonparametrik
26
A
Kriteria Klasifikasi
≥ �[
�
�
|
|
Ya
�
( )]
�
Tidak
Kelompok 1
Kelompok 2
Selesai
Gambar 1. Diagram Alir Pengklasifikasian Data (2 kelompok) Menggunakan
Analisis Diskriminan Kuadratik
V. KESIMPULAN
Adapun kesimpulan yang diperoleh dari hasil penelitian sebagai berikut:
1. Kaidah klasifikasi pada Analisis Diskriminan Kuadratik dengan Expected Cost
of Misclassification (ECM) minimum bergantung pada rasio fungsi kepekatan
peluang, rasio biaya kesalahan klasifikasi, dan rasio peluang prior sehingga
diperoleh persamaan diskriminan kuadratik sebagai berikut:
� = − �′ (∑− − ∑− )� + (�′ ∑− − �′ ∑− )� −
≥ �[
�
�
|
�
]
�
|
2. ECM minimum jika � yang memuat � , … , �� sedemikian sehingga fungsi
dari integralnya bernilai negatif, yaitu �
| � � � −�
| � � � <
3. Berdasarkan data simulasi, diperoleh aturan klasifikasi sebagai berikut:
−
−
� = − �′ −
−
[−
,
,
,
,
,
6
+ [− ,
− ln ,
− ,
,
− ,
,
− ,
6 − ,
− ,
, 6
66
,
6 6
,
− ,
−
−
,
,
6
≥
− ,
,
,
,
,
�[
,
66
6
6
� |
� |
− ,
− , 6 6
�
,
,
6
,
6 ]
, 6
�
]
�
6
]�
DAFTAR PUSTAKA
Alva, J. A. V. & Estrada, E. G. 2009. A Generalization of Shapiro–Wilk’s Test for
Multivariate Normality. Communications in Statistics - Theory and
Methods. Vol. 38. No. 11. Page 1870-1883.
Anton, H. & Rorres, C. 2010. Elementary Linear Algebra. Tenth Edition.
New York: John Wiley & Son, Inc.
Everitt, B.S. 2005. An R and S-PLUS Companion to Multivariate Analysis.
London: Springer.
Giri, N.C. 2004. Multivariate Statistical Analysis. Second Edition.
New York: Marcel Dekker, Inc.
Izenman, A.J. 2008. Modern Multivariate Statistical Techniques.
Philadelphia: Springer.
Johnson, R. A. & Wichern, D. W. 2007. Applied Multivariate Statistical Analysis.
Sixth Edition. New York: Prentice-Hall, Inc.
Mattjik, A. & Sumertajaya, I.M. 2011. Sidik Peubah Ganda Menggunakan SAS.
Bogor: IPB Press.
Raykov, T. & Marcoulides, G.A. An Introduction to Applied Multivariat Analysis.
New York: Taylor and Fracis Group.
Rencher, A.C. 2002. Methods of Multivariate Analysis. Second Edition.
New York: John Wiley & Son, Inc.
Sartono, B. dkk. 2003. Analisis Peubah Ganda. Bogor: Institut Pertanian Bogor.
DATA CLASSIFICATION
USING QUADRATIC DISCRIMINANT ANALYSIS
WITH EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM
By
SEPRIA HERDYANSAH
Discriminant analysis is multivariate analysis method that purpose grouping an
object to which one of some population that different based on observations of
object characters. The purposes of the research were reviewing theoretically
quadratic discriminant analysis model that minimize Expected Cost of
Misclassification (ECM). Then, applied on two data population that generated using
the R program. Based on these studies, showed that classification rule on quadratic
discriminant analysis with Expected Cost of Misclassification (ECM) minimum
influenced by probability density function ratio, cost of misclassification ratio, and
prior probability ratio. ECM is minimized if �1 that contains �1 , … , �� such that
the integrand is negative.
Keywords : quadratic discriminant analysis, classification, expected cost
of misclassification
ABSTRAK
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
Oleh
SEPRIA HERDYANSAH
Analisis diskriminan merupakan metode analisis multivariat yang bertujuan
mengelompokkan suatu individu ke salah satu dari beberapa populasi berbeda yang
ada berdasarkan pengamatan pada beberapa karakter individu. Penelitian ini
bertujuan untuk mengkaji secara teori model analisis diskriminan kuadratik dengan
Expected Cost of Misclassification (ECM) minimum, kemudian diterapkan pada
dua populasi data simulasi yang dibangkitkan menggunakan software R.
Berdasarkan kajian tersebut diperoleh bahwa kaidah klasifikasi pada Analisis
Diskriminan Kuadratik dengan Expected Cost of Misclassification (ECM)
minimum bergantung pada rasio fungsi kepekatan peluang, rasio biaya kesalahan
klasifikasi, dan rasio peluang prior. ECM dikatakan minimum jika �1 yang memuat
�1 , … , �� sedemikian sehingga fungsi dari integralnya bernilai negatif.
Kata Kunci : analisis diskriminan kuadratik, klasifikasi, minimize expected cost
of misclassification
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
(Skripsi)
Oleh
SEPRIA HERDYANSAH
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2016
ABSTRACT
DATA CLASSIFICATION
USING QUADRATIC DISCRIMINANT ANALYSIS
WITH EXPECTED COST OF MISCLASSIFICATION (ECM) MINIMUM
By
SEPRIA HERDYANSAH
Discriminant analysis is multivariate analysis method that purpose grouping an
object to which one of some population that different based on observations of
object characters. The purposes of the research were reviewing theoretically
quadratic discriminant analysis model that minimize Expected Cost of
Misclassification (ECM). Then, applied on two data population that generated using
the R program. Based on these studies, showed that classification rule on quadratic
discriminant analysis with Expected Cost of Misclassification (ECM) minimum
influenced by probability density function ratio, cost of misclassification ratio, and
prior probability ratio. ECM is minimized if �1 that contains �1 , … , �� such that
the integrand is negative.
Keywords : quadratic discriminant analysis, classification, expected cost
of misclassification
ABSTRAK
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
Oleh
SEPRIA HERDYANSAH
Analisis diskriminan merupakan metode analisis multivariat yang bertujuan
mengelompokkan suatu individu ke salah satu dari beberapa populasi berbeda yang
ada berdasarkan pengamatan pada beberapa karakter individu. Penelitian ini
bertujuan untuk mengkaji secara teori model analisis diskriminan kuadratik dengan
Expected Cost of Misclassification (ECM) minimum, kemudian diterapkan pada
dua populasi data simulasi yang dibangkitkan menggunakan software R.
Berdasarkan kajian tersebut diperoleh bahwa kaidah klasifikasi pada Analisis
Diskriminan Kuadratik dengan Expected Cost of Misclassification (ECM)
minimum bergantung pada rasio fungsi kepekatan peluang, rasio biaya kesalahan
klasifikasi, dan rasio peluang prior. ECM dikatakan minimum jika �1 yang memuat
�1 , … , �� sedemikian sehingga fungsi dari integralnya bernilai negatif.
Kata Kunci : analisis diskriminan kuadratik, klasifikasi, minimize expected cost
of misclassification
PENGKLASIFIKASIAN DATA
MENGGUNAKAN METODE ANALISIS DISKRIMINAN KUADRATIK
DENGAN EXPECTED COST OF MISCLASSIFICATION (ECM)
MINIMUM
Oleh
SEPRIA HERDYANSAH
Skripsi
Sebagai salah satu syarat untuk mencapai gelar
SARJANA SAINS
Pada
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2016
RIWAYAT HIDUP
Penulis dilahirkan di Banjar Baru, Way Kanan pada 5 September 1992, merupakan
anak kedua dari tiga bersaudara, dari Bapak Sukisman, S.Pd. dan Ibu Mujiati.
Penulis menempuh pendidikan taman kanak-kanak di TK Dharma Wanita Baradatu
pada tahun 1998-1999, sekolah dasar diselesaikan di SDN Banjar Baru pada tahun
2005, lalu pendidikan selanjutnya di SMPN 1 Baradatu pada tahun 2008, dan
pendidikan menengah atas di SMAN 9 Bandar Lampung pada tahun 2011.
Pada tahun 2011 penulis terdaftar sebagai mahasiswa S1 Matematika Fakultas
Matematika dan Ilmu Pengetahuan Alam Universitas Lampung (FMIPA Unila).
Selama menjadi mahasiswa, penulis aktif di beberapa organisasi kampus seperti
Rohani Islam FMIPA Unila 2012/2013, Himpunan Mahasiswa Jurusan Matematika
FMIPA Unila 2012/2013 sebagai anggota Bidang Eksternal, UKMF Natural
FMIPA Unila 2012/2013 sebagai Kepala Biro Usaha dan sebagai Pimpinan Umum
UKMF Natural pada periode 2013/2014 serta Badan Eksekutif Mahasiswa FMIPA
Unila 2014/2015 sebagai Kepala Departemen Media dan Informasi.
Pada tahun 2014 penulis melakukan Kerja Praktik (KP) di Kantor Pengelolaan
Kekayaan Negara dan Lelang (KPKNL) dan pada tahun 2015 melaksanakan Kuliah
Kerja Nyata (KKN) di Desa Marga Mulya Kecamatan Kelumbayan Barat
Kabupaten Tanggamus, Lampung.
PERSEMBAHAN
Dengan mengucap puji dan syukur kehadirat Allah SWT kupersembahkan karya
kecilku ini untuk:
Bapak dan Ibu tersayang yang telah menjadi motivasi terbesarku selama ini
Dosen Pembimbing dan Penguji yang sangat berjasa, seluruh sahabat-sahabatku
dan Almamaterku Universitas Lampung
SANWACANA
Puji syukur kehadirat Allah SWT atas rahmat dan karunia-Nya sehingga skripsi
ini dapat diselesaikan.
Skripsi dengan judul “Pengklasifikasian Data Menggunakan Analisis Diskriminan
Kuadratik dengan Expected Cost of Misclassification (ECM) Minimum” disusun
sebagai salah satu syarat memperoleh gelar Sarjana Sains (S.Si.) di Universitas
Lampung.
Dengan ketulusan hati penulis ingin mengucapkan terima kasih banyak kepada:
1. Ibu yang tak pernah berhenti berdoa untuk kesuksesanku dan tak hentinya
menasehati untuk terus bermunajat kepada-Nya. Ayah yang selalu
mendukung dan sabar menanti kelulusanku, serta kakakku Dwi Arso
Munandar, S.Si. dan adikku Rina Diana Sari, Amd.KL.
2. Widiarti, S.Si., M.Si. selaku Dosen Pembimbing I, terima kasih untuk
bimbingan dan kesedian waktunya selama penyusunan skripsi ini.
3. Drs. Rudi Ruswandi, M.Si. selaku Dosen Pembimbing II, terima kasih
untuk bantuan dan masukannya selama penyusunan skripsi.
4. Dian Kurniasari, S.Si., M.Sc. selaku Dosen Penguji, terima kasih atas
kesediannya untuk menguji, memberikan saran dan kritik yang
membangun dalam penyelesaian skripsi ini.
5. Ibu Dra. Dorrah Aziz, M.Si. selaku Pembimbing Akademik, terima kasih
atas bimbingan dan nasihatnya selama ini.
6. Bapak Drs. Tiryono Ruby, M.Sc., Ph.D. selaku Ketua Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Lampung.
7. Bapak Prof. Suharso, Ph.D. selaku Dekan FMIPA Universitas Lampung.
8. Seluruh dosen dan karyawan Jurusan Matematika.
9. Bunda Lusiana, Pak Drajat, dan staf TU Matematika lainnya.
10. Teman seatap dan seperjuangan Dias, Asmawi, Helmi, Sigit, Kak Udin,
Wahyu, dan Irul. Terima kasih atas kebersamaanya.
11. Erick, Jordian, Nova, Meri, Wesly, Reno, Bram, dan sahabat matematika
2011 lainnya.
12. Mbak Reny dan Kak Ridho yang selalu memberikan semangat.
13. Keluarga Besar UKMF Natural terima kasih atas ilmu, kekeluargaan, dan
kebersamaan sedari awal perkuliahan sampai saat ini. Natural itu kita, kita
itu Natural. We are family. Salam Pers.
14. Keluarga Besar BEM FMIPA 2014/2015 yang telah menyelipkan
kenangan berharga pada masa akhir perkuliahan ini.
15. Himatika FMIPA Universitas Lampung.
16. Semua pihak yang telah membantu dalam penyusunan skripsi ini.
17. Almamater tercinta Universitas Lampung.
Terima kasih, semoga skripsi ini dapat bermanfaat bagi banyak pihak.
Bandar Lampung, Januari 2016
Penulis
Sepria Herdyansah
DAFTAR ISI
Halaman
DAFTAR TABEL .......................................................................................... xiv
DAFTAR GAMBAR ...................................................................................... xv
I.
PENDAHULUAN ................................................................................. 1
1.1.
1.2.
1.3.
1.4.
II.
Latar Belakang ..............................................................................
Perumusan Masalah.......................................................................
Tujuan Penelitian...........................................................................
Manfaat Penelitian.........................................................................
1
4
4
5
TINJAUAN PUSTAKA ....................................................................... 6
2.1
2.2
2.3
2.4
2.5
2.6
2.7
Konsep Matriks .............................................................................
Analisis Peubah Ganda..................................................................
Distribusi Normal Multivariat ......................................................
Parameter Distribusi Normal Multivariat .....................................
2.4.1 Vektor Rataan .......................................................................
2.4.2 Matriks Varian Kovarian ......................................................
Metode Kemungkinan Maksimum Likelihood .............................
Analisis Diskriminan .....................................................................
2.6.1 Analisis Diskriminan Kuadratik ...........................................
Asumsi Analisis Diskriminan Kuadratik.......................................
2.7.1 Uji Distribusi Normal Multivariat ........................................
2.7.2 Uji Homogenitas Matriks Varian Kovarian .........................
6
8
9
10
10
11
12
13
16
18
18
19
III. METODOLOGI PENELITIAN .......................................................... 21
3.1
3.2
3.3
Waktu dan Tempat Penelitian ...................................................... 21
Data Penelitian .............................................................................. 21
Metode Penelitian .......................................................................... 22
IV. HASIL DAN PEMBAHASAN ............................................................. 27
4.1
4.2
Fungsi Diskriminan Kuadratik ...................................................... 27
Analisis Diskriminan Kuadratik .................................................... 29
4.3
4.4
4.5
4.6
4.7
V.
Pendugaan Parameter µ dan ∑ ......................................................
Aplikasi Analisis Diskriminan Kuadratik pada Data Simulasi .....
Uji Asumsi Analisis Diskriminan .................................................
4.5.1 Uji Normal Multivariat ........................................................
4.5.2 Uji Homogenitas Matriks Varian Kovarian .........................
Nilai Dugaan Vektor Nilai Tengah dan Matriks Varian
Kovarian ........................................................................................
Analisis Diskriminan Kuadratik ....................................................
4.7.1 Analisis Diskriminan Kuadratik untuk �1 = � dan
� | = � | .................................................................
4.7.2 Analisis Diskriminan Kuadratik untuk �1 < � dan
� | < � | .................................................................
4.7.3 Analisis Diskriminan Kuadratik untuk �1 > � dan
� | > � | .................................................................
34
38
38
39
40
40
42
42
44
45
KESIMPULAN ..................................................................................... 48
DAFTAR PUSTAKA ..................................................................................... 49
LAMPIRAN .................................................................................................... 50
Program R ........................................................................................................ 51
Tabel 6-9 .......................................................................................................... 55
DAFTAR TABEL
Tabel
Halaman
1. Struktur Data pada Analisis Diskriminan .........................................
22
2. Data Penelitian ..................................................................................
38
3. Hasil Klassifikasi untuk �1 = � dan �
|
=�
|
..................
43
..................
45
5. Hasil Klassifikasi untuk �1 > � dan �
|
>�
|
..................
46
6. Data Awal Bangkitan ........................................................................
55
7. Data Hasil Klassifikasi untuk �1 = � dan �
|
=�
|
9. Data Hasil Klassifikasi untuk �1 > � dan �
|
>�
|
4. Hasil Klassifikasi untuk �1 < � dan �
|
8. Data Hasil Klassifikasi untuk �1 < � dan �
� sehingga � > � .
j.
simulasi dengan jumlah data tiap kelompok yaitu � > � .
Membentuk model fungsi diskriminan kuadratik berdasarkan data
Mengklasifikasi data menggunakan aturan klasifikasi analisis diskriminan
kuadratik.
Secara garis besar langkah-langkah penelitian yang dilakukan dapat dilihat pada
diagram alir dalam Gambar 1.
25
Mulai
Terdapat 2
kelompok data
Apakah data
berdistribusi
normal?
Ya
Analisis
diskriminan
linear
Ya
Tidak
Apakah
ragamnya
homogen?
Apakah
ragamnya
homogen?
Tidak
Ya
Analisis
diskriminan
kuadratik
Analisis
diskriminan fisher
Menghitung
nilai rata-rata
Menghitung matriks
varian kovarian
Menghitung persamaan
diskriminan
A
Tidak
Analisis
diskriminan
nonparametrik
26
A
Kriteria Klasifikasi
≥ �[
�
�
|
|
Ya
�
( )]
�
Tidak
Kelompok 1
Kelompok 2
Selesai
Gambar 1. Diagram Alir Pengklasifikasian Data (2 kelompok) Menggunakan
Analisis Diskriminan Kuadratik
V. KESIMPULAN
Adapun kesimpulan yang diperoleh dari hasil penelitian sebagai berikut:
1. Kaidah klasifikasi pada Analisis Diskriminan Kuadratik dengan Expected Cost
of Misclassification (ECM) minimum bergantung pada rasio fungsi kepekatan
peluang, rasio biaya kesalahan klasifikasi, dan rasio peluang prior sehingga
diperoleh persamaan diskriminan kuadratik sebagai berikut:
� = − �′ (∑− − ∑− )� + (�′ ∑− − �′ ∑− )� −
≥ �[
�
�
|
�
]
�
|
2. ECM minimum jika � yang memuat � , … , �� sedemikian sehingga fungsi
dari integralnya bernilai negatif, yaitu �
| � � � −�
| � � � <
3. Berdasarkan data simulasi, diperoleh aturan klasifikasi sebagai berikut:
−
−
� = − �′ −
−
[−
,
,
,
,
,
6
+ [− ,
− ln ,
− ,
,
− ,
,
− ,
6 − ,
− ,
, 6
66
,
6 6
,
− ,
−
−
,
,
6
≥
− ,
,
,
,
,
�[
,
66
6
6
� |
� |
− ,
− , 6 6
�
,
,
6
,
6 ]
, 6
�
]
�
6
]�
DAFTAR PUSTAKA
Alva, J. A. V. & Estrada, E. G. 2009. A Generalization of Shapiro–Wilk’s Test for
Multivariate Normality. Communications in Statistics - Theory and
Methods. Vol. 38. No. 11. Page 1870-1883.
Anton, H. & Rorres, C. 2010. Elementary Linear Algebra. Tenth Edition.
New York: John Wiley & Son, Inc.
Everitt, B.S. 2005. An R and S-PLUS Companion to Multivariate Analysis.
London: Springer.
Giri, N.C. 2004. Multivariate Statistical Analysis. Second Edition.
New York: Marcel Dekker, Inc.
Izenman, A.J. 2008. Modern Multivariate Statistical Techniques.
Philadelphia: Springer.
Johnson, R. A. & Wichern, D. W. 2007. Applied Multivariate Statistical Analysis.
Sixth Edition. New York: Prentice-Hall, Inc.
Mattjik, A. & Sumertajaya, I.M. 2011. Sidik Peubah Ganda Menggunakan SAS.
Bogor: IPB Press.
Raykov, T. & Marcoulides, G.A. An Introduction to Applied Multivariat Analysis.
New York: Taylor and Fracis Group.
Rencher, A.C. 2002. Methods of Multivariate Analysis. Second Edition.
New York: John Wiley & Son, Inc.
Sartono, B. dkk. 2003. Analisis Peubah Ganda. Bogor: Institut Pertanian Bogor.