Pencarian pola klasifikasi siswa Sekolah Menengah Pertama (SMP) yang tidak melanjutkan jenjang Sekolah Menengah Atas (SMA) menggunakan algoritma C45 : studi kasus pada Kabupaten Timor Tengah Utara - USD Repository

  

PENCARIAN POLA KLASIFIKASI SISWA SEKOLAH MENENGAH

PERTAMA (SMP) YANG TIDAK MELANJUTKAN KE JENJANG

SEKOLAH MENENGAH ATAS (SMA) MENGGUNAKAN ALGORITMA

C4.5

STUDI KASUS PADA KABUPATEN TIMOR TENGAH UTARA

  

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

  

Oleh:

Carla Rambu Guna Peku Jawang

NIM : 085314035

PROGRAM STUDI TEKNIK INFORMATIKA

  

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2012

  

FINDING PATTERN CLASSIFICATION OF JUNIOR HIGH SCHOOL

DO NOT PROCEED TO THE HIGH SCHOOL USING THE C4.5

ALGORITHM

Case Study At Timor Tengah Utara Regency

A Thesis

  

Presented as Partial Fullfillment of the Requirements

To Obtain the Sarjana Komputer Degree

In Study Program of Informatics Engineering

  

By:

Carla Rambu Guna Peku Jawang

NIM : 085314035

  

INFORMATICS ENGINEERING STUDY PROGRAM

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2012

  

HALAMAN PERSEMBAHAN

“Segala sesuatu yang dikerjakan dengan usaha dan melangkah

bersama Dia tidak akan pernah sia-sia, pasti akan pulang

membawa hasilnya karena Tangan Tuhan sedang dan selalu

bekerja”

Yang tertinggal saat ini adalah menikmati kasih dan besar

anugrahNya, karna karya besar-Nya dalam hidupku, ku dapat

mempersembahkan karya kecilku, untuk :

  

Keluarga, Dosen serta sahabat

Orang-Orang Terhebat dalam hidupku

  

.* Terima kasih buat setiap doa, motivasi,

ilmu dan setiap uluran tangan*.

  

....Jesus Bless....

  

ABSTRAK

Penelitian ini bertujuan untuk mencari pola klasifikasi lulusan siswa SMP

yang tidak melanjutkan ke jenjang SMA dengan menggunakan algoritma C4.5,

yaitu salah satu metode pohon keputusan yang ada dalam teori data mining. Data

lulusan siswa SMP diperoleh dari 11 SMP pada dua kecamatan di Kabupaten

Timor Tengah Utara, yaitu Kecamatan Kota Kefamenanu dan Kecamatan

Miomaffo Timur, untuk tahun kelulusan 2008/2009, 2009/2010, 2010/2011. Data

yang digunakan berisi informasi tentang informasi nilai ujian nasional, keterangan

(lulus/ tidak lulus), jenis kelamin, usia siswa, anak ke berapa dalam saudara,

jumlah saudara, pekerjaan orang tua, penghasilan orang tua, jarak rumah dengan

SMA terdekat dan status melanjutkan / tidak melanjutkan. Sistem yang telah

dibangun diuji dengan menggunakan 3-fold cross validation dan 5-fold cross

. Tingkat akurasi total untuk keseluruhan data yang valid pada setiap validation

tahun kelulusan serta data gabungan ketiga tahun dengan 3-fold cross validation

adalah 69,08%, 79,73%, 78,34%, 72,31% sedangkan tingkat akurasi dengan 5-

fold cross validation adalah 66,95%, 80,57%, 79,91% dan 76,74. Adapun tingkat

akurasi berdasarkan data uji pada fold yang memiliki akurasi tertinggi pada 3-fold

cross validation sebesar 73,93%, 82,01%, 81,50% , 76,74% sedangkan tingkat

akurasi tertinggi pada 5-fold cross validation sebesar 73,04%, 83,13%, 82,19%

serta 79,71%. Dapat disimpulkan bahwa atribut yang mempengaruhi siswa tidak

melanjutkan sekolah adalah: 1) keterangan (lulus/tidaklulus), 2) pekerjaan orang

tua yang terjadi secara beragam, 3) siswa yang memperoleh nilai terbaik pada

beberapa mata pelajaran yang diujikan namun tidak melanjutkan sekolah, 4) siswa

berjenis kelamin perempuan.

  Kata Kunci: C4.5, data mining, cross-validation

  

ABSTRACT

This study aims to explore the pattern classification of graduate students who do

not continue to junior high school level using the C4.5 algorithm, one of decision

tree methods in the theory of data mining. Data obtained graduate junior high

school students from 11 junior high schools in two districts in North Central

Timor, the District and the District Miomaffo Kefamenanu City East for

graduation year 2008/2009, 2009/2010, 2010/2011. The data used contains

information about the national test scores, statement (passed / not passed), gender,

age of the student, how many in your child, the number of siblings, parental

employment, parental income, distance between home and school nearby and

status continue / not continue. The system has been built tested using 3-fold cross

validation and 5-fold cross validation. The accuracy rate of the overall total for

valid data in each year of graduation and three years of data combined with 3-fold

cross-validation was 69.08%, 79.73%, 78.34%, 72.31%, while the level of

accuracy with 5-foldcross-validation was 66.95%, 80.57%, 79.91%, and 76.74. As

for the accuracy of the test data based on the fold that have the highest accuracy

on 3-fold cross-validation of 73.93%, 82.01%, 81.50%, 76.74%, while the highest

level of accuracy in 5-fold cross validation by 73 , 04%, 83.13%, 82.19% and

79.71%. It can be concluded that the attributes that affect students do not attend

school are: 1) information (pass / no pass), 2) parents work occurring variety, 3)

students who obtain the best value on some subjects tested, but did not go to

school, 4 ) female students.

  Keywords: C4.5, data mining, cross-validation

KATA PENGANTAR

  Puji dan syukur kepada Tuhan yang Maha Esa, karena pada akhirnya penulis dapat menyelesaikan penelitian tugas akhir ini yang berjudul “Pencarian

  

Pola Klasifikasi Siswa Sekolah Menengah Pertama (SMP) Yang Tidak

Melanjutkan Ke Jenjang Sekolah Menengah Atas (SMA) menggunakan

Algoritma C4.5”.

  Penelitian ini tidak akan selesai dengan baik tanpa adanya dukungan,

semangat, dan motivasi yang telah diberikan oleh banyak pihak. Untuk itu,

penulis ingin mengucapkan terima kasih kepada:

  1. Ibu P.H. Prima Rosa, S.Si., M.Sc. selaku Dekan Fakultas Sains dan Teknologi.

  2. Ibu Ridowati Gunawan, S.Kom.,M.T. selaku Ketua Program Studi Teknik Informatika.

  3. Ibu Agnes M. Polina, S.Kom.,M.Sc. selaku Dosen Pembimbing yang telah memberikan kesabaran, waktu dan kebaikan.

  4. Dr.Cyprianus K. Adi selaku Dosen Pembimbing Akademik yang telah membimbing dan memberi motivasi.

  5. Bapak Puspaningtyas Sanjoyo Adi, S.T., M.T dan Ibu P.H. Prima Rosa, S.Si., M.Sc selaku dosen penguji atas kritik dan saran yang telah diberikan.

  6. Bapak Drs. J.J. Siang, M.Sc, yang telah memberi arahan dalam pengolahan data ilmu statistik. Terimakasih untuk waktu dan ilmu yang telah diberikan.

  7. Seluruh Dosen yang telah mendidik dan memberikan ilmu pengetahuan berharga selama penulis belajar di Universitas Sanata Dharma Yogyakarta.

  8. Pihak sekretariat dan laboran yang turut membantu penulis dalam menyelesaikan tugas akhir ini.

  9. Bapak Bele Bau, S.Pd serta Angga dalam mempersiapkan ruangan serta alat saat ujian.

  10. Bapak Kepala Dinas PPO Kabupaten Timor Tengah Utara.

  11. Bapak Drs. Emanuel Anunu selaku Kabid.Pend. Formal SMP/SMA/SMK Kabupaten Timor Tengah Utara yang telah memberikan ijin, arahan serta masukkan pada saat penulis melakukan penelitian di Kabupaten Timor Tengah Utara.

  12. Bapak dan Ibu Kepala Sekolah, Guru serta Pegawai Tata Usaha, SMPN 1 Kefamenanu, SMPN 2 Kefamenanu, SMPK Xaverius Putra, SMPK Xaverius Putri, SMPK Aurora, SMPK St. Antonius Padua Sasi, SMPN 1 Numpene, SMPN Bitefa, SMPN Fatumfaun, SMPN Jak, MTS Nurul Fallah, SMP Kristen Diakui Kefamenanu, SMPN Neonbat, SMA Negeri 1 Kefamenanu, SMA Negeri 2 Kefamenanu, SMA Negeri Taekas, SMA Katolik Fides Inteleqtium, SMA Negeri Pelita Karya, SMUK Warta Bakti, SMA Negeri Kejuruan (STM), SMA Kejuruan Diakui Katolik (SMEA).

  Terimakasih untuk ijin, waktu serta usaha dalam memberikan informasi dan ilmu.

  13. Kedua orang tua, Bapa Ir.Umbu Soru Pekujawang dan Mama Lidia Iki S.Pd untuk doa, kasih sayang, semangat, dan dukungan yang tak henti- hentinya diberikan kepada penulis.

  14. Om Hans Iki dan Tante Adhriana Restuwati yang telah banyak membantu selama di Jogja serta menjadi orang tua kedua semasa di Jogja, trimakasih buat semuanya.

  15. Alm. Kakek Simon Kora Iki yang semasa hidupnya senantiasa menanamkan pelajaran berharga tentang hidup dan rohani serta didikan dan hal baik lainnya yang tak bisa diungkapkan satu persatu. Nenek Rambu Peda Djoru yang selalu berdoa setiap cucu-cucunya melangkah untuk meraih masa depan, yang mau tersenyum dengan tetes air mata bahagia saat cucunya berhasil lulus. Ma ati dan Bapa Johan, Ma ani, Om Bram, Om Andre, Kaka Eri, Kaka Neni, Kaka Umbu Paki, serta semua keluarga di Sumba, Kupang dan Kefa, terima kasih untuk setiap doa dan nasihat agar penulis tetap semangat. Jesus bless.

16. Mama Gab Manek, Tanta Deta, Mama Ance, Mama Rambu di Soe.

  Terimakasih untuk doa yang senantiasa di panjatkan, sehingga dapat menyelesaikan masa kuliah ini dengan baik.

  17. Semua saudara tersayang, Noi(Dirk Pekujawang), Cua(Joshua Pekujawang), putri(Putri Iki), Emon Iki, Ceci(Essy), Copa(Cory), Yanti,

  Juan Niken atas dukungan, perhatian, dan doa sehingga penulis dapat menyelesaikan tugas akhir ini.

  18. Ronnye S. Rai, atas dukungan, motivasi, dan waktu selama penulis menyelesaikan tugas akhir.

  19. Teman-teman kost welcome yang sudah seperti saudara sendiri Eka Rini (belamor), Veverly W. Palinoan(kemuning), terima kasih untuk semangat dan dukungannya lewat motivasi dan kelucuan kita serta trimakasih untuk rasa persaudaraan yang kita jalani.

  20. Kakak-kakak sekolah minggu yang selalu mendoakan setiap minggunya.

  Terimakasih.

  21. Mba Kristia S.Kom yang telah memberikan informasi, terimakasih.

  22. Teman-teman kuliah serta seluruh teman- teman TI’08, Esi, Angga, Densi Anin S.Kom, Reza, Linardi Lie, S.Kom,Mba Sisca Endar Subagyo, Rista, Ilan, Bang Sur, Putri, Itha, Devi, Wulan, Bebeth terima kasih untuk semangat dan dukungannya serta kebersamaan sehingga penulis dapat menyelesaikan tugas akhir dengan baik.

  23. Pihak-pihak lain yang turut membantu penulis dalam menyelesaikan tugas akhir ini, yang tidak dapat disebutkan satu per satu.

  Penelitian tugas akhir ini masih memiliki banyak kekurangan. Untuk itu,

penulis sangat membutuhkan saran dan kritik untuk perbaikan di masa yang akan

datang. Semoga penelitian tugas akhir ini dapat membawa manfaat bagi semua

pihak.

  Yogyakarta, 23 November 2012 Carla Rambu Guna Peku Jawang

  

DAFTAR ISI

HALAMAN JUDUL……………………………………………………........i HALAMAN JUDUL (INGGRIS)…………………........................................ii HALAMAN PERSETUJUAN......……………………………………...........iii HALAMAN PERSEMBAHAN ..………………………………………........v PERNYATAAN KEASLIAN KARYA...………………………………........vi ABSTRAK....................................……………………………………….......vii ABSTRACT..................................……………………………………….......viii LEMBAR PERNYATAAN PERSETUJUAN.................................................ix

  KATA PENGANTAR......................................................................................x

v

  .....1 BAB I PENDAHULUAN...........................................................................

  

1.1 Latar Belakang................................................................................ ....1

  

1.2 Rumusan masalah..............................................................................4

  

1.3 Tujuan dan Manfaat...........................................................................4

1.4 Batasan Masalah................................................................................

  5

1.5 Populasi, Sampel dan Metode Pengumpulan Data............................

  6

  1.5.1 Metode Pengumpulan Data..........................................................6

  1.5.1.1 Untuk Data Primer........................................................6

  1.5.1.2 Untuk Data Sekunder....................................................7

1.6 Metodologi Penelitian........................................................................

  8

  

1.6.1 Penambangan Data.......................................................................8

  

1.7 Luaran................................................................................................9

  1.8 Sistematika Penulisan..................................................................................9

  BAB II LANDASAN TEORI........................................................................11

  

2.1 Penambangan Data............................................................................11

  2.1.1 Pengertian Penambangan Data....................................................11

  2.1.2 Proses Penambangan Data...........................................................11

  2.1.3 Pengelompokkan Penambangan Data..........................................15

  2.2 Klasifikasi..........................................................................................17

  2.2.1 Pengertian Klasifikasi..................................................................17

  2.2.2 Algoritma untuk Klasifikasi.........................................................19

  2.3 Algoritma C4.5...................................................................................23

  

BAB III ANALISIS DAN PERANCANGAN SISTEM.................................26

  3.1 Identifikasi Sistem..............................................................................26

  

3.2 Pemrosesan Data Awal, Input Sistem, Proses Sistem, dan Output

Sistem.......................................................................................................27

  3.2.1 Pemrosesan Data Awal.................................................................30

  3.3 Perancangan Umum Sistem................................................................50

  3.3.1 Masukan Sistem............................................................................50

  3.3.2 Proses Sistem................................................................................54

  3.3.3 Keluaran Sistem............................................................................55

  3.3.4 Diagram Use Case........................................................................56

  3.3.5 Narasi Use Case............................................................................58

  3.3.5.1 Narasi Use Case Login...................................................58

  3.3.5.2 Narasi Use Case Input Interval.......................................59

  3.3.5.3 Narasi Use Case Tambah Data.......................................59

  3.3.5.4 Narasi Use Case Transformasi Data...............................60

  3.3.5.5 Narasi Use Case Pola Klasifikasi...................................61

  3.3.5.6 Narasi Use Case Lihat Pohon.........................................61

  3.3.5.7 Narasi Use Case Simpan Aturan....................................62

  3.3.5.8 Narasi Use Case Evaluasi Sistem...................................62

  3.3.5.9 Narasi Use Case Prediksi Personal.................................63

  3.3.5.10 Narasi Use Case Prediksi Kelompok............................63

  3.3.5.11 Narasi Use Case Logout...............................................64

  3.3.6 Diagram Konteks...........................................................................65

  3.3.7 Diagram Aktivitas..........................................................................65

  3.3.7.1 Diagram Aktivitas Login................................................65

  3.3.7.2 Diagram Aktivitas Input Interval....................................66

  3.3.7.3 Diagram Aktivitas Tambah Data Pelatihan.....................67

  3.3.7.4 Diagram Aktivitas Transformasi Data............................68

  3.3.7.5 Diagram Aktivitas Pola Klasifikasi.................................69

  3.3.7.6 Diagram Aktivitas Lihat Pohon.......................................69

  3.3.7.7 Diagram Aktivitas Simpan Aturan..................................70

  3.3.7.8 Diagram Aktivitas Evaluasi Sistem................................70

  3.3.7.9 Diagram Aktivitas Prediksi.............................................71

  3.3.7.9.1 Diagram Aktivitas Prediksi Personal...............71

  3.3.7.9.2 Diagram Aktivitas Prediksi Kelompok............72

  3.3.7.10 Diagram Aktivitas Logout.............................................73

  3.4 Diagram Sekuensial............................................................................74

  3.4.1 Diagram Sekuensial Login.............................................................74

  3.4.2 Diagram Sekuensial Input Interval.................................................75

  3.4.3 Diagram Sekuensial Tambah Data.................................................76

  3.4.4 Diagram Sekuensial Transformasi Data.........................................77

  3.4.5 Diagram Sekuensial Pola Klasifikasi.............................................78

  3.4.6 Diagram Sekuensial Lihat Pohon...................................................79

  3.4.7 Diagram Sekuensial Simpan Aturan...............................................80

  3.4.7 Diagram Sekuensial Prediksi..........................................................81

  3.5 Diagram Kelas Analisis......................................................................82

  

3.6 Diagram Kelas Desain.............................................................................83

  3.6.1 Use Case Login..............................................................................83

  3.6.2 Use Case Input Interval..................................................................84

  3.6.3 Use Case Tambah Data..................................................................85

  3.6.4 Use Case Transformasi Data..........................................................87

  3.6.5 Use Case Pola Klasifikasi..............................................................88

  3.6.6 Use Case Lihat Pohon....................................................................89

  3.6.7 Use Case Simpan Aturan................................................................90

  3.6.8 Use Case Prediksi Personal............................................................91

  3.6.9 Use Case Prediksi Kelompok.........................................................92

  3.7 Algoritma Method-Method Penting dalam Kelas.................................93

  3.8 Perancangan Struktur Data...................................................................106

  3.9 Diagram Relasional Entitas.................................................................107

  3.10 Perancangan Antarmuka Pengguna....................................................108

  3.10.1 Halaman Login.............................................................................108

  3.10.2 Halaman Utama............................................................................109

  3.10.3 Halaman Input Interval.................................................................109

  3.10.4 Halaman Pola Klasifikasi.............................................................110

  3.10.5 Halaman Tampil Pohon................................................................111

  

3.10.6 Halaman Prediksi...........................................................................111

  3.10.6.1 Halaman Prediksi Personal............................................112

  3.10.6.2 Halaman Prediksi Kelompok.........................................113

  3.10.7 Halaman Bantuan..........................................................................113

  

BAB IV IMPLEMENTASI SISTEM................................................................114

  4.1 Implementasi........................................................................................114

  4.1.1 Spesifikasi Perangkat Keras dan Perangkat Lunak........................114

  4.1.2 Implementasi Data..........................................................................114

  4.1.3 Implementasi Use Case..................................................................115

  4.1.4 Implementasi Diagram Kelas..........................................................129

  4.1.4.1 Package Boundary............................................................129

  4.1.4.2 Package Entity..................................................................137

  4.1.4.3 Package Controller...........................................................161

  5.1 Penyelesaian Rumusan Masalah.........................................................192

  5.1.1 Data Tahun Kelulusan 2008/2009.................................................192

  5.1.2 Data tahun kelulusan 2008/2009 menggunakan data pelatihan pada fold yang memilik akurasi tertinggi saat data uji diprediksi.......196

  5.1.3 Evaluasi Hasil Pola untuk Data Tahun Kelulusan 2008/2009.......197

  5.1.4 Data Tahun Kelulusan 2009/2010.................................................200

  5.1.5 Data tahun kelulusan 2009/2010 menggunakan data pelatihan pada fold yang memiliki akurasi tertinggi saat data uji diprediksi......196

  5.1.6 Evaluasi Hasil Pola untuk Data Tahun Kelulusan 2009/2010.......203

  5.1.7 Data Tahun Kelulusan 2010/2011.................................................206

  5.1.8 Data tahun kelulusan 2010/2011 menggunakan data pelatihan pada fold yang memiliki akurasi tertinggi saat data uji diprediksi......208

  5.1.9 Evaluasi Hasil Pola untuk Data Tahun Kelulusan 2010/2011.......209

  5.1.10 Data gabungan dari ketiga tahun kelulusan.................................212

  5.1.11 Data gabungan tiga tahun kelulusan menggunakan data pelatihan

pada fold yang memiliki akurasi tertinggi saat data uji

diprediksi....................................................................................214

  

5.1.12 Evaluasi Hasil Pola untuk gabungan data tiga tahun kelulusan...215

  5.2 Pengukuran Kinerja Sistem.................................................................216

  5.3 Kelebihan dan Kekurangan Program..................................................244

  

BAB VI KESIMPULAN DAN SARAN...........................................................245

  6.1 Kesimpulan...........................................................................................245

  6.2 Saran.....................................................................................................246

DAFTAR PUSTAKA........................................................................................248

LAMPIRAN I....................................................................................................250

LAMPIRAN II...................................................................................................305

LAMPIRAN III..................................................................................................312

LAMPIRAN IV..................................................................................................303

  DAFTAR TABEL

Tabel 3.1 Atribut Data Mentah..........................................................................28Tabel 3.2 Data Mentah Tahun Kelulusan 2008-2009........................................30Tabel 3.3 Data Mentah Tahun Kelulusan 2009-2010........................................30Tabel 3.4 Data Mentah Tahun Kelulusan 2010-2011........................................31Tabel 3.5 Data Hasil Pembersihan Data Tahun Kelulusan 2008-2009..............32Tabel 3.6 Data Hasil Pembersihan Data Tahun Kelulusan 2009-2010..............32Tabel 3.7 Data Hasil Pembersihan Data Tahun Kelulusan 2010-2011..............33Tabel 3.8 Data Hasil Penggabungan Tiga Tahun Kelulusan.............................33Tabel 3.9 Interval Nilai......................................................................................38Tabel 3.10 Pilihan Gaji Orang Tua berdasarkan Aplikasi Pendataan Biodata UN ......................................................................................................38Tabel 3.11 Interval Pilihan Gaji Orang Tua berdasarkan Aplikasi Pendataan Biodata UN...................................................................................39Tabel 3.12 Interval Penghasilan Orang Tua.......................................................39Tabel 3.13 Interval Jarak Aplikasi Pendataan UN 2010-2011...........................40Tabel 3.14 Interval Jarak Baru...........................................................................40Tabel 3.15 Interval Anak Ke..............................................................................43Tabel 3.16 Interval Jumlah Saudara...................................................................45Tabel 3.17 Data Pelatihan..................................................................................51Tabel 3.18 Data Uji............................................................................................52Tabel 3.19 Deskripsi Use Case.........................................................................57Tabel 3.20 Narasi Use Case Login....................................................................58Tabel 3.21 Narasi Use Case Input Interval........................................................59Tabel 3.22 Narasi Use Case Tambah Data........................................................60Tabel 3.23 Narasi Use Case Transformasi Data................................................60Tabel 3.24 Narasi Use Case Pola Klasifikasi....................................................61Tabel 3.25 Narasi Use Case Lihat Pohon..........................................................61Tabel 3.26 Narasi Use Case Simpan Aturan.....................................................62Tabel 3.27 Narasi Use Case Evaluasi Sistem....................................................62Tabel 3.28 Narasi Use Case Prediksi Personal..................................................63Tabel 3.29 Narasi Use Case Prediksi Kelompok...............................................64Tabel 3.30 Narasi Use Case Logout..................................................................64Tabel 3.31 Keterangan Atribut..........................................................................106Tabel 5.1 Akurasi dengan 3-Fold Cross Validation dan 5-Fold Cross Validation serta Jumlah Pola yang terbentuk tahun kelulusan 2008/2009....197Tabel 5.2 Contoh pola yang terbentuk dengan menggunakan data pelatihan yang memiliki akurasi tertinggi untuk tahun kelulusan 2008/2009......199Tabel 5.3 Akurasi dengan 3-Fold Cross Validation dan 5-Fold Cross Validation serta Jumlah Pola yang terbentuk tahun kelulusan 2009/2010....203Tabel 5.4 Contoh pola yang terbentuk dengan menggunakan data pelatihan yang memiliki akurasi tertinggi untuk tahun kelulusan 2009/2010......205Tabel 5.5 Akurasi dengan 3-Fold Cross Validation dan 5-Fold Cross Validation serta Jumlah Pola yang terbentuk tahun kelulusan 2010/2011....209Tabel 5.6 Contoh pola yang terbentuk dengan menggunakan data pelatihan yang memiliki akurasi tertinggi untuk tahun kelulusan 2010/2011......211Tabel 5.7 Akurasi dengan 3-Fold Cross Validation dan 5-Fold Cross Validation serta Jumlah Pola yang terbentuk untuk gabungan data tiga tahun

  kelulusan......................................................................................215

Tabel 5.8 Hasil Pengukuran Akurasi dengan Menggunakan 3-fold Cross

  Validation untuk Data Tahun Kelulusan 2008/2009..................217

Tabel 5.9 Hasil Pengukuran Akurasi dengan Menggunakan 5-fold Cross

  Validation untuk Data Tahun Kelulusan 2008/2009..................219

Tabel 5.10 Hasil Pengukuran Akurasi dengan Menggunakan 3-fold Cross

  Validation untuk Data Tahun Kelulusan 2009/2010..................221

Tabel 5.11 Hasil Pengukuran Akurasi dengan Menggunakan 5-fold Cross

  Validation untuk Data Tahun Kelulusan 2008/2009..................222

Tabel 5.12 Hasil Pengukuran Akurasi dengan Menggunakan 3-fold Cross

  Validation untuk Data Tahun Kelulusan 2010/2011..................224

Tabel 5.13 Hasil Pengukuran Akurasi dengan Menggunakan 5-fold Cross untuk Data Tahun Kelulusan 2010/2011..................226

  Validation

Tabel 5.14 Hasil Pengukuran Akurasi dengan Menggunakan 3-fold Cross

  Validation untuk Data untuk Data Gabungan Tiga Tahun kelulusan......................................................................................227

Tabel 5.15 Hasil Pengukuran Akurasi dengan Menggunakan 5-fold Cross

  Validation untuk Data untuk Data Gabungan Tiga Tahun kelulusan......................................................................................229

Tabel 5.16 Data Sampel.................................................................................... 231Tabel 5.17 Pembagian data ke dalam 2 kelas....................................................231Tabel 5.18 Pembagian data ke dalam 3 fold......................................................232Tabel 5.19 Pembagian data ke dalam 5 fold......................................................232Tabel 5.20 Hasil prediksi data fold 1.................................................................233Tabel 5.21 Hasil prediksi data fold 2.................................................................233Tabel 5.22 Hasil prediksi data fold 3.................................................................234Tabel 5.23 Hasil data valid 3 Fold Cross Validation........................................235Tabel 5.24 Hasil prediksi data fold 1.................................................................236Tabel 5.25 Hasil prediksi data fold 2.................................................................237Tabel 5.26 Hasil prediksi data fold 3.................................................................238Tabel 5.27 Hasil prediksi data fold 4.................................................................239Tabel 5.28 Hasil prediksi data fold 5.................................................................239Tabel 5.29 Hasil data valid 5 Fold Cross Validation.........................................240Tabel 5.30 Perbandingan Tingkat Akurasi 3 Fold dan 5 Fold...........................243

  

DAFTAR GAMBAR

Gambar 1.1 Grafik Perkembangan Pendidikan di Kabupaten Timor Tengah Utara................................................................................................ 1Gambar 2.1 Penambangan data sebagai sebuah langkah dalam proses penemuan pengetahuan (Han,J & Kamber,M,2006).........................................15Gambar 3.1 Flowchart Proses Sistem................................................................55Gambar 3.2 Diagram Use Case..........................................................................56Gambar 3.3 Diagram Konteks............................................................................65Gambar 3.4 Diagram Aktivitas Login................................................................65Gambar 3.5 Diagram Aktivitas Input Interval....................................................66Gambar 3.6 Diagram Aktivitas Tambah Data Pelatihan....................................67Gambar 3.7 Diagram Aktivitas Transformasi Data............................................68Gambar 3.8 Diagram Aktivitas Pola Klasifikasi................................................69Gambar 3.9 Diagram Aktivitas Lihat Pohon .....................................................69Gambar 3.10 Diagram Aktivitas Simpan Aturan...............................................70Gambar 3.11 Diagram Aktivitas Evalusi Sistem...............................................70Gambar 3.12 Diagram Aktivitas Prediksi Personal...........................................71Gambar 3.13 Diagram Aktivitas Prediksi Kelompok .......................................72Gambar 3.14 Diagram Aktivitas Logout...........................................................73Gambar 3.15 Diagram Sekuensial Login..........................................................74Gambar 3.16 Diagram Sekuensial Input Interval..............................................75Gambar 3.17 Diagram Sekuensial Tambah Data..............................................76Gambar 3.18 Diagram Sekuensial Transformasi Data......................................77Gambar 3.19 Diagram Sekuensial Pola Klasifikasi..........................................78Gambar 3.20 Diagram Sekuensial Lihat Pohon................................................79Gambar 3.21 Diagram Sekuensial Simpan Aturan...........................................80Gambar 3.22 Diagram Sekuensial Prediksi......................................................81Gambar 3.23 Diagram Kelas Analisis Keseluruhan.........................................82Gambar 3.24 Diagram Kelas Desain Use Case Login.....................................83Gambar 3.25 Diagram Kelas Desain Use Case Input Interval.........................84Gambar 3.26 Diagram Kelas Desain Use Case Tambah Data.........................84Gambar 3.27 Diagram Kelas Desain Use Case Transformasi Data.................87Gambar 3.28 Diagram Kelas Desain Use Case Pola Klasifikasi.....................88Gambar 3.29 Diagram Kelas Desain Use Case Lihat Pohon...........................89Gambar 3.30 Diagram Kelas Desain Use Case Simpan Aturan......................90Gambar 3.31 Diagram Kelas Desain Use Case Prediksi Personal...................91Gambar 3.32 Diagram Kelas Desain Use Case Prediksi Kelompok................92Gambar 3.33 Diagram Relational Entitas........................................................107Gambar 3.34 Halaman Login..........................................................................108Gambar 3.35 Halaman Utama.........................................................................109Gambar 3.36 Halaman Input Interval..............................................................109Gambar 3.37 Halaman Pola Klasifikasi..........................................................110Gambar 3.38 Halaman Tampil Pohon.............................................................111Gambar 3.39 Halaman Prediksi.......................................................................111Gambar 3.40 Halaman Prediksi Personal........................................................112Gambar 3.41 Halaman Prediksi Kelompok...................................................113Gambar 3.42 Halaman Bantuan.....................................................................113Gambar 4.1 Form Login................................................................................115Gambar 4.2 Pemberitahuan Login Berhasil..................................................116Gambar 4.3 Halaman Utama.........................................................................117Gambar 4.4 Pemberitahuan Pengguna Keluar dari Sistem...........................118Gambar 4.5 Halaman Interval.......................................................................119Gambar 4.6 Pemberitahuan Interval Anak Berhasil Disimpan.....................120Gambar 4.7 Pemberitahuan Interval Jumlah Saudara Berhasil Disimpan....121Gambar 4.8 Pemberitahuan Interval Penghasilan Berhasil Disimpan..........122Gambar 4.9 Pemberitahuan Interval Jarak Berhasil Disimpan.....................123Gambar 4.10 Halaman Pola Klasifikasi........................................................123Gambar 4.11 Dialog Form............................................................................124Gambar 4.12 Pemberitahuan File telah diinputkan......................................124Gambar 4.13 Pemberitahuan Data telah berhasil ditransformasi.................125Gambar 4.14 Pemberitahuan Pohon sudah terbentuk..................................125Gambar 4.15 Halaman Lihat Pohon.............................................................126Gambar 4.16 Halaman Prediksi....................................................................126Gambar 4.17 Halaman Prediksi Personal.....................................................127Gambar 4.18 Halaman Prediksi Kelompok................................................. 128Gambar 4.19 Halaman Bantuan....................................................................129Gambar 5.1 Pola Tahun Kelulusan 2008/2009 yang terbentuk dari semua data siswa......................................................................................192Gambar 5.2 Pola Tahun Kelulusan 2008/2009 yang terbentuk dari data pelatihan pada fold yang memiliki akurasi tertinggi.............................196Gambar 5.3 Pola Tahun Kelulusan 2009/2010 yang terbentuk dari semua data siswa......................................................................................200Gambar 5.4 Pola Tahun Kelulusan 2009/2010 yang terbentuk dari data pelatihan pada fold yang memiliki akurasi tertinggi.............................202Gambar 5.5 Pola Tahun Kelulusan 2010/2011 yang terbentuk dari semua data siswa......................................................................................206Gambar 5.6 Pola Tahun Kelulusan 2010/2011 yang terbentuk dari data pelatihan pada fold yang memiliki akurasi tertinggi.............................208Gambar 5.7 Pola gabungan tiga tahun kelulusan yang terbentuk dari semua data siswa......................................................................................212Gambar 5.8 Pola gabungan tiga tahun kelulusan yang terbentuk dari data pelatihan pada fold yang memiliki akurasi tertinggi.............214Gambar 5.9 Pohon keputusan dan hasil akurasi total sistem data sampel....243Gambar 5.10 Pohon keputusan dan hasil akurasi tertinggi berdasarkan metode 3-

  fold dan 5-fold sistem data sampel..........................................242

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

  Program Wajib Belajar yang ditetapkan oleh pemerintah Republik Indonesia adalah 9 tahun. Pada beberapa daerah di Indonesia, salah satunya yang terjadi di Kabupaten Timor Tengah Utara (TTU), banyak lulusan Sekolah Menengah Pertama (SMP) yang tidak melanjutkan ke jenjang Sekolah Menengah Atas (SMA). Menurut data 2009, presentase yang bersekolah di SMP sebesar 5,64% dan SMA sebesar 2,55% (TTU dalam angka 2009, Sumber: Dinas Pendidikan Kabupaten Timor Tengah Utara).

Gambar 1.1 Grafik Perkembangan Pendidikan di Kabupaten Timor Tengah Utara (TTU).

  Diketahui pula berdasarkan data tahun 2008 , penduduk umur 10 tahun ke atas yang buta huruf sebesar 11,40%(17.487 jiwa), dimana lebih dari separuhnya adalah kaum perempuan(60,81%). Ini memperlihatkan adanya kemungkinan bahwa pendidikan bagi kaum perempuan masih

dianggap kurang perlu oleh sebagian masyarakat di Kabupaten TTU.

  Siswa SMP tidak dapat melanjutkan ke jenjang SMA menjadi sesuatu hal yang penting untuk diatasi karena jika lulusan siswa SMP tidak melanjutkan ke jenjang SMA, maka mereka belum mendapatkan pengetahuan yang cukup untuk menghadapi tantangan kerja, serta siswa yang berpotensi tidak memiliki kesempatan untuk mengembangkan kemampuannya.

  Jika kemungkinan lulusan siswa SMP yang tidak melanjutkan ke jenjang SMA, dapat diketahui sejak dini maka pemerintah, dinas pendidikan dan pihak sekolah dapat bekerjasama untuk dapat menentukan tindakan-tindakan yang diperlukan untuk memperjuangkan dan membantu siswa-siswa tersebut, sehingga angka putus sekolah dapat diminimalisir.

  Salah satu cara untuk menganalisis lulusan SMP tidak melanjutkan ke jenjang SMA adalah dengan data mining menggunakan teknik pencarian pola klasifikasi. Klasifikasi dilakukan berdasarkan data siswa SMP yang sudah ada. Salah satu model klasifikasi adalah dengan membuat pohon keputusan.

  Banyak algoritma yang dapat dipakai dalam pembentukan pohon keputusan, antara lain ID3, CART, dan C4.5. Algoritma C4.5 merupakan pengembangan dari algoritma ID3 (Larose,2005). Algoritma C4.5 dapat digunakan untuk pengklasifikasian dan prediksi (Kusrini & Luthi, Emha, 2009).

  Algoritma C4.5 dipilih karena algoritma ini memiliki kelebihan yaitu dapat diterapkan pada data diskrit maupun data kontinyu, dapat mengatasi missing data, dapat melakukan split pada pohon, dan aturan yang dihasilkan menjadi lebih sederhana untuk dipahami oleh pengguna.

  Berdasarkan penelitian mengenai perbandingan metode Nearest Neighbor dan algoritma C4.5 untuk menganalisis kemungkinan pengunduran diri calon mahasiswa di STMIK AMIKOM Yogyakarta, didapatkan kesimpulan bahwa hasil pengklasifikasian dengan C4.5 menghasilkan data yang lebih akurat dibandingkan dengan metode Nearest Neighbor. Selain itu proses testing memerlukan waktu yang lama jika dilakukan dengan metode Nearest Neighbor, dan pra proses pada metode Nearest Neighbor lebih banyak dibanding dengan algoritma C4.5 karena perlunya penambahan proses penentuan bobot variabel dan penentuan bobot perbandingan antar nilai variabel (Kusrini, 2009).