Pencarian pola klasifikasi karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan algoritma Reduct Based Decision Tree (RDT) - USD Repository
PENCARIAN POLA KLASIFIKASI KARYA PENGEMBANGAN PROFESI GURU BERDASARKAN DATA SERTIFIKASI GURU DENGAN ALGORITMA REDUCT BASED DECISION TREE (RDT) Skripsi Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika Oleh : Ana Suryaningsih
NIM : 07 5314 088
PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA
FINDING PATTERN CLASSIFICATION OF TEACHER PROFESSIONAL DEVELOPMENT WORK BASED ON THE TEACHER CERTIFICATION DATA USING REDUCT BASED DECISION TREE (RDT) ALGORITHM A Thesis Presented as Partial Fullfillment of the Requirements To Obtain the Sarjana Komputer Degree
In Study Program of Informatics Engineering By : Ana Suryaningsih
Student Number : 07 5314 088
INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2012
HALAMAN PERSEMBAHAN
Dengan mengucap syukur Alhamdulilah, kupersembahkan karya kecilku ini
untuk : Kedua orang tua, seluruh keluarga besar, dan para sahabat….☺☺☺
ABSTRAK
Salah satu faktor yang menentukan kualitas pendidikan adalah faktorpendidik atau guru. Dalam meningkatkan kualitas pendidik, pemerintah Indonesia
telah mengadakan program sertifikasi guru. Sertifikasi guru berkaitan erat dengan
penyusunan portofolio. Pada saat ini seorang guru dituntut untuk mengembangkan
profesinya. Dengan mengembangkan profesi maka seorang guru semakin
profesional dalam mengajar. Salah satu komponen portofolio yang dapat
menunjukkan adanya upaya pengembangan profesi guru adalah komponen karya
pengembangan profesi. Untuk mengenali profil kualitas guru berdasarkan karya
pengembangan profesinya, perlu dilakukan kajian terhadap pola klasifikasi karya
pengembangan profesi guru berdasarkan data sertifikasi guru, yang terdiri dari
komponen portofolio dan data pribadi guru. Kajian tersebut dapat dilakukan
dengan menerapkan teknik penambangan data (data mining).Tujuan penelitian ini adalah melakukan pencarian pola klasifikasi karya
pengembangan profesi guru berdasarkan data sertifikasi guru dengan menerapkan
algoritma Reduct Based Decision Tree (RDT). Data yang digunakan dalam
penelitian adalah data sertifikasi guru di rayon 38 tahun 2010 sebanyak 2230
record . Penelitian ini menghasilkan 835 pola klasifikasi sehingga dapat dilihat
profil guru peserta sertifikasi. Dari pola yang dihasilkan ternyata guru dengan usia
yang relatif muda cenderung menunjukkan karya pengembangan profesi yang
lebih baik dibandingkan guru dengan usia yang relatif tua dan dengan pengalaman
mengajar yang cukup lama. Sistem yang dibangun telah diuji dengan
menggunakan teknik 5-fold cross validation dan menghasilkan akurasi sebesar 58,
34 %.Kata kunci : Sertifikasi guru, Penambangan data, Reduct Based Decision Tree.
ABSTRACT
One factor which determines the quality of education is teacher oreducator. In order to increase the quality of teacher, the Indonesian government
has held a program named teacher certification. The teacher certification
program is closely related to portfolio compiling. Nowadays, a teacher is
required to develop his/her profession. By developing his/her profession, a
teacher will be more professional in teaching. One of the portfolio components
which can show the effort to develop teacher profession is professional
development work component. To identify the teacher’s quality profile based on
the professional development work, there is a need to study the classification
patterns of teacher professional development work based on the teacher
certification data which consists of components of teacher portfolios and personal
data. The study can be done by applying data mining technique.The purpose of this study is finding the pattern of teacher development
work classification based on teacher certification data by applying the Reduct
Based Decision Tree (RDT) algorithm. The data used in this study are the teacher
certification data in rayon 38 in the year 2010, which consists of 2230 record.
This study results 835 classification pattern so the profile of teacher certification
participants can be identified. From the pattern resulted, teachers with a
relatively young age tend to show the better professional development work than
teachers with a relatively older age and with a quite long teaching experience.
The system has been tested by using 5-fold cross validation and produces an
accuracy of 58, 34%.Keywords: Teacher Certification, Data Mining, Reduct Based Decision Tree
KATA PENGANTAR
Puji dan syukur kehadirat Tuhan Yang Maha Esa, karena pada akhirnya
penulis dapat menyelesaikan penelitian tugas akhir ini yang berjudul “Pencarian
Pola Klasifikasi Karya Pengembangan Profesi Guru Berdasarkan Data Sertifikasi
Guru dengan Algoritma Reduct Based Decision Tree (RDT)”. Penelitian ini tidak akan selesai dengan baik tanpa adanya dukungan,
semangat, dan motivasi yang telah diberikan oleh banyak pihak. Untuk itu,
penulis ingin mengucapkan terima kasih kepada:1. Ibu Ridowati Gunawan, S.Kom., M.T. selaku ketua program studi Teknik Informatika.
2. Ibu P.H. Prima Rosa, S.Si., M.Sc. selaku dosen pembimbing atas kesabaran, waktu, dan kebaikan yang telah diberikan.
3. Ibu Sri Hartati Wijono, S.Si., M.Kom. selaku dosen penguji atas kritik dan saran yang telah diberikan.
4. Pihak sekretariat dan laboran Fakultas Sains dan Teknologi yang turut membantu penulis dalam menyelesaikan tugas akhir ini.
5. Kedua orang tua, bapak Maripin (almarhum) dan ibu Sumijah atas kasih sayang, semangat, dan dukungan yang tak henti-hentinya diberikan kepada penulis.
6. Semua saudara, Wahyu Budiyati, SE., Aris Yulianto, Andri Priyanto, Agus Santoso, Anton Nugroho dan Ari Nurcahyo, atas dukungan, perhatian, dan doa sehingga penulis dapat menyelesaikan tugas akhir ini.
7. Keluarga besar Panudiana Kuhn atas kesempatan dan dukungannya dalam menuntut ilmu.
8. Teman-teman kost Dinda, Christin, Raras, Grace, Eva serta lainnya yang senantiasa selalu menemani dan memberikan dukungan serta menjadi motivasi bagi penulis dalam menyelesaikan tugas akhir ini.
9. Teman-teman kuliah, Andrias Pratiwi, A.M Sarwinda, Margaretha
Yosephin Seviana, S.Kom., Th.E. Wahyuning Pratiwi, A.Tendy, Hariyo Koco, Ignatius Wijaya Kusuma, serta teman-teman TI 2007 lainnya atas segala kebersamaan dan dukungan yang selalu diberikan kepada penulis.
10. Pihak-pihak lain yang turut membantu penulis dalam menyelesaikan tugas akhir ini, yang tidak dapat disebutkan satu per satu.
Penelitian tugas akhir ini masih memiliki banyak kekurangan. Untuk itu,
penulis sangat membutuhkan saran dan kritik untuk perbaikan di masa yang akan
datang. Semoga penelitian tugas akhir ini dapat membawa manfaat bagi semua
pihak.Yogyakarta, 20 Juni 2012 Penulis
DAFTAR ISI
HALAMAN JUDUL ............................................................................................................ i
HALAMAN JUDUL (INGGRIS) .......................................................................................... ii
HALAMAN PERSETUJUAN .............................................................................................. iii
HALAMAN PENGESAHAN .............................................................................................. iv
HALAMAN PERSEMBAHAN ............................................................................................. v
PERNYATAAN KEASLIAN KARYA ...................................................................................... vi
ABSTRAK ...................................................................................................................... vii
ABSTRACT ................................................................................................................... viii
LEMBAR PERSETUJUAN PUBLIKASI ................................................................................ ix
KATA PENGANTAR ......................................................................................................... x
DAFTAR ISI ................................................................................................................... xii
DAFTAR TABEL ............................................................................................................. xv
DAFTAR GAMBAR .........................................................................................................xvi
BAB I PENDAHULUAN...................................................................................................... 1
1.1 Latar Belakang Masalah ......................................................................................... 1
1.2 Rumusan Masalah ................................................................................................. 3
1.3 Tujuan Penelitian ................................................................................................... 3
1.4 Batasan Masalah ................................................................................................... 3
1.5 Metodologi Penelitian ........................................................................................... 3
1.6 Sistematika Penulisan ............................................................................................ 5
BAB II TINJAUAN PUSTAKA .............................................................................................. 6
2.1 Penambangan Data (Data Mining) ......................................................................... 6
2.2 Himpunan Kasar (Rough Sets) ................................................................................ 8
2.2.1 Pendahuluan .................................................................................................. 8
2.2.2 Ruang Hampiran dan Himpunan Kasar ............................................................ 9
2.2.3 Discernibility Matrix...................................................................................... 12
2.3 Pohon Keputusan (Decision Tree) ........................................................................ 13
2.3.1 Pengertian Pohon Keputusan (Decision Tree) ................................................ 13
2.3.3 Kekurangan Pohon Keputusan (Decision Tree) .............................................. 15
2.4 Algoritma C4.5 ..................................................................................................... 15
2.5 Algoritma Reduct Based Decision Tree (RDT) ........................................................ 18
2.5.1 Algoritma RDT .............................................................................................. 18
2.5.2 Contoh Kasus dengan Menggunakan Algoritma Reduct Based Decision Tree
(RDT) .......................................................................................................... 202.6 k-fold Cross Validation ......................................................................................... 24
BAB III ANALISIS DAN DESAIN ........................................................................................ 25
3.1 Identifikasi Sistem ............................................................................................... 25
3.2 Analisis Sistem ..................................................................................................... 25
3.2.1 Analisis Data Awal ........................................................................................ 25
3.2.2 Pemrosesan Awal ......................................................................................... 31
3.3 Analisis Kebutuhan Sistem ................................................................................... 36
3.3.1 Diagram Use Case ......................................................................................... 36
3.3.2 Narasi Use Case ............................................................................................ 37
3.4 Perancangan Umum Sistem ................................................................................. 44
3.4.1 Masukan Sistem ........................................................................................... 44
3.4.2 Proses Sistem ............................................................................................... 48
3.4.3 Keluaran Sistem ............................................................................................ 51
3.4.4 Diagram Aktivitas ......................................................................................... 51
3.4.4.1 Diagram Aktivitas Input Data Sertifikasi Guru ...................................... 51
3.4.4.2 Diagram Aktivitas Transformasi Data .................................................. 52
3.4.4.3 Diagram Aktivitas Reduct Atribut ........................................................ 52
3.4.4.4 Diagram Aktivitas Bentuk Pohon Keputusan........................................ 53
3.4.4.5 Diagram Aktivitas Simpan Pola ............................................................ 53
3.4.5 Diagram Kelas Analisis .................................................................................. 54
3.4.6 Diagram Sekuensial ...................................................................................... 54
3.4.6.1 Diagram Sekuensial Input Data Sertifikasi Guru ................................... 54
3.4.6.2 Diagram Sekuensial Transformasi Data ............................................... 55
3.4.6.3 Diagram Sekuensial Reduct Atribut ..................................................... 55
3.4.6.4 Diagram Sekuensial Bentuk Pohon Keputusan .................................... 55
3.4.7 Diagram Kelas Desain ................................................................................... 56
3.4.7.1 Use Case Input Data Sertifikasi Guru ................................................... 56
3.4.7.2 Use Case Transformasi Data ................................................................ 57
3.4.7.3 Use Case Reduct Atribut ...................................................................... 58
3.4.7.4 Use Case Bentuk Pohon Keputusan ..................................................... 59
3.4.7.5 Use Case Simpan Pola ......................................................................... 60
3.4.8 Algoritma Method-Method Penting dalam Setiap Kelas ................................ 60
3.4.9 Perancangan Struktur Data ........................................................................... 71
3.4.10 Perancangan Basis Data .............................................................................. 73
3.4.11 Perancangan Antarmuka ............................................................................ 74
3.4.11.1 Halaman Utama .............................................................................. 74
3.4.11.2 Halaman Preprocessing ................................................................... 74
3.4.11.3 Halaman Reduct Atribut .................................................................. 75
3.4.11.4 Halaman Lihat Pohon Keputusan ..................................................... 75
BAB IV IMPLEMENTASI SISTEM ..................................................................................... 76
4.1 Spesifikasi Perangkat Lunak dan Perangkat Keras ................................................ 76
4.2 Uji Validasi Sistem .............................................................................................. 76
4.3 Implementasi Use Case ....................................................................................... 77
4.4 Implemantasi Diagram Kelas ................................................................................ 83
BAB V ANALISIS SISTEM............................................................................................... 137
5.1 Evaluasi Pola Karya Pengembangan Profesi ....................................................... 137
5.2 Pengukuran Kinerja Sistem ................................................................................ 141
5.3 Kelebihan Sistem ............................................................................................... 142
5.4 Kekurangan Sistem ............................................................................................ 142
BAB VI PENUTUP ......................................................................................................... 143
5.1 KESIMPULAN ..................................................................................................... 143
5.2 SARAN ............................................................................................................... 143
DAFTAR PUSTAKA ....................................................................................................... 144
LAMPIRAN ................................................................................................................. 146
DAFTAR TABEL
Tabel 2.1 Contoh Database ........................................................................................... 12Tabel 2.2 Discernibility matrix untuk data pada Tabel 2.1 .............................................. 12Tabel 2.3 Matriks Boolean untuk data pada Tabel 2.1 ................................................... 13Tabel 2.4 Contoh Data Sertifikasi Guru .......................................................................... 21Tabel 2.5 Matriks Boolean (1)........................................................................................ 22Tabel 2.6 Matriks Boolean (2)........................................................................................ 23Tabel 3.1 Daftar Atribut Data Nilai Portofolio ................................................................ 26Tabel 3.2 Daftar Atribut Data Pribadi Guru .................................................................... 27Tabel 3.3 Kode Interval Nilai n1, n2, n4, n5, n6, n7, n8, n9, n10 ..................................... 33Tabel 3.4 Transformasi Atribut Pengalaman Mengajar (n3) ........................................... 34Tabel 3.5 Interval Usia ................................................................................................... 34Tabel 3.6 Kode Golongan .............................................................................................. 35Tabel 3.7 Narasi Use Case ............................................................................................. 37Tabel 3.8 Deskripsi Masukan Untuk Data Pelatihan ....................................................... 44Tabel 3.9 Deskripsi Masukan Untuk Data Uji ................................................................. 45Tabel 3.10 Pembagian Data untuk Setiap Fold ............................................................... 47Tabel 3.11 Kerangan Array dan ArrayList ....................................................................... 71Tabel 3.12 Keterangan Setiap Atribut dalam Vector ...................................................... 72Tabel 5.1 Daftar Pola dengan Jumlah Frekuensi >= 10 Kejadian .................................. 138Tabel 5.2 Hasil Pengukuran Akurasi dengan Menggunakan 5-fold cross validation ...... 141
DAFTAR GAMBAR
Gambar 2.1 Proses Penambangan Data........................................................................... 7Gambar 2.2 Himpunan kasar A dengan hampiran bawah K dan hampiran atas(A ) dalam ruang hampiran ............................................. 10
K (A ) K ( X , R )
Gambar 2.3 Gambaran Pohon Keputusan ..................................................................... 14Gambar 2.4 Algoritma C4.5 ........................................................................................... 16Gambar 3.1 Diagram Use Case ...................................................................................... 36Gambar 3.2 Flowchart Proses Sistem ............................................................................ 50Gambar 3.3 Diagram Konteks ........................................................................................ 50Gambar 3.4 Diagram Aktivitas Input Data Sertifikasi Guru ............................................. 51Gambar 3.5 Diagram Aktivitas Transformasi Data ......................................................... 52Gambar 3.6 Diagram Aktivitas Reduct Atribut ............................................................... 52Gambar 3.7 Diagram Aktivitas Bentuk Pohon Keputusan ............................................... 53Gambar 3.8 Diagram Aktivitas Simpan Pola ................................................................... 53Gambar 3.9 Diagram Kelas Analisis ............................................................................... 54Gambar 3.10 Diagram Sekuensial Input Data Sertifikasi Guru ........................................ 54Gambar 3.11 Diagram Sekuensial Transformasi Data .................................................... 55Gambar 3.12 Diagram Sekuensial Reduct Atribut .......................................................... 55Gambar 3.13 Diagram Sekuensial Bentuk Pohon Keputusan .......................................... 55Gambar 3.14 Diagram Sekuensial Simpan Pola .............................................................. 56Gambar 3.15 Diagram Kelas Use Case Input Data Sertifikasi Guru ................................. 56Gambar 3.16 Diagram Kelas Use Case Transformasi Data .............................................. 57Gambar 3.17 Diagram Kelas Use Case Reduct Atribut .................................................... 58Gambar 3.18 Diagram Kelas Use Case Bentuk Pohon Keputusan ................................... 59Gambar 3.19 Diagram Kelas Use Case Simpan Pola ....................................................... 60Gambar 3.20 ER Diagram .............................................................................................. 73Gambar 3.21 Halaman Utama ....................................................................................... 74Gambar 3.22 Halaman Preprocessing ............................................................................ 74Gambar 3.23 Halaman Reduct Atribut ........................................................................... 75Gambar 3.24 Halaman Lihat Pohon Keputusan.............................................................. 75Gambar 4.2 Halaman Preprocessing ............................................................................. 78Gambar 4.3 Halaman FileChooser.................................................................................. 79Gambar 4.4 Pemberitahuan File Berhasil Ditampilkan ................................................... 79Gambar 4.5 Pemberitahuan Belum Memilih File ........................................................... 80Gambar 4.6 Pemberitahuan Data Berhasil Ditransformasi ............................................. 80Gambar 4.7 Pemberitahuan Data Berhasil Direduct ....................................................... 80Gambar 4.8 Halaman Reduct Atribut ............................................................................. 81Gambar 4.9 Pemberitahuan Pohon Sudah Terbentuk .................................................... 81Gambar 4.10 Halaman Lihat Pohon ............................................................................... 82Gambar 4.11 Pemberitahuan Pola Berhasil Disimpan .................................................... 82BAB I PENDAHULUAN
1.1 Latar Belakang Masalah
Pendidikan merupakan salah satu aspek yang penting dalam meningkatkan
kesejahteraan masyarakat. Pendidikan yang berkualitas ditentukan oleh beberapa
faktor. Salah satu faktor yang menentukan kualitas pendidikan adalah faktor
pendidik atau guru. Hal ini dikarenakan guru mempunyai kontribusi dan pengaruh
yang sangat besar bagi ketercapaian mutu pendidikan.Dalam meningkatkan kualitas pendidik, pemerintah telah mengadakan
program sertifikasi guru. Sertifikasi guru adalah proses perolehan sertifikat
pendidik bagi guru. Sertifikasi guru ini bertujuan untuk menentukan kelayakan
guru dalam melaksanakan tugas sebagai agen pembelajaran dan mewujudkan
tujuan pendidikan nasional, peningkatan proses dan mutu hasil pendidikan serta
peningkatan profesionalitas guru [1].Sertifikasi guru berkaitan erat dengan penyusunan portofolio. Portofolio
adalah bukti fisik (dokumen) yang menggambarkan pengalaman berkarya/prestasi
yang dicapai selama menjalankan tugas profesi sebagai guru dalam interval waktu
tertentu. Fungsi portofolio dalam sertifikasi guru adalah untuk menilai kompetensi
guru sebagai pendidik dan agen pembelajaran [2].Berdasarkan buku Pedoman Penyusunan Portofolio Sertifikasi Guru
Tahun 2010, portofolio guru terdiri atas 10 komponen yaitu kualifikasi akademik,
pendidikan dan pelatihan, pengalaman mengajar, perencanaan dan pelaksanaan
pembelajaran, penilaian dari atasan dan pengawas, prestasi akademik, karya
pengembangan profesi, keikutsertaan dalam forum ilmiah, pengalaman organisasi
dibidang kependidikan dan sosial, dan penghargaan yang relevan dengan bidang
pendidikan. Selain data portofolio, dalam sertifikasi juga terdapat data pribadi
guru yang terdiri dari nama, tempat dan tanggal lahir, jenis kelamin, golongan,
dan lain-lain.Pada saat ini seorang guru dituntut untuk mengembangkan profesinya.
Dengan mengembangkan profesi maka seorang guru semakin profesional dalam
mengajar. Selain itu guru juga diharapkan menghasilkan karya, sebagai contoh
adalah penelitian-penelitian di bidang pendidikan. Semakin guru mengembangkan
profesinya maka semakin berkualitas pula guru tersebut. Salah satu komponen
portofolio yang dapat menunjukkan adanya upaya pengembangan profesi guru
adalah komponen karya pengembangan profesi. Untuk mengenali profil kualitas
guru berdasarkan karya pengembangan profesinya, perlu dilakukan kajian
terhadap pola klasifikasi karya pengembangan profesi guru berdasarkan data
sertifikasi guru, yang terdiri dari komponen portofolio dan data pribadi guru yang
berupa status pns, usia, jenis kelamin, agama, golongan dan asal kecamatan guru
mengajar. Kajian tersebut dapat dilakukan dengan menerapkan teknik
penambangan data (data mining).Penambangan data adalah suatu proses ekstraksi pengetahuan dari
sejumlah besar data [3]. Terdapat beberapa algoritma dalam penambangan data
(data mining), salah satunya adalah algoritma Reduct Based Decision Tree (RDT).
Data sertifikasi guru yang berupa data nilai portofolio dan data pribadi guru akan
diolah dengan teknik klasifikasi menggunakan algoritma Reduct Based Decision
Tree(RDT). Algoritma RDT ini mengkombinasikan teori himpunan kasar dan
algoritma pohon keputusan [4]. Dengan menggunakan algoritma RDT diharapkan
terbentuk pola klasifikasi sehingga dapat dilihat bagaimana pola karya
pengembangan profesi guru berdasarkan data sertifikasi guru. Dengan demikian
pihak sertifikasi guru dapat melihat profil guru peserta sertifikasi guru.1.2 Rumusan Masalah Berdasarkan latar belakang masalah di atas, maka rumusan masalah yang
muncul dalam penelitian ini adalah bagaimana mengidentifikasi pola klasifikasi
karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan
menerapkan algoritma Reduct Based Decision Tree (RDT).1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah melakukan pencarian pola klasifikasi
karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan
menerapkan algoritma Reduct Based Decision Tree (RDT).1.4 Batasan Masalah Dalam penelitian ini ada beberapa batasan masalah yaitu
1. Penelitian ini menerapkan algoritma Reduct Based Decision Tree (RDT).
2. Penelitian ini menerapkan algoritma C4.5 dalam pembentukan pohon keputusan.
3. Penelitian ini tidak menerapkan teknik pruning dalam pembentukan pohon keputusan.
4. Data yang digunakan dalam penelitian ini adalah data sertifikasi guru di rayon 38 tahun 2010.
1.5 Metodologi Penelitian
Metodologi yang digunakan dalam penelitian ini adalah
1. Studi Pustaka Studi pustaka bertujuan untuk memperdalam dan memahami teori maupun metode yang akan digunakan dalam memecahkan permasalahan yang ada. Studi pustaka dilakukan dengan mencari pustaka yang referensi dan acuan dalam penyelesaian masalah. Dalam penelitian ini, pustaka yang dipelajari adalah yang berhubungan dengan penambangan data.
2. Knowledge discovery in database (KDD) yang terdiri dari [3]:
1. Pembersihan Data (Data Cleaning) Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan.
2. Integrasi Data (Data Integration) Integrasi data merupakan proses penggabungan data dari berbagai sumber.
3. Seleksi Data (Data Selection) Seleksi data merupakan proses menyeleksi data dimana data yang relevan diambil dari database.
4. Transformasi Data (Data Transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam penambangan data.
5. Penambangan Data (Data Mining) Penambangan data merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. Dalam penelitian ini algoritma yang
digunakan adalah Reduct Based Decision Tree (RDT).
6. Evaluasi Pola (Pattern Evaluation) Untuk mengidentifikasi pola-pola menarik yang dalam arti tertentu menyatakan basis pengetahuan.
7. Presentasi Pengetahuan (Knowledge Presentation) Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.
1.6 Sistematika Penulisan
Sistematika penulisan tugas akhir ini adalah sebagai berikut :
BAB I : PENDAHULUAN Bab ini berisi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah, metodologi penelitian, dan sistematika penulisan.
BAB II : TINJAUAN PUSTAKA Bab ini berisi dasar-dasar teori yang digunakan dalam penyusunan tugas akhir. BAB III : ANALISIS DAN DESAIN Bab ini berisi tentang analisis serta perancangan aplikasi penambangan data. BAB IV : IMPLEMENTASI SISTEM Bab ini berisi implementasi penerapan teknik penambangan data dalam aplikasi. : BAB V ANALISIS SISTEM Bab ini berisi analisis hasil program yang telah didapat secara . keseluruhan
BAB VI : PENUTUP Bab ini berisi tentang kesimpulan dari hasil pembuatan aplikasi penambangan data dan saran-saran yang ditujukan kepada semua pihak yang bersangkutan.
BAB II TINJAUAN PUSTAKA
2.1 Penambangan Data (Data Mining)
Penambangan data adalah suatu proses ekstraksi pengetahuan dari
sejumlah besar data [3]. Secara fungsional, penambangan data adalah proses dari
pengumpulan informasi penting dari sejumlah data yang besar yang tersimpan di
basis data, gudang data, atau tempat penyimpanan informasi lainnya.Secara sederhana, penambangan data adalah langkah-langkah dalam
mendapatkan atau menemukan pengetahuan. Penemuan pengetahuan ini
merupakan sebuah proses seperti ditunjukkan pada gambar 2.1 dan terdiri dari
urutan-urutan sebagai berikut [3] :1. Pembersihan Data (Data Cleaning) Pembersihan data merupakan proses untuk menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan.
2. Integrasi Data (Data Integration) Integrasi data merupakan proses penggabungan data dari berbagai sumber.
3. Seleksi Data (Data Selection) Seleksi data merupakan proses menyeleksi data dimana data yang relevan diambil dari database.
4. Transformasi Data (Data Transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam penambangan data.
5. Penambangan Data (Data Mining) Penambangan data merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.
7
6. Evaluasi Pola (Pattern Evaluation) Untuk mengidentifikasi pola-pola menarik yang dalam arti tertetu menyatakan basis pengetahuan.
7. Presentasi Pengetahuan (Knowledge Presentation) Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.
Gambar 2.1 Proses Penambangan Data [3]
8
2.2 Himpunan Kasar (Rough Sets)
2.2.1 Pendahuluan
Himpunan kasar (rough sets) pertama kali diperkenalkan oleh Zdzislaw
Pawlak dari Warsaw University of Technology di Polandia pada tahun 1982
sebagai suatu metode matematis untuk mendeskripsikan himpunan tidak tegas,
dalam arti bahwa elemen-elemen tertentu dalam semestanya tidak dapat
ditentukan secara tegas apakah merupakan anggota himpunan itu atau tidak
karena elemen-elemen itu tidak dapat dibedakan satu sama lain akibat
keterbatasan atau ketidaklengkapan pengetahuan atau informasi yang tersedia
mengenai elemen-elemen itu [5].Pada awalnya himpunan kasar dikembangkan untuk menangani
ketidakpastian dan ketidaktegasan dalam bidang analisis data. Dasar
pengembangan teori himpunan kasar adalah asumsi bahwa setiap elemen dalam
semesta wacananya terkait dengan informasi mengenai elemen itu, dan bahwa
elemen-elemen dengan informasi yang sama adalah elemen-elemen yang
takterbedakan. Pada dasarnya pendekatan terhadap himpunan kasar adalah suatu
hampiran terhadap himpunan taktegas itu dengan menggunakan sepasang
himpunan tegas yang dikonstruksikan berdasarkan suatu partisi pada semesta
himpunan itu. Sebagai partisi biasanya diambil partisi yang terimbas oleh relasi
ekivalensi “takterbedakan” antara elemen-elemen dalam semesta itu. Dengan
demikian kelas-kelas ekivalensi dalam partisi itu memuat elemen-elemen semesta
yang takterbedakan satu sama lain. Relasi ekivalensi adalah model matematik
paling sederhana yang dapat dipergunakan untuk merepresentasikan keadaan di
mana elemen-elemen tertentu dalam suatu semesta tidak dapat dibedakan satu
sama lain, dengan mengingat bahwa relasi “takterbedakan” itu pada dasarnya
adalah suatu relasi ekivalensi, yaitu bersifat refleksif, simetrik, dan transitif.
Konsep himpunan kasar adalah perampatan konsep himpunan tegas, dalam arti
bahwa himpunan tegas adalah kejadian khusus dari himpunan kasar.9
2.2.2 Ruang Hampiran dan Himpunan Kasar
Menurut Pawlak, misalkan X adalah suatu semesta yang takkosong, R adalah suatu relasi ekivalensi pada X, [ x ] { y X | ( x , y ) R } adalah kelas
R ekivalensi yang memuat x , dan
X X / R {[ x ] | x X } adalah himpunan hasil- R
bagi pada X yang terimbas oleh relasi ekivalensi R, yaitu keluarga semua kelas
ekivalensi yang terimbas oleh R pada X. Pasangan K X R disebut ruang ( , )
hampiran, masing-masing kelas ekivalensi dalam X/R disebut himpunan elementer
atau atom dalam K, dan elemen-elemen dalam suatu himpunan elementer disebut
elemen-elemen yang takterbedakan dalam K. Dalam setiap ruang hampiran K,
himpunan kosong juga dianggap sebagai himpunan elementer. Setiap gabungan
berhingga banyak himpunan elementer dalam K disebut himpunan tersusun dalam
K .Jika A adalah suatu himpunan bagian dari semesta X, maka hampiran bawah dari A dalam K, dengan lambang K (A ), adalah K A x
X R x A ( ) {[ ] / | [ ] }
R R x
X x X x A
{ | [ ] } R
…(2.1) yaitu gabungan semua himpunan elementer yang termuat dalam A. Sedangkan hampiran atas dari A dalam K, dengan lambang K adalah
(A ),
K ( A ) {[ x ] X / R | [ x ] A } R R
x
X x X x A
{ | [ ] } …(2.2) R yaitu gabungan semua himpunan elementer yang beririsan dengan A.
Hampiran bawah dari A menyajikan himpunan elemen-elemen semesta yang pasti
merupakan anggota himpunan A, sedangkan hampiran atas dari A menyajikan
himpunan elemen-elemen semesta yang mungkin merupakan anggota himpunan
A . Perhatikan bahwa K A A K A Elemen-elemen semesta yang tidak
( ) ( ).berada dalam hampiran atas dari A adalah elemen-elemen yang pasti tidak
merupakan anggota A.10 Selisih hampiran atas dan hampiran bawah dari himpunan A dalam K,
yaitu B ( A ) K ( A ) K ( A ), disebut daerah batas dari himpunan A dalam K. Jika
K B ( A ) ,
yaitu K ( A ) K ( A ) A , maka A merupakan gabungan himpunan K
elementer dalam K dan disebut himpunan yang dapat dideskripsikan secara tepat
dalam K (atau himpunan tegas dalam K). Jika B ( A ) , maka A tidak dapat
K
dideskripsikan secara tepat dalam K dan disebut himpunan kasar dalam K. Dengan
perkataan lain, himpunan kasar adalah himpunan bagian dari semesta yang
mempunyai daerah batas yang takkosong.Suatu ilustrasi himpunan kasar A dengan hampiran bawah dan hampiran atasnya dalam suatu ruang hampiran K ( X , R ) disajikan dalam Gambar 2.2.
K
(A )
A K (A ) B (A ) K K = (X,R) X/R
Gambar 2.2 Himpunan kasar A dengan hampiran bawah K (A ) danhampiran atas K (A ) dalam ruang hampiran K ( X , R ) [6] Kualitas hampiran dalam suatu ruang hampiran dinyatakan dengan suatu K
X R
ukuran ketepatan. Bila ( , ) adalah suatu ruang hampiran dan A suatu
himpunan bagian dari X, maka banyaknya atom dalam K (A ) dan K (A ), yang
(A )
disajikan dengan dan (A ), berturut-turut disebut ukuran dalam dan ukuran
luar dari A dalam K. Jika A A maka A dikatakan terukur dalam K.
( ) ( ), Ketepatan hampiran dari A dalam K didefinisikan sebagai bilangan real ( A )
( A )
K
11 di mana A Jelas bahwa ( A ) 1 dan ( A ) 1 jika A terukur dalam
( ) . K K K .
Jika K ( X , R ) adalah suatu ruang hampiran dan A dan B adalah
himpunan bagian dari X, maka beberapa sifat penting dari hampiran bawah dan
hampiran atas adalah sebagai berikut: (1) K ( ) K ( )
(2) K ( X ) K ( X )
X (3) K ( A ) A K ( A )