Pencarian pola klasifikasi karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan algoritma Reduct Based Decision Tree (RDT) - USD Repository

  PENCARIAN POLA KLASIFIKASI KARYA PENGEMBANGAN PROFESI GURU BERDASARKAN DATA SERTIFIKASI GURU DENGAN ALGORITMA REDUCT BASED DECISION TREE (RDT) Skripsi Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer

  Program Studi Teknik Informatika Oleh : Ana Suryaningsih

  NIM : 07 5314 088

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA

  FINDING PATTERN CLASSIFICATION OF TEACHER PROFESSIONAL DEVELOPMENT WORK BASED ON THE TEACHER CERTIFICATION DATA USING REDUCT BASED DECISION TREE (RDT) ALGORITHM A Thesis Presented as Partial Fullfillment of the Requirements To Obtain the Sarjana Komputer Degree

  In Study Program of Informatics Engineering By : Ana Suryaningsih

  Student Number : 07 5314 088

INFORMATICS ENGINEERING STUDY PROGRAM FACULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2012

HALAMAN PERSEMBAHAN

  

Dengan mengucap syukur Alhamdulilah, kupersembahkan karya kecilku ini

untuk : Kedua orang tua, seluruh keluarga besar, dan para sahabat….

  ☺☺☺

  

ABSTRAK

Salah satu faktor yang menentukan kualitas pendidikan adalah faktor

pendidik atau guru. Dalam meningkatkan kualitas pendidik, pemerintah Indonesia

telah mengadakan program sertifikasi guru. Sertifikasi guru berkaitan erat dengan

penyusunan portofolio. Pada saat ini seorang guru dituntut untuk mengembangkan

profesinya. Dengan mengembangkan profesi maka seorang guru semakin

profesional dalam mengajar. Salah satu komponen portofolio yang dapat

menunjukkan adanya upaya pengembangan profesi guru adalah komponen karya

pengembangan profesi. Untuk mengenali profil kualitas guru berdasarkan karya

pengembangan profesinya, perlu dilakukan kajian terhadap pola klasifikasi karya

pengembangan profesi guru berdasarkan data sertifikasi guru, yang terdiri dari

komponen portofolio dan data pribadi guru. Kajian tersebut dapat dilakukan

dengan menerapkan teknik penambangan data (data mining).

  Tujuan penelitian ini adalah melakukan pencarian pola klasifikasi karya

pengembangan profesi guru berdasarkan data sertifikasi guru dengan menerapkan

algoritma Reduct Based Decision Tree (RDT). Data yang digunakan dalam

penelitian adalah data sertifikasi guru di rayon 38 tahun 2010 sebanyak 2230

record . Penelitian ini menghasilkan 835 pola klasifikasi sehingga dapat dilihat

profil guru peserta sertifikasi. Dari pola yang dihasilkan ternyata guru dengan usia

yang relatif muda cenderung menunjukkan karya pengembangan profesi yang

lebih baik dibandingkan guru dengan usia yang relatif tua dan dengan pengalaman

mengajar yang cukup lama. Sistem yang dibangun telah diuji dengan

menggunakan teknik 5-fold cross validation dan menghasilkan akurasi sebesar 58,

34 %.

  Kata kunci : Sertifikasi guru, Penambangan data, Reduct Based Decision Tree.

  

ABSTRACT

One factor which determines the quality of education is teacher or

educator. In order to increase the quality of teacher, the Indonesian government

has held a program named teacher certification. The teacher certification

program is closely related to portfolio compiling. Nowadays, a teacher is

required to develop his/her profession. By developing his/her profession, a

teacher will be more professional in teaching. One of the portfolio components

which can show the effort to develop teacher profession is professional

development work component. To identify the teacher’s quality profile based on

the professional development work, there is a need to study the classification

patterns of teacher professional development work based on the teacher

certification data which consists of components of teacher portfolios and personal

data. The study can be done by applying data mining technique.

  The purpose of this study is finding the pattern of teacher development

work classification based on teacher certification data by applying the Reduct

Based Decision Tree (RDT) algorithm. The data used in this study are the teacher

certification data in rayon 38 in the year 2010, which consists of 2230 record.

This study results 835 classification pattern so the profile of teacher certification

participants can be identified. From the pattern resulted, teachers with a

relatively young age tend to show the better professional development work than

teachers with a relatively older age and with a quite long teaching experience.

The system has been tested by using 5-fold cross validation and produces an

accuracy of 58, 34%.

  Keywords: Teacher Certification, Data Mining, Reduct Based Decision Tree

KATA PENGANTAR

  Puji dan syukur kehadirat Tuhan Yang Maha Esa, karena pada akhirnya

penulis dapat menyelesaikan penelitian tugas akhir ini yang berjudul “Pencarian

Pola Klasifikasi Karya Pengembangan Profesi Guru Berdasarkan Data Sertifikasi

Guru dengan Algoritma Reduct Based Decision Tree (RDT)

  ”. Penelitian ini tidak akan selesai dengan baik tanpa adanya dukungan,

semangat, dan motivasi yang telah diberikan oleh banyak pihak. Untuk itu,

penulis ingin mengucapkan terima kasih kepada:

  1. Ibu Ridowati Gunawan, S.Kom., M.T. selaku ketua program studi Teknik Informatika.

  2. Ibu P.H. Prima Rosa, S.Si., M.Sc. selaku dosen pembimbing atas kesabaran, waktu, dan kebaikan yang telah diberikan.

  3. Ibu Sri Hartati Wijono, S.Si., M.Kom. selaku dosen penguji atas kritik dan saran yang telah diberikan.

  4. Pihak sekretariat dan laboran Fakultas Sains dan Teknologi yang turut membantu penulis dalam menyelesaikan tugas akhir ini.

  5. Kedua orang tua, bapak Maripin (almarhum) dan ibu Sumijah atas kasih sayang, semangat, dan dukungan yang tak henti-hentinya diberikan kepada penulis.

  6. Semua saudara, Wahyu Budiyati, SE., Aris Yulianto, Andri Priyanto, Agus Santoso, Anton Nugroho dan Ari Nurcahyo, atas dukungan, perhatian, dan doa sehingga penulis dapat menyelesaikan tugas akhir ini.

  7. Keluarga besar Panudiana Kuhn atas kesempatan dan dukungannya dalam menuntut ilmu.

  8. Teman-teman kost Dinda, Christin, Raras, Grace, Eva serta lainnya yang senantiasa selalu menemani dan memberikan dukungan serta menjadi motivasi bagi penulis dalam menyelesaikan tugas akhir ini.

  9. Teman-teman kuliah, Andrias Pratiwi, A.M Sarwinda, Margaretha

  Yosephin Seviana, S.Kom., Th.E. Wahyuning Pratiwi, A.Tendy, Hariyo Koco, Ignatius Wijaya Kusuma, serta teman-teman TI 2007 lainnya atas segala kebersamaan dan dukungan yang selalu diberikan kepada penulis.

10. Pihak-pihak lain yang turut membantu penulis dalam menyelesaikan tugas akhir ini, yang tidak dapat disebutkan satu per satu.

  Penelitian tugas akhir ini masih memiliki banyak kekurangan. Untuk itu,

penulis sangat membutuhkan saran dan kritik untuk perbaikan di masa yang akan

datang. Semoga penelitian tugas akhir ini dapat membawa manfaat bagi semua

pihak.

  Yogyakarta, 20 Juni 2012 Penulis

  

DAFTAR ISI

HALAMAN JUDUL ............................................................................................................ i

HALAMAN JUDUL (INGGRIS) .......................................................................................... ii

HALAMAN PERSETUJUAN .............................................................................................. iii

HALAMAN PENGESAHAN .............................................................................................. iv

HALAMAN PERSEMBAHAN ............................................................................................. v

PERNYATAAN KEASLIAN KARYA ...................................................................................... vi

ABSTRAK ...................................................................................................................... vii

ABSTRACT ................................................................................................................... viii

LEMBAR PERSETUJUAN PUBLIKASI ................................................................................ ix

KATA PENGANTAR ......................................................................................................... x

DAFTAR ISI ................................................................................................................... xii

DAFTAR TABEL ............................................................................................................. xv

DAFTAR GAMBAR .........................................................................................................xvi

  

BAB I PENDAHULUAN...................................................................................................... 1

  1.1 Latar Belakang Masalah ......................................................................................... 1

  1.2 Rumusan Masalah ................................................................................................. 3

  1.3 Tujuan Penelitian ................................................................................................... 3

  1.4 Batasan Masalah ................................................................................................... 3

  1.5 Metodologi Penelitian ........................................................................................... 3

  1.6 Sistematika Penulisan ............................................................................................ 5

  

BAB II TINJAUAN PUSTAKA .............................................................................................. 6

  2.1 Penambangan Data (Data Mining) ......................................................................... 6

  2.2 Himpunan Kasar (Rough Sets) ................................................................................ 8

  2.2.1 Pendahuluan .................................................................................................. 8

  2.2.2 Ruang Hampiran dan Himpunan Kasar ............................................................ 9

  2.2.3 Discernibility Matrix...................................................................................... 12

  2.3 Pohon Keputusan (Decision Tree) ........................................................................ 13

  2.3.1 Pengertian Pohon Keputusan (Decision Tree) ................................................ 13

  2.3.3 Kekurangan Pohon Keputusan (Decision Tree) .............................................. 15

  2.4 Algoritma C4.5 ..................................................................................................... 15

  2.5 Algoritma Reduct Based Decision Tree (RDT) ........................................................ 18

  2.5.1 Algoritma RDT .............................................................................................. 18

  

2.5.2 Contoh Kasus dengan Menggunakan Algoritma Reduct Based Decision Tree

(RDT) .......................................................................................................... 20

  2.6 k-fold Cross Validation ......................................................................................... 24

  

BAB III ANALISIS DAN DESAIN ........................................................................................ 25

  3.1 Identifikasi Sistem ............................................................................................... 25

  3.2 Analisis Sistem ..................................................................................................... 25

  3.2.1 Analisis Data Awal ........................................................................................ 25

  3.2.2 Pemrosesan Awal ......................................................................................... 31

  3.3 Analisis Kebutuhan Sistem ................................................................................... 36

  3.3.1 Diagram Use Case ......................................................................................... 36

  3.3.2 Narasi Use Case ............................................................................................ 37

  3.4 Perancangan Umum Sistem ................................................................................. 44

  3.4.1 Masukan Sistem ........................................................................................... 44

  3.4.2 Proses Sistem ............................................................................................... 48

  3.4.3 Keluaran Sistem ............................................................................................ 51

  3.4.4 Diagram Aktivitas ......................................................................................... 51

  3.4.4.1 Diagram Aktivitas Input Data Sertifikasi Guru ...................................... 51

  3.4.4.2 Diagram Aktivitas Transformasi Data .................................................. 52

  3.4.4.3 Diagram Aktivitas Reduct Atribut ........................................................ 52

  3.4.4.4 Diagram Aktivitas Bentuk Pohon Keputusan........................................ 53

  3.4.4.5 Diagram Aktivitas Simpan Pola ............................................................ 53

  3.4.5 Diagram Kelas Analisis .................................................................................. 54

  3.4.6 Diagram Sekuensial ...................................................................................... 54

  3.4.6.1 Diagram Sekuensial Input Data Sertifikasi Guru ................................... 54

  3.4.6.2 Diagram Sekuensial Transformasi Data ............................................... 55

  3.4.6.3 Diagram Sekuensial Reduct Atribut ..................................................... 55

  3.4.6.4 Diagram Sekuensial Bentuk Pohon Keputusan .................................... 55

  3.4.7 Diagram Kelas Desain ................................................................................... 56

  3.4.7.1 Use Case Input Data Sertifikasi Guru ................................................... 56

  3.4.7.2 Use Case Transformasi Data ................................................................ 57

  3.4.7.3 Use Case Reduct Atribut ...................................................................... 58

  3.4.7.4 Use Case Bentuk Pohon Keputusan ..................................................... 59

  

3.4.7.5 Use Case Simpan Pola ......................................................................... 60

  3.4.8 Algoritma Method-Method Penting dalam Setiap Kelas ................................ 60

  3.4.9 Perancangan Struktur Data ........................................................................... 71

  3.4.10 Perancangan Basis Data .............................................................................. 73

  3.4.11 Perancangan Antarmuka ............................................................................ 74

  3.4.11.1 Halaman Utama .............................................................................. 74

  3.4.11.2 Halaman Preprocessing ................................................................... 74

  3.4.11.3 Halaman Reduct Atribut .................................................................. 75

  3.4.11.4 Halaman Lihat Pohon Keputusan ..................................................... 75

  

BAB IV IMPLEMENTASI SISTEM ..................................................................................... 76

  4.1 Spesifikasi Perangkat Lunak dan Perangkat Keras ................................................ 76

  4.2 Uji Validasi Sistem .............................................................................................. 76

  4.3 Implementasi Use Case ....................................................................................... 77

  

4.4 Implemantasi Diagram Kelas ................................................................................ 83

  

BAB V ANALISIS SISTEM............................................................................................... 137

  5.1 Evaluasi Pola Karya Pengembangan Profesi ....................................................... 137

  5.2 Pengukuran Kinerja Sistem ................................................................................ 141

  

5.3 Kelebihan Sistem ............................................................................................... 142

  

5.4 Kekurangan Sistem ............................................................................................ 142

  

BAB VI PENUTUP ......................................................................................................... 143

  5.1 KESIMPULAN ..................................................................................................... 143

  

5.2 SARAN ............................................................................................................... 143

DAFTAR PUSTAKA ....................................................................................................... 144

LAMPIRAN ................................................................................................................. 146

  

DAFTAR TABEL

Tabel 2.1 Contoh Database ........................................................................................... 12Tabel 2.2 Discernibility matrix untuk data pada Tabel 2.1 .............................................. 12Tabel 2.3 Matriks Boolean untuk data pada Tabel 2.1 ................................................... 13Tabel 2.4 Contoh Data Sertifikasi Guru .......................................................................... 21Tabel 2.5 Matriks Boolean (1)........................................................................................ 22Tabel 2.6 Matriks Boolean (2)........................................................................................ 23Tabel 3.1 Daftar Atribut Data Nilai Portofolio ................................................................ 26Tabel 3.2 Daftar Atribut Data Pribadi Guru .................................................................... 27Tabel 3.3 Kode Interval Nilai n1, n2, n4, n5, n6, n7, n8, n9, n10 ..................................... 33Tabel 3.4 Transformasi Atribut Pengalaman Mengajar (n3) ........................................... 34Tabel 3.5 Interval Usia ................................................................................................... 34Tabel 3.6 Kode Golongan .............................................................................................. 35Tabel 3.7 Narasi Use Case ............................................................................................. 37Tabel 3.8 Deskripsi Masukan Untuk Data Pelatihan ....................................................... 44Tabel 3.9 Deskripsi Masukan Untuk Data Uji ................................................................. 45Tabel 3.10 Pembagian Data untuk Setiap Fold ............................................................... 47Tabel 3.11 Kerangan Array dan ArrayList ....................................................................... 71Tabel 3.12 Keterangan Setiap Atribut dalam Vector ...................................................... 72Tabel 5.1 Daftar Pola dengan Jumlah Frekuensi >= 10 Kejadian .................................. 138Tabel 5.2 Hasil Pengukuran Akurasi dengan Menggunakan 5-fold cross validation ...... 141

  

DAFTAR GAMBAR

Gambar 2.1 Proses Penambangan Data........................................................................... 7Gambar 2.2 Himpunan kasar A dengan hampiran bawah K dan hampiran atas

  (A ) dalam ruang hampiran ............................................. 10

  K (A ) K  ( X , R )

Gambar 2.3 Gambaran Pohon Keputusan ..................................................................... 14Gambar 2.4 Algoritma C4.5 ........................................................................................... 16Gambar 3.1 Diagram Use Case ...................................................................................... 36Gambar 3.2 Flowchart Proses Sistem ............................................................................ 50Gambar 3.3 Diagram Konteks ........................................................................................ 50Gambar 3.4 Diagram Aktivitas Input Data Sertifikasi Guru ............................................. 51Gambar 3.5 Diagram Aktivitas Transformasi Data ......................................................... 52Gambar 3.6 Diagram Aktivitas Reduct Atribut ............................................................... 52Gambar 3.7 Diagram Aktivitas Bentuk Pohon Keputusan ............................................... 53Gambar 3.8 Diagram Aktivitas Simpan Pola ................................................................... 53Gambar 3.9 Diagram Kelas Analisis ............................................................................... 54Gambar 3.10 Diagram Sekuensial Input Data Sertifikasi Guru ........................................ 54Gambar 3.11 Diagram Sekuensial Transformasi Data .................................................... 55Gambar 3.12 Diagram Sekuensial Reduct Atribut .......................................................... 55Gambar 3.13 Diagram Sekuensial Bentuk Pohon Keputusan .......................................... 55Gambar 3.14 Diagram Sekuensial Simpan Pola .............................................................. 56Gambar 3.15 Diagram Kelas Use Case Input Data Sertifikasi Guru ................................. 56Gambar 3.16 Diagram Kelas Use Case Transformasi Data .............................................. 57Gambar 3.17 Diagram Kelas Use Case Reduct Atribut .................................................... 58Gambar 3.18 Diagram Kelas Use Case Bentuk Pohon Keputusan ................................... 59Gambar 3.19 Diagram Kelas Use Case Simpan Pola ....................................................... 60Gambar 3.20 ER Diagram .............................................................................................. 73Gambar 3.21 Halaman Utama ....................................................................................... 74Gambar 3.22 Halaman Preprocessing ............................................................................ 74Gambar 3.23 Halaman Reduct Atribut ........................................................................... 75Gambar 3.24 Halaman Lihat Pohon Keputusan.............................................................. 75Gambar 4.2 Halaman Preprocessing ............................................................................. 78Gambar 4.3 Halaman FileChooser.................................................................................. 79Gambar 4.4 Pemberitahuan File Berhasil Ditampilkan ................................................... 79Gambar 4.5 Pemberitahuan Belum Memilih File ........................................................... 80Gambar 4.6 Pemberitahuan Data Berhasil Ditransformasi ............................................. 80Gambar 4.7 Pemberitahuan Data Berhasil Direduct ....................................................... 80Gambar 4.8 Halaman Reduct Atribut ............................................................................. 81Gambar 4.9 Pemberitahuan Pohon Sudah Terbentuk .................................................... 81Gambar 4.10 Halaman Lihat Pohon ............................................................................... 82Gambar 4.11 Pemberitahuan Pola Berhasil Disimpan .................................................... 82

BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

  Pendidikan merupakan salah satu aspek yang penting dalam meningkatkan

kesejahteraan masyarakat. Pendidikan yang berkualitas ditentukan oleh beberapa

faktor. Salah satu faktor yang menentukan kualitas pendidikan adalah faktor

pendidik atau guru. Hal ini dikarenakan guru mempunyai kontribusi dan pengaruh

yang sangat besar bagi ketercapaian mutu pendidikan.

  Dalam meningkatkan kualitas pendidik, pemerintah telah mengadakan

program sertifikasi guru. Sertifikasi guru adalah proses perolehan sertifikat

pendidik bagi guru. Sertifikasi guru ini bertujuan untuk menentukan kelayakan

guru dalam melaksanakan tugas sebagai agen pembelajaran dan mewujudkan

tujuan pendidikan nasional, peningkatan proses dan mutu hasil pendidikan serta

peningkatan profesionalitas guru [1].

  Sertifikasi guru berkaitan erat dengan penyusunan portofolio. Portofolio

adalah bukti fisik (dokumen) yang menggambarkan pengalaman berkarya/prestasi

yang dicapai selama menjalankan tugas profesi sebagai guru dalam interval waktu

tertentu. Fungsi portofolio dalam sertifikasi guru adalah untuk menilai kompetensi

guru sebagai pendidik dan agen pembelajaran [2].

  Berdasarkan buku Pedoman Penyusunan Portofolio Sertifikasi Guru

Tahun 2010, portofolio guru terdiri atas 10 komponen yaitu kualifikasi akademik,

pendidikan dan pelatihan, pengalaman mengajar, perencanaan dan pelaksanaan

pembelajaran, penilaian dari atasan dan pengawas, prestasi akademik, karya

pengembangan profesi, keikutsertaan dalam forum ilmiah, pengalaman organisasi

dibidang kependidikan dan sosial, dan penghargaan yang relevan dengan bidang

pendidikan. Selain data portofolio, dalam sertifikasi juga terdapat data pribadi

  

guru yang terdiri dari nama, tempat dan tanggal lahir, jenis kelamin, golongan,

dan lain-lain.

  Pada saat ini seorang guru dituntut untuk mengembangkan profesinya.

Dengan mengembangkan profesi maka seorang guru semakin profesional dalam

mengajar. Selain itu guru juga diharapkan menghasilkan karya, sebagai contoh

adalah penelitian-penelitian di bidang pendidikan. Semakin guru mengembangkan

profesinya maka semakin berkualitas pula guru tersebut. Salah satu komponen

portofolio yang dapat menunjukkan adanya upaya pengembangan profesi guru

adalah komponen karya pengembangan profesi. Untuk mengenali profil kualitas

guru berdasarkan karya pengembangan profesinya, perlu dilakukan kajian

terhadap pola klasifikasi karya pengembangan profesi guru berdasarkan data

sertifikasi guru, yang terdiri dari komponen portofolio dan data pribadi guru yang

berupa status pns, usia, jenis kelamin, agama, golongan dan asal kecamatan guru

mengajar. Kajian tersebut dapat dilakukan dengan menerapkan teknik

penambangan data (data mining).

  Penambangan data adalah suatu proses ekstraksi pengetahuan dari

sejumlah besar data [3]. Terdapat beberapa algoritma dalam penambangan data

(data mining), salah satunya adalah algoritma Reduct Based Decision Tree (RDT).

Data sertifikasi guru yang berupa data nilai portofolio dan data pribadi guru akan

diolah dengan teknik klasifikasi menggunakan algoritma Reduct Based Decision

Tree

  (RDT). Algoritma RDT ini mengkombinasikan teori himpunan kasar dan

algoritma pohon keputusan [4]. Dengan menggunakan algoritma RDT diharapkan

terbentuk pola klasifikasi sehingga dapat dilihat bagaimana pola karya

pengembangan profesi guru berdasarkan data sertifikasi guru. Dengan demikian

pihak sertifikasi guru dapat melihat profil guru peserta sertifikasi guru.

  1.2 Rumusan Masalah Berdasarkan latar belakang masalah di atas, maka rumusan masalah yang

muncul dalam penelitian ini adalah bagaimana mengidentifikasi pola klasifikasi

karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan

menerapkan algoritma Reduct Based Decision Tree (RDT).

  1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah melakukan pencarian pola klasifikasi

karya pengembangan profesi guru berdasarkan data sertifikasi guru dengan

menerapkan algoritma Reduct Based Decision Tree (RDT).

  1.4 Batasan Masalah Dalam penelitian ini ada beberapa batasan masalah yaitu

1. Penelitian ini menerapkan algoritma Reduct Based Decision Tree (RDT).

  2. Penelitian ini menerapkan algoritma C4.5 dalam pembentukan pohon keputusan.

  3. Penelitian ini tidak menerapkan teknik pruning dalam pembentukan pohon keputusan.

  4. Data yang digunakan dalam penelitian ini adalah data sertifikasi guru di rayon 38 tahun 2010.

1.5 Metodologi Penelitian

  Metodologi yang digunakan dalam penelitian ini adalah

  1. Studi Pustaka Studi pustaka bertujuan untuk memperdalam dan memahami teori maupun metode yang akan digunakan dalam memecahkan permasalahan yang ada. Studi pustaka dilakukan dengan mencari pustaka yang referensi dan acuan dalam penyelesaian masalah. Dalam penelitian ini, pustaka yang dipelajari adalah yang berhubungan dengan penambangan data.

2. Knowledge discovery in database (KDD) yang terdiri dari [3]:

  1. Pembersihan Data (Data Cleaning) Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan.

  2. Integrasi Data (Data Integration) Integrasi data merupakan proses penggabungan data dari berbagai sumber.

  3. Seleksi Data (Data Selection) Seleksi data merupakan proses menyeleksi data dimana data yang relevan diambil dari database.

  4. Transformasi Data (Data Transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam penambangan data.

  5. Penambangan Data (Data Mining) Penambangan data merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. Dalam penelitian ini algoritma yang

digunakan adalah Reduct Based Decision Tree (RDT).

  6. Evaluasi Pola (Pattern Evaluation) Untuk mengidentifikasi pola-pola menarik yang dalam arti tertentu menyatakan basis pengetahuan.

  7. Presentasi Pengetahuan (Knowledge Presentation) Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.

1.6 Sistematika Penulisan

  Sistematika penulisan tugas akhir ini adalah sebagai berikut :

  BAB I : PENDAHULUAN Bab ini berisi latar belakang masalah, rumusan masalah, tujuan penelitian, batasan masalah, metodologi penelitian, dan sistematika penulisan.

  BAB II : TINJAUAN PUSTAKA Bab ini berisi dasar-dasar teori yang digunakan dalam penyusunan tugas akhir. BAB III : ANALISIS DAN DESAIN Bab ini berisi tentang analisis serta perancangan aplikasi penambangan data. BAB IV : IMPLEMENTASI SISTEM Bab ini berisi implementasi penerapan teknik penambangan data dalam aplikasi. : BAB V ANALISIS SISTEM Bab ini berisi analisis hasil program yang telah didapat secara . keseluruhan

  BAB VI : PENUTUP Bab ini berisi tentang kesimpulan dari hasil pembuatan aplikasi penambangan data dan saran-saran yang ditujukan kepada semua pihak yang bersangkutan.

BAB II TINJAUAN PUSTAKA

2.1 Penambangan Data (Data Mining)

  Penambangan data adalah suatu proses ekstraksi pengetahuan dari

sejumlah besar data [3]. Secara fungsional, penambangan data adalah proses dari

pengumpulan informasi penting dari sejumlah data yang besar yang tersimpan di

basis data, gudang data, atau tempat penyimpanan informasi lainnya.

  Secara sederhana, penambangan data adalah langkah-langkah dalam

mendapatkan atau menemukan pengetahuan. Penemuan pengetahuan ini

merupakan sebuah proses seperti ditunjukkan pada gambar 2.1 dan terdiri dari

urutan-urutan sebagai berikut [3] :

  1. Pembersihan Data (Data Cleaning) Pembersihan data merupakan proses untuk menghilangkan noise dan data yang tidak konsisten atau data yang tidak relevan.

  2. Integrasi Data (Data Integration) Integrasi data merupakan proses penggabungan data dari berbagai sumber.

  3. Seleksi Data (Data Selection) Seleksi data merupakan proses menyeleksi data dimana data yang relevan diambil dari database.

  4. Transformasi Data (Data Transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam penambangan data.

  5. Penambangan Data (Data Mining) Penambangan data merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data.

  7

  6. Evaluasi Pola (Pattern Evaluation) Untuk mengidentifikasi pola-pola menarik yang dalam arti tertetu menyatakan basis pengetahuan.

  7. Presentasi Pengetahuan (Knowledge Presentation) Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.

  Gambar 2.1 Proses Penambangan Data [3]

  8

2.2 Himpunan Kasar (Rough Sets)

2.2.1 Pendahuluan

  Himpunan kasar (rough sets) pertama kali diperkenalkan oleh Zdzislaw

Pawlak dari Warsaw University of Technology di Polandia pada tahun 1982

sebagai suatu metode matematis untuk mendeskripsikan himpunan tidak tegas,

dalam arti bahwa elemen-elemen tertentu dalam semestanya tidak dapat

ditentukan secara tegas apakah merupakan anggota himpunan itu atau tidak

karena elemen-elemen itu tidak dapat dibedakan satu sama lain akibat

keterbatasan atau ketidaklengkapan pengetahuan atau informasi yang tersedia

mengenai elemen-elemen itu [5].

  Pada awalnya himpunan kasar dikembangkan untuk menangani

ketidakpastian dan ketidaktegasan dalam bidang analisis data. Dasar

pengembangan teori himpunan kasar adalah asumsi bahwa setiap elemen dalam

semesta wacananya terkait dengan informasi mengenai elemen itu, dan bahwa

elemen-elemen dengan informasi yang sama adalah elemen-elemen yang

takterbedakan. Pada dasarnya pendekatan terhadap himpunan kasar adalah suatu

hampiran terhadap himpunan taktegas itu dengan menggunakan sepasang

himpunan tegas yang dikonstruksikan berdasarkan suatu partisi pada semesta

himpunan itu. Sebagai partisi biasanya diambil partisi yang terimbas oleh relasi

ekivalensi “takterbedakan” antara elemen-elemen dalam semesta itu. Dengan

demikian kelas-kelas ekivalensi dalam partisi itu memuat elemen-elemen semesta

yang takterbedakan satu sama lain. Relasi ekivalensi adalah model matematik

paling sederhana yang dapat dipergunakan untuk merepresentasikan keadaan di

mana elemen-elemen tertentu dalam suatu semesta tidak dapat dibedakan satu

sama lain, dengan mengingat bahwa relasi “takterbedakan” itu pada dasarnya

adalah suatu relasi ekivalensi, yaitu bersifat refleksif, simetrik, dan transitif.

  

Konsep himpunan kasar adalah perampatan konsep himpunan tegas, dalam arti

bahwa himpunan tegas adalah kejadian khusus dari himpunan kasar.

  9

2.2.2 Ruang Hampiran dan Himpunan Kasar

  Menurut Pawlak, misalkan X adalah suatu semesta yang takkosong, R adalah suatu relasi ekivalensi pada X, [ x ]  { yX | ( x , y )  R } adalah kelas

  R ekivalensi yang memuat x  , dan

  X X / R  {[ x ] | xX } adalah himpunan hasil- R

bagi pada X yang terimbas oleh relasi ekivalensi R, yaitu keluarga semua kelas

ekivalensi yang terimbas oleh R pada X. Pasangan K

  X R disebut ruang ( , )

hampiran, masing-masing kelas ekivalensi dalam X/R disebut himpunan elementer

atau atom dalam K, dan elemen-elemen dalam suatu himpunan elementer disebut

elemen-elemen yang takterbedakan dalam K. Dalam setiap ruang hampiran K,

himpunan kosong juga dianggap sebagai himpunan elementer. Setiap gabungan

berhingga banyak himpunan elementer dalam K disebut himpunan tersusun dalam

K .

  Jika A adalah suatu himpunan bagian dari semesta X, maka hampiran bawah dari A dalam K, dengan lambang K (A ), adalah K A x

  X R x A ( )  {[ ]  / | [ ]  }

  R Rx

  X x X x A

   {  | [ ]  } R

  …(2.1) yaitu gabungan semua himpunan elementer yang termuat dalam A. Sedangkan hampiran atas dari A dalam K, dengan lambang K adalah

  (A ), 

  K ( A )  {[ x ]  X / R | [ x ]  A  } R R

   x

  X x X x A

   {  | [ ]   } …(2.2) R yaitu gabungan semua himpunan elementer yang beririsan dengan A.

  

Hampiran bawah dari A menyajikan himpunan elemen-elemen semesta yang pasti

merupakan anggota himpunan A, sedangkan hampiran atas dari A menyajikan

himpunan elemen-elemen semesta yang mungkin merupakan anggota himpunan

A . Perhatikan bahwa K AAK A Elemen-elemen semesta yang tidak

( ) ( ).

berada dalam hampiran atas dari A adalah elemen-elemen yang pasti tidak

merupakan anggota A.

  10 Selisih hampiran atas dan hampiran bawah dari himpunan A dalam K,

   

yaitu B ( A ) K ( A ) K ( A ), disebut daerah batas dari himpunan A dalam K. Jika

  K B ( A )  ,  

   yaitu K ( A ) K ( A ) A , maka A merupakan gabungan himpunan K

elementer dalam K dan disebut himpunan yang dapat dideskripsikan secara tepat

dalam K (atau himpunan tegas dalam K). Jika B ( A )  , maka A tidak dapat

   K

dideskripsikan secara tepat dalam K dan disebut himpunan kasar dalam K. Dengan

perkataan lain, himpunan kasar adalah himpunan bagian dari semesta yang

mempunyai daerah batas yang takkosong.

  Suatu ilustrasi himpunan kasar A dengan hampiran bawah dan hampiran atasnya dalam suatu ruang hampiran K  ( X , R ) disajikan dalam Gambar 2.2.

  K

  (A )

  A K (A ) B (A ) K K = (X,R) X/R

Gambar 2.2 Himpunan kasar A dengan hampiran bawah K (A ) dan

  hampiran atas K (A ) dalam ruang hampiran K  ( X , R ) [6] Kualitas hampiran dalam suatu ruang hampiran dinyatakan dengan suatu K

  X R

ukuran ketepatan. Bila  ( , ) adalah suatu ruang hampiran dan A suatu

himpunan bagian dari X, maka banyaknya atom dalam K (A ) dan K (A ), yang

  (A ) 

disajikan dengan  dan (A ), berturut-turut disebut ukuran dalam dan ukuran

luar dari A dalam K. Jika  A   A maka A dikatakan terukur dalam K.

  ( ) ( ), Ketepatan hampiran dari A dalam K didefinisikan sebagai bilangan real  ( A )

   ( A ) 

  K

  11 di mana  A Jelas bahwa   ( A )  1 dan  ( A )  1 jika A terukur dalam

  ( )  . K K K .

  Jika K  ( X , R ) adalah suatu ruang hampiran dan A dan B adalah

himpunan bagian dari X, maka beberapa sifat penting dari hampiran bawah dan

hampiran atas adalah sebagai berikut:

    (1) K (  ) K (  ) 

    (2) K ( X ) K ( X )

  X (3) K ( A )  AK ( A )