PENCARIAN ATURAN ASOSIASI PADA DATA SERTIFIKASI GURU MENGGUNAKAN ALGORITMA APRIORI

  PENCARIAN ATURAN ASOSIASI PADA DATA SERTIFIKASI GURU MENGGUNAKAN ALGORITMA APRIORI Skripsi Diajukan Untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer Jurusan Informatika Oleh : MARGARETHA ALVIANA DEWANTI 075314015 PROGRAM STUDI TEKNIK INFORMATIKA JURUSAN TEKNIK INFORMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS SANATA DHARMA YOGYAKARTA 2012

  FINDING ASSOCIATION RULES ON TEACHER CERTIFICATION DATA BY USING APRIORI ALGORITHM A Thesis Presented as Partial Fulfillment of the Requirements To Obtain the Sarjana Komputer Degree In Informatics Engineering By : MARGARETHA ALVIANA DEWANTI 075314015

  INFORMATICS ENGINEERING STUDY PROGRAM DEPARTMENT OF INFORMATICS ENGINEERING FALCULTY OF SCIENCE AND TECHNOLOGY SANATA DHARMA UNIVERSITY YOGYAKARTA 2012

HALAMAN PERSEMBAHAN

  Karya ini saya persembahkan kepada: Tuhan Yesus, tanganMu yang berkarya, sehingga mujizat itu nyata

  Keluarga besar A.Sariyo Keluarga besar Alm. Ag. S. Kariman

  ~tiada hal yang tak mungkin di dunia ini jika kita mau berusaha~

  kado kecil buat mama-papa & ella

  

ABSTRAKSI

  Saat ini hampir setiap instansi pemerintahan maupun swasta memiliki berbagai jenis data yang berjumlah cukup banyak. Salah satu contoh data dalam jumlah banyak adalah data portofolio sertifikasi guru. Pemanfaatan data pada saat ini belum dilakukan secara maksimal, baru sebatas untuk pembuatan laporan. Data yang terkumpul dan tersimpan tersebut sebenarnya dapat diolah dan menghasilkan suatu manfaat atau informasi.

  Salah satu contoh tumpukan data yang dapat diambil informasinya adalah tumpukan data sertifikasi guru (data portofolio dan data profil guru). Dari tumpukan data tersebut dapat dicari keterkaitan antar nilai portofolio dengan data profil guru, yang kemudian hasil kombinasi tersebut dianalisis untuk mendapatkan suatu informasi. Untuk mendapatkan informasi dari tumpukan data tersebut adalah dengan cara penambangan data (data mining). Penambangan data adalah proses mengekstrak pola yang penting atau menarik dari sejumlah data yang sangat besar. Salah satu metode yang dikenal dalam penambangan data adalah analisis asosiasi (association analysis). Analisis asosiasi adalah teknik penambangan data yang bertugas menemukan aturan asosiasi antara suatu kombinasi item.

  Pada Tugas Akhir ini dibuat sebuah sistem untuk mengimplementasikan salah satu algoritma yang dapat digunakan untuk mencari aturan asosiasi yaitu algoritma Apriori. Implementasi algoritma ini akan mendapatkan pola keterkaitan antara komponen nilai portofolio guru yang mengikuti program sertifikasi guru. Ada 4 aturan yang terbentuk dari implentasi algoritma tersebut. Pertama, jika nilai kualifikasi akademik cukup rendah dan nilai prestasi akademik rendah maka nilai penghargaan yang relevan pada bidang akademik juga rendah. Kedua, jika nilai kualifikasi akademik cukup rendah maka nilai penghargaan yang relevan dengan bidang pendidikannya rendah. Ketiga, jika golongan ruang gajinya IV/A maka nilai pengembangan profesinya rendah dan nilai penghargaan yang relevan IV/A dan nilai pengembangan profesinya rendah maka nilai penghargaan yang relevan dengan bidang pendidikan juga rendah. Hasil implementasi algoritma

  

Apriori tersebut terbentuk dengan melakukan percobaan dengan nilai minimum

support antara 60% hingga 80% dan nilai minimum confidence 80 hingga 100%.

  

ABSTRACT

Currently, almost every government and private agency has different types

of data in large amount. Teacher certification portfolio data is one example of

data available in large amount. Unfortunately at present, data is limitedly used in

reports while it can actually be collected, stored and processed to produce

benefits or information.

  One example of a pile of data that can be taken as information is teacher

certification data (teacher portfolio and profile data). From these pile of data,

linkages between the value of the portfolio with the teacher profile data can be

obtained. The combined results are analyzed to obtain the required

information. To obtain the information from the data stack is by way of data

mining which is the process of extracting the important or interesting patterns

from large amounts of data. One method known in data mining is the analysis of

the association which is a data mining technique in charge of discovering

association rules between combination of items.

  At this final project, a system to implement any algorithm that can be used

to find the association rules algorithm Apriori is created. The implementation of

this algorithm will result in the pattern of linkages between components of the

portfolio value that follows the teacher certification program. There are four

rules that form the implementation algorithm.

  First, if the value is of academic

qualifications and academic achievement is low, the reward value relevant to the

academic field is also low. Second, if the value of academic qualifications is low,

the reward value relevant to the field of education is low. Third, if the resulting

grade is IV / A, the reward value of professional development and the reward

value relevant to the field of education is also low. Fourth, if the resulting grade

  

relevant to the field of education is also low. The result of the implementation of

the Apriori algorithm is formed by experimenting the minimum support between

60% to 80% and minimum confidence value of 80 to 100%.

KATA PENGANTAR

  Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, karena atas karunia berkat dan rahmatNya sehingga skripsi dengan judul Pencarian Aturan Asosiasi Pada Data Set Sertifikasi Guru Menggunakan Algoritma Apriori selesai disusun.

  Skripsi ini dapat terselesaikan juga tak lepas dari bantuan, dukungan, bimbingan serta dorongan dari banyak pihak. Oleh karena itu pada kesempatan ini penulis mengucapkan terima kasih sebesar – besarnya kepada :

  1. Ibu Paulina Heruningsih Prima Rosa, S.Si.,M.Sc, selaku Dosen Pembimbing Tugas Akhir, yang telah banyak memberikan bimbingan, dukungan,waktu dan motivasi yang mendukung terselesaikannya tugas akhir ini..

  2. Ibu Ridowati Gunawan, S.Kom., M.T, selaku Ketua Program Studi Teknik Informatika.

  3. Ibu Ridowati Gunawan, S.Kom., M.T dan Ibu Sri Hartati Wijono S.Si.,M.Kom selaku panitia penguji yang telah memberikan banyak kritik dan saran untuk tugas akhir saya.

  4. Panitia Sertifikasi Guru Rayon 38 yang telah memberikan ijin kepada penulis mengambil data sertifikasi guru guna penelitian ini.

  5. Mama, Papa , Ella atas perhatian doa, waktu, materi, saran, dukungan dan bimbingan selama penulis menyelesaikan skripsi ini.

  6. Simbah, budhe, pakdhe, bulek, om, mbak , mas, dan seluruh keluarga besar A.Sariyo dan Alm. Ag. S. Kariman atas segala doa, dan sarannya kepada penulis.

  7. Teman – teman seperjuangan Ana, Vindy, Monic, Rosa, Tendi, Mery, Ros yang telah banyak meluangkan waktunya untuk membantu dan mendukung serta memberi semangat kepada penulis selama pengerjaan skripsi.

  8. Sahabatku Endah ‘Kenuk’, Anton ‘Bow’, Om Kris ‘Jacko’, Pipin atas semangat, perhatian dan motivasinya kepada penulis

  9. Teman – teman Teknik Informatika khususnya angktan 2007, terima kasih untuk nasihat, canda tawa, motivasi, doa, semangat, perhatian dan kerbersamaannya selama 4 tahun ini.

  10. Teman-teman Palmers: Intan ‘Intun’, Lina ‘Oneng’, Vica, Ines, Monica, Galuh, Queen, Ephi, Sisil, Tika, Tyas, Esia, Dewi, Febri, keberadaan kalian telah memberikan warna-warni dalam hidupku.

  11. Seluruh staff dan dosen Teknik Informatika Universitas Sanata Dharma yang telah banyak memberikan bekal ilmu, arahan dan pengalaman selama saya menempuh studi.

  12. Seluruh staff Sekretariat Fakultas Teknik, dan Sains yang banyak membantu saya dalam urusan administrasi akademik terutama menjelang ujian tugas akhir.

  13. Staf laboran Teknik Informatika, atas bantuannya ketika penulis melakukan ujian akhir

  14. Seluruh pihak yang telah ambil bagian dalam proses penulisan tugas akhir ini yang tidak bisa penulis sebutkan satu per satu.

  Dengan rendah hati penulis menyadari bahwa tugas akhir ini masih jauh dari sempurna, oleh karena itu berbagai kritik dan saran untuk perbaikan tugas akhir ini sangat saya harapkan. Akhir kata, semoga tugas akhir ini bermanfaat bagi semua pihak. Terima kasih.

  Yogyakarta, Februari 2012 Penulis

  DAFTAR ISI

  HALAMAN JUDUL................................................................................................. i HALAMAN JUDUL................................................................................................. ii HALAMAN PERSETUJUAN.................................................................................. iii HALAMAN PENGESAHAN.................................................................................. iv PERNYATAAN KEASLIAN KARYA................................................................... v HALAMAN PERSEMBAHAN............................................................................... vi ABSTRAKSI............................................................................................................ vii ABSTRACT............................................................................................................. ix HALAMAN PERSETUJUAN PUBLIKASI............................................................ xi KATA PENGANTAR.............................................................................................. xii DAFTAR ISI............................................................................................................ xv DAFTAR GAMBAR............................................................................................... xx DAFTAR TABEL................................................................................................... xxii

  BAB I. PENDAHULUAN 1.1 Latar Belakang Masalah....................................................................

  1 1.2 Rumusan dan Batasan Masalah.........................................................

  3 1.3 Tujuan Penelitian...............................................................................

  4 1.4 Metodelogi Penelitian........................................................................

  4 1.5 Sistematika Penulisan........................................................................

  5

  BAB II. LANDASAN TEORI

  7 2.1 Penambangan Data............................................................................

  7 2.2 Analisis Asosiasi................................................................................

  9 2.3 Algoritma Apriori..............................................................................

  10 2.3.1 Contoh Penggunaan Algoritma Apriori...............................

  13 BAB III. ANALISIS DAN DESAIN SISTEM

  17 3.1 Identifikasi Sistem.............................................................................

  17 3.2 Analisis Sistem..................................................................................

  18 3.2.1 Analisis Data Awal..............................................................

  18

  21 3.2.2 Pemrosesan Awal.................................................................

  3.3 Analisis Kebutuhan Sistem................................................................

  27 3.3.1 Diagram Use Case...............................................................

  27 3.3.2 Narasi Use Case...................................................................

  27 3.4 Perancangan Umum Sistem...............................................................

  32 3.4.1 Input Sistem...........................................................................

  32 3.4.2 Output Sistem........................................................................

  32 3.4.3 Proses Sistem.........................................................................

  33 3.4.4 Perancangan Struktur Data....................................................

  34 3.4.5 Diagram Aktivitas..................................................................

  35 3.4.5.1 Diagram Aktivitas Input Data.................................

  35 3.4.5.2 Diagram Aktivitas Transformasi Data....................

  35

  3.4.5.4 Diagram Aktivitas Simpan Hasil............................

  36 3.4.6 Diagram Kelas Analisis.........................................................

  37 3.4.7 Desain Diagram Kelas...........................................................

  38

  3.4.8 Detail Algoritma Method - Method Penting Pada Tiap Kelas......................................................................................

  39 3.4.8.1 Kelas Proses_Apriori..............................................

  39 3.4.8.2 Kelas BacaData.......................................................

  43 3.4.8.3 Kelas TransformasiData.........................................

  43 3.4.8.4 Kelas Itemset..........................................................

  48 3.4.9 Diagram Sekuensial...............................................................

  52 3.4.9.1 Diagram Sekuensial Input Data..............................

  52 3.4.9.2 Diagram Sekuensial Transformasi Data.................

  52 3.4.9.3 Diagram Sekuensial Lihat Hasil.............................

  55 3.4.9.4 Diagram Sekuensial Simpan Hasil.........................

  56 3.5 Perancangan Antar Muka Pengguna..................................................

  56 3.5.1 Halaman Utama.....................................................................

  56 3.5.2 Halaman Masukan Data.........................................................

  57 3.5.3 Halaman Hasil Apriori...........................................................

  57 3.5.4 Halaman JFileChosser..........................................................

  58 BAB IV. IMPLEMENTASI SISTEM 59 4.1 Implementasi Antar Muka.................................................................

  59

  4.1.2 Halaman Masukan Data........................................................

  60 4.1.3 Halaman Proses Apriori.........................................................

  64

  4.2 Program Pencarian Aturan Asosiasi Dengan Data Set Sertifikasi Guru...................................................................................................

  67

  4.2.1 Membaca Data Dari File csv dan Menampilkannya pada Tabel......................................................................................

  67 4.2.2 Transformasi Data.................................................................

  70 4.2.3 Pencarian Frequent 1-Itemset................................................

  79 4.2.4 Pencarian Candidate k-Itemset..............................................

  81 4.2.5 Pencarian Frequent 2-Itemset................................................

  83 4.2.6 Pencarian Frequent k-Itemset................................................

  84 4.2.7 Pencarian Aturan Asosiasi Kuat (Best Rule).........................

  86 4.2.8 Menyimpan Hasil Pencarian Aturan Asosiasi.......................

  88 BAB V. ANALISIS HASIL DAN PEMBAHASAN

  90

  5.1 Percobaan Untuk Data Peserta Sertifikasi Yang Berstatus PNS Depag.................................................................................................

  90

  5.2 Percobaan Untuk Data Peserta Sertifikasi Yang Berstatus PNS Dinas..................................................................................................

  98

  5.3 Analisis Keseluruhan......................................................................... 108

  

BAB VI. KESIMPULAN DAN SARAN 112

  6.2 Saran..................................................................................................

  113 115 117

DAFTAR PUSTAKA LAMPIRAN

  

DAFTAR GAMBAR

Gambar Keterangan Halaman

  2.1 Langkah – Langkah KDD

  7 Pencarian Candidate Itemset dan Frequent Itemset dengan

  2.2

  14 Minimum Support = 60%

  3.1 Keterangan Untuk Kode Atribut Golongan

  26

  3.2 Use Case Untuk Pengguna

  27

  3.3 Diagram Konteks

  32

  3.4 Diagram Aktivitas Input Data

  35

  3.5 Diagram Aktivitas Transformasi Data

  35

  3.6 Diagram Aktivitas Lihat Hasil

  36

  3.7 Diagram Aktivitas Simpan Hasil

  36

  3.8 Diagram Kelas Analisis

  37

  3.9 Disain Diagram Kelas

  38

  3.10 Diagram Sekuensial Input Data

  52 Diagram Sekuensial Transformasi Data N1 Sampai

  3.11

  52 Dengan N10 Kecuali N3

  3.12 Diagram Sekuensial Transformasi Data Golongan

  53

  3.13 Diagram Sekuensial Transformasi Data Usia

  53

  3.14 Diagram Sekuensial Transformasi Data Jenis Kelamin

  54

  3.15

  54 Diagram Sekuensial Transformasi Data N3

  3.16 Diagram Sekuensial Lihat Hasil

  55

  3.17 Diagram Sekuensial Simpan Data

  56

  3.18 Halaman Utama

  56

  3.19 Halaman Masukan Data dan Proses Transformasi

  57

  3.20

  57 Halaman Hasil Apriori

  3.21 Halaman JFileChooser

  58

  4.1 Halaman Utama

  59

  4.2 Halaman Masukan Data(1)

  60

  4.3 Halaman JFileChooser

  61

  4.4 Halaman Masukan Data (2)

  62

  4.5 Tampilan Pesan Kesalahan (1)

  62

  4.6 Tampilan Pesan Kesalahan (2)

  63

  4.7 Tampilan Pesan Kesalahan (3)

  63

  4.8 Halaman Hasil Proses Transformasi

  64

  4.9 Halaman Proses Apriori

  65

  4.10 Tampilan Pesan Kesalahan (4)

  65

  4.11 Hasil Proses Apriori

  66

  DAFTAR TABEL

  28

  5.2 Hasil Percobaan Dengan Mengubah Nilai Minimum Confidence (Status PNS DEPAG)

  91

  5.1 Hasil Percobaan Dengan Mengubah Nilai Minimum Support (Status PNS DEPAG)

  34

  3.11 Keterangan Penggunaan Arraylist

  31

  3.10 Narasi Use Case Simpan Hasil

  30

  3.9 Narasi Use Case Lihat Hasil

  29

  3.8 Narasi Use Case Transformasi Data

  28

  3.7 Narasi Use Case Input Data

  3.6 Deskripsi Use Case

  Tabel Keterangan Halaman

  25

  3.5 Interval Usia Dan Kode Transformasinya

  25

  3.4 Kode Interval N3

  24

  3.3 Kode Interval Nilai N1 Sampe Dengan N10

  19

  3.2 Atribut Pada Data Peserta Portofolio Beserta Keterangannya

  18

  3.1 Atribut Pada Data Nilai Peserta Portofolio Beserta Keterangannya

  14

  2.2 Tabel Frequent Itemset Dengan Minimum Support =60%

  13

  2.1 Tabel Transaksi

  95

  5.3 Hasil Aturan Asosiasi Kuat Untuk Status Pns Depag

  97

  5.4 Hasil Percobaan Dengan Mengubah Nilai Minimum Support (Status PNS DINAS)

  99

  5.5 Hasil Percobaan Dengan Mengubah Nilai Minimum Confidence (Status PNS DINAS)

  103

  5.6 Hasil Aturan Asosiasi Kuat Dengan Status PNS DINAS 107

  5.7 Hasil Aturan Asosiasi Kuat (Best Rule) 108

  5.8 Frekuensi Tiap Interval dari Nilai Karya Pengembangan Profesi

  109

  5.9 Frekuensi Tiap Interval dari Nilai PEnghargaan yang Relevan dengan Bidang Pendidikan

  110

  5.10 Frekuensi Tiap Golongan 110

  6.1 Hasil Aturan Asosiasi Kuat (Best Rule) Untuk Data DINAS Dan DEPAG

  112

BAB I PENDAHULUAN

1.1 Latar Belakang

  Salah satu faktor pendukung kemajuan bangsa adalah pendidikan, karena pendidikan merupakan suatu proses dalam mencetak generasi penerus bangsa. Dunia pendidikan tak pernah lepas dari peranan para tenaga pendidik (guru). Guru adalah ujung tombak dalam suatu pendidikan. Pembangunan dan peningkatan sumber daya manusia dalam dunia pendidikan formal ada di tangan para guru. Untuk mencetak anak bangsa yang cerdas, kritis, inovatif, demokratis, dan berakhlak diperlukan guru yang berkualitas. Untuk mendukung terciptanya guru – guru yang berkualitas pemerintah mengadakan program sertifikasi guru.

  Sertifikasi guru adalah proses pemberian sertifikat pendidik kepada guru. Sertifikat pendidik diberikan kepada guru yang telah memenuhi standar profesional guru. Guru profesional merupakan syarat mutlak untuk menciptakan sistem dan praktik pendidikan yang berkualitas (Sudarto,2009). Sertifikasi bertujuan untuk meningkatkan kualitas guru. Seiring dengan itu, pemerintah memberikan tambahan insentif kepada guru-guru yang lulus sertifikasi sebagai tanda balas jasa.

  Sertifikasi guru sangat berkaitan erat dengan penyusunan portofolio. Menurut buku Pedoman Penyusunan Portofolio Sertifikasi Guru Tahun 2010, portofolio adalah bukti fisik (dokumen) yang menggambarkan pengalaman berkarya/prestasi yang dicapai selama menjalankan tugas profesi sebagai guru dalam interval waktu tertentu. Fungsi portofolio dalam sertifikasi guru dalam jabatan adalah untuk menilai kompetensi guru sebagai pendidik dan agen pembelajaran. Dalam buku tersebut terdapat 10 komponen penilaian perencanaan dan pelaksanaan pembelajaran (RPP), penilaian dari atasan dan pengawas, prestasi akademik, karya pengembangan profesi, keikutsertaan dalam forum ilmiah, pengalaman organisasi dibidang kependidikan dan sosial, dan penghargaan yang relevan dengan bidang pendidikan. Setiap komponen penilaian tersebut memiliki skor nilai tertentu seperti yang telah diatur pada buku Pedoman Penyusunan Portofolio Sertifikasi Guru Tahun 2010 pada Bagian III Rubrik Penilaian Portofolio Sertifikasi Guru Dalam Jabatan. Guru yang memiliki nilai portofolio di atas batas minimal dinyatakan lulus penilaian portofolio dan berhak menerima sertifikat pendidik. Namun, guru yang hasil penilaian portofolionya memperoleh nilai kurang sedikit dari batas minimal diberi kesempatan untuk melengkapi portofolio. Setelah lengkap guru dinyatakan lulus dan berhak menerima sertifikat pendidik. Bagi guru yang memperoleh nilai jauh di bawah batas minimal lulus wajib mengikuti pendidikan dan pelatihan (diklat) profesi guru yang akan dilaksanakan oleh perguruan tinggi yang ditetapkan oleh Menteri Pendidikan Nasiona l (Sudarto,2009).

  Selain data portofolio untuk proses sertifikasi guru juga terdapat data profil guru yang isisnya antara lain nama, tempat dan tanggal lahir, asal guru, tempat mengajar, dan lain – lain. Setelah data tersebut selesai dipergunakan untuk menentukan kelulusan sertifikasi guru, data tersebut hanya disimpan saja dan menjadi tumpukkan data. Melihat hal tersebut, penulis merasa ada sesuatu hal yang dapat dilakukan dengan tumpukan data tersebut. Namun karena ukuran data yang sangat besar, akan sangat sulit untuk menganalisanya secara manual. Oleh sebab itu diperlukan suatu cara yang dapat secara otomatis menganalisa data dan kemudian membuat kesimpulan untuk diperiksa lebih lanjut (Pramudiono,2003). Salah satu informasi yang bisa didapat dari tumpukan data tersebut adalah analisis kombinasi antar nilai dan data profil guru. Dengan mengkombinasikan data tersebut akan dicari keterkaitan antar nilai portofolio dengan profil guru. Hasil analisis dari profil (latar belakang) guru mempunyai pengaruh pada nilai – nilai portofolio atau apakah ada keterkaitan antar kesepuluh nilai itu sendiri. Namun untuk mendapatkan kombinasi nilai tersebut cukup sulit jika dilakukan secara manual karena himpunan data (data set) yang ada cukup banyak. Oleh karena itu untuk mengolah data tersebut penulis menggunakan teknik penambangan data (data mining).

  Penambangan data adalah serangkaian proses untuk mengekstrak pola yang penting atau menarik dari sejumlah data yang sangat besar berupa pengetahuan yang selama ini tidak diketahui secara manual (Han&Kamber,2006). Fungsi penambangan data adalah deskripsi, estimasi, prediksi, klasifikasi, clustering, dan analisis asosiasi (Yusuf et.al.,2006). Dari keenam fungsi tersebut penulis memilih menggunakan analisis asosiasi dengan algoritma apriori untuk mengolah data portofolio guru. Alasan penulis memilih menggunakan analisis asosiasi karena analisis asosiasi dapat digunakan untuk menemukan korelasi antar komponen (atribut) dalam suatu

  data set dan menurut Erwin(2009), algoritma apriori mudah untuk dipahami

  dan diimplementasikan dibandingkan dengan algoritma yang lainnya yang memang diterapkan untuk proses association rule. Analisis asosiasi atau

  association rule mining adalah teknik data mining untuk menemukan aturan

  asosiatif antara suatu kombinasi item (Kusrini,2009). Sedangkan algoritma yang akan digunakan untuk analisis asosiasi ini adalah apriori. Apriori adalah suatu algoritma yang mencari frequent itemset. Itemset adalah sekumpulan item. Frequent itemset adalah suatu itemset yang memenuhi

  minimum support (min_support) tertentu (Ernawati,2007).

1.2 Rumusan dan Batasan Masalah

  Berdasarkan latar belakang di atas maka didapatkan rumusan masalah dan batasan masalah sebagai berikut: Rumusan masalah : Bagaimana mencari hubungan antar nilai dengan latar belakang guru pada

  data set sertifikasi guru dengan menggunakan metode analisis asosiasi

  dengan algoritma apriori? Batasan masalah :

  a. Tugas penambangan data (data mining task) yang digunakan adalah analisis asosiasi dengan algoritma apriori.

  b. Data set yang digunakan dalam penelitian ini adalah data sertifikasi guru tahun 2010 pada rayon 38.

  1.3 Tujuan Penelitian

  Tujuan dari penelitian ini adalah untuk mengetahui hubungan antar nilai dan latar belakang guru pada data sertifikasi guru dengan menggunakan tugas penambangan data analisis asosiasi dengan algoritma apriori.

  1.4 Metodologi Penelitian

  Berikut ini langkah – langkah penelitian yang dilakukan oleh penulis :

  1. Studi Pustaka Studi pustaka dilakukan untuk mencari teori – teori yang akan dipergunakan dalam penelitian ini.

  2. Melakukan penambangan data untuk menemukan atau mendapatkan pengetahuan atau pola pada sejumlah data atau Knowledge Discovery

  In Database (KDD) dengan langkah – langkah sebagai berikut (Han

  & Kamber,2006) :

  1. Pembersihan data (data cleaning) Menghilangkan noise dan data yang tidak konsisten atau data tidak relevan.

  2. Integrasi data (data integration) Penggabungan data dari berbagai sumber

  3. Pemilihan data (data selection) Memilih data yang sesuai untuk dianalisis dari database.

  4. Transformasi data (data transformation) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam penambangan data.

  5. Penggalian data (data mining) Proses esensial dengan mengaplikasikan metode yang diterapkan untuk mengekstrak pola data.

  6. Evaluasi pola (pattern evaluation) Untuk mengidentifikasi pola-pola menarik kedalam knowledge based yang ditemukan.

  7. Penyajian pola (knowledge presentation) Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. .

1.5 Sistematika Penulisan

  Sistematika penulisan tugas akhir ini adalah sebagai berikut :

Bab I. Pendahuluan Bab ini berisi latar belakang, rumusan masalah, batasan masalah, tujuan, metodologi, dan sistematika penulisan. Bab II. Landasan Teori

  analisis asosiasi dengan algoritma apriori guna menemukan aturan asosiasi pada data set nilai portofolio guru peserta sertifikasi.

  Bab III. Analisis dan Perancangan Penambangan Data Dalam bab ini nantinya akan diidentifikasikan masalah yang akan

  diselesaikan serta tahap tahap penyelesaian masalah tersebut dengan menggunakan algoritma apriori. Dalam bab ini pula akan dijelaskan perancangan program implementasi penambangan data dengan algoritma apriori.

  Bab IV. Implementasi Penambangan Data Bab ini memuat implementasi algoritma apriori. Bab V. Analisa Hasil dan Pembahasan Bab ini berisi analisa hasil program dan pembahasan masalah berdasarkan hasil yang telah didapat secara keseluruhan. Bab VI. Kesimpulan dan Saran Bab ini berisi kesimpulan dan saran dari hasil analisis serta pembahasan masalah berdasarkan hasil yang telah didapat.

BAB II LANDASAN TEORI Dari latar belakang, tujuan dan rumusan masalah di atas terdapat beberapa hal yang belum jelas pengertiannya dan perlu untuk didefinisikan lebih lanjut. Dalam bab ini akan dijelaskan satu – per satu maksud dari beberapa pengertian

  yang ada pada BAB 1. Adapun hal – hal yang harus dijabarkan lebih dalam antara lain penambangan data, analisis asosiasi dan algoritma apriori.

2.1 Penambangan Data

  Penambangan data atau data mining adalah proses menemukan informasi yang berguna dengan cara otomatis pada repositori data yang besar (Tan et.al.,2006). Sebenarnya penambangan data merupakan suatu langkah dalam knowlegde discovery in databases (KDD). Knowledge discovery sebagai suatu proses terdiri atas pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation), data mining, evaluasi pola (pattern evaluation) dan penyajian pengetahuan (knowledge presentation) (Ayub,2007). Tahap – tahap tersebut diilustrasikan pada gambar 2.1 berikut ini :

Gambar 2.1 Langkah – Langkah KDD Penambangan data dapat menjalankan fungsi – fungsi berikut ini (Rochmah,2010) :

  a. Deskripsi Pola dan trend data sering dideskripsikan. Deskripsi tersebut membantu dalam menjelaskan pola dan trend yang terjadi. Model penambangan data harus setransparan mungkin, dimana hasilnya dapat mendeskripsikan pola dengan jelas.

  b. Estimasi Estimasi hampir sama dengan klasifikasi hnaya saja pada estimasi variabel targetnya harus numerik. Model yang dibangun menggunakan record yang lengkap, yang menyediakan nilai variabel target dan predictor. Untuk observasi yang baru, estimasi nilai variabel target ditentukan berdasarkan nilai – nilai predictor.

  c. Prediksi Prediksi hampir sama dengan klasifikasi dan estimasi. Namun hasil dari prediksi terjadi di masa depan.

  d. Klasifikasi Dalam klasifikasi variabel targetnya merupakan kategorikal. Model penambangan data memeriksa set record yang besar, dan setiap record mempunyai informasi variabel target dan set input atau variabel predictor.

  e. Clustering

  Clustering merupakan pengelompokkan record, observasi, atau kasus ke

  dalam kelas-kelas objek yang mirip. Clustering berbeda dengan klasifikasi karena di dalam clustering tidak terdapat variabel target.

  Clustering mencoba mensegmentasi seluruh data set ke dalam subgroup

  atau cluster yang relatif homogen, dimana kemiripan antar record dalam cluster dimaksimalisasi dan kemiripan record di luar cluster diminimalisasi. f. Asosiasi Asosiasi merupakan sebuah teknik data mining yaitu melakukan pencarian atribut mana yang digabungkan bersama. Tugas asosiasi mencoba untuk menemukan aturan untuk mengkuantifikasi hubungan antara dua atau lebih atribut. Aturan asosiasi berbentuk “If antecedent,

  then consequent”, bersama-sama dengan ukuran support dan confidence yang berhubungan dengan aturan.

2.2 Analisis Asosiasi

  Analisis asosiasi atau association rule mining adalah suatu prosedur untuk mencari hubungan antar item dalam suatu data set yang ditentukan (Han& Kamber,2006). Menurut Ulmer(2002), langkah analisis asosiasi meliputi 2 tahap yaitu:

  1. Mencari kombinasi yang paling sering terjadi dari suatu itemset.

  2. Mendefinisikan condition dan result (untuk conditional association rule).

  Dalam menentukan suatu association rule (Budhi&Lim,2005), terdapat suatu interestingness measure (ukuran kepercayaan) yang didapatkan dari hasil pengolahan data dengan perhitungan tertentu. Umumnya ada dua ukuran, yaitu (Budhi&Lim,2005):  Support: suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item/itemset dari keseluruhan transaksi. Ukuran ini menentukan pakah suatu item/itemset layak untuk dicari confidence-nya (misal, dari keseluruhan transaksi yang ada, seberapa besar tingkat dominasi yang menunjukkan bahwa item A dan B dibeli bersamaan).

   Confidence: suatu ukuran yang menunjukkan hubungan antar 2 item secara conditional (misal, seberapa sering item B dibeli jika orang membeli item A).

  Kedua ukuran ini nantinya berguna dalam menentukan aturan asosiasi yang menarik, yaitu untuk dibandingkan dengan batasan (treshold) yang ditentukan oleh user. Batasan tersebut umumnya terdiri dari minimum support (min_support) dan minimum confidence (min_confidence).

  Support dari aturan adalah rasio dari record yang

  mengandung dengan total record dalam basisdata. Untuk mendapatkan nilai support dapat menggunakan rumus : ................................................(2.1)

  Sedangkan min_support (minimum support) menandakan ambang batas (threshold) yang menentukan apakah sebuah itemset akan digunakan pada perhitungan selanjutnya untuk pencarian aturan asosiasi.

  Confidence dari aturan asosiasi adalah rasio dari record yang

  mengandung dengan total record yang mengandung . Untuk mendapatkan nilai confidence dapat menggunakan rumus : ............................................(2.2)

  Atau dapat ditulis sebagai berikut: ..............(2.3).

  Sedangkan min_confidence (minimum confidence) menandakan ambang batas (threshold) dari sebuah aturan asosiasi untuk menentukan aturan asosiasi yang kuat (strong association rule) (De’e Bhia, Edeltrudis,2010).

2.3 Algoritma Apriori

  Menurut Kusrini & Luthfi (2009), algoritma apriori termasuk jenis aturan asosiasi pada data mining. Selain apriori, yang termasuk pada golongan ini adalah metode generalized rule induction dan algoritma hash

  based. Aturan yang menyatakan asosiasi antara beberapa atribut sering prinsip apriori, yaitu jika suatu itemset merupakan frequent itemset maka semua subset-nya akan berupa frequent itemset (Tan, et.al. 2006). Pembentukan frequent itemset dilakukan dengan mencari semua kombinasi

  item – item yang memiliki support lebih besar atau sama dengan minsup yang telah ditentukan.

  Beberapa istilah yang digunakan dalam algoritma apriori antara lain (Yulita,2004) :

  a. Support (dukungan): probabilitas pelanggan membeli beberapa produk secara bersamaan dari seluruh transaksi. Support untuk aturan “X=>Y” adalah probabilitas atribut atau kumpulan atribut X dan Y yang terjadi bersamaan.

  b. Confidence (tingkat kepercayaan): probabilitas kejadian beberapa produk dibeli bersamaan dimana salah satu produk sudah pasti dibeli. Contoh: jika ada n transaksi dimana X dibeli, dan ada m transaksi dimana X dan Y dibeli bersamaan, maka confidence dari aturan if X then Y adalah m/n.

  c. Minimum support: parameter yang digunakan sebagai batasan frekuensi kejadian atau support count yang harus dipenuhi suatu kelompok data untuk dapat dijadikan aturan.

  d. Minimum confidence: parameter yang mendefinisikan minimum level dari confidence yang harus dipenuhi oleh aturan yang berkualitas.

  e. Itemset: kelompok produk.

  f. Support count: frekuensi kejadian untuk sebuah kelompok produk atau itemset dari seluruh transaksi.

  g. Kandidat itemset: itemset-itemset yang akan dihitung support count-nya.

  h. Large itemset: itemset yang sering terjadi, atau itemset-itemset yang sudah melewati batas minimum support yang telah diberikan.

  Sedangkan notasi-notasi yang digunakan dalam algoritma apriori antara lain: a. C adalah kandidat k-itemset, dimana k menunjukkan jumlah pasangan

  k item.

  b. L adalah large k-itemset.

  k

  Ada dua proses utama yang dilakukan algoritma apriori, yaitu (Yulita ,2004):

  1. Join (penggabungan): untuk menemukan L , C dibangkitkan dengan

  k k

  melakukan proses join L dengan dirinya sendiri, C =L *L lalu

  k-1 k k-1 k-1, anggota C diambil hanya yang terdapat didalam L . k k-1

  2. Prune (pemangkasan): menghilangkan anggota C yang memiliki

  k support count lebih kecil dari minimum support agar tidak dimasukkan ke dalam L . k

  Langkah-langkah dari algoritma apriori adalah sebagai berikut (Ulmer, David, 2002): 1. Set k=1 (menunjuk pada itemset ke-1).

  2. Hitung semua k-itemset (itemset yang mempunyai k item), untuk mendapatkan candidate 1-itemset.

  3. Hitung support dari semua calon itemset kemudian filter itemset tersebut berdasarkan perhitungan minimum support, untuk mendapatkan frequent

  1-itemset.

  4. Gabungkan semua itemset berukuran k untuk menghasilkan calon itemset k+1 atau candidate k-itemset.

  5. Set k=k+1.

  6. Ulangi langkah 3-5 sampai tidak ada itemset yang lebih besar yang dapat dibentuk.

  7. Buat final set dari itemset dengan menciptakan suatu union dari semua k-

2.3.1 Contoh Penggunaaan Algoritma Apriori

  Berikut akan ditunjukkan cara kerja algoritma apriori untuk menemukan frequent itemset dan pembangkitan aturan asosiasi menggunakan data dari tabel transaksi yang diambil dari Tan,et.al.(2006). Minimum support dan minimum confidence yang ditentukan berturut – turut 60% dan 70%.

Tabel 2.1 Tabel Transaksi

  

TID Itemset

  1 {Bread,Milk,Diapers} 2 {Bread,Diapers,Beer,Eggs} 3 {Milk,Beer,Coke} 4 {Bread,Milk,Diapers,Beer} 5 {Bread,Milk,Diapers,Coke}

  Dari tabel diatas maka proses pencarian frequent itemset dengan algoritma apriori adalah sebagai berikut:

  Candidate 1- itemset Count Suppor t (%)

  Frequent 1- itemset Count Support (%)

  {Beer} 3 60% {Beer} 3 60% {Bread} 4 80% {Bread} 4 80% {Coke} 2 40% {Diapers} 4 80% {Diapers} 4 80% {Milk} 4 80% {Milk} 4 80% {Eggs} 1 20%

  Candidate 2- itemset Count Suppor t (%)

  Frequent 2- itemset Count Support (%)

  {Beer,Bread} 2 40% {Bread,Diapers} 4 80%

  {Beer,Milk} 2 40% {Diapers,Milk} 3 60% {Bread,Diapers} 4 80% {Bread,Milk} 3 60% {Diapers,Milk} 3 60%

  Candidate 3- itemset Count Suppor t (%)

  Frequent 3- itemset Count Support (%)

  {Bread,Diapers, Milk} 3 60% {Bread,Diapers,

  Milk} 3 60%

Gambar 2.2 Pencarian candidate itemset dan frequent itemset dengan

  minimum support = 60%

  Berdasarkan pencarian frequent itemset diatas maka dapat dibuat tabel frequent itemset sebagai berikut :

Tabel 2.2 Frequent itemset dengan minimum support = 60%

  Frequent itemset Count Support(%)

  {Bread,Milk} {Diapers,Milk} {Bread,Diapers,Milk} 3 60% {Bread} {Diapers} {Milk} {Bread,Diapers} 4 80%

  Dari contoh di atas dapat dilihat bahwa bila nilai minsup diturunkan maka akan banyak candidate itemset yang terbentuk dan kardinalitas itemset yang lebih besar lagi, sehingga menyebabkan banyak pengulangan. Tetapi nilai minsup yang besar akan menyebabkan sedikit ditemukan frequent itemset sehingga menjadikan algoritma ini efisien, karena sedikit sekali melakukan proses pembacaan basisdata dan perhitungan nilai support.

  Sehingga dengan frequent itemset yang ditemukan diatas dapat diproses sebagai berikut :

  Subset dari frequent itemset : {Bread} ,{Diapers}, {Milk},

  {Bread,Diapers}, {Bread,Milk}, {Diapers,Milk}, {Bread,Diapers,Milk}. Dari subset yang ada dapat dibentuk aturan asosiasi sebagai berikut :

  a. Bread ⇒ Diapers

  

c (Bread⇒Diapers)= s (Bread,Diapers)/s Bread

  = 80/80 =100%

  b. Diapers ⇒ Bread

  c (Diapers⇒Bread)=s (Bread,Diapers)/s Diapers

  =80/80 =100%

  c. Bread ⇒ Milk

  

c (Bread⇒Milk) =s (Bread,Milk)/s Bread

  =60/80 =75%

  d. Milk ⇒ Bread

  c (Milk⇒Bread) =s (Bread,Milk)/s Milk

  =60/80 =75%

  e. Diapers ⇒Milk

  

c (Diapers⇒Milk) =s (Diapers,Milk)/s Diapers

  =60/80 =75%

  f. Milk ⇒Diapers

  

c (Milk⇒Diapers) =s (Diapers,Milk)/s Milk

  =60/80 g. Bread ⇒ Diapers & Milk