Penerapan data mining untuk penilaian kinerja PNS pada BKPP Kabupaten Gayo Lues menggunakan metode clustering

  PENERAPAN DATA MINING UNTUK PENILAIAN KINERJA PNS PADA BKPP KABUPATEN GAYO LUES MENGGUNAKAN METODE CLUSTERING SKRIPSI

  Diajukan untuk Menempuh Ujian Akhir Sarjana

ERVAN FAUZI PRANASTA 10110681 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS KOMPUTER INDONESIA 2015

KATA PENGANTAR

  Puji dan syukur penulis panjatkan kehadirat Allah SWT atas rahmat dan karunia- Nya sehingga penulis dapat menyelesaikan skripsi yang berjudul Penerapan Data Mining untuk Penilaian kinerja PNS pada BKPP Kabupaten Gayo Lues Menggunakan Metode Clustering.

  Penyusunan skripsi ini tidak akan terwujud tanpa mendapat dukungan, dan masukan dari berbagai pihak. Untuk itu, penulis ingin menyampaikan terimakasih yang sebesar-besarnya kepada : 1.

  Kedua orang tua dan keluarga besar penulis yang sudah memberikan do’a, dukungan, kasih sayang dan motivasi, sehingga penulis dapat menyelesaikan tugas akhir ini.

  2. Ibu Dian Dharmayanti, S.T., M.Kom. selaku dosen pembimbing, yang telah banyak memberikan arahan, saran dan bimbingan kepada penulis.

  3. Ibu Nelly Indriani W, S.Si., M.T. Selaku dosen wali penulis yang telah banyak memberikan ilmu, bantuan dan motivasi kepada penulis.

  4. Bapak dan Ibu dosen Program Studi Teknik Informatika yang telah ikhlas memberikan ilmu dan bantuan kepada penulis selama kuliah.

  5. Retno Widyastuti, Dadan Setiadi, Windia Septianti, Khaerur rizki, Firman Hidayat, Dinda Wilanda dan teman-teman seperjuangan penulis di Jurusan Teknik Informatika yang telah banyak memberikan dukungan selama proses pengerjaan laporan Tugas Akhir ini.

  Akhir kata, semoga skripsi ini dapat bermanfaat bagi pembaca.

  Bandung, Februari 2015 Ervan Fauzi Pranasta

  

DAFTAR ISI

  ABSTRAK ............................................................................................................... i ABSTRACT ............................................................................................................ ii KATA PENGANTAR ........................................................................................... iii DAFTAR GAMBAR ............................................................................................ vii DAFTAR TABEL ................................................................................................ viii DAFTAR SIMBOL .................................................................................................. x DAFTAR LAMPIRAN ........................................................................................ xiii

  BAB I PENDAHULUAN ........................................................................................ 1 I.1 Latar Belakang Masalah ........................................................................... 1 I.2 Identifikasi Masalah ................................................................................. 3 I.3 Maksud dan Tujuan .................................................................................. 3 I.4 Batasan Masalah ....................................................................................... 3 I.5 Metodologi Penelitian .............................................................................. 4 I.5.1 Metode Pengumpulan Data ................................................................... 4 I.5.2 Metode Pembangunan Perangkat Lunak .............................................. 5 I.6 Sistematika Penulisan ............................................................................... 7 BAB II TINJAUAN PUSTAKA .............................................................................. 9 II.1 Profil Instansi ........................................................................................... 9 II.1.1 Sejarah Instansi .......................................................................................... 9 II.1.2 Visi dan Misi ............................................................................................ 10 II.1.3 Struktur Organisasi .................................................................................. 11 II.2 Landasan Teori ....................................................................................... 12 II.2.1 Basis Data ................................................................................................ 12 II.2.2 Database Management System (DBMS) ................................................. 13 II.2.3 Data Mining ............................................................................................. 13 II.2.4 Metode Klastering (Clustering) ............................................................... 15 II.2.5 K-means ................................................................................................... 15 II.3 Alat-alat Pemodelan Sistem ................................................................... 19

  II.3.1 Diagram Konteks ..................................................................................... 19

  II.3.2 Data Flow Diagram (DFD) ...................................................................... 19

  II.3.3 Entity Relation Diagram (ERD) .............................................................. 20

  II.4 Alat-alat Pembangunan Perangkat Lunak .............................................. 21

  II.4.1 C# ............................................................................................................. 21

  II.4.2 Mysql ....................................................................................................... 23

  BAB III ANALISIS DAN PERANCANGAN ...................................................... 25 III.1 Analisis Sistem ....................................................................................... 25 III.1.1 Analisis Masalah .................................................................................... 25 III.1.2 Analisis Sistem yang sedang Berjalan .................................................... 26 III.1.2.1 Proses Perolehan nilai DP3 ................................................................. 26 III.1.2.2 Proses Pengelompokan PNS ............................................................... 29 III.1.2.3 Aturan Bisnis ....................................................................................... 30 III.1.3 Analisis Dokumen .................................................................................. 30 III.1.4 Analisis Preprocessing Data .................................................................. 36 III.1.5 Analisis Penerapan Algoritma ................................................................ 37 III.1.6 Analisis Kebutuhan Non Fungsional ...................................................... 47 III.1.6.1 Analisis Kebutuhan Perangkat Keras .............................................. 47 III.1.6.2 Analisis Kebutuhan Perangkat Lunak ............................................. 48 III.1.6.3 Analisis Kebutuhan Pengguna ........................................................ 49 III.1.7 Analisis Basis Data ................................................................................. 49 III.1.8 Analisis Kebutuhan Fungsional .............................................................. 50 III.1.8.1 Diagram Konteks ............................................................................ 50 III.1.8.2 Data Flow Diagram (DFD) ............................................................. 51 III.1.9 Spesifikasi Proses ................................................................................... 55 III.1.10 Kamus Data DFD ................................................................................. 60 III.2 Perancangan Sistem ................................................................................ 62 III.2.1 Perancangan Basis Data ......................................................................... 62 III.2.1.1 Skema Relasi ................................................................................... 62 III.2.1.2 Struktur Tabel.................................................................................. 63 III.2.2 Perancangan Struktur Menu ................................................................... 65

  III.2.3 Perancangan Antar Muka ....................................................................... 66

  III.2.4 Perancangan Pesan ................................................................................. 69

  III.2.5 Jaringan Semantik .................................................................................. 70

  III.2.6 Perancangan Prosedural ......................................................................... 71

  III.2.6.1 Prosedur Import Data ...................................................................... 71

  III.2.6.2 Prosedur Pengelompokan ................................................................ 72

  BAB IV IMPLEMENTASI DAN PENGUJIAN ................................................... 74 IV.1 Implementasi Sistem .............................................................................. 74 IV.1.1 Implementasi Perangkat Keras ........................................................... 74 IV.1.2 Implementasi Perangkat Lunak .......................................................... 74 IV.1.3 Implementasi Form ............................................................................. 75 IV.1.4 Implementasi Basis Data .................................................................... 76 IV.2 Pengujian Sistem .................................................................................... 78 IV.2.1 Rencana Pengujian .............................................................................. 78 IV.2.2 Pengujian Black Box .......................................................................... 79 IV.2.3 Pengujian K-Means Secara Manual Menggunakan Data Sampel ...... 85 IV.2.1 Pengujian Beta .................................................................................... 87 IV.3.1 Kesimpulan Pengujian ........................................................................ 88 BAB V KESIMPULAN DAN SARAN ................................................................. 89 DAFTAR PUSTAKA ............................................................................................ 90

DAFTAR PUSTAKA

  [1] A. Rahadinata, "Pengelompokam bimbingan belajar menggunaka metode clustering di SMA Negeri 1 Cilaku Kabupaten Cianjur," Perpustakaan

  UNIKOM, 2013.

  [2] S. Susanto and D. Suryadi, Pengantar Data Mining. Yogyakarta: Penerbit Andi, 2010. [3] Fathansyah, BASIS DATA - Edisi Revisi, 2nd ed. Bandung, Indonesia: Informatika Bandung, 2012. [4] Prasetyo, Eko, DATA MINING - Konsep dan Aplikasi Menggunakan

MATLAB, Nikodemus, Ed. Yogyakarta, Indonesia: Penerbit ANDI, 2012.

[5] M. S. Bancin, "Implementasi Metode K- Means Clustering Dan Metode

  Analytical Hierarchy Process (AHP) Dalam Penilaian Kedisiplinan Siswa (Studi Kasus : SMP Negeri 21 Medan)," http://repository.usu.ac.id/handle/123456789/41614, Sep. 2014.

  [6] P. Yudi Agusta, "K-Means

  • – Penerapan, Permasalahan," Jurnal Sistem dan Informatika Vol. 3, pp. 47-60, Feb. 2007.

  [7] wikibooks.org, "Data Mining Algorithms In R/Clustering/K-Means,"

  

http://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R/Clustering/K-

Means.

  [8] Ian H.Witten, Eibe Frank, and M. A. H. Unknown, "Pracrtical Machine Learning Tools and Techniques," in Data Mining, 2011, pp. 273-304. [9] R. Black, "Pengertian dan Contoh Dari Context Diagram, Data Flow Diagram, dan Flow Map".

BAB I PENDAHULUAN I.1 Latar Belakang Masalah Badan Kepegawaian Pendidikan dan Pelatihan (BKPP) kabupaten Gayo

  lues merupakan salah satu dinas yang bertugas untuk proses penataan sumber daya manusia (SDM) pegawai negri sipil (PNS) di kabupaten Gayo lues. Tugas pokok dari dinas ini adalah mengawasi, mengarahkan, merencanakan, melaksanakan dan mengendalikan pegawai negri sipil dalam penempatan kerja (mutasi), pendidikan, pelatihan serta pembinaan pegawai di lingkungan Pemerintahan Kabupaten Gayo lues. Penataan sumber daya manusia merupakan sebuah langkah strategis dalam pembangunan suatu organisasi atau instansi guna mendapat peningkatan kualitas kerja. Proses penataan sumber daya manusia harus dikelola secara efektif, maka dibutuhkan pengetahuan lebih tentang kualifikasi seseorang dan kemampuan untuk mengelolanya.

  Berdasarkan hasil wawancara dengan kepala bidang (kabid) Informasi dan Data Kepegawaian di dinas BKPP Kabupaten Gayo lues. Pihak BKPP menyadari betapa pentingnya pengembangan sumber daya manusia di Kabupaten Gayo lues, maka perhatian BKPP Kabupaten Gayo lues lebih ditujukan untuk peningkatan kualitas kerja dengan mengadakan Program pembinaan, pelatihan, pengembangan kompetensi, beasiswa untuk melanjutkan jenjang pendidikan dan pemberian penghargaan bagi PNS yang berprestasi. Setiap PNS memiliki kemampuan dan kualifikasi yang berbeda satu sama lain, maka perlu dikelompokan terlibih dahulu menurut kualitas yang mereka miliki supaya lebih tepat dalam pembinaan, pelatihan dan pengembangan kualitas kerja PNS tersebut. Maka dari itu pihak BKPP berencana melakukan pengelompokan PNS berdasarkan data penilaian pelaksanaan pekerjaan PNS yang dilakukan secara khusus oleh atasan masing- masing instansi. Akan tetapi ada permasalahan yang dihadapi, pihak BKPP kesulitan dalam mengelompokan Pegawai negri sipil yang memiliki kemampuan dan kualifikasi yang tepat berdasarkan data tersebut. Permasalahan ini terjadi karena Banyaknya nilai yang digunakan sebagai pembanding dan data tersebut tidak memungkinkan untuk diolah menggunakan Microsoft Office Excel yang saat ini digunakan Dinas BKPP Kabupaten Gayo Lues, karena pada Microsoft Office Excel untuk menampilkan data hasil perhitungan harus dibuat sebanyak jumlah baris atau kolom yang akan dihitung sedangkan data yang akan diolah berjumlah ribuan Akibatnya Proses pengelompokan yang dilakukan selama ini menjadi lebih lama dan membutuhkan ketelitian dalam pengolahan data agar hasil pengolahan data tidak rusak.

  Data mining merupakan metode untuk mencari informasi baru yang

  berguna dari sekumpulan data yang berjumlah besar dan dapat membantu dalam mengambil keputusan. Dalam data mining terdapat beberapa metode yaitu estimation, prediction, classification, clustering dan association. Dalam penelitian ini akan diterapkan metode clustering dengan algoritma k-means. Clustering merupakan teknik mengelompokan data dengan melakukan pemisahan data ke dalam sejumlah kelompok menurut karakteristik tertentu yang diinginkan dimana label dari setiap data belum diketahui dan dengan pengelompokan tersebut diharapkan dapat mengetahui kelompok data untuk kemudian diberi label sesuai permasalahan yang dihadapi.

  Berdasarkan masalah diatas, BKPP Kabupaten Gayo lues berencana untuk membagi kelompok PNS berdasarkan kemampuan dan klasifikasi yang dimiliki PNS tersebut untuk selanjutnya dapat diberi pembinaan, pelatihan, pengembangan kompetensi dan pemberian penghargaan. Pembagian kelompok tersebut meliputi komponen pengelompokan antara lain nilai kesetiaan, prestasi, tanggung jawab, ketaatan, kejujuran, kerjasama, prakarsa dan kepemimpinan. Pembagian kelompok ini akan dibantu sebuak aplikasi hasil dari implementasi data mining menggunakan metode clustering yang dapat mengelompokan pegawai negri sipil untuk mendapatkan label dari setiap kelompok.

  I.2 Identifikasi Masalah

  Berdasarkan latar belakang masalah maka diidentifikasi sebuah masalah yaitu bagaimana cara membangun sebuah sistem mengunakan data mining untuk membagi kelompok PNS berdasarkan kemampuan dan kualifikasi yang dimilikinya untuk diberi pembinaan, pelatihan, pengembangan kompetensi dan pemberian penghargaan pada PNS tersebut.

  I.3 Maksud dan Tujuan

  Berdasarkan permasalahan yang diteliti, maka maksud dari penelitian ini adalah Membangun aplikasi data mining yang dapat mengelompokan kualitas PNS dengan mengimplementasikan metode clustering. Sedangkan tujuan yang akan dicapai dalam penelitian adalah : 1.

  Memudahkan BKPP dalam mengelompokkan PNS yang memiliki kemampuan sama berdasarkan hasil penilaian DP3.

  2. Membantu pihak BKPP dalam menentukan PNS yang akan menjalani pembinaan, pelatihan, pengembangan kompetensi dan pemberian penghargaan.

  I.4 Batasan Masalah

  Berdasarkan latar belakang masalah yang telah diuraikan sebelumnya, maka dibuat batasan masalah agar penyajian lebih terarah dan mencapai sasaran yang ditentukan. Adapun batasan masalah yang dibuat adalah sebagai berikut: 1.

  Data yang digunakan adalah Daftar penilaian pelaksanaan pekerjaan (DP3) pada BKPP Kabupaten Gayo Lues tahun 2012

  2. Proses yang akan dilakukan sebatas pengelompokan PNS berdasarkan data penilaian pelaksanaan pekerjaan yang dilakukan oleh kepala bagian dari setiap instansi

  3. Informasi yang dihasilkan adalah kelompok PNS yang memiliki kemampuan dan kualifikasi untuk diberi pembinaan, pelatihan, pengembangan kompetensi dan pemberian penghargaan pada PNS tersebut 4. Metode yang digunakan adalah metode aliran terstruktur dengan menggunakan tools Data Flows Diagram (DFD) dan Entity Relationship

  Diagram (ERD) 5.

  Database yang digunakan yaitu MySQL 6. Aplikasi dibangun menggunakan C#.

7. Metode Clustering yang diimplementasikan menggunakan Algoritma K- means.

  I.5 Metodologi Penelitian

  Metodologi penelitian yang akan digunakan dalam pembuatan skripsi ini menggunakan metodologi deskriptif, yaitu metode penelitian yang bertujuan untuk mendapatkan gambaran yang jelas tentang hal-hal yang dibutuhkan dan berusaha menggambarkan serta menginterpretasi objek yang sesuai dengan fakta secara sistematis dan akurat.

  I.5.1 Metode Pengumpulan Data

  Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut: a.

  Studi Literatur Pengumpulan data dengan cara mempelajari Jurnal, browsing internet, buku referensi, dan bacaan-bacaan lainnya yang berhubungan erat dengan judul penelitian.

  b.

  Wawancara Teknik pengumpulan data dengan cara tanya jawab secara langsung Dengan Bapak Ajang saeful millah selaku pihak yang bertanggung jawab di dinas BKPP kabupaten gayo lues.

I.5.2 Metode Pembangunan Perangkat Lunak

  Metode yang digunakan dalam Pembangunan sistem pengelompokan pegawai negri sipil ini adalah menggunakan model waterfall. Berikut ini beberapa tahapan model waterfall yang digambarkan pada diagram [1]:

  

Gambar I.1 Model Waterfall

  a) System Engineering

  Tahapan System Engineering Merupakan bagian terbesar dalam pengerjaan suatu proyek, dimulai dengan menetapkan berbagai kebutuhan dari semua elemen yang diperlukan sistem dan mengalokasikannya ke dalam pembentukan perangkat lunak.

  b) Analysis

  Tahapan Analysis merupakan Kegiatan menganalisis kebutuhan-kebutuhan apa saja yang dibutuhkan untuk pembangunan suatu aplikasi.

  c) Design

  Tahapan Design merupakan perancangan sistem, yang dilakukan adalah mulai merancang desain database, tampilan antarmuka, dan proses dari sistem yang akan dibangun sesuai dengan kebutuhan user yang telah dianalisis sebelumnya.

  d) Coding

  Tahapan Coding merupakan kegiatan membangun coding berdasarkan hasil analisis dan perancangan agar sistem yang diperoleh sesuai dengan kebutuhan pengguna.

  e) Testing

  Tahapan Testing merupakan tahap pengujian sistem, yang dilakukan adalah melakukan pengujian sistem yang telah diimplementasikan sehingga aplikasi yang telah dibangun sesuai dengan harapan user. Testing fokus pada logika internal dan fungsi eksternal dari software, serta mengetes untuk mengcover error dan memastikan inputan yang telah dibuat dan hasilnya sesuai dengan tujuan.

  f) Maintenance

  Tahapan Maintenance merupakan fase siklus hidup yang paling lama. Sistem yang telah dibangun di-install dan dipakai, kemudian dilakukan pemeliharaan mencakup koreksi dari berbagai error yang tidak ditemukan pada tahap-tahap terdahulu, perbaikan atasimplementasi unit sistem dan pengembangan pelayanan sistem, sementara persyaratan-persyaratan baru ditambahkan.

I.6 Sistematika Penulisan

  Sistematika penulisan laporan akhir dari penelitian ini disusun untuk memberikan gambaran umum tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini adalah sebagai berikut :

  BAB I PENDAHULUAN Bab ini membahas penjelasan mengenai latar belakang masalah, identifikasi masalah, maksud dan tujuan, batasan masalah, metodologi penelitian serta sistematika penulisan.

  BAB II TINJAUAN PUSTAKA Bab ini membahas mengenai Profil perusahaan dan landasan teori yang digunakan dalam membangun aplikasi data mining, materi-materi umum yang membahas

  data mining dan berkaitan dengan teori-teori pendukung lainnya.

  BAB III ANALISIS DAN PERANCANGAN Bab ini membahas tentang Penganalisaan dan perancangan sistem yang dibangun menggunakan algoritma K-means, Fungsionalitas sistem serta desain antar muka sistem.

  BAB IV IMPLEMENTASI DAN PENGUJIAN Bab ini Menjelaskan mengenai implementasi aplikasi yang telah dibuat serta melakukan pengujian terhadap aplikasi yang diimplementasikan tersebut. BAB V KESIMPULAN DAN SARAN Bab ini Menjelaskan tentang kesimpulan yang diperoleh dari hasil implementasi dan pengujian aplikasi data mining yang telah dibuat, serta saran-saran untuk pengembangan selanjutnya.

BAB II TINJAUAN PUSTAKA II.1 Profil Instansi Badan Kepegawaian Pendidikan dan Pelatihan (BKPP) kabupaten Gayo

  lues merupakan salah satu dinas yang bertugas untuk proses penataan sumber daya manusia (SDM) pegawai negri sipil di kabupaten Gayo lues. Tugas pokok dari dinas ini adalah mengawasi, mengarahkan, merencanakan, melaksanakan dan mengendalikan pegawai negri sipil (PNS) dalam penempatan kerja (mutasi), pendidikan, pelatihan serta pembinaan pegawai di lingkungan Pemerintahan Kabupaten Gayo lues.

II.1.1 Sejarah Instansi

  Kabupaten Gayo Lues adalah salah satu kabupaten di provinsi Aceh, Indonesia dan merupakan hasil pemekaran dari Kabupaten Aceh Tenggara dengan Dasar Hukum UU No.4 Tahun 2002 pada tanggal 10 April 2002. Sejak berdiri sekretariat daerah kabupaten mulai dibentuk yang mana didalam struktur organisasi terdapat asisten pemerintahan, asisten administrasi, asisten umum, asisten ekonomi dan asisten pembangunan.

  Pada 1 maret 2008 terbentuklah Badan Kepegawaian Pendidikan dan Pelatihan (BKPP) kabupaten Gayo lues. Untuk proses penataan Sumber Daya Manusia Pegawai Negeri Sipil di lingkungan Kabupaten Gayo lues diperlukan adanya perangkat daerah yang memiliki tugas dan fungsi di bidang kepegawaian, maka melalui Peraturan Pemerintah No.41 Tahun 2007 tentang Pelaksanaan Tugas dan Fungsi Dinas, Organisasi maupun Lembaga Daerah Kabupaten Gayo lues dibentuklah BKPP Kabupaten Gayo lues dengan Kepala Bagian Kepegawaian Drs. Mahmud Bakri.

  Selama terbentuk hingga sekarang, BKPP kabupaten gayo lues telah memiliki 3 kepala Bagian antara lain Drs. Mahmud Bakri sejak berdirinya BKPP hingga bulan februari 2010 setelah itu jabatan kepala bagian kepegawaian diduduki oleh Maliki,.SE hingga tahun 2012 dan terakhir diduduki oleh H. Syabri,. S.pd hingga saat ini.

II.1.2 Visi dan Misi Visi Terwujudnya Masyarakat Gayo Lues yang Sejahtera, Rukun, Damai, Bertaqwa.

  dan Bermartabat.

  Misi 1.

  Menjalankan Syariat Islam Secara Kaffah 2. Mewujudkan Penyelenggaraan Pemerintahan yang Bersih dan Berwibawa

  Bebas KKN dan Menegakkan Supermasi Hukum 3. Meningkatkan Pemberdayaan Ekonomi Masyarakat 4.

  Meningkatkan Kualitas SDM 5. Menggali dan Melestrarikan SDA dan Memanfaatkan Secara Tepat Guna 6. Menggali dan Melestrarikan Adat Istiadat dan Seni Budaya 7. Meningkatkan Keamanan dan Ketertiban di Kabupaten Gayo Lues.

II.1.3 Struktur Organisasi

  Struktur organisasi dalam suatu institusi merupakan hal yang sangat penting, dengan adanya struktur organisasi ini memberikan pembagian tugas sesuai dengan bidangnya masing-masing. Adapun struktur organisasi di BKPP Kabupaten Gayo lues adalah sebagai berikut :

  

Gambar II.1 Struktur organisasi BKPP Kabupaten Gayo Lues

  II.2 Landasan Teori

  Landasan teori membahas mengenai materi atau teori apa saja yang digunakan sebagai acuan dalam membuat tugas akhir ini. Landasan teori yang diuraikan merupakan hasil dari studi literatur yaitu pengumpulan data dengan cara mempelajari jurnal, browsing internet, referensi buku dan bacaan-bacaan lainnya yang berhubungan erat dengan penelitian yang dilakukan.

  II.2.1 Basis Data Database atau Basis data merupakan kumpulan data yang disimpan secara

  sistematis didalam komputer dan dapat diolah atau dimanipulasi menggunakan perangkat lunak (program aplikasi) untuk menghasilkan informasi. Pendefinisian basis data meliputi spesifikasi berupa tipe data, struktur, dan juga batasan-batasan data yang akan disimpan. Basis data merupakan aspek yang sangat penting dalam sistem informasi dimana basis data merupakan gudang penyimpanan data yang akan diolah lebih lanjut. Basis data menjadi penting karena dapat menghidari duplikasi data, hubungan antar data yang tidak jelas, organisasi data, dan juga update yang rumit [3].

  Basis data (Database) sendiri dapat didefinisikan dalam sejumlah sudut pandang seperti [3]:

  1. Himpunan kelompok data (arsip) yang saling berhubungan yang diorganisasi sedemikian rupa agar kelak dapat dimanfaatkan kembali dengan cepat dan mudah.

  2. Kumpulan data yang saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa pengulangan (redun-dansasisi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.

3. Kumpulan file, table, arsip yang saling berhubungan yang disimpan dalam media penyimpanan elektronis.

  II.2.2 Database Management System (DBMS)

  Aplikasi yang digunakan untuk membangun sebuah sistem basis data yang memungkinkan Pengguna untuk mendefinisikan, membuat, memelihara dan mengontrol akses ke database merupakan pengertian dari Database Management

  

System (DBMS). DBMS membantu dalam pemeliharaan dan pengolahan

  kumpulan data dalam jumlah besar, sehingga dengan bantuan DBMS tidak akan menimbulkan kekacauan dan dapat digunakan oleh pengguna sesuai dengan kebutuhan. Bahasa basis data biasanya terdiri atas perintah-perintah yang diformulasikan dalam bentuk query sehingga perintah tersebut akan diproses oleh DBMS [3].

  II.2.3 Data Mining Data mining merupakan istilah yang sering dikatakan sebagai suatu cara

  untuk menguraikan serta mencari penemuan berupa pengetahuan didalam suatu database. Data mining adalah proses pemilihan atau “menambang” pengetahuan dari sekumpulan data dalam jumlah yang banyak [5].

  Terdapat beberapa Tahapan dalam data mining, antara lain[5] : 1.

  Basis Data Saat ini, hampir semua data bisnis disimpan dalam basis data relasional.

  Yaitu model basis data relasional yang dibangun dari serangkaian tabel, setiap tabel disimpan sebagai sebuah file. Sebuah tabel relasional terdiri dari baris dan kolom. Bentuk data yang tersimpan dalam basis data relasional inilah yang dapat diolah oleh sistem data mining.

  2. Seleksi Data Biasanya data dari proses transaksi disimpan pada lokasi yang berbeda- beda. Maka dari itulah dibutuhkan kemampuan dari sistem untuk dapat mengumpulkan data dengan cepat. Biasanya data tersebut sangat banyak dan memerlukan waktu dalam menganalisisnya. Maka dari itu dibutuhkan seleksi data untuk memperkecil ruang lingkup dengan memanfaatkan data yang penting saja.

  3. Praproses Data Data data yang sudah terkumpul selanjutnya akan mengalami proses pembersihan. Pembersihan ini dilakukan untuk membuang record yang keliru, merasionalisasi struktur data dan mengendalikan data yang hilang.

  4. Transformasi Data Transformasi data melakukan peringkasan data dan mengasumsikan data tersimpan didalam tempat penyimpanan tunggal. Hasil dari data pusat yang telah teringkas menggunakan ekstraksi data diringkas kembali dengan Transformasi data supaya data yang dihasilkan lebih padat dan disimpat di tempat penyimpanan tunggal. Fungsi agregate yang sering digunakan adalah average, minimum, maximum, dan count.

  5. Data mining Setelah melakukan semua proses diatas, maka algoritma data mining sudah siap untuk dijalankan.

  6. Evaluasi Data Inilah hasil akhir yang akan disajikan berupa data yang mudah dipahami, yang merupakan hasil dari pengolahan data melakukan Data mining.

  II.2.4 Metode Klastering (Clustering) Clustering adalah teknik menemukan sekelompok data dari pemecahan

  atau pemisahan sekumpulan data menurut karakteristik tertentu yang telah ditentukan, dalam pengelompokan tersubut nilai label nya belum diketahui shingga diharapkan setelah melakukan pengelompokan data dapat diketahui label dari data tersebut. Metode clustering juga sering disebut tahapan awal sebelum melakukan metode lain seperti klasifikasi[1].

  Cluster analysis adalah mengelompokan data objek pada informasi yang

  mirip atau memiliki kesamaan antara satu dengan yang lainnya, tujuannya agar dapat menemukan kelompok yang berkualitas seperti kelompok yang merupakan objek-objek yang mirip atau memiliki hugungan satu sama lain dan sebaliknya yaitu kelompok yang tidak berhubungan dengan objek dalam kelompok yang lain[2].

  Clustering cocok digunakan untuk menjelajahi data. Jika ada banyak kasus

  tapi tidak ada pengelompokan yang jelas, algoritma clustering dapat digunakan untuk mencari pengelompokan dari data tersebut. Clustering juga dapat berguna sebagai data-preprocessing yaitu langkah untuk mengidentifikasi kelompok- kelompok yang berhubunngan dalam membangun model [1].

  II.2.5 K-means

  Algoritma K-Means clustering merupakan teknik cluster berbasis jarak yang berusaha mempartisi data kedalam beberapa cluster. Metode ini mempartisi data kedalam cluster menurut karakteristik yang dimiliki setiap data, setiap data yang memiliki karakteristik sama dikelompokkan kedalam satu cluster yang sama begitu juga dengan data yang mempunya karakteristik berbeda dikelompokkan kedalam cluster lain [1].

  Pada algoritma ini, yang menjadi pusat cluster dinamakan centroid,

  

centroid merupakan nilai acak dari seluruh kumpulan data yang dipilih pada tahap

  awal, kemudian K-Means menyeleksi masing-masing komponen dari seluruh data dan memisahkan data tersebut kedalam salah satu centroid yang sudah diuraikan sebelumnya berdasarkan jarak terdekat antara komponen data dan pusat masing- masing centroid dengan syarat tidak ada lagi data yang berpindah kelompok. Pengelompokan data menggunakan K-means [7]: 1.

  Menentukan jumlah cluster 2. Menentukan nilai centroid yang ada di masing-masing cluster. Untuk menentukan nilai centroid pada awal iterasi dilakukan secara acak.

  y

  5. Kembali ke langkah 2, apabila masih ada data yang berpindah kelompok, sampai tidak ada lagi data yang berpindah kelompok

  = banyak data 4. Pengelompokan objek untuk menentukan anggota cluster adalah dengan memperhitungkan jarak minimum objek.

  i

  maksimal data

  n =

  )

  y

n

  ,...,

  2

  y

  ,

  1

  y = ( y

  = nilai

  )

  3. Hitung jarang setiap data yang ada pada masing-masing centroid menggunakan rumus euclidian hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid, berikut rumusnya

   

           

  2

  2

  2

  2

  1 ... , 2 2 1 1

           n i i i n n y x y x y x y x y x d

  

n

  .............( II.1 ) Keterangan :

  d = distance x = nilai x = ( x

  1

  , x

  2

  ,..., x

6. Tampilkan hasil seleksi

  Adapun flowchart dari algoritma K-Means dapat dilihat pada gambar III.2 berikut ini :

  

Gambar II.3 Flowchart algoritma K-Means

  II.3 Alat-alat Pemodelan Sistem

  Alat-alat pemodelan sistem membahas mengenai alat atau tools apa saja yang digunakan dalam membuat tugas akhir ini.

  II.3.1 Diagram Konteks

  diagram konteks merupakan diagram yang menggambarkan kondisi sistem yang ada baik input maupun output serta menyertakan terminator yang terlibat dalam penggunaan sistem. Diagram ini akan memberi gambaran tentang keseluruhan sistem. Sistem dibatasi oleh boundary (dapat digambarkan dengan garis putus). Dalam diagram konteks hanya ada satu proses. Tidak boleh ada store dalam diagram konteks [5].

  Diagram konteks berisi gambaran umum (secara garis besar) sistem yang akan dibuat. Secara kalimat, dapat dikatakan bahwa diagram konteks ini berisi “siapa saja yang memberi data (dan data apa saja) ke sistem, serta kepada siapa saja informasi (dan informasi apa saja) yang harus dihasilkan sistem.” Maka dapat disimpulkan bahwa diagram konteks adalah diagram yang terdiri dari suatu proses dan menggambarkan ruang lingkup suatu sistem. Diagram konteks merupakan level tertinggi dari DFD yang menggambarkan seluruh input ke sistem atau output dari sistem.

  II.3.2 Data Flow Diagram (DFD)

  Data Flow Diagram (DFD) adalah alat pembuatan model yang memungkinkan profesional sistem untuk menggambarkan sistem sebagai suatu jaringan proses fungsional yang dihubungkan satu sama lain dengan alur data, baik secara manual maupun komputerisasi. DFD ini sering disebut juga dengan nama Bubble chart, Bubble diagram, model proses, diagram alur kerja, atau model fungsi. DFD ini adalah salah satu alat pembuatan model yang sering digunakan, khususnya bila fungsi-fungsi sistem merupakan bagian yang lebih penting dan kompleks dari pada data yang dimanipulasi oleh sistem. Dengan kata lain, DFD adalah alat pembuatan model yang memberikan penekanan hanya pada fungsi

  DFD merupakan alat perancangan sistem yang berorientasi pada alur data dengan konsep dekomposisi dapat digunakan untuk penggambaran analisa maupun rancangan sistem yang mudah dikomunikasikan oleh profesional sistem kepada pemakai maupun pembuat program.

  Simbol

  • –simbol yang digunakan dalam Data Flow Diagram adalah sebagai berikut ini [9]:

  

Tabel II.1 Daftar Simbol DFD

II.3.3 Entity Relation Diagram (ERD)

  Entity Relationship Diagram merupakan model data berupa notasi grafis dalam pemodelan data konseptual yang menggambarkan hubungan antara penyimpan satu dengan penyimpan yang lain. Model data sendiri merupakan sekumpulan cara, peralatan untuk mendeskripsikan data-data yang memiliki hubungan satu sama lain, semantiknya, serta batasan konsistensi. Model data terdiri dari model hubungan entitas dan model relasional. Diagram hubungan entitas ditemukan oleh Peter Chen dalam buku Entity Relational Model-Toward a Unified of Data. Pada saat itu diagram hubungan entitas dibuat sebagai bagian dari perangkat lunak yang juga merupakan modifikasi khusus, karena tidak ada bentuk tunggal dan standar dari diagram hubungan entitas [3]. Simbol

  • –simbol yang digunakan dalam entity relationship diagram adalah sebagai berikut ini [9]:

  

Tabel II.2 Daftar Simbol ERD

  II.4 Alat-alat Pembangunan Perangkat Lunak

  Alat-alat Pembangunan Perangkat Lunak membahas mengenai alat atau tools apa saja yang digunakan dalam membuat Aplikasi data mining dalam penelitian ini.

  II.4.1 C#

  Bahasa pemrograman C# dikembangkan oleh Microsoft sebagai bahasa yang simple, modern, general purpose, dan berorientasi objek. Pengembangan bahasa C# sangat dipengaruhi oleh bahasa pemrograman terdahulu, terutama C++. Delphi, dan Java. C++ dikenal memiliki kecepatan yang tinggi dan memiliki akses memori hapir hingga ke low level. Namun bagi para programmer, C++ merupakan Bahasa yang relatif rumit dibandingkan bahasa pemrograman lainnya. Kehadiran C# memberi suntikan optimisme bagi para programmer untuk dapat mengembangkan aplikasi yang berdasa guna dengan baik cepat dan lebih mudah. Bahasa C# masih harus dikembangkan dengan kemampuan untuk melakukan berbagai task. Namun dalam hal performansi hingga saat ini C++ masih diakui sebagai salah satu yang terbaik.

  C# dikembangkan sejalan dengan pengembangan teknologi .Net. Teknologi .NET telah berevolusi dari .NET 1.0 hingga .NET 4.0. Sendiri merupakan sebuah framework yang memiliki base class library, dan bisa diimplementasikan ke dalam beberpaa bahasa pemrograman yang dikembangkan Microsoft termasuk diantaranya adalah bahasa C#. Microsoft mengembangkan

  IDE yang secara khusus mendukung pengembangan aplikasi dengan teknologi .NET, versi terakhirnya yaitu Visual Studio 2010, mendukung teknologi .Net 4. Diantara karakteristik dari .NET adanya sebuah Common Langguage Runtime (CLR). CLR sendiri merupakan sebuah komponen virtual machine yang akan diakses program pada saat runtime kode yang ditulis dalam bahasa C# ataupun

  VB.NET misalnya dicompile oleh .NET Compile r menjadi code dalam format Common Intermediate Langguage (CIL).

  CIL merupakan sebuah format bahasa standar pada level intermediate yang digunakan dalam bidang teknologi .NET apa pun bahasa pemrograman yang digunakan oleh kode. Kemudian pada saat runtime, CLR mengeksekusi CIL dengan melakukan proses loading dan linkin serta menghasilkan bahasa mesin untuk mengeksekusi program. Proses ini memunculkan istilah multilangguage pada pengembangan aplikasi .Net programmer memiliki pilihan untuk menentukan pilihan untuk menggunakan bahasa pemrograman, yang familiar bagi mereka dan apapun bahasa pemgraman apapun mereka tetap memilih akan tetap memiliki keungulan-keungulan dan dan teknoli lainnya.

  Standar European Computer Maufacturer Association (ECMA) mendatarkan beberapa tujuan desain dari bahasa pemrograman C#, sebagai berikut [5]: I.

  Bahasa pemrograman C# dibuat sebagai bahasa pemrograman yang bersifat bahasa pemrograman general – purpose (untuk tujuan jamak), berorientasi objek, modern, dan sederhana.

  II. Bahasa pemrograman C# ditujukan untuk digunakan dalam mengembangkan komponen perangkat lunak yang mampu mengambil keuntungan dari lingkungan terdistribusi. III.

  Portabilitas programmer sangatlah penting, khususnya bagi programmer yang telah lama menggunakan bahasa pemrogaman C dan C++.

IV. Dukungan untuk internasionalisasi (multi- language) juga sangat penting.

  V. C# ditujukan agar cocok digunakan untuk menulis program aplikasi baik dalam sistem klien-server (hosted system) maupun sistem 38 embedded (embedded system), mulai dari perangkat lunak yang sangat besar yang menggunakan sistem operasi yang canggih hingga kepada perangkat lunak yang sangat kecil yang memiliki fungsi-fungsi terdedikasi.

II.4.2 Mysql

  MySQL adalah sebuah implementasi dari sistem manajemen basisdata relasional (RDBMS) yang didistribusikan secara gratis. Setiap pengguna dapat secara bebas menggunakan MySQL, namun dengan batasan perangkat lunak tersebut tidak boleh dijadikan produk turunan yang bersifat komersial. MySQL sebenarnya merupakan turunan salah satu konsep utama dalam basisdata yang telah ada sebelumnya; SQL (Structured Query Language). SQL adalah sebuah konsep pengoperasian basisdata, terutama untuk pemilihan atau seleksi dan pemasukan data, yang memungkinkan pengoperasian data dikerjakan dengan mudah secara otomatis [3].

  .

BAB IV IMPLEMENTASI DAN PENGUJIAN IV.1 Implementasi Sistem Bab ini Menjelaskan mengenai implementasi dan pengujian aplikasi yang

  telah dibangun. Tahapan ini dilakukan setelah tahap analisis dan perancangan selesai dilakukan, adapun tujuan dari tahapan ini adalah mempersiapkan aplikasi agar dapat digunakan pengguna.

IV.1.1 Implementasi Perangkat Keras

  Spesifikasi perangkat keras (hardware) yang digunakan untuk membangun aplikasi adalah sebagai berikut:

1. Processor : Intel Core 2 duo @ 2,10 GHz 2.

  Harddisk : 250 Gb 3. Memory : 2 GB 4. Monitor 5. Keyboard 6. Optical Mouse 7. Printer

IV.1.2 Implementasi Perangkat Lunak

  Perangkat lunak (software) yang digunakan untuk membangun aplikasi adalah sebagai berikut:

1. Windows 8.1 Pro 2.

  Mysql 5 3. Xampp v3.1 4. Visual Studio 2010 5. SQLyog Ultimate

IV.1.3 Implementasi Form

  Implementasi form dilakukan untuk mengetahui setiap tampilan halaman yang dibangun dan pengkodeannya dalam bentuk file program. Implementasi form dapat dilihat pada Tabel berikut:

  

Tabel IV.1 Implementasi Form

NO Nama Form Deskripsi Nama File

  1 Halaman Utama Form ini digunakan untuk Form_Utama.cs menampilkan halaman utama aplikasi

  2 Import Data Form ini digunakan untuk proses Form_Import.cs mengimport data pegawai .csv kedalam aplikasi

  3 Preprocessing Form ini digunakan untuk Preprocessing.cs memilih atribut yang akan digunakan untuk proses clustering

  4 Clustering Form ini digunakan untuk Clustering.cs menghitung proses clustering dan menyimpannya kedalam database

  5 Hasil Form ini digunakan untuk Hasil.cs melihat hasil data hasil clustering

  6 Laporan Form ini digunakan untuk proses Laporan.cs pencetakan laporan dari hasil clustering

  7 Progress Form ini digunakan untuk fmProgress.cs menampilkan progress setiap proses yang sedang berjalan

IV.1.4 Implementasi Basis Data

  24

  18

  19

  20

  21

  22

  23

  25

  16

  26

  27

  28

  29

  30

  31

  32 CREATE TABLE `data_pegawai` ( `nipbar` varchar(25) NOT NULL DEFAULT '0', `nip` varchar(25) DEFAULT '0', `nama` varchar(50) DEFAULT '0', `j_kelamin` varchar(5) DEFAULT '0', `tmp_lahir` varchar(50) DEFAULT NULL, `tgl_lahir` date DEFAULT NULL, `pend_terakhir` varchar(10) DEFAULT NULL, `jurusan` varchar(25) DEFAULT NULL, `lokasi` varchar(35) DEFAULT NULL, `thn_lulus` year(4) DEFAULT NULL, `gol_cpns` varchar(5) DEFAULT NULL, `tmt_cpns` date DEFAULT NULL, `gol_terakhir` varchar(5) DEFAULT NULL, `tmt_gol_terakhir` date DEFAULT NULL, `no_kapreg` varchar(25) DEFAULT NULL, `instansi` varchar(30) DEFAULT NULL, `nama_jabatan` varchar(40) DEFAULT NULL, `tmt_jabatan` date DEFAULT NULL, `mk_tahun` int(4) DEFAULT NULL, `mk_bulan` int(2) DEFAULT NULL, `kesetiaan` int(3) DEFAULT NULL, `prestasi` int(3) DEFAULT NULL, `tanggung_jwb` int(3) DEFAULT NULL, `ketaatan` int(3) DEFAULT NULL, `kejujuran` int(3) DEFAULT NULL, `kerjasama` int(3) DEFAULT NULL, `prakarsa` int(3) DEFAULT NULL, `kepemimpinan` int(3) DEFAULT NULL, PRIMARY KEY (`nipbar`), UNIQUE KEY `nip` (`nipbar`) ) ENGINE=InnoDB DEFAULT CHARSET=latin1

  17

  Implementasi basis data dilakukan untuk mengetahui susunan tabel berdasarkan perancangan basis data yang telah dibuat sebelumnya. Berikut ini informasi ddl dalam pempuatan tabel.

  1) Pembuatan tabel data_pegawai

  5

  Berikut ini merupakan informasi ddl dalam pembuatan tabel data_pegawai pada database.

  

Tabel IV.2 Pembuatan tabel data_pegawai

  1

  2

  3

  4

  6

  14

  7

  8

  9

  10

  11

  12

  13

  15