Implementasi Metode ID3 untuk memprediks

SKRIPSI

Diajukan Sebagai Salah Satu Syarat Untuk Mencapai Gelar Sarjana Strata Satu Jurusan Teknik Informatika

Oleh : AANG SETIAWAN NIM : 12.10802.00229

FAKULTAS TEKNIK JURUSAN TEKNIK INFORMATIKA UNIVERSITAS MUHAMMADIYAH SIDOARJO 2016

LEMBAR PERNYATAAN

Yang bertanda tangan dibawah ini : Nama

: Aang Setiawan

Tempat, Tanggal Lahir

: Sidoarjo, 20 November 1992

NIM

Fakultas / Jurusan

: Teknik / Teknik Informatika

Menyatakan bahwa Skripsi yang berjudul “Implementasi metode ID3 untuk mempredksi kegiatan mahasiswa sepulang kuliah dan kelulusan mahasiswa” adalah bukan Skripsi orang lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya.

Demikian surat pernyataan ini saya buat dengan sebenar-benarnya dan apabila pernyataan ini tidak benar, saya bersedia mendapatkan sanksi akademis.

Sidoarjo, 22 Juni 2016 Yang menyatakan,

Aang Setiawan

LEMBAR PERSETUJUAN

Telah Diperiksa dan Disetujui Isi Laporan Skripsi Ini LAPORAN SKRIPSI

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa

sepulang kuliah dan kululusan mahasiswa

Disusun Oleh :

Nama

: Aang Setiawan

NIM

Menyetujui, Dosen Pembimbing

Mochamad Alfan Rosid, S.Kom, M.Kom FAKULTAS TEKNIK JURUSAN TEKNIK INFORMATIKA UNIVERSITAS MUHAMMADIYAH SIDOARJO 2016

LEMBAR PENGESAHAN Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa sepulang kuliah dan kululusan mahasiswa Skripsi disusun untuk salah satu syarat memperoleh gelar

Sarjana Komputer (S.Kom) Di Universitas Muhammadiyah Sidoarjo

Oleh :

Aang Setiawan 12.10802.00229

Tanggal ujian : 22 Juni 2016

Disetujui oleh :

1. Mochamad Alfan Rosid, S.Kom, M.Kom NIK. 210381

..……………. (Pembimbing)

2. Hindarto, S.Kom.,MT. NIK. 201198

..……………. (Penguji 1)

3. Yulian Findawati, ST, M.MT NIK. 208356

..……………. (Penguji 2)

Dekan Fakultas Teknik,

Izza Anshory, ST, MT NIK. 202239

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa sepulang kuliah dan kululusan mahasiswa

Nama : Aang Setiawan NIM : 121080200229 Pembimbing : Mochamad Alfan Rosid, S.Kom, M.Kom

ABSTRAK

Seorang mahasiswa dinyatakan lulus tepat waktu jika dapat menyelesaikan pendidikan selama minimal 8 semester atau 4 tahun. Untuk mewujudkan hal tersebut, perkembangan nilai Indeks Prestasi sangat membantu dalam proses penyelesaian skripsi suatu mahasiswa. Dengan memantau hasil belajar di Universitas berupa nilai IP tiap semester, seorang mahasiswa dapat dinyatakan lulus tepat waktu atau tidak. Pada penelitian ini dibuat aplikasi untuk Memprediksi kegiatan mahasiswa sepulang kuliah dan tingkat kelulusan mahasiswa. Harapan dengan adanya metode ini semua mahasiswa dapat diprediksi kegiatannya saat sepulang kuliah dan tingkat kecepatan studinya, sehingga kepada mereka dapat diberikan early warning atau peringatan dini agar lebih memperbaiki sistem belajarnya lagi.

Pohon Keputusan merupakan salah satu teknik terkenal dalam data mining dan merupakan salah satu metode yang populer dalam menentukan keputusan suatu kasus. Hal ini karena metode ini tidak memerlukan proses pengelolaan pengetahuan terlebih dahulu dan dapat menyelesaikan dengan sederhana kasus-kasus yang memiliki dimensi yang besar. ID3 merupakan algoritma pohon keputusan yang sering digunakan untuk membuat suatu pohon keputusan karena memiliki tingkat akurasi yang tinggi dalam menentukan keputusan.

Dalam laporan ini dibahas kinerja algoritma pohon keputusan ID3 untuk memprediksi kegiatan mahasiswa sepulang kuliah dan kelulusan mahasiswa. Dari penelitian yang dilakukan, diketahui yang digunakan sebagai data master disini adalah alumni mahasiswa universitas muhammadiyah sidoarjo sebanyak 60 dan yang menjadi data testing disini adalah mahasiswa semester 7 sebanyak 30. Disini 60 data dihitung secara manual menggunakan metode ID3 dan 30 data dihitung di program aplikasi. Hasil akhir dari penelitian ini membuktikan bahwa algoritma ID3 memiliki tingkat akurasi dengan nilai rata-rata sebesar 91.111 %.

Kata kunci : Pohon Keputusan, Kegiatan, Kelulusan, ID3.

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa sepulang kuliah dan kululusan mahasiswa

By

: Aang Setiawan

Student Identity Number : 121080200229 Supervisor

: Mochamad Alfan Rosid, S.Kom, M.Kom

ABSTRACT

One student stated Pass Timely Education IF can be completed for at least 8 semesters OR 4 Years. To review the HAL realize , Progress Value Achievement Index Very helpful hearts Resolution Process A student thesis . Article Search Google monitor the results to the University each semester Form IP Value , A student can be declared Passed On Time OR NOT . ON Research Singer Made Application for review Predicting student activities after classes and Graduation rates of students . WITH their expectations singer method ALL students can be predicted after classes and activities currently SPEED Level studies, so that they can not be shown to be given early warning in order MORE OR Early Warning System Improving learning Again.

Decision Trees is one of the well-known technique in data mining and is one popular method in the decision making of a case. This is because this method does not require any prior knowledge management process and can be completed with simple cases that have huge dimensions. ID3 is a decision tree algorithms are often used to create a decision tree because it has a high degree of accuracy in determining the decision.

In this report discussed the performance of ID3 decision tree algorithm to predict student activities after classes and graduation . From research conducted , known as master data that is used here is an alumnus of the university students of Muhammadiyah Sidoarjo 60 and into the data of testing here is a 7th semester student as much as 30. Here 60 are calculated manually using ID3 and 30 are calculated on the application program . The end result of this study proves that the ID3 algorithm has an accuracy rate with an average value of 91 111 % . Keywords : Decision Trees , Event , Graduation , ID3 .

MOTTO

“ Pendidikan merupakan perlengkapan paling baik untuk hari tua.” (Aristoteles)

“ Tiada kata terlambat untuk berbuat kebaikan.” (Aang Setiawan)

PERSEMBAHANKU

Puji syukur kehadirat Allah SWT sehingga Skripsi ini dapat terselesaikan dengan baik. Tidak lupa ucapan terima kasih kepada :

 Keluarga ku terutama kedua orang tua ku yang tiada henti yang selalu mendo'akan ku, memberikan dorongan dan motivasi sehingga Skripsi ini terselesaikan.

 Bapak Mochamad Alfan Rosid, S.Kom, M.Kom, selaku dosen pembimbing yang sabar memberikan bimbingan dan solusi atas permasalahan selama mengerjakan Skripsi ini.

 Hindarto, S.Kom, MT, Yulian Findawati, ST., MMT., selaku dosen penguji yang memberikan saran dan ilmu guna perbaikan pada penulis dimasa depan.

 Teman-teman kelas Sore - D Angkatan 2012, terima kasih untuk do'a dan semangatnya.

 Untuk kekasih sekaligus calon ibu dari anak-anakku nanti, Yuli Ermawati, terima kasih atas do'a, semangatnya selama proses pengerjaan Skripsi ini sampai selesai.

KATA PENGANTAR

Syukur Alhamdulillah atas kehadirat Allah S.W.T karena atas rahmat dan hidayah-Nya akhirnya laporan skripsi ini dapat saya selesaikan. Adapun maksud penulisan laporan skripsi ini adalah sebagai syarat untuk pelaksanaan mata kuliah Skripsi dalam menyelesaikan program studi Strata satu (S1) di Universitas Muhammadiyah Sidoarjo. Oleh karenanya, pada kesempatan ini penulis ingin mengucapkan banyak terima kasih kepada :

1. Drs.Hidayatulloh,M.Si., selaku Rektor Universitas Muhammadiyah Sidoarjo

2. Izza Anshory, ST., MT., selaku Dekan Fakultas Teknik

3. Yulian Findawati, ST., MMT., selaku Kaprodi Teknik Informatika

4. Mochamad Alfan Rosid, S.Kom., M.Kom ., selaku Dosen Pembimbing

5. Kedua orang tua saya yang selalu mendukung proses akademik saya

Penulis mendoakan untuk semua pihak yang telah membantu penulis mendapatkan imbalan yang lebih dan senantiasa diberkahi rahmat berlimpah dari Allah SWT. Aamiin. Semoga dengan terselesaikannya skripsi dan laporannya ini dapat memberikan manfaat bagi penulis dan pembaca. Penulis menyadari bahwa skripsi dan laporan ini masih jauh dari kesempurnaan. Mengingat terbatasnya pengetahuan dan kemampuan penulis, oleh karenanya penulis memohon maaf dan selalu terbuka untuk menerima kritik dan saran dari pembaca.

Sidoarjo, 20 Mei 2016

BAB 1 PENDAHULUAN

1.1 Latar Belakang

Mahasiswa merupakan aspek penting dalam evaluasi keberhasilan penyelenggaraan program studi pada suatu perguruan tinggi khususnya di Universitas Muhammadiyah Sidoarjo. Dalam masa pembelajarannya, mahasiswa berkembang untuk meningkatkan pola pikir kecerdasan sebagai langkah awal untuk memasuki dalam persaingan di dunia kerja dan lingkungan masyarakat kelak. Kualitas dari sebuah perguruan tinggi selain dapat dilihat dari rata-rata jumlah kelulusan Mahasiswa yang tepat waktu, juga dapat dilihat dari kegiatan Mahasiswa itu sendiri saat sepulang kuliah yang akan sangat berpengaruh pada nilai Indeks Prestasi, dan kegiatan mahasiswa sepulang kuliah juga dapat mencerminkan nama baik atau buruknya Universitas dimata masyarakat. Khusus mengenai evaluasi standar mahasiswa dan lulusan, komponen yang dinilai adalah system rekrutmen mahasiswa baru, dan lulusan ( rata-rata studi dan IPK ).

Universitas Muhammadiyah Sidoarjo merupakan salah satu perguruan tinggi ternama di Jawa Timur. Hal ini menyebabkan banyak Mahasiswa dari luar Kabupaten Sidoarjo untuk menunjang ilmu di Universitas Muhammadiyah Sidoarjo khususnya yang mengambil Teknik Informatika kelas pagi. Selama ini banyak sekali mahasiswa yang berasal dari Sidoarjo ataupun diluar Sidoarjo yang banyak menghabiskan waktu sepulang kuliah dengan melakukan berbagai aktivitas seusai dengan keinginan Mahasiswa itu sendiri dan hal itu sangat berpengaruh sekali untuk masa kelulusannya. Harapan dengan adanya metode ini semua mahasiswa dapat diprediksi kegiatannya sepulang kuliah dan tingkat kecepatan studinya, sehingga kepada mereka dapat diberikan early warning atau peringatan dini. Untuk itu penulis tertarik melakukan penelitian untuk dapat Implementasi Metode ID3 untuk Memprediksi

ID3 singkatan dari Iterative Dichotomiser Three. Ada juga yang menyebut Induction of Decision Tree. ID3 adalah suatu algooritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasi suatu obyek. ID3 diperkenalkan pertama kali oleh Ross Quinlan (1979). ID3 merepresentasi konsep-konsep dalam bentuk pohon keputusan. Aturan-aturan yang dihasilkan oleh ID3 mempunyai relasi yang hirarkis seperti suatu pohon (mempunyai akar, titik, cabang, dan daun). Beberapa peneliti menyebut struktur model yang dihasilkan ID3 sebagai pohon keputusan (decision tree) sementara peneliti yang lain menyebutnya pohon aturan (rule tree).

1.2 Rumusan Masalah

Berdasarkan dari uraian latar belakang di atas maka dapat dirumuskan suatu permasalahan antara lain :

1. Bagaimana menerapkan metode ID3 untuk dapat memprediksi kegiatan mahasiswa sepulang kuliah dan memprediksi tingkat kelulusan mahasiswa ?

1.3 Batasan Masalah

Agar dalam pengerjaan Skripsi ini dapat lebih terarah, maka pembahasan penulisan ini dibatasi pada ruang lingkup pembahasan sebagai berikut:

1. Jenis indikator yang akan menjadi objek analisa penelitian yaitu jenis kelamin, tipe kepribadian dan nilai IPK.

2. Kegiatan mahasiswa sepulang kuliah pada penelitian ini, yaitu Belajar, Bekerja, Nongkrong dan Tidur.

3. Ada 2 tipe Kepribadian pada penelitian ini, yaitu Introvert (senang menyendiri) dan Extrovert (senang bersama banyak orang).

4. Subjek utama penelitian ini adalah mahasiswa Universitas Muhammadiyah Sidoarjo semester 7 kelas pagi.

1.4 Tujuan Penelitian

Perlunya di buat aplikasi ini tujuannya adalah merancang dan membuat aplikasi implementasi metode ID3 untuk memprediksi kegiatan mahasiswa sepulang kuliah dan kelulusan mahasiswa, sehingga kepada mereka dapat diberikan early warning atau peringatan dini.

1.5 Manfaat Penelitian Dalam penelitian ini penulis berharap semoga hasil penelitian dapat

memberikan manfaat konseptual utamanya kepada Mahasiswa Universitas Muhammadiyah Sidoarjo agar bisa lebih memperbaiki lagi sistem belajar mereka agar bisa lulus dengan tepat waktu.

1. Manfaat Teoritis Secara teoritis hasil penelitian ini dapat bermanfaat sebagai berikut :

a. Sebagai salah satu alternatif untuk meningkatkan keaktifan Mahasiswa dalam meningkatkan kesadaran, bahwa pentingnya waktu senggang kuliah untuk digunakan belajar atau menambah wawasan mereka semasa berada di bangku kuliah.

b. Sebagai pijakan untuk mengembangkan penelitian-penelitian yang menggunakan Data Mining dengan metode ID3.

c. Bagi mahasiswa agar dapat meningkatkan mutu belajar dan kegiatan dalam masa kuliah mereka.

2. Manfaat Praktis Secara praktis penelitian ini dapat bermanfaat sebagai berikut :

a. Bagi penulis, dapat memperoleh pengalaman langsung dalam menerapkan dan bisa memprediksi kegiatan mahasiswa sepulang kuliah dan tingkat kelulusan mahasiswa dengan menggunakan Data Mining metode ID3.

b. Bagi Dosen, dapat digunakan sebagai bahan masukan khususnya untuk dapat mengetahui atau memprediksi mahasiswanya dengan mengetahui jenis kelamin, tipe kepribadian dan nilai Indeks Prestasi, apa kegiatan mahasiswa b. Bagi Dosen, dapat digunakan sebagai bahan masukan khususnya untuk dapat mengetahui atau memprediksi mahasiswanya dengan mengetahui jenis kelamin, tipe kepribadian dan nilai Indeks Prestasi, apa kegiatan mahasiswa

c. Bagi mahasiswa terutama sebagai subyek penelitian, diharapkan dapat lebih bisa memanfaatkan waktu luang mereka diluar kampus untuk belajar ataupun melakukan hal-hal positif yang lainnya agar bisa menunjang nilai Indeks Prestasi mereka dan keberhasilan mereka dalam memperoleh gelar Sarjana dengan tepat waktu.

1.6 Sistematika Penulisan Sistematika penulisan ini merupakan gambaran umum mengenai isi dari

keseluruhan pembahasan, yang bertujuan untuk memudahkan pembaca dalam mengikuti alur pembahasan yang terdapat dalam penulisan makalah skripsi ini. Adapun sistematika penulisan adalah sebagai berikut :

BAB 1 : PENDAHULUAN Berisi tentang latar belakang obyek penelitian yaitu Mahasiswa Universitas Muhammadiyah Sidoarjo. Membahas permasalahan yang dihadapi, ruang lingkup permasalahan yang akan diteliti, tujuan dan manfaat yang akan dilakukan dan sistematika penulisan. BAB 2 : TINJAUAN PUSTAKA DAN DASAR TEORI Berisi tentang teori dasar yang mendasari analisis dan penerapan metode ID3 untuk dapat memprediksi kegiatan mahasiswa sepulang kuliah dan tingkat kelulusan mahasiswa. Terdapat kutipan dari buku-buku, website, maupun sumber literatur lainnya yang mendukung penyusunan skripsi ini. Berisi pula teori-teori khusus yang berhubungan dengan Data Mining metode ID3. BAB 3 : METODOLOGI PENELITIAN Bab ini merupakan inti dari penelitian, membahas analisis sistem yang sedang berjalan pada Universitas Muhammadiyah Sidoarjo. Pada bab ini juga disertakan kerangka penelitian, perhitungan hasil analisa, DFD, desain interface program dan jadwal kegiatan.

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI

2.1 Penelitian Terdahulu Penelitian terdahulu yang mendukung penelitian ini adalah :

a. Ronny Ardi Giovani (2011) “Sistem Pendukung Keputusan Prediksi Kecepatan Studi Mahasiswa Menggunakan Metode ID3 ”, penelitian tersebut memberikan kesimpulan bahwa dengan adanya aplikasi data mining dapat memudahkan prediksi kecepatan studi mahasiswa. Applikasi Data Mining telah berhasil menetukan klasifikasi kecepatan studi mahasiswa dengan metode ID3.

b. Danny Himawan (2013) dengan judul “Aplikasi Data Mining Menggunakan Algoritma ID3 untuk Mengklasifikasi Kelulusan Mahasiswa pada Universitas Dian Nuswantoro Semarang ”, penelitian tersebut memberikan kesimpulan bahwa Dari hasil penelitian yang telah dilakukan didapat kan bahwa pada percobaan dengan 100 dataset dengan 10 sampel uji hasil yang diharapkan tidak mencapai yang diinginkan karena dengan 10 sampel uji 8 sampel tepat dan 2 sampel tidak tepat. Sama hal nya dengan 1000 dataset dengan 10 sampel uji hasil yang diharapkan tidak mencapai yang diinginkan karena dengan 10 sampel uji 8 sampel tepat dan 2 sampel tidak tepat. Sedangkan pada percobaan dengan seluruh dataset / 1469 data dengan 10 sampel uji, semua sampel uji tepat. Sehingga dapat disimpulkan bahwa semakin sedikit data training yang digunakan maka hasil klasifikasinya menunjukkan ketidakakuratan yang tinggi. Sebaliknya jika data training yang digunaan semakin banyak hasilnya akan semakin akurat. Software klasifikasi yang telah disusun dapat digunakan untuk menentukan klasifikasi potensi ketepatan kelulusan pada mahasiswa UDINUS Semarang.

Tabel 2.1 Perbedaan Penelitian Terdahulu dengan Penelitian Sekarang TEKNIK

NO. JUDUL PENGUMPULAN SOFTWARE HASIL

DATA

Sistem Pendukung Keputusan Prediksi

Dapat Kecepatan

Teknik

Studi

memudahkan Mahasiswa

Pengumpulan

Program

prediksi Menggunakan

1. Datanya

Visual Studio

kecepatan studi Metode ID3, oleh

menggunakan data

mahasiswa. Ronny Ardi Giovani

Mining Menggunakan Algoritma ID3 untuk

Dapat dengan Mengklasifikasi

Teknik

mudah Kelulusan

Pengumpulan

Program

mengklasifikas Mahasiswa

2. datanya dari dataset (Software)

pada

i kelulusan Universitas

Mahasiswa. Nuswantoro

Danny Himawan (2013) Implementasi

Dapat Metode ID3 untuk Teknik pengumpulan

memprediksi Memprediksi

kegiatan Kegiatan Mahasiswa menggunakan data

datanya

mahasiswa Program PHP

3. Sepulang Kuliah dan Alumni mahasiswa sepulang

& MySQL

Kelulusan

kuliah dan Mahasiswa,

Universitas

tingkat Aang

Oleh Muhammadiyah

Setiawan Sidoarjo kelulusan (2016)

mahasiswa. Dari uraian diatas maka dapat disimpulkan bahwa penelitian tersebut sudah

jelas, bahwa penelitian yang sekarang untuk mengumpulkan data menggunakan data jenis kelamin, status, IPK, kegiatan mahasiswa sepulang kuliah dan masa kelulusan mahasiswa. Dan untuk penghitungan didalam aplikasinya, penelitian yang sekarang jelas, bahwa penelitian yang sekarang untuk mengumpulkan data menggunakan data jenis kelamin, status, IPK, kegiatan mahasiswa sepulang kuliah dan masa kelulusan mahasiswa. Dan untuk penghitungan didalam aplikasinya, penelitian yang sekarang

2.2 Definisi Mahasiswa Mahasiswa adalah orang yang belajar di perguruan tinggi, baik di universitas,

institut atau akademi. Mereka yang terdaftar sebagai murid di perguruan tinggi dapat disebut sebagai mahasiswa. Tetapi pada dasarnya makna mahasiswa tidak sesempit itu. Terdaftar sebagai mahasiswa di sebuah Perguruan Tinggi hanyalah syarat administratif menjadi mahasiswa, tetapi menjadi mahasiswa mengandung pengertian yang lebih luas dari sekedar masalah administratif itu sendiri.

Menyandang gelar mahasiswa merupakan suatu kebanggaan sekaligus tantangan. Betapa tidak, ekspektasi dan tanggung jawab yang diemban oleh mahasiswa begitu besar. Pengertian mahasiswa tidak bisa diartikan kata per kata, Mahasiswa adalah Seorang agen pembawa perubahan. Menjadi seorang yang dapat memberikan solusi bagi permasalahan yang dihadapi oleh suatu masyarakat bangsa di berbagai belahan dunia.

Sebagai mahasiswa berbagai macam lebel pun disandang, ada beberapa macam label yang melekat pada diri mahasiswa, misalnya:

1. Direct Of Change, mahasiswa bisa melakukan perubahan langsung karena SDMnya yg banyak.

2. Agent Of Change, mahasiswa agent perubahan, maksudnya SDM untuk melakukan perubahan.

3. Iron Stock, sumber daya manusia dari mahasiswa itu tidak akan pernah habis.

4. Moral Force, mahasiswa itu kumpulan orang yg memiliki moral yg baik.

5. Social Control, mahasiswa itu pengontrol kehidupan sosial, contoh mengontrol kehidupan sosial yg dilakukan masyarakat.

Namun secara garis besar, setidaknya ada 3 peran dan fungsi yang sangat penting bagi mahasiwa, yaitu : Pertama, peranan moral, dunia kampus merupakan dunia di mana setiap mahasiswa dengan bebas memilih kehidupan yang mereka mau. Disinilah dituntut suatu tanggung jawab moral terhadap diri masing-masing sebagai indidu untuk dapat menjalankan kehidupan yang bertanggung jawab dan sesuai dengan moral yang hidup dalam masyarakat. Kedua, adalah peranan sosial. Selain tanggung jawab individu, mahasiswa juga memiliki peranan sosial, yaitu bahwa keberadaan dan segala perbuatannya tidak hanya bermanfaat untuk dirinya sendiri tetapi juga harus membawa manfaat bagi lingkungan sekitarnya. Ketiga, adalah peranan intelektual. Mahasiswa sebagai orang yang disebut-sebut sebagai insan intelek haruslah dapat mewujudkan status tersebut dalam ranah kehidupan nyata. Dalam arti menyadari betul bahwa fungsi dasar mahasiswa adalah bergelut dengan ilmu pengetahuan dan memberikan perubahan yang lebih baik dengan intelektualitas yang ia miliki selama menjalani pendidikan.

2.3 Data Mining

Data mining merupakan area yang banyak diminati dan dipakai dalam berbagai bidang. Mahasiswa, dosen, peneliti maupun praktisi di bidang manajemen, meteorologi, kedokteran, mikrobiologi dan lain-lain banyak memakai teknik-teknik data mining untuk membantu memahami dan mengimplementasikannya. Tentu saja untuk implementasi sederhana dengan skala problem kecil (Budi Santosa, 2007).

Data mining merupakan bidang yang sangat luas penerapannya. Untuk perkuliahan ini beberapa materi diambil dari buku referensi tersebut (kompilasi) sesuai dengan perkembangan terkini yang cenderung mengarah ke sistem Soft Computing yang lebih baik dalam mengatasi permasalahan yang ada saat ini (Prabowo Pudjo Widodo, Ramadya Trias Handayanto, Herlawati (2013).

Menarik untuk diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Dari definisi-definisi itu, dapat dilihat ada beberapa faktor yang mendefinisikan data mining :

1. Data mining adalah proses otomatis terhadap data yang dikumpulkan di masa lalu.

2. Objek dari data mining adalah data yang berjumlah besar atau kompleks.

3. Tujuan dari data mining adalah menemukan hubungan-hubungan atau pola-pola yang mungkin memberikan indikasi yang bermanfaat.

Sejarah Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dulu. Gambar 1 menunjukkan bahwa data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistic, database dan juga information retrieval.

Data Mining merupakan teknologi baru yang sangat berguna untuk membantu perusahaan-perusahaan menemukan informasi yang sangat penting dari gudang data mereka. Data Mining dapat menjawab pertanyaan-pertanyaan bisnis yang dengan cara tradisional memerlukan banyak waktu untuk menjawabnya. Data Mining mengeksplorasi basis data untuk menemukan pola-pola yang tersembunyi, mencari informasi pemrediksi yang mungkin saja terlupakan oleh para pelaku bisnis karena terletak di luar ekspektasi mereka. Untuk mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia.

2.3.1 Pengelompokan Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan yaitu :

1. Deskripsi Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara

untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden.

2. Estimasi Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi

lebih kearah numerik daripada kearah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai variabel dari target sebagai nilai prediksi, selanjutnya pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi.

3. Prediksi Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam

prediksi nilai dari hasil akan ada dimasa mendatang.

4. Klasifikasi Dalam klasifikasi, terdapat target variabel kategori, sebagai contoh

penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, sedang dan rendah.

5. Pengklusteran Pengklusteran merupakan pengelompokan record, pengamatan atau

memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Kluster adalah kumpulan record yang memiliki kemiripan satu dengan lainya dan memiliki ketidak miripan dengan record-record dalam kluster lain.

6. Asosiasi Tugas Asosiasi dalam data mining adalah menemukan atribut yang muncul

dalam satu waktu. Dalam dunia bisnis disebut dengan analisis keranjang belanja .

2.3.2 Tahapan Proses Dalam Data Mining

Ada beberapa tahapan proses dalam data mining. Diagram dibawah menggambarkan beberapa tahap / proses yang berlangsung dalam data mining. Fase awal dimulai dari data sumber dan berakhir dengan adanya informasi yang dihasilkan dari beberapa tahapan, yaitu :

Gambar 2.1 Alur Data Mining

Gambar 2.1 . Tahapan Data Mining

Gambar 2.1 Tahapan Proses Dalam Data Mining

Tahapan proses dalam Data Mining dapat dijelaskan sebagai berikut :

1. Seleksi Data Pemilihan (seleksi) data baru sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing / Cleaning Sebelum proses data mining dapat dilaksanakan , perlu dilakukan proses cleaning pada data yang menjadi kasus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan dalam data, seperti kesalahan cetak (tipografi).

3. Transformasi Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakn teknik atau metode tertentu . Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat tergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretasi / Evaluasi Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan . Tahap ini merupakan bagian dari proses KDD yang disebut sebagai interpretation.

2.4 Klasifikasi Metode Data Mining

Ada beberapa contoh metode yang bisa digunakan dalam data mining, diantaranya :

1. Decesion Tree (Pohon Kputusan)

Pohon Keputusan merupakan salah satu teknik terkenal dalam data mining dan merupakan salah satu metode yang populer dalam menentukan keputusan sautu kasus. Hal ini karena metode ini tidak memerlukan proses pengelolaan pengetahuan terlebih dahulu dan dapat menyelesaikan dengan sederhana kasus-kasus yang memiliki dimensi yang besar. Akurasinya sangat baik asalkan data yang akan dijadikan patokan merupakan data yang akurat. Metode ini banyak diterapkan dalam dalam berbagai bidang antara lain: kesehatan dan pengobatan, finansial, produksi, astronomi, hingga biologi molekuler. Tugas paling umum yang diserahkan kepada Pohon Keputusan merupakan salah satu teknik terkenal dalam data mining dan merupakan salah satu metode yang populer dalam menentukan keputusan sautu kasus. Hal ini karena metode ini tidak memerlukan proses pengelolaan pengetahuan terlebih dahulu dan dapat menyelesaikan dengan sederhana kasus-kasus yang memiliki dimensi yang besar. Akurasinya sangat baik asalkan data yang akan dijadikan patokan merupakan data yang akurat. Metode ini banyak diterapkan dalam dalam berbagai bidang antara lain: kesehatan dan pengobatan, finansial, produksi, astronomi, hingga biologi molekuler. Tugas paling umum yang diserahkan kepada

Pohon keputusan merupakan teknik yang paling efisien. Ibaratnya, kita menyaring sesuatu lewat pohon keputusan, apakah suatu data lolos atau tidak terhadap saringan kita dengan proses yang cukup cepat. Teknik regresi sangat banyak, tetapi yang paling terkenal adalah algoritma yang diperkenalkan oleh Prof. Briemann dengan istilah The Classification and Regression Tree (CART).

Masalah pertama pada pembuatan pohon keputusan adalah, variabel manakah yang menjadi akar dari pohon tersebut. Akar disini adalah pemisah pertama dari pohon keputusan. Dikenal istilah Bayesian Score yang menilai suatu variabel, atau dalam Pohon Keputusan terkenal dengan sebutan Entropi. Entropi dihitung dengan rumusan sebagai berikut :

(2.1) Dimana p 1 ,p 2 , ..., p n adalah probabilitas tiap kondisi pada atribut yang diprediksi dan :

Entropy (p 1 ,p 2 , ..., p n )=-p 1 log 2 p1 –p 2 log 2 P 2 ... –p n log 2 p n

p 1 +p 2 + ... + p n =1 (2.2) Algoritma pohon keputusan yang terkenal adalah C4.5. Pada akhir tahun 1970 sampai awal tahun 1980 J. Ross Quinlan, seorang peneliti di bidang mechine learning, membuat sebuah algoritma decision tree yang terkenal dengan ID3 (Iterative Dichotomiser). Quinlan kemudian membuat algoritma C4.5 (sering disebut dengan pohon keputusan) yang merupakan pengembangan dari algoritma ID3 (Han, 2006). Algoritma ini memiliki kelebihan, yaitu mudah dimengerti, fleksibel, dan menarik karena dapat divisualisasikan dalam bentuk gambar (pohon keputusan). Algoritma C4.5 merupakan struktur pohon dimana terdapat simpul yang mendeskripsikan atribut-atribut, setiap cabang menggambarkan hasil atribut yang diuji, dan setiap daun menggambarkan kelas. Algoritma C4.5 secara rekursif mengunjungi setiap simpul keputusan, memilih pembagian yang optimal, sampai tidak bisa dibagi lagi. Algoritma C4.5 menggunakan konsep information gain atau entropy reduction untuk p 1 +p 2 + ... + p n =1 (2.2) Algoritma pohon keputusan yang terkenal adalah C4.5. Pada akhir tahun 1970 sampai awal tahun 1980 J. Ross Quinlan, seorang peneliti di bidang mechine learning, membuat sebuah algoritma decision tree yang terkenal dengan ID3 (Iterative Dichotomiser). Quinlan kemudian membuat algoritma C4.5 (sering disebut dengan pohon keputusan) yang merupakan pengembangan dari algoritma ID3 (Han, 2006). Algoritma ini memiliki kelebihan, yaitu mudah dimengerti, fleksibel, dan menarik karena dapat divisualisasikan dalam bentuk gambar (pohon keputusan). Algoritma C4.5 merupakan struktur pohon dimana terdapat simpul yang mendeskripsikan atribut-atribut, setiap cabang menggambarkan hasil atribut yang diuji, dan setiap daun menggambarkan kelas. Algoritma C4.5 secara rekursif mengunjungi setiap simpul keputusan, memilih pembagian yang optimal, sampai tidak bisa dibagi lagi. Algoritma C4.5 menggunakan konsep information gain atau entropy reduction untuk

1. Menyiapkan data training. Data training biasanya diambil dari data histori yang pernah terjadi sebelumnya dan sudah dikelompokkan ke dalam kelas-kelas tertentu.

2. Menentukan akar dari pohon. Akar dari pohon dimbil dari atribut yang terpilih, dengan cara mengitung nilai gain dari masing-masing atribut, nilai gain yang paling tinngi akan menjadi akar yang pertama. Sebelum menghitung nilai gain dari atribut, hitung dulu nilai entropy. Untuk menghitung nilai entropy digunakan rumus :

Entropy(S) = ∑ - pi . log 2 pi

i=1

Keteragan : S = Himpunan Kasus n = Jumlah Partisi S pi = Proporsi Si terhadap S

3. Kemudian hitung nilai gain menggunakan rumus :

Gain (S,A) = Entropy(S) - ∑ n | Si | * Entropy (Si)

i=1 |S|

Keterangan : S = Himpunan Kasus

A = Fitur n = Jumlah Partisi atribut A | Si | = Proporsi Si terhadap S | S | = Jumlah Kasus dalam S

4. Ulangi langkah ke-2 hingga semua record terpartisi.

5. Proses partisi pohon keputusan akan berhenti saat :

a. Semua record dalam simpul N mendapat kelas yang sama.

b. Tidak ada atribut di dalam record yang dipartisi lagi.

c. Tidak ada record di dalam cabang yang kosong.

Tabel 2.2 dibawah ini adalah contoh data training apakah seseorang nasabah bermasalah dalam kredit atau tidak.

Tabel 2.2 Data untuk klasifikasi resiko kredit

Pelanggan Simpanan

Aset

Pendapatan Resiko Kredit

75 Good Data training pada Tabel 2.2 adalah untuk menentukan apakah seseorang nasabah

8 Medium

Medium

bermasalah atau tidak, ditentukan oleh kolom predictor saving, asset, dan pendapatan. Kolom Resiko Kredit adalah kelas dari masing-masing record. Berikut akan dibahas prediksi apakah nasabah bermasalah atau tidak, menggunakan metode klasifikasi. Langkah untuk membuat pohon keputusan, yaitu :

1. Tabel 2.2 adalah data training beserta kelasnya. Untuk atribut pendapatan yang bernilai angka, dibuat dalam bentuk kategori, yaitu pendapatan <=25, pendapatan >25, pendapatan <=50, pendapatan >50, pendapatan <=75, pendapatan >75.

2. Hitung entropy. Dari data training diketahui jumlah kasus ada 8, yang beresiko kredit good 5 record dan Bad 3 record sehingga didapat entropy :

Entropy = 𝑛 ∑ 𝑖=0 − 𝑝𝑖. 𝑙𝑜𝑔2 𝑝𝑖 (2.5)

= (-5/8 . log2 (5/8)) + (-3/8 . log (3/8)) = 0.9544

3. Hitung nilai Gain untuk setiap atribut, lalu ditentukan nilai gain tertinggi. Yang mempunyai nilai gain tertinggi itulah yang akan dijadikan akar dari pohon. Misalkan atribut saving dengan nilai low didapat nilai gain :

Gain (S,A) = Entropy(S) - ∑ 𝑛 𝑖=0 |𝑆𝑖| * Entropy ( 𝑆𝑖) (2.6)

Gain (S,A) = 0.9544 – ( 2/8(1) + 3/8(0) + 3/8(0.9183) = 0.3601 ) Hasil perhitungan gain untuk setiap atribut terlihat pada Tabel 2.3. Nilai gain tertinggi akan menjadi akar pohon. Terlihat dari Tabel 2.3 Atribut, asset mempunyai nilai low, medium, dan high. Nilai low dan high masing-masing sudah menjadi satu klasifikasi karena pada data training, semua asset menghasilkan keputusan yang sama yaitu bad untuk nilai low dan good untuk nilai high. Sedangkan untuk simpul dengan nilai medium perlu dipartisi lagi.

Bad X Good

Gambar 2.2 Pohon Keputusan dengan Simpul Akar Asset Gambar 2.2 adalah hasil pembentukan pohon keputusan berdasarkan perhitungan yang terdapat pada Tabel 2.2. Dari hasil perhitungan didapat gain tertinggi untuk atribut asset, maka asset menjadi akar dari pohon keputusan. Untuk menentukan akar dari atribut medium, dilakukan lagi perhitungan nilai gain (Prabowo Pudjo Widodo, Ramadya Trias Handayanto, Herlawati (2013).

Tabel 2.3 Nilai Entropy dan Gain untuk menentukan Simpul Akar Simpul

Data Good Bad Entropy Gain

Akar Total

8 5 3 0.9544 Saving

Low

Medium

2 1 1 1 Asset

High

Low

Medium

2 2 0 0 Pendapatan

High

2. Support Vector Machine (SVM)

Support Vector Machine merupakan metode klasifikasi jenis terpandu (supervised) karena ketika proses pelatihan, diperlukan target pembelajaran tertentu, berbeda dengan FCM yang dalam proses klasifikasi tidak membutuhkan target pelatihan.

Support Vector Machine merupakan algoritma yang bekerja menggunakan pemetaan nonlinier untuk mengubah data pelatihan asli ke dimensi yang lebih tinggi. Dalam hal ini dimensi baru, akan mencari hyperplane untuk memisahkan secara linier dan dengan pemetaan nonlinier yang tepat ke dimensi yang cukup tinggi, data dari dua kelas selalu dapat dipisahkan dengan hyperplane tersebut. Support Vector Machine menemukan hyperplane ini menggunakan support vector dan margin.

Support Vector Machine muncul pertama kali pada tahun 1992 oleh Vladimir Vapnik berama rekannya Bernhard Boser dan Isabelle Guyon. Dasar untuk SVM sudah ada sejak tahun 1960-an (termasuk karya awal oleh Vapnik dan Alexei Chervonenkis pada teori belajar statistik).

Meskipun waktu pelatihan SVM kebanyakan lambat, tetapi metode ini sangat akurat karena kemampuannya untuk menangani model-model nonlinier yang kompleks. SVM kurang rentan terhadap overfitting dibandingkan metode lainnya. SVM dapat digunakan untuk prediksi dan klasifikasi. Contoh penerapannya antara lain deteksi tulisan tangan, pengenalan obyek, identifikasi suara, dan lain-lain (Prabowo Pudjo Widodo, Ramadya Trias Handayanto, Herlawati (2013).

3. Adaptive Neuro – Fuzzy Inference System (ANFIS)

berbeda dengan Fuzzy Inference System (FIS) atau yang lebih dikenal dengan fuzzy saja, ANFIS membuat rule berdasarkan data yang di training lewat mekanisme mirip jaringan syaraf tiruan (JST). Jenis rule yang bia dilayani hanyalah yang bertipe Takagi-Sugeno-Kang (TSK), atau dikenal dengan istilah Sugeno saja. Jenis mamdani tidak dapat diterapkan pada ANFIS. Untuk mengenal lebih dekat dengan fuzzy TSK tersebut ini ringkasannya.

Metode TSK diprakasai oleh Takagi, Sugeno, dan Kang pada tahun 1985. Tujuannya untuk memperoleh rule yang berasal dari hubungan masukan dan keluaran suatu sistem. Prinsipnya antara lain :

If x is A and y is B then z = f(x,y) (2.7) Dimana A dan B merupakan set Fuzzy sedangkan z merupakan fungsi dalam bentuk crisp (bukan fuzzy). Jadi perbedaan mencolok antara TSK dengan Mamdani terletak sisi kanan setelah “then” karena pada metode mamdani, setelah “then” masih berupa fungsi fuzzy, bukan crisp (Prabowo Pudjo Widodo, Ramadya Trias Handayanto, Herlawati (2013).

4. Interactive Dychotomizer Three (ID3)

ID3 (Iterative Dichotomiser Three) atau yang disebut juga dengan Induction of Decision Tree adalah suatu algoritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasi suatu obyek. Pengertian laindari ID3 yaitu ID3 merupakan sebuah metode yang digunakan untuk membangkitkan pohon keputusan.

ID3 diperkenalkan pertama kali oleh Ross Quinlan (1979). ID3 merepresentasi konsep-konsep dalam bentuk pohon keputusan. Aturan-aturan yang dihasilkan oleh ID3 mempunyai relasi yang hirarkis seperti suatu pohon (mempunyai akar, titik, cabang, dan daun). Beberapa peneliti menyebut struktur model yang dihasilkan ID3 sebagai pohon keputusan (decision tree) sementara peneliti yang lain menyebutnya pohon aturan (rule tree).

Algoritma pada ID3 berbasis pada Occam’s razor: lebih memilih pohon keputusan yang lebih kecil (teori sederhana) dibanding yang lebih besar. Tetapi tidak dapat selalu menghasilkan pohon keputusan yang paling kecil dan karena itu occam’s razor bersifat heuristik. Occam’s razor diformalisasi menggunakan konsep dari entropi informasi.

2.5 Teori Pemrograman

Pada penelitian ini dipilih menggunakan bahasa pemrograman PHP & MySQL. Berikut definisi dari PHP & MySQL :

2.5.1 PHP & MySQL

PHP (singkatan dari Personal Home Page) adalah bahasa pemrograman yang digunakan untuk membuat Aplikasi Web. Alasan Menggunakan PHP diantaranya :

1. Free (gratis), PHP bersifat Open Source. Sehingga kita bebas menggunakan PHP tanpa harus membayar.

2. Lintas Per Platform. PHP dapat dijalankan pada sistem operasi apapun, seperti Linux, Windows, OpenBSD, FreeBSD, Mac OS, Solaris, dll.

3. Didukung Berbagai Web Server Handal, seperti Apache, IIS (Windows), Xitami, Lighttpd, OmniSecure, WebWeaver, Sambar Server, dll.

4. Mampu Koneksi dengan Berbagai Database, baik yang gratisan maupun seperti MySQL, Ms. SQL Server, Ms. Acces, ORACLE, PostgresSQL, Interbase, SQLite, dBase, Informix, IBM DB2, Sybase, ODBC, dll.

5. Memiliki tingkat akses paling cepat dibanding pemrograman web lainnya (Lukmanul Hakim, 2014).

2.6 Perangkat Pemodelan Sistem Dalam Pembuatan Suatu Program.

Pada pembuatan pemodelan system sangat di perlukan jika akan merancang suatu system informasi. Pemodelan system berupa aliran data yang akan di proses menjadi informasi.

2.6.1 Basis Data (Database)

Sistem basis data (database) merupakan sistem yang terdiri dari kumpulan file atau tabel yang saling berhubungan dan memungkinkan beberapa pemakai mengakses dan memanipulasinya. Sistem basis data juga merupakan suatu sistem yang menyusun dan mengelola data organisasi perusahaan, sehingga mampu Sistem basis data (database) merupakan sistem yang terdiri dari kumpulan file atau tabel yang saling berhubungan dan memungkinkan beberapa pemakai mengakses dan memanipulasinya. Sistem basis data juga merupakan suatu sistem yang menyusun dan mengelola data organisasi perusahaan, sehingga mampu

a. Menghindari terjadinya data kembar.

b. Memudahkan dalam manipulasi data.

c. Standarisasi klasifikasi data dan dokumen. Adapun konsep database dijelaskan sebagai berikut :

1. Entity adalah sebuah tabel yang berisi obyek sebagai identitas atau keterangan tentang tabel tersebut. Contoh : Data Mahasiswa.

2. Atribute adalah karakteristik dari entity yang menyediakan penjelasan detail tentang entity tersebut.

Nilai atribut merupakan suatu data aktual atau informasi yang disimpan pada suatu atribut didalam suatu entity. Contoh : NIM, Nama. Jenis – jenis atribut :

a. Atribute simple yaitu atribut yang bernilai tunggal yang tidak bisa diuraikan lagi. Contoh : NIM, TTL.

b. Atribute composit yaitu suatu atribut yang terdiri dari beberapa atribut yang lebih kecil yang mempunyai arti tertentu. Contoh: Tanggal Lahir.

c. Primary Key (PK) yaitu atribut yang digunakan untuk menentukan suatu entity secara unik dan dapat mewakili setiap kejadian dari suatu entity. Contoh : atribut NIM pada tabel Data Mahasiswa.

d. Foreign Key (FK) yaitu atribut sebagai kunci tamu untuk berhubungan dengan entity yang mempunyai kunci utama (PK).

e. Record adalah kumpulan elemen yang saling berkaitan yang menginformasikan tentang suatu entity secara lengkap. Pada entity Data Mahasiswa terdapat record : NIM, Nama, Alamat, Tempat lahir, Tanggal lahir, dan Jurusan.

f. File adalah kumpulan record sejenis yang mempunyai panjang elemen yang sama, atribut yang sama namun berbeda data valuenya. Contoh : file Data Mahasiswa, file Data Mata Kuliah.

2.6.2 Data Flow Diagram (DFD)

Data Flow Diagram adalah sebuah teknis grafis yang menggambarkan aliran informasi yang diaplikasikan pada saat data bergerak dari input menjadi output. DFD dapat digunakan untuk menyajikan sebuah sistem atau perangkat lunak pada setiap abstraksi. DFD dapat dipartisi ke dalam tingkat-tingkat yang merepresentasikan aliran informasi yang bertambah dan fungsi ideal. Notasi dasar digunakan dalam DFD :

1. External Entity / Entitas Luar (kesatuan luar) External Entity yaitu sebuah elemen sistem (misalnya perangkat keras, seseorang, program yang lain) atau sistem yang lain yang menghasilkan informasi bagi transformsi oleh perangkat lunak atau menerima informasi yang dihasilkan oleh perangkat lunak.

Gambar 2.3 Entitas Luar

2. Data Flow (arus data) Arus data merupakan data yang menjadi input atau output ke atau dari proses. Arus data ini mengalir diantara proses (process), simpanan data (data store) dan kesatuan luar (external entity).

Gambar 2.4 Arus Data

3. Data Flow (arus data) Arus data merupakan data yang menjadi input atau output ke atau dari proses. Arus data ini mengalir diantara proses (process), simpanan data (data store) dan

Nama Proses

Gambar 2.5 Nama Proses

4. Data Store (simpanan data) Data store merupakan penyimpanan data yang ditunjukan (file/ database) untuk penggunaan selanjutnya. Simpanan data di DFD di simbolkan dengan sepasang garis horizontal.

Gambar 2.6 Data Store

2.6.3 FlowChart

Flowchart adalah bagian dengan simbol-simbol tertentu yang menggambarkan urutan suatu proses dalam program. Proses yaitu untuk pengolahan data baik operasi perhitungan

maupun perubahan harga. Data untuk proses pembacaan dan penulisan data Decistion untuk mengambil keputusan Predifimed proses untuk menunjukkan unit sub program Floppy disk untuk dokumentasi program dan disimpan pada

floppy disk Terminal menunjukkan awal dan akhir program. Document menunjukkan dokumentasi program yang dicetak

dikertas Conector sebagai tanda penghubung antara halaman Arrow menunjukkan arah proses program

Gambar 2.7 Simbol – Simbol Flowchart

BAB III METODOLOGI PENELITIAN

Bab ini menjelaskan tentang perancangan dalam membangun Aplikasi Data Mining. Analisis meliputi analisis data mining dengan metode ID3 serta analisis dalam membangun aplikasi.

3.1 Lokasi Penelitian

Lokasi Penelitian adalah di perguruan tinggi Universitas Muhammadiyah Sidoarjo. Penelitian dimulai pada Oktober 2015 sampai Desember 2015.

3.2 Alat dan Bahan Penelitian

a. Alat

a. Seperangkat Laptop Intel Core i3 – 2350M, 2.3 GHz.

b. Sistem Operasi Windows 7

c. Bahasa Pemrograman PHP

d. MySQL

b. Bahan

1. Buku referensi tentang pemrograman PHP & MySQL

2. Artikel – artikel tentang database

3. Data penelitian Alumni mahasiswa Universitas Muhammadiyah Sidoarjo

3.3 Kerangka Penelitian

Pengumpulan Data

Analisa Data

Perancangan Sistem

Perancangan Program

Uji Kelayakan

Evaluasi Program

Implementasi Program

Gambar 3.1 Langkah-langkah penelitian secara skematis Dimana didalam pembuatan suatu system maupun aplikasi dibutuhkan sebuah

kerangka agar system atau aplikasi tersebut layak dipergunakan dan dapat bermanfaat bagi pemakainya. Dalam pembuatan aplikasi ada beberapa langkah – langkah yang harus diperhatikan yang biasa disebut dengan kerangka penelitian yang diantaranya adalah Pengumpulan Data, setelah melakukan pengumpulan data maka selanjutanya adalah menganalisa data tersebut sehingga dapat menentukan perancangan system yang dibutuhkan, selanjutnya menentukan perancangan program yang akan dipergunakan untuk membuat aplikasi tersebut. Setelah melakukan perancangan program, maka program yang sudah selesai diuji kelayakannya, jika masih belum sesuai dengan apa yang diharapkan maka langkah selanjutnya dengan mengevaluasi kerangka agar system atau aplikasi tersebut layak dipergunakan dan dapat bermanfaat bagi pemakainya. Dalam pembuatan aplikasi ada beberapa langkah – langkah yang harus diperhatikan yang biasa disebut dengan kerangka penelitian yang diantaranya adalah Pengumpulan Data, setelah melakukan pengumpulan data maka selanjutanya adalah menganalisa data tersebut sehingga dapat menentukan perancangan system yang dibutuhkan, selanjutnya menentukan perancangan program yang akan dipergunakan untuk membuat aplikasi tersebut. Setelah melakukan perancangan program, maka program yang sudah selesai diuji kelayakannya, jika masih belum sesuai dengan apa yang diharapkan maka langkah selanjutnya dengan mengevaluasi

3.4 Tahap Pengumpulan Data

Teknik pengumpulan data yang digunakan dalam penelitian skripsi adalah :

1. Pengamatan (observasi ) Yaitu suatu teknik pengumpulan data yang di peroleh dengan jalan melakukan penelitian dan pencatatan secara langsung pada obyek yang di teliti.

2. Studi Literatur Yaitu melalui berbagai artikel yang didapat dari jurnal dan buku – buku referensi yang menunjang pembuatan aplikasi ini.

3. Wawancara (Interview) Melakukan tanya jawab secara langsung dengan memberikan kuesioner kepada mahasiswa yang berkaitan dengan permasalahan seputar obyek penelitian untuk memperoleh keterangan yang relevan.

3.5 Analisa

3.5.1 Perhitungan hasil Analisa Data Latih

Tabel 3.1 Hasil Analisa Data Latih

Lulus Tepat No. Jenis Kelamin Tipe Kepribadian IPK

Kegiatan Waktu

1. Laki-laki

Introvert

3.30 Belajar Ya

2. Laki-laki

Introvert

3.30 Belajar Ya

3. Laki-laki

Introvert

3.30 Belajar Ya

4. Laki-laki

Introvert

3.30 Belajar Ya

5. Laki-laki

Extrovert

3.00 Nongkrong Tidak

6. Laki-laki

Extrovert

3.00 Nongkrong Tidak

7. Laki-laki

Extrovert

3.00 Bekerja Ya

8. Laki-laki

Extrovert

3.00 Bekerja Ya

9. Laki-laki Extrovert

3.00 Nongkrong Tidak

10. Laki-laki Extrovert

3.00 Nongkrong Tidak

11. Laki-laki

Introvert

3.00 Tidur Tidak

12. Laki-laki

Introvert

3.00 Tidur Tidak

13. Laki-laki Extrovert

2.75 Bekerja Tidak

14. Laki-laki Extrovert

2.75 Bekerja Tidak

15. Laki-laki Extrovert

3.00 Bekerja Ya

16. Laki-laki Extrovert

3.00 Bekerja Ya

17. Laki-laki Extrovert

3.30 Bekerja Ya

18. Laki-laki Extrovert

3.30 Bekerja Ya