PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH SKRIPSI SHARFINA FAZA 101402088
PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH
SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana
Teknologi Informasi SHARFINA FAZA
101402088
PERSETUJUAN
Judul : PENCARIAN ASSOCIATION RULES PADA DATA
._ LULUSAN MAHASISWA PERGURUAN TINGGI ._ MENGGUNAKAN ALGORITMA FP-GROWTH
Kategori : SKRIPSI Nama : SHARFINA FAZA Nomor Induk Mahasiswa : 101402088 Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
.. UNIVERSITAS SUMATERA UTARA
Komisi Pembimbing : Pembimbing 2 Pembimbing 1
PERNYATAAN
PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH
SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.
Medan, 15 Januari 2015 Sharfina Faza 101402088
Puji dan syukur penulis panjatkan kepada Allah SWT yang telah memberikan rahmat, karunia, taufik dan hidayah-Nya, serta segala sesuatu dalam hidup, sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi (S1)Teknologi Informasi, Fakultas Ilmu Komputer dan Teknologi Informasi.
Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah membantu penulis dalam menyelesaikan skripsi ini baik secara langsung maupun tidak langsung. Pada kesempatan ini penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada:
1. Keluarga penulis, Ayahanda Ir. Silmi, MT., Ibunda Ir. Rina Anugrahwaty, MT., Kakak penulis Insidini Fawwaz, S.Kom, dan adik penulis Faizzufar Taqy beserta keluarga besar yang selalu memberikan dukungan, perhatian serta doa kepada penulis sehingga dapat menyelesaikan skripsi ini.
2. Ibu Dr. Erna Budhiarti Nababan, M.IT. selaku Dosen Pembimbing I dan Bapak Dedy Arisandi, ST., M.Kom, selaku Dosen Pembimbing II yang telah banyak meluangkan waktunya serta memberikan bimbingan dan dukungan kepada penulis dalam penyusunan dan penulisan skripsi ini.
3. Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc. selaku Dosen Penguji I dan Bapak Dani Gunawan, ST., MT. selaku Dosen Penguji II yang telah memberikan
ABSTRAK
Beragamnya atribut pada data lulusan mahasiswa membuat pihak perguruan tinggi sulit mencari dan mengetahui kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut. Association rules mining merupakan teknik data
mining untuk menentukan hubungan diantara data atau bagaimana suatu kelompok
data mempengaruhi suatu kelompok data lain. Dengan kata lain, dapat dicarinya keterhubungan antar data pada data skala besar. Algoritma Frequent Pattren-Growth
(FP-Growth) adalah salah satu teknik association rules mining untuk menentukan
himpunan item yang paling sering muncul (frequent itemset) dalam sekumpulan data dalam bentuk FP-Tree. Dari hasil pencarian association rules pada data lulusan mahasiswa perguruan tinggi didapat kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi adalah kombinasi dari jenis sekolah SMA/MA Negeri Luar Medan, jalur masuk SNMPTN, nilai IPK antara 3.00 s/d 3.49, dan lama studi lebih dari 4 tahun.
Kata kunci: Data mining, association rules, algoritma FP-Growth.
SEARCHING ASSOCIATION RULES OF DATA GRADUATE STUDENTS
UNIVERSITY USING FP-GROWTH ALGORITHM
ABSTRACT
The attribute diversity of data graduate students makes it difficult for the university to find and know combination of attributes that apperar most frequently and have high connectivity between attributes. Association rules mining is a data mining techniques to determine a relationship between data or how a group of data affects another group of data. In other words, it can be find a connectivity between data in large scale of data. Frequent pattren-Growth Algorithm (FP-Growth) is one of the association rules mining techniques to determine a set of items that appear most frequently (frequent itemset) in a set of data in the form FP-Tree. From the results of searching association rules of data graduate students university, combination of attributes that appear most frequently and have high connectivity obtained is a combination of the type of State Senior High School Outside Medan, university entrance test SNMPTN , GPA between 3.00 - 3.49 , and times of study more than 4 years .
DAFTAR ISI
Hal.PERSETUJUAN ii
PERNYATAAN iii
UCAPAN TERIMA KASIH iv
ABSTRAK v
ABSTRACT vi
DAFTAR ISI vii
DAFTAR TABEL x
DAFTAR GAMBAR xi
BAB 1 PENDAHULUAN
1
1.1
1 Latar Belakang
1.2
3 Rumusan Masalah
1.3
4 Batasan Masalah
1.4
4 Tujuan Penelitian
1.5
4 Manfaat Penelitian
1.6
5 Metodologi
3.2.1 Penentuan atribut
21
3.2.2 Pengelompokan atribut
23
3.3 Pemrosesan Data
23
3.3.1 Data mining
24
3.3.2 Analisis frequent itemset
26
3.3.3 Pembentukan association rules
32
3.3.4 Pencocokan saran
33
3.4 Analisis Komponen Sistem
35
3.4.1 Data Flow Diagram (DFD)
35
3.4.1.1 DFD level-0
36
3.4.1.2 DFD level-1
37
3.4.1.3 DFD level-2
38
3.4.2 Flowchart
40
3.4.3 Sitemap aplikasi
41
3.5 Database Relationship
42
3.6 Perancangan Sistem
43 BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM
49
4.1 Implementasi Sistem
49
4.1.1 Spesifikasi software dan hardware yang digunakan
49
4.1.2 Implementasi Perancangan Antarmuka
49
5.2 Saran
73 DAFTAR PUSTAKA
74 LAMPIRAN A : SURAT KETERANGAN PENGAMBILAN DATA
76
DAFTAR TABEL
Hal.26 Tabel 3.8 Data itemset lulusan mahasiswa
54 Tabel 4.2 Hasil pengujian
32 Tabel 4.1 Rencana pengujian
32 Tabel 3.12 Nilai confidence dari frequent itemset
32 Tabel 3.11 Nilai support dari suffix O
31 Tabel 3.10 Nilai support dari suffix N
27 Tabel 3.9 Nilai support dari suffix M
25 Tabel 3.7 Nilai support per item
Tabel 2.1 Penelitian Terdahulu25 Tabel 3.6 Data lulusan mahasiswa dengan itemset
24 Tabel 3.5 Kode untuk setiap item atribut
22 Tabel 3.4 Data Lulusan mahasiswa
22 Tabel 3.3 Jumlah lulusan mahasiswa berdasarkan prestasi
20 Tabel 3.2 Pengelompokan prestasi keberhasilan
18 Tabel 3.1 Jumlah lulusan mahasiswa per fakultas
55
DAFTAR GAMBAR
Hal.Gambar 2.1 Proses KDD (Han & Kamber 2006)8 Gambar 2.2 Arsitektur sistem data mining (Han & Kamber 2006)
9 Gambar 2.3 Transaction data set (Tan, et al. 2005)
14 Gambar 2.4 Tree setelah membaca TID1 (Tan, et al. 2005)
14 Gambar 2.5 Tree setelah membaca TID2 (Tan, et al. 2005)
15 Gambar 2.6 Tree setelah membaca TID10 (Tan, et al. 2005)
15 Gambar 2.7 Tree yang mengandung suffix e (Tan, et al. 2005)
16 Gambar 2.8 Tree yang mengandung suffix d (Tan, et al. 2005)
16 Gambar 3.1 Proses analisis association rules
19 Gambar 3.2 Tree setelah pembacaan itemset-1
28 Gambar 3.3 Tree setelah pembacaan itemset-2
28 Gambar 3.4 Tree setelah pembacaan itemset-3
29 Gambar 3.5 Tree setelah pembacaan itemset-30
29 Gambar 3.6 Conditional FP-tree dengan suffix M
30
Gambar 3.20 Rancangan tampilan halaman info52 Gambar 4.5 Halaman parameter
62 Gambar 4.13 Hasil pencarian fakultas kesehatan masyarakat
62 Gambar 4.12 Hasil pencarian fakultas farmasi
61 Gambar 4.11 Hasil pencarian fakultas kedokteran gigi
58 Gambar 4.10 Hasil pencarian fakultas kedokteran
57 Gambar 4.9 Hasil proses pencarian
57 Gambar 4.8 Hasil uji coba pencarian
53 Gambar 4.7 Proses pencarian association rules
53 Gambar 4.6 Halaman jumlah mahasiswa
51 Gambar 4.4 Halaman daftar lulusan mahasiswa
44 Gambar 3.21 Rancangan tampilan home pengguna sebagai admin
51 Gambar 4.3 Halaman input lulusan mahasiswa
50 Gambar 4.2 Halaman home pengguna sebagai admin
48 Gambar 4.1 Halaman home pengguna sebagai user
47 Gambar 3.26 Rancangan tampilan kelola pengguna
47 Gambar 3.25 Rancangan tampilan jumlah mahasiswa
46 Gambar 3.24 Rancangan tampilan parameter data
45 Gambar 3.23 Rancangan tampilan daftar lulusan mahasiswa
45 Gambar 3.22 Rancangan tampilan input lulusan mahasiswa
63