PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH SKRIPSI SHARFINA FAZA 101402088

  PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH

  SKRIPSI Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana

  Teknologi Informasi SHARFINA FAZA

  101402088

  

PERSETUJUAN

  Judul : PENCARIAN ASSOCIATION RULES PADA DATA

  ._ LULUSAN MAHASISWA PERGURUAN TINGGI ._ MENGGUNAKAN ALGORITMA FP-GROWTH

  Kategori : SKRIPSI Nama : SHARFINA FAZA Nomor Induk Mahasiswa : 101402088 Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

  .. UNIVERSITAS SUMATERA UTARA

  Komisi Pembimbing : Pembimbing 2 Pembimbing 1

  

PERNYATAAN

  PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH

  SKRIPSI Saya mengakui bahwa skripsi ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

  Medan, 15 Januari 2015 Sharfina Faza 101402088

  Puji dan syukur penulis panjatkan kepada Allah SWT yang telah memberikan rahmat, karunia, taufik dan hidayah-Nya, serta segala sesuatu dalam hidup, sehingga penulis dapat menyelesaikan skripsi ini sebagai syarat untuk memperoleh gelar Sarjana Teknologi Informasi, Program Studi (S1)Teknologi Informasi, Fakultas Ilmu Komputer dan Teknologi Informasi.

  Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah membantu penulis dalam menyelesaikan skripsi ini baik secara langsung maupun tidak langsung. Pada kesempatan ini penulis ingin mengucapkan terima kasih yang sebesar-besarnya kepada:

  1. Keluarga penulis, Ayahanda Ir. Silmi, MT., Ibunda Ir. Rina Anugrahwaty, MT., Kakak penulis Insidini Fawwaz, S.Kom, dan adik penulis Faizzufar Taqy beserta keluarga besar yang selalu memberikan dukungan, perhatian serta doa kepada penulis sehingga dapat menyelesaikan skripsi ini.

  2. Ibu Dr. Erna Budhiarti Nababan, M.IT. selaku Dosen Pembimbing I dan Bapak Dedy Arisandi, ST., M.Kom, selaku Dosen Pembimbing II yang telah banyak meluangkan waktunya serta memberikan bimbingan dan dukungan kepada penulis dalam penyusunan dan penulisan skripsi ini.

  3. Bapak Romi Fadillah Rahmat, B.Comp.Sc., M.Sc. selaku Dosen Penguji I dan Bapak Dani Gunawan, ST., MT. selaku Dosen Penguji II yang telah memberikan

  ABSTRAK

  Beragamnya atribut pada data lulusan mahasiswa membuat pihak perguruan tinggi sulit mencari dan mengetahui kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi antar atribut. Association rules mining merupakan teknik data

  

mining untuk menentukan hubungan diantara data atau bagaimana suatu kelompok

  data mempengaruhi suatu kelompok data lain. Dengan kata lain, dapat dicarinya keterhubungan antar data pada data skala besar. Algoritma Frequent Pattren-Growth

  

(FP-Growth) adalah salah satu teknik association rules mining untuk menentukan

  himpunan item yang paling sering muncul (frequent itemset) dalam sekumpulan data dalam bentuk FP-Tree. Dari hasil pencarian association rules pada data lulusan mahasiswa perguruan tinggi didapat kombinasi atribut yang sering muncul dan memiliki keterhubungan tinggi adalah kombinasi dari jenis sekolah SMA/MA Negeri Luar Medan, jalur masuk SNMPTN, nilai IPK antara 3.00 s/d 3.49, dan lama studi lebih dari 4 tahun.

  Kata kunci: Data mining, association rules, algoritma FP-Growth.

  

SEARCHING ASSOCIATION RULES OF DATA GRADUATE STUDENTS

UNIVERSITY USING FP-GROWTH ALGORITHM

ABSTRACT

  The attribute diversity of data graduate students makes it difficult for the university to find and know combination of attributes that apperar most frequently and have high connectivity between attributes. Association rules mining is a data mining techniques to determine a relationship between data or how a group of data affects another group of data. In other words, it can be find a connectivity between data in large scale of data. Frequent pattren-Growth Algorithm (FP-Growth) is one of the association rules mining techniques to determine a set of items that appear most frequently (frequent itemset) in a set of data in the form FP-Tree. From the results of searching association rules of data graduate students university, combination of attributes that appear most frequently and have high connectivity obtained is a combination of the type of State Senior High School Outside Medan, university entrance test SNMPTN , GPA between 3.00 - 3.49 , and times of study more than 4 years .

  

DAFTAR ISI

Hal.

  PERSETUJUAN ii

  PERNYATAAN iii

  UCAPAN TERIMA KASIH iv

  ABSTRAK v

  ABSTRACT vi

  DAFTAR ISI vii

  DAFTAR TABEL x

  DAFTAR GAMBAR xi

  BAB 1 PENDAHULUAN

  1

  1.1

  1 Latar Belakang

  1.2

  3 Rumusan Masalah

  1.3

  4 Batasan Masalah

  1.4

  4 Tujuan Penelitian

  1.5

  4 Manfaat Penelitian

  1.6

  5 Metodologi

  3.2.1 Penentuan atribut

  21

  3.2.2 Pengelompokan atribut

  23

  3.3 Pemrosesan Data

  23

  3.3.1 Data mining

  24

  3.3.2 Analisis frequent itemset

  26

  3.3.3 Pembentukan association rules

  32

  3.3.4 Pencocokan saran

  33

  3.4 Analisis Komponen Sistem

  35

  3.4.1 Data Flow Diagram (DFD)

  35

  3.4.1.1 DFD level-0

  36

  3.4.1.2 DFD level-1

  37

  3.4.1.3 DFD level-2

  38

  3.4.2 Flowchart

  40

  3.4.3 Sitemap aplikasi

  41

  3.5 Database Relationship

  42

  3.6 Perancangan Sistem

  43 BAB 4

  IMPLEMENTASI DAN PENGUJIAN SISTEM

  49

  4.1 Implementasi Sistem

  49

  4.1.1 Spesifikasi software dan hardware yang digunakan

  49

  4.1.2 Implementasi Perancangan Antarmuka

  49

  5.2 Saran

  73 DAFTAR PUSTAKA

  74 LAMPIRAN A : SURAT KETERANGAN PENGAMBILAN DATA

  76

  

DAFTAR TABEL

Hal.

  26 Tabel 3.8 Data itemset lulusan mahasiswa

  54 Tabel 4.2 Hasil pengujian

  32 Tabel 4.1 Rencana pengujian

  32 Tabel 3.12 Nilai confidence dari frequent itemset

  32 Tabel 3.11 Nilai support dari suffix O

  31 Tabel 3.10 Nilai support dari suffix N

  27 Tabel 3.9 Nilai support dari suffix M

  25 Tabel 3.7 Nilai support per item

Tabel 2.1 Penelitian Terdahulu

  25 Tabel 3.6 Data lulusan mahasiswa dengan itemset

  24 Tabel 3.5 Kode untuk setiap item atribut

  22 Tabel 3.4 Data Lulusan mahasiswa

  22 Tabel 3.3 Jumlah lulusan mahasiswa berdasarkan prestasi

  20 Tabel 3.2 Pengelompokan prestasi keberhasilan

  18 Tabel 3.1 Jumlah lulusan mahasiswa per fakultas

  55

  

DAFTAR GAMBAR

Hal.

Gambar 2.1 Proses KDD (Han & Kamber 2006)

  8 Gambar 2.2 Arsitektur sistem data mining (Han & Kamber 2006)

  9 Gambar 2.3 Transaction data set (Tan, et al. 2005)

  14 Gambar 2.4 Tree setelah membaca TID1 (Tan, et al. 2005)

  14 Gambar 2.5 Tree setelah membaca TID2 (Tan, et al. 2005)

  15 Gambar 2.6 Tree setelah membaca TID10 (Tan, et al. 2005)

  15 Gambar 2.7 Tree yang mengandung suffix e (Tan, et al. 2005)

  16 Gambar 2.8 Tree yang mengandung suffix d (Tan, et al. 2005)

  16 Gambar 3.1 Proses analisis association rules

  19 Gambar 3.2 Tree setelah pembacaan itemset-1

  28 Gambar 3.3 Tree setelah pembacaan itemset-2

  28 Gambar 3.4 Tree setelah pembacaan itemset-3

  29 Gambar 3.5 Tree setelah pembacaan itemset-30

  29 Gambar 3.6 Conditional FP-tree dengan suffix M

  30

Gambar 3.20 Rancangan tampilan halaman info

  52 Gambar 4.5 Halaman parameter

  62 Gambar 4.13 Hasil pencarian fakultas kesehatan masyarakat

  62 Gambar 4.12 Hasil pencarian fakultas farmasi

  61 Gambar 4.11 Hasil pencarian fakultas kedokteran gigi

  58 Gambar 4.10 Hasil pencarian fakultas kedokteran

  57 Gambar 4.9 Hasil proses pencarian

  57 Gambar 4.8 Hasil uji coba pencarian

  53 Gambar 4.7 Proses pencarian association rules

  53 Gambar 4.6 Halaman jumlah mahasiswa

  51 Gambar 4.4 Halaman daftar lulusan mahasiswa

  44 Gambar 3.21 Rancangan tampilan home pengguna sebagai admin

  51 Gambar 4.3 Halaman input lulusan mahasiswa

  50 Gambar 4.2 Halaman home pengguna sebagai admin

  48 Gambar 4.1 Halaman home pengguna sebagai user

  47 Gambar 3.26 Rancangan tampilan kelola pengguna

  47 Gambar 3.25 Rancangan tampilan jumlah mahasiswa

  46 Gambar 3.24 Rancangan tampilan parameter data

  45 Gambar 3.23 Rancangan tampilan daftar lulusan mahasiswa

  45 Gambar 3.22 Rancangan tampilan input lulusan mahasiswa

  63