Model Sistem Pendukung Keputusan Dalam Penentuan Matakuliah Pilihan Di Jurusan Teknik Informatika UNIKOM

(1)

(2)

(3)

(4)

DALAM PENENTUAN MATAKULIAH PILIHAN

DI JURUSAN TEKNIK INFORMATIKA UNIKOM

Oleh

Dian Dharmayanti 5710110822

TESIS

Untuk memenuhi salah satu syarat ujian guna memperoleh gelar Magister Sistem Informasi

PROGRAM PASCA SARJANA UNIVERSITAS KOMPUTER INDONESIA

BANDUNG 2012


(5)

iv

KATA PENGANTAR

Segala puji dan syukur yang sedalam-dalamnya dipanjatkan ke khadirat Allah SWT yang telah memberikan karunia dan hidayah-Nya sehingga penulis dapat menyelesaikan tesis yang berjudul “Model Sistem Pendukung Keputusan Dalam Penentuan Matakuliah Pilihan Di Jurusan Teknik Informatika UNIKOM”. Tesis ini disusun untuk memenuhi syarat untuk memperoleh gelar magister komputer di Universitas Komputer Indonesia.

Penulis menyadari sepenuhnya bahwa dalam penulisan tesis ini masih terdapat kekurangan, karena itu penulis terbuka untuk menerima saran dan kritik yang sifatnya membangun dari pembaca agar dapat digunakan sebagai bahan kajian untuk pembuatan karya ilmiah yang lebih baik. Walaupun demikian, penulis telah berusaha semaksimal mungkin untuk dapat menyelesaikan tesis ini dengan harapan dapat memberikan manfaat khususnya dalam wawasan ilmu pengetahuan.

Dalam menyelesaikan tesis ini, penulis banyak sekali mendapat bantuan serta dorongan dari berbagai pihak baik moril maupun materil. Oleh karena itu perkenankan penulis menyampaikan terima kasih dan penghargaan sebesar-besarnya kepada :

1. Allah SWT dan Nabi Muhammad SAW, dengan rahmat dan kuasanya tesis ini dapat terselesaikan.

2. Bapak dan ibu tercinta, yang telah membesarkan, mendidik, memberikan dorongan dan mendoakan sehingga saya dapat menyelesaikan pendidikan ini.

3. Suami, anak-anak dan saudara-saudaraku yang telah memberikan dukungan, perhatian dan doa sehingga dapat menyelesaikan tesis ini.


(6)

v

4. Bapak Dr. Eng. Estiko Rijanto dan ibu Mira Kania Sabariah, M.T. , sebagai pembimbing dalam penulisan tesis ini yang telah banyak memberikan arahan, petunjuk, bantuan dan dorongan sampai terselesaikannya tesis ini.

5. Dr. Ir. Herman S. Soegoto, MBA sebagai Direktur Fakultas Pascasarjana Univerversitas Komputer Indonesia yang telah menerima dan memberikan kesempatan kepada saya sebagai mahasiswa Magister Sistem Informasi.

6. Semua rekan-rekan dosen di Teknik Informatika Universitas Komputer Indonesia. 7. Staf TU MSI, terima kasih atas kesabaran dan bantuan-bantuannya.

8. Dan juga kepada seluruh pihak-pihak yang tidak bias penulis tuliskan satu per satu.

Penulis berharap tulisan ini dapat bermanfaat bagi semua pihak dan semoga hasil penelitian ini dapat dilanjutkan sehingga didapatkan hasil yang bisa lebih baik dari yang telah penulis susun.

Bandung, Agustus 2012 Penulis.

(Dian Dharmayanti) NPM.5710110822


(7)

vi

DAFTAR ISI

ABSTRAK ... ii

ABSTRACT ...iii

KATA PENGANTAR ... iv

DAFTAR ISI ... vi

DAFTAR TABEL ... xi

DAFTAR GAMBAR ... xii

BAB I PENDAHULUAN ... 1

I.1 Latar Belakang ... 1

I.2 Rumusan Masalah ... 2

I.3 Tujuan Penelitian... 3

I.4 Manfaat Penelitian... 3

I.5 Batasan Masalah ... 3

I.6 Sistematika Penulisan ... 4

BAB II TINJAUAN PUSTAKA ... 6

II.1 Profil Jurusan... 6

II.1.1 Identitas Jurusan... 6


(8)

vii

II.2 Landasan Teori ... 10

II.2.1 Sistem Pendukung Keputusan... 10

II.2.2 Data Mining ... 17

II.2.2.1 Pengertian Data Mining ... 17

II.2.2.2 Proses Data Mining ... 18

II.2.2.3 Data Pada Data Mining ... 21

II.2.2.4 Teknik Data Mining dengan Association Rule Mining ... 23

II.2.2.5 Pendekatan Algoritma FP-Growth ... 25

II.2.2.6 Konsep Dasar Database ... 29

BAB III METODOLOGI PENELITIAN ... 31

III.1 Tahapan Penelitian ... 31

III.2 Skenario Penelitian ... 34

III.3 Waktu dan Tempat Penelitian... 35

BAB IV ANALISIS MODEL ... 36

IV.1 Analisis Metode dan Algoritma ... 36

IV.1.1 Analisis Metode ... 36

IV.1.2 Analisis Algoritma ... 38

IV.2 Business Understanding ... 39


(9)

viii

IV.3.1 Batasan-batasan dan Asumsi ... 42

IV.3.2 Realisasi Use Case ... 44

IV.3.2.1 Skenario Use Case Input Data Uji ... 45

IV.3.2.2 Skenario Use Case Penentuan Nilai Minimum Support dan Minimum Confidence ... 45

IV.3.2.3 Skenario Use Case Pembangunan FP-Tree... 46

IV.3.2.4 Skenario Use Case Ekstrak Frequent Itemset... 47

IV.3.2.5 Skenario Use Case Rule Generation ... 47

IV.3.2.6 Skenario Use Case Output AR ... 48

IV.3.2.7 Skenario Use Case Perbandingan Rules ... 49

IV.3.3 Realisasi Diagram Aktivitas ... 49

IV.3.3.1 Diagram Aktivitas Input Data Uji ... 50

IV.3.3.2 Diagram Aktivitas Penentuan Nilai Minsup dan Minconf ... 50

IV.3.3.3 Diagram Aktivitas Pembangunan FP-Tree ... 51

IV.3.3.4 Diagram Aktivitas Ekstrak Frequent Itemset ... 51

IV.3.3.5 Diagram Aktivitas Rule Generation ... 52

IV.3.3.6 Diagram Aktivitas Output AR... 52

IV.3.3.7 Diagram Aktivitas Perbandingan Rules ... 53


(10)

ix

IV.3.4.1 Sequence Input Data Uji ... 53

IV.3.4.2 Sequence Penentuan Nilai Minsup dan Minconf ... 54

IV.3.4.3 Sequence Pembangunan FP-Tree ... 54

IV.3.4.4 Sequence Ekstrak Frequent Itemset ... 55

IV.3.4.5 Sequence Rule Generation ... 55

IV.3.4.6 Sequence Output AR ... 56

IV.3.4.7 Sequence Perbandingan Rules ... 56

IV.3.5 Class Diagram ... 57

BAB V SIMULASI MODEL ... 61

V.1 Pengumpulan dan Analisis Data ... 61

V.1.1 Data Hasil Polling ... 61

V.1.2 Data Histori Nilai ... 63

V.2 Pendefinisian Atribut Data ... 65

V.2.1 Berdasarkan Data Hasil Polling ... 65

V.2.2 Berdasarkan Data Histori Nilai ... 66

V.3 Pemodelan ... 67

V.3.1 Pembangunan FP-Tree ... 68

V.3.1.1 Berdasarkan Hasil Polling ... 68


(11)

x

V.3.2 Generate Rule ... 75

V.3.3 Pengujian dengan Nilai Minimum Support dan Nilai Minimum Confidence ... 76

BAB VI KESIMPULAN DAN SARAN ... 77

VI.1 Kesimpulan ... 77

VI.2 Saran ... 77

DAFTAR PUSTAKA ... 79 LAMPIRAN


(12)

1

BAB I

PENDAHULUAN

I.1 Latar Belakang

Teknik Informatika merupakan salah satu jurusan dengan kapasitas jumlah mahasiswa yang besar di Universitas Komputer Indonesia (Unikom). Jurusan teknik informatika memiliki visi dan misi yang akan selalu menjadi acuan dalam kegiatan akademik. Begitu pula dalam pelaksanaan kurikulum, kurikulum akan menawarkan matakuliah pilihan yang dapat memenuhi visi dan misi jurusan. Jurusan ini menawarkan beberapa matakuliah pilihan di semester akhir yaitu semester 7 dan 8.

Saat ini dalam penentuan matakuliah yang ditawarkan, pihak jurusan menggunakan sistem polling yaitu memberikan semacam kuisoner kepada mahasiswa tingkat akhir untuk menentukan matakuliah pilihan yang akan diambil. Matakuliah pilihan dengan jumlah polling

terbesarlah yang akan dijadikan matakuliah pilihan wajib bagi seluruh mahasiswa tingkat akhir. Namun hal ini akan menimbulkan masalah bagi mahasiswa khususnya dikarenakan mahasiswa tersebut mengikuti pemilihan yang dilakukan oleh temannya bukan berdasarkan minat mahasiswa itu sendiri. Selain itu setiap matakuliah pilihan tersebut mempunyai nilai prasyarat dari matakuliah sebelumnya yang sebenarnnya dapat dijadikan acuan dalam penentuan matakuliah pilihan yang ditawarkan. Padahal matakuliah pilihan ini akan dapat menunjang proses penyelesaian tugas akhir yang akan mereka hadapi di semester selanjutnya. Selain itu penentuan matakuliah pilihan yang ditawarkan juga dapat ditentukan oleh apapun kebijakan yang diambil pihak jurusan dengan melihat kondisi jurusan dan mahasiswa. Matakuliah pilihan yang ditawarkan akan menentukan kekhasan jurusan Teknik Informatika berdasarkan visi dan misi yang akan dicapai.

Sistem pendukung keputusan (SPK) merupakan sistem yang menyediakan sarana bagi para manajer atau pihak pimpinan untuk mengembangkan informasi sesuai dengan keputusan


(13)

yang akan dibuat. Sistem ini merupakan bagian dari sistem informasi berbasis komputer (termasuk sistem berbasis pengetahuan (manajemen pengetahuan)) yang dipakai untuk mendukung pengambilan keputusan dalam suatu organisasi atau perusahaan. Sistem pendukung keputusan ini bertujuan untuk meningkatkan efektifitas bukan efisiensi pengambilan keputusan. Dalam pemrosesannya, SPK dapat menggunakan bantuan dari sistem lain seperti Artificial Intelligence, Expert Systems, Fuzzy Logic, atau dengan menerapkan teknologi dalam data mining.

Data mining merupakan suatu teknologi baru yang dikembangkan untuk menjawab persoalan dalam kumpulan data yang sangat besar. Data mining sendiri adalah serangkaian proses yang dapat mentransformasikan data dalam jumlah besar menjadi suatu informasi yang berguna[Tan, 2006]. Data historical dapat kita ekstrak untuk mendapatkan informasi dengan menerapkan teknologi data mining. Informasi ini dapat dijadikan alternatif solusi dalam proses pengambilan keputusan. Data mining memiliki banyak jenis teknik analisa yang digunakan dalam menemukan pattern dari suatu kumpulan data. Tiga teknik data mining

yang paling populer diantaranya adalah Association Rule Mining, Classification, Clustering. Dari paparan diatas, diharapkan dengan adanya model sistem pendukung keputusan yang dimiliki oleh pihak jurusan dapat membantu untuk menentukan pola keterkaitan antara nilai histori matakuliah, data polling atau irisan diantara keduanya dalam penentuan matakuliah pilihan yang akan ditawarkan dengan menerapkan teknik data mining.

I.2 Rumusan Masalah

Adapun perumusan masalah pada penelitian ini adalah sebagai berikut :

”Bagaimana membangun model sistem pendukung keputusan dapat memberikan rekomendasi penentuan matakuliah pilihan tidak hanya berdasarkan sistem polling (kemauan


(14)

mahasiswa) tetapi juga histori nilai mahasiswa (kemampuan) terhadap matakuliah pilihan atau berdasarkan data acuan dari kebijakan yang diambil pihak jurusan”

I.3 Tujuan Penelitian

Tujuan penyusunan penelitian ini adalah

1. Menghasilkan sebuah model sistem pendukung keputusan dalam penentuan matakuliah pilihan di Jurusan Teknik Informatika dengan data acuan dari kebijakan yang dinamis.

2. Model sistem pendukung keputusan ini dapat mencari minimum support dan

minimumconfidence yang maksimal untuk mendapatkan rekomendasi keputusan.

I.4 Manfaat Penelitian

Adapun manfaat pada penelitian ini adalah sebagai berikut :

1. Model keputusan ini dapat memberikan rekomendasi keputusan dalam penentuan matakuliah pilihan yang akan ditawarkan.

2. Model keputusan ini dapat menerima data masukan/acuan yang dinamis sesuai dengan kebijakan yang diambil pihak jurusan.

I.5 Batasan Masalah

Adapun batasan dalam penyelesaian tesis ini adalah :

1. Metode analisis yang akan digunakan dalam menghasilkan model keputusan ini adalah Association Rule dengan menggunakan algoritma FP-Growth

2. Data uji yang akan digunakan pada sistem ini adalah data polling yang disebarkan dan data histori nilai mahasiswa berdasarkan matakuliah prasyarat terhadap matakuliah pilihan yang sudah ditentukan oleh pihak jurusan


(15)

3. Sistem pendukung keputusan hanya menghasilkan model atau pola keterkaitan matakuliah pilihan yang ditawarkan sedangkan penentuan matakuliah pilihannya diambil oleh ketua jurusan berdasarkan model yang dihasilkan.

I.6 Sistematika Penulisan

Dalam penelitian ini, pembahasan akan dibagi kedalam beberapa bab untuk memperoleh gambaran yang jelas dan terstruktur. Sistematika penulisannya adalah sebagai berikut:

a. Bab 1 Pendahuluan

Bab ini menguraikan latar belakang masalah, rumusan masalah, tujuan penelitian, manfaat penelitian, batasan masalah, dan metodologi penelitian.

b. Bab 2 Tinjauan Pustaka

Bab ini memberikan gambaran besar tentang sistem pendukung keputusan, data mining dan algoritma data mining serta teori-teori pendukung lainnya.

c. Bab 3 Metodelogi Penelitian

Bab ini berisi penjelasan mengenai tahapan dan skenario penelitian yang dilakukan. Selain itu dalam bab ini juga akan dijelaskan mengenai waktu dan tempat dimana penelitian dilakukan.

d. Bab 4 Analisis Model

Bab ini berisi analisis metode dan algoritma yang digunakan dalam penelitian beserta analisis model keputusan yang terbagi menjadi dua yaitu arsitektur model dan model perangkat lunak.

e. Bab 5 Pengujian Model

Bab ini berisi tahapan pengujian data dengan menggunakan teknik data mining untuk mendapatkan model keputusan sebagai pembuktiannya.


(16)

f. Bab 6 Kesimpulan dan Saran

Bab ini berisi kesimpulan dari hasil pembahasan model keputusan. Selain itu, bab ini berisi saran terhadap hasil model yang didapatkan dari penelitian yang dilakukan.


(17)

6

BAB II

TINJAUAN PUSTAKA

II.1 Profil Jurusan

Teknik Informatika yang merupakan salah satu disiplin ilmu pada bidang Teknologi Informasi, dikembangkan untuk memberikan pengetahuan tentang pemanfaatan Teknologi Informasi tersebut guna memenuhi kebutuhan-kebutuhan manusia yang semakin beragam dan kompleks. Jurusan Teknik Informatika Universitas Komputer Indonesia akan diarahkan untuk menghasilkan seorang analis berlandaskan pada pengetahuan informatika teoretik dengan memaksimalkan pemanfaatan teknologi on-line yang diharapkan mempunyai kemampuan untuk memecahkan berbagai masalah dalam dunia nyata. Lulusan Teknik Informatika diharapkan tidak hanya sekedar mampu menggunakan program-program aplikasi komputer (user) atau membuat program aplikasi komputer (programmer), tetapi menjembatani kebutuhan-kebutuhan user dan programmer yang kemudian diterjemahkan dalam sebuah dokumen spesifikasi formal.

II.1.1 Identitas Jurusan

Nama Perguruan Tinggi : Universitas Komputer Indonesia

Alamat : Perguruan Tinggi Jl. Dipati Ukur No.112-114-116 Bandung 40132.

Program Studi (PS) : Teknik Informatika

Fakultas : Teknik dan Ilmu Komputer (FTIK)

Alamat : Kampus V Lt 3 Jl. Dipati Ukur 114 Bandung 40132 Telp. (022) 253 3825 Fax. (022) 253 3754


(18)

Website : http://if.unikom.ac.id E-mail : if@unikom.ac.id

SK Pendirian Program Studi (PS): SK Mendiknas No. 126/D/O/2000 Tanggal 8 Agustus 2000

Peringkat Akreditasi : B (Baik) SK. Badan Akreditasi PT No. 019/BAN- PT/Ak-X/S1/XII/200 Tanggal 8 Desember 2006 Ketua Jurusan : Mira Kania Sabariah, S.T., M.T.

Sekretaris Jurusan : Tati Harihayati M, M.T.

II.1.2 Sejarah Jurusan

Pada tahun 1994, Ir. Eddy Suryanto Soegoto, M.Sc mendirikan Lembaga Pendidikan Komputer Indonesia Jerman ( LPKIG) untuk program pendidikan 1 tahun, menempati kampus Jl. Dipati Ukur No. 102. Di tahun ketiga, nama Lembaga Pendidikan Komputer Indonesia Jerman (LPKIG) diubah menjadi Indonesian Germany Institute (IGI). Pada tanggal 24 Desember 1998 dibentuk Yayasan Science dan Teknologi yang dilanjutkan dengan Pengajuan ke Kopertis IV Jabar untuk pendirian STIE IGI dan STMIK IGI. Pada bulan Agustus 1999 keluar SK Mendiknas No. 143/D/O/1999 atas STIMK IGI dengan 5 Program Studi yaitu Teknik Informatika S1, Manajemen Informatika D3 & D1, Teknik Komputer D3 & D1, Teknik Informatika D3 & D1, Komputerisasi Akuntansi D3 & D1.

Mengantisipasi pesatnya perkembangan Teknologi Informasi, IPTEK, Era Globaliasi dan Milenium ke-3 serta untuk memberikan yang terbaik bagi masa depan mahasiswa/i nya, Yayasan Science dan Teknologi kemudian mengajukan usulan ke DIKTI melalui Kopertis Wilayah IV Jabar untuk melakukan merger atas kedua Sekolah Tinggi diatas untuk menjadi


(19)

Pada hari selasa, tanggal 8 Agustus 2000 keluar SK Mendiknas No. 126/D/O/2000

atas nama Akreditasi Universitas Komputer Indonesia, disingkat UNIKOM. Akreditasi Mendiknas atas UNIKOM disertai menetapkan kembali status Terdaftar kepada Program Studi Teknik Informatika jenjang pendidikan program S1 (Sarjana).

Visi

Visi program studi adalah menjadi program studi Teknik Informatika unggulan yang dapat menjawab tantangan perkembangan Teknologi Informasi dan Komputer yang berkembang sangat pesat, mampu menyediakan tenaga ahli kompeten, memiliki integritas kepribadian tinggi, dan tanggap terhadap perkembangan ilmu pengetahuan, teknologi, serta tuntutan masyarakat, bangsa, dan negara.

Misi

Misi program studi adalah menyelenggarakan program pendidikan tinggi, pelatihan dan penelitian yang terbaik di bidang teknik informatika berbasis kepada teknologi informasi dan komputer melalui pengembangan kurikulum akademik yang dinamis, fasilitas pendidikan dengan kualitas terbaik, dan staff akademik, teknisi dan administrasi yang memiliki pendidikan berkualitas.

Tujuan

Tujuan program studi adalah menghasilkan Sarjana yang memiliki pengetahuan dan keahlian dalam bidang teknik informatika yang profesional dalam berwawasan teknologi informasi dan komputer, mampu mengikuti perkembangan ilmu dan teknologi, serta beriman dan bertakwa kepada Tuhan Yang Maha Kuasa.


(20)

Program pendidikan untuk mendapatkan gelar sarjana S1 Program Studi Teknik Informatika Fakultas Teknik UNIKOM terdiri dari 147 sks yang dapat ditempuh dalam waktu 8 semester. Diharapkan nantinya mahasiswa akan memperoleh ilmu dan keterampilan yang memadai untuk terjun ke lapangan sesuai dengan bidang keahliannya. Berikut adalah contoh kurikulum yang digunakan di jurusan Teknik Informatika UNIKOM :

Tabel II.1. Daftar Matakuliah Kurikulum 2007

KURIKULUM 2007

SMT KDMK MATA KULIAH SKS

I

IF31102 PANCASILA 2

IF31105 BAHASA INGGRIS 2

IF31201 KALKULUS I 3

IF31202 FISIKA DASAR I 3

IF31203L PRAKTIKUM FISIKA DASAR I 1 IF31204 ALGORITMA DAN PEMROGRAMAN I 2 IF31205 PENGANTAR ILMU KOMPUTER 2 IF31206L SOFTWARE TERAPAN I 2

IF31207L APLIKASI IT I 2

TOTAL 19

II

IF32101 AGAMA DAN ETIKA 2

IF32208 ALGORITMA DAN PEMROGRAMAN II 2

IF32209 KALKULUS II 3

IF32210 FISIKA DASAR II 2

IF32211L PRAKTIKUM FISIKA DASAR II 1 IF32212 STATISTIKA DAN PROBABILITAS 2 IF32213L SOFTWARE TERAPAN II 2

IF32214L APLIKASI IT II 2

IF32301 KONSEP TEKNOLOGI 2

TOTAL 18

III

IF33215 KALKULUS LANJUT 3

IF33216 LOGIKA MATEMATIKA 3 IF33217 ORGANISASI KOMPUTER 3 IF33218 ALJABAR LINEAR DAN MATRIKS 3

IF33219 SISTEM BERKAS 3

IF33302 PEMROGRAMAN I 2

IF33303L PRAKTIKUM PEMROGRAMAN I 2

TOTAL 19

IV

IF34220 MATEMATIKA DISKRIT 3

IF34221 METODA NUMERIK 3

IF34222 STRUKTUR DATA 3

IF34304 PEMROGRAMAN II 2

IF34305L PRAKTIKUM PEMROGRAMAN II 2


(21)

IF34332 BASIS DATA 3

TOTAL 19

V

IF35223 TEORI BAHASA DAN AUTOMATA 3 IF35309 PEMODELAN DAN SIMULASI 3 IF35311 JARINGAN KOMPUTER 2 IF35313L APLIKASI TEKNOLOGI ONLINE ( E-COMMERCE

) 2

IF35314 ARSITEKTUR KOMPUTER 3

IF35317 SISTEM INFORMASI 3

IF35333 SISTEM BASIS DATA 2 IF35334L PRAKTIKUM SISTEM BASIS DATA 2

TOTAL 20

VI

IF36103 KEWARGANEGARAAN 2

IF36312L PRAKTIKUM JARINGAN KOMPUTER 2 IF36315 RISET OPERASIONAL 3 IF36316 PEMROGRAMAN BERORIENTASI OBJEK 3 IF36318 REKAYASA PERANGKAT LUNAK 3

IF36319 SISTEM OPERASI 3

IF36340 ENTERPRENEURSHIP 3

TOTAL 19

VII

IF37320 SISTEM TERDISTRIBUSI 3 IF37321 KECERDASAN BUATAN 3 IF37401 METODOLOGI PENELITIAN 2 IF37402 INTERAKSI MANUSIA DENGAN KOMPUTER 3

IF37501K KERJA PRAKTEK 2

IF373XXP PILIHAN 1 (Diisi Lengkap) 3 IF373XXP PILIHAN 2 (Diisi Lengkap) 3

TOTAL 19

VIII

IF38104 BAHASA INDONESIA 2

IF38346L PRAKTIKUM PERANGKAT KERAS 3 IF383XXP PILIHAN 1 (Diisi Lengkap) 3 IF383XXP PILIHAN 2 (Diisi Lengkap) 3 IF38502S SEMINAR DAN SKRIPSI 6

TOTAL 17

II.2 Landasan Teori

Subbab ini berisi uraian tentang dasar-dasar teori yang melandasi dan sesuai dengan tujuan penelitian ini. Teori, konsep dasar dan metode yang berkaitan yang menjadi dasar tujuan akan dijelaskan dalam bab ini.

II.2.1 Sistem Pendukung Keputusan

Sistem Pendukung Keputusan(SPK) atau yang lebih dikenal dengan istilah Decision Support Systems (DSS) adalah : [Turban, 2005]


(22)

a. Sistem berbasis komputer yang interaktif, yang membantu pengambil keputusan memanfaatkan data dan model untuk menyelesaikan masalah-masalah yang tak terstruktur.

b. SPK mendayagunakan resource individu-individu secara intelek dengan kemampuan komputer untuk meningkatkan kualitas keputusan. Jadi ini merupakan sistem pendukung yang berbasis komputer untuk manajemen pengambilan keputusan yang berhubungan dengan masalah-masalah yang semi terstruktur.

c. Istilah SPK kadang digunakan untuk menggambarkan sembarang sistem yang terkomputerisasi

d. SPK digunakan untuk definisi yang lebih sempit dan digunakan istilah Management Support Systems(MSS) sebagai payung untuk menggambarkan berbagai tipe sistem pendukung.

Proses pengambilan keputusan terdiri dari 3 fase proses yaitu :

a. Intelligence, yaitu pencarian kondisi-kondisi yang dapat menghasilkan keputusan. Proses yang terjadi pada fase ini antara lain : menemukan masalah, klasifikasi masalah, penguraian masalah dan kepemilikan masalah.

b. Design, menemukan, mengembangkan dan menganalisis materi-materi yang mungkin untuk dikerjakan. Termasuk juga disini pemahaman masalah dan pengecekan solusi yang layak. Juga model dari masalahnya dirancang, dites dan divalidasi. Tugas-tugas yang ada pada tahap ini merupakan kombinasi dari seni dan pengetahuan, yaitu:

1. Komponen-komponen model 2. Struktur model

3. Seleksi prinsip-prinsip pemilihan (kriteria evaluasi) 4. Pengembangan (penyedian) alternatif


(23)

6. Pengukuran hasil 7. Skenario

c. Choice, yaitu pemilihan dari materi-materi yang tersedia, mana yang akan dikerjakan Proses-proses yang terjadi pada kerangka kerja SPK dibedakan menjadi 3 jenis yaitu : a. Terstruktur, mengacu pada permasalahan rutin dan berulang untuk solusi standar yang

ada.

b. Tak terstruktur, adalah “fuzzy’, permasalahan kompleks dimana tak ada solusi serta

merta. Masalah yang tak terstruktur adalah tak adanya 3 fase proses yang terstruktur. c. Semi terstruktur, terdapat beberapa keputusan terstruktur, tetapi tak semuanya dari

fase-fase yang ada.

Adapun karakteristik dan kemampuan yang dimiliki oleh SPK dapat dilihat pada gambar dibawah ini :


(24)

1. SPK menyediakan dukungan bagi pengambil keputusan utamanya pada situasi semi terstruktur dan tak terstruktur dengan memadukan pertimbangan manusia dan informasi yang terkomputerisasi.

2. Dukungan disediakan untuk perbagai level manajerial yang berbeda, mulai dari pimpinan puncak sampai manajer lapangan.

3. Dukungan disediakan bagi individu dan juga bagi group Berbagai masalah organisasi yang melibatkan pengambilan keputusan dari orang dalam group.

4. SPK menyediakan dukungan ke berbagai keputusan yang berurutan atau saling berkaitan. 5. SPK mendukung perbagai fase proses pengambilan keputusan : intelligence, design, dan

choice.

6. SPK mendukung berbagai proses pengambilan keputusan dan style yang berbeda-beda; ada kesesuaian diantara SPK dan atribut pengambil keputusan individu.

7. SPK selalu bisa beradaptasi sepanjang masa. Pengambil keputusan harus reaktif, mampu mengatasi perubahan kondisi secepatnya dan beradaptasi untuk membuat SPK selalu bisa menangani perubahan ini. SPK adalah fleksibel, sehingga user dapat menambahkan, menghapus, mengkombinasikan, mengubah atau mengatur kembali elemen-elemen dasar (menyediakan respon cepat pada situasi yang tak diharapkan). Kemampuan ini memberikan analisis yang tepat waktu dan cepat setiap saat.

8. SPK mudah digunakan. User harus merasa nyaman dengan sistem ini. User friendly, fleksibelitas, dukungan grafis terbaik dan antarmuka bahasa yang sesuai dengan bahasa manusia dapat meningkatkan efektivitas SPK. Kemudahan penggunaan ini diimplikasikan pada mode yang interaktif.

9. SPK mencoba untuk meningkatkan efektivitas dari pengambilan keputusan (akurasi, jangka waktu, kualitas), lebih daripada efisiensi yang bisa diperoleh (biaya membuat keputusan, termasuk biaya penggunaan komputer).


(25)

10.Pengambil keputusan memiliki kontrol menyeluruh terhadap semua langkah proses pengambilan keputusan dalam menyelesaikan masalah. SPK secara khusus ditujukan untuk mendukung dan menggantikan pengambil keputusan. Pengambil keputusan dapat menindaklanjuti rekomendasi komputer sembarang waktu dalam proses dengan tambahan pendapat pribadi atau pun tidak.

11.SPK mengarah pada pembelajaran, yaitu mengarah pada kebutuhan baru dan penyempurnaan sistem, yang mengarah pada pembelajaran tambahan dan begitu selanjutnya dalam proses pengembangan dan peningkatan SPK secara berkelanjutan. 12.User/pengguna harus mampu menyusun sendiri sistem yang sederhana. Sistem yang lebih

besar dapat dibangun dalam organisasi user tadi dengan melibatkan sedikit saja bantuan dari spesialis dibidang Information Systems (IS).

13.SPK biasanya mendayagunakan berbagai model (standar atau sesuai keinginan user) dalam menganalisis berbagai keputusan. Kemampuan pemodelan ini menjadikan percobaan yang dilakukan dapat dilakukan pada berbagai konfigurasi yang berbeda. 14.SPK dalam tingkat lanjut dilengkapi dengan komponen knowledge yang bisa memberikan

solusi yang efisien dan efektif dari berbagai masalah yang pelik.


(26)

Gambar II.2 Proses pengambilan keputusan [Turban, 2005]

Komponen-komponen pembangun SPK antara lain : [Turban, 2005]

1. Data Management

Termasuk database, yang mengandung data yang relevan untuk berbagai situasi dan diatur oleh software yang disebut Database Management Systems (DBMS)

2. Model Management

Melibatkan model finansil, statistical, management science atau berbagai model kuantitatif lainnya, sehingga dapat memberikan ke sistem suatu kemampuan anlitis dan manajemen software yang diperlukan.

3. Communication

User dapat berkomunikasi dan memberikan perintah pada SPK melalui subsistem ini. Ini berarti menyediakan antarmuka.

4. Knowleadge Management

Subsistem optional ini dapat mendukung subsistem lain atau bertindak sebagai komponen yang berdiri sendiri.


(27)

Dibawah ini adalah model konseptual, yaitu sebagai berikut :

Gambar II.3 Model konseptual [Turban, 2005]

Kemampuan yang dimiliki DBMS dalam SPK adalah sebagai berikut : [Turban, 2005] a. Mendapatkan/mengekstrak data agar bisa masuk ke dalam database SPK.

b. Secara cepat meng-update (menambah, menghapus, mengedit, mengubah) record data dan file.

c. Menghubungkan data dari berbagai source.

d. Secara cepat menampilkan data dari database dalam queiries dan report.

e. Menyediakan keamanan data menyeluruh (proteksi dan akses yang tidak berhak, kemampuan recover dan lain-lain).

f. Menangani data personal dan tidak resmi sehingga user dapat mencoba dengan berbagai solusi alternatif berdasarkan pertimbangan mereka sendiri.

g. Memberikan tampilan data yang lebih kompleks dan proses manipulasinya berdasarkan queries yang diberikan.


(28)

Berikut ini disajikan diagram hubungan dari bidang-bidang KDE :

Gambar II.4 Diagram hubungan bidang-bidang KDE [Turban, 2005]

II.2.2 Data Mining

II.2.2.1 Pengertian Data Mining

Data Mining merupakan salah satu cabang ilmu komputer yang relatif baru yang memiliki keterkaitan dengan machine learning, kecerdasan buatan (artificial intelligence), statistik, dan database. Data Mining mengacu kepada ekstraksi atau penggalian pengetahuan dari suatu data dalam jumlah besar. Ada banyak pengertian dari data mining itu sendiri, diantaranya seperti penggalian pengetahuan dari database, ekstraksi pengetahuan (knowledge extraction), analisis data atau pola (pattern analysis), penggalian data dan lain sebagainya.


(29)

Definisi Data Mining menurut Budi Santosa dalam bukunya yang berjudul Data Mining (Teknik Pemanfaatan Data untuk Keperluan Bisnis) adalah sebagai berikut:

“Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar.”[Santosa, 2007] Sedangkan menurut Pang-Ning Tan dalam bukunya yang berjudul Introduction to Data Mining, definisi Data Mining adalah sebagai berikut:

“Process of automatically discovering useful information in large data repositories.”[Tan, 2006]

II.2.2.2 Proses Data Mining

Dalam aplikasinya, data mining sebenarnya merupakan bagian dari proses Knowledge Discovery in Databases atau KDD, bukan sebagai teknologi yang utuh dan berdiri sendiri. Data mining merupakan suatu bagian langkah yang penting dalam proses KDD terutama berkaitan dengan ekstraksi dan penghitungan pola-pola dari data yang ditelaah.

Proses – proses dari KKD sendiri, menurut Iko Pramudiono dalam artikelnya berjudul Pengantar Data Mining, terdiri dari:

1. Pembersihan data (Data cleaning)

Menghilangkan noise dan data inkonsisten.

2. Integrasi data (Data integration)

Menggabungkan data dari berbagai sumber data yang berbeda.

3. Pemilihan data (Data selection)

Mengambil data yang relevan dengan tugas analisis dari database.

4. Transformasi data (Data transformation)

Mentransformasi atau menggabungkan data ke dalam bentuk yang sesuai untuk penggalian lewat operasi summary atau aggregation.


(30)

5. Penambangan data (Data mining)

Proses esensial untuk mengekstrak pola dari data dengan metode cerdas.

6. Evaluasi pola (Pattern evaluation)

Mengidentifikasikan pola yang menarik dan merepresentasikan pengetahuan berdasarkan

interestingness measures.

7. Presentasi pengetahuan (Knowledge presentation)

Penyajian pengetahuan yang digali kepada pengguna dengan menggunakan visualisasi dan teknik representasi pengetahuan.

Tahap-tahap tersebut bersifat interaktifdimana pengguna atau user terlibat langsung atau dengan perantaraan basis pengetahuan (knowledge base) yang terintegrasi didalam sistem. Pola-pola yang menarik disajikan kepada pengguna dan disimpan sebagai pengetahuan baru di dalam basis pengetahuan. Dari tahapan tersebut dapat diketahui bahwa data mining hanya merupakan satu bagian langkah dari keseluruhan proses KDD.

Gambar II.5 Data Mining sebagai bagian dari proses KDD [HAN06]


(31)

Umumnya sistem data mining terdiri dari komponen-komponen berikut: 1. Data Warehouse

Terdiri dari satu atau beberapa database, data warehouse, atau data dalam bentuk lain. Pembersihan data dan integrasi data dilakukan terhadap data tersebut.

2. Data Warehouse Server

Bertanggung jawab terhadap pencarian data yang relevan sesuai dengan yang diinginkan pengguna atau user.

3. Basis Pengetahuan(Knowledge base)

Merupakan basis pengetahuan yang digunakan sebagai panduan dalam pencarian pola. 4. Data mining engine

Merupakan bagian penting dari sistem dan idealnya terdiri dari kumpulan modul-modul fungsi yang digunakan dalam proses karakterisasi (characterization), klasifikasi (classification) dan analisis kluster (cluster analysis).

5. Evaluasi Pola (Pattern evaluation)

Komponen ini pada umumnya berinteraksi dengan modul-modul data mining. 6. Antarmuka (Graphical User Interface)

Merupakan modul komunikasi antara pengguna atau user dengan sistem yang memungkinkan pengguna berinteraksi terhadap sistem untuk menentukan proses data mining itu sendiri.


(32)

Gambar II.6 Sistem Data Mining [HAN06]

II.2.2.3 Data Pada Data Mining

Pada prinsipnya data mining dapat diaplikasikan pada berbagai jenis data, yaitu pada

database relational, data warehouse, database transaksional, advance database system, flat-files dan world wide web. Tetapi teknik mining pada setiap jenis data berbeda. [HAN06]

1. Database Relational

Suatu database relasional terdiri dari kumpulan tabel-tabel, dimana masing-masing tabel mempunyai nama yang unik. Setiap tabel terdiri dari kumpulan atribut (kolom atau field) dan biasanya menyimpan banyak record. Setiap record pada database relational

mewakili suatu objek yang diidentifikasi oleh sebuah kunci yang unik.

Database relasional dapat diakses melalui query yang ditulis dalam bahasa query seperti SQL, atau melalui antarmuka grafis yang tersedia. Database relasional merupakan database yang sangat populer dan kaya akan informasi yang tersimpan didalamnya oleh karena itu data mining banyak diterapkan pada databaserelational.


(33)

2. Data Warehouse

Suatu data warehouse mengkonsolidasikan data dari berbagai sumber data dengan aturan penamaan, ukuran atribut fisik, serta semantik yang konsisten. Data warehouse dibangun dari suatu proses pembersihan data, transformasi data dan integrasi data, pengambilan data dan penyegaran data yang dilakukan secara periodik.

Data warehouse biasanya dimodelkan dengan suatu struktur database multidimensional yang disebut data cube. Dimensi pada data-cube dapat bertingkat untuk memudahkan dalam mendapatkan rangkuman informasi dari tingkatan dimensi yang lebih luas atau umum sampai kepada tingkatan informasi yang lebih sempit atau khusus dengan operasi

roll-up atau sebaliknya dengan operasi drill-down. Akan tetapi untuk mendapatkan informasi yang tidak diketahui secara eksplisit diperlukan satu tahap lagi yaitu aplikasi teknik data mining.

3. Database Transactional

Suatu database transactional terdiri dari sebuah file dimana tiap-tiap record mewakili suatu transaksi. Suatu transaksi umumnya mengandung suatu nomor identitas transaksi yang bersifat unik, dan suatu daftar item-item yang membentuk transaksi tersebut. Suatu

database transactional dimungkinkan untuk mempunyai tabel-tabel tambahan yang saling terkait yang berisikan informasi-informasi yang saling berhubungan.

4. Advance Database System

Aplikasi database terbaru mampu untuk menangani data spesial (data peta), data desain (desain dari sebuah gedung), hypertext dan data multimedia (termasuk didalamnya data teks, gambar, video, dan audio) dan data pada world wide web. Aplikasi-aplikasi tersebut membutuhkan struktur data yang efisien dan metode-metode yang skalabilitas untuk menangani struktur objek yang komplek.


(34)

II.2.2.4 Teknik Data Mining dengan Association Rule Mining

Dari definisi data mining yang luas, terdapat banyak jenis teknik analisa yang dapat digolongkan dalam data mining. Teknik data mining yang akan digunakan dalam penelitian ini adalah Association Rule Mining.

Association rule mining adalah teknik mining untuk menemukan aturan asosiatif antara suatu kombinasi item. Pada mulanya digunakan untuk Market Basket Analysis dalam menemukan barang-barang yang dibeli oleh pelanggan secara berhubungan. Contoh dari aturan asosiatif dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut, pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu. Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua parameter,

support yaitu persentase kombinasi item tersebut dalam database dan confidence yaitu kuatnya hubungan antar item dalam aturan asosiatif.

Adapun model data yang digunakan dalam Association rule mining adalah sebagai berikut :

a. I = {i1, i2, …, im}: kumpulan item.

b. Sebuah transaksi t : t merupakan bagian dari item, t  I. c. Transaksi Database T: kumpulan transaksi T = {t1, t2, …, tn}.

Secara umum, Association Rule Mining dapat dibagi menjadi dua tahap: 1. Pencarian Frequent Itemset

Pada proses ini dilakukan pencarian Frequent Itemset. Frequent Itemset yang diperoleh harus memenuhi minimum support (Itemset, Support, dan Confidence).


(35)

Frequent Itemset yang telah dihasilkan dari proses sebelumnya digunakan untuk membentuk Association Rule. Association Rule yang dihasilkan akan memenuhi minimum support dan minimum confidence.

Sedangkan perhitungan yang ada dalam Association rule mining yaitu : sebuah transaksi t yang berisi X, sekumpulan item (itemset) yang berada dalam I, jika Xt. Association rule adalah sebuah implikasi dari bentuk:

XY, dimana X, YI, dan X Y = 

 Itemset adalah sekumpulan item. Contohnya X = {milk, bread, cereal} ini sebuah itemset.

k-itemset adalah sebuah itemset dengan k item. Contohnya, {milk, bread, cereal} itemset dengan 3 item.

Menurut Larose (2005) support dari suatu association rule adalah proporsi dari transaksi dalam database yang mengandung X dan Y, yaitu :

Sedangkan Confidence dari association rule adalah ukuran ketepatan suatu rule, yaitu persentase transaksi dalam database yang mengandung X dan juga mengandung Y.

Pada tahap Frequent Itemset Candidate Generation terdapat beberapa kendala yang harus dihadapi untuk memperoleh Frequent Itemset. Seperti banyaknya jumlah kandidat yang memenuhi minimum support, dan proses perhitungan minimum support dari

Frequent Itemset yang harus melakukan scan database berulang-ulang. Pendekatan Apriori sangat membantu dalam mengurangi jumlah kandidat Frequent Itemset. Algoritma Apriori dikenal dengan paradigma generate and test, yaitu pembuatan kandidat kombinasi item


(36)

yang mungkin berdasar aturan tertentu lalu diuji apakah kombinasi item tersebut memenuhi syarat support minimum. Kombinasi item yang memenuhi syarat tersebut. disebut frequent itemset, yang nantinya dipakai untuk membuat aturan-aturan yang memenuhi syarat

confidence minimum. Ciri dari algoritma Apriori adalah jika suatu itemset termasuk dalam

large itemset, maka semua himpunan bagian (subset) dari itemset tersebut juga termasuk

large itemset [Agrawal, 1994]. Tetapi dengan menggunakan FP-growth, kita dapat melakukan Frequent Itemset Mining tanpa melakukan candidate generation.

II.2.2.5 Pendekatan Algoritma FP-Growth

Dalam mendapatkan frequent itemset, algoritma FP-Growth melakukannya tanpa

candidate itemset generation. Ada dua langkah yang dilakukan dalam pendekatan algoritma

FP-Growth yaitu: [TAN, 2006]

Langkah 1: membangkitkan struktur data tree yang dikenal dengan FP-tree dimana scan

database hanya dilakukan dua kali saja.

Langkah 2: mengekstrak frequent itemsets secara langsung dari FP-tree

Adapun struktur data yang ada pada FP-tree adalah sebagai berikut :


(37)

Penjelasan secara umum dari pembuatan struktur data pada FP-tree diatas adalah sebagai berikut :

1. Node sesuai dengan item dari data transaksi dan memiliki counter

2. FP-Growth membaca transaksi ke-1 dan memetakan kedalam tree

3. Dalam kasus ini, counter akan selalu bertambah

4. Pointer dibuat antara node yang berisi item sama (menyebabkan single linked lists) 5. Semakin banyak jalur yang dilalui maka kompresinya akan semakin tinggi

6. Frequent itemset diekstrak dari FP-Tree

Pada pendekatan FP-Growth saat mendapatkan frequent itemset akan melalui dua tahapan yaitu :

1. Tahap 1: FP-Tree Construction

Pada langkah ini akan dilakukan pemeriksaan database hanya dua kali saja yaitu: Pertama :

a. Scan data dan temukan support untuk setiap item.

b. Item-item yang tidak frequent (infrequent) sudah tidak ada dalam FP-tree

c. Urutkan frequent items dalam decreasing order berdasarkan support yang dibuat Kedua : membangkitkan FP-tree

a. Pembacaan transaksi ke-1 : {a, b}

Buat 2 node a dan b, dan jalur menjadi null  a  b. Set count untuk a dan b menjadi 1.

b. Pembacaan transaksi ke-2 : {b, c, d}

Buat 3 node b, c and d, dan jalur menjadi null  b  c  d. Set count menjadi 1. Catatan : seluruh transaksi 1 dan 2 melibatkan item b sehingga tambahkan link antar item b


(38)

Akan menjadi common prefix item dengan transaksi ke-1 sehingga jalur untuk traksaksi 1 dan 3 akan menjadi overlap dan count untuk setiap node akan ditambahkan dengan 1. Tambahkan link antara c dan d

d. Lakukan hingga seluruh transaksi dipetakan dalam setiap jalur di FP-tree.

Gambar II.8 FP-tree yang telah dibangkitkan [TAN, 2006]

2. Tahap 2: Frequent Itemset Generation

Pada tahapan ini ada beberapa hal yang dilakukan untuk menghasilkan frequent itemset

yaitu:

a. FP-Growth mengekstrak frequent itemsets dari FP-tree. b. Algoritma Bottom-up dari setiap leaves menuju root

c. Pertama, ekstrak prefix path sub-trees dalam setiap item(set)

d. Setiap prefix path sub-tree diproses secara rekursif untuk mengekstrak frequent itemset. Kemudian akan dilakukan penggabungan untuk mendapatkan frequent itemset.


(39)

Gambar II.9 Prefix path sub-trees dalam setiap item[TAN, 2006]

Algoritma FP-growth menemukan frequent itemset yang berakhiran suffix tertentu dengan menggunakan metode divide and conquer untuk memecah problem menjadi subproblem yang lebih kecil. Setelah mengetahui bahwa item e adalah item yang frequent, maka subproblem selanjutnya adalah menemukan frequent itemset dengan akhiran de, ce, be, dan ae. Dengan menggabungkan seluruh solusi dari subproblem yang ada, maka himpunan semua frequent itemset yang berakhiran item e akan didapatkan. Setelah memeriksa frequent itemset untuk beberapa akhiran (suffix), maka didapat hasil yang dirangkum dalam tabel berikut:

Tabel II.2. Hasil Frequent Itemsets

Suffix Frequent Itemset

E {e},{d,e},{a,d,e},{c,e},{a,e} D {d},{c,d},{b,c,d},{a,c,d},{b,d},{a,b,d},{a,d} C {c},{b,c},{a,b,c},{a,c}

B {b},{a,b}

A {a}

Dengan metode divide and conquer ini yaitu suatu metode yang digunakan untuk memecah problem menjadi subproblem yang lebih kecil, maka pada setiap langkah rekursif, algoritma FP-growth akan membangun sebuah conditional FP-tree baru yang telah


(40)

diperbaharui nilai support count, dan membuang lintasan yang mengandung item-item yang tidak frequent lagi.

II.2.2.6 Konsep Dasar Database a. Pengertian Database

Basis Data (database) terdiri atas dua kata, yaitu Basis dan Data. Basis dapat diartikan sebagai markas atau gudang, tempat bersarang atau berkumpul. Sedangkan Data adalah representasi fakta dunia nyata yang mewakili objek seperti manusia, barang, hewan, konsep, keadaan, dan sebagainya, yang direkam dalam bentuk angka, huruf, simbol, teks, gambar atau kombinasinya.

Database sendiri dapat didefinisikan dalam sejumlah sudut pandang sebagai berikut: 1. Himpunan kelompok data (arsip) yang saling berhubungan dan diorganisasi sedemikian

rupa agar kelak dapat dimanfaatkan kembali dengan cepat dan mudah.

2. Kumpulan data yang saling berhubungan yang disimpan secara bersamasama sedemikian rupa dan tanpa pengulangan yang tidak perlu untuk memenuhi berbagai kebutuhan. 3. Kumpulan file atau tabel atau arsip yang saling berhubungan yang disimpan dalam media

penyimpanan elektronis.

4. Basis data dan lemari arsip sesungguhnya memiliki prinsip kerja dan tujuan yang sama. Prinsip utamanya adalah pengaturan data atau arsip dan tujuan utamanya adalah kemudahan dan kecepatan dalam pengambilan kembali data atau arsip tersebut.

b. Model-model Database

Database dipakai untuk aplikasi sederhana sampai aplikasi rumit yang melibatkan beberapa user. Ada tiga model database yang dibagi berdasarkan kompleksitasnya :

1. Database yang berdiri sendiri (Stand-alone)

Merupakan database yang sangat sederhana karena disimpan di sistem file lokal dan mesin database mengakses pada mesin yang sama. Desainer database tidak perlu


(41)

khawatir akan terjadinya konkurensi karena database hanya dipakai oleh satu aplikasi.

2. Database terbagi (File Share)

Database ini hampir sama dengan databasestand-alone tetapi dapat diakses oleh banyak user. Misalnya sebuah database karyawan dipakai oleh beberapa bagian. Jika satu bagian mengubah data, maka bagian lain juga dapat merasakan perubahan data tersebut.

Database ini akan mengalami masalah jika aplikasi memerlukan banyak perhitungan dan pada saat pengaksesan secara bersamaan ke dalam database.

3. Database Client/Server

Merupakan database level tertinggi. Database ini memerlukan sebuah mesin khusus atau


(42)

31

METODOLOGI PENELITIAN

III.1 Tahapan Penelitian

Sebagai langkah awal, penelitian ini dilakukan guna menganalisis hasil pengolahan data menggunakan algoritma dalam Association Rules Mining khususnya algoritma FP-Growth guna menentukan keterhubungan antara atribut yang satu dengan yang lain dalam suatu basis data. Dalam hal ini langkah-langkah proses penelitian akan diuraikan dalam bentuk diagram alir.

Definisi Kebutuhan Sistem

Business Understanding

Pemodelan Pengumpulan Data

Data Understanding

Pendefinisian Atribut Data

Gambar III.1 Diagram Alir Metodelogi Penelitian

Adapun penjelasan dari metodologi yang digunakan dalam penelitian ini adalah:

a. Definisi Kebutuhan Sistem

Tahap ini merupakan pendefinisian kebutuhan sistem berdasarkan masalah atau kendala yang dihadapi pada tempat studi kasus dengan cara melakukan wawancara dan observasi langsung.


(43)

32

Pada tahap ini juga pembelajaran tentang topik-topik yang relevan terhadap penelitian yang akan dilakukan. Selain itu studi juga dilakukan untuk mempelajari mengenai data mining dan metode data mining yang akan digunakan.

b. Business understanding

Tahap ini berisi langkah-langkah yang bertujuan untuk memahami lingkup permasalahan pada institusi/jurusan tempat studi kasus serta memahami kondisi yang ada pada institusi tersebut. Tahapan ini akan berusaha untuk mengetahui secara rinci proses bisnis yang terjadi pada sistem berjalan khususnya berkaitan dengan data polling yang selama ini dijadikan acuan pada saat penentuan matakuliah pilihan di jurusan. Pada penelitian ini selain data polling juga akan digunakan data nilai sebagai acuan rekomendasi. Sehingga aturan dan kebijakan untuk histori nilai harus dipahami dari institusi/jurusan tempat studi kasus.

c. Pengumpulan data

Pengumpulan data meliputi tahap pengumpulan training data dan testing data pada institusi/jurusan tempat studi kasus yang akan digunakan untuk membentuk model keputusan. Data yang akan dikumpulkan berupa data polling yang disebarkan dan histori nilai dari nilai prasyarat matakuliah pilihan yang akan ditawarkan.

d. Data Understanding

Tahap persiapan data ini terbagi menjadi tiga tahap utama, yaitu [3]:

1) Describe data

Tahap ini merupakan tahap pendeskripsian data yang sudah didapat dari tempat studi kasus.Setiap atribut data yang sudah didapat didefinisikan supaya bisa dimengerti dan dipelajari dengan baik.


(44)

2) Explore data

Tahap ini berisi langkah-langkah untuk melihat keterhubungan atribut-atribut pada data yang dikumpulkan serta melihat atribut-atribut yang mungkin digunakan dalam menjawab pertanyaan data mining.

3) Verify data quality

Tahap ini memverifikasi hasil deskripsi dan eksplorasi data yang didapat. Dari tahap ini pula didapat gambaran kualitas data yang akan digunakan dalam pemodelan.

e. Pendefinisian atribut data

Tahap ini dilakukan untuk menyiapkan data untuk tahap pemodelan. Tahap ini terbagi menjadi lima tahap, yaitu [3]:

1) Select data

Tahap ini memilih data serta atribut yang akan digunakan dalam proses data mining.

2) Clean data

Tahap ini dilakukan untuk meningkatkan kualitas data dengan cara menangani nilai yang kosong serta memperhatikan outliers yang ada pada data.

3) Construct data

Tahap ini merupakan tahap dimana atribut-atribut turunan dibentuk sebagai atribut tambahan dalam penemuan pola.

4) Integrate data

Tahap ini menggabungkan data dari beberapa tabel sehingga menghasilkan nilai atau

record baru.

5) Format data

Tahap ini mengubah kumpulan data yang sudah diproses menjadi suatu format file yang dimengerti oleh alat bantu pemodelan yang digunakan.


(45)

f. Pemodelan

Tahap pemodelan pada tesis ini digunakan untuk mencari model keputusan yang tepat untuk domain permasalahan tesis ini. Pada tahap ini akan dihasilkan model keputusan dengan menggunakan Association Rule Mining dengan algoritma FP-Growth dari data yang telah dihasilkan sebelumnya. Model keputusan yang dihasilkan merupakan hasil irisan dari rule yang didapatkan dari polling (kemauan) dan histori nilai (kemampuan).

III.2 Skenario Penelitian

Kegiatan yang dilakukan dalam penelitian ini diantaranya adalah pembentukan data transaksi yang berasal dari data hasil polling dan data nilai untuk memperoleh aturan-aturan yang dibutuhkan. Proses dimulai dengan mendefinisikan kebutuhan system pada tempat studi kasus dengan cara wawancara dan observasi langsung untuk mengetahui masalah atau kendala yang terjadi. Selan itu pula kegiatan ini dibarengi dengan studi pustaka untuk mengetahui cara atau metode yang tepat yang dapat digunakan sebagai penyelesaian masalah. Kegiatan berikutnya yaitu pemahaman proses bisnis dari system yang ada yaitu dengan mengetahui kebijakan dan aturan dalam pengisian polling untuk penentuan matakuliah pilihan. Penentuan matakuliah pilihan ini akan diuji untuk mencari irisan dengan data nilai bagi mahasiswa yang telah mengisi polling untuk menentukan matakuliah pilihan yang direkomendasikan bagi pihak jurusan. Aturan data nilai yang digunakan berdasarkan kebijakan dan aturan yang diberikan pihak jurusan.

Metodologi data mining didasarkan pada dua tahapan yang dilakukan untuk menemukan Association Rules pada dataset polling dan nilai dengan metode FP-Tree yang terdapat pada algoritma FP-Growth. Kedua tahapan tersebut adalah :


(46)

2. Association rule mining dengan menggunakan algoritma FP-Growth

Pada tahap pertama, seleksi atribut dalam dataset untuk mendapatkan data record dengan atribut yang relevan dan konsisten terhadap hasil output /keluaran yang diinginkan serta dilakukan pemrosesan awal terhadap data transaksi untuk menghapus data atau record yang tidak konsisten, redundan dan missing value sehingga memperoleh dataset polling dan nilai yang siap untuk diolah ke tahap selannjutnya. Pada tahap kedua, mengekstrak data atau mentransformasikan dataset yang akan digunakan untuk menemukan pola/informasi sehingga dataset tersebut siap untuk di-mining. Dari masing-masing dataset yaitu polling dan nilai, rule

yang dihasilkan akan dilakukan irisan untuk mendapatkan model keputusan akhir yang dapat merekomendasikan matakuliah pilihan yang akan ditawarkan pihak jurusan. Pengolahan data ini menggunakan metode Association Rule dengan algoritma FP-Growth.

III.3 Waktu dan Tempat Penelitian

Waktu pelaksanaan penelitian dilakukan mulai bulan Maret 2012 hingga bulan Juni 2012. Adapun tempat penelitiannya dilakukan di jurusan Teknik Informatika UNIKOM.


(47)

36

BAB IV

ANALISIS MODEL

IV.1 Analisis Metode dan Algoritma

Dalam subbab ini akan dibahas mengenai perbandingan beberapa metode dan algoritma data mining yang digunakan dalam mendapatkan model keputusan dalam penentuan matakuliah pilihan jurusan Teknik Informatika UNIKOM.

IV.1.1 Analisis Metode

Data mining adalah proses logis yang digunakan untuk mencari pengetahuan lebih dari sejumlah besar data dengan mengunakan teknik dan algoritma tertentu. Tujuan dari data mining itu sendiri adalah menemukan pola yang sebelumnya tidak diketahui sehingga dapat digunakan dalam proses pendukung pengambilan keputusan. Pola yang ditemukan biasanya akan digunakan untuk memecahkan masalah atau membantu pihak eksekutif dalam mengambil keputusan. Untuk bisa menemukan pengetahuan yang baik dari data yang besar, ada beberapa metode dan algoritma yang dapat dipergunakan. Adapun evaluasi terhadap metode-metode data mining supaya peneliti dapat memilih dan menggunakan teknik yang tepat dalam melakukan penelitian ini. Hasil evaluasinya dapat dilihat pada tabel IV.1.

Tabel IV.1 Evaluasi metode-metode dalam data mining

Metode Identifikasi

Statistik Statistik adalah cabang dari ilmu matematika yang berkonsentrasi terhadap koleksi dan deskripsi data.

Clustering Berkonsentrasi terhadap pengelompokan objek-objek yang memiliki

kemiripan dan membandingkannya antar cluster.

Decision Tree Metode prediksi yang mengklasifikasikan data menggunakan bentuk pohon.


(48)

Metode Environment

Statistik Teknik ini digunakan dalam tempat yang sama dan untuk permasalahan

yang sama (prediksi, dan penemuan klasifikasi)

Clustering Digunakan oleh end user untuk menandai customer dalam database

mereka

Decision Tree Digunakan untuk pengklasifikasian dan estimasi.

Association Rule Memberikan gambaran relationship dari suatu domain.

Metode Keuntungan

Statistik Membantu menjawab beberapa pertanyaan penting tentang data yang

akan diolah sebelum memulai untuk proses data mining.

Clustering Bisa memberikan gambaran jelas tentang apa yang terjadi di dalam database.

Decision Tree Bisa menangani seluruh jenis variabel termasuk missing value.

Association Rule Dapat diformulasikan untuk mencari pola yang sekuensial.

Metode Kerugian

Statistik Banyak dari data pada masa sekarang yang tidak bisa dijawab dan diolah

menggunakan statistic

Clustering Terkadang proses split dan merge antar cluster mempunyai kesulitan tersendiri.

Decision Tree Tidak terlalu cocok untuk sejumlah besar tes diagnostik.

Association Rule Kurang bisa menunjukkan alasan dari pola yang dihasilkan

Metode Konsekuensi

Statistik Bisa menghasilkan prediksi yang naive dan bersifat trivial.

Clustering Hanya memisahkan data secara kemiripan statistical

Decision Tree Handal dari segi kecepatan pengklasifikasian

Association Rule Data yang digunakan biasanya berupa data transaksi

Metode Implementasi

Statistik Histogram dan linear regression

Clustering Hierarchical Clustering dan partitional Clustering

Decision Tree CART dan CHAID


(49)

Dalam penelitian ini, metode yang akan digunakan adalah Association Rule

dikarenakan dalam penelitian ini diharapkan dapat menghasilkan model keputusan berdasarkan pola keterkaitan antara matakuliah pilihan yang akan ditawarkan dalam satu semester berdasarkan data hasil polling (kemauan) dan data histori nilai (kemampuan).

IV.1.2 Analisis Algoritma

Dalam tahapan metode Association Rule terbagi menjadi dua tahap yaitu : 1. Pencarian Frequent Itemset

Pencarian Frequent Itemset yang diperoleh harus memenuhi minimum support (Itemset, Support, dan Confidence).

2. Rule Generation

Frequent Itemset yang telah dihasilkan dari proses sebelumnya digunakan untuk membentuk Association Rule. Association Rule yang dihasilkan harus memenuhi minimum support dan minimum confidence.

Pada tahap Frequent Itemset Candidate Generation terdapat beberapa kendala yang harus dihadapi untuk memperoleh Frequent Itemset. Seperti banyaknya jumlah kandidat yang memenuhi minimum support, dan proses perhitungan minimum support dari Frequent Itemset yang harus melakukan scan database berulang-ulang. Pendekatan algoritma apriori sangat membantu dalam mengurangi jumlah kandidat Frequent Itemset. Algoritma apriori dikenal dengan paradigma generate and test, yaitu pembuatan kandidat kombinasi item yang mungkin berdasar aturan tertentu lalu diuji apakah kombinasi item tersebut memenuhi syarat

support minimum. Kombinasi item yang memenuhi syarat tersebut disebut frequent itemset, yang nantinya dipakai untuk membuat aturan-aturan yang memenuhi syarat confidence minimum. Algoritma apriori juga memiliki kekurangan yaitu, untuk melakukan pencarian frequent itemset, Algoritma apriori harus melakukan scanning database berulang kali untuk setiap kombinasi item. Hal tersebut menyebabkan banyaknya waktu yang dibutuhkan untuk


(50)

melakukan scanning database. Selain itu, dibutuhkan generate candidate yang besar untuk mendapatkan kombinasi item dari database.

Algoritma FP-Growth merupakan pengembangan dari algoritma Apriori. Sehingga kekurangan dari algoritma Apriori diperbaiki oleh algoritma FP-Growth. Frequent Pattern Growth (FP-Growth) adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data. Pada algoritma Apriori diperlukan generate candidate untuk mendapatkan

frequent itemsets. Akan tetapi, di algoritma FP-Growth generate candidate tidak dilakukan karena FP-Growth menggunakan konsep pembangunan tree dalam pencarian frequent itemsets. Hal tersebutlah yang menyebabkan algoritma FP-Growth lebih cepat dari algoritma

Apriori. Karakteristik algoritma FP-Growth adalah struktur data yang digunakan adalah tree

yang disebut dengan FP-Tree. Dengan menggunakan FP-Tree, algoritma FP-growth dapat langsung mengekstrak frequent Itemset dari FP-Tree.

Berdasarkan analisis algoritma Association Rule diatas maka dalam penelitian ini algoritma FP-Growth akan digunakan untuk mempercepat proses penentuan frequent itemset

sebelum men-generaterule sebagai rekomendasi keputusan.

IV.2 Business Understanding

Pada subbab ini akan dijelaskan mengenai masalah yang terjadi pada suatu jurusan di institusi pendidikan dalam menentukan keputusan terhadap matakuliah pilihan yang akan ditetapkan dalam suatu semester. Dalam kasus ini, program studi Teknik Informatika mempunyai beberapa matakuliah pilihan yang ditawarkan tetapi hanya dua matakuliah pilihan yang akan ditetapkan disemester tujuh atau di semester delapan.


(51)

Mengingat jumlah mahasiswa (student body) program studi Teknik Informatika yang selalu bertambah setiap tahun akademiknya menyebabkan beberapa masalah dalam penentuan matakuliah pilihan diantaranya keterkaitannya dengan :

a. Jumlah pengajar matakuliah pilihan b. Jumlah kelas

c. Jumlah ruangan

Sehingga dari beberapa masalah ini akan menyebabkan perubahan kebijakan yang harus diambil oleh Ketua Program Studi Teknik Informatika. Berdasarkan wawancara dan observasi dengan program studi didapat contoh kebijakan sebagai berikut :

a. Pada saat jumlah mahasiswa bertambah akan menyebabkan jumlah kelas dan kebutuhan ruangan juga akan bertambah, maka Ketua Program Studi akan mengambil kebijakan bahwa penentuan matakuliah pilihan akan berdasarkan pada hasil polling

b. Sedangkan pada saat jumlah mahasiswa berkurang, maka Ketua Program Studi akan mengambil kebijakan bahwa penentuan matakuliah pilihan hanya berdasarkan pada kebijakan program studi.

Pada sistem berjalan saat ini, penentuan matakuliah berdasarkan sistem polling yang disebarkan kepada mahasiswa semester 6 diawal semester 7. Data yang didapatkan dari sistem polling akan merekomendasikan pihak jurusan dalam hal ini Ketua Program Studi dalam menentukan matakuliah pilihan. Sistem polling ini merupakan cerminan kemauan mahasiswa terhadap matakuliah pilihan. Padahal berdasarkan wawancara dengan beberapa mahasiswa yang mengisi sistem polling bahwa pengisian ini pada umumnya hanya mengikuti pengisian yang oleh teman-temannya bukan sepenuhnya berdasarkan kemauan. Disisi lain setiap matakuliah pilihan memiliki matakuliah prasyarat yang harus diambil sebelum


(52)

mengikuti matakuliah pilihan ini. Histori nilai ini merupakan cerminan dari kemampuan mahasiswa terhadap matakuliah prasyarat terhadap matakuliah pilihan. Sehingga dalam penelitian ini akan dilakukan rekomendasi pengambilan keputusan berdasarkan irisan dari data polling (kemauan) dan histori nilai (kemampuan) terhadap matakuliah pilihan.

Dalam penelitian ini, model keputusan yang dihasilkan akan memberikan rekomendasi bagi pihak jurusan berupa rule matakuliah pilihan. Hasil model keputusan ini berdasarkan penjelasan diatas harus dapat menangani seluruh kebijakan yang akan diambil oleh pihak program studi. Model keputusan ini harus dapat menerima data acuan baik dari data polling (kemauan), data histori nilai (kemampuan), gabungan antara data polling

(kemauan) dan data histori nilai (kemampuan), atau apapun data yang akan dijadikan acuan dalam penentuan matakuliah pilihan. Model keputusan ini juga dapat melakukan perbandingan rule dari beberapa data acuan untuk mendapatkan irisan sebagai rekomendasi keputusan.

IV.3 Analisis Model Keputusan

Model keputusan adalah model suatu keputusan yang digunakan untuk menguji hasil analisis model keputusan menggunakan association rule mining dengan algoritma FP-Growth terhadap data polling dan histori nilai sehingga menghasilkan rekomendasi penentuan keputusan terhadap matakuliah pilihan.

Secara garis besar penjelasan model keputusan ini adalah :

1. User memasukkan data transaksi sebagai data uji ke sistem. Data uji adalah data suatu transaksi yang akan di-mining menggunakan teknik association rule dengan pendekatan algoritma FP-growth. Setiap data traksaksi tersebut akan ditentukan itemset yang akan digunakan. Itemset inilah yang akan dijadikan dasar proses association rule mining. Data uji bisa berasal dari suatu file atau data dari suatu basis data.


(53)

2. Sistem melakukan proses association rule mining menggunakan pendekatan FP-Growth

sesuai dengan data uji berikut nilai minimum support dan minimum confidence. Proses ini akan menghasilkan sebuah struktur data tree yang disebut FP-tree. Setelah pembangkitan struktur tree, maka akan dilakukan pengekstrakan frequent itemsets secara langsung dari

FP-tree. Tingkat kevalidan data digunakan untuk memastikan bahwa hasil frequent itemsets dapat mewakili kasus yang dihadapi.

3. Frequent Itemset dari hasil pendekatan FP-growth akan di-generate untuk menghasilkan

rule berdasarkan nilai minimum support dan minimum confidence yang telah ditentukan sebelumnya. Rule yang dihasilkan oleh keputusan ke pengguna. Rule yang dihasilkan akan digunakan oleh user sebagai bahan masukan/rekomendasi dan diproses dengan menggunakan pertimbangan, aturan-aturan atau prosedur yang ada pada proses pengambilan keputusan.

4. Rule yang dihasilkan dapat dibandingan dengan rule yang lain untuk mendapatkan irisan sebagai rekomendasi keputusan.

5. Rule hasil irisan dapat disajikan kepada user dalam bentuk file text (*.txt) atau database

(*.sql).

IV.3.1 Batasan-batasan dan Asumsi

Batasan-batasan dan asumsi yang berlaku dalam model keputusan ini diantaranya adalah:

1. Model keputusan ini hanya akan melakukan proses association rule mining dengan pendekatan FP-Growth saja, sedangkan untuk pengambilan keputusan tetap dilakukan oleh user itu sendiri, terutama pada bagian saat penentuan data transaksi yang akan digunakan. Oleh karena itu kemampuan penguasaan user terhadap kasus yang dihadapi sangat diperlukan.


(54)

2. User dalam model keputusan hanya dapat menerima masukan data dari file text atau dari basis data berupa data transaksional. Pembacaan data dari basis data dapat dilakukan dari basis data apapun dengan melalui koneksi ODBC (Open Database Connectivity).

3. Model keputusan yang akan dibangun akan menggunakan proses association rule mining

dengan pendekatan algoritma FP-Growth. Algoritma FP-Growth dipilih karena algoritma ini hanya akan melakukan pemeriksaan kedalam database dua kali saja dalam menghasilkan frequent itemset untuk men-generate rule yang diinginkan. Dengan algoritma ini kita tidak perlu berulang-ulang memeriksa database dalam menghasilkan

frequent itemset.

4. Model keputusan ini dapat melakukan irisan dari dua rule yang dihasilkan dari masing-masing data acuan.

Berdasarkan analisis dan batasan model diatas maka diagram use case model keputusan dapat dilihat pada Gambar 4.1 di bawah ini.


(55)

Gambar IV.1 Diagram Use case Model Keputusan Penentuan Matakuliah Pilihan

Ada 7 use case utama yang ada dalam model keputusan ini adalah : 1. Use case Input Data Uji

2. Use case Penentuan Nilai Minimum Support dan Minimum Confidence

3. Use case Pembangunan FP-Tree

4. Use case Ekstrak Frequent Itemset

5. Use case Rule Generation

6. Use case Output AR

7. Use case Perbandingan Rules IV.3.2 Realisasi Use Case

Berdasarkan diagram use case diatas, penjelasan dari masing-masing use case


(56)

IV.3.2.1Skenario Use Case Input Data Uji

Nama Input Data Uji

Deskripsi Use case ini menggambarkan proses input data uji dalam sistem.

Aktor Pengguna

Skenario Utama

Kondisi awal - Sistem menampilkan layar input data uji.

- Sistem menampilkan pilihan sumber data uji dari database atau dari file text.

Aksi Aktor Reaksi Sistem

1. Pengguna memilih sumber data uji 2. Sistem membaca data dan menampilkannya di layar.

3. Sistem menampilkan pilihan menyimpan data uji atau membatalkan pembacaan datanya.

4. Pengguna memilih menyimpan data uji.

5. Sistem menyimpan data uji ke dalam database, dan layar input data ditutup dan kembali ke pengolahan proyek AR.

Skenario Alternatif : Pemilih memilih pembatalan pembacaan data

6. Sistem tidak menyimpan data uji ke dalam database, dan kembali ke pengolahan proyek AR.

Kondisi akhir Data uji untuk proses pengolahan AR telah tersimpan di dalam database sehingga dapat digunakan untuk proses analisis AR.

IV.3.2.2 Skenario Use Case Penentuan Nilai Minimum Support dan Minimum

Confidence

Nama Penentuan Nilai Minimum Support dan Minimum Confidence Deskripsi Use case ini menggambarkan proses penentuan nilai minimum

support dan minimum confidence yang akan digunakan dalam analisis AR.

Aktor Pengguna

Skenario Utama Kondisi awal - Data uji telah dibaca


(57)

- Sistem menampilkan jumlah frekuensi masing-masing item data yang dibaca dari obyek uji.

Aksi Aktor Reaksi Sistem

1. Pengguna memilih data nilai

minimum support dan minimum confidence yang akan ditentukan

2. Sistem menampilkan layar pengisian nilai minimum support

dan minimum confidence

3. Pengguna mengisi minimum support dan minimum confidence

4. Sistem menyimpan nilai minimum support dan minimum confidence ke basis data.

Kondisi akhir Nilai minimum support dan minimum confidence telah ditentukan dan disimpan dalam basis data dan dapat digunakan dalam proses AR.

IV.3.2.3Skenario Use Case Pembangunan FP-Tree

Nama Pembangunan FP-Tree

Deskripsi Use case ini menggambarkan proses pembangunan FP-Tree

Aktor Pengguna

Skenario Utama

Kondisi awal - Data uji yang akan dianalisis telah tersedia dan minimum support dan minimum confidence telah ditentukan

Aksi Aktor Reaksi Sistem

1. Pengguna memilih untuk melakukan pembangunan FP-Tree

2. Sistem akan menghitung jumlah frekuensi item dari data uji berdasarkan minsup dan minconf 3. Sistem akan melakukan

pembangunan FP-Tree

4. Sistem menampilkan hasil pembangunan FP-Tree

Kondisi akhir Pembangunan FP-Tree telah dilakukan dan pengguna dapat melihatnya di layar hasil FP-Tree yang dibangun


(58)

IV.3.2.4Skenario Use Case Ekstrak Frequent Itemset

Nama Ekstrak Frequent Itemset

Deskripsi Use case ini menggambarkan proses ekstrak frequent itemset

Aktor Pengguna

Skenario Utama

Kondisi awal - FP-Tree telah dibangun berdasarkan data uji dan minimum support serta minimum confidence

Aksi Aktor Reaksi Sistem

1. Pengguna memilih untuk melakukan ekstrak frequent itemset

2. Sistem akan mengkombinasikan setiap suffix dari item yang frequent

3. Sistem menyimpan hasil ekstrak

itemset yang frequent kedalam basis data

4. Sistem menampilkan hasil itemset

yang frequent

Kondisi akhir Proses ekstrak frequent itemset telah dilakukan, data itemset

yang frequent telah disimpan di basis data dan pengguna dapat melihatnya di layar output AR.

IV.3.2.5Skenario Use Case Rule Generation

Nama Rule Generation

Deskripsi Use case ini menggambarkan proses membangkitkan rule

berdasarkan hasil frequent itemset

Aktor Pengguna

Skenario Utama Kondisi awal - Frequent itemset telah dihasilkan

Aksi Aktor Reaksi Sistem

1. Pengguna memilih rule generation 2. Sistem akan mengkombinasikan hasil frequent itemset


(59)

1. Sistem akan mengeliminasi hasil kombinasi yang tidak memenuhi

minsup dan minconf

2. Sistem menyimpan hasil kombinasi yang memenuhi minsup

dan minconf

3. Sistem menampilkan hasil rule Kondisi akhir Proses rule generation telah dilakukan, hasil rule generation

telah disimpan di basis data dan pengguna dapat melihatnya di layar output AR.

IV.3.2.6Skenario Use Case Output AR

Nama Output AR

Deskripsi Use case menggambarkan proses output rule generation hasil proses AR. Hasil proses AR dapat disimpan/diexport ke basis data lain atau ke file.

Aktor Pengguna

Skenario Utama

Kondisi awal - Rule yang berasal dari proses analisis AR telah didapatkan. - Sistem akan menampilkan pilihan format export data yang

akan dilakukan (file teks atau file sql).

Aksi Aktor Reaksi Sistem

1. Pengguna memilih format export

data yang dilakukan dan nama file tujuan.

Skenario Alternatif : Pengguna memilih export ke file SQL

2. Sistem akan menyimpan hasil AR ke file sql

Skenario Alternatif : Pengguna memilih export ke file Text

3. sistem akan menyimpan hasil AR ke file text


(60)

IV.3.2.7Skenario Use Case Perbandingan Rules

Nama Perbandingan Rules

Deskripsi Use case ini menggambarkan proses perbandingan antara dua

rule untuk mendapatkan irisan rule dari beberapa proyek .

Aktor Pengguna

Skenario Utama

Kondisi awal Data proyek AR yang pernah dilakukan ada di basis data

Aksi Aktor Reaksi Sistem

1. Pengguna memilih proyek AR yang akan dibandingkan.

2. Sistem menampilkan menampilkan projek AR yang telah dihasilkan 3. Sistem mencari irisan rule dari

projek AR yang dipilih

4. Sistem menampilkan hasil irisan

rule proyek AR 5. Pengguna dapat memilih

mengekspor hasil irisan dalam bentuk file text

Kondisi akhir Sistem akan menampilkan hasil irisan rule atau mengekspor hasil irisan dalam bentuk file text.

IV.3.3 Realisasi Diagram Aktivitas

Berdasarkan skenario masing-masing use case diatas, maka penjelasan diagram aktivitasnya dapat dilihat pada gambar dibawah ini.


(61)

IV.3.3.1Diagram Aktivitas Input Data Uji

Gambar IV.2 Diagram aktivitas Input Data Uji

IV.3.3.2Diagram Aktivitas Penentuan Nilai Minsup dan Minconf


(1)

subproblem yang lebih kecil. Setelah memeriksa frequent itemset untuk beberapa akhiran (suffix), maka didapat hasil yang dirangkum dalam tabel berikut :

Tabel V.8 Hasil Frequent Itemsets

Suffix Frequent Itemset

DbLanjut {DbLanjut (14)}

KSI {KSI (13)} {DbLanjut-KSI (8)} ManPro {ManPro (13)}

Pengcit {PengCit (11)}

ADSI {ADSI (9)}

V.3.1.2 Berdasarkan Hasil Histori Nilai

Sedangkan pembangunan FP-Tree ini dibangun berdasarkan data hasil penyederhanaan histori nilai dengan minimum support dan minimum confidence yang sama dengan pembangunan FP-Tree hasil polling.

a. Penentuan Frequent Itemsets

Hasil penyederhanaan data histori nilai pada tabel V.6 akan dihitung nilai frekuensi kemunculan tiap item dengan minimum support = 30% atau 7,2 adalah sebagai berikut :

Tabel V.9 Frekuensi Kemunculan tiap item

Item Frekuensi ADSI (A) 24 KSI (K) 24 ManPro (M) 24 PengCit (P) 24 SIG (S) 24 TeKomp (T) 24 DbLanjut (D) 22

Adapun FP-tree keseluruhan yang terbentuk dengan pembacaan setiap transaksi yang terjadi pada tabel V.6 dan tabel V.9 yaitu :


(2)

Gambar V.8 Hasil pembentukan FP-Tree

b. Penerapan Algoritma FP-Growth

Setelah tahap pembangunan FP-tree dari sekumpulan data transaksi, akan diterapkan algoritma FP-Growth untuk mencari frequent itemset yang signifikan. Untuk mendapatkan

frequent itemset maka perlu ditentukan pohon dengan lintasan yang berakhir dengan support count terkecil, yaitu DbLanjut. Berturut-turut ditentukan juga yang berakhiran Tekomp,SIG, PengCit, ManPro, KSI dan ADSI. Proses pembentukan dapat dilihat pada gambar berikut :

Gambar V.9 Lintasan yang mengandung simpul DbLanjut K=24

D=22

P=24

A=24

P=24

S=24

M=24

K=24

D=22 T=24

A=24

P=24

S=24

M=24


(3)

Gambar V.10 Lintasan yang mengandung simpul TeKomp

Gambar V.11 Lintasan yang mengandung simpul SIG

Gambar V.12 Lintasan yang mengandung simpul PengCit K=24

T=24

A=24

P=24

S=24

M=24

Null

K=24 A=24

P=24

S=24

M=24

Null

K=24 A=24

P=24 M=24


(4)

Gambar V.13 Lintasan yang mengandung simpul ManPro

Gambar V.14 Lintasan yang mengandung simpul KSI

Gambar V.15 Lintasan yang mengandung simpul ADSI

Setelah memeriksa frequent itemset untuk beberapa akhiran (suffix), maka didapat hasil yang dirangkum dalam tabel berikut menggunakan metode divide and conquer yaitu:

Tabel V.10 Hasil Frequent Itemset

Suffix Frequent Itemset

ADSI (A) {ADSI (24)}

KSI (K) {KSI (24)} {ADSI-KSI (24)}

ManPro (M) {ManPro (24)} {ADSI-ManPro (24)} {KSI-ManPro (24)} {ADSI-KSI-ManPro (24)}

PengCit (P) {PengCit (24)} PengCit (24)} {KSI-PengCit (24)} {ManPro-PengCit (24)} PengCit (24)} {ADSI-ManPro-PengCit (24)} {KSI-ManPro-PengCit (24)} {ADSI-KSI-ManPro-PengCit (24)}

SIG (S) {SIG (24)} {ADSI-SIG (24)} {KSI-SIG (24)} {ManPro-SIG (24)} {PengCit-SIG (24)} {ADSI-KSI-SIG (24)} {ADSI-ManPro-SIG (24)} {ADSI-PengCit-SIG (24)} {KSI-ManPro-SIG (24)} {KSI-PengCit-{KSI-ManPro-SIG (24)} {ManPro-PengCit-{KSI-ManPro-SIG (24)} {ADSI-KSI-ManPro-{KSI-ManPro-SIG (24)} {ADSI-KSI-PengCit-SIG (24)} {ADSI-ManPro-PengCit-SIG (24)} {KSI-ManPro-PengCit-SIG (24)} {ADSI-KSI-ManPro-{KSI-ManPro-PengCit-SIG (24)}

TeKomp (T) {Tekomp (24)} {ADSI-Tekomp (24)} {KSI-Tekomp (24)} {ManPro-Tekomp (24)} {PengCit-Tekomp (24)} {SIG-Tekomp (24)} {ADSI-KSI-Tekomp (24)} {ADSI-ManPro-Tekomp (24)} {ADSI-PengCit-{ADSI-ManPro-Tekomp (24)} {ADSI-SIG-{ADSI-ManPro-Tekomp (24)} {KSI-ManPro-Tekomp (24)} {KSI-PengCit-{KSI-ManPro-Tekomp (24)} {KSI-SIG-{KSI-ManPro-Tekomp (24)} {ManPro-PengCit-Tekomp (24)} {ManPro-SIG-{ManPro-PengCit-Tekomp (24)} {PengCit-SIG-{ManPro-PengCit-Tekomp (24)} {ADSI-KSI-ManPro-Tekomp (24)} {ADSI-KSI-PengCit-Tekomp (24)} {ADSI-KSI-SIG-Tekomp (24)} {ADSI-ManPro-PengCit-Tekomp (24)} {ADSI-ManPro-SIG-Tekomp (24)} {ADSI-PengCit-SIG-Tekomp (24)} {KSI-ManPro-PengCit-Tekomp (24)} {KSI-ManPro-{ADSI-PengCit-SIG-Tekomp (24)} {KSI-PengCit-SIG-Tekomp (24)} {ManPro-PengCit-SIG-Tekomp (24)}

{ADSI-KSI-K=2 A=2

M=24

K=24 A=24

Null

A=24 Null


(5)

ManPro-PengCit-Tekomp (24)} ManPro-SIG-Tekomp (24)} {ADSI-KSI-PengCit-SIG-Tekomp (24)} {ADSI-ManPro-{ADSI-KSI-PengCit-SIG-Tekomp (24)} {KSI-ManPro-PengCit-SIG-Tekomp (24)} {ADSI-KSI-ManPro-{KSI-ManPro-PengCit-SIG-Tekomp (24)}

DbLanjut (D) {DbLanjut (22)} {ADSI-DbLanjut (22)} {KSI-DbLanjut (22)} {ManPro-DbLanjut (22)} {PengCit-DbLanjut (22)} {SIG-DbLanjut (22)} {Tekomp-DbLanjut (22)} {ADSI-KSI-DbLanjut (22)} {ADSI-ManPro-{ADSI-KSI-DbLanjut (22)} {ADSI-PengCit-{ADSI-KSI-DbLanjut (22)} {ADSI-SIG-DbLanjut (22)} {ADSI-Tekomp-{ADSI-SIG-DbLanjut (22)} ManPro-{ADSI-SIG-DbLanjut (22)} {KSI-PengCit-DbLanjut (22)} {KSI-SIG-DbLanjut (22)} {KSI-Tekomp-DbLanjut (22)} {ManPro-PengCit-DbLanjut (22)} {ManPro-SIG-DbLanjut (22)} {ManPro-Tekomp-DbLanjut (22)} {PengCit-SIG-DbLanjut (22)} {PengCit-Tekomp-DbLanjut (22)} {SIG-Tekomp-DbLanjut (22)} ManPro-DbLanjut (22)} PengCit-DbLanjut (22)} {ADSI-KSI-SIG-DbLanjut (22)} {ADSI-KSI-Tekomp-DbLanjut (22)} {ADSI-ManPro-PengCit-DbLanjut (22)} ManPro-SIG-DbLanjut (22)} ManPro-Tekomp-DbLanjut (22)} {ADSI-PengCit-SIG-DbLanjut (22)} {ADSI-PengCit-Tekomp-DbLanjut (22)} {ADSI-SIG-Tekomp-DbLanjut (22)} {KSI-ManPro-PengCit-{ADSI-SIG-Tekomp-DbLanjut (22)} {KSI-ManPro-SIG-{ADSI-SIG-Tekomp-DbLanjut (22)} {KSI-ManPro-Tekomp-DbLanjut (22)}

V.3.2 Generate Rule

Dari hasil frequent itemset diatas akan di-generate untuk mendapatkan rule dengan

minimum support=30% dan minimum confidence=60% dengan masing-masing itemset

dikombinasikan dengan itemset yang lain, sehingga menghasilkan rule polling di tabel V.11 dan rule nilai di tabel V.12 (lampiran).

Tabel V.11 Rule Polling yang dihasilkan

Confidence Rule

57.14 {DbLanjut}->{KSI} 61.54 {KSI}->{DbLanjut}

Adapun hasil irisan dari dua rule (hasil polling dan histori nilai) adalah sebagai berikut :

Tabel V.123 Irisan Rule yang dihasilkan

Rule Confidence Hasil Polling Confidence Histori Nilai

{KSI}->{DbLanjut} 61.54 91.67

Berdasarkan irisan rule yang dihasilkan maka rekomendasi keputusan dari hasil polling

(kemauan) dan histori nilai (kemauan) dalam penentuan matakuliah pilihan yang ditawarkan adalah matakuliah Keamanan Sistem Informasi dan Database Lanjut.


(6)

V.3.3 Simulasi dengan Nilai Minimum Support dan Nilai Minimum Confidence

Simulasi ini dilakukan untuk dapat memberikan penjelasan mengenai penentuan

minimum support dan minimum confidence yang diambil secara acak terhadap data yang sama untuk mendapatkan irisan rule. Rentang minimum support dan minimum confidence

dalam model ini adalah 0% sampai dengan 100%. Adapun hasil simulasi yang telah dilakukan dengan menggunakan beberapa nilai minimum support dan minimum confidence

dapat dilihat pada lampiran hasil simulasi. Sedangkan hasil kesimpulan simulasi adalah sebagai berikut :

1. Nilai minimum support dan minimum confidence terbesar yang dapat digunakan dalam menghasilkan irisan antara data polling dan data histori nilai untuk kelas if1 adalah

minimum support=30% dan minimum confidence=60%.

2. Jika nilai minimum support lebih kecil dari 30% dan minimum confidence lebih kecil dari 60% maka hasil simulasi untuk data polling dapat menghasilkan rule tetapi tidak memenuhi nilai minimum confidence sehingga tetap tidak dapat digunakan dalam melakukan irisan meskipun pada data histori nilai rule yang dihasilkan begitu banyak.

3. Jika nilai minimum support lebih besar dari 30% dan minimum confidence lebih kecil dari 60% ternyata pada data polling tidak ada rule yang dihasilkan dikarenakan pada hasil ekstrak frequent itemset-nya semua bernilai tunggal tidak ada kombinasi itemset yang dihasilkan sehingga tetap tidak dapat digunakan dalam melakukan irisan meskipun pada data histori nilai rule yang dihasilkan begitu banyak.