APLIKASI PENCARIAN DAN PENGKLASIFIKASIAN PROPOSAL TUGAS AKHIR MENGGUNAKAN KOMBINASI ALGORITHMA BOYER MOORE DAN NAÏVE BAYES CLASSIFIER.

APLIKASI PENCARIAN DAN PENGKLASIFIKASIAN PROPOSAL TUGAS
AKHIR MENGGUNAKAN KOMBINASI ALGORITHMA BOYER MOORE
DAN NAÏVE BAYES CLASSIFIER

SKRIPSI
Diajukan Untuk Memenuhi Sebagai Prasyaratan
Dalam Mmeperoleh Gelar Sarjana Komputer
Pr ogram Studi Teknik Infor matika

Oleh :

REFFI PRIMA WINANJ AYA ABADI
NPM : 0734010070
J URUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNOLOGI INDUSTRI
UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN”
J AWA TIMUR
2012

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.


APLIKASI PENCARIAN DAN PENGKLASIFIKASIAN PROPOSAL TUGAS AKHIR
MENGGUNAKAN KOMBINASI ALGORITHMA BOYER MOORE DAN NAÏVE BAYES
CLASSIFIER

Diajukan Kepada Fakultas Tekhnik Informatika
Universitas Pembangunan Nasional “Veteran” Jawa Timur

Untuk Menyusun Skripsi S-1 Program Studi Tekhnik Informatika

Oleh :
Reffi Prima Winanjaya Abadi
0734010070/FTI/TF

UNIVERSITAS PEMBANGUNAN NASIONAL “VETERAN”
JAWA TIMUR
2012

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.


LEMBAR PERSETUJ UAN
APLIKASI PENCARIAN DAN PENGKLASIFIKASIAN
PROPOSAL TUGAS AKHIR MENGGUNAKAN KOMBINASI
ALGORITMA BOYER MOORE DAN NAÏVE BAYES
CLASSIFIER
Disusun Oleh :
REFFI PRIMA WINANJ AYA ABADI
NPM : 0734010070
Telah disetujui mengikuti Ujian Negar a Lisan
Gelombang Oktober Tahun Akademik 2012/2013
Menyetujui,
Pembimbing Utama

Pembimbing Pendamping

I Gede Susr ama Mas Diyasa, ST, MT
NIP/NPT. 270 060 640 210

Dr . Ir. Ni Ketut Sar i, MT.

NIP. 19650731 199203 2 001

Mengetahui,
Kepala Pr ogr am Studi Teknik Infor matika
Fakultas Teknologi Industr i
Univer sitas Pembangunan Nasional “Veter an” J awa Timur

Dr . Ir . Ni Ketut Sar i, MT.
NIP. 19650731 199203 2 001
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

TUGAS AKHIR
APLIKASI PENCARIAN DAN PENGKLASIFIKASIAN
PROPOSAL TUGAS AKHIR MENGGUNAKAN
KOMBINASI ALGORITMA BOYER MOORE DAN NAÏVE
BAYES CLASSIFIER
DisusunOleh :

REFFI PRIMA WINANJ AYA ABADI

NPM : 0734010070
Telah dipertahankan dihadapan dan diterima oleh Tim Penguji Skripsi
Program Studi Teknik Infor matika, Fakultas Teknologi Industri
Univer sitas Pembangunan Nasional “Veteran” J awaTimur
Pada tanggal 25 Oktober 2012
PEMBIMBING :

TIM PENGUJ I :

1.

1.

I Gede Susrama Mas Diyasa, ST, MT
NIP/NPT. 270 060 640 210

Ir. Mu’tasim Billah, MS
NIP/NPT. 1960 0504 1987 03 1001

2.


2.

Dr. Ir. Ni Ketut Sari, MT
NIP/NPT. 19650731 199203 2 001

Intan Yuniar Purbasari. S.kom, MSc
NIP/NPT. 3 8006 04 0198 1
3.
Dr. Ir. Ni Ketut Sari, MT
NIP/NPT. 19650731 199203 2 001

Mengetahui
Dekan Fakultas Teknologi Industr i
Univer sitas Pembangunan Nasional “Veter an” J awaTimur

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

Ir . Sutiyono, MT

NIP/NPT. 19600713 198703 1001

KATA PENGANTAR

Dengan nama Allah SWT Yang Maha Pengasih dan Maha Penyayang Segala puji
dan syukur bagi Allah SWT karena atas rahmat dan hidayahNya-lah penulis dapat
menyelesaikan

tugas

Pengklasifikasian

akhir

Pr oposal

yang

berjudul


Tugas

Akhir

“Aplikasi

Pencarian

Menggunakan

Dan

Kombinasi

Algoritma Boyer Moore Dan Naive Bayes Classifier” . Sholawat dan Salam
atas junjungan kita Nabi Besar Muhammad SAW. Beserta keluarga dan para
sahabat sekalian.
Skripsi ini disusun dengan tujuan

memenuhi syarat untuk memperoleh


gelar Sarjana di Universitas Pembangunan Nasional “Veteran” JATIM.
Pengarahan, bimbingan dan dukungan dari semua pihak merupakan faktor
yang sangat membantu dalam menyelesaikan karya ini, maka dari itu dalam
kesempatan ini penulis ingin mengucapkan terima kasih kepada :
1. Bapak Ir Sutiyono, MT, selaku Dekan FTI, UPN “Veteran” Jawa Timur.
2. Ibu Dr.Ir.Ni Ketut Sari, MT selaku ketua jurusan dan Dosen pembimbing 2
Teknik Informatika, FTI, UPN “Veteran” Jawa Timur.
3. Bapak I Gede Susrama, ST . M.Kom selaku Dosen pembimbing 1.
4. Kedua Orang Tua penulis ( Bpk. Dr s Bambang Sudjanarko. MAP dan Ir.
Wiwik Nurhayati ) beserta Adik ku yang tercinta ( Metalia Puspitasari dan
Oktario Firman Saputra ) yang telah memberikan doa, serta bantuan dan
dorongan semangat baik secara moril maupun materil yang tidak ternilai
harganya, kebahagiaanmu adalah tujuan hidupku.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

ii


5. Teman-teman serta Semua rekan-rekan Mahasiswa di Jurusan Teknik
Informatika dan Sistem Informasi Angkatan 2007, Farid (TF), Rino (TF),
Yoppy (TF), Bayu (TF), Helmy (TF), Rased (TF), Almon (TF), Taufik (TF),
Bingkar (SI), Sandy (TF), Tammy (SI), Terima kasih atas doa dan semua
dukungannya.
6. Teman-teman Seperumahan yang memberikan semangat, motifasi dan doa.
7.

Dan semua pihak yang telah membantu dalam penyusunan tugas akhir ini,
penyusun tidak dapat menyebutkan satu persatu.
Akhir kata menyadari bahwa Skripsi ini masih jauh dari sempurna, oleh

karena itu sangat mengharapkan kritik dan saran yang bersifat membangun.
Namun, penulis tetap berharap agar karya ini dapat bermanfaat bagi para pembaca
khususnya bagi rekan - rekan mahasiswa.

Surabaya, Oktober 2012

Peneliti


Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

iii

DAFTAR ISI
Halaman
LEMBAR PENGESAHAN
ABSTRAK ...........................................................................................................

i

KATA PENGANTAR ......................................................................................... ii
DAFTAR ISI ........................................................................................................ iv
DAFTAR GAMBAR ........................................................................................ v
DAFTAR TABEL
BAB I

........................................................................................ vii


PENDAHULUAN

……………………………………………. 1

1.1 latar Belakang

……………………………………………. 1

1.2 Perumusan Masalah

……………………………………. 2

1.3 Batasan Masalah ……………………………………………. 3
1.4 Tujuan

……………………………………………………. 3

1.5 Manfaat

……………………………………………………. 4

1.6 Metode Penelitian ……………………………………………. 4

BAB II

1.7 Sistematika Penulisan

……………………………………. 4

TINJAUAN PUSTAKA

…………………………………….. 6

2.1 Definisi Data Dan Konsep dasar Informasi

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

…………….. 6

2.1.1 Data

…………………………………………….. 6

2.1.2 Informasi

…………………………………….. 6

2.1.3 Kualitas Informasi

…………………………….. 6

2.1.4 Nilai Informasi ……………………………………... 7
2.1.5 Siklus Informasi …………………………………....... 7
2.2 Konsep Dasar Sistem Informasi ……………………………. 8
2.2.1 Komponen Sistem Informasi

……………………. 8

2.2.2 Tujuan Sistem Informasi

…………………….. 9

2.3 Aplikasi Temu Kembali Informasi

……………………... 9

2.4 Text Mining

…………………………………………….. 13

2.5 Proses Pengklasifikasian ……………………………………... 14
2.6 Tata Bahasa Indonesia

……………………………………... 15

2.7 Stemming ……………………………………………………... 19
2.8 Flow Map …………………………………………………….. 21
2.9 Naïve Bayes Classifier

……………………………………... 22

2.10 Algorithma Booyer More

……………………………... 26

2.11 Unified Modelling Language

…………………………….. 29

2.12 Embarcadero Delphi 2010

…………………………….. 39

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

BAB III ANALISIS DAN PERANCANGAN SISTEM

………………..

42

3.1 Desain Penelitian ……………………………………………... 42
3.2 Bahan Dan Alat Penelitian

……………………………... 43

3.3 Struktured Chart Sistem Pencarian Dan Klasifiksi
Proposal Tugas Akhir
3.4 Diagram Work Flow

……………………………………... 44
…………………………………….. 45

3.5 Analisa Proses Pencarian Menggunakan Booyer Moore …….. 46
3.6 Analisa Proses Klaisifikasi Menggunakan Naïve Bayes …….. 48
3.7 Rancangan Algoritma Booyer Moore

……………………... 49

3.8 Rancangan Algorithma Naïve Bayes

……………………... 51

BAB IV IMPLEMENTASI DAN PENGUJIAN

……………………... 59

4.1 Spesifikasi Perangkat

……………………………………... 59

4.2 Implementasi Antar Muka

……………………………... 59

4.2.1 Form Awal

……………………………………... 59

4.2.2 Form Input

……………………………………... 60

4.2.3 Form Training ……………………………………... 60
4.3 Implementasi Algorithma Booyer More ……………………... 62
4.4 Implementasi Algorithma Naïve Bayes Classifer ……………... 63
4.5 Pengujian Aplikasi

……………………………………... 68

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

4.5.1 Bahan Pengujian

……………………………... 68

4.5.2 Pengujian Aplikasi

……………………………... 72

4.5.2.1 Pengujian Katagori CIS

……………... 73

4.5.2.2 Pengujian Katagori ITNS

……………... 80

4.5.2.3 Pengujian Katagori SENG

……………... 87

BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan
5.2 Saran

…………………………….. 94

…………………………………………….. 94

…………………………………………………….. 94

DAFTAR PUSTAKA …………………………………………………………. 95

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

DAFTAR TABEL
No

Halaman

2.1

Pencocokan String Pertama …………………………….. 26

2.2

Pencocokan String Kedua

4.1

Daftar Judul Tugas Akhir Sebagai Data Pengujian

……………………………. 27

Katagori CIS ……………………………………………... 70
4.2

Daftar Judul Tugas Akhir Sebagai Data Pengujian
Katagori ITNS…………………………………………….. 71

4.3

Daftar Judul Tugas Akhir Sebagai Data Pengujian
Katagori SENG

…………………………………….. 72

4.4

Hasil Pengujian Bidang CIS ……………………………. 79

4.5

Hasil Pengujian Bidang ITNS…………………………….. 86

4.6

Hasil Pengujian Bidang SENG

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

…………………….. 92

DAFTAR GAMBAR
No

Halaman

2.1

Siklus Akuntansi

…………………………………….. 8

2.2

Desain dari Porter stemmer for Bahasa Indonesia

2.3

Metodologi Dalam UML

2.4

Notasi Actor ……………………………………………... 34

2.5

Notasi Use Case

2.6

Notasi Class ……………………………………………... 36

2.7

Notasi Interface

……………………………………... 36

2.8

Notasi Interaction

……………………………………... 37

2.9

Notasi Note

2.10

Notasi Dependency ……………………………………….. 37

2.11

Notasi Asociation

2.12

Notasi Generalization ……………………………………... 38

2.13

Notasi Realization

2.14

Tampilan Awal Delphi …………………………………… 41

3.1

Skema Desain Penelitian

3.2

Struktur Chart Klasifikasi Artikel

…….. 21

……………………………... 31

……………………………………... 35

……………………………………………... 37

……………………………………... 38

…………………………………….. 39

……………………………. 42

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

…………………….. 44

3.3

Diagram Work Flow ……………………………………... 45

3.4

Bagan Proses Pencarian

3.5

Blok Diagram Klasifikasi Bayesian …………………….. 48

3.6

Diagram Alir Sistem Boyer Moore

3.7

Diagram Alir Sistem Naïve Bayes Classifier …………… 57

4.1

Tampilan Form Awal ……………………………………... 60

4.2

Tampilan Form Input ……………………………………... 60

4.3

Tampilan Form Trainning

4.4

Tampilan Awal Aplikasi (from input)

4.5

Form Proses Pelatihan……………………………………... 73

4.6

Tampilan Proses Pelatihan Telah selesai
Di Lakukan

…………………………….. 46

…………………….. 50

……………………………... 61
…………….. 72

……………………………………….......... 73

4.7

Hasil Pengujian CIS Pertama Katagori CIS ……………. 74

4.8

Form Dialog Konvirmasi Penerimaan Proposal
Tugas Akhir ……………………………………………... 74

4.9

Hasil Pengujian CIS Yang Kedua Katagori CIS

…….. 75

4.10

Hasil Pengujian CIS Yang Ketiga Katagori CIS

……... 75

4.11

Hasil Pengujian CIS Yang Keempat Katagori CIS

……... 76

4.12

Hasil Pengujian CIS Yang Kelima Katagori CIS

……... 76

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

4.13

Hasil Pengujian CIS Yang Keenam Katagori CIS

……... 77

4.14

Hasil Pengujian CIS Yang Ketujuh Katagori CIS

……... 77

4.15

Hasil Pengujian CIS Yang Kedelapan Katagori CIS …….. 78

4.16

Hasil Pengujian CIS Yang Kesembilan Katagori CIS…….. 78

4.17

Hasil Pengujian CIS Yang Kesepuluh Katagori CIS …….. 79

4.18

Hasil Pengujian Pertama Katagori ITNS

……………... 81

4.19

Hasil Pengujian Kedua Katagori ITNS

……………... 81

4.20

Hasil Pengujian Ketiga Katagori ITNS

……………. 82

4.21

Hasil Pengujian Keempat Katagori ITNS

……………... 82

4.22

Hasil Pengujian Kelima Katagori ITNS

……………... 83

4.23

Hasil Pengujian Keenam Katagori ITNS

……………... 83

4.24

Hasil Pengujian Ketujuh Katagori ITNS

……………... 84

4.25

Hasil Pengujian Kedelapan Katagori ITNS ……………... 84

4.26

Hasil Pengujian Kesembilan Katagori ITNS ……………... 85

4.27

Hasil Pengujian Kesepuluh Katagori ITNS ……………... 85

4.28

Hasil Pengujian Pertama Katagori SENG

……………... 87

4.29

Hasil Pengujian Kedua Katagori SENG

……………... 88

4.30

Hasil Pengujian Ketiga Katagori SENG

…………….. 88

4.31

Hasil Pengujian Keempat Katagori SENG

……………... 89

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

`

4.32

Hasil Pengujian Kelima Katagori SENG

……………... 89

4.33

Hasil Pengujian Keenam Katagori SENG

……………... 90

4.34

Hasil Pengujian Ketujuh Katagori SENG

…………….. 90

4.35

Hasil Pengujian Kedelapan Katagori SENG ……………... 91

4.36

Hasil Pengujian Kesembilan Katagori SENG……............... 91

4.37

Hasil Pengujian Kesepuluh Katagori SENG ……………... 92

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

Judul

:Aplikasi Pencarian Dan Pengklasifikasian Proposal Tugas

Pem bimbing I
Pem bimbing II
Penyusun

:I Gede Susrama, ST. M .Kom
:Dr.Ir. Ni Ketut Sari, M T
:Reffi Prima Winanjaya A

Akhir M enggunakan Kombinasi Algorit ma BM Dan NBC

ABSTRAK
Keberadaan data sebagai hasil dari tumbuh dan berkembangnya teknologi,
khususnya sistem informasi menjadi sangat mudah diperoleh. Apalagi
perkembangan teknologi hardware dan software yang semakin pesat dan semakin
murah, membuat proses dokumentasi menjadi semakin mudah. Faktor-faktor ini
akhirnya menyebabkan terjadinya “ledakan data” di berbagai bidang.
UPN Veteran Jawa Timur, khususnya jurusan Teknik Informatika dalam suatu
gelombang prosedur pengajuan proposal tugas akhir, akan ada banyak sekali
mahasiswa yang melakukannya. Hal ini akan mengakibatkan penumpukan data
yang meyebabkan waktu antrian proses menjadi lama agar proposal tugas akhir
mahasiswa tersebut disetujui. Berdasarkan latar belakang tersebut diatas,
memberikan ide pembuatan aplikasi yang dapat melakukan pelacakan kesamaan
topik tugas akhir berdasarkan judul dan sekaligus melakukan klasifikasinya
berdasarkan judul dalam proposal tugas akhir mahasiswa. Jenis klasifikasi tugas
akhir mengacu pada ketetapan program studi teknik informatika UPN Veteran
Jawa Timur, yaitu : CIS (Computer and Intelligent System), ITNS (Network and
Secuirty Goverment) dan SENG (Software Engineering). Hasil penelitian
menunjukkan bahwa penggunaan metode Booyer Moore dan Naive Bates sudah
cukup baik dengan tingkat akurasi mencapai 80 % dalam melakukan pencarian
dan pengklasifikasian tugas akhir.
Kata Kunci : klasifikasi, text mining, Booyer Moore, Naive Bayes

i

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

BAB I
PENDAHULUAN

1.1.

Latar Belakang
Pada masa sekarang, aplikasi sistem informasi telah berkembang pesat

penggunaannya, pada saat ini sudah sedemikian pesat dan merambah ke berbagai
sisi kehidupan manusia. Perkembangan yang demikian tersebut didukung oleh
tersedianya perangkat keras maupun perangkat lunak yang semakin hari semakin
hebat kemampuannya. (Bimo Sunarfrihantono, 2002). sehingga dapat dikatakan
keberadaannya sangat melekat pada kehidupan sehari-hari, baik itu pekerjaan,
hiburan, maupun sesuatu yang pribadi. Tidak hanya di kota besar, kini aplikasi
sistem informasi mulai menyebar hingga ke desa. Dan tidak hanya secara
konvensional menggunakan Personal Computer (PC) dengan modem, sistem
informasi kini juga bisa diakses menggunakan notebook melalui hotspot.
Teknologi informasi merupakan teknologi yang digunakan untuk
mengolah data,termasuk memproses, mendapatkan, menyusun, menyimpan,
memanipulasi data dalam berbagai cara untuk menghasilkan informasi yang
berkualitas, yaitu informasi yang relevan, akurat dan tepat waktu (Wardiana,
2002). Keberadaan data sebagai hasil dari tumbuh dan berkembangnya teknologi,
khususnya sistem informasi menjadi sangat mudah diperoleh. Apalagi
perkembangan teknologi hardware dan software yang semakin pesat dan semakin
murah, membuat proses dokumentasi menjadi semakin mudah. Faktor-faktor ini
akhirnya menyebabkan terjadinya “ledakan data” di berbagai bidang.

1

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

2

Seperti halnya dalam bidang pendidikan yang secara khusus menyoroti
masalah mahasiswa dan proposal tugas akhirnya. Bagi perguruan tinggi yang
sudah menerapkan basis IT (Information of Technology), adalah sebuah keharusan
dan kebiasaan untuk seorang mahasiswanya untuk mendokumentasikan proposal
tugas akhirnya ke dalam bentuk hardcopy maupun softcopy agar bisa menjadi
bukti fisik dalam bentuk dokumen akan keeksistensian jurusan tersebut di
universitas maupun perguruan tinggi. Selain itu, pendokumentasian bisa juga
untuk mencegah timbulnya proposal tugas akhir ganda dan mempercepat proses
penerimaan proposal tersebut.
UPN Veteran Jawa Timur, khususnya jurusan Teknik Informatika dalam
suatu gelombang prosedur pengajuan proposal tugas akhir, akan ada banyak sekali
mahasiswa yang melakukannya. Hal ini akan mengakibatkan penumpukan data
yang meyebabkan waktu antrian proses menjadi lama agar proposal tugas akhir
mahasiswa tersebut disetujui.
Berdasarkan latar belakang tersebut diatas, memberikan ide pembuatan
aplikasi yang dapat melakukan pelacakan kesamaan topik tugas akhir berdasarkan
judul dan sekaligus melakukan klasifikasinya berdasarkan judul dalam proposal
tugas akhir mahasiswa.

1.2.

Perumusan Masalah
Rumusan masalah yang digunakan dalam tugas akhir ini adalah :
1. Bagaimana menerapkan algorithma Boyer Moore (BM) untuk mencari
kesamaan proposal tugas akhir berdasarkan judul yang pernah
diajukan ?

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

3

2. Bagaimana menerapkan algorithma Naïve Bayes Classifier (NBC)
untuk menentukan klasifikasi proposal tugas akhir berdasarkan judul
yang diajukan ?
3. Bagaimana membuat aplikasi untuk menerapkan kedua algorithma
tersebut diatas ?
1.3.

Batasan Masalah
Batasan masalah yang digunakan dalam tugas akhir ini yaitu :

1. Data yang dipergunakan sebagai input adalah nama, npm, dan Judul proposal
tugas akhir mahasiswa.
2. Jenis klasifikasi tugas akhir mengacu pada ketetapan program studi teknik
informatika UPN Veteran Jawa Timur, yaitu : CIS (Computer and Intelligent
System), ITNS (Network and Secuirty Goverment) dan SENG (Software
Engineering)
3. Aplikasi dapat berjalan pada sistem operasi Microsoft Windows Vista atau
Windows Seven.

1.4.

Tujuan
Tujuan yang ingin dicapai pada pengerjaan tugas akhir ini adalah:
1. Mengimplementasikan algorithma Boyer Moore (BM) untuk mencari
kesamaan proposal tugas akhir berdasarkan judulnya.
2. Mengimplementasikan algorithma Naïve Bayes Classifier (NBC)
untuk melakukan klasifikasi proposal tugas akhir berdasarkan
judulnya.
3. Mengetahui tingkat akurasi algoritma Naïve Bayes Classifier (NBC)
dalam melakukan klasifikasi proposal tugas akhir.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

4

1.5.

Manfaat
Adapun manfaat yang ingin diperoleh dari pengerjaan tugas akhir ini adalah

dapat membuat perangkat lunak untuk

mempermudah petugas koordinator

(dalam hal ini PIA) dan mahasiswa mengetahui sebuah proposal tugas akhir
pernah diajukan sebelumnya sekaligus melakukan klasifikasinya.
1.6.

Metode Penelitian
Adapun metode penelitian yang dipergunakan dalam pengerjaan tugas

akhir ini adalah :
1. Studi Literatur
Mencari referensi dan bahan pustaka tentang teori-teori yang berhubungan
dengan permasalahan yang akan dikerjakan dalam tugas akhir ini.
2. Studi Kasus
Mencari contoh-contoh kasus serupa yang berhubungan dengan permasalahan
dalam tugas akhir ini.

1.7.

Sistematika Penulisan
Sistematika penulisan tugas akhir ini disusun untuk memberikan gambaran

umum tentang penelitian yang dijalankan. Sistematika penulisan tugas akhir ini
adalah sebagai berikut :
BAB I

PENDAHULUAN
Bab ini berisi latar belakang masalah, identifikasi masalah, maksud
dan tujuan yang ingin dicapai, batasan masalah, metodologi
penelitian yang diterapkan dalam memperoleh dan mengumpulkan
data, waktu dan tempat penelitian, serta sistematika penulisan.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

5

BAB II

TINJ AUAN PUSTAKA
Membahas berbagai konsep dasar dan teori-teori yang berkaitan
dengan topik masalah yang diambil dan hal-hal yang berguna
dalam proses analisis permasalahan.

BAB III

ANALISIS DAN PERANCANGAN
Menganalisis masalah dari model penelitian untuk memperlihatkan
keterkaitan antar variabel yang diteliti serta model matematis untuk
analisisnya.

BAB IV

IMPLEMENTASI DAN PENGUJ IAN
Membahas mengenai pengimplementasian aplikasi yang telah
dibuat ke perangkat yang akan digunakan serta melakukan
pengujian terhadap aplikasi yang telah diimplementasikan tersebut.

BAB V

KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran yang sudah diperoleh dari hasil
penulisan tugas akhir.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

BAB II
TINJ AUAN PUSTAKA

2.1.

Definisi Data Dan Konsep Dasar Infor masi
Konsep Informasi tidak akan lepas dari keterhubungan dengan data.

Untuk mendapatkan Informasi yang valid maka dibutuhkan data-data yang
berhubungan antara satu dengan yang lain agar output sesuai dengan yang
diharapkan.
2.1.1. Data
Data adalah kumpulan dari fakta-fakta, kejadian-kejadian yang dapat
berupa simbol, angka, huruf, dan lain-lain yang berguna bagi suatu pengolahan
data (proses) atau sebagai masukan (input) bagi suatu proses. Data merupakan
deskripsi dari sesuatu dan kejadian yang kita hadapi.
2.1.2. Infor masi
Informasi adalah “hasil dari pengolahan data menjadi bentuk yang lebih
berguna bagi yang menerimanya, yang menggambarkan suatu kejadian nyata dan
dapat digunakan sebagai alat bantu dalam pengambilan suatu keputusan”
(Jogiyanto, 2005). Dalam hal ini data bisa dianggap sebagai obyek yang masih
mentah yang belum dapat memberikan arti banyak bagi pemakai sehingga perlu
diolah lebih lanjut untuk menghasilkan suatu informasi yang dibutuhkan,
sedangkan informasi adalah suatu subyek yang bermanfaat bagi penerimanya.
Dengan kata lain informasi adalah hasil dari pengolahan atau pemrosesan data.
2.1.3. Kualitas Infor masi
Kualitas dari suatu informasi tergantung pada tiga hal pokok yaitu :
6
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

7

a. Akurat ( accurate )
Informasi harus bebas dari kesalahan-kesalahan dan tidak menyesatkan,
dalam hal ini informasi harus jelas mencerminkan maksudnya.
b. Tepat waktu ( time lines )
Informasi yang datang pada penerima tidak boleh terlambat. Informasi yang
sudah usang tidak akan mempunyai nilai lagi karena informasi merupakan
suatu landasan dalam mengambil sebuah keputusan dimana bila pengambilan
keputusan terlambat maka akan berakibat fatal untuk organisasi.
c. Relevan ( relevance )
Informasi harus mempunyai manfaat untuk pemakainya, dimana relevansi
informasi untuk tiap-tiap individu berbeda tergantung pada keperluan.
2.1.4. Nilai Infor masi
Nilai dari Informasi (value of information) ditentukan dari dua hal, yaitu
manfaat dan biaya mendapatkannya. Suatu Informasi dikatakan bernilai bila
manfaatnya lebih efektif dibandingkan dengan biaya mendapatkannya. Kegunaan
Informasi adalah untuk mengurangi hal ketidakpastian di dalam proses
pengambilan keputusan tentang suatu keadaan.
2.1.5. Siklus Infor masi
Data agar menjadi lebih berarti dan berguna dalam bentuk informasi,
maka perlu diolah melalui suatu model tertentu. Data yang telah diolah tersebut
kemudian diterima oleh penerima, lalu penerima membuat suatu keputusan dan
melakukan tindakan, yang berarti menghasilkan suatu tindakan yang lain yang
akan membuat sejumlah data kembali. Data tersebut akan ditangkap sebagai input,
dan diproses kembali lewat suatu model dan seterusnya sehingga membentuk

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

8

suatu siklus. Siklus ini disebut dengan siklus Informasi (information cycle) atau
disebut pula siklus pengolahan data (processing cycles).

Gambar 2.1. Siklus Informasi
2.3.

Konsep Dasar Sistem Infor masi
Sistem Informasi adalah “suatu jaringan dari beberapa elemen-elemen

yang saling berhubungan serta membentuk satu kesatuan untuk menyediakan
informasi yang dibutuhkan oleh organisasi untuk beroperasi dengan cara yang
sukses, serta memberi sinyal kepada manajemen dan yang lain terhadap kejadian
internal dan eksternal yang penting dan menyediakan suatu dasar informasi untuk
pengambilan keputusan” (Wahyono,2004)
2.3.1. Komponen Sistem Informasi
Membangun suatu sistem Informasi diperlukan penggabungan elemenelemen pendukung tersebut antara lain :
a. Software, merupakan suatu program komputer, struktur data, dan dokumendokumen yang saling berhubungan yang digunakan dalam metode logika dan
prosedur yang dibutuhkan.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

9

b. Hardware, merupakan perangkat elektronik yang memiliki kemampuan untuk
melakukan proses komputerisasi.
c. Brainware, adalah pengguna dan operator perangkat keras atau perangkat
lunak.
d. Data, berupa salinan-salinan

manual dan

deskripsi informasi yang

menggambarkan operasi sistem.
2.3.2. Tujuan Sistem Infor masi
Sistem Informasi memiliki beberapa tujuan, yaitu:
1. Integrasi sistem
a. Menghubungkan sistem individu/kelompok
b. Pengkolektifan data dan penyambungan secara otomatis
c. Peningkatan koordinasi dan pencapaian sinergi
2. Efisiensi pengelolaan
a. Penggunaan basis data dalam upaya kesamaan pengadministrasian data
b. Pengelolaan data berkaitan dengan karakteristik Informasi
c. Penggunaan dan pengambilan Informasi
3. Dukungan keputusan untuk manajemen
a. Melengkapi Informasi guna kebutuhan proses pengambilan kebutuhan
b. Akuisisi Informasi eksternal melalui jaringan komunikasi
c. Ekstraksi dari Informasi internal yang terpadu.

2.2.

Aplikasi Temu Kembali Informasi
Temu kembali informasi (information retrieval) adalah ilmu pencarian

informasi pada dokumen, pencarian untuk dokumen itu sendiri, pencarian untuk

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

10

metadata yang menjelaskan dokumen, atau mencari di dalam database, baik relasi
database yang stand-alone atau hipertext database yang terdapat pada network
seperti internet atau World Wide Web atau intranet, untuk teks, suara, gambar,
atau data. Information retrieval (IR) adalah ilmu yang lahir dari berbagai disiplin
ilmu, baik ilmu komputer, matematika, ilmu kepustakaan, ilmu informasi,
psikologi kognitif, linguistik, statistik, maupun fisika.
Secara prinsip, penyimpanan informasi dan penemuan kembali informasi
adalah hal yang sederhana. Misalkan terdapat tempat penyimpanan dokumendokumen dan seseorang (user) merumuskan suatu pertanyaan (request atau query)
yang jawabannya adalah himpunan dokumen yang mengandung informasi yang
diperlukan yang diekspresikan melalui pertanyaan user. User bisa saja
memperoleh dokumen-dokumen yang diperlukannya dengan membaca semua
dokumen dalam tempat penyimpanan, menyimpan dokumen-dokumen yang
relevan dan membuang dokumen lainnya. Hal ini merupakan perfect retrieval,
tetapi solusi ini tidak praktis. Karena user tidak memiliki waktu atau tidak ingin
menghabiskan waktunya untuk membaca seluruh koleksi dokumen, terlepas dari
kenyataan bahwa secara fisik user tidak mungkin dapat melakukannya. Oleh
karena itu, diperlukan suatu sistem temu kembali informasi (information retrieval
system) untuk membantu user menemukan dokumen yang diperlukannya.
Sistem temu-kembali informasi pada prinsipnya adalah suatu sistem yang
sederhana. Misalkan ada sebuah kumpulan dokumen dan seorang user
yangmemformulasikan sebuah pertanyaan (request atau query). Jawaban dari
pertanyaan tersebut adalah sekumpulan dokumen yang relevan dan membuang
dokumen yang tidak relevan.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

11

Sistem temu-kembali informasi pada dasarnya dibagi dalam dua
komponen utama yaitu sistem pengindeksan (indexing) yang menghasilkan basis
data sistem dan temu-kembali yang merupakan gabungan dari user interface dan
look-uptable. Pada bagian selanjutnya akan dijelaskan berbagai macam sistem
pengindeksan

dan

teknik-teknik

temu-kembali

informasi

yang

telah

dikembangkan.
Hiperteks dan temu-kembali informasi merupakan bidang penelitian yang
berbeda satu dengan yang lain. Hiperteks berkisar pada masalah userdisorientation, strategi pengembangan dokumen hiperteks, dan mekanisme
konversi dokumen tekstual menjadi bentuk hiperteks (Ellist,1996). Sedangkan
temu-kembali informasi bergerak pada topik manipulasi kueri, konsep basis data
tekstual, dan relevansi dokumen terhadap kueri (Bodhitama,1997). Penggabungan
kedua bidang ini dapat memecahkan masalah-masalah dalam bidang temu
kembali informasi. Misalnya, sistem temu-kembali informasi yang didasarkan
pada penggunaan operator Boolean, mengandalkan kemampuan pemakai dalam
memformulasikan kueri. Hal ini sering mempersulit pengguna. Dengan adanya
sistem hiperteks, hal ini dapat di permudah dengan penyediaan antar muka yang
memakai pencarian dengan metode browsing.
Smeaton(1991) di dalam Ellist(1996) juga menyatakan bahwa hiperteks
dan temu-kembali informasi itu saling berkomplemen satu sama lain. Hiperteks
membutuhkan lebih banyak searching sedangkan temu-kembali informasi
membutuhkan lebih banyak browsing. Hal yang dimaksud adalah hiperteks akan
semakin baik jika disertai dengan fasilitas search, dan temu-kembali informasi
membutuhkan browsing dalam melakukan pencarian yang efisien. Adapun

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

12

maksud dari searching adalah berusaha mendapatkan atau mencapai tujuan
spesifik sedangkan browsing adalah mengikuti suatu path sampai mencapai suatu
tujuan. Menurut Brown(1988) didalam Agosti(1993), browsing itu bisa
diibaratkan dengan From Where to What. Maksudnya adalah kita tahu dimana
posisi kita dalam database dan kita ingin tahu apa yang ada disana (database).
Searching bisa diibaratkan dengan From What to Where. Maksudnya adalah kita
tahu apa yang kita inginkan dan kita ingin menemukan dimana dia didalam
database.
Penggabungan sistem temu-kembali lebih dikenal dengan nama search
engine, Sistem ini dapat dibagi kedalam dua kategori berdasarkan sumber
informasinya yaitu:
1. Worldwide Search Engine
Worldwide Search Engine adalah suatu sistem temu-kembali informasi
yang mengambil data-data dari berbagai server di seluruh penjuru dunia. Datadata tersebut diambil melalui program yang disebut dengan “robot” atau “bot”.
Program inilah yang melakukan pencarian data pada setiap server, yang kemudian
dikirim ke server pusat pada selang waktu tertentu.
2. Local Search Engine
Local search engine adalah suatu sistem temu-kembali informasi yang
mengambil data-data dari server tertentu saja. Kata “local”, yang berarti lokal atau
setempat, memberi penekanan akan lokasi sumber data yang akan digunakan.
Local search engine tidak dirancang untuk mengarungi belantara internet seperti
worlwide search engine. Tujuan implementasi local search engine dimaksudkan

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

13

untuk pencarian pada objek spesifik dan lebih kecil lingkupnya dibandingkan
internet sendiri.
Mengenai pemilihan penerapan sistem temu-kembali berbentuk local
search engine atau worlwide search engine tergantung kepada masalah atau jenis
informasi yang akan kita sediakan. Penerapan kedua kategori ini hanya akan
mempengaruhi cara sistem pengindeksan dari temu-kembali. Sedangkan teknik
retrieval dan rancangan penerapan teknik pada hiperteks akan sama saja, baik
pengindeksannya secara local search engine ataupun worldwide search engine.
Sistem temu-kembali yang dibangun terdiri dari berbagai macam teknik
retrieval seperti teknik Boolean biasa dan Boolean berperingkat serta teknik
Extended

Boolean

berdasarkan

p-norm

model.

Sedangkan

teknik

pengindeksannya juga terdiri dari beberapa macam antara lain teknik berdasarkan
frekuensi kemunculan istilah dan teknik pengindeksan yang dinormalisasi
berdasarkan aturan Savoy(1993). Pada sistem ini, teknik retrieval, basis data
indeks dan kumpulan dokumen berada dalam sebuah komputer server yang sama
(local).

2.3.

Text Mining
Text mining adalah salah satu bidang khusus dari data mining. Sesuai

dengan buku The Text Mining Handbook, text mining dapat didefinisikan sebagai
suatu proses menggali informasi dimana seorang user berinteraksi dengan
sekumpulan dokumen menggunakan tools analisis yang merupakan komponenkomponen dalam data mining yang salah satunya adalah kategorisasi.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

14

Tujuan dari text mining adalah untuk mendapatkan informasi yang
berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan pada text
mining adalah kumpulan teks yang memiliki format yang tidak terstruktur atau
minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu
pengkategorisasian teks (text categorization) dan pengelompokan teks (text
clustering). Text Mining tidak jauh berbeda dengan Data Mining. Yang
membedakannya adalah pada sumber datanya, dimana Text Mining bersumber
dari kumpulan dokumen atau text. Pada Text Mining, informasi yang akan digali
biasanya berisi informasi-informasi yang tidak terstruktur, tujuannya adalah
mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat
dilakukan analisa keterhubungan antardokumen. Tahapan yang dilakukan secara
umum dalam Text Mining adalah: tokenizing, filtering, stemming, tagging dan
analyzing.

2.4.

Proses Pengklasifikasian
Classification adalah proses untuk menemukan model atau kelas data,

dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya
tidak diketahui. Model itu sendiri bisa berupa aturan jika-maka berbentuk pohon
pengambilan keputusan (Decision Tree), formula matematis seperti Bayesian dan
Support Vector Machine atau bisa juga berupa jaringan seperti neural network.
Ada lima ukuran yang dapat digunakan untuk mengevaluasi setiap
metode :
1. Predictive accuracy yang mengukur tingkat akurasi dalam mengklasifikasikan
data baru. Ukuran ini paling sering digunakan sebagai pembanding.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

15

2. Kecepatan. Biaya komputasi untuk menghasilkan classifier dan saat
menggunakan classifier pada proses klasifikasi.
3. Robustness. Kemampuan menangani noise dan nilai hilang.
4. Scalability. Kemampuan menangani data dalam jumlah besar.
5. Interpretability. Mengukur sejauh mana model dapat diinterpretasi.
Pada skripsi kali ini, hanya predictive accuracy yang akan digunakan
untuk pengklasifikasian artikel teks berdasarkan judulnya.

2.5.

Tata Bahasa Bahasa Indonesia
Bahasa Indonesia, sebuah kata dikatakan memiliki morfologi yang dapat

membuat kata tersebut berperan sebagai kata benda, kata keterangan atau kata
kerja.
Ada banyak ragam pembentukan kata dalam Bahasa Indonesia. Sebagian
besar kata dibentuk dengan cara menggabungkan beberapa komponen yang
berbeda. Untuk memahami cara pembentukan kata-kata tersebut kita sebaiknya
mengetahui lebih dahulu beberapa konsep dasar dan istilah seperti yang dijelaskan
berikut ini :
Kata dasar (akar kata), yaitu kata yang paling sederhana yang belum
memiliki imbuhan, juga dapat dikelompokkan sebagai bentuk asal (tunggal) dan
bentuk dasar (kompleks), tetapi perbedaan kedua bentuk ini tidak dibahas di sini.
Afiks (imbuhan), yaitu satuan terikat (seperangkat huruf tertentu) yang
apabila ditambahkan pada kata dasar akan mengubah makna dan membentuk kata
baru. Afiks tidak dapat berdiri sendiri dan harus melekat pada satuan lain seperti
kata dasar. Istilah afiks termasuk prefiks, sufiks dan konfiks.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

16

Prefiks (awalan), yaitu afiks (imbuhan) yang melekat di depan kata dasar
untuk membentuk kata baru dengan arti yang berbeda. Sufiks (akhiran), yaitu
afiks (imbuhan) yang melekat di belakang kata dasar untuk membentuk kata baru
dengan arti yang berbeda. Konfiks (sirkumfiks atau simulfiks) yang secara
simultan (bersamaan), yaitu satu afiks melekat di depan kata dasar dan satu afiks
melekat di belakang kata dasar yang bersama-sama mendukung satu fungsi. Kata
turunan (kata jadian), yaitu kata baru yang diturunkan dari kata dasar yang
mendapat imbuhan.
Keluarga kata dasar, yaitu kelompok kata turunan yang semuanya
berasal dari satu kata dasar dan memiliki afiks yang berbeda. Imbuhan adalah
suatu unsur struktural yang diikatkan pada sebuah kata dasar. Imbuhan terbagi
atas : Awalan (Prefiks), Sisipan (Infiks), Akhiran (Sufiks), Imbuhan Terbelah
(Konfiks).
Imbuhan yang terdapat di awal suatu kata, seperti : “me-, ber-, per-,
meng-, di-, ter-, ke- dan se-“. Untuk awalan me- mempunyai aturan khusus, yaitu:
1. tetap, jika huruf pertama kata dasar adalah l, m, n, q, r, atau w.
Contoh: me- + luluh → meluluh, me- + makan → memakan.
2. me- → mem-, jika huruf pertama kata dasar adalah b, f, p*, atau v.
Contoh: me- + baca → membaca, me- + pukul → memukul*, me- + vonis →
memvonis, me- + fasilitas + i → memfasilitasi.
3. me- → men-, jika huruf pertama kata dasar adalah c, d, j, atau t*.
Contoh : me- + datang → mendatang, me- + tiup → meniup*.
4. me- → meng-, jika huruf pertama kata dasar adalah huruf vokal, k*, g, h.
Contoh: me- + kikis → mengikis*, me- + gotong → menggotong, me- +

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

17

hias → menghias.
5. me- → menge-, jika kata dasar hanya satu suku kata.
Contoh: me- + bom → mengebom, me- + tik → mengetik, me- + klik →
mengeklik.
6. me- → meny-, jika huruf pertama adalah s*.
Contoh: me- + sapu → menyapu*.
Huruf dengan tanda * memiliki sifat-sifat khusus :
1. Dilebur jika huruf kedua kata dasar adalah huruf vokal.
Contoh : me- + tipu → menipu, me- + sapu → menyapu, me- + kira →
mengira.
2. Tidak dilebur jika huruf kedua kata dasar adalah huruf konsonan.
Contoh : me- + klarifikasi → mengklarifikasi.
3. Tidak dilebur jika kata dasar merupakan kata asing yang belum diserap secara
sempurna.
Contoh: me- + konversi → mengkonversi.
Bahasa Indonesia, terdapat empat sisipan (infiks), yaitu : -el-, -em-, -erdan –in-. Sedangkan imbuhan di akhir kata (sufiks) terdapat delapan, yaitu : -i, kan, -an, -man, -wan , -wati, -wi (-wiah) dan –nya. Selain itu juga terdapat sufiks
yang berasal dari bahasa asing yaitu: -wan, -wati, -in, -at, - isme, -(is)asi, -logi
dan –tas. Juga terdapat akhiran lain yang disebut partikel (P), yaitu: lah, kah, tah,
pun. Sufiks juga dapat diberikan untuk menggantikan kata ganti kepunyaan (KK),
misalnya: -ku, -mu, dan –nya.
Dalam

perkembangannya,

morfologi

bahasa

penambahan :

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

Indonesia

terdapat

18

1. Konfiks (imbuhan terbelah), yaitu gabungan dari infiks dan sufiks tetapi
menjadi satu kesatuan yang tidak dapat dipisahkan. Konfiks ini harus
mengapit kata dasar. Terdapat beberapa konfiks yaitu: ke - an, ber - an, peng an, per - an, se - nya.
2. Simulfiks (imbuhan gabungan), yaitu gabungan lebih dari satu awalan atau
akhiran, contoh: member – kan untuk memberlakukan dan memberdayakan.
Metode stemming pada tugas akhir ini mengacu yang dibuat oleh Nazief
dan Adriani yang berbasiskan pada morfologi bahasa Indonesia dengan definisi
sebagai berikut :
kata = stem | kata berimbuhan infleksional | kata berimbuhan derivasional | tidak
dikenal kata berimbuhan infleksional = stem Sinf | kata berimbuhan derivasional
| tidak dikenal
kata berimbuhan derivasional = stem-Sdr | Pder-stem | Pder- kata berimbuhan
derivasional | tidak dikenal
dimana :
Sder = Suffix atau akhiran derivasional
Sinf = Suffix atau akhiran infleksional
Pder = Prefix atau awalan derivasional
Setiap Sder, Sinf, Pder memiliki aturan sendiri. Metode ini menggunakan
kamus untuk menentukan hasil stem. Kata yang hendak di-stem awalnya dicari
dalam kamus, apabila tidak ditemukan maka selanjutnya kata tersebut diduga
memiliki imbuhan infleksional. Untuk mendapatkan imbuhan infleksional
digunakan struktur morfologi kedua. Dalam prosesnya struktur morfologi ketiga
akan digunakan karena kata ini diduga terdiri dari imbuhan derivasional dan Sinf.

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

19

Apabila kata dasar masih juga belum ditemukan maka kata ini selanjutnya diduga
memiliki imbuhan derivasional. Untuk mencari kata dasar dari kata dengan
imbuhan derivasional digunakan struktur aturan morfologi ketiga. Apabila kata
dasar belum juga ditemukan, maka kata yang hendak di-stem yang akan
dikembalikan.

2.6.

Stemming
Stemming adalah proses penghilangan prefiks dan sufiks dari kueri dan

istilah-istilah dokumen (Grossman, 2002). Stemming dilakukan atas dasar asumsi
bahwa kata-kata yang memiliki stem yang sama memiliki makna yang serupa
sehingga pengguna tidak keberatan untuk memperoleh dokumen-dokumen yang
di dalamnya terdapat kata-kata dengan stem yang sama dengan kuerinya.
Teknik-teknik stemming dapat dikategorikan menjadi:
1. Berdasarkan aturan sesuai bahasa tertentu
2. Berdasarkan kamus
3. Berdasarkan kemunculan bersama.
Proses ini memiliki dua tujuan. Dalam hal efisiensi, stemming
mengurangi jumlah kata-kata unik dalam indeks sehingga mengurangi kebutuhan
ruang penyimpanan untuk indeks dan mempercepat proses pencarian. Dalam hal
keefektifan, stemming meningkatkan recall dengan mengurangi bentuk-bentuk
kata ke bentuk dasarnya atau stem-nya. Sehingga dokumen-dokumen yang
menyertakan suatu kata dalam berbagai bentuknya memiliki kecenderungan yang
sama untuk ditemukembalikan. Hal tersebut tidak akan diperoleh jika tiap bentuk
suatu kata disimpan secara terpisah dalam indeks. Akan tetapi, stemming dapat

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

20

menurunkan tingkat precision jika setiap bentuk suatu stem diperoleh, sedangkan
yang relevan hanyalah bentuk yang sama dengan yang digunakan dalam kueri
(Liddy, 2001).
Parsing dan stemming dalam suatu IRS tergantung pada bahasa yang
digunakan dalam dokumen yang akan dicari. IRS untuk Bahasa Inggris kurang
optimal untuk menangani dokumen dalam Bahasa Indonesia. Bahasa Indonesia
memiliki daftar kata buang (stoplist) serta sistem pembentukan kata yang sangat
berbeda dengan bahasa Inggris, sehingga diperlukan IRS yang khusus untuk
Porter Stemmer Bahasa Indonesia
Stemming untuk Bahasa Indonesia telah dikembangkan antara lain yang
menggunakan aturan berdasarkan algoritme Porter (1980) oleh Akhmadi (2002)
yang hanya melakukan pemotongan prefiks dan oleh Ridha (2002) yang
melakukan pemotongan prefiks dan sufiks. Stemming berdasarkan kamus untuk
Bahasa Indonesia juga telah dikembangkan oleh Nazief (1996) (Nazief, 2000).
Stemming adalah proses penghilangan atau pemotongan imbuhan yang
terdapat pada sebuah kata yang mempunyai imbuhan menjadi bentuk kata
dasarnya saja, untuk Bahasa Indonesia imbuhan mempunyai peran penting dalam
suatu kalimat, karena suatu kata dapat mempunyai arti yang berbeda apabila
diberi suatu imbuhan. Yang mengakibatkan setiap kata berimbuhan mempunyai
arti yang berbeda dan pembentukan kata baru. Contohnya : kata “diadaptasikan”
atau “beradaptasi” menjadi bentuk kata dasar “adaptasi” sebagai istilah. Algoritma
ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari
algoritma ini adalah sebuah kata yang kemudian dilakukan, pemeriksaan semua

Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

21

kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 Awalan (Prefiks)
dan 3 Akhiran (Sufiks). Sehingga bentuknya menjadi :
Prefiks 1 + Pr efiks 2 + Kata Dasar + Akhiran 1 + Akhiran 2 + Akhiran 3.
Implementasi Porter Stemmer for Bahasa Indonesia berdasarkan English Porter
Stemmer yang dikembangkan oleh W.B. Frakes pada tahun 1992. Karena bahasa
Inggris datang dari kelas yang berbeda, beberapa modifikasi telah dilakukan untuk
membuat Algoritma Porter dapat digunakan sesuai dengan bahasa Indonesia.
Desain dari Porter Stemmer for Bahasa Indonesia dapat dilihat pada gambar 2.2
dibawah ini :

Gambar 2.2. Desain dari Porter Stemmer for Bahasa Indonesia

2.7.

Flow Map
Flow Map adalah diagram yang menunjukan aliran data berupa

formulir-formulir ataupun keterangan berupa dokumentasi yang mengalir atau
beredar dalam suatu sistem. Notasi yang digunakan dalam suatu flow map
Hak Cipta © milik UPN "Veteran" Jatim :
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa mencantumkan dan menyebutkan sumber.

22

merupakan

penggabungan notasi flow chart program. Hal-hal

yang

harus

diperhatikan dalam menggambarkan flow map adalah sebagai berikut:
1. Penggambaran flow map dimulai dari atas halaman ke bagian bawah,
kemudian dari kiri kebagian kanan
2. Penggambaran flow map dilakukan berdasarkan pembagian atau sub
sistem
3. Dalam flow map harus jelas dimana awal suatu status informasi,
kemudian dimana akhir silkus
4. Semua bagian siklus informasi harus jelas Menggunakan kertas kerja
yang jelas sesuai dengan yang akan dilakukan dalam sistem
5. Semua sub sistem yang digambarkan, harus mengalami siklus informasi
6. Jika