Pencarian Kata dan Sinonim Kata Dalam Dokumen Dengan Menggunakan Algoritma Two Sliding Windows
PENCARIAN KATA DAN SINONIM KATA DALAM DOKUMEN
DENGAN MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS
SKRIPSI
FRANS OCTAVIANUS
091402089
PROGRAM STUDI S1 TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
Universitas Sumatera Utara
PENCARIAN KATA DAN SINONIM KATA DALAM DOKUMEN
DENGAN MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Sarjana Teknologi Informasi
FRANS OCTAVIANUS
091402089
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
Universitas Sumatera Utara
PERSETUJUAN
Judul
: PENCARIAN
KATA
DAN
SINONIM
KATA
DALAM DOKUMEN DENGAN MENGGUNAKAN
ALGORITMA TWO SLIDING WINDOWS
Kategori
: SKRIPSI
Nama
: FRANS OCTAVIANUS
Nomor Induk Mahasiswa
: 091402089
Program Studi
: SARJANA (S1) TEKNOLOGI INFORMASI
Departemen
: TEKNOLOGI INFORMASI
Fakultas
: ILMU
KOMPUTER
DAN
TEKNOLOGI
INFORMASI
Diluluskan di
Medan, 22 Oktober 2015
Komisi Pembimbing
:
Pembimbing 2
Pembimbing 1
Dedy Arisandi, ST.M.Kom
Dr. Erna Budhiarti Nababan, M.IT
NIP. 19790831 200912 1 002
NIP. -
Diketahui/ Disetujui Oleh
Program Studi Teknologi Informasi
Ketua,
Muhammad Anggia Muchtar, ST.,MM.IT
NIP. 19800110 200801 1 010
Universitas Sumatera Utara
PERNYATAAN
PENCARIAN KATA DAN SINONIM KATA DALAM DOKUMEN DENGAN
MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 22 Oktober 2015
FRANS OCTAVIANUS
091402089
Universitas Sumatera Utara
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa dan Maha
Penyayang, dengan segala rahmat dan karuniaNya penulisan tugas akhir ini berhasil
diselesaikan dalam waktu yang telah ditetapkan. Selama penyelesaian tugas akhir ini,
banyak bantuan dan kerja sama serta doa dan dukungan dari berbagai pihak, oleh karena
itu penulis sampaikan ucapan terima kasih sedalam - dalamnya dan penghargaan kepada
:
1. Kedua orang tua dan sanak saudara penulis yang telah memberikan dukungan dan
motivasi baik materil dan spiritual selama penulis mengikuti pendidikan hingga
selesainya tugas akhir ini.
2. Ibu Dr. Erna Budhiarti Nababan, M.IT dan Bapak Dedy Arisandi, S.T., M.Kom
selaku pembimbing yang telah banyak meluangkan waktu dan pikiran beliau,
memotivasi, memberikan arahan, kritik dan saran kepada penulis.
3. Bapak Romi Fadillah Rahmat, B.Comp.Sc, M.Sc dan Ibu Amalia, ST.,M.T yang
telah bersedia menjadi dosen pembanding yang telah memberikan kritik dan saran
kepada penulis.
4. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak M. Anggia
Muchtar, ST.,MM.IT dan Bapak M. Fadly Syahputra, B.Sc.,M.Sc.IT. Dekan dan
Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas
Sumatera Utara, semua dosen di Fakultas Ilmu Komputer dan Teknologi
Informasi.
5. Kepada Bang Manap, Kakak Umi, dan Ibu Mega dan semua staff dan pegawai di
Fakultas Ilmu Komputer dan Teknologi Informasi yang tidak dapat saya sebutkan
satu-persatu.
6. Kepada sahabat seperjuangan dan rekan – rekan mahasiswa Program Studi
Teknologi Informasi USU yang telah memberikan dukungan dan semangat untuk
saya.
Semoga segala kebaikan dan bantuannya dibalas oleh Tuhan Yang Maha Esa
dan semoga tugas akhir ini dapat bermanfaat bagi semua pihak yang memerlukannya.
Universitas Sumatera Utara
i
ABSTRAK
Saat ini informasi mudah didapatkan terutama informasi yang tersimpan di dalam
dokumen. Di dalam dokumen terutama artikel sering dijumpai kata-kata yang masih
jarang digunakan seperti beranda, telaga, bilik, misai, dan jeram. Kata-kata tersebut
mengandung persamaan kata dengan kata-kata umum yang sudah sering digunakan
dalam pembicaraan sehari-hari. Akan tetapi, kata kunci pencarian yang umumnya dicari
oleh user, dominan berupa kata-kata umum yang sering dijumpai. Oleh karena itu,
diperlukan suatu metode untuk mempermudah pengguna dalam mencari informasi yang
berhubungan dengan kata dan sinonim kata pada dokumen. Peneliti menggunakan
metode stemming yaitu Porter Stemming yang digunakan untuk mengolah kata-kata
berimbuhan menjadi kata dasar. Selanjutnya diproses lebih lanjut untuk dicari
kecocokan persamaan makna kata yang sesuai. Kata dan sinonim kata yang telah
diproses akan dicari menggunakan algoritma Two Sliding Windows sebagai metode
pencarian teks pada dokumen. Pencarian menjadi lebih cepat karena TSW melakukan
pengecekan dengan menggunakan dua sisi (windows) yaitu sisi kiri dan kanan secara
paralel. Hasil pengujian menunjukkan metode yang dipakai bisa menyelesaikan
permasalahan mencari sinonim kata baik kata dasar maupun kata majemuk. Tingkat
keakuratan tidak mencapai 100% karena adanya perbedaan kata imbuhan baik serapan
maupun sisipan yang menimbulkan makna berbeda.
Kata kunci : Sinonim kata, Pencocokan pola, Two Sliding Windows (TSW), Porter
Stemming.
Universitas Sumatera Utara
ii
Words and Synonym Searching in Documents using Two Sliding Windows
Algorithm
ABSTRACT
Nowadays information is obtained easily, especially information stored in the
document. In the document, especially the article often found words that are rarely used
such as porches, pond, walk, whiskers, and rafting. These words contain a synonym
with common words that have been frequently used in everyday conversation. However,
the search keywords are generally searched by the user, the form of common words that
are often encountered. Therefore, a method is needed in order to facilitate the user while
searching the information in the document. the application uses stemming method
namely Porter Stemming used to process from much affix words into root words. Then
processed further to look for the meaning of the equation match several appropriate
word. Word and synonym that has been processed will be searched by Two Sliding
Windows algorithm as a method of text searching in the document. Search becomes
faster because TSW check by using double-sided (windows) that the left and right being
searched in parallel. The test results showed that the method can be used to solve the
problems of searching for a synonym both basic words and compound words. The
accuracy does not reach 100% because of different affixes; “serapan” as well as
“sisipan” which giving several different meanings.
Keyword : Synonym, Pattern Matching, Two Sliding Windows (TSW), Porter
Stemming.
Universitas Sumatera Utara
iii
DAFTAR ISI
ABSTRAK
i
ABSTRACT
ii
DAFTAR ISI
iii
DAFTAR TABEL
iv
DAFTAR GAMBAR
v
BAB 1 PENDAHULUAN
1
1.1 Latar Belakang
1
1.2 Rumusan Masalah
1
1.4 Tujuan Penelitian
2
1.3 Batasan Masalah
2
1.5 Manfaat Penelitian
2
1.6 Metodologi Penelitian
3
1.7 Sistematika Penulisan
3
BAB 2 LANDASAN TEORI
6
2.1 Sinonim Kata
6
2.2 Stemming
8
2.3 Stopword
13
2.4 Pattern Matching
14
2.5 Penelitian Terdahulu
16
BAB 3 ANALISIS DAN PERANCANGAN SISTEM
17
3.1 Data Yang Digunakan
17
3.2 Arsitektur Umum
17
3.3 Analisis Data
18
3.4 Rancangan Antar Muka
33
BAB 4 IMPLEMENTASI DAN PENGUJIAN
37
4.1 Implementasi Sistem
37
4.2 Tahapan Operasi Aplikasi
40
4.3 Pengujian Sistem
44
Universitas Sumatera Utara
iv
BAB 5 KESIMPULAN DAN SARAN
49
5.1 Kesimpulan
49
5.2 Saran
50
DAFTAR PUSTAKA
51
Universitas Sumatera Utara
v
DAFTAR TABEL
Hal.
Tabel 2.1 Aturan untuk Infection Particle
11
Tabel 2.2 Aturan untuk Possesive Pronoun
12
Tabel 2.3 Aturan untuk First Order Derivational Prefix
12
Tabel 2.4 Aturan untuk Second Order Derivational Prefix
13
Tabel 2.5 Aturan untuk Derivation Suffix
13
Tabel 2.6 Penelitian Terdahulu
18
Tabel 4.1 Pengujian terhadap variasi jumlah kata pada kalimat baku
44
Tabel 4.2 Hasil pencocokan dengan kata kunci
45
“pelaku,pasar,jibaku,reda,polemic,krisis,ekonomi”
Tabel 4.3 Hasil pencocokan dengan sinonim kata kunci
47
“aktor,nekat,surut,reda,perdebatan,berhenti,darurat,krisis”
Universitas Sumatera Utara
vi
DAFTAR GAMBAR
Hal.
Gambar 2.1 Desain Porter Stemmer
10
Gambar 2.2 Bad character shift a dan b (nextl)
15
Gambar 2.3 Bad character shift a dan b (nextr)
15
Gambar 3.1 Arsitektur Umum Sistem
18
Gambar 3.2 Proses Stopwords
19
Gambar 3.3 Algoritma Porter dalam proses stemming
21
Gambar 3.4 Proses Pencarian Teks
24
Gambar 3.5 Ilustrasi posisi penentuan letak pada bagian kiri teks
25
Gambar 3.6 Aturan Operasi Hitung Nilai shift kiri
26
Gambar 3.7 Ilustrasi posisi penentuan letak pada bagian kanan teks
27
Gambar 3.8 Aturan Operasi Hitung Nilai shift kanan
28
Gambar 3.9 Pre-processing bad character shift algoritma Berry-Ravindran
29
Gambar 3.10 Algoritma Two Sliding Windows (TSW)
33
Gambar 3.11 Perancangan Sistem
34
Gambar 4.1 Tampilan halaman input
38
Gambar 4.2 Tampilan database file
39
Gambar 4.3 Tampilan halaman kamus kata
39
Gambar 4.4 Tampilan saat menuliskan kata-kata pada textbox
40
Gambar 4.5 Tampilan hasil pencarian sinonim kata pada dokumen
41
Gambar 4.6 Tampilan saat memilih berkas
42
Gambar 4.7 Tampilan hasil penyimpanan berkas
43
Gambar 4.8 Tampilan saat menambah kata dan sinonim kata
43
Gambar 4.9 Hasil pengujian dengan kata kunci “para pelaku pasar berjibaku
45
redakan polemik krisis ekonomi”
Universitas Sumatera Utara
DENGAN MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS
SKRIPSI
FRANS OCTAVIANUS
091402089
PROGRAM STUDI S1 TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
Universitas Sumatera Utara
PENCARIAN KATA DAN SINONIM KATA DALAM DOKUMEN
DENGAN MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah
Sarjana Teknologi Informasi
FRANS OCTAVIANUS
091402089
PROGRAM STUDI TEKNOLOGI INFORMASI
FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI
UNIVERSITAS SUMATERA UTARA
MEDAN
2015
Universitas Sumatera Utara
PERSETUJUAN
Judul
: PENCARIAN
KATA
DAN
SINONIM
KATA
DALAM DOKUMEN DENGAN MENGGUNAKAN
ALGORITMA TWO SLIDING WINDOWS
Kategori
: SKRIPSI
Nama
: FRANS OCTAVIANUS
Nomor Induk Mahasiswa
: 091402089
Program Studi
: SARJANA (S1) TEKNOLOGI INFORMASI
Departemen
: TEKNOLOGI INFORMASI
Fakultas
: ILMU
KOMPUTER
DAN
TEKNOLOGI
INFORMASI
Diluluskan di
Medan, 22 Oktober 2015
Komisi Pembimbing
:
Pembimbing 2
Pembimbing 1
Dedy Arisandi, ST.M.Kom
Dr. Erna Budhiarti Nababan, M.IT
NIP. 19790831 200912 1 002
NIP. -
Diketahui/ Disetujui Oleh
Program Studi Teknologi Informasi
Ketua,
Muhammad Anggia Muchtar, ST.,MM.IT
NIP. 19800110 200801 1 010
Universitas Sumatera Utara
PERNYATAAN
PENCARIAN KATA DAN SINONIM KATA DALAM DOKUMEN DENGAN
MENGGUNAKAN ALGORITMA TWO SLIDING WINDOWS
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Medan, 22 Oktober 2015
FRANS OCTAVIANUS
091402089
Universitas Sumatera Utara
PENGHARGAAN
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa dan Maha
Penyayang, dengan segala rahmat dan karuniaNya penulisan tugas akhir ini berhasil
diselesaikan dalam waktu yang telah ditetapkan. Selama penyelesaian tugas akhir ini,
banyak bantuan dan kerja sama serta doa dan dukungan dari berbagai pihak, oleh karena
itu penulis sampaikan ucapan terima kasih sedalam - dalamnya dan penghargaan kepada
:
1. Kedua orang tua dan sanak saudara penulis yang telah memberikan dukungan dan
motivasi baik materil dan spiritual selama penulis mengikuti pendidikan hingga
selesainya tugas akhir ini.
2. Ibu Dr. Erna Budhiarti Nababan, M.IT dan Bapak Dedy Arisandi, S.T., M.Kom
selaku pembimbing yang telah banyak meluangkan waktu dan pikiran beliau,
memotivasi, memberikan arahan, kritik dan saran kepada penulis.
3. Bapak Romi Fadillah Rahmat, B.Comp.Sc, M.Sc dan Ibu Amalia, ST.,M.T yang
telah bersedia menjadi dosen pembanding yang telah memberikan kritik dan saran
kepada penulis.
4. Ketua dan Sekretaris Program Studi Teknologi Informasi, Bapak M. Anggia
Muchtar, ST.,MM.IT dan Bapak M. Fadly Syahputra, B.Sc.,M.Sc.IT. Dekan dan
Pembantu Dekan Fakultas Ilmu Komputer dan Teknologi Informasi Universitas
Sumatera Utara, semua dosen di Fakultas Ilmu Komputer dan Teknologi
Informasi.
5. Kepada Bang Manap, Kakak Umi, dan Ibu Mega dan semua staff dan pegawai di
Fakultas Ilmu Komputer dan Teknologi Informasi yang tidak dapat saya sebutkan
satu-persatu.
6. Kepada sahabat seperjuangan dan rekan – rekan mahasiswa Program Studi
Teknologi Informasi USU yang telah memberikan dukungan dan semangat untuk
saya.
Semoga segala kebaikan dan bantuannya dibalas oleh Tuhan Yang Maha Esa
dan semoga tugas akhir ini dapat bermanfaat bagi semua pihak yang memerlukannya.
Universitas Sumatera Utara
i
ABSTRAK
Saat ini informasi mudah didapatkan terutama informasi yang tersimpan di dalam
dokumen. Di dalam dokumen terutama artikel sering dijumpai kata-kata yang masih
jarang digunakan seperti beranda, telaga, bilik, misai, dan jeram. Kata-kata tersebut
mengandung persamaan kata dengan kata-kata umum yang sudah sering digunakan
dalam pembicaraan sehari-hari. Akan tetapi, kata kunci pencarian yang umumnya dicari
oleh user, dominan berupa kata-kata umum yang sering dijumpai. Oleh karena itu,
diperlukan suatu metode untuk mempermudah pengguna dalam mencari informasi yang
berhubungan dengan kata dan sinonim kata pada dokumen. Peneliti menggunakan
metode stemming yaitu Porter Stemming yang digunakan untuk mengolah kata-kata
berimbuhan menjadi kata dasar. Selanjutnya diproses lebih lanjut untuk dicari
kecocokan persamaan makna kata yang sesuai. Kata dan sinonim kata yang telah
diproses akan dicari menggunakan algoritma Two Sliding Windows sebagai metode
pencarian teks pada dokumen. Pencarian menjadi lebih cepat karena TSW melakukan
pengecekan dengan menggunakan dua sisi (windows) yaitu sisi kiri dan kanan secara
paralel. Hasil pengujian menunjukkan metode yang dipakai bisa menyelesaikan
permasalahan mencari sinonim kata baik kata dasar maupun kata majemuk. Tingkat
keakuratan tidak mencapai 100% karena adanya perbedaan kata imbuhan baik serapan
maupun sisipan yang menimbulkan makna berbeda.
Kata kunci : Sinonim kata, Pencocokan pola, Two Sliding Windows (TSW), Porter
Stemming.
Universitas Sumatera Utara
ii
Words and Synonym Searching in Documents using Two Sliding Windows
Algorithm
ABSTRACT
Nowadays information is obtained easily, especially information stored in the
document. In the document, especially the article often found words that are rarely used
such as porches, pond, walk, whiskers, and rafting. These words contain a synonym
with common words that have been frequently used in everyday conversation. However,
the search keywords are generally searched by the user, the form of common words that
are often encountered. Therefore, a method is needed in order to facilitate the user while
searching the information in the document. the application uses stemming method
namely Porter Stemming used to process from much affix words into root words. Then
processed further to look for the meaning of the equation match several appropriate
word. Word and synonym that has been processed will be searched by Two Sliding
Windows algorithm as a method of text searching in the document. Search becomes
faster because TSW check by using double-sided (windows) that the left and right being
searched in parallel. The test results showed that the method can be used to solve the
problems of searching for a synonym both basic words and compound words. The
accuracy does not reach 100% because of different affixes; “serapan” as well as
“sisipan” which giving several different meanings.
Keyword : Synonym, Pattern Matching, Two Sliding Windows (TSW), Porter
Stemming.
Universitas Sumatera Utara
iii
DAFTAR ISI
ABSTRAK
i
ABSTRACT
ii
DAFTAR ISI
iii
DAFTAR TABEL
iv
DAFTAR GAMBAR
v
BAB 1 PENDAHULUAN
1
1.1 Latar Belakang
1
1.2 Rumusan Masalah
1
1.4 Tujuan Penelitian
2
1.3 Batasan Masalah
2
1.5 Manfaat Penelitian
2
1.6 Metodologi Penelitian
3
1.7 Sistematika Penulisan
3
BAB 2 LANDASAN TEORI
6
2.1 Sinonim Kata
6
2.2 Stemming
8
2.3 Stopword
13
2.4 Pattern Matching
14
2.5 Penelitian Terdahulu
16
BAB 3 ANALISIS DAN PERANCANGAN SISTEM
17
3.1 Data Yang Digunakan
17
3.2 Arsitektur Umum
17
3.3 Analisis Data
18
3.4 Rancangan Antar Muka
33
BAB 4 IMPLEMENTASI DAN PENGUJIAN
37
4.1 Implementasi Sistem
37
4.2 Tahapan Operasi Aplikasi
40
4.3 Pengujian Sistem
44
Universitas Sumatera Utara
iv
BAB 5 KESIMPULAN DAN SARAN
49
5.1 Kesimpulan
49
5.2 Saran
50
DAFTAR PUSTAKA
51
Universitas Sumatera Utara
v
DAFTAR TABEL
Hal.
Tabel 2.1 Aturan untuk Infection Particle
11
Tabel 2.2 Aturan untuk Possesive Pronoun
12
Tabel 2.3 Aturan untuk First Order Derivational Prefix
12
Tabel 2.4 Aturan untuk Second Order Derivational Prefix
13
Tabel 2.5 Aturan untuk Derivation Suffix
13
Tabel 2.6 Penelitian Terdahulu
18
Tabel 4.1 Pengujian terhadap variasi jumlah kata pada kalimat baku
44
Tabel 4.2 Hasil pencocokan dengan kata kunci
45
“pelaku,pasar,jibaku,reda,polemic,krisis,ekonomi”
Tabel 4.3 Hasil pencocokan dengan sinonim kata kunci
47
“aktor,nekat,surut,reda,perdebatan,berhenti,darurat,krisis”
Universitas Sumatera Utara
vi
DAFTAR GAMBAR
Hal.
Gambar 2.1 Desain Porter Stemmer
10
Gambar 2.2 Bad character shift a dan b (nextl)
15
Gambar 2.3 Bad character shift a dan b (nextr)
15
Gambar 3.1 Arsitektur Umum Sistem
18
Gambar 3.2 Proses Stopwords
19
Gambar 3.3 Algoritma Porter dalam proses stemming
21
Gambar 3.4 Proses Pencarian Teks
24
Gambar 3.5 Ilustrasi posisi penentuan letak pada bagian kiri teks
25
Gambar 3.6 Aturan Operasi Hitung Nilai shift kiri
26
Gambar 3.7 Ilustrasi posisi penentuan letak pada bagian kanan teks
27
Gambar 3.8 Aturan Operasi Hitung Nilai shift kanan
28
Gambar 3.9 Pre-processing bad character shift algoritma Berry-Ravindran
29
Gambar 3.10 Algoritma Two Sliding Windows (TSW)
33
Gambar 3.11 Perancangan Sistem
34
Gambar 4.1 Tampilan halaman input
38
Gambar 4.2 Tampilan database file
39
Gambar 4.3 Tampilan halaman kamus kata
39
Gambar 4.4 Tampilan saat menuliskan kata-kata pada textbox
40
Gambar 4.5 Tampilan hasil pencarian sinonim kata pada dokumen
41
Gambar 4.6 Tampilan saat memilih berkas
42
Gambar 4.7 Tampilan hasil penyimpanan berkas
43
Gambar 4.8 Tampilan saat menambah kata dan sinonim kata
43
Gambar 4.9 Hasil pengujian dengan kata kunci “para pelaku pasar berjibaku
45
redakan polemik krisis ekonomi”
Universitas Sumatera Utara