2.5 Penelitian terdahulu
Berbagai penelitian telah dilakukan untuk menyelesaikan pencarian kata maupun persamaannya dengan algoritma pencarian antara lain :
1. Budhi et al. 2006 menggunakan algoritma Porter Stemmer for Bahasa
Indonesia, untuk proses Stemmer pada langkah pre-processing yang merubah sebuah teks dalam bahasa Indonesia menjadi bentuk Compact Transaction.
Compact Transaction digunakan sebagai masukan untuk proses Keyword-Based Association Analysis, sebuah metode Text Mining yang dikembangkan dari
metode Market Basket Analysis, digunakan untuk membentuk rule-rule asosiasi dari data teks
.
Hasil pengujian terhadap kesalahan proses Stem kata secara otomatis cukup kecil, yaitu 2 sehingga dapat diatasi dengan cepat
menggunakan pemeriksaan kembali secara manual terhadap hasil Stemmer.
2. Hudaib et al. 2008 melakukan penelitian untuk menerapkan dan membuat
sebuah algoritma pattern matching yang cepat.Algoritma tersebut dinamakan algoritma two sliding windows. Penelitian dilakukan dengan menerapkan ide
dari algoritma Berry-Ravindran untuk menentukan nilai pergeseran dan menggunakan dua sisi window untuk melakukan scanning karakter. Hasil
pengujian menunjukkan bahwa performansi terbaik algoritma TSW apabila kata-kata tersebut berada di akhir sebuah dokumen.
3. Tahitoe Diana 2010 melakukan penelitian terhadap algoritma Enhanced
Confix Stripping Stemmer dan mendapati adanya kesalahan yang dilakukan oleh algoritma tersebut karena ECS Stemmer tidak mengajukan perbaikan terhadap
permasalahan overstemming dan understemming. Oleh karena itu, diajukan perbaikan dengan menggunakan metode corpus based stemming. Hasil
pengujian menunjukkan kesalahan stemming yang dilakukan oleh ECS Stemmer dapat diperbaiki dan penggunaan data fusion dan metode condorcet dapat
mempersingkat waktu yang dibutuhkan untuk pembentukan relevan set dalam proses efektifitas sistem temu kembali informasi.
Universitas Sumatera Utara
4. Firdausiah et al. 2008 mencari sinonim kata berdasarkan pengukuran
similaritas semantic berbasis WordNet pada sistem penilaian otomatis jawaban essay menggunakan ontologi moodle. Proses pencarian sinonim menghasilkan
beberapa output sinonim berbeda pada level yang berbeda.
5. Putra, Hedryan K.2013 menerepkan algoritma Karp Rabin dan metode
pendekatan sinonim kata untuk mendapatkan tingkat duplikasi dengan tingkat ketelitian tinggi. Akurasi yang dihasilkan cukup tinggi karena pendeteksian
dokumen diproses dengan membandingkan kata perkata yang terdapat di dalam dokumen dan membandingkan kata yang memiliki sinonim kata. Penjelasan
penelitian sebelumnya dapat dilihat pada tabel 2.6.
Tabel 2.6 Penelitian terdahulu yang berkaitan dengan pencarian sinonim kata No
Judul Penulis
Tahun Keterangan
1 Algoritma Porter
Stemming for Bahasa Indonesia untuk pre-
processing text mining berbasis metode Market
Basket Analysis
Budhi et al
2006 Pada penelitian ini, Budhi
dkk merubah data teks menjadi bentuk compact
transaction yang akan dijasikan sebagai
masukan pada metode market basket analysis
2 A Fast Pattern Matching
with Two Sliding Windows
Hudaib et al
2008 Pada penelitian ini,
Hudaib dkk menerapkan algoritma pencarian baru
menggunakan pre- processing algoritma BR
dan deteksi dari dua sisi teks
Universitas Sumatera Utara
Tabel 2.6 Penelitian terdahulu yang berkaitan dengan pencarian sinonim kata lanjutan
No Judul Penulis
Tahun Keterangan
3 Implementasi modifikasi
Enhanced Confix Stripping Stemmer
Tahitoe Diana
2010 Pada penelitian ini,
Tahitoe dan Diana menggunakan algoritma
ECS dan memperbaiki kinerja algoritma tersebut
dengan metode corpus based stemming
4 Sistem Penilaian
Otomatis Jawaban Essay menggunakan Ontologi
Moodle Firdausiah
et al 2008
Pada penelitian ini, Firdausiah dkk mengukur
kemiripan kata dengan metode pendekatan
sinonim kata untuk mendapatkan jawaban
yang serupa
Universitas Sumatera Utara
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
Bab ini membahas data yang digunakan dan mengimplementasikan algortima pattern matching pada pencarian sinonim kata dalam dokumen.
3.1 Data yang digunakan