2.5 Penelitian terdahulu
Berbagai  penelitian  telah  dilakukan  untuk  menyelesaikan  pencarian  kata  maupun persamaannya dengan algoritma pencarian antara lain :
1. Budhi  et  al.  2006  menggunakan  algoritma  Porter  Stemmer  for  Bahasa
Indonesia, untuk proses Stemmer pada langkah pre-processing  yang merubah sebuah  teks  dalam  bahasa  Indonesia  menjadi  bentuk  Compact  Transaction.
Compact Transaction digunakan sebagai masukan untuk proses Keyword-Based Association  Analysis,  sebuah  metode  Text  Mining  yang  dikembangkan  dari
metode Market Basket Analysis, digunakan untuk membentuk rule-rule asosiasi dari  data  teks
.
Hasil  pengujian  terhadap  kesalahan  proses  Stem  kata  secara otomatis  cukup  kecil,  yaitu  2  sehingga  dapat  diatasi  dengan  cepat
menggunakan pemeriksaan kembali secara manual terhadap hasil Stemmer.
2. Hudaib  et  al.  2008  melakukan  penelitian  untuk  menerapkan  dan  membuat
sebuah  algoritma  pattern  matching  yang  cepat.Algoritma  tersebut  dinamakan algoritma  two  sliding  windows.  Penelitian  dilakukan  dengan  menerapkan  ide
dari  algoritma  Berry-Ravindran  untuk  menentukan  nilai  pergeseran  dan menggunakan  dua  sisi  window  untuk  melakukan  scanning  karakter.  Hasil
pengujian  menunjukkan  bahwa  performansi  terbaik  algoritma  TSW    apabila kata-kata tersebut berada di akhir sebuah dokumen.
3. Tahitoe    Diana  2010  melakukan  penelitian  terhadap  algoritma  Enhanced
Confix Stripping Stemmer dan mendapati adanya kesalahan yang dilakukan oleh algoritma tersebut karena ECS Stemmer tidak mengajukan perbaikan terhadap
permasalahan  overstemming  dan  understemming.  Oleh  karena  itu,  diajukan perbaikan  dengan  menggunakan  metode  corpus  based  stemming.  Hasil
pengujian menunjukkan kesalahan stemming yang dilakukan oleh ECS Stemmer dapat  diperbaiki  dan  penggunaan  data  fusion  dan  metode  condorcet  dapat
mempersingkat waktu yang dibutuhkan untuk pembentukan relevan set dalam proses efektifitas sistem temu kembali informasi.
Universitas Sumatera Utara
4. Firdausiah  et  al.  2008  mencari  sinonim  kata  berdasarkan  pengukuran
similaritas semantic berbasis WordNet pada sistem penilaian otomatis jawaban essay menggunakan ontologi moodle. Proses pencarian sinonim menghasilkan
beberapa output sinonim berbeda pada level yang berbeda.
5. Putra,  Hedryan  K.2013  menerepkan  algoritma  Karp  Rabin  dan  metode
pendekatan sinonim kata untuk mendapatkan tingkat duplikasi dengan tingkat ketelitian  tinggi.  Akurasi  yang  dihasilkan  cukup  tinggi  karena  pendeteksian
dokumen diproses dengan membandingkan kata perkata yang terdapat di dalam dokumen  dan  membandingkan  kata  yang  memiliki  sinonim  kata.  Penjelasan
penelitian sebelumnya dapat dilihat pada tabel 2.6.
Tabel 2.6 Penelitian terdahulu yang berkaitan dengan pencarian sinonim kata No
Judul Penulis
Tahun Keterangan
1 Algoritma Porter
Stemming for Bahasa Indonesia untuk pre-
processing text mining berbasis metode Market
Basket Analysis
Budhi et al
2006 Pada penelitian ini, Budhi
dkk merubah data teks menjadi bentuk compact
transaction yang akan dijasikan sebagai
masukan pada metode market basket analysis
2 A Fast Pattern Matching
with Two Sliding Windows
Hudaib et al
2008 Pada penelitian ini,
Hudaib dkk menerapkan algoritma pencarian baru
menggunakan pre- processing algoritma BR
dan deteksi dari dua sisi teks
Universitas Sumatera Utara
Tabel 2.6 Penelitian terdahulu yang berkaitan dengan pencarian sinonim kata lanjutan
No  Judul Penulis
Tahun Keterangan
3 Implementasi modifikasi
Enhanced Confix Stripping Stemmer
Tahitoe Diana
2010 Pada penelitian ini,
Tahitoe dan Diana menggunakan algoritma
ECS dan memperbaiki kinerja algoritma tersebut
dengan metode corpus based stemming
4 Sistem Penilaian
Otomatis Jawaban Essay menggunakan Ontologi
Moodle Firdausiah
et al 2008
Pada penelitian ini, Firdausiah dkk mengukur
kemiripan kata dengan metode pendekatan
sinonim kata untuk mendapatkan jawaban
yang serupa
Universitas Sumatera Utara
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
Bab ini membahas data yang digunakan dan mengimplementasikan algortima pattern matching pada pencarian sinonim kata dalam dokumen.
3.1 Data yang digunakan