Penelitian terdahulu LANDASAN TEORI

2.5 Penelitian terdahulu

Berbagai penelitian telah dilakukan untuk menyelesaikan pencarian kata maupun persamaannya dengan algoritma pencarian antara lain : 1. Budhi et al. 2006 menggunakan algoritma Porter Stemmer for Bahasa Indonesia, untuk proses Stemmer pada langkah pre-processing yang merubah sebuah teks dalam bahasa Indonesia menjadi bentuk Compact Transaction. Compact Transaction digunakan sebagai masukan untuk proses Keyword-Based Association Analysis, sebuah metode Text Mining yang dikembangkan dari metode Market Basket Analysis, digunakan untuk membentuk rule-rule asosiasi dari data teks . Hasil pengujian terhadap kesalahan proses Stem kata secara otomatis cukup kecil, yaitu 2 sehingga dapat diatasi dengan cepat menggunakan pemeriksaan kembali secara manual terhadap hasil Stemmer. 2. Hudaib et al. 2008 melakukan penelitian untuk menerapkan dan membuat sebuah algoritma pattern matching yang cepat.Algoritma tersebut dinamakan algoritma two sliding windows. Penelitian dilakukan dengan menerapkan ide dari algoritma Berry-Ravindran untuk menentukan nilai pergeseran dan menggunakan dua sisi window untuk melakukan scanning karakter. Hasil pengujian menunjukkan bahwa performansi terbaik algoritma TSW apabila kata-kata tersebut berada di akhir sebuah dokumen. 3. Tahitoe Diana 2010 melakukan penelitian terhadap algoritma Enhanced Confix Stripping Stemmer dan mendapati adanya kesalahan yang dilakukan oleh algoritma tersebut karena ECS Stemmer tidak mengajukan perbaikan terhadap permasalahan overstemming dan understemming. Oleh karena itu, diajukan perbaikan dengan menggunakan metode corpus based stemming. Hasil pengujian menunjukkan kesalahan stemming yang dilakukan oleh ECS Stemmer dapat diperbaiki dan penggunaan data fusion dan metode condorcet dapat mempersingkat waktu yang dibutuhkan untuk pembentukan relevan set dalam proses efektifitas sistem temu kembali informasi. Universitas Sumatera Utara 4. Firdausiah et al. 2008 mencari sinonim kata berdasarkan pengukuran similaritas semantic berbasis WordNet pada sistem penilaian otomatis jawaban essay menggunakan ontologi moodle. Proses pencarian sinonim menghasilkan beberapa output sinonim berbeda pada level yang berbeda. 5. Putra, Hedryan K.2013 menerepkan algoritma Karp Rabin dan metode pendekatan sinonim kata untuk mendapatkan tingkat duplikasi dengan tingkat ketelitian tinggi. Akurasi yang dihasilkan cukup tinggi karena pendeteksian dokumen diproses dengan membandingkan kata perkata yang terdapat di dalam dokumen dan membandingkan kata yang memiliki sinonim kata. Penjelasan penelitian sebelumnya dapat dilihat pada tabel 2.6. Tabel 2.6 Penelitian terdahulu yang berkaitan dengan pencarian sinonim kata No Judul Penulis Tahun Keterangan 1 Algoritma Porter Stemming for Bahasa Indonesia untuk pre- processing text mining berbasis metode Market Basket Analysis Budhi et al 2006 Pada penelitian ini, Budhi dkk merubah data teks menjadi bentuk compact transaction yang akan dijasikan sebagai masukan pada metode market basket analysis 2 A Fast Pattern Matching with Two Sliding Windows Hudaib et al 2008 Pada penelitian ini, Hudaib dkk menerapkan algoritma pencarian baru menggunakan pre- processing algoritma BR dan deteksi dari dua sisi teks Universitas Sumatera Utara Tabel 2.6 Penelitian terdahulu yang berkaitan dengan pencarian sinonim kata lanjutan No Judul Penulis Tahun Keterangan 3 Implementasi modifikasi Enhanced Confix Stripping Stemmer Tahitoe Diana 2010 Pada penelitian ini, Tahitoe dan Diana menggunakan algoritma ECS dan memperbaiki kinerja algoritma tersebut dengan metode corpus based stemming 4 Sistem Penilaian Otomatis Jawaban Essay menggunakan Ontologi Moodle Firdausiah et al 2008 Pada penelitian ini, Firdausiah dkk mengukur kemiripan kata dengan metode pendekatan sinonim kata untuk mendapatkan jawaban yang serupa Universitas Sumatera Utara BAB 3 ANALISIS DAN PERANCANGAN SISTEM Bab ini membahas data yang digunakan dan mengimplementasikan algortima pattern matching pada pencarian sinonim kata dalam dokumen.

3.1 Data yang digunakan