3. METODOLOGI PENELITIAN
3.1 Kerangka Penelitian
Keberhasilan suatu penelitian ditentukan dari perencanaan penelitian. Dalam perencanaan penelitian tersebut harus jelas apa saja yang akan dilakukan
agar penelitian dapat berjalan dengan semestinya. Langkah-langkah penelitian ini secara umum dapat digambarkan seperti yang terlihat pada Gambar 4.
Gambar 4 Langkah-langkah penelitian.
3.2 Prosedur Penelitian
Berdasarkan langkah-langkah penelitian pada Gambar 4, tahapan penelitian yang dilakukan pada tiap langkah diuraikan pada pembahasan selanjutnya.
3.2.1 Tahap Pemahaman Masalah
Untuk dapat menyelesaikan penelitian ini, masalah yang ada harus dipahami dengan baik. Permasalahan yang ada digali dengan cara studi literatur dari
sumber-sumber yang berkaitan dengan permasalahan penelitian
ini. Selain itu, permasalahan dalam tentang tata bahasa Sunda dilakukan dengan cara melakukan
22 wawancara dengan nara sumber yang kompeten yaitu Bapak Dr. Yayat Sudaryat,
M.Hum. dosen Sastra Sunda Universitas Pendidikan Indonesia
3.2.2 Tahap Pengumpulan Dokumen dan Pemasukan Data Kamus
Dokumen-dokumen dalam bahasa Sunda digunakan untuk pengujian pada tahap evaluasi stemming. Dokumen uji yang terkumpul adalah sebanyak 130
dokumen berbahasa Sunda dengan topik yang beragam. Topik dokumen berisi tentang sejarah, budaya, agama, berita dan lain-lain. Seluruh dokumen yang
terkumpul, format penulisan dokumen kemudian diubah menjadi bentuk teks. Hal ini untuk memudahkan pembacaan dokumen oleh tokenizer.
Data kamus diperlukan untuk pembandingan kata pada proses stemming. Untuk memasukan data kamus, sumber data didapat dari Kamus Lengkep Sunda-
Indonesia Indonesia Sunda Sunda-Sunda Tamsyah 1996 dan dilengkapi dengan kamus Sunda – Indonesia Satjadibrata 2011. Dari hasil pemasukan data kamus
tersebut didapat 8 234 kata.
3.2.3 Tahap Perancangan Tokenizer
Tokenizer akan membaca kata per kata dari dokumen. Modul tokenizer akan menerima masukan berupa dokumen dan keluarannya adalah kumpulan kata
atau token. Tokenizer akan mengabaikan tanda baca, dan tanda-tanda lainnya yang tidak diperlukan. Tokenizer akan membaca dokumen dalam bentuk teks atau
HTML. Program selengkapnya tokenizer dapat dilihat pada Lampiran 1.
3.2.4 Tahap Pembuatan Kata Uji dari Dokumen
Pada tahap ini, dokumen yang terkumpul akan dicari token atau kata yang ada dalam dokumen tersebut. Pembuatan kata uji ini akan menggunakan tokenizer
yang dirancang pada Bab 3.2.3. Kata atau token yang terkumpul akan disimpan dalam sebuah tabel dalam database yang berisi daftar kemunculan kata dalam
dokumen. Kata yang disimpan dalam database adalah kata yang unik, artinya tidak akan ada kata yang sama.
23 Kata uji ini akan digunakan untuk pengujian algoritme stemming yang
dirancang. Selanjutnya kata hasil stemming akan dievaluasi apakah hasil stemming sesuai dengan kata yang diharapkan.
3.2.5 Tahap Pembuatan Stoplist