yang berfungsi untuk memudahkan pencarian kembali data tersebut. Dalam penelitian ini, fungsi tersebut sangat dibutuhkan ketika kalimat diparsing akan disimpan di dalam
array dengan indeks yang autoincrement dan data akan dipanggil kembali sesuai indeksnya saat menampilkan gambar dari database. Tipe data array memiliki pointer
untuk menunjukkan dimana indeks yang aktif. Untuk array yang baru dideklarasikan, nomor indeks adalah nomor indeks yang pertama [0]. Untuk mengetahui nomor indeks
yang aktif digunakan fungsi key dan untuk mengetahui jumlah elemenkata yang telah diparsing digunakan fungsi count.
Pada PHP juga tersedia fungsi bernama ereg yang dapat digunakan untuk menangani ekspresi regular dalam hal ini digunakan fungsi preg karena kompatibel
pada PHP 5.3 dan versi selanjutnya, khususnya fungsi preg_replace yang berguna untuk mengganti suatu bagian string dengan string yang lain berdasarkan ekspresi
regular.
2.7 Penelitian Terdahulu
Adapun penelitian terdahulu seperti Aplikasi kamus Digital Bahasa Batak – Indonesia – Inggris menggunakan Visual basic 6.0 Harahap, 2013. Implementasi Algoritma
Enhanced Confix Stripping Stemmer pada kamus sistem bahasa isyarat Indonesia. Iqramitha, 2013. Penggunaan Algoritma Semut Dan Confix Stripping Stemmer
Untuk Klasifikasi Dokumen Berita Berbahasa Indonesia Mahendra, 2008. Dan
penelitian ini terinspirasi dari kamus Karo pada salah satu website yang didalamnya juga terdapat konversi Bahasa Indonesia ke dalam bentuk Aksara Karo secara terpisah,
dalam website tersebut juga tidak menerima adanya input imbuhan, oleh karena itu peneliti bermaksud menambahkan fitur baru dari website tersebut dan menggabungkan
antara kamus dan konversi untuk penulisannya. Website tersebut adalah www.kamus.karo.or.id
. Pada tabel 2.7 merupakan penelitian – penelitian terdahulu.
No Judul
KelebihanKelebihanKeteraangan Penulis
1 Aplikasi kamus Digital
Bahasa Batak – Indonesia
– Inggris
menggunakan Visual basic 6.0. 2013
Tidak menerima input kata
berimbuhan Harahap
Universitas Sumatera Utara
No Judul
KelebihanKekuranganKeterangan Penulis 2
Implementasi Algoritma
Enhanced Confix
Stripping Stemmer pada kamus
sistem bahasa isyarat Indonesia. 2013
Dapat menguraikan kata berimbuhan dan kata baku secara jelas, namun
untuk kata awalan ke dan kata depan ke belum dapat dibedakan.
Iqramitha
3
Penggunaan Algoritma Semut Dan Confix
Stripping Stemmer Untuk Klasifikasi
Dokumen Berita Berbahasa Indonesia.
2008 Adanya kendala untuk masalah kata
yang mengandung sisipan. Mahendra
Lanjutan tabel 2.7
Universitas Sumatera Utara
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
Pada bab ini, akan membahas beberapa hal diantaranya data yang digunakan, penerapan algoritma dan analisa perancangan sistem dalam mengimplementasikan
Algoritma Enhanced Confix Stripping Stemmer ECS pada proses stemming untuk
menerjemahkan Bahasa Indonesia ke dalam bentuk Bahasa Karo.
3.1 Data yang digunakan
Data yang digunakan berdasarkan dari kamus Karo Indonesia Darwin Prinst 2002 dimana kamus tersebut berisikan kata – kata umum yang sering dibicarakan sehari –
hari. 3.2
Proses Penerjemahan
Pada tahap awal, user menginputkan kata yang hendak diartikan kedalam kolom yang telah disediakan. Kemudian sistem akan memproses input tersebut. Setiap kata yang
diinputkan akan mengalami proses stemming, menjadi terpisah antara imbuhan dan kata dasar.
Jika terdapat kata yang sama dengan kata yang ada di database maka kata tersebut akan tersimpan sementara, lalu sistem akan mulai memproses dan memunculkan
terjemahan dari input tadi. Dan jika ternyata kata yang diinputkan tidak terdapat di dalam database maka sistem akan melanjutkan proses penyesuaian dengan Aksara
Batak Karo. Diagram sistem pada gambar 3.1 dapat mempresentasikan proses penerjemahan Bahasa Indonesia ke dalam Bahasa Karo dan penyesuaian Aksara Batak
Karo.
Universitas Sumatera Utara
Input kata 1
Jika tidak terdapat kata pada database, maka
kata tersebut langsung melanjutkan proses
penyesuaian dengan Aksara Batak Karo
Proses Stemming 2
Mencari terjemahan yang sesuai dengan Database
3
Menyesuaikan dengan Aksara Batak Karo
4 Menampilkan output
5
Gambar 3.1 Diagram Sistem
Proses dari diagram pada gambar 3.1 dapat diperjelas dengan contoh sebagai berikut :
1. Diberikan input kata seperti : Terjatuh
2. Stemming kata : [ter] [jatuh] 3. Setiap kata di cek ke dalam database, apakah kata tersebut terdapat di dalam
database atau tidak. 4. Jika terdapat kata yang tidak cocok di dalam database, maka sistem akan
melanjutkan proses selanjutnya yaitu menyesuaikan dengan Aksara Batak Karo. 5. Setelah selesai proses penerjemahan kata di dalam database, maka kata tersebut
disimpan sementara. Lalu kata yang tersimpan tadi akan kembali dicocokkan dengan kata yang ada dalam database Aksara Batak Karo.
6. Hasil terjemahan yang ditampilkan sebagai berikut :
Universitas Sumatera Utara
Untuk flowchart sistem dapat dilihat pada gambar 3.2
Mulai
Input Kata
Kata distemming
Cek kata dasar
Sesuaikan imbuhan dengan
Bahasa Karo
Cek Imbuhan
Pasangkan Kembali Dengan
kata dasar
Ambil Aksara Karo
Selesai Ya
Ya Tidak
Tidak
Gambar 3.2 Flowchart Sistem
Universitas Sumatera Utara
Algoritma Enhanced Confix Stripping Stemmer adalah algoritma stemming yang akurat untuk mencari kata dasar dari suatu kata dalam bentuk bahasa Indonesia
Sholihin, 2013. Pada tahap pertama tiap kata yang diinputkan oleh user akan distemming
menggunakan algoritma ECS yang sudah dimodifikasi. Jika kata tersebut terdapat dalam kamus kata, maka kata merupakan kata dasar. Jika kata tidak terdapat di dalam
kamus kata, maka kata tersebut akan mengalami proses stemming dan jika kata tersebut tidak dapat distemming, maka kata tersebut akan diurai menjadi huruf per
huruf. Dan selanjutnya akan dicocokkan dengan aksara Batak Karo yang terdapat di dalam database yang tersedia.
3.3 Pedoman Penulisan Aksara Batak Penggunaa surat batak versi karo telah dijelaskan oleh Neumann 1922 dan Smit
1916.
a. Anak ni surat
Semua ina ni surat yang berupa konsonan berakhir dengan bunyi [a] bp bapa. Bunyi [a] ini dapat dihapus dengan menggunakan tanda bunuh yang disebut
pěněngěn [K] atau pangolat [T]. Fungsi diakritik tersebut persis sama dengan diakritik yang disebut virama dalam bahasabahasa India, atau paten dalam bahasa Jawa. Pada
contoh berikut aksara Ka kehilangan bunyi [a]: lk\lk\ laklak. Bunyi [a] yang melekat pada ina ni surat dapat diubah menjadi vocal lain
dengan menambahkan anak ni surat. Huruf Ga g misalnya dapat diubah menjadi gE Ge seperti dalam kata bligE Balige. Selain itu, ada dua diakritik yang menambahkan
bunyi [ng] atau [h] pada ina ni surat, contohnya adalah bkr Bangkara, atau rumh rumah [K].
Dua jenis diakritik dapat dikombinasikan: pti pating [K], reh r ěh [K]. Bila
terdapat kombinasi dari anak ni surat yang letaknya di belakang ina ni surat yakni i, u, atau e dan anak ni surat h atau ng yang terletak di atas-kanan ina ni surat
maka anak ni surat h atau ng agak bergeser ke kanan sehingga posisinya tepat di atas anak ni surat i, u, atau e. Perlu dicatat bahwa aturan ini tidak selalu dipatuhi.
Universitas Sumatera Utara
Pada suku kata tertutup yang terdiri dari urutan Konsonan - Vokal - Konsonan, anak ni surat yang menandai vokal selalu diletakkan di antara ina ni surat yang kedua dan
anda bunuh seperti terlihat pada contoh ini: gko\
gok; borti- borit [S]; sni-tk- sintak [K].
b. Aksara A dan Ha