Aplikasi Kamus Digital Bahasa Indonesia - Karo Dengan Output Aksara Batak Karo Menggunakan Enhanced Confix Stripping Stemmer (Ecs)

(1)

APLIKASI KAMUS DIGITAL BAHASA INDONESIA - KARO

DENGAN

OUTPUT

AKSARA BATAK KARO MENGGUNAKAN

ENHANCED CONFIX STRIPPING STEMMER (ECS)

SKRIPSI

UPIK PURNAMAWATI

091402019

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

2014


(2)

APLIKASI KAMUS DIGITAL BAHASA INDONESIA - KARO DENGAN OUTPUT AKSARA BATAK KARO MENGGUNAKAN ENHANCED CONFIX STRIPPING STEMMER

(ECS) SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Sarjana Teknologi Informasi

UPIK PURNAMAWATI

091402019

PROGRAM STUDI S1 TEKNOLOGI INFORMASI

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

MEDAN 2014


(3)

PERSETUJUAN

Judul : APLIKASI KAMUS DIGITAL BAHASA

INDONESIA - KARO DENGAN OUTPUT AKSARA BATAK KARO MENGGUNAKAN ENHANCED CONFIX STRIPPING STEMMER (ECS)

Kategori : SKRIPSI

Nama : UPIK PURNAMAWATI

Nomor Induk Mahasiswa : 091402019

Program Studi : SARJANA (S1) TEKNOLOGI INFORMASI Fakultas : ILMU KOMPUTER DAN TEKNOLOGI

INFORMASI UNIVERSITAS SUMATERA UTARA Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

M. Andri Budiman , ST.,M.Comp.Sc.,M.E.M Sarah Purnamawati, ST.M.Sc

NIP : 19751008 200801 1 0011 NIP : 19830226 201012 2 003

Diketahui/Disetujui oleh

Program Studi S1 Teknologi Informasi Ketua,

M. Anggia Muchtar, ST., MM.IT NIP 198001102008011010


(4)

PERNYATAAN

APLIKASI KAMUS DIGITAL BAHASA INDONESIA - KARO DENGAN

OUTPUT AKSARA BATAK KARO MENGGUNAKAN

ENHANCED CONFIX STRIPPING STEMMER (ECS)

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil karya sendiri, kecuali beberapa kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan,

Upik Purnamawati 091402019


(5)

PENGHARGAAN

Alhamdulillah, puji dan syukur penulis ucapkan kehadirat Allah SWT, serta shalawat dan salam kepada junjungan kita nabi Muhammad SAW, karena atas berkah, rahmat dan hidayahnya penulis dapat menyelesaikan penyusunan skripsi ini.

Dalam penulisan skripsi ini penulis banyak mendapatkan bantuan serta dorongan dari pihak lain. Dalam kesempatan ini dengan segala kerendahan hati, penulis mengucapka terima kasih kepada:

1. Ketua dan Sekretaris Jurusan M. Anggia Muchtar, ST, M.MIT dan M. Fadly Syahputra, ST., M.MIT

2. Kepada Ibu Sarah Purnamawati, ST.M.Sc dan Bapak M. Andri Budiman, ST.,M.Comp.Sc.,M.E.M selaku dosen pembimbing penulis yang telah memberikan saran dan masukan serta bersedia meluangkan waktu, tenaga dan pikiran dalam membantu menyelesaikan skripsi ini.

3. Bapak Romi Fadilla Rahmat B.Comp.Sc.,M.Sc dan Bapak Dani Gunawan ST.,M.T selaku dosen pembanding dan penguji yang telah banyak memberikan petunjuk, saran dan kritik dalam menyelesaikan skripsi ini.

4. Keluarga yaitu ayah , Djamahir yang telah memberikan seluruh dukungannya kepada penulis. Kakak, Juwita Wati, Edi junaidi, Rosmawati yang telah dengan senang hati memberikan dukungan baik moril dan materi, serta dengan sabar membimbing penulis untuk menyelesaikan skripsi ini. Kepada mami Zaenap yang dengan senang hati memberikan bantuan berupa materi dan doa untuk penulis. Dan seluruh keluarga yang tidak dapat disebut satu – persatu namanya. 5. Bapak M. Anggia Muchtar, ST, M.MIT selaku dosen penasihat akademik saya. 6. Seluruh Dosen yang mengajar dan staff tata usaha pada program studi

Teknologi Informasi Universitas Sumatera Utara.

7. Teman-teman Teknologi Informasi stambuk 2009, Buyung, Ani, Zyzy, Irwan, Rozy, Arif, Kepo, Yuli, Robert, Rian, Iting, Mitha, Jihan, Dila, Mira.

8. Kekasih tersayang yang dengan sabar memberi dukungan baik moril dan materi kepada penulis, Nico Syahputra.

9. Dan seluruh rekan – rekan kuliah sejawat yang tidak dapat disebutkan satu per satu.

Dalam penyusunan skripsi ini penulis menyadari bahwa masih banyak kekurangan, untuk itu penulis mengharapkan saran dan kritik yang bersifat membangun dari semua pihak demi kesempuranaan skripsi ini.

Akhir kata penulis mengharapkan semoga skripsi ini dapat bermanfaat dan membantu semua. pihak yang memerlukannya.


(6)

ABSTRAK

Aksara Batak Karo merupakan aksara yang telah ada sejak dahulu, namun aksara Batak Karo ini masih sedikit masyarakat yang mengetahuinya. Masyarakat suku Karo sendiri masih ada yang belum mengenal aksara Batak Karo ini. dalam penelitian ini, penulis akan membuat suatu aplikasi kamus bahasa Indonesia – Karo dengan output aksara Batak Karo, dan kamus ini dapat menerima kata berimbuhan dengan penerapan algoritma Enhanced Confix Stripping Stemmer, berdasarkan pengujian yang telah dilakukan, algoritma Enhanced Confix Stripping Stemmer ini dapat memaksimalkan penterjemahan kata.


(7)

ABSTRACT

Karo Batak script is a script which were of old, but the Karo Batak alphabet is still a few people who know. Karo tribal communities themselves there are not familiar with this Karo Batak alphabet. in this study, the author will make an application Indonesian dictionary - Karo and Batak Karo script output, and this dictionary can receive the word with affix and the application uses an algorithm enhanced confix stripping Stemmer, based of testing that has been done, enhanced confix stripping Stemmer algorithm can maximize the affix translation.


(8)

DAFTAR ISI

PERSETUJUAN ii

PERNYATAAN iii

PENGHARGAAN iv

ABSTRAK v

ABSTRACT vi

DAFTAR ISI vii

DAFTAR TABEL ix

DAFTAR GAMBAR x

BAB 1 1

PENDAHULUAN 1

1.1Latar Belakang 1

1.2Rumusan Masalah 2

1.3Batasan Masalah 2

1.4Tujuan Penelitian 3

1.5Manfaat Penelitian 3

1.6Metodologi Penelitian 3

BAB 2 5

LANDASAN TEORI 5

2.1 Kamus 5

2.2 Aksara Batak 5


(9)

2.4 Proses Stemming 17 2.5 Algoritma Enhanced Confix Stripping Stemmer 17

2.6 Bahasa Pemprograman PHP 19

2.7 Penelitian Terdahulu 22

BAB 3 24

ANALISIS DAN PERANCANGAN SISTEM 24

3.1 Data Yang Digunakan 24

3.2 Proses Penerjemahan 24

3.3 Analisis Perancangan Sistem 27

3.3.1 Analisis pengguna 27

3.3.2 Diagram Use Case 27

3.4 Perancangan Database 29

3.5 Perancangan Antar Muka Pemakai (User Interface) 29 3.5.1 Rancangan Halaman Input 29 3.5.2 Rancangan Halaman Output 30

BAB 4 32

IMPLEMENTASI DAN PENGUJIAN SISTEM 32

4.1 Spesifikasi Perangkat Keras dan Perangkat Lunak 32

4.2 Tampilan Antarmuka 33

4.2.1 Tampilang Halaman Beranda 33 4.2.2 Tampilan Halaman Aksara 34 4.2.3 Tampilan Halaman Output 35

BAB 5 38

KESIMPULAN DAN SARAN 38

5.1 Kesimpulan 38

5.2 Saran 38

DAFTAR PUSTAKA 40


(10)

DAFTAR TABEL

Halaman

Tabel 2.1 Perbedaan Aksara 8

Tabel 2.2 Persamaan Aksara 10

Tabel 2.3 Aksara 14

Tabel 2.4 Tanda Diakritik (anak ni surat) 15

Tabel 2.5 Nama anak ni surat 16

Tabel 2.6 Kombinasi Awalan – Akhiran yang dilarang 18

Tabel 2.7 PenelitianTerdahulu 22

Tabel 3.1 Tabel Database 30

Tabel 4.1 Tabel Rencana Pengujian 33

Tabel 4.2 Tabel Hasil Evaluasi pada Tampilan halaman beranda 34 Tabel 4.3 Tabel Hasil Evaluasi pada Tampilan halaman input 35 Tabel 4.4 Tabel Hasil Evaluasi pada Tampilan halaman output 36


(11)

DAFTAR GAMBAR

Halaman

Gambar 2.1 Silsilah Aksara 6

Gambar 2.2 Arah Penyebaran Aksara Batak 17

Gambar 3.1 Diagram Sistem 25

Gambar 3.2 Flowchart Sistem 26

Gambar 3.3 Diagram Use Case 28

Gamabr 3.4 Rancangan Halaman Input 30

Gambar 3.5 Rancangan Halaman Output 31

Gamabr 4.1 Tampilan Halaman Beranda 33

Gambar 4.2 Tampilan Halaman Aksara 34

Gambar 4.3 Tampilan Halaman Aksara yang diberi input kata terjatuh 35


(12)

ABSTRAK

Aksara Batak Karo merupakan aksara yang telah ada sejak dahulu, namun aksara Batak Karo ini masih sedikit masyarakat yang mengetahuinya. Masyarakat suku Karo sendiri masih ada yang belum mengenal aksara Batak Karo ini. dalam penelitian ini, penulis akan membuat suatu aplikasi kamus bahasa Indonesia – Karo dengan output aksara Batak Karo, dan kamus ini dapat menerima kata berimbuhan dengan penerapan algoritma Enhanced Confix Stripping Stemmer, berdasarkan pengujian yang telah dilakukan, algoritma Enhanced Confix Stripping Stemmer ini dapat memaksimalkan penterjemahan kata.


(13)

ABSTRACT

Karo Batak script is a script which were of old, but the Karo Batak alphabet is still a few people who know. Karo tribal communities themselves there are not familiar with this Karo Batak alphabet. in this study, the author will make an application Indonesian dictionary - Karo and Batak Karo script output, and this dictionary can receive the word with affix and the application uses an algorithm enhanced confix stripping Stemmer, based of testing that has been done, enhanced confix stripping Stemmer algorithm can maximize the affix translation.


(14)

BAB I

PENDAHULUAN

1.1 Latar Belakang

Indonesia terkenal dengan berbagai macam suku dan budaya, mulai dari Sabang hingga Merauke memiliki ciri khas tersendiri baik dari segi tutur bahasa hingga budaya, di pulau Sumatera contohnya, terdapat berbagai macam tutur bahasa yang khas.

Apabila ditinjau lebih dalam mengenai pulau Sumatera, khususnya Sumatera Utara, Sumatera Utara terkenal dengan bermacam tutur bahasa dan budaya. Aksara Batak salah satu contoh ragam bahasa, dan aksara Batak merupakan bagian dari keluarga aksara India. Aksara India yang tertua adalah aksara Brahmi yang menurunkan dua kelompok tulisan yaitu India Utara dan India Selatan (Casparis, 1975).

Aksara Batak ini terbagi lagi lima yaitu, Angkola-Mandailing, Toba, Simalungun, Pakpak-Dairi, dan Karo. Pada penelitian ini, penulis berfokus pada aksara Batak Karo. Aksara Batak Karo adalah aksara kuno yang dipergunakan oleh masyarakat Karo, akan tetapi pada saat ini penggunaannya sangat terbatas sekali bahkan hampir tidak pernah digunakan lagi. Oleh karena itu, dalam penelitian ini penulis berharap dapat menerapkan sebuah kamus untuk Bahasa Indonesia ke dalam Bahasa Karo menggunakan aksara Batak Karo, agar dapat membantu pembelajaran bagi masyarakat suku Karo, atau siapa saja yang ingin belajar Bahasa Karo dan mengenal aksara Batak Karo.

Dalam penerapan atau pembuatan kamus digital bahasa Indonesia – karo ini menggunakan algoritma Enhanced Confix Stripping Stemmer (ECS), sebelumnya pengertian kamus digital sendiri merupakan sebuah fasilitas pengolahan kata


(15)

elektronis, yaitu sebuah fasilitas yang memungkinkan aplikasi pengolahan kata memeriksa ejaan dari dokumen yang diketik. Hal ini dapat meminimumkan kemungkinan salah eja dan salah ketik. Di negara-negara maju, pengguna data secara elektonis sudah sangat umum, sehingga menjadi salah satu indikator pemilihan terhadap pengolahan data yang hendak dipakai (Rinarozky, 2007).

Algoritma Enhanced Confix Stripping Stemmer (ECS) adalah algoritma

stemming yang akurat untuk mencari kata dasar dari suatu kata dalam bentuk bahasa Indonesia (Sholihin, 2013).

1.2 Rumusan Masalah

Terbatasnya aplikasi kamus bahasa Indonesia – Karo dan pengenalan tentang aksara Batak Karo menjadi hal yang mendasar dalam penelitian ini, dan juga masih sedikitnya aplikasi kamus yang dapat menerjemahkan kata berimbuhan Bahasa Indonesia - Karo. Sehingga diperlukan sebuah aplikasi yang dapat membantu dalam menerjemahkan kata dasar dan kata berimbuhan dari bahasa Indonesia – Karo dengan menggunakan aksara Batak Karo sebagai output dan diikuti cara pembacaan aksara Batak Karo dengan huruf latin.

1.3 Batasan Masalah

Adapun batasan masalah dalam penelitian ini adalah :

1. Input berupa teks dalam kata menggunakan bahasa Indonesia 2. Input hanya satu kata.

3. Imbuhan yang dapat diterjemahkan ke bahasa Karo hanya : a) Awalan

1. Ber 2. Di 3. Ter b) Akhiran

1. Kan 2. I 3. Lah 4. Nya 5. Mu 6. Ku


(16)

4. Output berupa teks dalam kata berupa bahasa Karo dan aksara Batak Karo.

5. Data yang digunakan terdapat dalam kamus Bahasa Indonesia – Bahasa Karo secara online dan kamus Karo – Indonesia (Darwin Prinst, 2002).

1.4 Tujuan Penelitian

Adapun tujuan dari penelitian ini adalah menterjemahkan kata berimbuhan pada bahasa Indonesia - Karo dengan input Bahasa Indonesia dan output berupa aksara Batak Karo dan menggunakan algoritma Enhanced Confix Stripping Stemmer (ECS).

1.5 Manfaat Penelitian

Penelitian ini memiliki manfaat sebagai berikut :

1. Sebagai bahan pembelajaran Bahasa Indonesia - Karo dengan menggunakan aksara Batak Karo.

2. Aksara Batak Karo akan lebih dikenal bukan saja oleh suku Karo, namun masyarakat umum.

3. Membantu peneliti dalam mempelajari dan memperdalam ilmu tentang algoritma

Enhanced Confix Stripping Stemmer (ECS), aksara Batak Karo dan Bahasa Karo. 4. Sebagai suatu alat yang dapat melestarikan kebudayaan suku karo, dengan adanya

penggunaan aksara Batak Karo dalam output kamus tersebut.

5. Membantu untuk menerjemahkan kata dalam bahasa Indonesia ke dalam bahasa Karo, baik itu dalam kata dasar maupun kata berimbuhan.

1.6 Metodologi Penelitian

Tahapan-tahapan yang akan dilakukan pada pelaksanaan skripsi ini adalah sebagai berikut:

1. Studi Literatur

Studi literatur dilakukan dengan mengumpulkan bahan-bahan referensi baik dari buku, artikel, paper, jurnal, makalah, maupun situs-situs internet. Studi literatur yang dilakukan terkait dengan aksara Batak, Bahasa Karo, dan Algoritma Enhanced Confix Stripping Stemmer (ECS).


(17)

2. Analisis Permasalahan

Pada tahap ini dilakukan analisis terhadap hasil studi literatur untuk mengetahui dan mendapatkan pemahaman mengenai Kamus Digital Indonesia – Karo.

3. Perancangan Sistem

Pada tahap ini dilakukan perancangan arsitektur, pengumpulan data pelatihan, pemilihan lingkungan pengembangan dan perancangan antarmuka. Proses perancangan dilakukan berdasarkan hasil analisis studi literatur yang telah didapatkan.

4. Implementasi Sistem

Pada tahap ini dilakukan proses implementasi pengkodean program dalam aplikasi komputer menggunakan bahasa pemrograman yang telah dipilih yang sesuai dengan analisis dan perancangan yang sudah dilakukan. Pelatihan jaringan, verifikasi dan validasi.

5. Pengujian

Pada tahap ini dilakukan proses pengujian dan percobaan terhadap sistem sesuai dengan kebutuhan yang ditentukan sebelumnya serta memastikan program yang dibuat berjalan seperti yang diharapkan.

6. Dokumentasi

Pada tahap ini dilakukan pembuatan dokumentasi sistem, lengkap dengan analisis yang diperoleh.

7. Penyusunan Laporan

Pada tahap ini dilakukan dokumentasi hasil analisis dan implementasi dari Kamus Digital Indonesia – Karo.


(18)

BAB 2

LANDASAN TEORI

Pada bab ini membahas mengenai teori-teori yang digunakan untuk memahami permasalahan yang berkaitan dengan Kamus, Aksara Batak Karo, Bahasa Karo, Stemmer, Algoritma Enhanced Confix Stripping Stemmer (ECS), dan Bahasa Pemprograman PHP dan penelitian terdahulu.

2.1 Kamus

Kata kamus diserap dari bahasa Arab qamus, dengan bentuk jamaknya qawamis. Kata Arab itu sendiri berasal dari kata Yunani okeanos yang berarti lautan. Sejarah kata itu jelas memperlihatkan mana dasar yang terkandung dalam kata kamus, yaitu wadah pengetahuan, khusunya pengetahuan bahasa, yang tidak terhingga dalam dan luasnya. dalam pengertian lain, Kamus adalah buku acuan yang memuat kata dan ungkapan, biasanya disusun menurut abjad beserta penjelasan tentang makna dan pemakainya (Kamus Besar Bahasa Indonesia). Kamus disusun sesuai dengan abjad dari A-Z dengan tujuan untuk memudahkan pengguna kamus dalam mencari istilah yang diinginkannya dengan cepat dan mudah. Kamus memiliki kegunaan untuk memudahkan penggunanya dalam mencari istilah-istilah yang belum dipahami maknanya.

2.2 Aksara Batak

2.2.1 Asal usul aksara batak

Keterangan tentang asal usul aksara batak ini merujuk penelitian Kozok, 1999. Dalam buku Warisan Leluhur dan sastra lama, surat Batak sering diklasifikasikan sebagai sebuah silabogram, namun ini jelas keliru karena aksara Batak – sebagaimana juga


(19)

aksara-aksara lainnya di Nusantara – merupakan bagian dari rumpun tulisan Brahmi (India) yang lebih tepat dapat diklasifikasikan sebagai abugida (paduan antara silabogram dan abjad). Sebuah abugida terdiri dari aksara yang melambangkan sebuah konsonan sementara vokal dipasang pada aksara sebagai diakritik. Abugida adalah jenis tulisan yang bersifat fonetis dalam arti bahwa setiap bunyi bahasanya dapat dilambangkan secara akurat.

Paleografi adalah ilmu tentang tulisan-tulisan kuno. Dibanyak masyarakat yang mengenal tulisan terdapat naskah-naskah kuno yang umurnya dapat mencapai ratusan atau bahkan ribuan tahun. Aksara yang terdapat pada naskah-naskah kuno pada umumnya berbeda dengan aksara yang terdapat dalam naskah yang lebih baru. Dengan cara memperbandingkan aksara-akasara yang terdapat dalam naskah-naskah lama, kita dapat menyusun semacam silsilah aksara.

Sebagian besar sistem tulisan yang ada di Afrika, Eropa, dan Asia berasal dari satu sumber, yakni aksara Semit Kuno yang menjadi nenek moyang tulisan-tulisan Asia (Arab, Ibrani dan India) maupun Eropa (Latin, Yunani dsb.)

Aksara Batak termasuk keluarga tulisan India. Aksara India yang tertua adalah aksara Brahmi yang menurunkan dua kelompok tulisan yakni India Utara dan India Selatan. Aksara Nagari dan Palawa masing-masing berasal dari kelompok utara dan selatan dan kedua-duanya pernah dipakai diberbagai tempat Asia Tenggara, termasuk Indonesia (Casparis 1975). Yang paling berpengaruh adalah aksara Palawa. Semua tulisan asli Indonesia berinduk pada aksara tersebut.

Pada Gambar 2.1 dapat dilihat dimana secara garis besar tempatnya aksara Batak dalam silsilah tulisan sedunia.


(20)

Surat Batak terdiri atas dua perangkat huruf yang masing-masing disebut ina ni surat dan anak ni surat. Sistem tulisan yang demikian juga dipakai oleh semua abjad India dan abjad-abjad turunannya. Dan memang aksara Batak dan demikian juga semua aksara Nusantara lainnya yang berinduk pada aksara India). Namun demikian, kerabat surat Batak yang paling dekat adalah aksara-aksara Nusantara, dan khususnya yang di Sumatra. Tulisan Nusantara asli dapat dibagi atas lima kelompok : Aksara Hanacaraka terdapat di Jawa, Sunda, Bali. Surat Ulu terdapat di Kerinci, Rejang,Lampung, Lembak, Pasemah, dan Serawai. Surat Batak terdapat di Angkola Mandailing, Toba, Simalungun, Pakpak-Dairi, Karo. Aksara Sulawes terdapat di Bugis, Makasar, dan Bima. Aksara Filipina terdapat di Bisaya, Tagalog, Tagbanwa, Mangyan.

Naskah yang paling lama pada umumnya ditulis pada bahan yang dapat bertahan lama seperti di batu atau di lempengan logam. Batu bertulis yang paling tua di Indonesia adalah prasasti Raja Mulavarman yang ditemukan di Kutai, Kalimantan Barat yang ditulis pada tahun 322 Saka (tahun 400 Masehi). Hampir sama tua (450 M) adalah prasasti Raja Purnavarman yang ditemukan di Ci Aruten, Jawa Barat.

Kedua prasasti tersebut beraksara Palawa, dan berbahasa Sanskerta. Prasasti-prasasti Sriwijaya dari abad ke-7 juga masih menggunakan aksara Palawa, tetapi bahasanya lain, yakni bahasa Melayu Kuno. Lambat-laun aksara Palawa tersebut berubah bentuknya sehingga pada abad kedelapan menurunkan aksara Kawi (baik di Sumatra maupun di Jawa).

Aksara Kawi tersebut masih relatif mirip dengan aksara induknya, tetapi di sepanjang abad aksara itu berkembang lagi dan bentuk hurufnya berubah. Sebagai akibat perkembangan tersebut, pada abad ke-14 terbentuk beberapa aksara serumpun, termasuk Sumatra (prasasti Adityawarman) dan Jawa (prasasti Majapahit) yang sudah sangat berbeda dari aksara Palawa. Sedangkan aksara Jawa hanacaraka (abad kedelapan belas hingga kini) juga jauh berbeda dengan aksara Kawi di zaman

Majapahit.

Bila kita perhatikan perubahan-perubahan yang terjadi di sepanjang abad menjadi jelas bahwa perubahan itu tidak terjadi secara mendadak melainkan secara


(21)

berkesinambungan. Sebagai contoh, mari kita simak sejarah perkembangan huruf Na. Pada naskah Batak ditemukan empat bentuk Na. Yang berbentuk yang paling tua karena masih mirip dengan bentuk aksara Palawa dan Kawi (kolom 2–

4). Na-kuno ini memiliki varian

bentuk baru . Perbedaan aksara tersebut dapat dilihat pada tabel 2.1.

Tabel 2.1 Perbedaan Aksara

Pada kolum pertama tabel di atas terlihat huruf Na sebagaimana ditulis di India pada awal dan pertengahan milenium pertama. Kolom kedua memperlihatkan aksara yang sama sekitar seribu tahun kemudian (abad ke-14). Ternayata dalam kurun waktu seribu tahun bentuk Na Majapahit itu tidak berubah jauh dengan bentuk Palawa; bagian bawah masih hampir sama, namun bagian atas disederhanakan.

Kolom 3 dan 4 memperlihatkan dua bentuk aksara yang juga dari abad ke-14, tetapi digunakan di Sumatra, persisnya di Dharmasraya, di perbatasan Sumatra Barat dan Jambi. Walaupun bentuknya berbeda, kedua aksara berasal dari masa dan tempat yang sama. Keduanya digunakan pada abad ke-14 di dalam kerajaan Malayu. Yang pertama ditulis pada naskah Tanjung Tanah yang berasal dari Dharmasraya, dan yang kedua ditemukan pada bagian belakang patung Amoghapasa yang ditulis oleh Adityawarman dan ditemukan di Dharmasraya juga.

Bentuk Na naskah Tanjung Tanah tidak berbeda jauh dengan bentuk aksara Bali Baru namun Jawa Baru sudah makin menjauh dari aksara asalnya. Jelas kelihatan disini bahwa aksara Palawa dan Kawi masih sangat mirip, dan juga Batak , yakni Na-kuno, masih cukup dekat dengan aksara Palawa dan Kawi, sementara Batak (Na-Baru) merupakan penyederhanaan bentuk . Dengan adanya sejumlah naskah kuno, terutama prasasti dan naskah yang ditulis di lempengan-lempengan


(22)

tembaga atau emas, maka sejarah aksara Jawa dapat ditelusuri kembali sampai pada awal perkembangan aksara Kawi. Orang Batak, Rejang, Kerinci, Lampung, Bugis, Makasar dan juga orang Filipina pada umumnya tidak mengenal prasasti atau naskah logam, dan hanya menggunakan bahan yang mudah lapuk seperti bambu, kulit kayu (Sumatra), dan lontar (Sulawesi). Naskah yang masih ada pada umumnya tidak lebih tua daripada 200 tahun sehingga kita tidak tahu banyak tentang sejarah perkembangan aksara-aksara Nusantara tersebut.

Diduga bahwa semua tulisan Nusantara di luar Jawa dan Bali berasal dari sumber yang sama yang dianggap berada di Sumatra bagian selatan pada masa kejayaan Sriwijaya. Di antara aksara-aksara Nusantara yang paling dekat dengan ak-sara Batak adalah akak-sara Kerinci (surat incung), akak-sara Lebong, Lembak, Lintang, Pasemah, Rejang, Serawai (surat ulu), serta aksara Lampung. Sama dengan daerah Batak, daerah-daerah tersebut juga agak terpencil di daerah pegunungan sehingga kurang terpengaruh oleh pengaruh-pengaruh asing yang dibawa dari seberang lautan dan secara lambat merembet dari pesisir ke pedalaman. Salah satu pengaruh budaya asing adalah masuknya agama Islam. Serentak dengan penyebaran agama Islam ber-sebar pula tulisan Arab yang di Melayu terkenal sebagai tulisan Jawi. Aksara “Arab gundul” tersebut cepat menggantikan aksara-aksara Sumatra asli yang kemudian hilang sama sekali.

Karena daerah-daerah yang disebut di atas berada di pedalaman dan agak terpencil, maka pengaruh Islam baru dirasakan pada abad ke-19 sehingga aksara asli masih dapat bertahan sampai pada abad ke-20. Besar kemungkinan bahwa aksara Mi-nangkabau dan Melayu juga pernah ada, tetapi kemudian digantikan oleh tulisan Arab-Melayu sehingga hilang tak berbekas. Aksara-aksara surat ulu di Sumatra bagian selatan banyak memiliki persamaan dengan huruf Batak. Huruf Ka, Ga, dan Ha hampir sama bentuknya, dan juga huruf Da masih banyak menunjukkan persamaan. Persamaan tersebut dapat dilihat pada tabel 2.2.


(23)

Tabel 2.2 Persamaan Aksara

Persamaan Surat Batak, Surat Ulu, dan Surat Incung

Sebagian nama anak huruf juga sangat mirip. Selain itu semua aksara Sumatra dan termasuk juga sebagian aksara Sulawesi dan Filipina memiliki persamaan yang struktural yang membedakannya dengan aksara India, Asia Tenggara, Jawa, dan Bali. Ciri-ciri khas aksara-aksara Sumatra, Sulawesi, dan Filipina adalah kesederhanaannya. Dibandingkan dengan aksara-aksara India yang memiliki empat puluhan aksara ditambah belasan tanda diakritik, tulisan-tulisan Nusantara jauh lebih sederhana. Tulisan Jawa dan Bali memiliki 20 aksara dan 10 diakritik, tulisan Lampung memiliki 20 aksara dan 12 diakritik, tulisan Makasar 19 aksara dan 5 diakritik, dan tulisan Ta-galog hanya 15 aksara dan dua diakritik. Tulisan-tulisan India dan juga tulisan Sunda, Jawa, dan Bali mempunyai tanda “pasangan”, ialah tanda diakritik penanda konsonan yang ditulis untuk menutup konsonan lain di depannya. Tulisan-tulisan Nusantara di luar Jawa dan Bali tidak menggunakan pasangan sehingga jumlah huruf yang harus dihafal jauh berkurang.

Kesederhanaan dalam bentuk aksaranya juga adalah ciri-ciri khas bagi aksara-aksara tersebut. Bila dibandingkan dengan aksara-aksara Jawa atau Bali, tampak bahwa aksara Sumatra, Sulawesi dan Filipina mempunyai bentuk yang lebih sederhana. Bentuk yang berlengkung-lengkung telah diganti oleh bentuk yang lebih bersegi yang lebih sesuai untuk menulis di permukaan yang keras seperti di kulit bambu. Aksara-aksara tersebut juga memperkenalkan sebuah hal yang baru yakni aksara-aksara yang didahului bunyi sengau. Batak (Karo) memiliki dua huruf tambahan yakni Mba dan Nda, aksara Kerinci dan Rencong menambahkan dua lagi yakni Ngga dan Nja. Aksara Bugis juga mempunyai empat aksara yang bersengau ialah Ngka, Mpa, Nra, dan Nca. Perlu dicatat bahwa gejala tersebut tidak ada pada aksara Batak selain Karo, dan juga tidak ada di Lampung, Makasar, dan Filipina. Karena


(24)

persamaan-persamaan yang tadi disebut, dapat diduga bahwa semua aksara Nusantara di luar Jawa dan Bali berasal dari satu aksara purba. Aksara purba tersebut kemungkinan besar tercipta di daerah Sumatra selatan pada masa kejayaan dan di sekitar wilayah Sriwija.

Aksara purba tersebut dapat dipastikan tercipta di bawah pengaruh aksara-aksara Palawa yang telah berkembang di wilayah tersebut, namun diolah sedemikian rupa sehingga bentuknya menjadi lebih sederhana supaya lebih mudah dipelajari, lebih sesuai untuk bahasa-bahasa setempat (yang dari segi bunyi jauh lebih sederhana daripada bahasa-bahasa India), dan juga lebih sesuai untuk menulis di atas bambu. Bagaimana persisnya perkembangan aksara Sumatra selanjutnya, bagaimana hubungannya dengan kerabat-kerabat lainnya di Filipina dan di Sulawesi, dan bagai-mana persisnya peranan aksara Jawa dalam pembentukan aksara Sumatra tidak diketahui dan mungkin juga kelak tidak akan diketahui.

Walaupun pengetahuan kita tentang masa lampau aksara Batak sangat terbatas, kita dapat mengetahui sedikit tentang sejarah perkembangan aksara Batak dengan cara memperbandingkan aksara Batak satu sama lain, dan juga dengan aksara Nusantara lainnya. Ternyata penelitian yang demikian yang sampai sekarang belum pernah dilakukan, sangat bermanfaat untuk menambah pengetahuan kita tentang perkembangan dan arah penyebaran aksara Batak. Analisa ini dimulai pada ina ni surat. (Kozok, 1999).

2.2.1.1aksara ( ina ni surat )

Van der Tuuk berpendapat bahwa perkembangan aksara Batak terjadi dari selatan ke utara, dan bahwa daerah asalnya di Mandailing (Tuuk 1971:77). Parkin (1978:100) juga berpendapat demikian karena alasan-alasan berikut: Aksara Nya, Wa dan Ya melambangkan tiga bunyi yang terdapat dalam bahasa Mandailing sementara dalam bahasa Toba tidak ada bunyi [ny], [w], atau [y].

Dengan demikian ketiga huruf tersebut sebenarnya mubazir karena tidak terdapat bunyinya dalam bahasa Toba. Sebagai contoh, Mandailing sayur menjadi saur di Toba, manyurat menjadi manurat. Pada bahasa Pakpak dan Karo tidak ada bunyi [ny] dan juga tidak ada aksara Nya. Keberadaan Nya di aksara Toba membuktikan


(25)

bahwa aksara Toba berasal dari Mandailing. Argumentasi Parkin sangat masuk akal. Sekiranya aksara Batak mula-mula tercipta di Toba, tak mungkin ada huruf Nya, karena tidak ada bunyi itu dalam bahasa Toba. Di Tanah Karo – daerah yang paling

utara letaknya, huruf

Ca. Ternyata urutan dalam abjadnya tetap sama dengan posisi Nya ialah antara La dan

I. Dengan demikian, huruf

adalah dari selatan ke utara. Teori tersebut juga didukung oleh faktor-faktor lainnya: Keragaman dalam varian-varian aksara paling besar di Mandailing, disusul oleh Toba dan Karo.

Namun di Karo, keragaman tersebut disebabkan oleh adanya perkembangan-perkembangan yang relatif baru seperti variasi yang ada pada huruf Sa, Da, dan Ca, dan terutama karena adanya sejumlah aksara baru seperti ketiga varian Mba , dan serta kedua varian Nda ( ). Semua varian tersebut merupakan perkembangan baru dan tidak ada di daerah Batak lainnya. Huruf Ma memiliki berbagai varian di Toba dan Angkola-Mandailing: , dan Pakpak, Karo dan Simalungun masing-masing hanya ada satu bentuk saja.

Di antara ketiga varian tadi, bentuk biasa digunakan di Angkola dan Mandailing, tetapi agak jarang digunakan di Toba yang lebih cenderung memakai dan . Keragaman dalam varian-varian aksara di Toba, dan khususnya di Man-dailing menunjuk pada usia tinggi tulisan di daerah itu. Sebagai contoh akan saya mengemukakan dua aksara, yakni Na dan Ja.

Sebagaimana telah ditunjuk di atas, bentuk Na dalam aksara Kawi sangat mirip dengan varian yang terdapat di Mandailing dan di Toba. Hal ini tidak berarti bahwa aksara Batak berasal dari aksara Kawi, melainkan menunjukkan bahwa kedua aksara tersebut masih mempunyai nenek moyang yang sama atau bahwa terdapat pengaruh Jawa pada sejarah perkembangan aksara Batak purba.

Keberadaan varian yang oleh Voorhoeve disebut “Na kuno” di Mandailing dan Toba juga menunjukkan bahwa perkembangan aksara Batak adalah dari selatan ke utara. Bentuk aksara Ja ( ) yang ditambah sebuah garis horisontal. Hal yang sama juga berlaku untuk da dan ja pada


(26)

aksara Kawi, tetapi bukan pada aksara Palawa sehingga dapat disimpulkan bahwa pada tahap awal perkembangan aksara Batak mesti ada pengaruh Kawi. Aksara kemudian disederhanakan sehingga di daerah utara dari Toba hanya bentuk yang ada. Bila kita perbandingkan kedua aksara selatan (Angkola-Mandailing dan Toba), ternyata hanya terdapat sedikit perbedaan saja. Aksara Toba kehilangan beberapa varian dari aksara Sa dan Ha, tetapi di daerah Toba juga terjadi perkembangan baru dengan memperkenalkan varian Ta ( ) dan varian Wa ( ).

Namun tidak tertutup pula kemungkinan bahwa dan adalah bentuk yang lebih lama yang di Mandailing dan di sebagian Toba kemudian berubah menjadi

varian Ta ( ) dan varian Wa (

lah bentuk yang lebih lama, dan dan

dan ) dan Karo (

). Mesti diakui bahwa secara teoretis terdapat kemungkinan bahwa varian v meru-pakan perkembangan baru di Pakpak-Dairi yang kemudian bersebar ke selatan lalu di-pakai di sebagian daerah Toba.

Akan tetapi kemungkinan tersebut hanya kecil saja. Sebagaimana akan ditunjukkan nanti, terlalu banyak indikasi bahwa perkembangan aksara Batak adalah dari selatan ke utara dan bukan sebaliknya. Suatu hal yang perlu dicatat di sini adalah bahwa aksara Simalungun memiliki beberapa persamaan dengan Mandailing. Misalnya varian Sa, (yang sangat mirip dengan

varian-varian Angkola-Mandailing dan

Simalungun, tetapi tidak di Toba.

Hal itu menunjukkan bahwa ada kemungkinan besar bahwa sudah sangat dini aksara Batak dari Mandailing masuk ke Simalungun. Bentuk huruf Ya dengan garis horisontal yang melengkung juga menunjukkan pengaruh Mandailing. Menurut Van der Tuuk, kedua varian Toba untuk huruf Ta

Timur”, sedangkan varian dan

der Tuuk tidak menjelaskan daerah mana yang dimaksud dengan Toba Barat dan Toba Timur, tetapi kalau Van der Tuuk benar, dapat kita tarik kesimpulan sebagai berikut: Aksara Batak mula-mula berkembang di daerah Angkola-Mandailing, barangkali tidak jauh dari perbatasan Sumatra Barat.


(27)

Dari sana aksara Batak tersebar arah ke utara sehingga terbentuk sebuah aksara purba Toba-Timur–Simalungun (kemudian disebut Toba-Simalungun) di daerah antara Parapat dan Balige yang subur dan padat penduduk. Aksara Simalungun kemudian tidak menunjukkan perkembangan yang berarti, tetapi berubah sedikit bentuknya sehingga semua aksara kelihatan seperti terdiri dari garis-garis yang terpisah-pisah sebagaimana kelihatan sekali pada huruf Ma dan Ra.

Aksara purba Toba-Simalungun menurunkan dua jenis huruf: Toba Timur

yang menggunakan Ta dan Wa selatan: , dan

menggunakan Ta dan Wa utara: dan

perkembangan kemudian yang masuk dari Toba Barat ke Pakpak-Dairi ( dan dan Karo (hanya ).

Perlu ditegaskan di sini bahwa tidak ada garis pasti antara ‘Toba Timur’ dan ‘Toba Barat’. Naskah yang dapat dipastikan daerah asalnya terlalu sedikit. Lagi pula, bentuk huruf mana yang dipakai oleh salah seorang juga sangat tergantung pada gurunya. Sifat datu yang suka mengembara turut mengaburkan batas-batas antara daerah.

Daerah Karo dapat dipastikan sebagai daerah yang paling belakangan menerima aksara Batak. Tetapi justru di daerah ini, tulisannya berkembang sangat subur. Ratusan naskah Karo yang tersimpan di berbagai koleksi di mancanegara mem-buktikan bahwa bukan saja para datu (di Karo disebut guru) bisa membaca dan menulis.

Di situ juga banyak terdapat pulas – semacam surat kaleng yang di daerah Karo juga terkenal sebagai musuh běrngi (musuh di malam hari). Tetapi bukti yang paling kuat bahwa aksara Batak cukup umum diketahui oleh para pria Karo adalah kebiasaan menulis ratapan percintaan (bilang-bilang) di ruas-ruas bambu. Barangkali justru karena surat Batak di Karo menjadi demikian populer, maka terjadi perkembangan-perkembangan yang baru seperti dibuktikan oleh huruf Mba dan Nda yang khas Karo. Pada tabel 2.3 dapat dilihat berbagai aksara Batak.


(28)

Tabel 2.3 Aksara

2.2.1.2 Tanda diakritik (anak ni surat)

Untuk menambah bunyi vokal, bunyi sengau dan bunyi /h/ serta untuk mematikan bunyi /a/ perlu ditambah beberapa tanda diakritik (anak ni surat). Perhatikan bahwa dari semua bahasa Batak, bahasa Toba memiliki jumlah bunyi bahasa yang paling sedikit. Hanya bahasa Karo dan Pakpak yang memiliki bunyi e-pepet dan oleh sebab itu maka ada huruf tersendiri untuk e-pepet yang berbeda dengan e-keras.

Dalam bahasa Batak lainnya bunyi e-pepet menjadi /o/: telu => tolu, besi => bosi. Baik Toba maupun Mandailing tidak memiliki bunyi /h/ pada akhir suku kata sehingga: idah => ida, rumah => ruma, geluh => golu, reh =>ro. Tanda – tanda anak ni surat dapat dilihat pada tabel 2.4. dan nama anak ni surat dapat dilihat pada tabel 2.5.


(29)

Tabel 2.4 tanda diakritik (anak ni surat)


(30)

Tabel 2.5 Nama anak ni surat

Karo Pakpak Simalungun Toba Mandailing

ḝ kḝbḝrḝtḝn kḝbḝrḝtḝn podi - - - E kḝtelengḝn kḝtadingin hatalingan hatadingan Talinga I kḝlawan Kaloan haluan haluain

hauluan haulian siulu, uluwa

Uluwa

O kḝtolongḝn Sikora sihorlu siala, sihora Siala ulu

Ou - - hatulungan - -

U Sikurun kḝbḝrḝtḝn haboritan haborotan haboruan

Boruta buruta

Ng kḝbincarḝn kḝbincarḝn haminsaran haminsaran hamisaran paminggil

Amisara

H kḝjḝringḝn Sikorjan hajoringan - - tanda mati pḝnḝngḝn Pangolat ? panongonan pangolat pangolat

Pada tabel 2.5 merupakan keterangan – keterangan nama anak ni surat yang ada pada aksara Batak.


(31)

Jika digambarkan, arah penyebaran aksara Batak adalah seperti gambar 2.2.

Gambar 2.2Arah Penyebaran Aksara Batak

(Sumber : Kozok, 1999)

2.3 Bahasa Karo

Bahasa Karo adalah bahasa persatuan dari suku Karo untuk berkomunikasi antara satu dengan yang lainnya.

2.4 Proses Stemming

Stemming adalah suatu proses pengembalian suatu kata berimbuhan ke bentuk dasarnya (stem/root). (Mahendra, 2008).


(32)

2.5 Algoritma Enhanced Confix Stripping Stemmer

Algoritma Enhanced confix stripping Stemmer merupakan peningkatan peforma dari algoritma Confix Stripping stemmer yang dikembangkan oleh Mahendra (2008), dan merupakan salah satu algoritma yang dapat mengatasi proses stemming yang spesifik untuk Bahasa Indonesia. Pemilihan algoritma Enhanced confix stripping Stemmer

merujuk pada penelitian Mahendra (2008). Pada dasarnya, algoritma Enhanced confix stripping Stemmer merupakan modifikasi dari algoritma confix stripping Stemmer

(Asian, 2007) yang dikembangkan dari algoritma stemming yang dibuat oleh Nazief dan Adriani (1996) dengan beberapa penambahan aturan tertentu yang telah terbukti mampu meningkatkan kinerja Stemmer tersebut.

Algoritma stemming Nazief dan Adriani dikembangkan berdasarkan pada aturan morfologi Bahasa Indonesia yang mengelompokkan dan mengenkapsulasi imbuhan-imbuhan, termasuk di dalamnya adalah awalan (prefix), sisipan(infix), akhiran (suffix) dan gabungan awalan-akhiran (confixes). Algoritma Enhanced confix stripping Stemmer menambahkan penggunaan kamus kata dasar dan mendukung

recoding, yakni penyusunan kembali kata-kata yang mengalami proses stemming

berlebih.

Tabel 2.6 Kombinasi Awalan-Akhiran yang dilarang

Awalan (prefix)

Akhiran (suffix) yang

tidak diperbolehkan

be- -i

di- -an

ke- -i, -kan

me- -an

se- -i, -kan

te- -an

Algoritma Enhanced confix stripping Stemmer (Mahendra, 2008) adalah sebagai berikut:

1. Cek kombinasi akhiran dan awalan yang dilarang sesuai Tabel 2.1, apabila bernilai benar maka lakukan penghilangan awalan terlebih dahulu. Apabila bernilai salah, maka penghilangan akhiran dilakukan terlebih dahulu.


(33)

2. Lakukan recoding apabila diperlukan. 3. Lakukan loopPengembalianAkhiran.

4. Cek apakah terdapat tanda hubung (‘-’) yang menandakan bahwa input kata tersebut adalah kata ulang atau bentuk jamak. Jika ada, maka lakukan stemming

pada sub-kata di sebelah kiri dan kanan tanda hubung tersebut. Apabila stemming

memberikan hasil yang sama, maka kata dasar kata ulang tersebut adalah hasil

stemming yang didapatkan.

5. Jika proses-proses di atas gagal, maka input kata yang distemming dianggap sebagai kata dasar.

Pada setiap langkah, dilakukan proses pengecekan outputstemming ke kamus. Apabila ditemukan, maka proses ini berhenti. Berikut adalah contoh proses stemming pada kata “perpolitikan” dengan menggunakan Enhanced confix stripping stemmer:

1. Cek kombinasi awalan dan akhiran yang dilarang: salah. Hilangkan akhiran terlebih dahulu.Penghilangan akhiran menyisakan kata “perpoliti”.

2. Penghilangan awalan menyisakan kata “politi” (sesuai aturan 23 pada Tabel 2.2). 3. Karena aturan 23 pada Tabel 2.2 tidak mendefinisikan karakter recoding, maka

proses recoding tidak dilakukan.

4. Kata “politi” tidak ada di kamus, oleh karena itu dilakukan loopPengembalianAkhiran:

 Awalan-awalan yang telah dihilangkan, dikembalikan lagi. Langkah ini menghasilkan kata “perpoliti”.

 Akhiran-akhiran dikembalikan. Karena akhiran yang sebelumnya dihilangkan adalah “-kan”, maka karakter ’k’ saja yang dikembalikan terlebih dahulu. Proses ini menghasilkan kata “perpolitik”.

 Karena “perpolitik” tidak ada di kamus, maka proses penghilangan awalan dilakukan. Proses ini menghasilkan kata “politik”.

 Karena “politik” ditemukan dalam kamus, proses loopPengembalianAkhiran ini berhenti. Kata dasar “perpolitikan” adalah “politik”.

2.6 Bahasa Pemprograman PHP

PHP (Hypertext Preprocessor) adalah bahasa komputer yang dibuat untuk pengembangan web dinamis. Pada umumnya PHP digunakan di server namun juga dapat berdiri sendiri sebagai aplikasi graphical (Kadir, 2001).


(34)

Dalam penelitian ini penulis menggunakan bahasa pemprograman PHP dan MySQL dikarenakan oleh bahasa pemprograman PHP dan MySQL memiliki beberapa kelebihan seperti dinyatakan oleh Sutarman (2007) kelebihannya sebagai berikut: 1. Bahasa pemograman PHP adalah sebuah bahasa script yang tidak melakukan

sebuah kompilasi dalam penggunaannya.

2. Web Server yang mendukung PHP dapat ditemukan dimana-mana dari mulai IIS sampai dengan Apache dengan konfigurasi yang relatif mudah.

3. Dapat berjalan pada sistem operasi yang berbeda seperti UNIX, Windows, dan Macintosh.

Sedangkan database MySQL memiliki beberapa kelebihan, yaitu: 1. Portability

MySQL dapat berjalan stabil pada berbagai sistem operasi seperti Windows,Linux, FreeBSD, Mac Os X Server, Solaris, Amiga dan masih banyak lagi.

2. Open Source

MySQL dapat didistribusikan secara open source, dibawah lisensi GPLsehingga dapat digunakan secara gratis.

3. Multiuser

MySQL dapat digunakan oleh beberapa userdalam waktu yang bersamaan tanpa mengalami masalah atau konflik.

4. Performance tuning

MySQL memiliki kecepatan yang baik dalam menangani query sederhana,dengan kata lain dapat memproses lebih banyak SQL per satuan waktu.

5. Column types

MySQL memiliki tipe kolom yang sangat kompleks, seperti signed/ unsigned integer,

float, double, char, text, date, timestamp, dan lain-lain. 6. Command dan functions

MySQL memiliki operator dan fungsi secara penuh yang mendukung perintah Select

dan Wheredalam query. 7. Security

MySQL memiliki beberapa lapisan sekuritas seperti level subnetmask, nama host,dan izin akses user dengan sistem perizinan yang perizinan yang mendetail serta password


(35)

8. Scalability dan limits

MySQL mampu menangani database dalam skala besar, dengan jumlah recordslebih dari 50 juta dan 60 juta ribu serta 5 milyar baris. Selain itu batas indeksyang dapat ditampung mencapai 32 indeks pada tiap tabelnya.

9. Connectivity

MySQL dapat melakukan koneksi dengan client menggunakan protocolTCP/IP, Unix soket (UNIX), atau Named Pipes (NT).

10. Localization

MySQL dapat mendeteksi pesan kesalahan pada client dengan menggunakan lebih dari dua puluh bahasa. Meskipun demikian, bahasa Indonesia belum termasuk di dalamnya.

11. Interface

MySQL memiliki interface (antar muka) terhadap berbagai aplikasi dan bahasa pemograman dengan menggunakan fungsi API (Application Programming Interface). 12. Clients dan tools

MySQL dilengkapi dengan berbagai tool yang dapat digunakan untuk adminsitrasi

database, dan pada setiap tool yang ada disertakan petunjuk online. 13. Struktur Tabel

MySQL memiliki struktur tabel yang lebih fleksibel dalam menangani ALTERTABLE, dibandingkan database lainnya semacam PostgreSQL atau pun Oracle.

PHP mempunyai lima macam tipe data, yaitu:

1. Integer adalah Tipe data ini digunakan untuk menyatakan bilangan bulat karena tidak mempunyai titik desimal sehingga tidak diperbolehkan menggunakan karakter koma antara dua bilangan.

2. Float/double atau bilangan pecahan

3. String adalah

satu kalimat, yang biasanya diapit oleh dua tanda kutip

4. Array adalah suatu struktur data yang terdiri atas banyak variabel dengan tipe data sama, dimana masing-masing elemen variabel mempunyai nilai indeks. 5. Objek

Tipe data yang digunakan adalah array yang berfungsi untuk menampung sejumlah nilai yang berbeda. Data yang disimpan dalam array menggunakan indeks


(36)

yang berfungsi untuk memudahkan pencarian kembali data tersebut. Dalam penelitian ini, fungsi tersebut sangat dibutuhkan ketika kalimat diparsing akan disimpan di dalam

array dengan indeks yang autoincrement dan data akan dipanggil kembali sesuai indeksnya saat menampilkan gambar dari database. Tipe data array memiliki pointer untuk menunjukkan dimana indeks yang aktif. Untuk array yang baru dideklarasikan, nomor indeks adalah nomor indeks yang pertama [0]. Untuk mengetahui nomor indeks yang aktif digunakan fungsi key() dan untuk mengetahui jumlah elemenkata yang telah diparsing digunakan fungsi count().

Pada PHP juga tersedia fungsi bernama ereg yang dapat digunakan untuk menangani ekspresi regular (dalam hal ini digunakan fungsi preg() karena kompatibel pada PHP 5.3 dan versi selanjutnya, khususnya fungsi preg_replace yang berguna untuk mengganti suatu bagian string dengan string yang lain berdasarkan ekspresi regular).

2.7 Penelitian Terdahulu

Adapun penelitian terdahulu seperti Aplikasi kamus Digital Bahasa Batak – Indonesia – Inggris menggunakan Visual basic 6.0 (Harahap, 2013). Implementasi Algoritma

Enhanced Confix Stripping Stemmer pada kamus sistem bahasa isyarat Indonesia. (Iqramitha, 2013). Penggunaan Algoritma Semut Dan Confix Stripping Stemmer

Untuk Klasifikasi Dokumen Berita Berbahasa Indonesia (Mahendra, 2008). Dan penelitian ini terinspirasi dari kamus Karo pada salah satu website yang didalamnya juga terdapat konversi Bahasa Indonesia ke dalam bentuk Aksara Karo secara terpisah, dalam website tersebut juga tidak menerima adanya input imbuhan, oleh karena itu peneliti bermaksud menambahkan fitur baru dari website tersebut dan menggabungkan antara kamus dan konversi untuk penulisannya. Website tersebut adalah

Pada tabel 2.7 merupakan penelitian – penelitian terdahulu.

No Judul Kelebihan/Kelebihan/Keteraangan Penulis

1 Aplikasi kamus Digital Bahasa Batak – Indonesia – Inggris menggunakan Visual basic 6.0. (2013)

Tidak menerima input kata berimbuhan


(37)

No Judul Kelebihan/Kekurangan/Keterangan Penulis 2 Implementasi

Algoritma Enhanced

Confix Stripping

Stemmer pada kamus sistem bahasa isyarat Indonesia. (2013)

Dapat menguraikan kata berimbuhan dan kata baku secara jelas, namun untuk kata awalan ke dan kata depan ke belum dapat dibedakan.

Iqramitha

3 Penggunaan Algoritma Semut Dan Confix Stripping Stemmer Untuk Klasifikasi Dokumen Berita Berbahasa Indonesia. (2008)

Adanya kendala untuk masalah kata yang mengandung sisipan.

Mahendra


(38)

BAB 3

ANALISIS DAN PERANCANGAN SISTEM

Pada bab ini, akan membahas beberapa hal diantaranya data yang digunakan, penerapan algoritma dan analisa perancangan sistem dalam mengimplementasikan Algoritma Enhanced Confix Stripping Stemmer (ECS) pada proses stemming untuk menerjemahkan Bahasa Indonesia ke dalam bentuk Bahasa Karo.

3.1 Data yang digunakan

Data yang digunakan berdasarkan dari kamus Karo Indonesia Darwin Prinst (2002) dimana kamus tersebut berisikan kata – kata umum yang sering dibicarakan sehari – hari.

3.2 Proses Penerjemahan

Pada tahap awal, user menginputkan kata yang hendak diartikan kedalam kolom yang telah disediakan. Kemudian sistem akan memproses input tersebut. Setiap kata yang diinputkan akan mengalami proses stemming, menjadi terpisah antara imbuhan dan kata dasar.

Jika terdapat kata yang sama dengan kata yang ada di database maka kata tersebut akan tersimpan sementara, lalu sistem akan mulai memproses dan memunculkan terjemahan dari input tadi. Dan jika ternyata kata yang diinputkan tidak terdapat di dalam database maka sistem akan melanjutkan proses penyesuaian dengan Aksara Batak Karo. Diagram sistem pada gambar 3.1 dapat mempresentasikan proses penerjemahan Bahasa Indonesia ke dalam Bahasa Karo dan penyesuaian Aksara Batak Karo.


(39)

25

Input kata 1

Jika tidak terdapat kata pada database, maka kata tersebut langsung melanjutkan proses penyesuaian dengan Aksara Batak Karo Proses Stemming

2

Mencari terjemahan yang sesuai dengan Database

3

Menyesuaikan dengan Aksara Batak Karo

4 Menampilkan output

5

Gambar 3.1 Diagram Sistem

Proses dari diagram pada gambar 3.1 dapat diperjelas dengan contoh sebagai berikut : 1. Diberikan input kata seperti :Terjatuh

2. Stemming kata : [ter] [jatuh]

3. Setiap kata di cek ke dalam database, apakah kata tersebut terdapat di dalam

database atau tidak.

4. Jika terdapat kata yang tidak cocok di dalam database, maka sistem akan melanjutkan proses selanjutnya yaitu menyesuaikan dengan Aksara Batak Karo. 5. Setelah selesai proses penerjemahan kata di dalam database, maka kata tersebut

disimpan sementara. Lalu kata yang tersimpan tadi akan kembali dicocokkan dengan kata yang ada dalam database Aksara Batak Karo.


(40)

26

Untuk flowchart sistem dapat dilihat pada gambar 3.2

Mulai

Input Kata

Kata distemming

Cek kata dasar

Sesuaikan imbuhan dengan

Bahasa Karo

Cek Imbuhan

Pasangkan Kembali Dengan

kata dasar

Ambil Aksara Karo

Selesai Ya

Ya

Tidak

Tidak


(41)

27

Algoritma Enhanced Confix Stripping Stemmer adalah algoritma stemming yang akurat untuk mencari kata dasar dari suatu kata dalam bentuk bahasa Indonesia (Sholihin, 2013).

Pada tahap pertama tiap kata yang diinputkan oleh user akan distemming

menggunakan algoritma ECS yang sudah dimodifikasi. Jika kata tersebut terdapat dalam kamus kata, maka kata merupakan kata dasar. Jika kata tidak terdapat di dalam kamus kata, maka kata tersebut akan mengalami proses stemming dan jika kata tersebut tidak dapat distemming, maka kata tersebut akan diurai menjadi huruf per huruf. Dan selanjutnya akan dicocokkan dengan aksara Batak Karo yang terdapat di dalam database yang tersedia.

3.3 Pedoman Penulisan Aksara Batak

Penggunaa surat batak versi karo telah dijelaskan oleh Neumann (1922) dan Smit (1916).

a. Anak ni surat

Semua ina ni surat yang berupa konsonan berakhir dengan bunyi [a] (bp

bapa). Bunyi [a] ini dapat dihapus dengan menggunakan tanda bunuh yang disebut

pěněngěn [K] atau pangolat [T]. Fungsi diakritik tersebut persis sama dengan diakritik yang disebut virama dalam bahasabahasa India, atau paten dalam bahasa Jawa. Pada contoh berikut aksara Ka kehilangan bunyi [a]: lk\lk\laklak.

Bunyi [a] yang melekat pada ina ni surat dapat diubah menjadi vocal lain dengan menambahkan anak ni surat. Huruf Ga (g) misalnya dapat diubah menjadi gE

Ge seperti dalam kata bligE Balige. Selain itu, ada dua diakritik yang menambahkan bunyi [ng] atau [h] pada ina ni surat, contohnya adalah b^kr Bangkara, atau rumh

rumah [K].

Dua jenis diakritik dapat dikombinasikan: pti^pating [K], reh rěh [K]. Bila terdapat kombinasi dari anak ni surat yang letaknya di belakang ina ni surat (yakni i, u, atau e) dan anak ni surat /h/ atau /ng/ (yang terletak di atas-kanan ina ni surat) maka anak ni surat /h/ atau /ng/ agak bergeser ke kanan sehingga posisinya tepat di atas anak ni surat i, u, atau e. Perlu dicatat bahwa aturan ini tidak selalu dipatuhi.


(42)

28

Pada suku kata tertutup yang terdiri dari urutan Konsonan - Vokal - Konsonan, anak ni surat yang menandai vokal selalu diletakkan di antara ina ni surat yang kedua dan anda bunuh seperti terlihat pada contoh ini:

gko\gok; borti- borit [S]; sni-tk-sintak [K].

b. Aksara A dan Ha

Menurut Voorhoeve (1975:41), makna asli hurufaadalah [ha] dan huruf k bermakna [ka], tetapi dalam dialek-dialek selatan a selalu berbunyi [a] dan k bermakna [ha] atau [ka]. Pada kelompok Batak Utara, a selalu bermakna [a] atau [ha] dan k menjadi [ka] seperti dapat dilihat pada tabel berikut:

Karo akuaku

Simalungun aKahu

Pakpak aKaku

Toba aKahu

Mandailing aHahu

Huruf a juga digunakan sebagai penopang vokal. Karena surat Batak hanya mengenal dua ina ni surat yang bermakna vokal, ialah I dan U, maka huruf a dipakai bila vokal-vokal [e], [ǝ], dan [o] berada pada awal suku kata. Dengan demikian aE dibaca [e],

ao dibaca [o] dan sebagainya: aEtkE\etek, aakE\aek, amo\Pompu, ani\dinda,

aN\d^undang.

c. Aksara I dan U

Aksara ina ni surat I dan U (I dan U) hanya digunakan di awal suku kata terbuka (UL ulu, pI<to\ paingot). Bila sebuah suku kata tertutup diawali dengan bunyi [i] atau [u] maka vokal tersebut diwakili oleh kombinasi huruf a dan anak ni surat /i/ atau /u/ (aM\pm umpama, ani\D^ indung). Aturan ini juga berlaku bagi suku kata yang dimulai dengan vokal-vokal lainnya: (amo\Pompu, aoloolo, aems-

ěmas [K]).

*K Di surat Batak versi Karo, huruf I dan U boleh dipakai, boleh tidak. Di mana pun posisinya, I selalu dapat diganti dengan ai, dan U boleh diganti dengan au. Dengan demikian, kata iluh dapat ditulis ailuh atau Iluh. Di semua surat Batak lainnya terdapat kecenderungan untuk selalu menggunakan I dan U bila berada pada

posisi awal suku kata terbuka.


(43)

29

Karena fonem [w] dan [y] tidak terdapat pada bahasa Batak Toba, maka aksara Wa dan Ya tidak perlu bila menulis surat Batak versi Toba. Namun demikian, huruf Wa (w) dan Ya (w) sering dipakai, juga dalam naskah-naskah Batak Toba, untuk menyambungkan dua vokal. Kata reak, misalnya, dapat ditulis reak\ atau reyk\

dan demikian juga terdapat varian Da (dua) dan Dw (duwa). Tidak jarang kita menjumpai kedua varian pada satu naskah.

Di Karo dan Simalungun deretan dua vokal selalu harus disambungkan dengan menggunakan w dan y. Dalam surat Batak versi Karo, kata sea selalu ditulis sEy

(seya) dan tidak pernah sEa (sea); demikian juga dengan kata dua yang harus ditulis

duw. Di semua surat Batak, w dipakai untuk menyambung dua vokal bila vokal pertama adalah [u] atau [o] (yakni ua, oa, oe, dan ue), sedangkan y menyambung dua vokal bila yang pertama menjadi [e] atau [i] (yakni ia, io, ea, dan eo).

*K Di Karo, vokal ganda (diftong) [ai] biasanya ditulis /e/: kata nai biasanya ditulis nE (ne), tetapi kadang-kadang varian nyi (nayi) digunakan juga. Menurut uli kozok, kebiasaan ini hanya ada di Karo, sedangkan dalam naskah-naskah Toba dan Mandailing deretan vokal [ai] seperti dalam contoh kata sai selalu ditulis sai (sai), dan dalam hal ini s mewakili /sa/ dan ai /i/.

Vokal ganda [au] tidak lazim digunakan di Karo. Di antara beberapa kata yang menggunakan [au] terdapat kata lau (air, sungai) dan laut (laut). Dalam naskah-naskah Karo, lau selalu ditulis layo, dan laut selalu ditulis lawit. Dalam naskah Toba dan Mandailing, [au] selalu ditulis seperti dalam kata saT\, yaitu s /sa/ – aT\ /ut/. Namun perlu diingat bahwa kombinasi bunyi [a] dan [u] dalam kata saut sebetulnya bukan diftong karena [a] dan [u] diucapkan secara terpisa menjadi sa-ut.

*S Pada naskah Simalungun huruf w dan y sering digunakan untuk menulis kata yang berawal vokal. Dengan demikian, ulang sering ditulis wulang, dan on

ditulis won. Kata yang berawal bunyi [i] dan [e] juga sering ditulis dengan y.

Diftong [ei] sering terdapat dalam bahasa Simalungun, misalnya dalam kata

atei atau tarsulei. Kedua kata ini biasa ditulis atE ate dan tr-SlEtarsule. Kadang-kadang huruf Ya dipakai untuk menambah vokal /i/: atEyiatei,tr-SlEyi, tarsulei.

d. Nasalisasi dan aksara Mba dan Nda (K)

Salah satu ciri khas surat Batak versi Karo adalah bahwa bunyi sengau [m], [n], dan

[ŋ] yang terdapat sebelum konsonan [b], [c], [d], [g], [j], [k], dan [p] tidak ditulis.

Dengan demikian, kata panta selalu ditulis pt. Demikian juga dengan kata tonggal

yang selalu ditulis togal, banci menjadi baci, nangkih menjadi nakih, sampur menjadi

sapur dan sebagainya:


(44)

30

Tonggal = togal Togl

nande = nade ndE

lanja = laja lj

sampur = sapur spru-

tangkal = takal tkl-

Demikian juga dengan kata nande yang sering ditulis nade, dan kata mambur yang sering ditulis mabur walaupun terdapat aksara Nda dan Mba. Tingkat penggunaan kedua aksara tersebut tidak terlalu tinggi. Hanya sekitar 40% naskah Karo yang menggunakan aksara itu. Kemungkinan besar kedua aksara tersebut masih relatif baru, meskipun telah digunakan pada naskah Karo yang paling lama. Perlu dicatat bahwa umur naskah-naskah Karo yang berada di museum-museum di dalam dan di luar negeri jarang melebihi 120 tahun.

e. Kendala Morfemik

Seperti sudah disebut di atas, surat Batak sebenarnya bukan abjad karena tidak benar-benar fonetis. Hal itu juga tampak dari kenyataan bahwa hanya seorang yang mengetahui bahasanya dapat menulis surat Batak. Jika kita disuruh menulis kata

marina dengan menggunakan huruf Latin, kita dapat melaksanakan hal itu dan bisa menulis kata yang diucapkan tadi tanpa kesalahan walaupun kita tidak mengerti katanya. Ialah karena abjad Latin pada hakikatnya fonetis.

Lain halnya jika kita disuruh menulis kata yang sama dengan surat Batak. Jika kita tidak menguasai bahasa Batak Toba, tentu kita akan menulis mrin karena kita tidak tahu bahwa kata marina terdiri atas dua morfem yakni awalan {mar-} dan kata dasar {ina}. Struktur morfemik inilah yang turut mempengaruhi cara menulis surat

Batak, dan ada kecenderungan untuk menandai batas-batas morfemis dengan menulis

mr\In . Demikian juga dengan kata taringot tr\I<to\ atau parulian pr\Ulian\.

Perlu dicatat, bahwa aturan ini tidak selalu diperhatikan oleh penulis naskah-naskah Batak. Cukup banyak naskah yang menulis kata maringan mri<n\ dan bukan

mr\I<n\.

f. Konsonan ganda

*KP Dalam bahasa Karo dan Pakpak terdapat banyak kata yang mempunyai struktur KVKVK dengan e-pepet [ə] sebagai vokal pertama. Dalam hal ini, konsonan yang mengikuti pepet itu dapat dieja ganda: misalnya kata bělin ‘besar’ bila diucapkan pelan-pelan ejaan menjadi bel-lin. Dengan demikian, struktur kata sebenarnya bukan KVKVK, melainkan terdiri dari dua suku kata yang masing-masing berbunyi KVK. Penulisannya bisa belni- bělin atau ble-lni- běllin. Contoh lain adalah: bě-ne


(45)

31

dan běn-ne ‘hilang’, tě-mbe dan těm-mbe ‘jadi’ dan sebagainya. Penggandaan konsonan seperti itu adalah gejala yang umum sekali dalam naskah Pakpak dan Karo.

Menarik untuk dicatat bahwa penggandaan konsonan setelah e-pepet memili sejarah yang panjang. Dalam tulisan Jawi kata seperti senyum lazim ditulis dengn dua N: sennyum. Pada prasasti-prasasti Sriwijaya tidak ada tanda untuk e-pepet karena aksara induknya, aksara Palawa dari India, memang tidak memiliki tanda dikritis untuk e-pepet. Karena e-pepet begitu sering digunakan dalam bahasa Melayu maka para ahli kalam di zaman Sriwijaya menandai adanya e-pepet dengan menggandakan konsonan.

g. Awalan -er

*K Pada naskah Karo awalan ěr- selalu menjadi rě-, misalnya ěrkěrikěn ditulis

rěkěrikěn. Hanya pada beberapa naskah saja terdapat bentuk are-kerikne- (hěrkěrikěn).

3.4 Analisis Perancangan Sistem

Analisis perancangan sistem merupakan penggambaran atau perencanaan dari beberapa elemen dalam pengembangan aplikasi. Dalam tahap ini akan dijabarkan mengenai pengguna serta beberapa diagram yang dapat menjelaskan sistem seperti

use case diagram.

3.3.1 Analisis pengguna (user)

Analisis pengguna merupakan identifikasi para pengguna yang dapat melakukan interaksi dengan sistem. Dalam penelitian ini, pengguna hanya sebagai pengunjung yang akan melakukan penerjemahan kata dari bahasa Indonesia ke bahasa Karo. Dan sistem ini tidak memerlukan proses login.

3.3.2 Diagram use case

Perancangan sistem digambarkan dengan menggunakan pemodelan use case. Untuk pengidentifikasian aktor berdasarkan pada tahap analisis pengguna, aktor yang berperan dalam aplikasi ini hanya satu aktor yaitu pengunjung. Use case yang terjadi adalah use case melakukan terjemahan kata, membaca beranda, dan membaca tentang pembuat aplikasi. Diagram use case dapat memberikan gambaran interaksi yang terjadi antara aktor dengan use case di dalam sistem. Berdasarkan pengidentifikasian aktor dan use case, scenario use case yang terjadi dapat digambarkan dengan diagram


(46)

32

Pengguna

«uses»

Membaca isi Beranda

Membaca tentang Pembuat Aplikasi «uses»

«uses» Mengunakan Kamus

Gambar 3.3 Diagram Use Cas

Use Case Specification untuk Gambar 3.4 adalah sebagai berikut:

a) Brief Description

Use case ini digunakan oleh pengunjung untuk melakukan penerjemahan kata.

b) Pre Condition

Pengunjung harus mengisi kolom kata dalam bahasa Indonesia untuk diterjemah oleh sistem.

c) Characteristic of activation

Eksekusi hanya bisa dilakukan oleh pengunjung.

d) Flow of Events

o Basic Flow

- Use case ini akan dimulai jika pengunjung menekan tombol terjemah. - Kemudian sistem menampilkan halaman output.

- Di halaman tersebut, terdapat terjemahan bahasa Karo dari kata bahasa Indonesia dan penulisan dalam aksara Batak Karo yang di input

sebelumnya.


(47)

33

o Alternative Flow

- Jika kata dari kalimat tidak ada di database, sistem akan menampilkan kembali kata tersebut sebagai terjemahannya dan mencocokkannya dengan aksara Batak Karo.

e) Post Condition

Pada use case ini pengunjung dapat melakukan penerjemahan lagi.

f) Limitation

Untuk mendapatkan terjemahan yang tepat, kata yang diinput harus jelas dan terhindar dari kesalahan pengetikan kata dan pengetikan kata sesuai dengan KBBI.

3.5 Perancangan Database (Basis Data)

Dalam penelitian ini, database yang dirancang dibuat dalam file tersendiri menggunakan MySQL. Database hanya memiliki satu table yang terdiri atas beberapa atribut yaitu kata, bagian dan arti. Table yang akan digunakan pada aplikasi ringkasannya diberikan pada Tabel 3.1.

Tabel 3.1 Tabel Database

No Atribut Type Null Keterangan

1 Bahasa

Indonesia

Varchar (30) No Bahasa Indonesia

2 Karo Varchar (50) No Terjemahan

3.6 Perancangan Antar Muka Pemakai (User Interface)

Perancangan antarmuka pengguna merupakan tahap dimana desain sistem yang telah dipersiapkan akan ditampilkan menjadi antarmuka antara pengguna dengan sistem. Ada dua rancangan tampilan antarmuka pada penelitian ini yaitu: rancangan halaman


(48)

34

3.5.1 Rancangan halaman input

Pada halaman input akan di isi dengan sebuah textarea tempat dimana user memberi

input berupa kalimat bahasa inggris dan sebuah button untuk memroses input yang telah dimasukkan oleh user. Tampilan rancangan halaman input dapat dilihat seperti pada Gambar 3.7

Gambar 3.4 Rancangan halaman input

Rancangan halaman input pada Gambar 3.7 terdapat lima komponen penting pada

interface, yaitu text(1) yang berfungsi sebagai teks pembuka berisi “Input kata yang akan diterjemah”, textarea(2) yang berfungsi sebagai tempat dimana pengunjung memberi input berupa teks berbahasa Indonesia, button(3) yang berfungsi sebagai tombol untuk memroses daerah input dan text(4) tambahan untuk footer.

3.5.2 Rancangan halaman output

Pada halaman output akan di isi dengan kalimat input awal yang diberikan user dan kalimat hasil terjemahannya. Pada rancangan halaman output ini berisi terjemahan dalam bahasa karo, dan aksara Batak Karo, juga cara membaca aksara Batak Karo. Tampilan rancangan halaman output dapat dilihat pada Gambar 3.8

3 button

4 text 1 text


(49)

35

Gambar 3.5 Rancangan halaman output

Rancangan halaman output pada Gamabr 3.8 juga terdapat enam komponen penting pada interface, yaitu textarea(1) yang menampilkan input yang telah diberikan pengunjung, text(2) yang berisi teks hasil stemming dari input awal, text(3) yang menampilkan hasil terjemahan dari input, button(4) adalah tombol untuk melakukan proses terjemahan, text(5) adalah hasil pencocokan tulisan bahasa indonesia sesuai dengan aksara Karo, text(6) adalah pencocokan tulisan dari bahasa Karo dengan Aksara Karo, text(7) merupakan cara membaca dari text(5), dan text(8) merupakan cara membaca dan keterangan dari text(6).

4 button

5 text 6 text

7 text 8 text

1 textarea

2 text


(50)

36

BAB 4

IMPLEMENTASI DAN PENGUJIAN SISTEM

Pada bab ini akan diuraikan tahapan selanjutnya dalam pengembangan aplikasi yaitu tahap implementasi dan pengujian sistem. Di sini akan dijelaskan tentang proses pengimplementasian algoritma ke dalam sistem dan melakukan pengujian dari aplikasi yang dikembangkan.

4.1 Spesifikasi Perangkat Keras dan Perangkat Lunak

Spesifikasi perangkat lunak yang digunakan selama pembangunan perangkat lunak adalah sebagai berikut:

1. Operating System Windows 7, 2. Xampp 2.5.8

Agar perangkat lunak dapat berjalan dengan baik untuk para pengguna, maka spesifikasi yang dibutuhkan oleh sistem baik dari sisi perangkat keras (hardware) maupun perangkat lunak (software) dapat diuraikan sebagai berikut.

Untuk perangkat keras, yang direkomendasikan adalah sebagai berikut: 1. Processor dengan kecepatan minimal 1 GHz,

2. CPU Intel Atom, dan lebih baik lagi jika CPU nya lebih tinggi, 3. RAM minimal 1 MB.

Untuk perangkat lunak, yang dapat mendukung agar aplikasi dapat berjalan adalah sebagai berikut:


(51)

37

2. Browser, seperti Mozilla Firefox, Google Chrome, dan lain-lain, 3. Xampp 2.5.8.

4.2 Tampilan Antar Muka

Setelah melewati tahap analisis perancangan antarmuka pengguna, rancangan digunakan sebagai acuan untuk peng-coding-an halaman-halaman pada perangkat lunak. Berikut merupakan antarmuka pengguna untuk halaman beranda, halaman aksara dan halaman tentang. Rencana pengujian sistem yang akan diuji dapat dilihat pada Tabel 4.1 berikut.

Tabel 4.1Tabel rencana pengujian

No. Komponen Sistem yang Diuji Butir Uji

1 Halaman Beranda Mencoba semua menu halaman pada bagian menu

2 Halaman Aksara Kolom terjemahan tombol “terjemahkan”

3 Halaman Tentang Data peneliti

4.2.1 Tampilan halaman beranda

Halaman berandayang telah dilakukan peng-coding-an ditunjukkan pada Gambar 4.1 berikut.

Gambar 4.1 Tampilan Halaman Beranda

Halaman beranda seperti yang ditunjukkan pada gambar 4.1 merupan sebuah keterangan dari aplikasi yang dikerjakan oleh peneliti. Setelah pen-coding-an telah


(52)

38

selesai dilakukan, maka selanjutnya dilakukanlah evaluasi terhadap tampilan halaman

input. Hasil proses evaluasi dapat dilihat pada Tabel 4.2 berikut.

Tabel 4.2 Tabel hasil evaluasi pada tampilan halaman beranda

No. Sasaran Pengujian Hasil yang Diharapkan

Hasil Pengujian

Status

1 Uji tampilan aplikasi ketika dieksekusi

Menampilkan kolom beranda yang berisi keterangan dari pembuatan dan kegunaan aplikasi

Menampilkan kolom beranda yang berisi keterangan dari pembuatan dan kegunaan aplikasi

Berhasil

2 Uji pemilihan menu aksara Menuju halaman input Menuju halaman input Berhasil

3 Uji pemilihan menu Tentang Menampilkan halaman Tentang Menampilkan halaman Tentang Berhasil

4.2.2 Tampilan halaman aksara

Halaman aksara yang telah dilakukan peng-coding-an ditunjukkan pada Gambar 4.2 berikut.

Gambar 4.2 Tampilan halaman aksara

Halaman aksara seperti yang ditunjukkan pada Gambar 4.2, telah diberikan satu buah <textarea> yang dapat digunakan oleh pengguna untuk mengisi input berupa kata, dan satu buah <button> yang dapat digunakan untuk memroses daerah input


(53)

39

untuk menghasilkan hasil stemming, hasil terjemahan dalam bahasa Karo dan menhasilkan konversi kedalam bentuk aksara Batak Karo juga cara membacanya.

Setelah pen-coding-an telah selesai dilakukan, maka selanjutnya dilakukanlah evaluasi terhadap tampilan halaman aksara. Hasil proses evaluasi dapat dilihat pada Tabel 4.3 berikut.

Tabel 4.3Tabel hasil evaluasi pada tampilan halaman input No. Sasaran Pengujian Hasil yang Diharapkan Hasil

Pengujian

Status

1 Uji tampilan aplikasi ketika dieksekusi

Menampilkan kolom input, tombol “terjemahkan

Menampilkan kolom input, tombol “terjemahkan

Berhasil

2 Uji pemilihan tombol terjemahkan

Memproses input dan menampilkan input serta halaman output

Memroses input dan menampilkan input serta halaman output

Berhasil

Gambar 4.3 Tampilan halaman aksara yang diberi input terjatuh 4.2.3 Tampilan halaman output

Halaman output berisi data input yang telah diberikan pengguna berupa kata serta hasil terjemahan yang dilakukan berdasarkan pengecekan pada database. Halaman output


(54)

40

Gambar 4.4 Tampilan halaman Output

Halaman output seperti yang ditunjukkan pada Gambar 4.4, merupakan hasil proses dari gambar 4.3.

Setelah pen-coding-an telah selesai dilakukan, maka selanjutnya dilakukanlah evaluasi terhadap tampilan halaman output. Hasil proses evaluasi dapat dilihat pada Tabel 4.4. Evaluasi ditujukan untuk mengetahui apakah setiap menu pada halaman

output telah berhasil diimplementasi dan digunakan saat sistem telah selesai dilakukan peng-coding-an.

Tabel 4.4 Tabel hasil evaluasi pada tampilan halaman output No. Sasaran Pengujian Hasil yang Diharapkan Hasil

Pengujian

Status

1 Uji tampilan halaman output

Menampilkan daerah input, hasil terjemahan dan

menampilkan input dan terjemahan dalam bentuk aksara Batak karo

Menampilkan daerah input, hasil terjemahan dan

menampilkan input dan terjemahan dalam bentuk aksara Batak karo

Berhasil

2 Uji pemilihan menu beranda Menuju halaman beranda Menuju halaman beranda Berhasil

4 Uji pemilihan menu tentang Menampilkan halaman tentang Menampilkan halaman tentang Berhasil


(55)

41

Contoh kata-kata yang telah di input ke dalam tabel dapat di lihat pada tabel 4.5 berikut.

Bahasa Indonesia Karo

Air lau

Acap megati

Adik agi

Alas lapik

Ambruk sontar

anjing biang

Antar tarohken

Anti tangkal

Asam Macem

Atas Datas

Ayah Bapa

Untuk sementara data yang ada di dalam database berjumlah 400 kata, ini karena perbendaharaan kata baku pada bahasa karo masih sedikit dan aturan dalam perbendaharaan kata tersebut belum dapat dijelaskan secara pasti.


(56)

42

BAB 5

KESIMPULAN DAN SARAN

Pada bab ini diuraikan kesimpulan yang didapat dari pengimplementasian algoritma

Enhanced Confix Stripping Stemmer pada aplikasi kamus bahasa Indonesia - Karo, beserta saran-saran yang dapat digunakan sebagai bahan pertimbangan untuk pengembangan atau riset selanjutnya.

5.1 Kesimpulan

Berdasarkan analisis dari sistem dan pengujian sistem secara menyeluruh yang telah dilakukan pada bab sebelumnya, maka ada beberapa hal yang dapat dijadikan kesimpulan pada penelitian ini antara lain:

1. Aplikasi Kamus bahasa Indonesia – Karo ini bukan saja sebagai pencarian arti kata dalam bahasa Indonesia – Karo namun juga sebagai bahan pembelajaran dan pengenalan aksara Batak Karo.

2. Algoritma Enhanced Confix Stripping Stemmer (ECS) mampu secara efektif mencari kata baku dari imbuhan khususnya bahasa Indonesia dan mengembalikan kata berimbuhan bahasa Indonesia dan selanjutnya menterjemahkan ke dalam bentuk bahasa Karo.

5.2 Saran

Penulis menyarankan dalam pengembangan penelitian lebih lanjut untuk aplikasi kamus bahasa Indonesia – Karo :

1. Sistem ini dapat memberi pembelajaran lebih dari sekedar tulisan, diharapkan untuk pengembangan lebih lanjut dengan menyertakan suara dari pengucapan tulisan dalam bahasa Karo, karena di dalam bahasa Karo terdapat banyak bunyi sengau dan perbedaan pengucapan huruf e.


(57)

43

2. Dalam pengembangan sistem lebih lanjut diharapkan tidak hanya penerjemahan kata saja, tetapi juga penerjemahan kalimat dengan konversi aksara Batak Karo.


(58)

44

DAFTAR PUSTAKA

Agusta, Ledy. 2009. Perbandingan Algoritma Stemming Porter Dengan Algoritma Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia.Konferensi Nasional Sistem dan Informatika 2009: Bali, 14 November 2009.

Asian, Jelita, 2007. “Effective Techniques for Indonesian Text Retrieval”. PhD thesis School of Computer Science and Information Technology RMIT University Australia.

Darmawan, H. A., Wurijanto, T., dan Masturi A. Rancang Bangun Aplikasi Search Engine Tafsir Al-Qur’an Menggunakan Teknik Text Mining Dengan Algoritma VSM (Vector Space Model).STIKOM : Surabaya.

Kadir, Abdul. 2001. Dasar Pemrograman Web Dinamis Menggunakan PHP. Yogyakarta: ANDI.

Kozok, Uli. 1999. Warisan Leluhur Sastra Lama dan Aksara Batak. Bogor : SMK Grafika Mardi Yuana.

Mahendra, I. P. A. K., Arifin, A. Z., dan Ciptaningtyas , H. T. 2008. Penggunaan Algoritma Semut dan Confix strippingStemmer Untuk Klasifikasi Dokumen Berita Berbahasa Indonesia. Skripsi. Institut Teknologi Sepuluh Nopember: Surabaya.

Nazief, B. dan Adriani, M. 1996. Confix stripping: Approach to Stemming Algorithm for Bahasa Indonesia. University of Indonesia: Jakarta.

Iqramitha, A. Implementasi Algoritma Enhanced Confix Stripping Stemmer Pada Kamus Sistem Bahasa Isyarat Indonesia. Skripsi. Teknologi Informasi Universitas Sumatera Utara : Medan.

Sholihin, A., Solihin F., dan Rachman, F. H. 2013.Penerapan Modifikasi Metode

Enhanced confix strippingStemmer Pada Teks Berbahasa Madura. Jurnal Sarjana Teknik Informatika Vol. 1 No. 1. Hal 1-4.


(1)

untuk menghasilkan hasil stemming, hasil terjemahan dalam bahasa Karo dan menhasilkan konversi kedalam bentuk aksara Batak Karo juga cara membacanya.

Setelah pen-coding-an telah selesai dilakukan, maka selanjutnya dilakukanlah evaluasi terhadap tampilan halaman aksara. Hasil proses evaluasi dapat dilihat pada Tabel 4.3 berikut.

Tabel 4.3Tabel hasil evaluasi pada tampilan halaman input No. Sasaran Pengujian Hasil yang Diharapkan Hasil

Pengujian

Status

1 Uji tampilan aplikasi ketika dieksekusi

Menampilkan kolom input, tombol “terjemahkan

Menampilkan kolom input, tombol “terjemahkan

Berhasil

2 Uji pemilihan tombol terjemahkan

Memproses input dan menampilkan input serta halaman output

Memroses input dan menampilkan input serta halaman output

Berhasil

Gambar 4.3 Tampilan halaman aksara yang diberi input terjatuh 4.2.3 Tampilan halaman output

Halaman output berisi data input yang telah diberikan pengguna berupa kata serta hasil terjemahan yang dilakukan berdasarkan pengecekan pada database. Halaman output yang telah dilakukan peng-coding-an ditunjukkan pada Gambar 4.4.


(2)

Gambar 4.4 Tampilan halaman Output

Halaman output seperti yang ditunjukkan pada Gambar 4.4, merupakan hasil proses dari gambar 4.3.

Setelah pen-coding-an telah selesai dilakukan, maka selanjutnya dilakukanlah evaluasi terhadap tampilan halaman output. Hasil proses evaluasi dapat dilihat pada Tabel 4.4. Evaluasi ditujukan untuk mengetahui apakah setiap menu pada halaman output telah berhasil diimplementasi dan digunakan saat sistem telah selesai dilakukan peng-coding-an.

Tabel 4.4 Tabel hasil evaluasi pada tampilan halaman output No. Sasaran Pengujian Hasil yang Diharapkan Hasil

Pengujian

Status

1 Uji tampilan halaman output

Menampilkan daerah input, hasil terjemahan dan

menampilkan input dan terjemahan dalam bentuk aksara Batak karo

Menampilkan daerah input, hasil terjemahan dan

menampilkan input dan terjemahan dalam bentuk aksara Batak karo

Berhasil

2 Uji pemilihan menu beranda Menuju halaman beranda Menuju halaman beranda Berhasil

4 Uji pemilihan menu tentang Menampilkan halaman tentang Menampilkan halaman tentang Berhasil


(3)

Contoh kata-kata yang telah di input ke dalam tabel dapat di lihat pada tabel 4.5 berikut.

Bahasa Indonesia Karo

Air lau

Acap megati

Adik agi

Alas lapik

Ambruk sontar

anjing biang

Antar tarohken

Anti tangkal

Asam Macem

Atas Datas

Ayah Bapa

Untuk sementara data yang ada di dalam database berjumlah 400 kata, ini karena perbendaharaan kata baku pada bahasa karo masih sedikit dan aturan dalam perbendaharaan kata tersebut belum dapat dijelaskan secara pasti.


(4)

BAB 5

KESIMPULAN DAN SARAN

Pada bab ini diuraikan kesimpulan yang didapat dari pengimplementasian algoritma Enhanced Confix Stripping Stemmer pada aplikasi kamus bahasa Indonesia - Karo, beserta saran-saran yang dapat digunakan sebagai bahan pertimbangan untuk pengembangan atau riset selanjutnya.

5.1 Kesimpulan

Berdasarkan analisis dari sistem dan pengujian sistem secara menyeluruh yang telah dilakukan pada bab sebelumnya, maka ada beberapa hal yang dapat dijadikan kesimpulan pada penelitian ini antara lain:

1. Aplikasi Kamus bahasa Indonesia – Karo ini bukan saja sebagai pencarian arti kata dalam bahasa Indonesia – Karo namun juga sebagai bahan pembelajaran dan pengenalan aksara Batak Karo.

2. Algoritma Enhanced Confix Stripping Stemmer (ECS) mampu secara efektif mencari kata baku dari imbuhan khususnya bahasa Indonesia dan mengembalikan kata berimbuhan bahasa Indonesia dan selanjutnya menterjemahkan ke dalam bentuk bahasa Karo.

5.2 Saran

Penulis menyarankan dalam pengembangan penelitian lebih lanjut untuk aplikasi kamus bahasa Indonesia – Karo :

1. Sistem ini dapat memberi pembelajaran lebih dari sekedar tulisan, diharapkan untuk pengembangan lebih lanjut dengan menyertakan suara dari pengucapan tulisan dalam bahasa Karo, karena di dalam bahasa Karo terdapat banyak bunyi sengau dan perbedaan pengucapan huruf e.


(5)

2. Dalam pengembangan sistem lebih lanjut diharapkan tidak hanya penerjemahan kata saja, tetapi juga penerjemahan kalimat dengan konversi aksara Batak Karo.


(6)

DAFTAR PUSTAKA

Agusta, Ledy. 2009. Perbandingan Algoritma Stemming Porter Dengan Algoritma Nazief & Adriani Untuk Stemming Dokumen Teks Bahasa Indonesia.Konferensi Nasional Sistem dan Informatika 2009: Bali, 14 November 2009.

Asian, Jelita, 2007. “Effective Techniques for Indonesian Text Retrieval”. PhD thesis School of Computer Science and Information Technology RMIT University Australia.

Darmawan, H. A., Wurijanto, T., dan Masturi A. Rancang Bangun Aplikasi Search Engine Tafsir Al-Qur’an Menggunakan Teknik Text Mining Dengan Algoritma VSM (Vector Space Model).STIKOM : Surabaya.

Kadir, Abdul. 2001. Dasar Pemrograman Web Dinamis Menggunakan PHP. Yogyakarta: ANDI.

Kozok, Uli. 1999. Warisan Leluhur Sastra Lama dan Aksara Batak. Bogor : SMK Grafika Mardi Yuana.

Mahendra, I. P. A. K., Arifin, A. Z., dan Ciptaningtyas , H. T. 2008. Penggunaan Algoritma Semut dan Confix strippingStemmer Untuk Klasifikasi Dokumen Berita Berbahasa Indonesia. Skripsi. Institut Teknologi Sepuluh Nopember: Surabaya.

Nazief, B. dan Adriani, M. 1996. Confix stripping: Approach to Stemming Algorithm for Bahasa Indonesia. University of Indonesia: Jakarta.

Iqramitha, A. Implementasi Algoritma Enhanced Confix Stripping Stemmer Pada Kamus Sistem Bahasa Isyarat Indonesia. Skripsi. Teknologi Informasi Universitas Sumatera Utara : Medan.

Sholihin, A., Solihin F., dan Rachman, F. H. 2013.Penerapan Modifikasi Metode Enhanced confix strippingStemmer Pada Teks Berbahasa Madura. Jurnal Sarjana Teknik Informatika Vol. 1 No. 1. Hal 1-4.