sehingga dapat meningkatkan atau mengurangi kemungkinan kata tersebut akan digunakan di dalam konteks yang sama. Menyatukan informasi terbaru ke dalam
modul prediksi bisa dilakukan dengan berbagai cara. Salah satu cara untuk melakukannya yaitu dengan menggunakan hitungan terbaru untuk setiap kata atau
rangkaian kata, dan tambahkan dengan kelipatan satu setiap kata tersebut digunakan di dalam konteks yang diinginkan. Setiap dokumen atau rangkaian dari N kata di
dalam dokumen bisa dianggap sebagai konteks yang baru. Diperlukan juga sebuah algoritma untuk menentukan bagaimana harusnya kata-kata tersebut dipilih menurut
nilai frekuensi dasar dan hitungan terbaru Fazly, 2002. Pada tulisan ini, penulis menggunakan pendekatan adaptasi adaptive lexicon
dan recency information.
2.5 Windows API
Windows API Application Programming Interface dapat membuat program yang ditulis oleh pengguna mampus berinteraksi dengan sistem operasi Windows,
contohnya seperti menampilkan sesuatu pada layar dan mendapatkan input dari mouse dan keyboard. Semua program yang ada pada Windows kecuali program yang berbasis
konsol harus berinteraksi dengan Windows API apapun bahasa pemrogramannya. Versi yang terbaru adalah Win32 API Steane, 2009. Pada penelitian ini, penulis
menggunakan Windows API agar program dapat menerima input pengguna dari keyboard dan mengirimkan output ke program seperti Microsoft Word, Notepad, E-
mail, Blog, dan program pengolah teks lainnya.
2.6 Penelitian Terdahulu
WordQ merupakan suatu perangkat lunak untuk mengolah kata yang dikembangkan oleh Bloorview Macmillan Center, Toronto, Canada, dengan bantuan dari Ontario
Rehabilitaion Technologi Cosortium Nantais et al., 2001. WordQ bisa digunakan oleh perangkat lunak pengolah kata yang berbasis sistem operasi Windows, WordQ
mempunyai modul untuk word prediction yang dapat memberikan beberapa alternatif kata kepada pengguna, dan modul speech yang menyediakan fitur text-to-speech.
Modul WordQ menggunakan statistik kata unigram dan bigram yang bisa
Universitas Sumatera Utara
dikustomisasi berdasarkan kamus kata yang digunakan oleh pengguna agar dapat
memberikan alternatif kata yang tepat Fazly A., 2002.
Dalam beberapa uji coba dengan total 116.579 kata yang diambil dari 3 buku, WordQ dapat mengurangi jumlah keystroke sebanyak 37 sampai dengan 53.1,
tergantung dari tipe teks, adaptasi, dan tipe frekuensi dari informasi yang digunakan. Di setiap uji coba, daftar kata yang diprediksi terdiri dari 5 kata, tergantung dari tipe
suatu teks Nantais et al, 2001. Predictive Adaptive Lexicon PAL merupakan suatu perangkat lunak
komputer yang dikembangkan oleh Arnott et al. Perangkat lunak ini dapat membantu pengguna dalam merangkai suatu teks dengan memberikan beberapa alternatif kata
yang tepat didalam suatu kalimat. Pengguna dapat memilih dari daftar kata tersebut dengan menekan tombol keyboard yang telah ditentukan atau dengan mengetik kata
mereka sendiri. Modul prediksi yang digunakan oleh PAL berdasarkan informasi frekuensi kata yang didapat dan memprediksi kata berdasarkan prefiks.Perangkat
lunak ini diuji coba dengan beberapa teks, buku manual, artikel koras, dan transkrip dari suatu acara televisi. Dengan menggunakan daftar kata yang ditampilkan sebanyak
10 kata, perangkat lunak ini dapat mengurangi jumlah keystroke sebanyak 30 sampai dengan 46, tergantung dari tipe suatu teks Arnott et al, 1984.
Sugianto, S.A dan teman-teman sudah membuat suatu aplikasi predictive text yang menggunakan metode n-gram based. Aplikasi ini menunjukkan bahwa metode
n-gram sebagai metode dasar dalam proses prediksi sangatlah membantu pemilahan kata, sehingga proses prediksi menjadi lebih efektif, mampu menghasilkan prediksi
efektif di atas 20 dari total prediksi yang terjadi. Keystroke saving yang dapat dihasilkan dapat mencapai 50 tergantung dari data training yang digunakan. Selain
dari pada metode n-gram sendiri, pengaturan bobot untuk masing-masing score kata juga sangat mempengaruhi proses prediksi kataSugianto et al, 2013. Pada Tabel 2.1
merupakan tabel dari penelitian terdahulu.
Universitas Sumatera Utara
Tabel 2.1 Penelitian Terdahulu No
Peneliti Keterangan
1 Nantais, et al. 2001
Daftar kata yang ditampilkan 5, dan mempunyai fitur text-to-speech
2 Arnott, et al. 1984
Daftar kata yang ditampilkan 10, dan dapat mengurangi keystroke sebanyak 30 sampai
dengan 46
3 Carlberger, et al. 1997a
Memprediksi berdasarkan
frekuensi kata,
unigram, dan bigram, dan mampu beradaptasi
4 Sugianto, et al. 2013
Mampu menghasilkan prediksi yang efektif di atas 20 dari total prediksi yang terjadi. Keystroke
saving mencapai 50 tergantung dari data training.
Pada penelitian ini penulis menggunakan unigram model dan adaptasi adaptive lexicon dan recency information. Penulis juga menggunakan database kata-kata
bahasa Indonesia, berbeda dengan penelitian sebelumnya kebanyakan menggunakan database bahasa Inggris. Aplikasi word prediction yang dibuat oleh penulis juga dapat
berjalan di beberapa aplikasi pengolah kata seperti Microsoft word, e-mail, notepad, dan lain-lain.
Universitas Sumatera Utara
BAB 3 ANALISIS DAN PERANCANGAN SISTEM
Bab ini akan membahas tentang analisis serta perancangan sistem untuk fitur word prediction dengan menggunakan metode n-gram, membuat pemodelan sistem seperti
merancang alur kerja sistem flowchart. Mempelajari konsep dan proses kerja word prediction, serta merancang antarmuka.
3.1 Analisis masalah
Untuk dapat mengetik, tidak diperlukan suatu keahlian khusus karena semua orang dapat mengetik pada computer. Namun, beberapa orang mengalami kesulitan dalam
mengetik. Contohnya seperti orang yang mengalami keterbatasan fisik atau berkebutuhan khusus, karena bagi mereka untuk menekan tombol pada keyboard
merupakan suatu usaha yang tidak mudah. Namun, bagi yang tidak memiliki keterbatasan fisik atau berkebutuhan khusus. Juga memiliki masalah dalam mengetik,
seperti orang yang baru belajar bahasa Indonesia, orang tersebut masih memiliki sedikit akan kosakata bahasa Indonesia jadi dia akan mengalami hambatan dalam
mengetik menggunakan bahasa Indonesia. Maka dari itu diperlukanlah layanan word prediction yang dapat membantu
pengguna dalam mengetik pada computer. Layanan ini dapat membantu pengguna karena dapat mengurangi jumlah tombol yang harus ditekan dalam mengetik suatu
kata dan dapat meminimalisasi kesalahan yang terjadi dalam mengetik. Namun, kebanyakan fitur word prediction pada saat ini kebanyakan menggunakan bahasa
asing, masih sedikit yang mengembangkannya dalam bahasa Indonesia. Jadi banyak orang-orang yang terpaksa belajar mengetik agar lancar dalam mengetik dan
menyewa tukang ketik, karena akan diperlukan waktu yang cukup lama bagi dirinya
Universitas Sumatera Utara