Analisis masalah Analisis Data

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

Bab ini akan membahas tentang analisis serta perancangan sistem untuk fitur word prediction dengan menggunakan metode n-gram, membuat pemodelan sistem seperti merancang alur kerja sistem flowchart. Mempelajari konsep dan proses kerja word prediction, serta merancang antarmuka.

3.1 Analisis masalah

Untuk dapat mengetik, tidak diperlukan suatu keahlian khusus karena semua orang dapat mengetik pada computer. Namun, beberapa orang mengalami kesulitan dalam mengetik. Contohnya seperti orang yang mengalami keterbatasan fisik atau berkebutuhan khusus, karena bagi mereka untuk menekan tombol pada keyboard merupakan suatu usaha yang tidak mudah. Namun, bagi yang tidak memiliki keterbatasan fisik atau berkebutuhan khusus. Juga memiliki masalah dalam mengetik, seperti orang yang baru belajar bahasa Indonesia, orang tersebut masih memiliki sedikit akan kosakata bahasa Indonesia jadi dia akan mengalami hambatan dalam mengetik menggunakan bahasa Indonesia. Maka dari itu diperlukanlah layanan word prediction yang dapat membantu pengguna dalam mengetik pada computer. Layanan ini dapat membantu pengguna karena dapat mengurangi jumlah tombol yang harus ditekan dalam mengetik suatu kata dan dapat meminimalisasi kesalahan yang terjadi dalam mengetik. Namun, kebanyakan fitur word prediction pada saat ini kebanyakan menggunakan bahasa asing, masih sedikit yang mengembangkannya dalam bahasa Indonesia. Jadi banyak orang-orang yang terpaksa belajar mengetik agar lancar dalam mengetik dan menyewa tukang ketik, karena akan diperlukan waktu yang cukup lama bagi dirinya Universitas Sumatera Utara agar dapat mengetik dengan lancar. Penyebab dan dampak dari permasalahan yang tersebut diperlihatkan pada diagram Ishikawa pada Gambar 3.1. Gambar 3.1 Diagram Ishikawa analisis permasalahan

3.2 Analisis Data

Data yang digunakan pada sistem ini diperoleh dari penelitian Lanin, et al 2013. Lanin, et al membandingkan distribusi frekuensi kata bahasa Indonesia di Kompas, Wikipedia, Twitter, dan Kaskus. Korpus data Kompas diambil dari artikel online yang berbahasa Indonesia pada tahun 2012. Pada Tabel 3.1 akan diberikan beberapa kata yang diperoleh dari artikel online surat kabar Kompas. Tabel 3.1 Sampel Data Kata Lanin et al, 2013 No Kata Frekuensi Kata 1 yang 795050 2 di 709509 3 dan 629540 Universitas Sumatera Utara Tabel 3.1. Sampel Data Kata Lanin et al, 2013 Lanjutan No Kata Frekuensi Kata 4 ini 332855 5 itu 313570 6 dengan 312096 7 untuk 297067 8 dari 280966 9 dalam 222488 . . . . . . . . . 1500 karakter 3173 Setelah didapatkan data-data frekuensi kata seperti yang diperlihatkan pada Tabel 3.1, data-data tersebut akan dimasukkan ke dalam database dan akan menjadi acuan untuk memprediksi kata. Untuk lebih jelasnya akan dijelaskan pada subbab berikutnya. Universitas Sumatera Utara

3.3. Perancangan Sistem