Rumusan Masalah Batasan Masalah Tujuan Penelitian Manfaat Penelitian

4 mengukur dependensi acak antar variabel Battiti, 1994. Penelitian dalam bidang klasifikasi sentimen menggunakan seleksi fitur Mutual Information pernah dilakukan sebelumnya oleh Narayanan. Hasil penelitian menunjukkan bahwa adanya peningkatan akurasi dari 73,77 untuk penggunaan algoritma Naïve Bayes dengan Laplacian Smoothing menjadi 88,80 setelah ditambahkannya seleksi fitur pada algoritma Naïve Bayes Narayanan dkk., TT. Oleh sebab itu, pada penelitian ini akan diterapkan Mutual Information untuk penyeleksian fitur sebelum diklasifikasi dengan Naïve Bayes Classifier sehingga diharapkan hasil analisis sentimen menjadi lebih akurat.

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, maka dapat dirumuskan beberapa permasalahan sebagai berikut. 1 Bagaimana pengaruh seleksi fitur Mutual Information dalam upaya meningkatkan akurasi dari analisis sentimen dengan Naïve Bayes Classifier? 2 Bagaimana akurasi yang dihasilkan dalam analisis sentimen setelah penambahan seleksi fitur Mutual Information pada metode Naïve Bayes Classifier ?

1.3 Batasan Masalah

Adapun batasan masalah dalam penelitian ini adalah : 1 Pada penelitian ini dataset yang digunakan adalah tweet yang ditujukan kepada provider telekomunikasi di Indonesia. Tweet tersebut mengandung mention dan hastag yang diikuti dengan nama provider antara lain, telkomsel, simpati, AS, indosat, dan lain-lain. 2 Proses stopword hanya berlaku pada kata-kata berbahasa Indonesia saja. 3 Menggunakan metode n-gram kata dengan jumlah n =1, 2, 3, 4 sebagai fitur. 5

1.4 Tujuan Penelitian

Adapun tujuan dalam penelitian ini adalah : 1 Untuk mengetahui pengaruh seleksi fitur Mutual Information dalam upaya meningkatkan akurasi dari analisis sentimen dengan Naïve Bayes Classifier. 2 Untuk mengetahui akurasi yang dihasilkan dalam analisis sentimen setelah penambahan seleksi fitur Mutual Information pada metode Naïve Bayes Classifier.

1.5 Manfaat Penelitian

Adapun manfaat dalam penelitian ini adalah : 1 Sebagai landasan untuk penelitian selanjutnya yang ingin mengembangkan penelitian mengenai analisis sentimen. 2 Sebagai bahan referensi untuk perusahaan provider telekomunikasi yang ingin memanfaatkan hasil penelitian untuk mendapatkan feedback dengan mudah tanpa menggunakan cara manual atau mendata opini masyarakat satu persatu. 3 Hasil penelitian ini dapat digunakan oleh pihak produsen yaitu pihak perusahaan provider telekomunikasi dalam memantau penerimaan produk dan layanan mereka di masyarakat secara real time. Sehingga berdampak pula pada investasi saham dari perusahaan tersebut untuk menentukan kapan terjadinya aktivitas jual dan beli saham terhadap akumulasi hasil sentimen dari data Twitter melalui sistem ini.

1.6 Metodologi Penelitian