Latar Belakang Analisa Jaringan Sistem Distribusi Air Bersih Pada Kecamatan Sidikalang Kabupaten Dairi

BAB 1 PENDAHULUAN

1.1. Latar Belakang

Pada saat ini situs microblogging telah menjadi alat komunikasi yang sangat populer di kalangan pengguna internet. Dimana jutaan pesan yang muncul setiap hari di situs web populer yang menyediakan layanan microblogging seperti Twitter, Tumblr, dan Facebook Alexa, 2013. Penulis pesan tersebut menulis tentang kehidupan mereka, berbagi opini tentang berbagai topik dan membahas isu-isu yang tejadi pada saat ini. Format pesan yang bebas dan aksesibilitas dari berbagai platform yang mudah, pengguna internet cenderung untuk beralih dari blog atau milis ke layanan microblogging Agarwal, et al, 2011. Hal tersebut menyebabkan semakin banyak pengguna yang melakukan posting tentang suatu produk dan layanan yang mereka gunakan, atau mengekspresikan pandangan mereka tentang politik dan agama. Twitter sebagai salah satu situs microblogging dengan pengguna lebih dari 500 juta dan 400 juta tweet perhari Farber, 2012, memungkinkan pengguna untuk berbagi pesan menggunakan teks pendek disebut Tweet Twitter, 2013. Twitter dapat menjadi sumber data pendapat dan sentimen masyarakat Data tersebut dapat digunakan secara efisien untuk pemasaran atau studi sosial Pak Paroubek, 2010. Sentiment analysis atau opinion mining adalah studi komputasional dari opini- opini orang, sentimen dan emosi melalui entitas dan atribut yang dimiliki yang diekspresikan dalam bentuk teks Liu, 2012. Analisis sentimen akan mengelompokkan polaritas dari teks yang ada dalam kalimat atau dokumen untuk mengetahui pendapat yang dikemukakan dalam kalimat atau dokumen tersebut apakah bersifat positif, negatif atau netral Pang Lee, 2008. Text mining adalah salah satu teknik yang dapat digunakan untuk melakukan klasifikasi dokumen dimana text mining merupakan variasi dari data mining yang berusaha menemukan pola yang menarik dari sekumpulan data tekstual yang berjumlah besar Feldman Sanger, 2007. Analisis sentimen pada Twitter terdapat kelemahan dalam kata-kata yang terdapat pada kalimat yang diposting oleh pengguna situs tersebut. Twitter hanya memungkinkan pengguna menulis sebanyak 140 karakter, hal ini yang menyebabkan para pengguna sering menggunakan singkatan kata dan ejaan kata yang salah. Cara penulisan yang salah tersebut mengakibatkan terjadi kelemahan pada proses Text Mining, dimana dapat menyulitkan fitur yang diambil serta mengurangi ketepatan klasifikasi. Oleh karena itu disini penulis akan menggunakan metode n- gram karakter kata untuk mengambil fitur-fitur yang ada pada sebuah Tweet yang kemudian akan diklasifikasi dengan Algoritma Naive Bayes Classifier.

1.2 Rumusan Masalah