BAB 1
PENDAHULUAN
1.1. Latar Belakang
Pada saat ini situs microblogging telah menjadi alat komunikasi yang sangat populer di kalangan pengguna internet. Dimana jutaan pesan yang muncul setiap hari di situs
web populer yang menyediakan layanan microblogging seperti Twitter, Tumblr, dan Facebook Alexa, 2013.
Penulis pesan tersebut menulis tentang kehidupan mereka, berbagi opini tentang berbagai topik dan membahas isu-isu yang tejadi pada saat ini. Format pesan
yang bebas dan aksesibilitas dari berbagai platform yang mudah, pengguna internet cenderung untuk beralih dari blog atau milis ke layanan microblogging Agarwal, et
al, 2011. Hal tersebut menyebabkan semakin banyak pengguna yang melakukan posting tentang suatu produk dan layanan yang mereka gunakan, atau
mengekspresikan pandangan mereka tentang politik dan agama. Twitter sebagai salah satu situs microblogging dengan pengguna lebih dari 500 juta dan 400 juta tweet
perhari Farber, 2012, memungkinkan pengguna untuk berbagi pesan menggunakan teks pendek disebut Tweet Twitter, 2013. Twitter dapat menjadi sumber data
pendapat dan sentimen masyarakat Data tersebut dapat digunakan secara efisien untuk pemasaran atau studi sosial Pak Paroubek, 2010.
Sentiment analysis atau opinion mining adalah studi komputasional dari opini-
opini orang, sentimen dan emosi melalui entitas dan atribut yang dimiliki yang diekspresikan dalam bentuk teks Liu, 2012. Analisis sentimen akan
mengelompokkan polaritas dari teks yang ada dalam kalimat atau dokumen untuk
mengetahui pendapat yang dikemukakan dalam kalimat atau dokumen tersebut apakah bersifat positif, negatif atau netral Pang Lee, 2008.
Text mining adalah salah satu teknik yang dapat digunakan untuk melakukan
klasifikasi dokumen dimana text mining merupakan variasi dari data mining yang berusaha menemukan pola yang menarik dari sekumpulan data tekstual yang
berjumlah besar Feldman Sanger, 2007. Analisis sentimen pada Twitter terdapat kelemahan dalam kata-kata yang
terdapat pada kalimat yang diposting oleh pengguna situs tersebut. Twitter hanya memungkinkan pengguna menulis sebanyak 140 karakter, hal ini yang menyebabkan
para pengguna sering menggunakan singkatan kata dan ejaan kata yang salah. Cara penulisan yang salah tersebut mengakibatkan terjadi kelemahan pada
proses Text Mining, dimana dapat menyulitkan fitur yang diambil serta mengurangi ketepatan klasifikasi. Oleh karena itu disini penulis akan menggunakan metode n-
gram karakter kata untuk mengambil fitur-fitur yang ada pada sebuah Tweet yang
kemudian akan diklasifikasi dengan Algoritma Naive Bayes Classifier.
1.2 Rumusan Masalah