Makalah Analisis Sentiment Tweet Indonesia

MAKALAH
ANALISIS SENTIMEN TWEET

Oleh :
Agung Sulistyo (14.01.53.0037)
Tidy Yuniardy S (14.01.53.0003)
Indra Dwi H (14.01.53.0049)

FAKULTAS TEKNOLOGI INFORMASI
UNIVERSITAS STIKUBANK (UNISBANK)
SEMARANG
2018

BAB I
PENDAHULUAN
1.1 LATAR BELAKANG
Twitter adalah layanan jejaring sosial dan mikroblog yang memungkinkan
penggunanya untuk mengirim dan membaca pesan atau informasi berbasis teks
hingga 140 karakter, yang dikenal dengan sebutan kicauan (tweet).Sebuah
tweet dapat mengekspresikan sebuah perasaan atau keadaan dari pengguna
Twiter.Informasi yang beredar juga sangat banyak mulai dari berita, opini,

komentar, kritik dan semuanya ada yang bersifat positif, negatif dan netral.
Pada Twitter terdapat istilah bernama tweet yang merupakan sebuah pesan
atau status yang dibuat oleh penggunanya.
Analisis sentimen merupakan bagian dari Natural Language Processing
(NLP) dan Machine Learning. Cara kerjanya adalah dengan melakukan
klasifikasi terhadap opini positif maupun negatif. Analisis sentimen
menganalisa pendapat orang, evaluasi,sikap, penilaian, sentimen, dan emosi
terhadap entitas sepertimasalah, produk, jasa, organisasi, individu, peristiwa
atau suatu topik.Sentimen analisis ini memiliki tujuan untuk menentukan
sentimen publik terhadap suatu objek tertentu yang disampaikan melalui
twitter dengan menggunakan bahasa indonesia agar dapat membantu usaha
untuk melihat opini publik terkait dengan objek tersebut sebagai bahan
pertimbangan pengambilan keputusan.
Berdasarkan pemaparan yang telah diuraikan, penelitian kali ini
bermaksud untuk membangun analisis sentimen pada twitter dengan objek
Starbucks.
1.2 RUMUSAN MASALAH
Berdasarkan uraian diatas dapat dirumuskan permasalahannya adalah
bagaimana menganalisis dan mengklasifikasi sentimen melalui tweet di twitter
dengan objek Starbucks.


BAB II
TINJAUAN PUSTAKA
2.1 KAJIAN DEDUKTIF
2.1.1 Analisis Sentimen
Analisa sentimen atau biasa disebut opinion mining merupakan salah satu
cabang penelitian Text Mining. Opinion mining adalah riset komputasional
dari opini, sentimen dan emosi yang diekspresikan secara tekstual. Jika
diberikan suatu set dokumen teks yang berisi opini mengenai suatu objek,
maka opinion mining bertujuan untuk mengekstrak atribut dan komponen
dari objek yang telah dikomentasi pada setiap dokumen dan untuk
menentukan apakah komentar tersebut bermakna positif atau negatif.
Sentiment Analysis dapat dibedakan berdasarkan sumber datanya,
beberapa level yang sering digunakan dalam penelitian Sentiment Analysis
adalah Sentiment Analysis pada level dokumen dan Sentiment Analysis
pada level kalimat. Berdasarkan level sumber datanya Sentiment Analysis
terbagi menjadi 2 kelompok besar yaitu :
a. Coarse-grained Sentiment Analysis
Pada Sentiment Analysis jenis ini, Sentiment Analysis yang
dilakukan adalah pada level dokumen. Secara garis besar fokus

utama dari Sentiment Analysisjenis ini adalah menganggap seluruh
isi dokumen sebagai sebuah sentiment positif atau sentiment
negatif.
b. Fined-grained Sentiment Analysis
Fined-grained Sentiment Analysis adalah Sentiment Analysis pada
level kalimat. Fokus utama fined-greined Sentiment Analysis
adalah menentukan sentimen pada setiap kalimat.
2.1.2 Analisis Opini atau Sentimen
Analisis opini atau Sentimen merupakan bagian riset dari text mining.
Sentimen analisis merebak sekitar tahun 2003, setelah itu banyak
penelitian yang mencakup area ini. Aplikasi hasil penelitian ini sangat
berguna dalam banyak bidang, namun ada beberapa bidang mayor yang

paling terbantu, yaitu dalam dunia web-online (mengenai pelayan, maupun
marketing), periklanan, bisnis dan keamanan negara ( intelligence).
Beberapa perusahaan profit juga mengembangkan tool sendiri untuk
memberikan jasa analisis sentimen (Twitratr, tweetfeel dan Social
Mention). Opini, sentiment atau kata yang sering didengar sentimental
adalah kata/trait yang melekat pada variable seperti perilaku, evaluasi,
appraisal, mood, afeksi, subjective belief/belief system dan feeling.

Variabel diatas (dan belum semua) nyatanya sangat mempengaruhi
bagaimana kita dalam melihat suatu peristiwa dan mengambil keputusan
atau opini pribadi mengenai suatu kejadian. Dalam sosial media data yang
ditampung mengenai opini berkembang sangat pesat, karena opini lebih
cepat disalurkan dan mudah melakukan akses ke opini orang lain oleh
karena itu analisis sentiment sangat diperlakukan. Analisis sentiment
merupakan tipologi area dari ilmu Natural Language Processing yang
bergerak secara kontinum mulai dari level/tahap klasifikasi teks, sampai
mereview polaritasnya. Riset yang paling sering dilakukan terhadap
analisis Twitter adalah pada tahap klasifikasi.
2.2 KAJIAN INDUKTIF
Berdasarkan

penelitian

Nuke

Y

A


Faradhillah,

Renny

P

Kusumawardani, Irmasari Hafidz (2016) dalam penelitiannya yang berjudul
“Eksperimen Sistem Klasifikasi Analisa Sentimen Twitter Pada Akun Resmi
Pemerintah Kota Surabaya Berbasis Pembelajaran Mesin”, memaparkan
bahwa salah satu sumber informasi yang dibutuhkan oleh Pemerintah untuk
dapat meningkatkan kinerjanya adalah umpan balik dari masyarakat. Saat ini
media sosial digunakan oleh masyarakat sebagai alat untuk menyalurkan opini
dan kondisi yang terjadi di sekitar. Pemerintah Kota Surabaya memiliki akun
media sosial yaitu twitter bertujuan untuk meningkatkan interaksi kepada
masyarakat Surabaya secara luas. Untuk dapat memantau seluruh tweet pada
seluruh akun bukanlah sesuatu yang mudah dilakukan secara manual. Dalam
penelitian ini dilakukan pengklasifikasian opini masyarakat pada media twitter
menggunakan pembelajaran mesin. Pengklasifikasian dilakukan dengan
menggunakan algoritma Naïve Bayes dan Support Vector Machine (SVM).


Setelah klasifikasi, dibuat web framework pembuatan visualisasi berupa
wordcloud dan grafik streamgraph yang ditampilkan secara interaktif dengan
aplikasi berbasis web yaitu R Shiny.

Menurut penelitian yang dilakukan oleh Syahmia Gusriani, Kartina
Diah Kusuma Wardhani, Muhammad Ihsan Zul (2016) dalam penelitiannya
yang berjudul “Analisis Sentimen Terhadap Toko Online di Sosial Media
Menggunakan Metode Klasifikasi Naïve Bayes”, menjelaskan bahwa
Maraknya penggunaan jejaring sosial seperti Facebook mendorong munculnya
data tekstual yang tidak terbatas, sehingga muncul kebutuhan penyajian
informasi tanpa mengurangi nilai dari informasi tersebut. Salah satu
pemanfaatan data ini adalah untuk mengetahui opini atau sentimen publik
terhadap pelayanan dan produk suatu toko online. Metodologi yang digunakan
untuk melakukan analisis sentimen dimulai dari collecting data, preprocessing,
feature selection, klasifikasi dan pengukuran akurasi. Naive Bayes merupakan
metode klasifikasi yang digunakan untuk memperoleh hasil prediksi klasifikasi
sentimen. Hasil analisis pengujian menunjukkan kestabilan akurasi setelah
diuji dengan k-Fold Cross Validation dan Confusion Matrix dengan akurasi
93.7% dimana minimum support untuk Frequent Itemset Mining adalah 0.014.


BAB III
METODE PENELITIAN
3.1 OBJEK PENELITIAN
Objek dari analisis sentimen tweet adalah Starbucks
3.2 METODE PENGUMPULAN DATA
Berikut adalah metode pengumpulan data dalam penelitian ini
3.2.1 Studi Literatur
Pengumpulan data dilakukan dengan cara mempelajari, meneliti
dan menelaah berbagai literatur yang bersumber dari buku, situs
internet, jurnal ilmiah, dan sumber – sumber lainnya yang berkaitan
dengan penelitian yang dilakukan.
3.2.2 Pengumpulan Data Twitter
Pengumpulan data twitter dilakukan dengan menggunakan
sumber data primer yang diambil menggunakan Twitter Search API
dengan memasukan keyword yang berhubungan dengan objek
3.2.3 Observasi
Observasi yang dilakukan ialah mengamati data tweet yang
akan di analisis yang bersinggungan dengan objek penelitian.
3.3 JENIS DATA

Jenis data yang digunakan dalam penelitian ini adalah data primer
yaitu tweet yang berhubungan dengan objek penelitian (Starbucks) dari sosial
media Twiitter. Pengumpulan data menggunakan Twitter Search API dengan
memasukan keyword – keyword yang berhubungan dengan objek yang
dikombinasikan dengan kata – kata sentimen.
3.4 ALUR PENELITIAN
Berikut adalah tahapan – tahapan dalam penelitian

Identifik
asi
tweet

Penerap
an
metode
algoritm

Penerap
an
metode

algoritm

Pengujia
n
tingkat
akurasi

Gambar 3.1 Alur Analisis Sentimen

Berikut penjelasan dari alur analisis sentimen diatas :
1. Identifikasi Tweet
Identifikasi tweet merupakan tahapan awal yang dilakukan pada penelitian ini.
Pada tahap ini yang dilakukan adalah melakukan pengidentifikasian tweet yang
akan di analisis yaitu tweet yang bersinggungan dengan Starbucks
2. Penerapan Metode Algoritma Information Retrieval
Pada tahap ini tweet yang sudah diidentidikasi kemudian diterapkan algoritma
information retrieval untuk mengetahui tweet mana yang mengandung sentimen
dengan yang tidak, yang nantinya akan digunakan untuk perhitungan pada
penerapan metode algoritma extraxtion
3. Penerapan Metode Algoritma Extraction

Pada tahap ini tweet yang sudah di-retreve kemudian diekstrak menggunakan
algoritma extrction berupa klasifikasi yang sudah ditentukan
4. Pengujian Tingkat Akurasi
Pada tahap ini tweet yang sudah memiliki kelas masing – masing diuji
menggunakan metode pengujian, agar diketahui tingkat akurasi hasil yang tepat

BAB IV
HASIL DAN PEMBAHASAN
4.1

IMPLEMENTASI
Dalam menjalankan program kita perlu melakukan Installasi package –
package yang dibutuhkan sesuai kebutuhan pada penelitian ini.
install.packages("twitteR")
install.packages("ROAuth")
install.packages("tm")
install.packages("ggplot2")
install.packages("wordcloud")
install.packages("sentimentr")
install.packages("plyr")

install.packages("RTextTools")
install.packages("devtools")
install.packages("e1071")
require(devtools)
Setelah melakukan Installasi jalankan library yang dibutuhkan.
library(e1071)
library(twitteR)
library(ROAuth)
library(tm)
library(ggplot2)
library(wordcloud)
library(sentimentr)
library(plyr)
library(RTextTools)
library(e1071)
library(sentiment)
library(Rstem)

Gambar 1 (R Console)
Proses installasi package dari local filesGambar 1 (R Console), file dapat di
download melalui mirror atau dari repositori yang tersedia. Setelah terinstall panggil
library yang dibutuhkan.

Untuk dapat mengakses data dari twitter kita perlu memasukan(“consumer key”,
“consumer secret key”, “access token”,”access token key”) dari aplikasi yang dibuat
di apps.twitter.com
setup_twitter_oauth("uJ5u5Y4k69KCnSXIE1heiN6KP",
"Jt7oqVEd5Bd0owEFJguiY4gtMv3P8E8P6SHLMfphI3s4IHT3cN",
"514460550BTjSyvVg01i9l7ADeWRRry1udTBWXa6ec2dcbx6q","OyGA7Q8uG
bb8y2hay1Y71bwt1zprGZXTBT8NqVfyD1UQH")
Setelah memasukan Twitter Aouth, jalankan program satu persatu

# harvest some tweets
some_tweets = searchTwitter("starbucks", n=500, lang="en")
# get the text
some_txt = sapply(some_tweets, function(x) x$getText())
# remove retweet entities
some_txt = gsub("(RT|via)((?:\\b\\W*@\\w+)+)", "", some_txt)
# remove at people

some_txt = gsub("@\\w+", "", some_txt)
# remove punctuation
some_txt = gsub("[[:punct:]]", "", some_txt)
# remove numbers
some_txt = gsub("[[:digit:]]", "", some_txt)
# remove html links
some_txt = gsub("http\\w+", "", some_txt)
# remove unnecessary spaces
some_txt = gsub("[ \t]{2,}", "", some_txt)
some_txt = gsub("^\\s+|\\s+$", "", some_txt)
# define "tolower error handling" function
try.error = function(x)
{
# create missing value
y = NA
# tryCatch error
try_error = tryCatch(tolower(x), error=function(e) e)
# if not an error
if (!inherits(try_error, "error"))
y = tolower(x)
# result
return(y)
}
# lower case using try.error with sapply
some_txt = sapply(some_txt, try.error)
# remove NAs in some_txt
some_txt = some_txt[!is.na(some_txt)]
names(some_txt) = NULL
# classify emotion
library(sentiment)

class_emo = classify_emotion(some_txt, algorithm="bayes", prior=1.0)
# get emotion best fit
emotion = class_emo[,7]
# substitute NA’s by "unknown"
emotion[is.na(emotion)] = "unknown"
# classify polarity
class_pol = classify_polarity(some_txt, algorithm="bayes")
# get polarity best fit
polarity = class_pol[,4]
# data frame with results
sent_df = data.frame(text=some_txt, emotion=emotion,polarity=polarity,
stringsAsFactors=FALSE)
# sort data frame
sent_df = within(sent_df,emotion

Dokumen yang terkait

FREKWENSI PESAN PEMELIHARAAN KESEHATAN DALAM IKLAN LAYANAN MASYARAKAT Analisis Isi pada Empat Versi ILM Televisi Tanggap Flu Burung Milik Komnas FBPI

10 189 3

ANALISIS SISTEM PENGENDALIAN INTERN DALAM PROSES PEMBERIAN KREDIT USAHA RAKYAT (KUR) (StudiKasusPada PT. Bank Rakyat Indonesia Unit Oro-Oro Dowo Malang)

160 705 25

Analisis Sistem Pengendalian Mutu dan Perencanaan Penugasan Audit pada Kantor Akuntan Publik. (Suatu Studi Kasus pada Kantor Akuntan Publik Jamaludin, Aria, Sukimto dan Rekan)

136 695 18

Representasi Nasionalisme Melalui Karya Fotografi (Analisis Semiotik pada Buku "Ketika Indonesia Dipertanyakan")

53 338 50

Analisis Penyerapan Tenaga Kerja Pada Industri Kerajinan Tangan Di Desa Tutul Kecamatan Balung Kabupaten Jember.

7 76 65

Analisis Pertumbuhan Antar Sektor di Wilayah Kabupaten Magetan dan Sekitarnya Tahun 1996-2005

3 59 17

Analisis tentang saksi sebagai pertimbangan hakim dalam penjatuhan putusan dan tindak pidana pembunuhan berencana (Studi kasus Perkara No. 40/Pid/B/1988/PN.SAMPANG)

8 102 57

Analisis terhadap hapusnya hak usaha akibat terlantarnya lahan untuk ditetapkan menjadi obyek landreform (studi kasus di desa Mojomulyo kecamatan Puger Kabupaten Jember

1 88 63

DAMPAK INVESTASI ASET TEKNOLOGI INFORMASI TERHADAP INOVASI DENGAN LINGKUNGAN INDUSTRI SEBAGAI VARIABEL PEMODERASI (Studi Empiris pada perusahaan Manufaktur yang Terdaftar di Bursa Efek Indonesia (BEI) Tahun 2006-2012)

12 142 22

Hubungan antara Kondisi Psikologis dengan Hasil Belajar Bahasa Indonesia Kelas IX Kelompok Belajar Paket B Rukun Sentosa Kabupaten Lamongan Tahun Pelajaran 2012-2013

12 269 5