ANALISIS SENTIMEN WISATA BAHARI DI SULAWESI TENGGARA MEMANFAATKAN MEDIA SOSIAL TWITTER DENGAN MENGGUNAKAN METODE LEXICON-BASED

semanTIK, Vol.3, No.2, Jul-Des 2017, pp. 161-168
ISSN : 2502-8928 (Online)



161

ANALISIS SENTIMEN WISATA BAHARI DI
SULAWESI TENGGARA MEMANFAATKAN MEDIA
SOSIAL TWITTER DENGAN MENGGUNAKAN
METODE LEXICON-BASED
Statiswaty*1, Rusnia2, Natalis Ransi 3
Jurusan Teknik Informatika, Fakultas Teknik, Universitas Halu Oleo, Kendari
e-mail : *[email protected] ,[email protected], [email protected]
*1,2,3

Abstrak
Sulawesi Tenggara memiliki potensi wisata bahari yang cukup besar yang masih perlu
dikembangkan. Salah satu cara mengembangkannya adalah melalui analisis sentimen pada media
sosial seperti Twitter. Twitter adalah sebuah media sosial yang memberikan kemudahan bagi
penggunanya untuk membagi dan mengakses informasi. Pengguna jejaring sosial twitter tersebar di

seluruh penjuru dunia dan diakses melalui berbagai macam perangkat teknologi. Melalui penggunaan
twitter, berbagai tanggapan atau sentimen masyarakat pada suatu tempat wisata dapat diperoleh untuk
mengetahui kekurangan yang dimiliki tempat wisata tersebut. Dengan demikian, berdasarkan tweet
dari wisatawan, maka dapat dilakukan analisis sentimen pada wisata bahari di Sulawesi Tenggara.
Untuk membangun sentiment classifier diperlukan sebuah metode di dalamnya. Metode yang
digunakan dalam penelitian ini adalah Lexicon-Based yaitu metode untuk melakukan analisis
sentimen yang berbasis kamus. Metode ini dapat mengidentifikasi sentimen dari setiap opinion words
yang terdapat pada data tweet
Berdasarkan hasil uji coba dan evaluasi yang telah dilakukan, maka sistem yang dibuat mampu
memberikan informasi tentang opini positif,negatif dan netral masyarakat terhadap wisata bahari di
Sulawesi Tenggara. Penelitian ini mendapatkan hasil akurasi 77,06 %.
Kata Kunci—Analisis Sentimen, Lexicon-Based, Twitter, Wisata Bahari.
Abstract
Southeast Sulawesi has a big potential in marine tourism sector that needed to be improved.
One of the ways to improve the potential is by doing sentiment analysis from social media like
Twitter. Twitter is a social media that allows users to share and accessinformation. Users of twitter
are spread all over the world and can be accessed through various devices. By using Twitter, we can
obtain various sentiments and responses from people in order to know the shortcomings of that
tourism place. Therefore, based on tourist twitter status, sentiment analysis of marine tourism sector
in Southeast Sulawesi can be analyzed.

To build a sentiment classifier it required a method. The method used in this study is the
Lexicon-Based method of conducting a dictionary-based sentiment analysis. This method can identify
the sentiments of each opinion words contained in the data tweet.
Based on the results of testing and evaluations that have been done, the system is capable to
provide information about positive, negative and neutral opinion of the community towards marine
tourism in Southeast Sulawesi. This research get the result of accuracy 77,06%.
Keywords—Sentiment Analisys, Lexicon-Based, Twitter, Marine Tourism.

Received June 1st ,2012; Revised June 25th, 2012; Accepted July 10th, 2012

162

Analisis Sentimen Wisata Bahari di Sulawesi Tenggara…

2. METODE PENELITIAN

1. PENDAHULUAN

I


ndonesia
merupakan negara yang
memiliki objek wisata yang sangat
menarik seperti wisata alam, wisata
budaya, sejarah maupun wisata bahari. Di
antara sekian banyak objek wisata yang ada,
Sulawesi Tenggara menyuguhkan objek wisata
bahari yang sangat indah [1]. Keindahan alam
yang dimiliki, menarik minat wisatawan untuk
mengunjungi berbagai objek wisata bahari
tersebut. Dari besarnya minat wisatawan,
menyebabkan banyaknya pengguna jejaring
sosial yang melakukan posting tentang wisata
bahari yang dikunjungi. Wisata bahari di
Sulawesi Tenggara masih perlu dikembangkan
maka dari itu dibutuhkan respon masyarakat
untuk mengetahui kekurangan yang dimiliki
wisata tersebut.
Pengguna jejaring sosial tersebut
tersebar di mana-mana di seluruh penjuru

dunia dan dapat diakses melalui berbagai
macam perangkat teknologi. Twitter adalah
sebuah media sosial yang memberikan
kemudahan bagi penggunanya untuk membagi
dan
mengakses
informasi.
Peneliti
menggunakan media sosial Twitter sebagai
sumber data analisis dengan menggunakan
Twitter API yang telah ada. Berdasarkan tweet
dari masyarakat, maka dapat dilakukan
analisis sentimen pada wisata bahari.
Sentiment Analysis, atau disebutjuga opinion
mining, merupakan bidang studi yang
menganalisis opini, sentimen, evaluasi,
penilaian, sikap dan emosi publik terhadap
suatu entitas seperti produk, pelayanan,
organisasi, individu, masalah, peristiwa, topik,
dan atributnya [2].

Untuk membangun sentiment classifier
diperlukan sebuah metode di dalamnya.
Metode yang digunakan dalam penelitian ini
adalah Lexicon-Based yaitu metode untuk
melakukan analisis sentimen yang berbasis
kamus. Metode ini dapat mengidentifikasi
sentimen dari setiap opinion words yang
terdapat pada data tweet. Untuk menganalisis
wisata bahari diperlukan metode yang dapat
melihat langsung penilaian masyarakat
terhadap suatu objek.

2.1

Twitter
Twitter adalah sebuah situs web yang
dimiliki dan dioperasikan oleh Twitter Inc.,
yang
menawarkan jejaring
sosial berupa mikroblog sehingga

memungkinkan penggunanya untuk mengirim
dan
membaca
pesan
yang
disebut
kicauan (tweet). Kicauan (tweet) adalah teks
tulisan yang memiliki 140 karakter yang
ditampilkan pada halaman profil pengguna.
Kicauan (tweet) bisa dilihat secara luas,
namun pengirim dapat membatasi pengiriman
pesan ke daftar teman-teman mereka saja.
Pengguna dapat melihat kicauan (tweet)
penulis lain yang dikenal dengan sebutan
pengikut (follower).Semua pengguna dapat
mengirim dan menerima kicauan (tweet)
melalui situs Twitter, aplikasi eksternal yang
kompatibel (telepon seluler), atau dengan
pesan singkat (SMS) yang tersedia di negaranegara
tertentu.

Pengguna
Twitter,
berdasarkan data PT Bakrie Telecom,
memiliki 19,5 juta pengguna di Indonesia dari
total 500 juta pengguna global. Twitter
menjadi salah satu jejaring sosial paling besar
di dunia sehingga mampu meraup keuntungan
mencapai USD 145 juta (Kominfo, 2017).
2.2

Text Mining
Text mining (penambangan teks) adalah
penambangan yang dilakukan oleh komputer
untuk mendapatkan sesuatu yang baru dalam
bentuk sebuah informasi, sesuatu yang tidak
diketahui sebelumnya atau menemukan
kembali informasi yang tersirat secara implisit,
yang berasal dari informasi yang diekstrak
secara otomatis dari sumber-sumber data teks
yang berbeda-beda [3]. Pada dasarnya proses

kerja dari text mining banyak mengadopsi
penelitian data mining, namun yang menjadi
perbedaan adalah pola yang digunakan oleh
text mining diambil dari sekumpulan bahasa
alami yang tidak terstruktur, sedangkan dalam
data mining pola yang diambil adalah dari data
yang terstruktur. Tahapan-tahapan dalam text
mining secara umum adalah text preprocessing
dan feature selection [3].
2.3

Analisis Sentimen
Sentiment analysis atau opinion mining
mengacu pada bidang yang luas dari
pengolahan bahasa alami, komputasi linguistik
dan text mining yang bertujuan menganlisa
pendapat, sentimen, evaluasi, sikap, penilaian
IJCCS Vol. x, No. x, July 201x : first_page – end_page

 163


Statiswaty, Rusnia dan RansiIJCCSISSN: 1978-1520

dan emosi seseorang apakah pembicara atau
penulis berkenaan dengan suatu topik ,
produk, layanan, organisasi, individu, ataupun
kegiatan tertentu.
Tugas dasar dalam analisis sentimen
adalah mengelompokkan teks yang ada dalam
sebuah kalimat atau dokumen kemudia
menentukan pendapat yang dikemukakan
dalam kaliamat atau dokumen tersebut apakah
bersifat positif, negatif atau netral [2].
Sentiment analysis juga dapat menyatakan
perasaan emosional sedih, gembira, atau
marah.
2.4

Lexicon-Based
Salah satu pendekatan yang umum

digunakan dalam melakukan analisis sentimen
adalah dengan menggunakan Lexicon-Based.
Metode ini disebut juga sebagai lexical based
approach. Lexical based approach merupakan
sebuah metode untuk melakukan analisis
sentimen dengan menggunakan sebuah kamus
sebagai sumber bahasa atau leksikal.
Tahapan proses dari metode LexiconBased :
1. Data Acquisition
Pada proses ini dilakukan pengambilan
data dari media sosial berbahasa indonesia.
Hasil dari proses ini adalah daftar opini
pembaca serta metadata-nya seperti: nama
user dan waktu.
2. Load Dictionary
Pada proses ini dilakukan load kamus.
Kamus adalah komponen penting dalam
sistem yang
menggunakan
pendekatan

lexicon-based. Kamus digunakan dalam
proses normalisasi kalimat dan ekstraksi kata
kunci. Dalam penelitian ini merujuk pada
kamus KBBI, dimana penulis menggunakan
kamus KBBI tersebut dalam membangun
sistem analisis sentimen untuk wisata bahari
di Sulawesi Tenggara.
3. Preprocessing
Preprocessing
bertujuan
untuk
menyiapkan kalimat sebelum dilakukan
ekstraksi kata kunci dan penentuan sentimen.
Proses yang dilakukan adalah normalisasi
kalimat yang bertujuan untuk menormalkan
kalimat sehingga kalimat tidak baku menjadi
normal sehingga bahasa tidak baku tersebut
dapat dikenali sebagai bahasa yang sesuai
dengan KBBI.

4. Menghilangkan emoticon
Ketika sedang menulis status (tweet)
seseorang kadang salah atau kurang tepat
dalam penggunaan emoticon, entah disengaja
atau tidak banyak yang melakukannya.
Table 1 menunjukkan konversi emoticon
yang dapat dilihat pada Tabel 1.
Tabel 1 Konversi Emoticon
Emoticon
:) :-) :)) :-)) =) =))

Konversi
Senyum
Tawa

:D :-D =D
:-( :(

Sedih

;-) ;)

Kedip

:-P :P

Ejek

:-/ :/

Ragu

:| :-|

Haru

5. Extract keywords
Proses ini bertujuan untuk mengekstraksi
kata kunci penentu sentimen positif dan
negatif. Berikut
adalah
kamus
yang
digunakan dalam penelitian ini dan contoh isi
kamusnya:
a. Kata kunci positif : bagus, cantik, indah
b. Kata kunci negatif : jelek, kotor, jauh
c. Kata kunci netral : biasa
d. Kamus gaul : bgmn = bagaimana, bgs =
bagus, z = sy.
6. Determine sentiment
Proses ini bertujuan untuk menentukan
sentimen suatu kalimat opini, penentuan
sentimen dilakukan dengan menghitung
probabilitas kemunculan kata kunci positif
dan kata kunci negatif. Klasifikasi pada
dictionary based approach dilakukan
berdasarkan Persamaan (1).
If ∑ k score(k) > 0 then positive
If ∑k score(k) < 0 then negative
If ∑k score(k) = 0 then neutral

(1)

Di mana :
∑k score (k) = Nilai bobot sentimen.
Untuk menghitung jumlah akurasi pada
data tweet digunakan Persamaan (2)
=

× 100

(2)

Di mana :
t = jumlah sentemen yang benar
n = jumlah seluruh data tweet

Title of manuscript is short and clear, implies research results (First Author)

164

Analisis Sentimen Wisata Bahari di Sulawesi Tenggara…

Performa sistem diukur dengan cara
menghitung tingkat akurasi deteksi sistem.
Akurasi dihitung dengan cara membandingkan
hasil deteksi sentimen dari sistem dengan nilai
sentimen sebenarnya yang sebelumnya telah
ditentukan oleh manusia, dalam hal ini oleh
penulis sendiri.
2.5

Unified Modeling Language (UML)
UML disebut sebagai bahasa pemodelan
bukan metode. Kebanyakan metode terdiri
paling sedikit prinsip, bahasa pemodelan dan
proses. Bahasa pemodelan (sebagian besar
grafik) merupakan notasi dari metode yang
digunakan untuk mendesain secara cepat.
Bahasa
pemodelan
merupakan bagian
terpenting dari metode. Ini merupakan bagian
kunci tertentu untuk komunikasi. UML
merupakan bahasa standar untuk penulisan
blue print software yang digunakan untuk
visualisasi, spesifikasi, pembentukan dan
pendokumentasian alat-alat dari
sistem
perangkat lunak [4].
Dalam terapannya, UML digambarkan
dalam bentuk diagram. Diagram yang
digunakan dalam penelitian, yaitu:
1. Use case adalah deskripsi fungsi yang
disediakan oleh sistem dalam bentuk teks
sebagai dokumentasi dari use case symbol
namun dapat juga dilakukan dalam activity
diagrams. Use case digambarkan hanya
yang dilihat dari luar oleh actor (keadaan
lingkungan sistem yang dilihat user) dan
bukan bagaimana fungsi yang ada di dalam
sistem.
2. Diagram Aktivitas menggambarkan aliran
kerja (workflow) atau aktivitas dari sebuah
sistem atau proses bisnis atau menu yang
ada pada perangkat lunak. Diagram
Aktivitasmenggambarkan aktivitas sistem
bukan apa yang dilakukan Aktor.
3. Diagram Sekuen menggambarkan kelakuan
objek
pada
Use
Case
dengan
mendeskripsikan waktu hidup objek dan
pesan yang dikirimkan dan diterima antar
objek. Jumlah Diagram Sekuen yang harus
digambar adalah minimal sama dengan
jumlah Use Case yang didefinisikan.

menggunakan web browser dan xampp . Uji
coba dilakukan untuk mengetahui apakah
program dapat berjalan sebagaimana mestinya
dengan lingkungan uji coba yang telah
ditentukan serta dilakukan sesuai dengan
skenario uji coba.
3.1

Arsitektur Sistem
Pada arsitektur sistem dijelaskan
dimana user menggunakan web aplikasi untuk
menentukan kata kunci yang digunakan.
Setelah kata kunci telah ditentukan, dilakukan
pengambilan data pada twitter menggunakan
API twitter. Setelah data terkumpulkan maka
dilakukan proses preprocessing, pada proses
ini dilakukan normalisasi kalimat dan
tokenisasi. Lexicon-Based digunakan untuk
memuat kamus kata kunci dan menentukan
sentimen dari tweet yang telah dianalisis, maka
akan keluar output data tweet dan diagram.
3.2

Analisis Kebutuhan Sistem
Pada tahap selanjutnya menganalisis
apayang
dibutuhkan
sistem.
Analisis
kebutuhan sistem terbagi atas kebutuhan
fungsional dan non-fungsional.
3.3

Rancangan Sistem
Rancangan Analisis Sentimen Wisata
Bahari di Sulawesi Tenggara menggunakan
Unified
Modelling
Language
(UML).
DalamPenelitian ini, penulis menyajikan
rancangansistem menggunakan 3 diagram,
yaitu Diagram Use Case, Diagram Activity
danDiagram Sequence.
1. Gambar 1 menunjukkan Diagram Use
Case yang menggambarkan fungsionalitas
yang diharapkan dari sebuah sistem, selain
itu juga menggambarkan kebutuhan sistem
dari sudut pandang User/Pemain.

3. HASIL DAN PEMBAHASAN
Dalam bab ini dibahas mengenai
program dan hasil uji coba program yang telah
dirancang dan diimplementasikan dengan
IJCCS Vol. x, No. x, July 201x : first_page – end_page

Gambar 1 Diagram Use Case

 165

Statiswaty, Rusnia dan RansiIJCCSISSN: 1978-1520
2.

Gambar 2 menunjukkan Diagram Activity
memodelkan prosesproses apa saja yang
terjadi pada sistem.

Gambar 2 Diagram Activity
3. Gambar
3
menunjukkan
Diagram
Sequence yang menjelaskan interaksi
objek yang berdasarkan urutan waktu, atau
dapat menggambarkan urutan atau tahapan
yang harus dilakukan untuk dapat
menghasilkan sesuatu.

ditentukan serta dilakukan sesuai dengan
skenario uji coba.
Pada tahap ini dilakukan proses
pengujian terhadap suatu sistem yang
dibangun. Pengujian yang akan dilakukan
mempunyai mekanisme untuk menemukan
data uji yang dapat menguji perangkat lunak
secara lengkap dan mempunyai kemungkinan
tinggi untuk menemukan kesalahan. Tujuan
dari pengujian ini adalah untuk menjamin
bahwa perangkat lunak yang dibangun
memiliki kualitas yang handal yaitu mampu
mempresentasikan
kajian
pokok
dari
spesifikasi,
analisis,
perancangan
dan
pengkodean dari perangkat lunak itu sendiri.
1. Tampilan Halaman Utama
Gambar 4 menunjukkan menu Beranda
dari sistem. Halaman ini merupakan halaman
utama dari aplikasi, pada halaman ini
menampilkan peta wisata bahari di Sulawesi
Tenggara.

Gambar 4 Halaman Utama
2. Tampilan Menu Ambil Tweet
Gambar 5 menunjukkan tampilan menu
Ambil tweet, akan menampilkan sebuah form
kata
kunci
dimana Pengguna dapat
mememasukan kata kunci nama wisata yang
akan dianalisis, kata kunci tersebut akan
memanggil sejumlah tweet yang berkaitan
dengan kata kunci tersebut.
Gambar 3 Diagram Sequence
3.4

Implementasi Sistem
Dalam bab ini dibahas mengenai
program dan hasil uji coba program yang telah
dirancang dan diimplementasikan dengan
menggunakan web browser dan xampp . Uji
coba dilakukan untuk mengetahui apakah
program dapat berjalan sebagaimana mestinya
dengan lingkungan uji coba yang telah

Gambar 5 Halaman Menu Ambil Tweet

Title of manuscript is short and clear, implies research results (First Author)

166

Analisis Sentimen Wisata Bahari di Sulawesi Tenggara…

3. Halaman Menu Preprocessing
Gambar
6
menunjukkan
halaman
untukmenyiapkan kalimat sebelum dilakukan
ekstraksi kata kunci dan penentuan sentimen.
Proses yang dilakukan terdiri dari normalisasi
kalimat dan tokenisasi.

4. KESIMPULAN
Kesimpulan dari penelitian ini yaitu :
1. Aplikasi
ini
mampu
melakukan
mengklasifikasi sentimen yang ada pada
sebuah
Tweet
secara
otomatis
mengggunakan metode Lexicon-Based
dengan akurasi sistem 77.06 %.
2. Proses klasifikasi semakin akurat jika data
latih yang digunakan dalam pembelajaran
berjumlah banyak, akan tetapi dapat juga
mengurangi keakuratan jika kata-kata
yang terdapat pada Tweet
tersebut
mengalamibias atau bermakna ganda.
5. SARAN

Gambar 6 Halaman Menu Prepocessing
4. Halaman Menu Klasifikasi
Gambar 7 menunjukkan halaman dimana
tweet yang telah melalui proses preprocessing
akan diklasifikasi menjadi sentimen positif,
netral maupun negatif. Tampilan Menu
Klasifikasi dapat dilihat pada Gambar 7.

Saran dalam penelitian ini untuk
penelitian selanjutnya yaitu :
1. Untuk penelitian berikutnya diharapkan
sistem
ini
tidak
hanya
untuk
mengklasifikasi untuk sentimen terhadap
Wisata Bahari tetapi juga terhadap tokoh
politik atau produk yang lain.
2. Wisata yang akan dianalisis tidak dibatasi
agar Wisata Bahari yang tidak terdapat
dalam sistem dapat dilakukan analisis
sentimennya.
3. Bahasa yang digunakan tidak hanya
bahasa
Indonesia
tetapi
bisa
menggunakan bahasa asing dan bahasa
daerah.
DAFTAR PUSTAKA

Gambar 7 Halaman Menu Klasifikasi

[1]

Akhyaruddin, 2012, The Asia Pacific
Region Discussion Forum on Blue
Economy
Report.
http://www.imacsindonesia.com/v5/inde
x.php/id/news/87-the-asia-pacificregion-discussion-forum-on-blueeconomy, diakses tanggal 4 Agustus
2017

[2]

Dehaff, M., 2010, Sentiment Analysis,
Hard
But
Worth
It!
http://customerthink.com/sentiment_anal
ysis_hard_but_worth_it/,
diakses
tanggal 2 Agustus 2017

[3]

Feldman, Ronen dan Sanger, James.
2007. The Text Mining Handbook
Advanced Approaches in Analyzing
Unstructured
Data.
Cambridge
University Press, New York.

5. Menu Visualisasi
Gambar 8 menunjukkan grafik analisis
sentimen pada wisata bahari yang menjadi
kata kunci saat melakukan ambil tweet.
Tampilan MenuVisualisasidapat dilihat pada
Gambar 8.

Gambar 8 Halaman Menu Visualisasi

IJCCS Vol. x, No. x, July 201x : first_page – end_page

Statiswaty, Rusnia dan RansiIJCCSISSN: 1978-1520

[4]

 167

A.S, Rosa, dan M. Shalahuddin. 2011,
Modul
Pembelajaran
Rekayasa.
Perangkat Lunak (Terstruktur dan
Berorientasi Objek). Bandung : Modula

Title of manuscript is short and clear, implies research results (First Author)

168

Analisis Sentimen Wisata Bahari di Sulawesi Tenggara…

IJCCS Vol. x, No. x, July 201x : first_page – end_page