Analisis Opini Masyarakat terhadap Acara Televisi

ANALISIS OPINI TERHADAP TANGGAPAN MASYARAKAT UNTUK
REVIEW ACARA TELEVISI ATAU FILM
Joan Santoso1, Devi Dwi Purwanto2, Jonie Hermanto3, Bobby Salim4
1
Departemen Teknologi Informasi, 2,3,4Departemen Sistem Informasi
Sekolah Tinggi Teknik Surabaya
joan@stts.edu, devi@stts.edu, jonie@stts.edu, bobbysalim1993@gmail.com
Sebagai salah satu media informasi dan hiburan, acara televisi ditujukan untuk pemirsa dari
semua kalangan. Informasi tersebut secara tidak langsung akan dinikmati secara serentak oleh
masyarakat luas sehingga dapat memberikan opini tersendiri bagi masyarat yang menontonnya.
Karakteristik tiap acara dari media yang menjadi penyalur acara tersebut sangat beraneka ragam.
Fenomena ini menjadi salah satu yang menarik untuk digali. Media sosial seringkali digunakan oleh
berbagai user untuk menyampaikan aspirasi dari opini terkait film atau acara televisi yang telah
ditonton. Hal ini menjadi menarik karena dapat digunakan sebagai input yang berharga untuk menjadi
bahan evaluasi dari penyelenggara acara televisi acara tersebut. Penelitian ini memanfaatkan data dari
acara televisi di media sosial tersebut agar dapat dianalisa apakah sebuah acara televisi mendapatkan
opini yang baik atau buruk berdasarkan komentar user di twitter. Metode yang digunakan dalam
penelitian ini adalah Naive Bayes Classfier. Hasil dari penelitian ini menunjukkan bahwa sistem yang
dibangun dapat memberikan rata-rata keakuratan sebesar 80.23 persen untuk menentukan opini dari
sebuah acara televisi dari media sosial.
Kata Kunci - Analisa Opini, Acara Televisi, Naive Bayes


1.

Latar Belakang
Acara yang disuguhkan di televisi (TV) sangat beragam. Mulai dari sinetron,
FTV (Film TV), kuis sampai reality show bergiliran mucul di layar kaca. Beberapa
acara bertahan lama namun tidak sedikit acara yang sekedar numpang lewat. Acara
yang bertahan lama tersebut tidak lepas dari tingginya rating yang didapat oleh acara
yang bersangkutan. Jika banyak pemirsa yang bersedia menonton acara tertentu maka
acara tersebut dinilai dengan rating tinggi. Sayangnya, tingginya rating suatu acara
tidak selalu berbanding lurus dengan kualitas acara yang dipertontonkan. Tingginya
rating juga tidak mencerminkan seberapa bagus acara tersebut untuk dikonsumsi
semua kalangan umur. Karakteristik tiap acara dari media yang menjadi penyalur
acara tersebut sangat beraneka ragam. Fenomena ini menjadi salah satu hal yang
menarik untuk digali. Media sosial seringkali digunakan oleh berbagai user untuk
menyampaikan aspirasi dari opini terkait film atau acara televisi yang telah ditonton.
Analisa opini atau sentiment analysis telah banyak dilakukan oleh berbagai pihak
untuk menilai sebuah tanggapan masyarakat terhadap sebuah produk. Penelitian
terkait untuk melakukan analisa review film telah dilakukan sebelumnya oleh
Chandani(Chandani,2015). Penelitian menggunakan data media social seperti twitter

sebagai data untuk analisa opini atau sentiment analisis telah dilakukan pada Bahasa
Inggris oleh Alexander Pak pada tahun 2010(Pak, 2010) dan Alec Go pada tahun
2009(Go, 2009). Sedangkan penelitian untuk analisa opini dari data media sosial pada
Bahasa Indonesia telah dilakukan oleh berbagai pihak, antara lain Noviah Dwi
Putrianti dan Edi Winarko yang menganalisa teks twitter Bahasa Indonesia dengan
Maximum Entropy dan SVM(Putranti, 2014). Terdapat penelitian lain selain untuk
menganalisa topik untuk review film, yaitu sentimen dan ekstraksi topik penentu
65

sentimen pada opini terhadap tokoh publik yang dilakukan oleh Ismail Sunni dan Dwi
Hendratmo Widyantoro pada tahun 2012(Sunni, 2012).
Melihat fenomena riset dari sentiment analysis yang telah dilakukan
sebelumnya, maka dilakukan upaya untuk mengembangkan sistem dalam melakukan
analisa opini dari masyarakat terhadap review acara televisi atau film yang ada di
media sosial. Data dari media sosial ini akan diambil dan diolah dengan algoritma
Naive Bayes untuk mengkategorikan sebuah opini tersebut termasuk dalam positif,
negatif, atau netral.
2

Analisa Opini

Analisis sentimen atau Opinion Mining merupakan proses untuk mendapatkan
informasi yang terkandung dalam suatu kalimat opini. Analisis sentimen dilakukan
untuk melihat pendapat atau kecenderungan opini terhadap sebuah dari seseorang,
apakah cenderung berpandangan atau beropini negatif atau positif. Salah satu contoh
penggunaan analisis sentimen dalam dunia nyata adalah identifikasi kecenderungan
dari opini pasar terhadap suatu objek. Opini tersebut akan dianalisa untuk
mendapatkan kesimpulan apakah masyarakat mengetahui barang tersebut dan apakah
pasar menyukai barang tersebut atau tidak.
Ada beberapa jenis pembagian pada Opinion Mining yang dilakukan oleh para
peneliti. Menurut Korfiatis (Korfiatis, 2015) terdapat 3 tipe Opinion Mining yaitu :
1. Opinion Extraction
Opinion Extraction adalah proses mengekstrak opini dari sebuah teks. Fokus
Opinion Extractiontidak untuk mengklasifikasikan setiap review secara
keseluruhan, tetapi mengklasifikasikan setiap kalimat yang berisi beberapa
fitur produk. Beberapa kalimat mungkin akan mengekspresikan pendapat
positif sementara kalimat lain mungkin mengekspresikan pendapat negatif.
Tujuannya adalah untuk mengekstrak opini dari sebuah dokumen atau
beberapa paragraf sehingga mendapatkan kesimpulan opini positif dan opini
negative atas dokumen atau paragraf tersebut.
2. Opinion Classification

Opinion Classification adalah proses mengolah opini dari sebuah teks melalui
analisa secara subjektif.Opinion Classification mengidentifikasi dan
mendapatkan hasil analisa apakah sebuah teks berisi opini positif atau
negatif.Contoh : “The picture quality of this camera is amazing”, klasifikasi
opini dari teks diatas adalah positif.
3. Sentiment Assessment
Sentiment Assessment adalah proses mengolah opini dari sebuah teks melalui
analisa berdasarkan keadaan emosi seseorang. Opinion Classification
mengidentifikasi dan mendapatkan hasil analisa apakah seseorang sedang
bahagia, marah, atau bahkan sedih.Dengan melakukan proses analisa yang
sudah dijelaskan diatas, kita dapat mendapatkan beberapa informasi seperti
holder / sumber opini, target / objek atau fitur, type / jenis perilaku dan text /
kalimat.Berbicara mengenai keadaan emosi, Sentiment Assessmentjuga
66

memungkinkan untuk mendapatkanbeberapa tipologi keadaan emosi
seseorang terhadap suatu objek.Dr Klaus Scherer mengelompokan beberapa
kondisi emosi seseorang sebagai berikut1:
 Emotion : angry, sad, joyful, fearful
 Mood : cheerful, gloomy, irritable, listless

 Interpersonal stances : friendly, cold, warm
 Attitudes : loving, hating, desiring
 Personality traits : nervous, anxious, reckless
Selain pembagian jenis Opinion Mining yang sudah dijabarkan diatas, Opinion
Mining juga dapat dibedakan berdasarakan tingkat kesulitan dan hasilnya.Berikut
adalah jenis Opinion Mining berdasarkan tingkat kesulitannya.
1. Tingkat termudah hanyalah untuk menganalisa apakah opini tersebut termasuk
opini positif atau opini negative.
2. Tingkat menengah analisis opini dilakukan untuk mendapatkan hasil dengan
opsi lebih dari 2, seperti nilai 1-5 dan kemudian mengurutkan hasilnya.
3. Tingkat lanjut dari analisis opini untuk mendapatkan dan menganalisa sumber,
target, atau kondisi emosi yang lebih kompleks.
3.

Metodologi
Pada bagian ini akan dijelaskan mengenai arsitektur system dari Sentiment
Analysis yang akan digunakan dalam penelitian ini yang dapat dilihat pada gambar 1.
Pada arsitektur penelitian ini proses akan dibagi menjadi 3 bagian, yaitu
preprocessing, ekstraksi feature, training/testing. Fase preprocessing dilakukan
tahapan pengolahan data teks meliputi tokenisasi dan stemming. Fase ekstraksi

features dilakukan dengan mengubah data menjadi bag of word. Fase training akan
digunakan untuk membentuk model dari Naïve Bayes dan fase testing akan
digunakan untuk melabeli data tweet baru yang ada di sistem. Detail dari setiap
proses akan dijabarkan lebih lanjut pada subbab berikutnya.
3.1

Preprocessing
Pada fase ini dilakukan preprocessing terhadap data teks yang akan diolah.
Baik untuk training dan testing akan dilakukan tahapan yang sama pada fase ini.
Preprocessing yang akan dilakukan adalah mencakup pemisahan token dan stemming.
Untuk algoritma stemming yang digunakan adalah menggunakan algoritma stemmer
Bahasa Indonesia yang telah dikembangkan oleh Fadillah Z. Tala pada tahun
2003.(Tala, 2003). Ilustrasi dari tahapan preprocessing dapat dilihat pada gambar 2.

Michel Gen´ ereux and Roger Evans, “Distinguishing affective states in weblog posts
”, http://lipn.univ-paris13.fr/~genereux/pub_fichiers/SS0603GenereuxM.pdf, diakses 7 April 2015,
jam 15:00 WIB.

1


67

Gambar 1. Arsitektur Sistem

Gambar 2. Alur Preprocessing
Hasil dari proses tokenisasi fase ini adalah sekumpulan kata yang telah dipisahkan
dan dinormalisasi dengan mengubah menjadi huruf kecil. Proses pengubahan ini
diberi nama dengan case folding. Hasil dari stemming adalah seluruh kata turunan
seperti pada contoh “sangatlah” akan berubah menjadi bentuk dasarnya, yaitu
“sangat” dan “pemainnya” berubah menjadi bentuk kata dasar yaitu main. Dari
sekumpulan kata-kata yang telah dilakukan stemming tersebut akan dijadikan input
dari fase berikutnya yaitu feature extraction. Setelah itu dilakukan pembuangan
stopword dari dokumen tersebut. Stopword list menggunakan hasil penelitian dari
Fadillah Z. Tala(Tala, 2003).
3.2

Feature Extraction
Pada tahapan ini dilakukan proses ekstraksi fitur dari data yang digunakan.
Extraksi fitur pada penelitian ini akan menggunakan representasi bag-of word
standard seperti pada penelitian yang dilakukan oleh B. Lee Pang pada tahun

68

2002(Pang, 2002). Selain pengubahan opini menjadi bentuk bag of word, maka juga
dilakukan proses penanganan kalimat negasi. Hal ini dilakukan untuk membedakan
kata-kata yang berada pada setelah kata negasi dengan yang tidak. Contoh ilustrasi
pengubahan dari data opini menjadi bag- of word dapat dilihat pada gambar 3.
Pada penanganan untuk kata negasi, setiap bertemu kata negasi seperti di
contoh, maka seluruh kata akan ditambahkan kata not setelah kata negasi hingga
bertemu tanda baca. Pada ilustrasi gambar 3, dilakukan penambahan kata not dari
setelah kata not hingga bertemu titik sehingga dapat dianggap sebagai kata yang
berbeda dengan kata yang tidak dinegasi. Dalam pembentukan bag-of word, seluruh
kata unik yang akan disimpan dalam vocabulary dan kata-kata tersebut akan
digunakan sebagai fitur dari proses klasifikasi.

Gambar 3. Ekstraksi Fitur
Klasifikasi
Algoritma naïve bayes adalah salah satu algoritma yang sering digunakan
dalam klasifikasi teks. Pada penelitian ini naïve bayes digunakan untuk
mengkategorikan opini ke dalam tiga kelas, yaitu positif, negatif, atau netral. Naïve
bayes pada prinsip menggunakan teorema bayes dengan asumsi bahwa setiap fitu

adalah tidak saling terkait.
3.3

Teorema Bayes digunakan untuk menghitung probabilitas terjadinya suatu
peristiwa berdasarkan pengaruh yang didapat dari hasil pengamatan. Teorema Bayes
menerangkan hubungan antara probabilitas terjadinya peristiwa A dengan syarat
peristiwa B telah terjadi dan probabilitas terjadinya peristiwa B dengan syarat
peristiwa A telah terjadi.
Sebagai contoh, jika terdapat 3 macam buah (apel, jeruk, semangka) di dalam
sebuah kotak dan seseorang mempunyai keyakinan bahwa ada kemungkinan buah
apel akan muncul maka probabilitas apel disebut probabilitas prior dan dilambangkan
69

sebagai P(apel). Setelah ada informasi tambahan semisal “ukuran kecil”, maka
probabilitas buah sekarang adalah probabilitas bersyarat akibat informasi tambahan
yang muncul. Probabilitas munculnya buah apel jika diketahui ukuran buah kecil
disebut juga probabilitas posterior dan dilambangkan sebagai P(ukuran = kecil | apel).
Penentuan kelas yang cocok bagi suatu sampel dilakukan dengan cara
membandingkan nilai Posterior untuk masing-masing kelas, dan mengambil kelas
dengan nilai Posterior yang tinggi. Secara matematis klasifikasi dirumuskan pada

rumus (1).
= argmax ( | ) ( )


(1)

Dimana :
 c yaitu variabel kelas yang tergabung dalam suatu himpunan kelas C
 d adalah dokumen atau artikel yang akan dikategorikan.
 P(d|c) adalah probabilitas posterior dari dokumen d jika diketahui target class
nya adalah c
 P(c) adalah probabilitas prior dari target class c di data.
Untuk melakukan perhitungan dari probabilitas posterior P(d|c) dilakukan dengan
menggunakan rumus (2) dan (3) sebagai berikut.

( | )= ∏
(

| )=


(


(

, )

( ) |

| )

(2)
(3)

|

Dimana :
 P(wi|c) adalah probabilitas kemunculan kata ke –i pada target class c di
dataset.
 Count(wi,c) adalah jumlah kemunculan kata w pada kelas c di dataset.
 Count(c) adalah jumlah kemunculan seluruh kata yang ada di kelas c di
dataset.
 |V| adalah jumlah kata unik yang digunakan sebagai fitur atau yang ada di
dalam vocabulary.
Pada perhitungan dari probablitas posterior tersebut dilakukan penambahan laplace
smooting dengan mengganggap bahwa seluruh kata akan muncul sekali. Smooting
dilakukan untuk mengatasi kata-kata yang tidak muncul pada waktu proses
klasifikasi. Untuk perhitungan probabilitas prior dari target class dapat menggunakan
rumus (4).
70

(4)

( )=

Dimana :
 Nc adalah jumlah target class yang muncul di dataset.
 N adalah jumlah data yang ada di dalam dataset.
4.

Percobaan dan Hasil
Uji coba ini berfungsi untuk mengetahui seberapa baik kinerja sentiment
analysis yang dilakukan. Data uji coba yang digunakan sebanyak 500 review dimana
dibagi menjadi 250 data review positif dan 250 data review negatif. Data tersebut
didapatkan dari berbagai posting komentar atau posting dari media sosial yang ada di
internet. Data tersebut nantinya akan dipakai untuk proses learning dan testing dari
algoritma Naïve Bayes.
Percobaan dilakukan sebanyak tiga kali, yaitu menggunakan proporsi 70
persen training dan 30 persen testing, 80 persen training dan 20 persen testing, dan 90
persen training dan 10 persen training. Hasil dari penelitian ini menunjukkan bahwa
akurasi tertinggi didapatkan dari pembagian data 80 persen dan 20 persen, yaitu 86
persen, dan rata-rata tingkat akurasi dari 3 percobaan tersebut adalah 80.23 persen.
Tabel 1. Hasil Ujicoba
Percobaan
Percobaan 1

Percobaan 2

Percobaan 3

Data Percobaan
Training = 350 data
Testing = 150 data
Training = 400 data
Testing = 100 data
Training = 450 data
Testing = 50 data

Rata- Rata Akurasi
5.

Hasil (Akurasi)
72.67%

86 %

82 %
80.23%

Kesimpulan
Perfomansi dari penelitian dapat memberikan hasil terbesar adalah 86 persen.
Hasil dari percobaan ini didapatkan dari 3 buah percobaan yaitu percobaan pertama
menggunakan 350 data training dan 150 data testing dengan hasil sebesar 72.67
persen, percobaan kedua menggunakan 400 data training dan 100 data testing dengan
hasil sebesar 86 persen, dan percobaan terakhir menggunakan 450 data training dan
50 data testing dengan hasil sebesar 82 persen.
71

Pengembangan yang dapat dilakukan untuk penelitian kedepan adalah tidak
hanya melakukan pengkategorisasian dokumen ke 3 kelompok saja tetapi
menggunakan bantuan dari algoritma lain untuk mendapatkan sumber dan target dari
opini yang diberikan. Selain hal tersebut algoritma yang digunakan pada penelitian
selanjutnya dapat dipilih beberapa jenis algoritma yang lebih baik seperti SVM,
Logistic Regression, atau Recurrent Neural Network.
Daftar Pustaka
Chandani, Vinita, and Romi Satria Wahono. 2015. "Komparasi Algoritma Klasifikasi
Machine Learning Dan Feature Selection pada Analisis Sentimen Review
Film." Journal of Intelligent Systems 1.1: 56-60.
Go, Alec, Lei Huang, and Richa Bhayani. 2009. "Twitter sentiment
analysis." Entropy 17: 252.
Korfiatis, Nikolaos, 2015. “Big Data and Opinion Mining: Challenges and
Opportunities”,http://www.dbis.informatik.uni-frankfurt.de/downloads/
teaching/enterpreneur_wise13/presentation_unibator.pdf, diakses 7 April
2015, jam 15:00 WIB.
Michel Gen´ ereux and Roger Evans, 2015,“Distinguishing affective states in weblog
posts,http://lipn.univparis13.fr/~genereux/pub_fichiers/SS0603GenereuxM
.pdf, diakses 7 April 2015, jam 15:00 WIB.
Pak, Alexander, and Patrick Paroubek. 2010."Twitter as a Corpus for Sentiment
Analysis and Opinion Mining." LREc. Vol. 10. No. 2010.
Pang, B., Lee, L., & Vaithyanathan, S. (2002, July). Thumbs up?: sentiment
classification using machine learning techniques. In Proceedings of the
ACL-02 conference on Empirical methods in natural language processingVolume 10 (pp. 79-86). Association for Computational Linguistics.
Putranti, Noviah Dwi, and Edi Winarko. 2014."Analisis sentimen twitter untuk teks
berbahasa Indonesia dengan maximum entropy dan support vector
machine." IJCCS-Indonesian Journal of Computing and Cybernetics
Systems 8.1: 91-100.
Sunni, Ismail, Dwi Hendratmo Widyantoro. 2012."Analisis sentimen dan ekstraksi
topik penentu sentimen pada opini terhadap tokoh publik." Jurnal Sarjana
Institut Teknologi Bandung Bidang Teknik Elektro dan Informatika 1.2.
Tala, Fadillah Z. 2003."A study of stemming effects on information retrieval in
Bahasa Indonesia." Institute for Logic, Language and Computation,
Universiteit van Amsterdam, The Netherlands.

72

Dokumen yang terkait

Analisis Komparasi Internet Financial Local Government Reporting Pada Website Resmi Kabupaten dan Kota di Jawa Timur The Comparison Analysis of Internet Financial Local Government Reporting on Official Website of Regency and City in East Java

19 819 7

Analisis komparatif rasio finansial ditinjau dari aturan depkop dengan standar akuntansi Indonesia pada laporan keuanagn tahun 1999 pusat koperasi pegawai

15 355 84

MANAJEMEN PEMROGRAMAN PADA STASIUN RADIO SWASTA (Studi Deskriptif Program Acara Garus di Radio VIS FM Banyuwangi)

29 282 2

FREKWENSI PESAN PEMELIHARAAN KESEHATAN DALAM IKLAN LAYANAN MASYARAKAT Analisis Isi pada Empat Versi ILM Televisi Tanggap Flu Burung Milik Komnas FBPI

10 189 3

FENOMENA INDUSTRI JASA (JASA SEKS) TERHADAP PERUBAHAN PERILAKU SOSIAL ( Study Pada Masyarakat Gang Dolly Surabaya)

63 375 2

Analisis Sistem Pengendalian Mutu dan Perencanaan Penugasan Audit pada Kantor Akuntan Publik. (Suatu Studi Kasus pada Kantor Akuntan Publik Jamaludin, Aria, Sukimto dan Rekan)

136 695 18

Analisis Penyerapan Tenaga Kerja Pada Industri Kerajinan Tangan Di Desa Tutul Kecamatan Balung Kabupaten Jember.

7 76 65

Analisis Pertumbuhan Antar Sektor di Wilayah Kabupaten Magetan dan Sekitarnya Tahun 1996-2005

3 59 17

Analisis tentang saksi sebagai pertimbangan hakim dalam penjatuhan putusan dan tindak pidana pembunuhan berencana (Studi kasus Perkara No. 40/Pid/B/1988/PN.SAMPANG)

8 102 57

Analisis terhadap hapusnya hak usaha akibat terlantarnya lahan untuk ditetapkan menjadi obyek landreform (studi kasus di desa Mojomulyo kecamatan Puger Kabupaten Jember

1 88 63