Analisa Sentimen Tweet untuk Penentuan Potensi Pangsa Pasar.
ABSTRAK
Perkembangan teknologi dan informasi semakin berkembang pada zaman ini, hampir segala hal dapat dilakukan dengan teknologi saat ini. Teknologi dapat memudahkan orang yang ingin membuka usaha sendiri untuk mengetahui trend apa yang sedang berkembang saat ini. Saat ini pula internet adalah sumber informasi yang menampung banyak sekali opini-opini orang banyak tentang suatu hal. Salah satu sumber informasi yang lengkap ada dalam social media, salah satunya adalah Twitter. Dengan memanfaatkan koneksi internet, pemakai dapat melakukan pengamatan dimanapun dia berada, karena aplikasi dapat dijalankan di browser. Pada aplikasi bertujuan agar orang yang ingin membangun atau meningkatkan usaha nya dapat memaksimalkan dari informasi-informasi yang tersedia di social media Twitter. Aplikasi ini pun akan dapat membedakan manakah trend yang bersifat positif , bersifat negatif , ataupun bersifat netral. Diharapkan dengan pembuatan aplikasi ini, orang yang menggunakan nya dapat memanfaatkan trend positif yang sedang terjadi , dan menjauhkan dari trend negatif yang sedang terjadi.
(2)
ABSTRACT
Development of information technology is growing rapidly nowadays, just about anything can be done with current technology. Technology can facilitate people who want to open their own business to know the trend of what is in demand today. Currently the internet is also a source of information that holds a lot of people's opinions about something. One source of complete information in social media, one of them is Twitter. By utilizing the internet connection, the user can make the observation wherever he is, because the application can run in the browser. In applications intended for people who want to build or improve their businesses can maximize on the information available in the social media Twitter. This application also will be able to distinguish Which trends are positive, negative, or neutral. Expected by making this application, the person using it can take advantage of the positive trend that is going on, and away from the negative trend is happening.
(3)
DAFTAR ISI
LEMBAR PENGESAHAN ... i
PERNYATAAN ORISINALISTAS LAPORAN PENELITIAN ... ii
PERNYATAAN PUBLIKASI LAPORAN PENELITIAN ... iii
PRAKATA ... iv
ABSTRAK ... vi
ABSTRACT ... vii
DAFTAR ISI ... viii
DAFTAR GAMBAR ... xi
DAFTAR TABEL ... xii
DAFTAR NOTASI/ LAMBANG ... xiii
DAFTAR SINGKATAN ... xvi
DAFTAR ISTILAH ... xvii
BAB 1 PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 1
1.3 Tujuan Pembahasan ... 1
1.4 Ruang Lingkup ... 2
1.5 Sumber Data ... 2
1.6 Sistematika Penyajian ... 2
BAB 2 KAJIAN TEORI ... 4
2.1 Sentiment Analysis ... 4
2.2 Analisis Potensi Pasar ... 4
2.3 Pembelajaran Mesin ... 5
(4)
2.5 Naïve Bayes ... 5
2.6 Google Maps API ... 10
2.7 Unified Modelling Language(UML)... 10
BAB 3 ANALISIS DAN RANCANGAN SISTEM ... 11
3.1 Rancangan Eksperimen ... 11
3.1.1 Data Analisis ... 11
3.1.2 Pre-processing ... 11
3.1.3 Sentiment Classification ... 13
3.1.4 Visualisasi ... 14
3.2 Rancangan Basis Data ... 15
3.2.1 Entity Relationship Diagram ... 15
3.2.2 Transformasi ERD ke dalam Table ... 16
3.3 Desain Perangkat Lunak ... 17
3.3.1 Pemodelan Perangkat Lunak ... 17
3.3.1.1 Use Case Diagram ... 17
3.3.1.1.1 Rancangan Use Case Diagram ... 17
3.3.1.1.2 Deskripsi Use Case Diagram ... 18
3.3.1.2 Activity Diagram ... 18
3.3.1.2.1 Melihat Sentiment Tweet ... 18
3.3.1.2.2 Mulai Proses Sentiment Tweet ... 20
3.3.1.2.3 Menghentikan Proses Sentiment Tweet ... 21
3.3.2 Rancangan Antarmuka ... 22
BAB 4 IMPLEMENTASI ... 23
4.1 Implementasi Antarmuka Penentuan Lokasi ... 23
4.2 Implementasi Antarmuka Hasil Sentimen ... 23
(5)
BAB 5 PENGUJIAN ... 25
5.1 Pengujian Akurasi Ketepatan ... 25
5.2 Pengujian Sentimen ... 31
5.3 Pengujian Pencarian Tweet ... 31
BAB 6 SIMPULAN DAN SARAN ... 33
6.1 Simpulan ... 33
6.2 Saran ... 33
(6)
DAFTAR GAMBAR
Gambar 2.1 Naïve Bayes Example... 8
Gambar 2.2 Naive Bayes Example 2 ... 8
Gambar 2.3 Naive Bayes Example 3 ... 9
Gambar 2.4 Naive Bayes Example 4 ... 9
Gambar 2.5 Naive Bayes Example 5 ... 10
Gambar 3.1 Rancangan Eksperimen ... 11
Gambar 3.2 Data Analisis ... 11
Gambar 3.3 Visualisasi ... 14
Gambar 3.4 Entity Relationship Diagram ... 15
Gambar 3.5 Use Case Diagram ... 17
Gambar 3.6 Activity Diagram Melihat Sentiment Tweet ... 20
Gambar 3.7 Activity Diagram Mulai Sentiment Tweet ... 21
Gambar 3.8 Activity Diagram Menghentikan Proses Sentiment Tweet ... 22
Gambar 3.9 Rancangan Antarmuka ... 22
Gambar 4.1 Implementasi Antarmuka Penentuan Lokasi... 23
Gambar 4.2 Implementasi Antarmuka Hasil Sentimen... 23
(7)
DAFTAR TABEL
Tabel 3.1 Tabel Pre-processing ... 11
Tabel 3.2 Tabel Stopword ... 12
Tabel 3.3 Tabel User ... 16
Tabel 3.4 Tabel Tweet... 16
Tabel 3.5 Tabel Indexing ... 16
Tabel 3.6 Use Case Diagram Melihat Sentimen Tweet... 18
Tabel 3.7 Use Case Mulai Proses Sentimen Tweet ... 18
Tabel 3.8 Use Case Menghentikan Proses Sentimen Tweet ... 18
Tabel 5.1 Pengujian Akurasi ... 25
Tabel 5.2 Pengujian Sentimen... 31
(8)
DAFTAR NOTASI/ LAMBANG
Jenis Notasi/Lambang Nama Arti
Flowchart Simbol arus /
flow
Menyatakan jalannya arus suatu proses
Flowchart Simbol process Menyatakan suatu
tindakan
(proses) yang dilakukan oleh komputer
Flowchart Simbol manual Menyatakan suatu
tindakan (proses) yang tidak dilakukan oleh komputer
Flowchart Simbol decision Menujukkan suatu
kondisi tertentu yang akan menghasilkan dua kemungkinan
Flowchart Simbol terminal Menyatakan permulaan
atau akhir suatu program
Flowchart Simbol Manual
input
Memasukkan data secara manual dengan
menggunakan online keyboard
Flowchart Simbol hard disk Menunjukkan input/output menggunakan harddisk.
Flowchart Simbol
Penghubung
Menunjukkan penghubung ke halaman yang masih sama atau ke halaman lain.
Flowchart Simbol
Dokumen
Menunjukan dokumen input atau output, untuk proses manual maupun mekanik.
(9)
Jenis Notasi/Lambang Nama Arti
Flowchart Simbol drum
magnetik
Menunjukan input / output menggunakan drum magnetik
Flowchart Simbol Display Menunjukkan output yang
ditampilkan di monitor.
Flowchart Simbol pita
kertas berlubang
Menunjukkan input/output menggunakan pita kertas berlubang.
ERD Entitas Menunjukkan sebuah
objek yang dapat
dibedakan dengan objek lainnya
ERD Atribut Mendeskripsikan karakter
entitas
ERD Relasi Menunjukkan adanya
hubungan diantara sejumlah entitas yang berbeda
ERD Garis (one to
many)
Penghubung antar relasi dan entitas dimana satu entitas dapat memiliki lebih dari satu hubungan.
ERD total
participation constraint
Keberadaan suatu entity tergantung pada
hubungannya dengan entity lain.
DFD Alur Data Menunjukkan alur data
(informasi/objek) yang mengalir. Nama alur data menunjukkan nama dari data yang mengalir tersebut, dan bisa lebih dari satu.
DFD Proses Menunjukkan tugas atau
proses yang dilakukan baik secara manual atau
otomatis dan menunjukkan angka referensi dari proses tersebut
(10)
Jenis Notasi/Lambang Nama Arti
DFD Entitas Eksternal Merupakan simbol entitas
eksternal untuk
menunjukkan tempat asal data (sumber) atau tempat tujuan data (Tujuan). Nama entitas eksternal (terminator) ditulis dalam bentuk tunggal.
DFD Penyimpanan
Data
Simbol ini menunjukkan gudang informasi atau data.
Sangat sering terjadi bahwa unsur-unsur data tidak berjalan dari suatu proses ke proses
berikutnya secara langsung, melainkan disimpan terlebig dahulu, sementara operasi lainnya atau penyusunan ulang unsur-unsur data berlangsung.
(11)
DAFTAR SINGKATAN
CSS Cascading Style Sheet ERD Entity Relationship Diagram
HTML Hyper Text Markup Language
(12)
DAFTAR ISTILAH
Aplikasi suatu perangkat lunak komputer yang memanfaatkan kemampuan komputer langsung untuk melakukan sesuatu tugas.
Form tempat untuk mengontrol proses masukan data, menampilkan data, memeriksa, dan memperbaharui data.
System suatu kesatuan yang terdiri komponen yang dihubungkan bersama untuk memudahkan aliran informasi.
Admin pengguna yang memiliki hak akses untuk pengelolaan suatu data dan dapat memberikan akses kepada pengguna tertentu.
User pengguna.
Field Sebuah baris dalam tabel pada database yang diisi oleh user dengan melakukan pengisian data.
(13)
BAB 1
PENDAHULUAN
1.1Latar Belakang
Pada saat ini dalam masyarakat terdapat bermacam-macam trend yang sedang terjadi, sehingga diperlukannya pengamatan akan trend terkini. Dengan memanfaatkan suatu trend yang terdapat dalam masyrakat, seseorang dapat melakukan suatu hal yang dapat menguntunkan, seperti membuka bisnis, berjualan, dan lain-lain. Namun terlebih dahulu kita harus mengetahui apakah trend yang sedang in saat ini. Salah satu cara untuk mengetahuinya adalah dengan membuat quisioner, angket, atau lainnya, namun cara tersebut kurang efektif karena membutuhkan banyak waktu, pengeluaran, dan mencari subjek penelitian. Karena itu terpikirlah untuk membuat aplikasi yang dapat menganalisis potensi pasar berdasarkan trend.
Dalam aplikasi yang akan dibuat ini akan meneliti potensi sebuah trend untuk pangsa pasar yang diambil dari social media yaitu Twitter. Aplikasi akan mengambil data yang sudah di fetch sebelumnya dari database. Aplikasi pun dapat menentukan positif atau negatifnya sebuah tweet, sehingga kita dapat menganilis sebuah trend beserta sentiment statement-nya.
Sebenarnya sudah ada aplikasi yang serupa yaitu Sasbuzz yang memiliki fitur untuk analisis marketing dan mendeteksi negative statement terkait produk tertentu dalam Twitter. Pada aplikasi ini akan diimplementasikan beberapa fitur dari Sasbuzz tersebut seperti analisis sentiment statement yang terdapat pada Tweet. Namun Sasbuzz adalah aplikasi berbayar sehingga kurang dapat dilakukan untuk research purpose, maka dibuatlah ide untuk membuat aplikasi ini.
1.2Rumusan Masalah
Berdasarkan latar belakang maka terdapat rumusan masalah antara lain:
1. Bagaimana mendeteksi potensi pangsa pasar beerdasarkan data Twitter? 2. Bagaimana menganalisis sentimen pada data tweet?
1.3Tujuan Pembahasan
(14)
2
1. Dengan membangun sistem untuk menganalisa pangsa pasar berbasis sentiment , geografis, dan kesegaran data.
2. Dengan menerapkan algoritma Naïve Bayes, dimana setiap tweet akan dikategorikan kedalam 3 kelas, yaitu: negatif, netral, dan positif.
1.4Ruang Lingkup
Ruang Lingkup yang terdapat dalam Software adalah:
1. Input: tweet pengguna media sosial Twitter yang sudah terdapat dalam database.
2. Output: hasil dari sentiment analysis yang diproses dari data dalam database..
1.5Sumber Data
Sumber data yang digunakan untuk pembuatan aplikasi ini diperoleh dari dokumen-dokumen dari pihak yang terkait yaitu tweet dari pengguna yang berada di Indonesia.
1.6Sistematika Penyajian
Dalam proses penyusunan laporan, sistematika pembahasan penulisan laporan tugas akhir akan dijabarkan sebagi berikut:
BAB 1. PENDAHULUAN
Bab 1 berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan pembahasan, ruang lingkup kajian, sumber data, dan sistematika penyajian Laporan Tugas Akhir.
BAB 2. KAJIAN TEORI
Bab 2 berisi tentang penjelasan teori-teori yang berkatian dengan pembuatan sistem dan mendukung pembuatan sistem yang ada
BAB 3. ANALISIS DAN RANCANGAN SISTEM
Bab 3 berisi tentang penjelasan analisis suatu keadaan, kebutuhan sistem, perancangan pembuatan sistem, ERD, dan gambaran arsitektur sistem.
BAB 4. HASIL PENELITIAN
Bab 4 berisi tentang penjelasan perencanaan tahap implementasi, proses perkembangan implementasi proyek, penjelasan mengenai realisasi fungsionalitas dan User Interface Design yang sudah dibuat.
(15)
3
BAB 5. PEMBAHASAN DAN UJI COBA HASIL PENELITIAN
Bab 5 berisi tentang penjelasan rencana pengujian sistem serta testing akan diuji dan dilakukan.
BAB 6. SIMPULAN DAN SARAN
Bab 6 berisi kesimpulan dari pembahasan pada perancangan serta analisa pengujian aplikasi yang dibuat.
(16)
BAB 6
SIMPULAN DAN SARAN
6.1Simpulan
Kesimpulan yang diperoleh dari hasil analisis, pengambilan data, implementasi, dan pengujian aplikasi ini adalah:
1. Trend pangsa pasar dapat diketahui dengan memasukkan hal yang dicari dan melihat apakah hal tersebut bernilai positif, netral, ataupun negatif.
2. Program dapat menganalisis sentiment dari suatu tweet dengan menggunakan metode learning naïve bayes.
6.2Saran
Berikut ini adalah saran-saran yang bisa dipakai untuk mengembangkan aplikasi:
1. Pengelompokan nama tempat.
2. Menambah list stopwords, seperti kemungkinan singkatan-singkatan. 3. Formalisasi kata seperti “kaaammiii” menjadi kami.
(17)
DAFTAR PUSTAKA
[1] Bo Pang, Lillian Lee, Opinion Mining And Sentiment Analysis, Now Publishers Inc, 2008.
[2] F. W. d. S. Irawan, .Pemasaran: Prinsip dan Kasus, Yogyakarta: PT BPFE Yogyakarta, 2011.
[3] F. Hristea, The Naïve Bayes Model for Unsupervised Word Sense Disambiguation: Aspects Concerning Feature Selection, Springer-Verlag Berlin Heidelberg, 2013.
[4] [Online]. Available: https://github.com/sastrawi/sastrawi.
[5] S. Saraswati, Text Mining dengan Metode Naive Bayes, Denpasar, 2011. [6] S. Davis, Google Maps API, Texas: Pragmatic Bookshelf, 2007.
[7] A. Nugroho, Rekayasa Perangkat Lunak Menggunakan UML dan Java, Yogyakarta: ANDI, 2009.
[8] G. Swain, Object-Oriented Analysis and Design Through Unified Modelling Language, University Science Press: New Delhi, 2010.
(1)
DAFTAR ISTILAH
Aplikasi suatu perangkat lunak komputer yang memanfaatkan kemampuan komputer langsung untuk melakukan sesuatu tugas.
Form tempat untuk mengontrol proses masukan data, menampilkan data, memeriksa, dan memperbaharui data.
System suatu kesatuan yang terdiri komponen yang dihubungkan bersama untuk memudahkan aliran informasi.
Admin pengguna yang memiliki hak akses untuk pengelolaan suatu data dan dapat memberikan akses kepada pengguna tertentu.
User pengguna.
Field Sebuah baris dalam tabel pada database yang diisi oleh user dengan melakukan pengisian data.
(2)
BAB 1
PENDAHULUAN
1.1Latar BelakangPada saat ini dalam masyarakat terdapat bermacam-macam trend yang sedang terjadi, sehingga diperlukannya pengamatan akan trend terkini. Dengan memanfaatkan suatu trend yang terdapat dalam masyrakat, seseorang dapat melakukan suatu hal yang dapat menguntunkan, seperti membuka bisnis, berjualan, dan lain-lain. Namun terlebih dahulu kita harus mengetahui apakah trend yang sedang in saat ini. Salah satu cara untuk mengetahuinya adalah dengan membuat quisioner, angket, atau lainnya, namun cara tersebut kurang efektif karena membutuhkan banyak waktu, pengeluaran, dan mencari subjek penelitian. Karena itu terpikirlah untuk membuat aplikasi yang dapat menganalisis potensi pasar berdasarkan trend.
Dalam aplikasi yang akan dibuat ini akan meneliti potensi sebuah trend untuk pangsa pasar yang diambil dari social media yaitu Twitter. Aplikasi akan mengambil data yang sudah di fetch sebelumnya dari database. Aplikasi pun dapat menentukan positif atau negatifnya sebuah tweet, sehingga kita dapat menganilis sebuah trend beserta sentiment statement-nya.
Sebenarnya sudah ada aplikasi yang serupa yaitu Sasbuzz yang memiliki fitur untuk analisis marketing dan mendeteksi negative statement terkait produk tertentu dalam Twitter. Pada aplikasi ini akan diimplementasikan beberapa fitur dari Sasbuzz tersebut seperti analisis sentiment statement yang terdapat pada Tweet. Namun Sasbuzz adalah aplikasi berbayar sehingga kurang dapat dilakukan untuk research purpose, maka dibuatlah ide untuk membuat aplikasi ini.
1.2Rumusan Masalah
Berdasarkan latar belakang maka terdapat rumusan masalah antara lain:
1. Bagaimana mendeteksi potensi pangsa pasar beerdasarkan data Twitter? 2. Bagaimana menganalisis sentimen pada data tweet?
1.3Tujuan Pembahasan
(3)
2
1. Dengan membangun sistem untuk menganalisa pangsa pasar berbasis sentiment , geografis, dan kesegaran data.
2. Dengan menerapkan algoritma Naïve Bayes, dimana setiap tweet akan dikategorikan kedalam 3 kelas, yaitu: negatif, netral, dan positif.
1.4Ruang Lingkup
Ruang Lingkup yang terdapat dalam Software adalah:
1. Input: tweet pengguna media sosial Twitter yang sudah terdapat dalam
database.
2. Output: hasil dari sentiment analysis yang diproses dari data dalam database..
1.5Sumber Data
Sumber data yang digunakan untuk pembuatan aplikasi ini diperoleh dari dokumen-dokumen dari pihak yang terkait yaitu tweet dari pengguna yang berada di Indonesia.
1.6Sistematika Penyajian
Dalam proses penyusunan laporan, sistematika pembahasan penulisan laporan tugas akhir akan dijabarkan sebagi berikut:
BAB 1. PENDAHULUAN
Bab 1 berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan pembahasan, ruang lingkup kajian, sumber data, dan sistematika penyajian Laporan Tugas Akhir.
BAB 2. KAJIAN TEORI
Bab 2 berisi tentang penjelasan teori-teori yang berkatian dengan pembuatan sistem dan mendukung pembuatan sistem yang ada
BAB 3. ANALISIS DAN RANCANGAN SISTEM
Bab 3 berisi tentang penjelasan analisis suatu keadaan, kebutuhan sistem, perancangan pembuatan sistem, ERD, dan gambaran arsitektur sistem.
BAB 4. HASIL PENELITIAN
Bab 4 berisi tentang penjelasan perencanaan tahap implementasi, proses perkembangan implementasi proyek, penjelasan mengenai realisasi
(4)
3
BAB 5. PEMBAHASAN DAN UJI COBA HASIL PENELITIAN
Bab 5 berisi tentang penjelasan rencana pengujian sistem serta testing akan diuji dan dilakukan.
BAB 6. SIMPULAN DAN SARAN
Bab 6 berisi kesimpulan dari pembahasan pada perancangan serta analisa pengujian aplikasi yang dibuat.
(5)
BAB 6
SIMPULAN DAN SARAN
6.1SimpulanKesimpulan yang diperoleh dari hasil analisis, pengambilan data, implementasi, dan pengujian aplikasi ini adalah:
1. Trend pangsa pasar dapat diketahui dengan memasukkan hal yang dicari dan melihat apakah hal tersebut bernilai positif, netral, ataupun negatif.
2. Program dapat menganalisis sentiment dari suatu tweet dengan menggunakan metode learning naïve bayes.
6.2Saran
Berikut ini adalah saran-saran yang bisa dipakai untuk mengembangkan aplikasi:
1. Pengelompokan nama tempat.
2. Menambah list stopwords, seperti kemungkinan singkatan-singkatan. 3. Formalisasi kata seperti “kaaammiii” menjadi kami.
(6)
DAFTAR PUSTAKA
[1] Bo Pang, Lillian Lee, Opinion Mining And Sentiment Analysis, Now Publishers Inc, 2008.
[2] F. W. d. S. Irawan, .Pemasaran: Prinsip dan Kasus, Yogyakarta: PT BPFE Yogyakarta, 2011.
[3] F. Hristea, The Naïve Bayes Model for Unsupervised Word Sense Disambiguation: Aspects Concerning Feature Selection, Springer-Verlag Berlin Heidelberg, 2013.
[4] [Online]. Available: https://github.com/sastrawi/sastrawi.
[5] S. Saraswati, Text Mining dengan Metode Naive Bayes, Denpasar, 2011. [6] S. Davis, Google Maps API, Texas: Pragmatic Bookshelf, 2007.
[7] A. Nugroho, Rekayasa Perangkat Lunak Menggunakan UML dan Java, Yogyakarta: ANDI, 2009.
[8] G. Swain, Object-Oriented Analysis and Design Through Unified Modelling Language, University Science Press: New Delhi, 2010.