Analisa Sentimen Tweet untuk Penentuan Potensi Pangsa Pasar.

(1)

ABSTRAK

Perkembangan teknologi dan informasi semakin berkembang pada zaman ini, hampir segala hal dapat dilakukan dengan teknologi saat ini. Teknologi dapat memudahkan orang yang ingin membuka usaha sendiri untuk mengetahui trend apa yang sedang berkembang saat ini. Saat ini pula internet adalah sumber informasi yang menampung banyak sekali opini-opini orang banyak tentang suatu hal. Salah satu sumber informasi yang lengkap ada dalam social media, salah satunya adalah Twitter. Dengan memanfaatkan koneksi internet, pemakai dapat melakukan pengamatan dimanapun dia berada, karena aplikasi dapat dijalankan di browser. Pada aplikasi bertujuan agar orang yang ingin membangun atau meningkatkan usaha nya dapat memaksimalkan dari informasi-informasi yang tersedia di social media Twitter. Aplikasi ini pun akan dapat membedakan manakah trend yang bersifat positif , bersifat negatif , ataupun bersifat netral. Diharapkan dengan pembuatan aplikasi ini, orang yang menggunakan nya dapat memanfaatkan trend positif yang sedang terjadi , dan menjauhkan dari trend negatif yang sedang terjadi.


(2)

ABSTRACT

Development of information technology is growing rapidly nowadays, just about anything can be done with current technology. Technology can facilitate people who want to open their own business to know the trend of what is in demand today. Currently the internet is also a source of information that holds a lot of people's opinions about something. One source of complete information in social media, one of them is Twitter. By utilizing the internet connection, the user can make the observation wherever he is, because the application can run in the browser. In applications intended for people who want to build or improve their businesses can maximize on the information available in the social media Twitter. This application also will be able to distinguish Which trends are positive, negative, or neutral. Expected by making this application, the person using it can take advantage of the positive trend that is going on, and away from the negative trend is happening.


(3)

DAFTAR ISI

LEMBAR PENGESAHAN ... i

PERNYATAAN ORISINALISTAS LAPORAN PENELITIAN ... ii

PERNYATAAN PUBLIKASI LAPORAN PENELITIAN ... iii

PRAKATA ... iv

ABSTRAK ... vi

ABSTRACT ... vii

DAFTAR ISI ... viii

DAFTAR GAMBAR ... xi

DAFTAR TABEL ... xii

DAFTAR NOTASI/ LAMBANG ... xiii

DAFTAR SINGKATAN ... xvi

DAFTAR ISTILAH ... xvii

BAB 1 PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 1

1.3 Tujuan Pembahasan ... 1

1.4 Ruang Lingkup ... 2

1.5 Sumber Data ... 2

1.6 Sistematika Penyajian ... 2

BAB 2 KAJIAN TEORI ... 4

2.1 Sentiment Analysis ... 4

2.2 Analisis Potensi Pasar ... 4

2.3 Pembelajaran Mesin ... 5


(4)

2.5 Naïve Bayes ... 5

2.6 Google Maps API ... 10

2.7 Unified Modelling Language(UML)... 10

BAB 3 ANALISIS DAN RANCANGAN SISTEM ... 11

3.1 Rancangan Eksperimen ... 11

3.1.1 Data Analisis ... 11

3.1.2 Pre-processing ... 11

3.1.3 Sentiment Classification ... 13

3.1.4 Visualisasi ... 14

3.2 Rancangan Basis Data ... 15

3.2.1 Entity Relationship Diagram ... 15

3.2.2 Transformasi ERD ke dalam Table ... 16

3.3 Desain Perangkat Lunak ... 17

3.3.1 Pemodelan Perangkat Lunak ... 17

3.3.1.1 Use Case Diagram ... 17

3.3.1.1.1 Rancangan Use Case Diagram ... 17

3.3.1.1.2 Deskripsi Use Case Diagram ... 18

3.3.1.2 Activity Diagram ... 18

3.3.1.2.1 Melihat Sentiment Tweet ... 18

3.3.1.2.2 Mulai Proses Sentiment Tweet ... 20

3.3.1.2.3 Menghentikan Proses Sentiment Tweet ... 21

3.3.2 Rancangan Antarmuka ... 22

BAB 4 IMPLEMENTASI ... 23

4.1 Implementasi Antarmuka Penentuan Lokasi ... 23

4.2 Implementasi Antarmuka Hasil Sentimen ... 23


(5)

BAB 5 PENGUJIAN ... 25

5.1 Pengujian Akurasi Ketepatan ... 25

5.2 Pengujian Sentimen ... 31

5.3 Pengujian Pencarian Tweet ... 31

BAB 6 SIMPULAN DAN SARAN ... 33

6.1 Simpulan ... 33

6.2 Saran ... 33


(6)

DAFTAR GAMBAR

Gambar 2.1 Naïve Bayes Example... 8

Gambar 2.2 Naive Bayes Example 2 ... 8

Gambar 2.3 Naive Bayes Example 3 ... 9

Gambar 2.4 Naive Bayes Example 4 ... 9

Gambar 2.5 Naive Bayes Example 5 ... 10

Gambar 3.1 Rancangan Eksperimen ... 11

Gambar 3.2 Data Analisis ... 11

Gambar 3.3 Visualisasi ... 14

Gambar 3.4 Entity Relationship Diagram ... 15

Gambar 3.5 Use Case Diagram ... 17

Gambar 3.6 Activity Diagram Melihat Sentiment Tweet ... 20

Gambar 3.7 Activity Diagram Mulai Sentiment Tweet ... 21

Gambar 3.8 Activity Diagram Menghentikan Proses Sentiment Tweet ... 22

Gambar 3.9 Rancangan Antarmuka ... 22

Gambar 4.1 Implementasi Antarmuka Penentuan Lokasi... 23

Gambar 4.2 Implementasi Antarmuka Hasil Sentimen... 23


(7)

DAFTAR TABEL

Tabel 3.1 Tabel Pre-processing ... 11

Tabel 3.2 Tabel Stopword ... 12

Tabel 3.3 Tabel User ... 16

Tabel 3.4 Tabel Tweet... 16

Tabel 3.5 Tabel Indexing ... 16

Tabel 3.6 Use Case Diagram Melihat Sentimen Tweet... 18

Tabel 3.7 Use Case Mulai Proses Sentimen Tweet ... 18

Tabel 3.8 Use Case Menghentikan Proses Sentimen Tweet ... 18

Tabel 5.1 Pengujian Akurasi ... 25

Tabel 5.2 Pengujian Sentimen... 31


(8)

DAFTAR NOTASI/ LAMBANG

Jenis Notasi/Lambang Nama Arti

Flowchart Simbol arus /

flow

Menyatakan jalannya arus suatu proses

Flowchart Simbol process Menyatakan suatu

tindakan

(proses) yang dilakukan oleh komputer

Flowchart Simbol manual Menyatakan suatu

tindakan (proses) yang tidak dilakukan oleh komputer

Flowchart Simbol decision Menujukkan suatu

kondisi tertentu yang akan menghasilkan dua kemungkinan

Flowchart Simbol terminal Menyatakan permulaan

atau akhir suatu program

Flowchart Simbol Manual

input

Memasukkan data secara manual dengan

menggunakan online keyboard

Flowchart Simbol hard disk Menunjukkan input/output menggunakan harddisk.

Flowchart Simbol

Penghubung

Menunjukkan penghubung ke halaman yang masih sama atau ke halaman lain.

Flowchart Simbol

Dokumen

Menunjukan dokumen input atau output, untuk proses manual maupun mekanik.


(9)

Jenis Notasi/Lambang Nama Arti

Flowchart Simbol drum

magnetik

Menunjukan input / output menggunakan drum magnetik

Flowchart Simbol Display Menunjukkan output yang

ditampilkan di monitor.

Flowchart Simbol pita

kertas berlubang

Menunjukkan input/output menggunakan pita kertas berlubang.

ERD Entitas Menunjukkan sebuah

objek yang dapat

dibedakan dengan objek lainnya

ERD Atribut Mendeskripsikan karakter

entitas

ERD Relasi Menunjukkan adanya

hubungan diantara sejumlah entitas yang berbeda

ERD Garis (one to

many)

Penghubung antar relasi dan entitas dimana satu entitas dapat memiliki lebih dari satu hubungan.

ERD total

participation constraint

Keberadaan suatu entity tergantung pada

hubungannya dengan entity lain.

DFD Alur Data Menunjukkan alur data

(informasi/objek) yang mengalir. Nama alur data menunjukkan nama dari data yang mengalir tersebut, dan bisa lebih dari satu.

DFD Proses Menunjukkan tugas atau

proses yang dilakukan baik secara manual atau

otomatis dan menunjukkan angka referensi dari proses tersebut


(10)

Jenis Notasi/Lambang Nama Arti

DFD Entitas Eksternal Merupakan simbol entitas

eksternal untuk

menunjukkan tempat asal data (sumber) atau tempat tujuan data (Tujuan). Nama entitas eksternal (terminator) ditulis dalam bentuk tunggal.

DFD Penyimpanan

Data

Simbol ini menunjukkan gudang informasi atau data.

Sangat sering terjadi bahwa unsur-unsur data tidak berjalan dari suatu proses ke proses

berikutnya secara langsung, melainkan disimpan terlebig dahulu, sementara operasi lainnya atau penyusunan ulang unsur-unsur data berlangsung.


(11)

DAFTAR SINGKATAN

CSS Cascading Style Sheet ERD Entity Relationship Diagram

HTML Hyper Text Markup Language


(12)

DAFTAR ISTILAH

Aplikasi suatu perangkat lunak komputer yang memanfaatkan kemampuan komputer langsung untuk melakukan sesuatu tugas.

Form tempat untuk mengontrol proses masukan data, menampilkan data, memeriksa, dan memperbaharui data.

System suatu kesatuan yang terdiri komponen yang dihubungkan bersama untuk memudahkan aliran informasi.

Admin pengguna yang memiliki hak akses untuk pengelolaan suatu data dan dapat memberikan akses kepada pengguna tertentu.

User pengguna.

Field Sebuah baris dalam tabel pada database yang diisi oleh user dengan melakukan pengisian data.


(13)

BAB 1

PENDAHULUAN

1.1Latar Belakang

Pada saat ini dalam masyarakat terdapat bermacam-macam trend yang sedang terjadi, sehingga diperlukannya pengamatan akan trend terkini. Dengan memanfaatkan suatu trend yang terdapat dalam masyrakat, seseorang dapat melakukan suatu hal yang dapat menguntunkan, seperti membuka bisnis, berjualan, dan lain-lain. Namun terlebih dahulu kita harus mengetahui apakah trend yang sedang in saat ini. Salah satu cara untuk mengetahuinya adalah dengan membuat quisioner, angket, atau lainnya, namun cara tersebut kurang efektif karena membutuhkan banyak waktu, pengeluaran, dan mencari subjek penelitian. Karena itu terpikirlah untuk membuat aplikasi yang dapat menganalisis potensi pasar berdasarkan trend.

Dalam aplikasi yang akan dibuat ini akan meneliti potensi sebuah trend untuk pangsa pasar yang diambil dari social media yaitu Twitter. Aplikasi akan mengambil data yang sudah di fetch sebelumnya dari database. Aplikasi pun dapat menentukan positif atau negatifnya sebuah tweet, sehingga kita dapat menganilis sebuah trend beserta sentiment statement-nya.

Sebenarnya sudah ada aplikasi yang serupa yaitu Sasbuzz yang memiliki fitur untuk analisis marketing dan mendeteksi negative statement terkait produk tertentu dalam Twitter. Pada aplikasi ini akan diimplementasikan beberapa fitur dari Sasbuzz tersebut seperti analisis sentiment statement yang terdapat pada Tweet. Namun Sasbuzz adalah aplikasi berbayar sehingga kurang dapat dilakukan untuk research purpose, maka dibuatlah ide untuk membuat aplikasi ini.

1.2Rumusan Masalah

Berdasarkan latar belakang maka terdapat rumusan masalah antara lain:

1. Bagaimana mendeteksi potensi pangsa pasar beerdasarkan data Twitter? 2. Bagaimana menganalisis sentimen pada data tweet?

1.3Tujuan Pembahasan


(14)

2

1. Dengan membangun sistem untuk menganalisa pangsa pasar berbasis sentiment , geografis, dan kesegaran data.

2. Dengan menerapkan algoritma Naïve Bayes, dimana setiap tweet akan dikategorikan kedalam 3 kelas, yaitu: negatif, netral, dan positif.

1.4Ruang Lingkup

Ruang Lingkup yang terdapat dalam Software adalah:

1. Input: tweet pengguna media sosial Twitter yang sudah terdapat dalam database.

2. Output: hasil dari sentiment analysis yang diproses dari data dalam database..

1.5Sumber Data

Sumber data yang digunakan untuk pembuatan aplikasi ini diperoleh dari dokumen-dokumen dari pihak yang terkait yaitu tweet dari pengguna yang berada di Indonesia.

1.6Sistematika Penyajian

Dalam proses penyusunan laporan, sistematika pembahasan penulisan laporan tugas akhir akan dijabarkan sebagi berikut:

BAB 1. PENDAHULUAN

Bab 1 berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan pembahasan, ruang lingkup kajian, sumber data, dan sistematika penyajian Laporan Tugas Akhir.

BAB 2. KAJIAN TEORI

Bab 2 berisi tentang penjelasan teori-teori yang berkatian dengan pembuatan sistem dan mendukung pembuatan sistem yang ada

BAB 3. ANALISIS DAN RANCANGAN SISTEM

Bab 3 berisi tentang penjelasan analisis suatu keadaan, kebutuhan sistem, perancangan pembuatan sistem, ERD, dan gambaran arsitektur sistem.

BAB 4. HASIL PENELITIAN

Bab 4 berisi tentang penjelasan perencanaan tahap implementasi, proses perkembangan implementasi proyek, penjelasan mengenai realisasi fungsionalitas dan User Interface Design yang sudah dibuat.


(15)

3

BAB 5. PEMBAHASAN DAN UJI COBA HASIL PENELITIAN

Bab 5 berisi tentang penjelasan rencana pengujian sistem serta testing akan diuji dan dilakukan.

BAB 6. SIMPULAN DAN SARAN

Bab 6 berisi kesimpulan dari pembahasan pada perancangan serta analisa pengujian aplikasi yang dibuat.


(16)

BAB 6

SIMPULAN DAN SARAN

6.1Simpulan

Kesimpulan yang diperoleh dari hasil analisis, pengambilan data, implementasi, dan pengujian aplikasi ini adalah:

1. Trend pangsa pasar dapat diketahui dengan memasukkan hal yang dicari dan melihat apakah hal tersebut bernilai positif, netral, ataupun negatif.

2. Program dapat menganalisis sentiment dari suatu tweet dengan menggunakan metode learning naïve bayes.

6.2Saran

Berikut ini adalah saran-saran yang bisa dipakai untuk mengembangkan aplikasi:

1. Pengelompokan nama tempat.

2. Menambah list stopwords, seperti kemungkinan singkatan-singkatan. 3. Formalisasi kata seperti “kaaammiii” menjadi kami.


(17)

DAFTAR PUSTAKA

[1] Bo Pang, Lillian Lee, Opinion Mining And Sentiment Analysis, Now Publishers Inc, 2008.

[2] F. W. d. S. Irawan, .Pemasaran: Prinsip dan Kasus, Yogyakarta: PT BPFE Yogyakarta, 2011.

[3] F. Hristea, The Naïve Bayes Model for Unsupervised Word Sense Disambiguation: Aspects Concerning Feature Selection, Springer-Verlag Berlin Heidelberg, 2013.

[4] [Online]. Available: https://github.com/sastrawi/sastrawi.

[5] S. Saraswati, Text Mining dengan Metode Naive Bayes, Denpasar, 2011. [6] S. Davis, Google Maps API, Texas: Pragmatic Bookshelf, 2007.

[7] A. Nugroho, Rekayasa Perangkat Lunak Menggunakan UML dan Java, Yogyakarta: ANDI, 2009.

[8] G. Swain, Object-Oriented Analysis and Design Through Unified Modelling Language, University Science Press: New Delhi, 2010.


(1)

DAFTAR ISTILAH

Aplikasi suatu perangkat lunak komputer yang memanfaatkan kemampuan komputer langsung untuk melakukan sesuatu tugas.

Form tempat untuk mengontrol proses masukan data, menampilkan data, memeriksa, dan memperbaharui data.

System suatu kesatuan yang terdiri komponen yang dihubungkan bersama untuk memudahkan aliran informasi.

Admin pengguna yang memiliki hak akses untuk pengelolaan suatu data dan dapat memberikan akses kepada pengguna tertentu.

User pengguna.

Field Sebuah baris dalam tabel pada database yang diisi oleh user dengan melakukan pengisian data.


(2)

BAB 1

PENDAHULUAN

1.1Latar Belakang

Pada saat ini dalam masyarakat terdapat bermacam-macam trend yang sedang terjadi, sehingga diperlukannya pengamatan akan trend terkini. Dengan memanfaatkan suatu trend yang terdapat dalam masyrakat, seseorang dapat melakukan suatu hal yang dapat menguntunkan, seperti membuka bisnis, berjualan, dan lain-lain. Namun terlebih dahulu kita harus mengetahui apakah trend yang sedang in saat ini. Salah satu cara untuk mengetahuinya adalah dengan membuat quisioner, angket, atau lainnya, namun cara tersebut kurang efektif karena membutuhkan banyak waktu, pengeluaran, dan mencari subjek penelitian. Karena itu terpikirlah untuk membuat aplikasi yang dapat menganalisis potensi pasar berdasarkan trend.

Dalam aplikasi yang akan dibuat ini akan meneliti potensi sebuah trend untuk pangsa pasar yang diambil dari social media yaitu Twitter. Aplikasi akan mengambil data yang sudah di fetch sebelumnya dari database. Aplikasi pun dapat menentukan positif atau negatifnya sebuah tweet, sehingga kita dapat menganilis sebuah trend beserta sentiment statement-nya.

Sebenarnya sudah ada aplikasi yang serupa yaitu Sasbuzz yang memiliki fitur untuk analisis marketing dan mendeteksi negative statement terkait produk tertentu dalam Twitter. Pada aplikasi ini akan diimplementasikan beberapa fitur dari Sasbuzz tersebut seperti analisis sentiment statement yang terdapat pada Tweet. Namun Sasbuzz adalah aplikasi berbayar sehingga kurang dapat dilakukan untuk research purpose, maka dibuatlah ide untuk membuat aplikasi ini.

1.2Rumusan Masalah

Berdasarkan latar belakang maka terdapat rumusan masalah antara lain:

1. Bagaimana mendeteksi potensi pangsa pasar beerdasarkan data Twitter? 2. Bagaimana menganalisis sentimen pada data tweet?

1.3Tujuan Pembahasan


(3)

2

1. Dengan membangun sistem untuk menganalisa pangsa pasar berbasis sentiment , geografis, dan kesegaran data.

2. Dengan menerapkan algoritma Naïve Bayes, dimana setiap tweet akan dikategorikan kedalam 3 kelas, yaitu: negatif, netral, dan positif.

1.4Ruang Lingkup

Ruang Lingkup yang terdapat dalam Software adalah:

1. Input: tweet pengguna media sosial Twitter yang sudah terdapat dalam

database.

2. Output: hasil dari sentiment analysis yang diproses dari data dalam database..

1.5Sumber Data

Sumber data yang digunakan untuk pembuatan aplikasi ini diperoleh dari dokumen-dokumen dari pihak yang terkait yaitu tweet dari pengguna yang berada di Indonesia.

1.6Sistematika Penyajian

Dalam proses penyusunan laporan, sistematika pembahasan penulisan laporan tugas akhir akan dijabarkan sebagi berikut:

BAB 1. PENDAHULUAN

Bab 1 berisi tentang pendahuluan yang terdiri dari latar belakang, rumusan masalah, tujuan pembahasan, ruang lingkup kajian, sumber data, dan sistematika penyajian Laporan Tugas Akhir.

BAB 2. KAJIAN TEORI

Bab 2 berisi tentang penjelasan teori-teori yang berkatian dengan pembuatan sistem dan mendukung pembuatan sistem yang ada

BAB 3. ANALISIS DAN RANCANGAN SISTEM

Bab 3 berisi tentang penjelasan analisis suatu keadaan, kebutuhan sistem, perancangan pembuatan sistem, ERD, dan gambaran arsitektur sistem.

BAB 4. HASIL PENELITIAN

Bab 4 berisi tentang penjelasan perencanaan tahap implementasi, proses perkembangan implementasi proyek, penjelasan mengenai realisasi


(4)

3

BAB 5. PEMBAHASAN DAN UJI COBA HASIL PENELITIAN

Bab 5 berisi tentang penjelasan rencana pengujian sistem serta testing akan diuji dan dilakukan.

BAB 6. SIMPULAN DAN SARAN

Bab 6 berisi kesimpulan dari pembahasan pada perancangan serta analisa pengujian aplikasi yang dibuat.


(5)

BAB 6

SIMPULAN DAN SARAN

6.1Simpulan

Kesimpulan yang diperoleh dari hasil analisis, pengambilan data, implementasi, dan pengujian aplikasi ini adalah:

1. Trend pangsa pasar dapat diketahui dengan memasukkan hal yang dicari dan melihat apakah hal tersebut bernilai positif, netral, ataupun negatif.

2. Program dapat menganalisis sentiment dari suatu tweet dengan menggunakan metode learning naïve bayes.

6.2Saran

Berikut ini adalah saran-saran yang bisa dipakai untuk mengembangkan aplikasi:

1. Pengelompokan nama tempat.

2. Menambah list stopwords, seperti kemungkinan singkatan-singkatan. 3. Formalisasi kata seperti “kaaammiii” menjadi kami.


(6)

DAFTAR PUSTAKA

[1] Bo Pang, Lillian Lee, Opinion Mining And Sentiment Analysis, Now Publishers Inc, 2008.

[2] F. W. d. S. Irawan, .Pemasaran: Prinsip dan Kasus, Yogyakarta: PT BPFE Yogyakarta, 2011.

[3] F. Hristea, The Naïve Bayes Model for Unsupervised Word Sense Disambiguation: Aspects Concerning Feature Selection, Springer-Verlag Berlin Heidelberg, 2013.

[4] [Online]. Available: https://github.com/sastrawi/sastrawi.

[5] S. Saraswati, Text Mining dengan Metode Naive Bayes, Denpasar, 2011. [6] S. Davis, Google Maps API, Texas: Pragmatic Bookshelf, 2007.

[7] A. Nugroho, Rekayasa Perangkat Lunak Menggunakan UML dan Java, Yogyakarta: ANDI, 2009.

[8] G. Swain, Object-Oriented Analysis and Design Through Unified Modelling Language, University Science Press: New Delhi, 2010.