Salah satu faktor yang mempengaruhi agar fitur klasifikasi memberikan hasil yang maksimal adalah pada tahap
preprocessing
data
tweet
dilakukan
filtering
dengan menghapus kata-kata yang tidak ada di KBBI dan dilakukan proses
stemming
, sehingga hanya berupa kumpulan kata dasar
Nur Santika, 2011. Berdasarkan penelitian yang telah ada sebelumnya, penelitan ini mencoba
melakukan analisis sentimen dengan mengklasifikasi data
twitter
berbahasa Indonesia. Data tersebut akan diproses dengan
text mining
untuk menghindari data yang kurang sempurna kemudian mengelompokkan data
tweet
berdasarkan emosi ke dalam lima
cluster
yaitu senang, takut, sedih, marah, cinta. Pengelompokkan ini menggunakan algoritma
Agglomerative Hierarchical Clustering
.
1.2 Rumusan Masalah
Berdasarkan Latar Belakang yang telah dikemukakan diatas, maka permasalahan yang akan dibahas dalam penelitian ini, yaitu :
1. Bagaimana pendekatan
Agglomerative Hierarchical Clustering
mampu mengelompokkan emosi setiap
tweet
dengan baik ? 2.
Berapakah tingkat akurasi analisis sentimen
twitter
menggunakan pendekatan
Agglomerative Hierarchical Clustering
?
1.3 Tujuan Penelitian
Tujuan dari penelitian ini adalah membangun sistem yang secara otomatis mampu mengelompokkan emosi setiap
tweet
menggunakan
Agglomerative Hierarchical Clustering
dan mengetahui tingkat akurasi pengelompokkan.
1.4 Manfaat
Manfaat yang diberikan pada penelitian ini, yaitu : 1.
Dapat membantu menganalisis sentimen pada
twitter
dengan metode
Agglomerative Hierarchical Clustering.
2. Menjadi referensi bagi penelitian
– penelitian berikutnya yang relevan dengan kasus analisis sentimen
twitter
.
1.5 Luaran
Luaran yang diharapkan pada penelitian ini berupa suatu sistem yang secara otomatis mampu mengelompokkan emosi setiap
tweet
.
1.6 Batasan Masalah
Pada pengerjaan penelitian ini diberikan batasan-batasan masalah untuk permasalahan yang ada antara lain:
1.
Tweet
yang dianalisis sentimen hanya
tweet
berbahasa Indonesia. 2.
Pengelompokkan
tweet
berdasarkan lima emosi yaitu cinta, marah, senang, sedih, dan takut
3.
Tweet
yang digunakan hanya
tweet
yang berupa
text
, tidak mengandung gambar.
1.7 Sistematika Penulisan
Sistematika penulisan proposal tugas akhir ini dibagi menjadi beberapa bab dengan susunan sebagai berikut:
BAB I :
Pendahuluan Berisi penjelasan mengenai masalah yang akan diteliti, berisi
latar belakang, rumusan masalah, tujuan penelitian,manfaat penelitian, luaran, batasan masalah, dan sistematika penulisan.
BAB II :
Landasan Teori Berisi mengenai penjelasan dan uraian teori-teori yang berkaitan
dengan topik analisis sentimen
twitter
, antara lain teori tentang analisis sentimen, emosi,
preprocessing
teks
Information Retrieval
, pembobotan kata, normalisasi
min-max
, normalisasi
z-score
, algoritma
Agglomerative Hierarchical Clustering, Cosine Similarity, Euclidean Distance,
dan
Confusion Matriks
BAB III :
Metodologi Penelitian Berisi analisa dan design yang merupakan detail teknis sistem
yang akan dibangun. BAB IV
: Implementasi dan Analisis Hasil
Bab ini berisi implementasi dari perancangan yang telah dibuat sebelumnya serta analisis dari hasil program yang telah dibuat
BAB V :
Penutup Bab ini berisi kesimpulan dari penelitian dan saraan
– saran untuk pengembangan penelitian lebih lanjut.
6
BAB II LANDASAN TEORI