Salah satu faktor yang mempengaruhi agar fitur klasifikasi memberikan hasil yang maksimal adalah pada tahap preprocessing data tweet dilakukan filtering dengan
menghapus kata-kata yang tidak ada di KBBI dan dilakukan proses stemming, sehingga hanya berupa kumpulan kata dasar
Nur Santika, 2011. Berdasarkan penelitian yang telah ada sebelumnya, penelitan ini mencoba
melakukan analisis sentimen dengan mengklasifikasi data twitter berbahasa Indonesia. Data tersebut akan diproses dengan text mining untuk menghindari data
yang kurang sempurna kemudian mengelompokkan data tweet berdasarkan emosi ke dalam lima cluster yaitu senang, takut, sedih, marah, cinta. Pengelompokkan ini
menggunakan algoritma Agglomerative Hierarchical Clustering.
1.2 Rumusan Masalah
Berdasarkan Latar Belakang yang telah dikemukakan diatas, maka permasalahan yang akan dibahas dalam penelitian ini, yaitu :
1. Bagaimana pendekatan Agglomerative Hierarchical Clustering mampu
mengelompokkan emosi setiap tweet dengan baik ? 2.
Berapakah tingkat akurasi analisis sentimen twitter menggunakan pendekatan Agglomerative Hierarchical Clustering?
1.3 Tujuan Penelitian
Tujuan dari penelitian ini adalah membangun sistem yang secara otomatis mampu mengelompokkan emosi setiap tweet menggunakan Agglomerative
Hierarchical Clustering dan mengetahui tingkat akurasi pengelompokkan.
1.4 Manfaat
Manfaat yang diberikan pada penelitian ini, yaitu : 1.
Dapat membantu menganalisis sentimen pada twitter dengan metode Agglomerative Hierarchical Clustering.
2. Menjadi referensi bagi penelitian
– penelitian berikutnya yang relevan dengan kasus analisis sentimen twitter.
1.5 Luaran
Luaran yang diharapkan pada penelitian ini berupa suatu sistem yang secara otomatis mampu mengelompokkan emosi setiap tweet.
1.6 Batasan Masalah
Pada pengerjaan penelitian ini diberikan batasan-batasan masalah untuk permasalahan yang ada antara lain:
1. Tweet yang dianalisis sentimen hanya tweet berbahasa Indonesia.
2. Pengelompokkan tweet berdasarkan lima emosi yaitu cinta, marah, senang, sedih,
dan takut 3.
Tweet yang digunakan hanya tweet yang berupa text, tidak mengandung gambar.
1.7 Sistematika Penulisan
Sistematika penulisan proposal tugas akhir ini dibagi menjadi beberapa bab dengan susunan sebagai berikut:
BAB I :
Pendahuluan Berisi penjelasan mengenai masalah yang akan diteliti, berisi
latar belakang, rumusan masalah, tujuan penelitian,manfaat penelitian, luaran, batasan masalah, dan sistematika penulisan.
BAB II :
Landasan Teori Berisi mengenai penjelasan dan uraian teori-teori yang berkaitan
dengan topik analisis sentimen twitter, antara lain teori tentang analisis sentimen, emosi, preprocessing teks Information Retrieval ,
pembobotan kata, normalisasi min-max, normalisasi z-score, algoritma Agglomerative Hierarchical Clustering, Cosine Similarity, Euclidean
Distance, dan Confusion Matriks BAB III
: Metodologi Penelitian
Berisi analisa dan design yang merupakan detail teknis sistem yang akan dibangun.
BAB IV :
Implementasi dan Analisis Hasil Bab ini berisi implementasi dari perancangan yang telah dibuat
sebelumnya serta analisis dari hasil program yang telah dibuat BAB V
: Penutup
Bab ini berisi kesimpulan dari penelitian dan saraan – saran
untuk pengembangan penelitian lebih lanjut.
6
BAB II LANDASAN TEORI