34
BAB III METODE PENELITIAN
Bab ini berisi perancangan penelitian yang akan dibuat oleh penulis meliputi data, kebutuhan system, tahapan penelitian, desain interface, skenario sistem, dan
desain pengujian.
3.1 Data
Data yang digunakan pada penelitian ini adalah tweet berbahasa Indonesia yang ditulis oleh para pengguna Twitter. Tweet yang dikumpulkan berupa tweet-tweet yang
mengandung emosi cinta, senang, marah, takut, dan sedih. Dari masing- masing emosi, diambil 100 data per emosi sehingga total tweet yang digunakan sebagai data berjumlah
500 . Pencarian data dilakukan dengan menggunakan hashtag cinta, senang,
takut, dan sedih pada website www.netlytic.org. Pemilihan data secara manual yaitu memilih kalimat-kalimat tweet yang berbahasa Indonesia dan tidak mengandung
gambar. Tweet yang telah dipilih kemudian di simpan ke file teks. Setiap tweet diletakkan pada setiap baris pada file teks. File teks berisi tweet tersebut kemudian
dijadikan input pada sistem untuk diolah lebih lanjut. Berikut contoh tweet dengan emosi cinta. Penulis tweet mengungkapkan
perasaan cintanya pada seseorang atau sesuatu melalui kata-kata yang ditulis.
Gambar 3. 1 Tweet Cinta
Berikut contoh tweet dengan emosi senang. Penulis tweet mengungkapkan perasaan senangnya pada seseorang atau sesuatu melalui kata-kata yang ditulis.
Gambar 3. 2Tweet Senang
Berikut contoh tweet dengan emosi marah. Penulis tweet mengungkapkan perasaan marahnya pada seseorang atau sesuatu melalui kata-kata yang ditulis.
Gambar 3. 3 Tweet Marah
Berikut contoh tweet dengan emosi takut. Penulis tweet mengungkapkan perasaan takutnya melalui kata-kata yang ditulis.
Gambar 3. 4 Tweet Takut Berikut contoh tweet dengan emosi sedih. Penulis tweet mengungkapkan
perasaan sedihnya pada seseorang melalui kata-kata yang ditulis.
Gambar 3. 5 Tweet Sedih
3.2 Kebutuhan Sistem
Untuk proses membuat sistem digunakan software dan hardware sebagai berikut :
1. Software
a Sistem Operasi
: Windows 8 64-bit b
Bahasa Pemograman : Matlab R2010A
2. Hardware
a Processor
: Intel R CoreTM i3-3217U CPU 1.8GHz b
Memory : 2 Gb
c Harddisk
: 500 Gb
3.3 Tahapan Penelitian
3.3.1 Studi Pustaka
Pada Studi Pustaka ini penulis mencantumkan dan menggunakan teori –
teori yang terkait dengan penelitian yang dilakukan,seperti teori Analisis sentimen, emosi, Preprocessing text Information Retrieval, Pembobotan kata, Normalisasi,
Agglomerative Hierarchical Clustering, Euclidean Distance, dan Confusion matriks.
3.3.2 Pengumpulan Data
Data yang digunakan pada penelitian ini adalah tweet berbahasa Indonesia yang ditulis oleh para pengguna Twitter. Tweet yang dikumpulkan berupa tweet
yang berisi emosi cinta, marah, senang, sedih, dan takut.
3.3.3 Pembuatan Alat Uji
Pada tahap ini, akan dirancang suatu alat uji yang dimulai dengan perancangan interface dan pembuatan alat uji untuk menguji Agglomerative
Hierarchical Clustering untuk mengelompokkan tweet serta mendapatkan akurasi dari sistem yang telah dibangun.
3.3.4 Pengujian
Pada tahap pengujian ini, data terlebih dahulu di-preprocessing sehingga dari data yang dihasilkan dapat dilakukan proses clustering. Dari hasil clustering
yang dilakukan, pengujian dilakukan dengan menggunakan Cofusion Matriks.
3.4 Desain Interface