34
BAB III METODE PENELITIAN
Bab ini berisi perancangan penelitian yang akan dibuat oleh penulis meliputi data, kebutuhan system, tahapan penelitian, desain
interface
, skenario sistem, dan desain pengujian.
3.1 Data
Data yang digunakan pada penelitian ini adalah
tweet
berbahasa Indonesia yang ditulis oleh para pengguna
Twitter
.
Tweet
yang dikumpulkan berupa
tweet
-
tweet
yang mengandung emosi cinta, senang, marah, takut, dan sedih. Dari masing- masing emosi,
diambil 100 data per emosi sehingga total
tweet
yang digunakan sebagai data berjumlah 500 .
Pencarian data dilakukan dengan menggunakan
hashtag
cinta, senang, takut, dan sedih pada website www.netlytic.org. Pemilihan data secara manual yaitu
memilih kalimat-kalimat tweet yang berbahasa Indonesia dan tidak mengandung gambar. Tweet yang telah dipilih kemudian di simpan ke file teks. Setiap
tweet
diletakkan pada setiap baris pada
file
teks.
File
teks berisi
tweet
tersebut kemudian dijadikan input pada sistem untuk diolah lebih lanjut.
Berikut contoh
tweet
dengan emosi cinta. Penulis
tweet
mengungkapkan perasaan cintanya pada seseorang atau sesuatu melalui kata-kata yang ditulis.
Gambar 3. 1
Tweet
Cinta
Berikut contoh
tweet
dengan emosi senang. Penulis
tweet
mengungkapkan perasaan senangnya pada seseorang atau sesuatu melalui kata-kata yang ditulis.
Gambar 3. 2
Tweet
Senang
Berikut contoh
tweet
dengan emosi marah. Penulis
tweet
mengungkapkan perasaan marahnya pada seseorang atau sesuatu melalui kata-kata yang ditulis.
Gambar 3. 3
Tweet
Marah
Berikut contoh
tweet
dengan emosi takut. Penulis
tweet
mengungkapkan perasaan takutnya melalui kata-kata yang ditulis.
Gambar 3. 4
Tweet
Takut Berikut contoh
tweet
dengan emosi sedih. Penulis
tweet
mengungkapkan perasaan sedihnya pada seseorang melalui kata-kata yang ditulis.
Gambar 3. 5
Tweet
Sedih
3.2 Kebutuhan Sistem
Untuk proses membuat sistem digunakan
software
dan
hardware
sebagai berikut :
1. Software
a Sistem Operasi
: Windows 8 64-bit b
Bahasa Pemograman : Matlab R2010A
2. Hardware
a
Processor
: Intel R CoreTM i3-3217U CPU 1.8GHz b
Memory
: 2 Gb c
Harddisk
: 500 Gb
3.3 Tahapan Penelitian
3.3.1 Studi Pustaka
Pada Studi Pustaka ini penulis mencantumkan dan menggunakan teori –
teori yang terkait dengan penelitian yang dilakukan,seperti teori Analisis sentimen, emosi,
Preprocessing text Information Retrieval
, Pembobotan kata, Normalisasi,
Agglomerative Hierarchical Clustering, Euclidean Distance, dan Confusion matriks
.
3.3.2 Pengumpulan Data
Data yang digunakan pada penelitian ini adalah
tweet
berbahasa Indonesia yang ditulis oleh para pengguna
Twitter
.
Tweet
yang dikumpulkan berupa
tweet
yang berisi emosi cinta, marah, senang, sedih, dan takut.
3.3.3 Pembuatan Alat Uji
Pada tahap ini, akan dirancang suatu alat uji yang dimulai dengan perancangan
interface
dan pembuatan alat uji untuk menguji Agglomerative Hierarchical
Cluster
ing untuk mengelompokkan
tweet
serta mendapatkan akurasi dari sistem yang telah dibangun.
3.3.4 Pengujian
Pada tahap pengujian ini, data terlebih dahulu di-
preprocessing
sehingga dari data yang dihasilkan dapat dilakukan proses
clustering
. Dari hasil
clustering
yang dilakukan, pengujian dilakukan dengan menggunakan
Cofusion Matriks
.
3.4 Desain