Klasifikasi Emosi Konsumen Menggunakan Naive Bayes Classifier (Studi Kasus: Natasha Skin Care) - UNS Institutional Repository
HALAMAN JUDUL
KLASIFIKASI EMOSI KONSUMEN MENGGUNAKANMETODE NAÏVE BAYES CLASSIFIER (Studi Kasus: NATASHA SKIN CARE) SKRIPSI
Diajukan untuk memenuhi sebagai persyaratan mendapatkan gelar Strata Satu
Program Studi Informatika
Disusun Oleh : AFIFAH NURLAILA M0513004 PROGRAM STUDI INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA
2017
HALAMAN PERSETUJUAN SKRIPSI KLASIFIKASI EMOSI KONSUMEN MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (STUDI KASUS: NATASHA SKIN CARE)
Disusun oleh: AFIFAH NURLAILA NIM. M0513004 telah disetujui oleh pembimbing pada tanggal 15 Desember 2017
Pembimbing 1, Dr. Wiranto, M.Kom, M.Cs.
NIP. 196612301993021001 Pembimbing 2, Ristu Saptono, S.Si., M.T.
NIP. 197902102002121001
HALAMAN PENGESAHAN SKRIPSI KLASIFIKASI EMOSI KONSUMEN MENGGUNAKAN
METODE NAÏVE BAYES CLASSIFIER (STUDI KASUS: NATASHA SKIN CARE)
HALAMAN PENGESAHAN Disusun oleh: AFIFAH NURLAILA NIM. M0513004 telah dipertahankan dihadapan dewan penguji, pada tanggal: 2 Januari 2018
Susunan Dewan Penguji 1.
Dr. Wiranto, M.Kom, M.Cs.
( ) NIP. 196612301993021001
2. Ristu Saptono, S.Si., M.T.
( ) NIP. 197902102002121001
3. Denis Eka Cahyani, S.Kom., M.Kom.
( ) NIP/NIK. 1991031020161001
4. Dr. Techn. Dewi Wisnu Wardani, S.Kom., M.S.
( ) NIP. 197810262005012002 Disahkan oleh Kepala Program Studi Informatika,
Drs. Bambang Harjito, M.App.Sc, Ph.D.
NIP. 196211301991031002
MOTTO
Dan janganlah kamu berputus asa dari rahmat Allah, sesungguhnya tiada berputus asa dari rahmat Allah melainkan kaum yang kafir. (Q.S. Yusuf : 87) Allah pasti akan memberi jawaban doa seseorang selama ia tak tergesa-gesa
(Andromeda Nisa) Dengan terus bergerak dan menguatkan ikhtiar itu artinya kamu melayakkan diri untuk mendapatkan pertolongan Allah dari arah yang tak disangka (Dea Mahfudz)
PERSEMBAHAN
Tugas Akhir ini penulis persembahkan kepada: Ibu, Bapak, Adik, dan Keluarga
Besar Mbah Mustakim serta teman-teman Universitas Sebelas Maret (UNS)Surakarta Segala puji bagi Allah swt, Rabb yang mengatur segala kehidupan di bumi dan setelahnya. Alhamdulillah, setelah melalui proses yang panjang, penulis dapat menyelesaikan skripsi berjudul “Klasifikasi Emosi Konsumen Menggunakan Metode
Naïve Bayes Classifier (Studi Kasus: Natasha Skin Care )”.
Dalam pengerjaan skripsi ini banyak hambatan dan keterbatasan yang ditemui. Banyak bantuan yang telah diberikan oleh berbagai pihak. Oleh karena itu, penulis mengucapkan terima kasih kepada
1. ibu Umi Sa’adah dan bapak Suharja atas segala dukungan dan doa-doa baiknya 2. bapak Dr. Wiranto, M.Cs. selaku Pembimbing I 3. bapak Ristu Saptono, S.Si., M.T. selaku Pembimbing II sekaligus Pembimbing
Akademik 4. bapak-ibu dosen dan karyawan Program Studi Informatika UNS 5. semua pihak yang tidak dapat dituliskan satu persatu
Penulis menyadari masih banyak kekurangan dalam penyusunan laporan skripsi ini. Oleh karena itu, kritik dan saran dari pembaca sekalian sangatlah penulis harapkan. Semoga laporan skripsi ini bermanfaat untuk menambah wawasan bagi pembaca maupun penulis sendiri.
Surakarta, Desember 2017
DAFTAR ISI
KLASIFIKASI EMOSI KONSUMEN MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (Studi Kasus: NATASHA SKIN CARE) AFIFAH NURLAILA
Program Studi Informatika Fakultas MIPA Universitas Sebelas Maret
ABSTRAK
Dewasa ini konsumen dapat dengan mudah menyampaikan review atau pendapatnya terhadap suatu produk atau jasa dari Natasha Skin Care melalui
mentions @NatashaSkinCare. Dari mentions tersebut dapat dikenali emosi konsumen setelah menggunakan produk atau jasa dari Natasha Skin Care.
Penelitian ini bertujuan untuk melakukan klasifikasi emosi menurut Ekman yaitu
joy, surprise, anger, fear, sad, dan disgust dengan menggunakan Naïve Bayes Classifier . Naïve Bayes Classifier dipilih karena memiliki kelebihan yaitu
sederhana, cepat, dan berakurasi tinggi. Dataset pada penelitian ini berjumlah 19.253 dengan pembagian untuk setiap kelasnya adalah 804 joy, 43 surprise, 154 anger, 61 fear, 287 sad, 167 disgust, dan 17736 no-emotions. Hasil penelitian menunjukkan bahwa metode Naïve Bayes Classifier memiliki kinerja yang baik untuk mengklasifikasikan emosi konsumen Natasha Skin Care melalui jejaring sosial twitter. Rata-rata tingkat accuracy pada dataset tanpa kelas no-emotions adalah 80,19%. Rata-rata pada klasifikasi emosi tanpa melibatkan kelas
no-emotions menunjukkan nilai recall tertinggi pada kelas joy yaitu sebesar
92,21%. Nilai precision tertinggi pada kelas surprise yaitu sebesar 97,77% dan nilai F1-Measure tertinggi terdapat pada kelas joy sebesar 89,14%. Sedangkan rata-rata pada dataset dengan kelas no-emotions adalah 88,58%. Walaupun
accuracy pada dataset dengan kelas no-emotions lebih tinggi, tetapi nilai precision dan recall-nya sangatlah rendah yaitu mencapai nilai 0%. Setelah
menggunakan algoritma resampling ROS, rata-rata nilai precision, recall, dan
F1-Measure tertinggi terdapat pada kelas no-emotions. Yaitu precision bernilai 96,64%, recall bernilai 76,36%, dan F1-Measure bernilai 85,93%.
Kata kunci: klasifikasi emosi, naïve bayes classifier, resampling
CLASSIFICATION OF CUSTOMERS EMOTION USING
NAÏVE BAYES CLASSIFIER
(Case Study: Natasha Skin Care)
Department of Informatic, Mathematic and Science Faculty,
Universitas Sebelas Maret
ABSTRACT Today customers can easily submit their review or opinion of a product
or a service from Natasha Skin Care through mentions tweet @NatashaSkinCare.
Mentions can be identified emotions of costumers after using a products or a
services of Natasha Skin Care. This research proposes to classify emotions
according to Ekman that is joy, surprise, anger, fear, sad, and disgust by using
Naïve Bayes Classifier. Naïve Bayes Classifier is chosen because of its advantages
that is simple, fast, and high accuracy. The dataset in this study amounted to
19,253 with the division for each class is 804 joy, 43 surprise, 154 anger, 61 fear, 287 sad, 167 disgust, and 17736 no-emotions. The results show that the Naïve
Bayes Classifier method has a good performance to classify the emotions Natasha
Skin Care customers through twitter. The average accuracy rate on the no-
emotions class dataset is 80.19%. The average of the emotional classification
without involving the no-emotions class shows the highest recall value in the joy
class of 92.21%. The highest precision value in the surprise class was 97.77%
and the highest F1-Measure was in the joy class of 89.14%. The mean on the
dataset with the no-emotions class is 88.58%. Although the accuracy of the dataset
with the no-emotions class is higher, the precision and recall value is very low,
which is 0%. After using the ROS resampling algorithm, the mean values of
precision, recall, and F1-Measure are highest in the no-emotions class. Precision
value is 96.64%, recall value is 76.36%, and F1-Measure value is 85.93%.Keyword: emotional classification, naïve bayes classifier, resampling
DAFTAR TABEL
Tabel 2.1 Confusion Matrix berukuran n x n ............................................................. 11Tabel 2.2 Penelitian Terkait ....................................................................................... 15Tabel 3.1 Confusion Matrix berukuran 7 x 7 ......................................................................... 21Tabel 4.1 Data Penelitian ........................................................................................... 22Tabel 4.2 Proses Case Folding .................................................................................. 23Tabel 4.3 Proses Penghilangan Username dan Hashtag ............................................ 23Tabel 4.4 Proses Penghilangan Karakter Selain Huruf .............................................. 24Tabel 4.5 Proses Tokenizing ....................................................................................... 24Tabel 4.6 Proses Filtering .......................................................................................... 24Tabel 4.7 Contoh Data Tweet untuk Perhitungan Naïve Bayes Classifier ................. 25Tabel 4.8 Hasil Pengujian Klasifikasi Tanpa Melibatkan Kelas No-emotions .......... 30Tabel 4.9 Pembagian Data Training dan Data Testing pada Klasifikasi tanpaTabel 4.10 Rata-Rata dari Evaluasi pada Data Tanpa Melibatkan Kelas No-emotions
Tabel 4.11 Pembagian Data Training dan Data Testing pada Klasifikasi dengan
Tabel 4.12 Hasil Pengujian Klasifikasi dengan Melibatkan Kelas No-emotions ....... 34Tabel 4.13 Rata-Rata dari Hasil Evaluasi pada Data dengan Melibatkan Kelas
Tabel 4.14 Hasil Pengujian Klasifikasi dengan Resampling ROS ............................. 36Tabel 4.15 Rata-Rata dari Hasil Evaluasi pada Data dengan Resampling ROS ........ 37
DAFTAR GAMBAR
Gambar 2.1 Model mapping