Implementasi Metode Multi Class Support Vector Machine Untuk Klasifikasi Emosi pada Lirik Lagu Bahasa Indonesia

BIODATA PENULIS A.

   Data Pribadi

  Nama Lengkap : Citrawati Isra Salekhah Tempat, Tanggal Lahir : Bandung, 24 Desember 1993 Jenis Kelamin : Perempuan Agama : Islam Kewarganegaraan : Indonesia Alamat : Jl. Raya Jepara Kudus Km. 7 01/02 Ngabul

  Tahunan Jepara No. Telepon : 08112255922 Email : citraisra@gmail.com B.

   Pendidikan Formal

  1998

  : TK Pertiwi, Jepara 1999

  • – 1999
  • – 2005
  • – 2008
  • – 2011
  • – 2016

  : SD Negeri Panggang 2, Jepara 2005

  : SMA Negeri 1, Jepara Jurusan Ilmu Pengetahuan Alam

  2011

  : Universitas Komputer Indonesia, Bandung Jurusan S1 – Teknik Informatika C.

   Riwayat Pekerjaan Kerja praktik di PT. MediaWave Interaktif Tahun 2014.

  Bandung, 25 Agustus 2016

  Citrawati Isra Salekhah

  NIM. 10111473

  : SMP Negeri 2, Jepara 2008

IMPLEMENTASI METODE MULTI CLASS SUPPORT

  

VECTOR MACHINE UNTUK KLASIFIKASI EMOSI PADA

LIRIK LAGU BAHASA INDONESIA

SKRIPSI

  Diajukan untuk Menempuh Ujian Akhir Sarjana

  

CITRAWATI ISRA SALEKHAH

10111473

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIA

  

2016

  KATA PENGANTAR Assalamu’alaikum Warahmatullahi Wabarakatuh.

  Alhamdulillahi Rabbil ‘Alamin, segala puji dan syukur Penulis panjatkan kehadirat Allah SWT yang atas rahmat dan karunia-Nya, tidak lupa shalawat serta salam tercurah limpahkan kepada Baginda Rasulullah SAW, sehingga Penulis dapat menyelesaikan skripsi yang berjudul

  “IMPLEMENTASI METODE MULTI CLASS SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI EMOSI PADA LIRIK LAGU BAHASA

  INDONESIA” untuk memenuhi salah satu syarat dalam menyelesaikan studi jenjang strata satu (S1) di Program Studi Teknik Informatika, Fakultas Teknik dan Ilmu Komputer, Universitas Komputer Indonesia. Dikarenakan keterbatasan yang dimiliki Penulis, penyusunan skripsi ini tidak akan terwujud tanpa mendapat banyak dukungan, bantuan dan masukan dari berbagai pihak. Untuk itu melalui kata pengantar ini, Penulis ingin menyampaikan rasa terimakasih yang sebesar-besarnya kepada:

  1. Allah SWT atas segala nikmat yang telah diberikan, beserta izin-Nya lah sehingga Penulis dapat menyelesaikan skripsi ini.

  2. Kedua orang tua, ibu (Erni Suryani) dan ayah (Soelchan Saleh) yang telah memberikan kasih sayang, doa dan dukungan baik moril maupun materi, sehingga Penulis dapat menyelesaikan skripsi ini.

  3. Ibu Ednawati Rainarli, S. Si., M. Si., selaku dosen wali Penulis di kelas IF- 11/2011 dan dosen pembimbing Penulis. Terimakasih karena telah banyak meluangkan waktu untuk memberikan bimbingan, saran, ilmu dan nasehatnya selama proses penyusunan skripsi ini.

  4. Bapak Alif Finandhita, S. Kom., M. T., selaku reviewer, karena telah memberikan saran, ilmu dan masukannya kepada Penulis.

  5. Bapak Rangga Gelar Guntara, S. Kom., M. Kom., selaku penguji tiga, karena telah memberikan saran, ilmu dan masukannya kepada Penulis.

  6. Bapak dan Ibu dosen serta seluruh staf pegawai Program Studi Teknik Informatika Universitas Komputer Indonesia yang telah membantu Penulis selama proses perkuliahan.

  7. Terima kasih kepada Bang Ali yang telah membagi ilmunya serta bertukar pikiran tentang metode Multi Class Support Vector Machine.

  8. Teman-teman seperjuangan skripsi semester genap 2015/2016, anak-anak bimbingan ibu Ednawati Rainarli S. Si., M. Si., serta angkatan 2011 terutama kelas IF-11 yang selalu memberi dukungan dan semangat kepada Penulis selama penyusunan skripsi.

  9. Terima kasih kepada 3J (Ismi Muwakhidah, Sri Jayanti) yang selalu memberikan dukungan, motivasi, serta meluangkan waktunya untuk bermain bersama.

  10. Teman-teman Secret Admirer (Rismayanti, Dewi Raida, Shandhi Shinta, Sesky Oktaliva, Mutiara Fitryana, Luthfia Sarafina Nuryadin, Rifan Muhammad Furqon, Abudin) yang selalu memberikan dukungan, motivasi, serta telah meluangkan waktunya untuk bermain bersama.

  11. Serta seluruh pihak yang tidak dapat Penulis sebutkan satu persatu, terimakasih atas segala bentuk dukungannya untuk menyelesaikan skripsi ini.

  Penulis menyadari bahwa penulisan skripsi ini masih jauh dari kata sempurna. Oleh karena itu, Penulis mengharapkan saran dan masukan yang bersifat membangun untuk perbaikan dan pengembangan skripsi ini selanjutnya. Akhir kata, semoga penulisan skripsi ini dapat bermanfaat bagi penulis khususnya dan bagi pembaca pada umumnya.

  Wassalamu’alaikum Warahmatullahi Wabarakatuh.

  Bandung, 25 Agustus 2016 Penulis

  DAFTAR ISI

  ABSTRAK ............................................................................................................... i

  

ABSTRACT .............................................................................................................. ii

  KATA PENGANTAR ........................................................................................... iii DAFTAR ISI ........................................................................................................... v DAFTAR GAMBAR ............................................................................................. ix DAFTAR TABEL .................................................................................................. xi DAFTAR SIMBOL .............................................................................................. xiii DAFTAR LAMPIRAN ....................................................................................... xvii

  BAB 1 PENDAHULUAN ...................................................................................... 1

  1.1 Latar Belakang Masalah .............................................................................. 1

  1.2 Rumusan Masalah ....................................................................................... 2

  1.3 Maksud dan Tujuan ..................................................................................... 2

  1.4 Batasan Masalah .......................................................................................... 2

  1.5 Metodologi Penelitian ................................................................................. 3

  1.5.1 Metode Pengumpulan Data ......................................................................... 3

  1.5.2 Metode Pembangunan Perangkat Lunak ..................................................... 4

  1.5.3 Metode Klasifikasi ...................................................................................... 5

  1.6 Sistematika Penulisan .................................................................................. 6

  BAB 2 LANDASAN TEORI .................................................................................. 9

  2.1 Emosi ........................................................................................................... 9

  2.2 International Survey On Emotion Antecedents And Reaction (ISEAR) .... 9

  2.3 Preprocessing ............................................................................................ 10

  2.3.1 Case Folding .............................................................................................. 10

  2.8.4 Sequence Diagram ..................................................................................... 27

  3.4.5 Stemming .................................................................................................. 39

  3.4.4 Stopword Removal .................................................................................... 37

  3.4.3 Tokenizing ................................................................................................. 36

  3.4.2 Convert Negation ...................................................................................... 34

  3.4.1 Case Folding .............................................................................................. 33

  3.4 Analisis Preprocessing .............................................................................. 32

  3.3 Analisis Data Masukan .............................................................................. 31

  3.2 Analisis Proses .......................................................................................... 29

  3.1 Analisis Masalah ....................................................................................... 29

  BAB 3 ANALISIS DAN PERANCANGAN ....................................................... 29

  2.8.3 Class Diagram ........................................................................................... 26

  2.3.2 Convert Negation ...................................................................................... 10

  2.8.2 Activity Diagram ....................................................................................... 26

  2.8.1 Use Case Diagram ..................................................................................... 26

  2.8 Unified Modeling Language ..................................................................... 25

  2.7 Pemrograman Berorientasi Objek ............................................................. 24

  2.6 Pengukuran Kinerja Klasifikasi ................................................................ 23

  2.5 Metode Support Vector Machine .............................................................. 18

  2.4 Pembobotan TF-IDF ................................................................................. 18

  2.3.5 Stemming .................................................................................................. 12

  2.3.4 Stopwords Removal .................................................................................. 11

  2.3.3 Tokenizing ................................................................................................. 11

  3.5 Analisis Pembobotan TF-IDF ................................................................... 42

  3.6 Analisis Metode Multi Class Support Vector Machine ............................ 45

  3.9 Perancangan Sistem ................................................................................... 67

  4.2 Pengujian ................................................................................................... 72

  4.1.3 Implementasi Antarmuka .......................................................................... 72

  4.1.2 Implementasi Perangkat Lunak ................................................................. 71

  4.1.1 Implementasi Perangkat Keras .................................................................. 71

  4.1 Implementasi ............................................................................................. 71

  BAB 4 IMPLEMENTASI DAN PENGUJIAN .................................................... 71

  3.9.4 Jaringan Semantik ..................................................................................... 69

  3.9.3 Perancangan Pesan .................................................................................... 69

  3.9.2 Perancangan Antarmuka ........................................................................... 67

  3.9.1 Perancangan Struktur Menu ...................................................................... 67

  3.8.5 Sequence Diagram ..................................................................................... 63

  3.6.1 Analisis Pelatihan Multi Class Support Vector Machine .......................... 45

  3.8.4 Class Diagram ........................................................................................... 62

  3.8.3 Activity Diagram ....................................................................................... 59

  3.8.2 Use Case Skenario ..................................................................................... 56

  3.8.1 Use Case Diagram ..................................................................................... 55

  3.8 Analisis Kebutuhan Fungsional ................................................................ 54

  3.7.3 Analisis Pengguna ..................................................................................... 54

  3.7.2 Analisis Kebutuhan Perangkat Lunak ....................................................... 54

  3.7.1 Analisis Kebutuhan Perangkat Keras ........................................................ 54

  3.7 Analisis Kebutuhan Non Fungsional ......................................................... 53

  3.6.2 Analisis Pengujian Multi Class Support Vector Machine ......................... 51

  4.2.1 Rencana Pengujian .................................................................................... 72

  4.2.2 Skenario Pengujian .................................................................................... 72

  4.2.3 Hasil Pengujian ......................................................................................... 74

  4.2.4 Evaluasi Pengujian .................................................................................... 78

  BAB 5 KESIMPULAN DAN SARAN ................................................................ 79

  5.1 Kesimpulan ................................................................................................ 79

  5.2 Saran .......................................................................................................... 79 DAFTAR PUSTAKA ........................................................................................... 81

DAFTAR PUSTAKA

  [1] R. Hirat and N. Mittal, "A Survey On Emotion Detection Techniques using Text in Blogspot," International Bulletin of Mathematical Research, vol. 02, no. 1, pp. 180-187, 2015.

  [2] S. M. Mohamad and S. Kiritchenko, "Using Hastags to Capture Fine Emotion Categories from Tweets," Computational Intelligence, vol. 31, no. 2, pp. 301- 326, 2015.

  [3] F. Kleedorfer, P. Knees and T. Pohle, "Oh Oh Oh Whoah! Towards Automatic Topic Detection in Song Lyrics," in Studio Smart Agent Technologies, Austria, 2008.

  [4] L. Sofiyani, Z. Abidin and H. Nurhayati, "Klasifikasi Emosi untuk Teks Berbahasa Indonesia dengan Menggunakan K-Nearest Neighbor," pp. 294- 299, 2012.

  [5] F. Wulandini and A. S. Nugroho, "Text Clasification Using Support Vector Machine for Webmining Based Spatio Temporal Anlysis of the Spread of Tropical Diseases," International Conference on Rural Information and Communication Technology, pp. 189-192, 2009.

  [6] E. Prasetyo, DATA MINING - Mengolah Data menjadi Informasi Menggunakan Matlab, Yogyakarta: ANDI, 2014. [7] "aaac emotion-research.net," The Association for the Advancement of

  Affective Computing (AAAC), [Online]. Available: http://emotion- research.net/toolbox/toolboxdatabase.2006-10-13.2581092615. [Accessed

  11 March 2016]. [8] "KapanLagi.com," KLN KapanLagi Network, [Online]. Available: http://lirik.kapanlagi.com. [Accessed 11 March 2016].

  [9] "wow keren," MEDIA

  INFO, 2016. [Online]. Available: http://www.wowkeren.com. [Accessed 11 March 2016]. [10] C. D. Manning, P. Raghavan and H. Schutze, An Introduction to Information Retrieval, Cambridge: Cambridge University Press, 2009. [11] W. A. Gani, "Klasifikasi Emosi pada Teks Bahasa Indonesia Menggunakan

  Metode K-Nearest Neighbor dengan Pembobotan WIDF," Jurnal Ilmiah Komputer dan Informatika (KOMPUTA), 2016.

  [12] L. Agusta, "Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Andriani untuk Stemming Dokumen Teks Bahasa Indonesia," Konferensi Nasional Sistem dan Informatika, pp. 196-201, 2009.

  [13] M. Nazir, Metode Penelitian, Bogor: Ghalia Indonesia, 2011. [14] Direktorat Tenaga Kependidikan, Direktorat Jenderal Peningkatan Mutu

  Pendidik dan Tenaga Kependidikan, Pendekatan, Jenis, dan Metode Penelitian Pendidikan, Jakarta: Departemen Pendidikan Nasional, 2008. [15] K. Oatley and J. M. Jenkins, Understanding Emotions, Blackwell, 1996. [16] M. J. Power and T. Dalgleish, Cognition and Emotion, LEA Press, 1997. [17] F. Z. Tala, "A Study of Stemming Efects on Information Retrieval in Bahasa

  Indonesia," Institute for Logic, Language, and Computation Univesite itvan Amsterdam The Netherlands, Amsterdam, 2003. [18] I. Destuardi and S. Sumpeno, "Klasifikasi Emosi untuk Teks Bahasa

  Indonesia Menggunakan Metode Naive Bayes," Seminar Nasional Pascasarjana, 2009. [19] S. Chakrabarti, Mining the Web: Discovering Knowledge from Hypertext Data, San Francisco: Morgan Kaufman, 2003. [20] J. Han, M. Kamber and J. Pei, Data Mining : Concepts and Techniques, Morgan Kaufmann, 2011. [21] G. S. Budhi, I. Gunawan and F. Yuwono, "Algoritma Porter Stemmer for

  Bahasa Indonesia untuk Pre-processing Text Mining Berbasis Metode Market Basket Analysis," PAKAR Jurnal Teknologi Informasi dan Bisnis, vol. 7, 2006.

  [22] D. Grossman and F. Ophir, Information Retrieval: Algorithm and Heuristics, Kluwer Academic Publisher, 1998. [23] N. Christianini and J. S. Taylor, "An Introduction to Support Vector Machines and Other Kernels-based Learning Methods," Cambridge University Press,

  2000. [24] N. Christianini, "Support Vector and Kernel Machines," ICML Tutorial, 2001.

  [25] M. H, "Support Vector Machines-Kernels and The Kernel Trick," An

  elaboration for the Hauptseminar Reading Club: Support Vector Machines, 2006.

  [26] P. A. Octaviani, "Penerapan Metode Klasifikasi Support Vector Machine (SVM) pada Data Akreditasi Sekolah Dasar (SD) di Kabupaten Magelang," Universitas Diponegoro, S1 Statistika, Semarang, 2014.

  [27] R. A. Mauludiya, "Simulasi dan Analisis Klasifikasi Genre Musik Berbasis FFT dan Support Vector Machine," Universitas Telkom, S1 Teknik Telekomunikasi, Bandung, 2015.

  [28] R. A. S and S. M., Modul Pembelajaran Rekayasa Perangkat Lunak (Terstruktur dan Berorientasi Objek), Bandung: Modula, 2013. [29] C.-W. Hsu and C.-J. Lin, "A Comparison of Methods for Multi-class Support Vector Machines," IEEE Transaction on Neural Network, vol. 13, no. 2, pp.

  415-425, 2002.

1 BAB 1 PENDAHULUAN

1.1 Latar Belakang Masalah

  Teks merupakan salah satu media yang digunakan untuk berkomunikasi dan menyampaikan informasi [1]. Tidak hanya memuat informasi, teks juga dapat mengekspresikan emosi [2]. Lirik lagu merupakan salah satu bentuk teks yang dapat digunakan sebagai objek dalam penelitian klasifikasi emosi. Dalam penentuan emosi, lirik lagu merupakan elemen yang memiliki makna paling kuat dalam menggambarkan emosi [3].

  Penelitian terhadap klasifikasi emosi pada lirik lagu Bahasa Indonesia pernah dilakukan sebelumnya oleh Lailatus Sofiyana menggunakan metode K-Nearest

  

Neighbor (K-NN) dengan nilai akurasi mencapai 60% [4]. Penelitian tersebut

  belum menghasilkan tingkat akurasi yang maksimal karena performansi metode klasifikasi yang digunakan kurang baik dalam mengklasifikasikan teks. Hal ini ditunjukkan pada penelitian klasifikasi teks Bahasa Indonesia yang dilakukan oleh Fatimah Wulandini bahwa metode K-NN memberikan hasil akurasi paling rendah dibandingkan metode klasifikasi Support Vector Machine, Naïve Bayes Classifier, dan C4.5 Decision Tree dengan akurasi sebesar 49,17% [5].

  Support Vector Machine (SVM) merupakan metode klasifikasi yang berakar

  dari teori pembelajaran statistik yang hasilnya sangat menjanjikan untuk memberikan hasil yang lebih baik dari metode yang lain. Selain itu, SVM juga bekerja dengan baik pada set data dengan dimensi yang tinggi [6], seperti teks. Hal ini dibuktikan dengan penelitian Fatimah Wulandini yang berjudul “Text

  

Classification Using Support Vector Machine for Webmining Based Spatio

Temporal Analysis of the Spread of T ropical Diseases” bahwa metode SVM

  menunjukkan hasil paling baik pada kasus klasifikasi informasi teks Bahasa Indonesia dibandingkan dengan metode Naive Bayes classifier, k-Nearest Neighbor

  

classifier, dan C4.5 Decision Tree dengan akurasi sebesar 92,5%. Penelitian

  tersebut berhasil mengklasifikasikan 111 dari 120 artikel Bahasa Indonesia secara benar sesuai dengan kelas asli ke dalam 6 kelas kategori, yaitu economy, defense &

  

security, education, health, sports, dan politics [5]. Berdasarkan hasil dari

  penelitian tersebut membuktikan bahwa metode SVM dapat memecahkan masalah klasifikasi multi class dengan baik.

  Berdasarkan uraian diatas, maka pada penelitian ini digunakan metode Multi

  

Class Support Vector Machine untuk mengklasifikasikan emosi pada lirik lagu

Bahasa Indonesia.

  1.2 Rumusan Masalah

  Berdasarkan latar belakang yang telah dijelaskan, maka rumusan masalah dalam penelitian ini adalah bagaimana cara mengimplementasikan metode Multi

  

Class Support Vector Machine untuk klasifikasi emosi pada lirik lagu Bahasa

Indonesia.

  1.3 Maksud dan Tujuan

  Maksud dari penelitian ini adalah mengimplementasikan metode Multi Class

Support Vector Machine untuk klasifikasi emosi pada lirik lagu Bahasa Indonesia.

Sedangkan tujuan yang ingin dicapai dari penelitian ini adalah mengetahui besar akurasi yang didapatkan dengan mengimplementasikan metode Multi Class

  

Support Vector Machine untuk klasifikasi emosi pada lirik lagu Bahasa Indonesia.

  1.4 Batasan Masalah

  Agar penelitian yang dilakukan lebih terarah dan mencapai sasaran yang ditentukan, maka diperlukan sebuah pembatasan masalah atau ruang lingkup kajian, yaitu sebagai berikut: 1.

  Data latih yang digunakan adalah data dari International Survey On Emotion

  Antecedents And Reaction (ISEAR) berjumlah 1000 data pernyataan dengan format (.txt) [7].

  2. Data uji yang digunakan adalah lirik lagu Bahasa Indonesia berjumlah 30 data dengan format (.txt) [4] [8] [9].

  3. Kategori emosi yang digunakan adalah senang, takut, marah, sedih, dan bersalah, disesuaikan dengan penelitian sebelumnya [4].

  4. Tahapan preprocessing meliputi case folding, convert negation, tokenizing, stopword removal, dan stemming [10] [11].

  5. Algoritma stemming yang digunakan adalah algoritma Nazief & Adriani [12].

  6. Metode pembobotan yang digunakan adalah TF-IDF [10].

  7. Metode Multi Class Support Vector Machine yang digunakan adalah one against all [6].

  8. Fungsi kernel yang digunakan adalah linear [6].

1.5 Metodologi Penelitian

  Metodologi penelitian merupakan cara utama yang digunakan peneliti untuk mencapai tujuan dan menentukan jawaban atas masalah yang diajukan [13]. Metode penelitian yang digunakan dalam penelitian ini adalah metode eksperimen. Metode eksperimen didefinisikan sebagai metode sistematis guna membangun hubungan yang mengandung fenomena sebab akibat. Metode eksperimen merupakan metode inti dari model penelitian yang menggunakan pendekatan kuantitatif [14]. Variabel bebas yang diteliti adalah metode klasifikasi Multi Class Support Vector Machine yang digunakan untuk klasifikasi emosi pada lirik lagu Bahasa Indonesia, sedangkan variabel terikatnya adalah nilai akurasi.

  Penelitian ini memiliki 3 metode dalam pelaksanaannya, yaitu metode pengumpulan data, metode pembangunan perangkat lunak, dan metode klasifikasi. Berikut ini merupakan penjelasan dari masing-masing metode:

1.5.1 Metode Pengumpulan Data

  Metode pengumpulan data yang digunakan dalam penelitian ini adalah sebagai berikut: a. Studi Literatur

  Studi literatur yang dilakukan adalah pengumpulan data dengan cara mengumpulkan jurnal, paper, buku, serta bacaan-bacaan yang dapat mendukung sebagai referensi pada penelitian ini. Studi literatur yang dibutuhkan adalah mengenai metode Multi Class Support Vector Machine. b. Observasi Observasi yang dilakukan adalah pengumpulan data dari International Survey

  

On Emotion Antecedents And Reaction (ISEAR) yang digunakan sebagai data latih

dan lirik lagu Bahasa Indonesia sebagai data uji.

1.5.2 Metode Pembangunan Perangkat Lunak

  Metode pembangunan perangkat lunak merupakan langkah-langkah yang akan dilakukan dalam membangun simulasi untuk mengklasifikasikan emosi pada lirik lagu Bahasa Indonesia. Berikut ini adalah tahapan metode pembangunan perangkat lunak yang akan dilakukan dalam penelitian ini, dapat dilihat pada Gambar 1.1

  Analisis Perancangan Implementasi Pengujian

Gambar 1.1 Metode Pembangunan Perangkat Lunak

  Berikut merupakan penjelasan masing-masing tahapan dari Gambar 1.1:

  1. Analisis Dalam tahapan ini dilakukan untuk mempelajari konsep dan analisis mengenai klasifikasi emosi menggunakan metode Multi Class Support Vector

  Machine.

  2. Perancangan Pada tahap ini dilakukan perancangan dari simulasi klasifikasi emosi pada lirik lagu Bahasa Indonesia yang akan dibuat dengan analisis yang telah dilakukan pada tahap sebelumnya.

  3. Implementasi Pada tahap ini akan dilakukan proses implementasi metode Multi Class

  

Support Vector Machine ke dalam simulasi yang akan dibangun sesuai dengan

perancangan yang dibuat pada tahap sebelumnya.

  4. Pengujian Pada tahap ini akan dilakukan pengujian terhadap simulasi yang telah dibangun, apakah simulasi yang dibangun sudah sesuai dengan tujuan dari penelitian.

1.5.3 Metode Klasifikasi

  Berikut adalah gambaran metode klasifikasi yang dilakukan dalam penelitian ini dapat dilihat pada Gambar 1.2

  

Pelatihan Pengujian

Data Latih Data Uji

Preprocessing Preprocessing

Pembobotan Pembobotan

  

Model Klasifikasi

Gambar 1.2 Metode Klasifikasi Berikut penjelasan dari masing-masing tahapan Gambar 1.2:

  1. Preprocessing Data latih dan data uji yang akan digunakan dilakukan proses preprocessing untuk mengubah bentuk data yang belum terstruktur menjadi data yang terstruktur.

  Proses preprocessing ini terdiri dari 5 tahap yaitu case folding, convert negation, tokenizing, stopword removal dan stemming.

  2. Pembobotan Data latih dan data uji yang telah dipreprocessing akan dilakukan pembobotan menggunakan metode pembobotan TF-IDF.

  3. Model Data latih yang telah melalui proses preprocessing dan pembobotan akan dijadikan model untuk acuan dalam memprediksikan kelas teks.

  4. Klasifikasi Data uji yang telah melalui proses preprocessing dan pembobotan akan dilakukan klasifikasi menggunakan model yang dihasilkan pada tahap pelatihan.

  Metode klasifikasi yang digunakan pada penelitian ini adalah Multi Class Support Vector Machine.

1.6 Sistematika Penulisan

  Sistematika penulisan penelitian ini disusun untuk memberikan gambaran umum mengenai penelitian yang dikerjakan. Sistematika penulisan penelitian adalah sebagai berikut:

  BAB 1 PENDAHULUAN Bab ini menjelaskan tentang gambaran umum mengenai isi laporan skripsi yang

  berisi penjelasan meliputi latar belakang masalah, rumusan masalah, maksud dan tujuan, batasan masalah, metodologi penelitian, serta sistematika penulisan dalam penelitian tentang implementasi metode Multi Class Support Vector Machine untuk klasifikasi emosi pada lirik lagu Bahasa Indonesia.

  BAB 2 LANDASAN TEORI Bab ini menjelaskan tentang berbagai konsep dan teori-teori para ahli dari literatur

  pendukung untuk menampilkan kategori emosi dari lirik lagu Bahasa Indonesia dengan mengimplementasikan metode Multi Class Support Vector Machine.

  BAB 3 ANALISIS DAN PERANCANGAN Bab ini berisi penjelasan mengenai analisis masalah dari objek penelitian yang

  dilakukan untuk mengetahui masalah apa yang timbul dan mencoba memecahkan masalah tersebut, analisis proses, analisis kebutuhan data masukan, analisis proses

  

prepocessing, analisis pembobotan TF-IDF, analisis klasifikasi emosi dengan

  metode Multi Class Support Vector Machine, dan pengukuran kinerja klasifikasi dari penggunaan metode Multi Class Support Vector Machine untuk klasifikasi emosi pada lirik lagu Bahasa Indonesia. Selain itu dijelaskan juga analisis kebutuhan non fungsional, analisis kebutuhan fungsional, dan perancangan struktur menu, perancangan antarmuka, perancangan pesan, dan jaringan semantik dari perangkat lunak yang akan dibangun.

  BAB 4 IMPLEMENTASI DAN PENGUJIAN Bab ini berisi tentang implementasi dari analisis dan perancangan yang telah

  dilakukan pada bab sebelumnya. Implementasi yang dilakukan terdiri dari implementasi sistem berupa implementasi perangkat keras, implementasi perangkat lunak, dan implementasi antarmuka. Selain itu dilakukan pengujian terhadap perangkat lunak yang dibangun melalui rencana pengujian, skenario pengujian, serta mengukur kinerja klasifikasi emosi yang dihasilkan. Informasi yang ditampilkan dari implementasi dan pengujian yang dilakukan berupa sebuah kategori emosi dari lirik lagu.

  BAB 5 KESIMPULAN DAN SARAN Bab ini berisi penjelasan mengenai kesimpulan yang didapatkan dari pembahasan

  pada bab-bab sebelumnya, serta saran yang dapat diberikan oleh peneliti untuk penelitian atau pengembangan selanjutnya. Pada bagian kesimpulan berisi tentang apakah dengan penerapan metode Multi Class Support Vector Machine dapat mengklasifikasikan emosi pada lirik lagu Bahasa Indonesia atau tidak. Sedangkan bagian saran berisi tentang hal-hal yang belum bisa terselesaikan pada penelitian yang telah dilakukan, serta hal-hal yang bisa dilakukan untuk pengembangan selanjutnya.

2 BAB 2 LANDASAN TEORI

2.1 Emosi

  Emosi dapat digambarkan sebagai keadaan yang pada umumnya disebabkan oleh suatu kejadian penting sebuah subyek yang meliputi (a) keadaan mental sadar yang dinyatakan dengan kemampuan mengenali, kualitas perasaan dan diarah untuk beberapa subyek, (b) gangguan jasmani pada beberapa organ tubuh, (c) pengenalan ekspresi pada wajah, suara dan isyarat tubuh, (d) kesiapan untuk melakukan tindakan tertentu. Karenanya emosi dalam sosiobiologi adalah kecenderungan mental (conative dan kognitif), keadaan, proses dan model komputasi harus spesifikasi semirip mungkin [15].

  Sejumlah penelitian tentang emosi manusia telah dilakukan sehingga ada kesepakatan tentang emosi dasar [16]:

  1. Takut sebagai ancaman fisik atau sosial untuk diri sendiri.

  2. Marah sebagai ganjalan atau frustasi dari peran atau tujuan yang dirasakan orang lain.

  3. Jijik menggambarkan penghapusan atau jarak dari seseorang, obyek, atau menolak ide untuk diri sendiri dan menghargai peran dan tujuan.

  4. Sedih digambarkan sebagai kegagalan atau kerugian tentang peran dan tujuan.

  

5. Senang digambarkan sebagai berhasil atau bergerak menuju selesainya peran

yang bernilai atau tujuan.

2.2 International Survey On Emotion Antecedents And Reaction (ISEAR)

  ISEAR adalah sebuah data tentang emosi yang selama bertahun-tahun dimulai pada tahun 1990-an, sebuah kelompok besar psikolog di seluruh dunia mengumpulkan data dalam proyek ISEAR, dipimpin oleh Klaus R. Scherer dan Harald Wallbott. Mahasiswa responden, baik psikolog dan non-psikolog, diminta untuk melaporkan situasi di mana mereka mengalami semua tujuh emosi utama (senang, takut, marah, sedih, jijik, malu, dan rasa bersalah). Dalam setiap kasus, pertanyaan-pertanyaan meliputi cara mereka telah mengenali situasi dan bagaimana mereka bereaksi. Data akhir ini memuat laporan tentang tujuh emosi masing- masing sekitar 3.000 responden di 37 negara di lima benua [7].

  Dalam penelitian ini data latih yang digunakan diperoleh dari dataset ISEAR yang berbahasa Inggris kemudian diterjemahkan ke dalam bahasa Indonesia tanpa mengurangi maksud dari kalimat-kalimat dalam ISEAR. Data yang diambil sebanyak 1000 data dengan banyak masing-masing emosi adalah 200 data karena terdapat lima kategori emosi yang akan diklasifikasikan. Lima kategori emosi tersebut adalah senang, sedih, marah, takut dan bersalah.

2.3 Preprocessing

  Preprocessing adalah tahapan untuk mempersiapkan teks menjadi data yang

  akan diolah di tahapan berikutnya. Masukan awal pada proses ini adalah berupa dokumen teks. Teks yang akan dilakukan proses pada umumnya memiliki beberapa karakteristik, diantaranya adalah memiliki dimensi yang tinggi, terdapat noise pada data, dan terdapat struktur teks yang tidak baik. Agar dapat dihasilkan fitur yang baik dan mewakili data dengan baik, perlu dilakukan tahapan preprocessing [17].

  Adapun tahapan preprocessing yang akan dilakukan pada penelitian ini yaitu

case folding, convert negation, tokenizing, stopword removal dan stemming.

Berikut adalah gambaran tahap preprocessing yang dapat dilihat pada Gambar 2.1:

  

Convert Stopword

Case Folding Tokenizing Stemming

Negation Removal

Gambar 2.1 Tahap Preprocessing

  2.3.1 Case Folding Case folding merupakan tahapan proses mengubah semua huruf dalam teks

  dokumen menjadi huruf kecil, serta menghilangkan karakter selain a-z, kecuali karakter pemecah kalimat, seperti spasi, tab, dan newline (lompat baris) [17].

  2.3.2 Convert Negation Convert negation merupakan proses konversi kata-kata negasi yang terdapat

  pada suatu kalimat, karena kata negasi mempunyai pengaruh dalam merubah nilai emosi pada sebuah kalimat [11]. Di dalam klasifikasi teks emosi kata-kata negasi cinta” dan “tidak senang” dapat menempatkan dokumen dalam kelas yang berbeda. Kata- kata negasi tersebut meliputi kata “bukan”, “tidak” dan “tanpa”. Jika terdapat kata negasi maka akan digabungkan dengan kata setelahnya.

  Langkah-langkah pada tahap convert negation adalah sebagai berikut: a. Kata yang digunakan adalah hasil dari case folding.

  b.

  Jika ditemukan data yang mengandung kata-kata negasi maka kata negasi tersebut akan digabungkan dengan kata setelah kata negasi tersebut.

  2.3.3 Tokenizing Tokenizing adalah proses pemotongan string input berdasarkan tiap kata

  yang menyusunnya. Pemecahan kalimat menjadi kata-kata tunggal dilakukan dengan melihat pemisah seperti spasi, tab, dan newline (lompat baris) [17].

  2.3.4 Stopwords Removal

  Kebanyakan bahasa resmi di berbagai negara memiliki kata fungsi dan kata sambung seperti artikel dan preposisi yang hampir selalu muncul pada dokumen teks. Biasanya kata-kata ini tidak memiliki arti yang lebih di dalam memenuhi kebutuhan seorang searcher di dalam mencari informasi. Kata-kata tersebut (misalnya a, an, the on pada bahasa Inggris) disebut sebagai stopwords [19]. Sebuah sistem text retrieval biasanya disertai dengan sebuah stoplist. Stoplist berisi sekumpulan kata yang 'tidak relevan', namun sering sekali muncul dalam sebuah dokumen. Dengan kata lain stoplist berisi sekumpulan stopwords [20].

  Stopwords removal adalah sebuah proses untuk menghilangkan kata yang

  'tidak relevan' pada hasil parsing sebuah dokumen teks dengan cara membandingkannya dengan stoplist yang ada [21]. Tahapan ini bertujuan untuk menghilangkan kata yang dianggap tidak dapat memberikan pengaruh dalam menentukan suatu kategori tertentu dalam suatu dokumen. Proses ini dilakukan karena kata tersebut sering muncul hampir di setiap dokumen sehingga dianggap tidak dapat menjadi pembeda yang baik dalam membedakan kategori yang satu dengan kategori yang lain.

  Setiap kata akan diperiksa apakah masuk ke dalam stoplist atau tidak, jika sebuah kata masuk ke dalam stoplist maka kata tersebut tidak akan diproses lebih lanjut dan kata tersebut akan dihilangkan. Sebaliknya apabila sebuah kata tidak termasuk ke dalam stoplist maka kata tersebut akan masuk ke proses berikutnya.

  Stoplist yang digunakan diambil dari penelitian Fadillah Z. Tala dengan judul A study of Stemming Effects on Information Retrieval in Bahasa Indonesia.

  Jumlah stopword yang terdapat pada penelitian tersebut adalah sebanyak 756 kata [17]. Kata-kata yang termasuk stopword tersebut biasanya berupa kata ganti orang, kata penghubung, pronominal penunjuk, dan lain sebagainya.

2.3.5 Stemming

  Stemming merupakan suatu proses yang terdapat dalam sistem information

retrieval yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke

  kata-kata akarnya (root word) dengan menggunakan aturan-aturan tertentu. Sebagai contoh, kata bersama, kebersamaan, menyamai, akan di-stem ke root word-nya yaitu “sama”. Kata dasar yang digunakan diambil dari situs http://bahtera.org. Bahtera adalah kamus Bahasa Indonesia yang menjadi rujukan sesuai Kamus Besar Bahasa Indonesia, kata dasar yang terdapat di bahtera ini sebanyak 28.526 kata.

  Proses stemming pada teks berbahasa Indonesia berbeda dengan stemming pada teks berbahasa Inggris. Pada teks berbahasa Inggris, proses yang diperlukan hanya proses menghilangkan sufiks. Sedangkan pada teks berbahasa Indonesia, selain sufiks, prefiks, dan konfiks juga dihilangkan.

  Algoritma yang digunakan pada proses ini adalah algoritma Nazief & Adriani. Berdasarkan hasil penelitian [12] menyimpulkan bahwa proses stemming dokumen teks berbahasa Indonesia menggunakan algoritma Porter memiliki prosentase keakuratan (presisi) lebih kecil dibandingkan dengan stemming menggunakan algoritma Nazief & Adriani. Oleh karena itu, pada penelitian ini algoritma stemming yang digunakan adalah algoritma Nazief & Adriani.

  Algoritma yang dibuat oleh Bobby Nazief dan Mirna Adriani ini memiliki tahap-tahap sebagai berikut:

1. Cari kata yang akan distem dalam kamus. Jika ditemukan maka diasumsikan bahwa kata tersebut adalah root word. Maka algoritma berhenti.

  2. Inflection Suffixes (“-lah”, “-kah”, “-ku”, “-mu”, atau “-nya”) dibuang. Jika berupa particles (“-lah”, “-kah”, “-tah” atau “-pun”) maka langkah ini diulangi lagi untuk menghapus Possesive Pronouns (“-ku”, “-mu”, atau “-nya”), jika ada.

  3. Hapus Derivation Suffixes (“-i”, “-an” atau “-kan”). Jika kata ditemukan di kamus, maka algoritma berhenti. Jika tidak maka ke langkah 3a.

  a.

  Jika “-an” telah dihapus dan huruf terakhir dari kata tersebut adalah “-k”, maka “-k” juga ikut dihapus. Jika kata tersebut ditemukan dalam kamus maka algoritma berhenti. Jika tidak ditemukan maka lakukan langkah 3b.

  b.

  Akhiran yang dihapus (“-i”, “-an” atau “-kan”) dikembalikan, lanjut ke langkah 4.

  4. Hapus Derivation Prefix. Jika pada langkah 3 ada sufiks yang dihapus maka pergi ke langkah 4a, jika tidak pergi ke langkah 4b.

  a.

  Periksa tabel kombinasi awalan-akhiran yang tidak diijinkan. Jika ditemukan maka algoritma berhenti, jika tidak pergi ke langkah 4b.

  b.

  For i = 1 to 3, tentukan tipe awalan kemudian hapus awalan. Jika root word belum juga ditemukan lakukan langkah 5, jika sudah maka algoritma berhenti. Catatan: jika awalan kedua sama dengan awalan pertama algoritma berhenti.

  5. Melakukan Recoding.

  6. Jika semua langkah telah selesai tetapi tidak juga berhasil maka kata awal diasumsikan sebagai root word. Proses selesai. Tipe awalan ditentukan melalui langkah-langkah berikut: 1.

  Jika awalannya adalah: “di-”, “ke-”, atau “se-” maka tipe awalannya secara berturut- turut adalah “di-”, “ke-”, atau “se-”.

  2. Jika awalannya adalah “te-”, “me-”, “be-”, atau “pe-” maka dibutuhkan sebuah proses tambahan untuk menentukan tipe awalannya.

  3. Jika dua karakter pertama bukan “di-”, “ke-”, “se-”, “te-”, “be-”, “me-”, atau “pe-” maka berhenti.

  4. Jika tipe awalan adalah “none” maka berhenti. Jika tipe awalan adalah bukan

  “none” maka awalan dapat dilihat pada Tabel 2.2 Hapus awalan jika ditemukan.

Tabel 2.1 Kombinasi Awalan Akhiran yang Tidak Diijinkan

  

Awalan Akhiran yang tidak diijinkan

be- -i di- -an ke- -i, -kan me- -an se- -i, -kan

Tabel 2.2 Cara Menentukan Tipe Awalan Kata yang Diawali dengan “te-”

  Following Characters Tipe Awalan Set 1 Set 2 Set 3 Set 4

  

“-r-” “-r-” - - none

“-r-” vowel - - ter-luluh

“-r-” not (vowel or “-r-”) “-er-” vowel ter

“-r-” not (vowel or “-r-”) “-er-” not vowel ter-

“-r-” not (vowel or “-r-”) not “-er-” - ter

not (vowel or “-r-”) “-er-” vowel - none not (vowel or “-r-”) “-er-” not vowel - te

Tabel 2.3 Jenis Awalan Berdasarkan Tipe Awalannya

  

Tipe Awalan Awalan yang harus dihapus

di- di- ke- ke- se- se- te- te- ter- ter- ter-luluh ter

  Untuk mengatasi keterbatasan pada algoritma di atas, maka ditambahkan aturan- aturan dibawah ini:

1. Aturan untuk reduplikasi.

  • Jika kedua kata yang dihubungkan oleh kata penghubung adalah kata yang sama maka root word adalah bentuk tunggalnya, contoh

  : “buku-buku” root word- nya adalah “buku”.

  • Kata lain, misalnya “bolak-balik”, “berbalas-balasan”, dan “seolah-olah”.

  Untuk mendapatkan root word-nya, kedua kata diartikan secara terpisah. Jika keduanya memiliki root word yang sama maka diubah menjadi bentuk tunggal, contoh: kata “berbalas-balasan”, “berbalas” dan “balasan” memiliki root word yang sama yaitu “balas”, maka root word “berbalas- balasan” adalah “balas”. Sebaliknya, pada kata “bolak-balik”, “bolak” dan

  “balik” memiliki root word yang berbeda, maka root word-nya adalah “bolak-balik” 2. Tambahan bentuk awalan dan akhiran serta aturannya.