Analisis Sentimen Review Barang Berbahasa Indonesia Dengan Metode Support Vector Machine Dan Query Expansion

Vol. 2, No. 9, September 2018, hlm. 2909-2916 http://j-ptiik.ub.ac.id

Analisis Sentimen Review Barang Berbahasa Indonesia Dengan Metode

Support Vector Machine Dan Query Expansion

₁ ₂ ₃ Dimas Joko Haryanto , Lailil Muflikhah , Mochammad Ali Fauzi

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya ₁ ₂ ₃ Email: [email protected], [email protected], [email protected]

Abstrak

Berbelanja secara online sekarang merupakan kegiatan umum yang terjadi pada masyarakat. Berkembangnya jaman membuat seseorang memilih untuk belanja secara online daripada harus melakukan perjalanan ke toko untuk mendapatkan barang yang dibutuhkan. Sebuah r eview barang yang terdapat pada setiap barang di sebuah toko

online dapat berguna untuk melihat bagaimana umpan balik

pembeli sebelumnya melalui sebuah komentar. Komentar yang diberikan terdiri dari komentar positif atau komentar negatif. Untuk mengatasi masalah tersebut maka digunakan metode analisis sentimen komentar pada

review barang berbahasa Indonesia menggunakan metode Support Vector Machine dan

Query Expansion. Dalam penelitian ini menggunakan 400 data komentar yang terbagi menjadi dua yaitu

positif dan negatif. Adapun metode yang digunakan adalah metode Support Vector Machine kerne

Polynomial berderajat dua dengan Query Expansion. Query Expansion digunakan untuk memperluas

kata pada data uji yang memiliki sinonim yang tidak terdapat pada data latih. Hasil pengujian akhir menghasilkan rata-rata akurasi sebesar 96,25% dengan parameter nilai

learning rate = 0,001, nilai

lambda = 0,1, nilai complexity = 0,01 dan iterasi maksimal adalah 50. Berdasarkan hasil pengujian,

diperoleh akurasi metode Support Vector Machine dan Query Expansion sebesar 96,25% dan akurasi menggunakan metode Support Vector Machine tanpa Query Expansion sebesar 94,75%.

Kata kunci: SVM, Query Expansion, Analisis Sentimen, Komentar

Abstract

Shopping an item in online store is a common activity happening to the community now. The rise of time

makes someone chooses to shop online rather than having to travel to the store to get what they need.

Reviews of each items in an online store can be useful to see how the buyer's previous feedback through

a comment. The comments categorized as positive comments or negative comments. Therefore, to

overcome the problem then used sentiment analysis reviews of items using Support Vector Machine and

Query Expansion method. This research uses 400 data comments that is divided into two comment, that

is positive and negative. The method used is Support Vector Macine polynomial kernel with degree two

and Query Expansion. Query Expansion is used to expand a word that has synonyms that are not

contained in the training data. The final test result yields an average of accuracy is 96,25% with

parameter value of learning rate = 0,001, value of lambda = 0,1, value of complexity = 0,01 and

maximum iteration is 50. Accuracy of Support Vector Machine and Query Expansion method is better

than just using Support Vector Machine method which only gets 94,75% of accuracy.

Keywords: SVM, Query Expansion, Sentiment Analysis, Comment

terdapat pada setiap barang di dalam toko online 1.

PENDAHULUAN tersebut berguna untuk melihat bagaimana

umpan balik dari orang-orang yang sebelumnya Kebutuhan masyarakat semakin meningkat telah membeli barang tersebut. Umpan balik seiring dengan mudahnya pembelian barang diberikan oleh pengguna biasanya terbagi atas melalui internet. Pembelian barang sekarang dua macam, yaitu komentar positif atau dapat dilakukan mulai dari rumah, kantor atau komentar negatif. Pengguna dapat bahkan tempat alam bebas tanpa perlu harus mengekspresikan pendapat mereka tentang menemui sang penjual. Review barang yang kualitas, harga, layanan sebuah

website, penjual Fakultas Ilmu Komputer Universitas Brawijaya

2909

online dan kecepatan pengiriman. Pengguna

penelitian tersebut menunjukkan bahwa metode

1000 data sentimen positif dan 1000 data sentimen negatif. Sementara itu, data Twitter berjumlah 1200 data kicauan yang terdiri dari 600 kelas negatif dan positif. Hasil akhir yang didapat pada data

review film yaitu nilai akurasi

antara Support Vector Machine dan Naïve Bayes

Classification memiliki nilai yang sama yaitu

78.55%, sedangkan

K-Nearest Neighbor hanya

mendapat nilai 56.7%. Hasil akhir yang didapat pada data Twitter yaitu nilai akurasi dari Support

Vector Machine lebih baik dari 2 metode yang

lain yaitu sebesar 72%, Naïve Bayesian

Classification sebesar 67.33% dan K-Nearest Neighbor sebesar 56.83%. Kesimpulan pada

Support Vector Machine lebih unggul daripada Naïve Bayesian Classification, sedangkan untuk K-Nearest Neighbor memperoleh hasil jauh

data yaitu data review film dan data Twitter. Data

dibawah Support Vector Machine ataupun Naïve Bayesian Classification (Ipmawati, 2017).

Metode Query Expansion adalah metode membantu mengatasi masalah ketidakcocokan token dengan tambahan term yang relevan. Metode ini telah diterapkan secara luas untuk meningkatkan efisiensi pada

Relevance Back System (Rivas, 2014). Query Expansion

digunakan untuk memperluas kata pada data uji yang tidak terdapat pada data latih. Pada penelitian tentang analisi sentimen pada review aplikasi mobile menggunakan metode Naïve

Bayes

dan

Query Expansion,

peneliti sebelumnya melakukan analisis sentimen pada data review aplikasi mobile. Algoritme yang digunakan adalah

Naïve Bayes dan Query Expansion. Data yang digunakan yaitu 100 data

uji dan 1000 data latih. Penerapan Query

Expansion pada data uji menyebabkan akurasi

review film yang digunakan berjumlah

K-Nearest Neighbor. Pada penelitian tersebut digunakan 2

belanja online sering menggunakan komentar dari pengguna sebelumnya ketika mereka akan melakukan pembelian barang (Chen, 2012). Oleh karena itu, pengelompokan review barang dari konsumen dipengaruhi oleh emosi (sentimen) yang dikelompokkan atau diklasifikasikan untuk menentukan kepolarisasiannya yaitu positif atau negatif (Indriati, 2016).

review aplikasi mobile dengan rata-

Analisis sentimen mempelajari cara pandang, tingkah laku dan perasaan atau emosi seseorang terhadap sebuah individu, masalah, aktifitas, subjek (Basari, 2013). Analisis sentimen digunakan untuk menganalisis

review

sebuah barang dari

website

kemudian mengklasifikasikan komentar tersebut kedalam sentimen positif atau negatif. Teknik klasifikasi yang digunakan pada penelitian-penelitian sebelumnya untuk analisis sentimen adalah

Naïve Bayes, Support Vector Machine, dan K- Nearest Neighbor. Beberapa penelitian

sebelumnya tentang analisis sentimen pada sebuah

review online salah satunya analisis

sentimen pada review aplikasi mobile menggunakan metode neighbor weighted k-

nearest neighbor (NWKNN) (Indriati, 2016),

penelitian tersebut menggunakan NWKNN yang merupakan pengembangan K-Nearest Neighbor dengan menerapkan prinsip pembobotan. Hasil uji dari penelitian tersebut yaitu metode NWKNN mampu melakukan klasifikasi dokumen

rata nilai f-measure terbaik sebesar 0.9 pada saat nilai k=20, sementara pada data tidak seimbang diperoleh bahwa nilai

dan

k=45 menghasilkan rata-

rata nilai f-measure sebesar 0.797. Kedua pengujian tersebut dilakukan pada data latih dan data uji dengan perbandingan 80% dan 20%.

Pada penelitian tentang analisis sentimen tingkat kepuasan pengguna penyedia layanan telekomunikasi seluler Indonesia pada Twitter dengan metode Support Vector Machine dan

Lexicon Based Features, peneliti sebelumnya

melakukan analisis sentimen tingkat kepuasan masyarakat menggunakan data Twitter mengenai penyedia layanan telekomunikasi seluler. Algoritme yang digunakan pada penelitian tersebut adalah Support Vector

Machine Dan Lexicon Based Features dengan

menggunakan kernel polynomial berderajat 2 dengan nilai konstanta learning rate 0.0001 dan iterasi maksimum = 50. Data yang digunakan sebanyak 300 data dengan perbandingan 70% untuk data latih dan 30% untuk data uji. Akurasi yang didapatkan dengan menggunakan metode

Support Vector Machine dan Lexicon Based Features sebesar 79%, sedangkan apabila tidak

menggunakan metode Lexicon Based Features akurasi yang didapatkan sebesar 84% (Rofiqoh, 2017).

Pada penelitan tentang komparasi teknik klasifikasi teks mining pada analisis sentimen, peneliti sebelumnya menggunakan 3 metode sebagai metode perbandingan pada analisis sentimen yaitu Support Vector Machine, Naïve

Bayesian Classification,

akhir yang didapatkan sebesar 98%, sementara akurasi yang didapatkan tanpa menerapkan

Query Expansion hanya 95% (Firmansyah, 2016).

Tabel 1. Fungsi kernel Nama Kernel Fungsi Polynomial

dot product dari data yang sudah

ditransformasikan pada ruang baru. Nilai dot

product dapat dihitung tanpa mengetahui proses

transformasi data Φ. Fungsi kernel memberikan kemudahan dalam proses pembelajaran SVM untuk menentukan support vector (Nugroho, 2003).

Fungsi

kernel dapat dirumuskan pada Persamaan 1.

( . ) = Φ( ). Φ( )

(1)

( ⋅ ) = ( . + 1)

( ) ke ruang vektor yang memiliki dimensi lebih tinggi. Pemetaan ini bertujuan untuk merepresentasikan data pada ruang vektor baru.

Gaussian RBF

( ⋅ ) = exp (− ( ‖ − ‖

2 ))

Sigmoid ( ⋅ ) = tanh⁡( . +

2.4 Metode Sequential Support Vector Machine

Metode sekuensial adalah metode yang dikembangkan oleh Vijayakumar (1999), yang berguna untuk mendapatkan hyperplane. Metode ini dapat memberikan solusi optimal dan

Proses pembelajaran pada SVM saat menemukan support vector hanya bergantung dari

dipisahkan oleh hyperplane secara sempurna. Maka dari itu, diperlukan modifikasi SVM dengan memasukkan fungsi kernel. Konsep dari SVM non-linear adalah mengubah data x yang dipetakan oleh fungsi

Analisis sentimen membantu seorang penjual untuk mengevaluasi pendapat dan tingkah laku dari klien terhadap barang mereka, sehingga penjual tersebut mendapatkan

non-linearly separable, sehingga kedua class tidak dapat

Pada umumnya, masalah yang ada di dunia nyata mempunyai bentuk

linear dengan memasukkan kernel trik pada ruang dimensi tinggi.

menemukan hyperplane terbaik yang berfungsi sebagai pemisah dua buah kelas pada input space (Saifinnuha, 2015). Prinsip dasar dari SVM adalah pengklasifikasi linear, kemudian dikembangkan menjadi pengklasifikasi non-

linier dengan

Metode Support Vector Machine (SVM) adalah metode klasifikasi

2.3 Support Vector Machine

pada data mining, karena data teks memiliki data yang tidak terstruktur sehingga perlu dilakukan beberapa tahap yang pada intinya mengubah data menjadi lebih terstruktur.

review

barang mereka secara langsung dari klien dengan menggunakan media sosial seperti Twitter atau komentar pada sebuah toko online. Oleh karena itu, dibutuhkan analisis sentimen untuk menganalisis pandangan seseorang terhadap sebuah barang sehingga bisa meningkatkan daya guna serta penjualan barang tersebut dengan mengetahui kelemahan barang dari sudut pengguna. Pada penelitian ini, hasil akhir yang akan dihasilkan adalah tingkat akurasi yang dicapai dalam melakukan analisis sentimen dengan menggunakan Support Vector Machine dan Query Expansion.

2. DASAR TEORI

text mining. Fungsi utama dari text mining

akan tetapi kumpulan dari berbagai macam fungsi yang dikombinasikan dan disebut fungsi

Text mining bukanlah sebuah fungsi,

pola yang tersembunyi pada sumber tertentu agar dapat digunakan untuk suatu tujuan (Indriati, 2016). Untuk melakukan analisis pembuat keputusan, maka dibutuhkan data tidak terstruktur yang berjumlah besar dalam bentuk dokumen.

2.2 Text Mining Text mining bertujuan untuk menemukan

Analisis sentimen mempelajari pandangan individu, evaluasi, tingkah laku dan perasaan terhadap orang, individu, masalah, aktivitas dan subjek (Basari, 2013). Tujuan dari sentimen analisis adalah memutuskan sikap atau pendapat dari seseorang terhadap suatu topik atau target. Analisis sentimen dapat digunakan untuk menentukan nilai kesukaan atau ketidaksukaan seseorang terhadap suatu barang. Nilai yang sering digunakan pada sentimen analisis yaitu positif dan negatif. Nilai ini dapat digunakan untuk dijadikan parameter dalam pengambilan keputusan.

2.1 Analisis Sentimen

Categorization, Summarization, Prioritization, Clustering, Information Monitor dan Question & answers (Mustafa, 2009).

Text mining merupakan bagian dari data mining, akan tetapi tahapan proses pada text mining lebih banyak dibanding tahapan proses

meliputi Searching, Information Extraction,

2. Inisialisasi nilai α i

2 (∑ ( ,

term binary dimana token berinilai 1 apabila ada

− ) + ∑ ( ,

=0 =0 )

(6) Analisis sentimen dapat dihitung dengan menggunakan Persamaan 7.

( ) = ∑ ( , ) + =0

(7)

mempercepat proses iterasi daripada menggunakan solusi konvensional. Langkah- langkah dalam melakukan metode sequential sebagai berikut:

dan 0 apabila tidak ada. Proses analisis sentimen akan menentukan data uji yang dimasukkan tergolong positif atau negatif. Pembobotan term

Pada Gambar 1 dilakukan input data latih dan data uji, kemudian dilakukan preprocessing. Pembobotan yang digunakan yaitu pembobotan

pada proses ini akan digunakan untuk analisis sentimen.

Support Vector Machine. Nilai bias yang didapat

JSastrawi. Hasil dari preprocessing tersebut akan dilakukan klasifikasi dengan Sequential

stemming akan menggunakan library

membuat data yang terstruktur dan siap untuk diproses. Data mentah yang digunakan biasanya merupakan data yang tidak terstruktur. Tahapan dalam teknik preprocessing adalah case folding, tokenisasi, normalisasi, filtering dan stemming. Proses

text mining yang digunakan untuk

3 METODOLOGI PENELITIAN

Terdapat beberapa langkah dalam alur sistem ini, langkah awal yaitu memasukkan data latih. Data latih tersebut kemudian dilakukan

)

= −

teknik

Menghitung Persamaan (3), (4), dan (5) untuk memperbarui nilai E dan

1. Melakukan inisialisasi terhadap parameter ya ng akan digunakan yaitu λ (

lambda), γ (learning rate), C

( complexity), ε (epsilon) dan iterasi maksimum.

= 0, kemudian hitung matriks dengan Persamaan 2.

ⅈ = ( (

1 , ) +

2 )

(2) 3.

α.

b dengan Persamaan 6.

= ∑ (3) b.

= min⁡{max[ (1 − ), − ] , − } (4) c.

= + ⁡ (5) 4.

Melakukan langkah 3 hingga iterasi maksimum atau

Max(| δα|) < ε.

Setelah proses diatas selesai, maka akan didapatkan

α dan support vector. Tahap

selanjutnya adalah menghitung nilai bias

preprocessing. Preprocessing adalah tahap awal

2.5 Query Expansion

sinonim, antonim, terjemahan, kata turunan, dan gabungan kata. Hasil yang akan diambil hanya bagian daftar sinonim. Daftar sinonim dari kata tersebut akan disimpan dalam format teks dan digabungkan dengan daftar sinonim dari kata yang lain.

binary pada data uji akan mengalami tambahan

Metode

Gambar 1 Diagram Alir Sistem

API Kateglo.

dengan bantuan data sinonim yang telah dikumpulkan dari

Query Expansion, dimana Query Expansion akan memperluas pencarian token

proses yaitu

membantu mengatasi masalah ketidakcocokan token dengan tambahan term yang relevan. Metode ini telah diterapkan secara luas untuk meningkatkan efisiensi sistem temu kembali (Rivas, 2014). Query Expansion menggambarkan seperangkat teknik untuk memodifikasi kueri agar memenuhi informasi yang dibutuhkan (Selberg, 1997).

JSON kata tersebut yang memuat definisi,

Query Expansion

digunakan untuk memperluas kata yang tidak terdapat pada data latih, sehingga kata di data uji yang tidak muncul di data latih dapat dilakukan perluasan kata dengan menggunakan data sinonim. Pembentukan data sinonim yang akan digunakan pada

Query Expansion dilakukan secara online

dengan menggunakan API kateglo. Kateglo adalah aplikasi terbuka yang menyediakan kamus, tesaurus dan glosarium bahasa Indonesia. Sistem akan melakukan akses terhadap Kateglo dengan menggunakan

API

Kateglo, kemudian hasil yang didapatkan berupa

Query Expansion adalah metode Data yang digunakan berjumlah 400 data, dimana 200 data adalah komentar positif dan 200 data adalah komentar negatif. Data komentar tersebut didapatkan dari situs

tokopedia.com

lambda dilakukan

yang semakin kecil akan menyebabkan nilai

Max(| δα|) bernilai < ε. Apabila nilai Max(|δα|)

berada dibawah epsilon, maka iterasi sudah berhenti karena nilai

δα telah konvergen.

Paramater γ (learning rate) yang diinisialisasi dengan tepat dapat meningkatkan akurasi dan mempercepat proses learning.

4.2 Pengujian Nilai Parameter λ (lambda)

Pengujian nilai parameter

untuk mendapatkan nilai lambda yang menghasilkan akurasi terbaik. Pengujian ini akan menggunakan

perhitungan kondisi berhenti iterasi. Nilai

kernel polynomial berderajat

dua, nilai C (complexity) = 0, 01, ε (epsilon) =

0,00001 dan iterasi = 50, sedangkan nilai parameter learning rate didapat dari pengujian sebelumnya yaitu 0,001. Nilai lambda yang akan diujikan yaitu 0,1, 0,3, 0,5, 0,7, 0,9, 1, 2, 3, dan

0,00% 20,00% 40,00% 60,00% 80,00% 100,00%

120,00% Aku ra si

Learning Rate Learning Rate

Gambar 3 Preprocessing

δα

δα, dimana δα digunakan untuk

kemudian disalin ke sebuah file .txt. Apabila nilai hasil perhitungan analisis sentimen bernilai lebih dari 0, maka data uji tersebut akan digolongkan menjadi komentar positif, jika nilai hasil perhitungan analisis sentimen bernilai kurang dari 0, maka data uji tersebut akan digolongan menjadi komentar negatif.

4 PENGUJIAN DAN ANALISIS

sebanyak 10 kali dengan menggunakan

Pada penelitian ini akan dilakukan pengujian dan anilisis terhadap hasil dari analisis sentimen review barang berbahasa Indonesia menggunakan metode

Support Vector Machine

dan Query Expansion. Pengujian yang dilakukan pada penelitian ini yaitu pengujian terhadap nilai parameter

γ (learning rate), λ (lambda), C

(complexity),

ε (epsilon) dan iterasi maksimal, serta pengujian perbandingan analisis sentimen dengan Query Expansion dan tanpa Query

Expansion. Setiap pengujian dilakukan

10-fold cross validation

perhitungan

rate)

Pengujian nilai parameter γ (learning rate) dilakukan untuk melihat nilai learning rate mana yang terbaik. Pengujian dilakukan pada nilai

Gambar 2 Analisis nilai parameter learning rate learning rate = 0,0001, 0,001, 0,01, 0,1, 1, 10, 20.

Kernel yang digunakan yaitu polynomial berderajat dua, λ (lambda) = 0,5, C (complexity)

= 0, 01, ε (epsilon) = 0,00001 dan iterasi = 50. Gambar 3 menunjukkan hasil pengujian parameter learning rate.

Berdasarkan Gambar 3 didapatkan bahwa pengaruh parameter γ (learning rate) pada proses

training menghasilkan akurasi terbaik

pada nilai γ (learning rate) sebesar 0.001 dan pengujian menggunakan nilai γ (learning rate) = 0.1 membuat akurasi yang didapatkan mulai konvergen. Penurunan akurasi terjadi pada saat nilai γ (learning rate) terlalu besar. Hal ini akan berpengaruh terhadap kecepatan proses

learning. Nilai learning rate digunakan untuk

4.1 Pengujian Nilai Parameter γ (learning

yang didapatkan akan berpengaruh terhadap nilai bias b dan nilai bias b akan berpengaruh pada saat proses klasifikasi dokumen.

120,00% 0,1 0,3 0,5 0,7 0,9 1

4.4 Pengujian Nilai Parameter ε (epsilon)

Pengujian nilai parameter ε (epsilon) dilakukan untuk mendapatkan nilai

ε (epsilon) yang menghasilkan akurasi terbaik. Nilai ε

(epsilon) yang akan diujikan yaitu 0,00001,

0,0001, 0,001, 0,01, 0,1, dan 1. Parameter yang akan digunakan yaitu γ (learning rate) = 0,001,

λ (lambda) = 0,1, C (complexity) = 0,01 dan iterasi = 50.

Gambar 6 Analisis nilai parameter epsilon 0,00% 20,00%

40,00% 60,00% 80,00% 100,00%

Berdasarkan Gambar 4 didapatkan bahwa parameter λ (lambda) berpengaruh terhadap hasil akurasi. Hal ini dapat terlihat pada saat λ ( lambda) = 0,1 sampai dengan 0,5 menghasilkan akurasi cukup tinggi, kemudian pada saat nilai λ ( lambda) = 0,7 mulai terjadi penurunan akurasi hing ga λ (lambda) = 2. Kemudian akurasi mengalami peningkatan pada saat λ (lambda) =

ra si Lambda

Uji Lambda 0,00% 20,00%

40,00% 60,00% 80,00% 100,00%

120,00% Aku ra si

4 Aku

C Uji C

0,00% 20,00% 40,00% 60,00% 80,00% 100,00%

120,00% Aku ra si

Epsilon Uji Epsilon

Gambar 4 Analisis nilai parameter lambda

pencarian

λ (lambda) = 0,1, ε (epsilon) = 0,00001 dan iterasi = 50.

3. Nilai λ (lambda) = 0,1 merupakan hasil terbaik dengan akurasi sebesar 96%. Nilai λ (lambda) yang terlalu besar akan mengakibatkan akurasi menjadi rendah. Hal ini terbukti pada saat pengujian menggunakan λ (lambda) = 50 mengakibatkan akurasi yang didapatkan hanya 63,

75%. Nilai λ (lambda) yang terlalu besar akan berpengaruh pada saat perhitungan matriks

Hessian. Perhitungan matriks Hessian akan

menjadi lebih lambat karena nil ai λ (lambda) yang besar akan mengakibatkan kecepatan untuk mencapai konvergensi menjadi lebih lambat dan ketidakstabilan pada proses learning (Vijayakumar, 1999).

Pengujian nilai parameter C (complexity) dilakukan untuk mendapatkan nilai C

(complexity) yang menghasilkan akurasi terbaik.

Nilai complexity yang akan diujikan yaitu 0,0001, 0,001, 0,01, 0,1, 1, 10, dan 20. Parameter yang akan digunakan yaitu

γ (learning rate) = 0,001,

Gambar 5 Analisis nilai parameter C

δα juga berpengaruh terhadap

Berdasarkan Gambar 5 didapatkan bahwa pengaruh parameter C (

complexity) pada proses training berpengaruh terhadap akurasi. Nilai C

( complexity) yang terlalu kecil yaitu 0,0001 menyebabkan akurasi yang didapatkan rendah sebesar 59,25% dan mulai meningkat saat nilai C ( complexity) semakin besar. Akurasi terbaik didapatkan saat nilai C (

complexity) = 0,01

sebesar 96,00%. Hal ini disebabkan karena pengaruh nilai C ( complexity) pada perhitungan

δα. δα digunakan untuk mencari nilai α terbaru

yang akan ditambahkan dengan nilai

sebelumnya. Nilai

support vector. Data support vector

4.3 Pengujian Nilai Parameter C (complexity)

Berdasarkan Gambar 6 didapatkan bahwa nilai ε (epsilon) berpengaruh pada hasil akurasi yang didapatkan. Akurasi terbaik didapatkan saat nilai

mengakibatkan akurasi rendah karena terjadi konvergensi dini yang berarti iterasi akan berhenti pada saat nilai

Berdasarkan Gambar 8, didapatkan bahwa terjadi peningkatan akurasi antara metode

Support Vector Machine yang menggunakan Query Expansion dibandingkan dengan metode Support Vector Machine yang tidak

menggunakan Query Expansion sebesar 1,5%. Pada penggunaan metode Support Vector

Machine dan Query Expansion akurasi yang

didapatkan sebesar 96,25%, sedangkan pada saat menggunakan metode Support Vector Machine tanpa Query Expansion akurasi yang didapatkan sebesar 94,75%. Hal ini dikarenakan pada pengujian dengan menggunakan Support Vector

α yang didapatkan belum optimal.

ε (epsilon) terlalu besar akan

ε (epsilon) = 0,0001 sebesar 96,25%, kemudian menurun pada saat nilai ε (epsilon) =

tetapi, jika nilai

α yang terjadi tidak terlalu signifikan. Akan

nilai

α. Apabila max(|δα) < ε, maka perubahan

nilai

(epsilon) digunakan untuk melihat perubahan

0,001 sampai dengan 1. Hal ini karena ε

4.6 Perbandigan Akurasi Query Expansion

4.5 Pengujian Nilai Parameter Iterasi

Vector Machine tanpa menggunakan Query Expansion, hasil yang didapatkan lebih rendah

Metode Perbandingan Akurasi Metode

Aku ra si

SVM + Query Expansion SVM

94,00% 94,50% 95,00% 95,50% 96,00% 96,50%

Iterasi Uji Iterasi

50 75 100 250 500 Aku ras i

Gambar 8 Perbandingan akurasi SVM+QE dan SVM 95,80% 95,90% 96,00% 96,10% 96,20% 96,30%

Expansion tetap dapat digunakan apabila sistem tersebut tidak terhubung pada jaringan internet.

menggunakan Query Expansion. Perbedaan akurasi yang kecil disebabkan karena data sinonim yang digunakan adalah data dalam bentuk file teks, sehingga metode Query

Support Vector Machine dengan

karena terdapat beberapa kata pada data uji yang memiliki makna hampir mirip pada data latih, tetapi tidak dapat dianggap muncul karena penulisan kata yang berbeda, sehingga hasil akurasi menjadi lebih rendah dibandingkan metode

data uji dengan menggunakan data sinonim kata yang telah dikumpulkan sebelumnya. Token yang memiliki makna mirip berdasarkan pada data sinonim akan bernilai 1, sehingga token dianggap muncul pada dokumen latih tersebut. Pada pengujian dengan menggunakan Support

yang konvergen dengan dilihat dari perubahan nilai

Machine dan Query Expansion, metode Query Expansion memperluas kata yang terdapat pada

Pengujian nilai parameter iterasi dilakukan untuk mendapatkan nilai iterasi yang menghasilkan akurasi terbaik. Pada pengujian ini, parameter yang akan digunakan adalah parameter dari pengujian sebelumnya yaitu

(learning rate) = 0,001,

λ (lambda) = 0,1, ε (epsilon) = 0,0001, dan C (complexity) = 0,01. Kernel yang akan digunakan yaitu kernel berderajat dua.

Berdasarkan Gambar 7 didapatkan bahwa pengaruh parameter iterasi pada proses

learning menghasilkan akurasi yang cenderung

Gambar 7 Analisis nilai parameter iterasi

α yang bisa dijadikan support vektor.

stabil. Akurasi terbaik didapatkan pada saat iterasi bernilai 50 sebesar 96,25%. Akurasi yang tinggi disebabkan karena iterasi maksimal memberikan waktu untuk dapat mencapai nilai

α yang didapat belum mencapai konvergen,

nilai

α dan akurasi yang rendah terjadi karena

sehingga nilai α yang didapatkan belum optimal. Nilai iterasi yang kecil akan menyebabkan semakin sedikit nilai

5 KESIMPULAN

Ipmawati, J., Kusrini, Luthfi, E.T. 2017.

Department of Computer Science and Engineering University of Washington. Seattle

Universitas Brawijaya. Selberg, E.W., 1997. Information Retrieval Advances using Relevance Feedback.

Analisis pada Twitter Berbahasa Indonesia untuk Mendapatkan Rating Program Televisi Menggunakan Metode Support Vecotr Machine. S1.

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer. Malang. Saifinnuha, A.Z., 2015. Penerapan Sentimen

Analisis Sentimen Tingkat Kepuasan Pengguna Penyedia Layanan Telekomunikasi Seluler Indonesia Pada Twitter Dengan Metode Support Vector Machine dan Lexicon Based Features.

Rofiqoh, U., Perdana, S.P., Fauzi, M.A., 2017.

Study of Query Expansion Techniques and Their Application in the Biomedical Information Retrieval. Hindawi Publishing Corporation the Scientific World Journal. Spanyol.

Rivas, A.R., Iglesias, E.I., Borrajo, L., 2014.

2003. Application of Support Vector Machine in Bioinformatics. Proceeding of Indonesian Scientific Meeting in Central Japan. Japan.

International Journal of Multimedia and Ubiquitous Engineering. Pakistan. Nugroho, A.S., Witarto, A.B., Handoko, D.,

Knowledge Discovery using Text Mining: A Programmable Implementation on Information Extraction and Categorization.

Indonesian Journal on Networking and Security. Yogyakarta. Mustafa, A., Akbar, A., Sultas, A., 2009.

Komparasi Teknik Klasifikasi Teks Mining Pada Analisis Sentimen.

Indriati, Ridok, A. 2016. Sentiment analysis For Review Mobile Applications Using Neighbor Method Weighted K-Nearest Neighbor (NWKNN). Journal of Environmental Engineering & Sustainable Technology. Malang.

Metode Support Vector Machine yang diterapkan yaitu Sequential Training SVM dengan tambahan metode Query Expansion dapat diterapkan pada analisis sentimen review barang berbahasa Indonesia. Data yang digunakan yaitu 200 data komentar positif dan 200 data komentar negatif. Data tersebut akan dilakukan preprocessing yaitu case folding, tokenisasi, normalisasi, filtering, dan stemming. Pembobotan token yang digunakan yaitu term

FILKOM Universitas Brawijaya. Malang

Firmansyah, R.F.N., Fauzi, M.A., Afirianto, T., 2016. Sentiment Analysis pada Review Aplikasi Mobile Menggunakan Metode Naïve Bayes dan Query Expansion.

Chen, H., 2012. The Impact of Comments and Recommendation System on Online Shopper Buying Behaviour. Journal of Networks. Beijing.

Basari, A.S.H., Hussin, B., Ananta, I.G.P., Zeniarja, J. 2013. Opinion Mining of Movie Review using Hybrid Method of Support Vector Machine and Particle Swarm Optimization. Procedia Engineering 53 (2013) 453 – 462. Malaysia.

6 DAFTAR PUSTAKA

sedangkan akurasi yang diperoleh dengan menggunakan metode Support Vector Machine tanpa Query Expansion sebesar 94.75%.

Machine dan Query Expansion sebesar 96.25%,

, nilai λ (lambda) = 0.1, nilai C (complexity) = 0.01, nilai ε (epsilon) = 0.0001, dan nilai iterasi = 50. Akurasi yang diperoleh dengan menggunakan metode Support Vector

γ (learning rate) = 0.001

barang berbahasa Indonesia dengan menggunakan daftar sinonim kata. Parameter terbaik didapatkan pada nilai

review

yang lebih bagus dalam klasifikasi

Query Expansion digunakan untuk mendapatkan hasil

binary. Query Expansion digunakan pada saat perhitungan bobot pada data uji.

Vijayakumar, S., Wu, S., 1999. Sequential Support Vector Classifiers and Regression. Processing International Conference on Soft Computing. Jepang.

Analisis Sentimen Review Barang Berbahasa Indonesia Dengan Metode Support Vector Machine Dan Query Expansion

2. DASAR TEORI

2. Inisialisasi nilai α i

2.5 Query Expansion

4 PENGUJIAN DAN ANALISIS

4.1 Pengujian Nilai Parameter γ (learning

4 Aku

4.3 Pengujian Nilai Parameter C (complexity)

4.5 Pengujian Nilai Parameter Iterasi

Dokumen yang terkait

Analisis Perbandingan Kinerja Algoritme Fair Share Scheduling Dengan Capacity Scheduling Terhadap Pengiriman Job Pada Hadoop Cluster Multinode

Implementasi Algoritme Extreme Learning Machine (ELM) untuk Prediksi Beban Pemanasan dan Pendinginan Bangunan

Implementasi Metode Bayesian Network Untuk Diagnosis Penyakit Kambing (Studi Kasus : UPTD Pembibitan Ternak dan Hijauan Makanan Ternak Singosari Malang)

Analisis Sentimen Kurikulum 2013 pada Twitter menggunakan Ensemble Feature dan Metode K-Nearest Neighbor

Implementasi Metode Naïve Bayes-Certainty Factor Untuk Identifikasi Penyakit Kanker Pada Sistem Reproduksi Wanita

Segmentasi Pelanggan Menggunakan Metode K-Means Clustering Berdasarkan Model RFM Pada Klinik Kecantikan (Studi Kasus : Belle Crown Malang)

Penentuan Durasi Nyala Lampu Lalu Lintas Berdasarkan Panjang Antrian Kendaraan Menggunakan Metode Backpropagation

Analisis Kualitas Layanan Website Althea Indonesia Terhadap Kepuasan dan Loyalitas Pelanggan Menggunakan E-S-Qual dan E-RecS-Qual

Klasifikasi Jenis Audio Berdasarkan Kondisi Psikologi Menggunakan Kombinasi Algoritme Self Organizing Maps dan Learning Vector Quantization

Prediksi Jumlah Kendaraan Bermotor di Indonesia Menggunakan Metode Average-Based Fuzzy Time Series Models

Dukungan

Links

Analisis Sentimen Review Barang Berbahasa Indonesia Dengan Metode Support Vector Machine Dan Query Expansion

2. DASAR TEORI

2. Inisialisasi nilai α i

2.5 Query Expansion

4 PENGUJIAN DAN ANALISIS

4.1 Pengujian Nilai Parameter γ (learning

4 Aku

4.3 Pengujian Nilai Parameter C (complexity)

4.5 Pengujian Nilai Parameter Iterasi

Dokumen yang terkait

Analisis Perbandingan Kinerja Algoritme Fair Share Scheduling Dengan Capacity Scheduling Terhadap Pengiriman Job Pada Hadoop Cluster Multinode

Implementasi Algoritme Extreme Learning Machine (ELM) untuk Prediksi Beban Pemanasan dan Pendinginan Bangunan

Implementasi Metode Bayesian Network Untuk Diagnosis Penyakit Kambing (Studi Kasus : UPTD Pembibitan Ternak dan Hijauan Makanan Ternak Singosari Malang)

Analisis Sentimen Kurikulum 2013 pada Twitter menggunakan Ensemble Feature dan Metode K-Nearest Neighbor

Implementasi Metode Naïve Bayes-Certainty Factor Untuk Identifikasi Penyakit Kanker Pada Sistem Reproduksi Wanita

Segmentasi Pelanggan Menggunakan Metode K-Means Clustering Berdasarkan Model RFM Pada Klinik Kecantikan (Studi Kasus : Belle Crown Malang)

Penentuan Durasi Nyala Lampu Lalu Lintas Berdasarkan Panjang Antrian Kendaraan Menggunakan Metode Backpropagation

Analisis Kualitas Layanan Website Althea Indonesia Terhadap Kepuasan dan Loyalitas Pelanggan Menggunakan E-S-Qual dan E-RecS-Qual

Klasifikasi Jenis Audio Berdasarkan Kondisi Psikologi Menggunakan Kombinasi Algoritme Self Organizing Maps dan Learning Vector Quantization

Prediksi Jumlah Kendaraan Bermotor di Indonesia Menggunakan Metode Average-Based Fuzzy Time Series Models

Dokumen yang Anda mencari sudah siap untuk unduhkan