Implementasi Metode Backpropagation Neural Network berbasis Lexicon Based Features dan Bag of Words Untuk Identifikasi Ujaran Kebencian Pada Twitter

Vol. 2, No. 10, Oktober 2018, hlm. 3182-3191 http://j-ptiik.ub.ac.id

Implementasi Metode Backpropagation Neural Network berbasis Lexicon

Based Features dan Bag of Words Untuk Identifikasi Ujaran Kebencian

₁ Pada Twitter ₂ ₃ Muhammad Mishbahul Munir , Mochammad Ali Fauzi , Rizal Setya Perdana

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya ₁ ₂ ₃ Email: [email protected], [email protected], [email protected]

Abstrak

Ujaran kebencian adalah bahasa yang mengekspresikan suatu kebencian terhadap suatu kelompok atau individu yang bermaksud untuk menghina atau mempermalukan dan medianya bisa terdapat dimana saja, salah satunya Twitter. Twitter merupakan media sosial yang memungkinkan pengguna untuk mengutarakan perasaan dan opini melalui tweet, termasuk tweet yang mengandung ujaran kebencian. Data dokumen atau tweet berasal dari penelitian yang terdahulu tentang ujaran kebencian. Metode yang digunakan dalam mengolah data dokumen tersebut adalah Backpropagation Neural Network dengan pembaruan fitur menggunakan Lexicon Based Features yang dikombinasikan dengan Bag of Words. Pada penelitian ini menggunakan data sebanyak 500 data yang dibagi menjadi data latih sebanyak 400 data dan data uji sebanyak 100 data. Dari hasil pengujian evaluasi, ketika menggunakan Lexicon Based

Features nilai rata-rata f-measure sebesar 0%, lebih buruk dibandingkan dengan menggunakan Bag of

Words yang nilai rata-rata f-measure sebesar 76,638%, sedangkan ketika Lexicon Based Features

dikombinasikan dengan Bag of Words mendapat nilai rata-rata terbaik diantara fitur sebelumnya dengan

f-measure sebesar 78,081%. Dan hasil perbandingan metode Backpropagation Neural Network berbasis

Lexicon Based Features dan Bag of Words tidak lebih baik dibandingkan dengan Random Forest

Decision Tree menggunakan n-gram fitur pada penelitian sebelumnya.

Kata kunci: ujaran kebencian, twitter, bag of words, lexicon based features, backpropagation neural network

Abstract

Hate speech is a language that expresses a hatred of a group or individual who intends to insult or

humiliate and the media can be found anywhere, one of them Twitter. Twitter is a social media that

allows users to express feelings and opinions through tweets, including tweets that contain hate speech.

Document or tweet data comes from previous research on hate speech. The method used in processing

the document data is Backpropagation Neural Network with feature updates using Lexicon Based

Features combined with Bag of Words. In this study using data as much as 500 data is divided into

training data as much as 400 data and test data as much as 100 data. From the evaluation test results,

when using Lexicon Based Features, the average value of f-measure is 0%, worse than using the Bag of

Words with an average f-measure of 76.638%, while when Lexicon Based Features is combined with

the Bag of Words got the best average score among the previous features with a f-measure of 78.081%.

And the result Backpropagation Neural Network using Lexicon Based Features combined with Bag of

Words is not better than Random Forest Decision Tree using n-gram from previous research.

Keywords: hate speech, twitter, bag of words, lexicon based features, backpropagation neural network

kelompok (Davidson, et al., 2017). Saat ini 1. kebebasan berbicara sudah sangat luas sampai

PENDAHULUAN

mengarah ke ujaran kebencian, apalagi dalam Ujaran kebencian adalah bahasa yang dunia maya seperti media sosial dimana digunakan untuk mengekspresikan kebencian siapapun bisa memberikan pernyataan secara terhadap kelompok yang menjadi sasaran atau bebas tanpa ada batasan. Berdasarkan data dimaksudkan untuk menghina,

Badan Reserse Kriminal Kepolisian Negara mempermalukan, atau untuk menghina anggota

Fakultas Ilmu Komputer Universitas Brawijaya

3182

Republik Indonesia (Bareskrim Polri) pada 2015 kejahatan siber berupa ujaran kebencian mencapai 143 kejadian, namun mengalami peningkatan menjadi 199 kejadian pada 2016 (Direktorat Tindak Pidana Siber Bareskrim, 2016). Kejadian yang ada pada data Bareskrim merupakan data yang masuk ke tingkat pidana saja, tentu masih banyak ujaran kebencian yang ada diberbagai macam media sosial.

Network (BPNN) dengan fitur yang dipilih

memiliki pengaruh yang besar dengan precision 91,76%, recall 80,07%, F ^{1 score sebesar} 86,08%, dan accuracy 84,96%. Dalam penelitian lain (George & Joseph, 2014) tentang klasifikasi teks oleh Augmenting Bag of Words (BoW)

Representation dengan Co-occurrence Feature

menunjukan bahwa antara BoW dan BoW+occurrence lebih unggul sedikit BoW+occurrence. Sedangkan pada penelitian (Sun, et al., 2015) tentang pelabelan konseptual pada Bag of Words, menggunakan Conceptual

Labeling (CL) hasil penelitiannya diketahui

bahwa solusi yang didapat efektif dalam merepresentasikan semantic bag of words.

Oleh karena itu, dalam penelitian ini akan menggunakan metode Backpropagation Neural

adalah Lexicon Based Features dan Bag of

teknik Machine Learning untuk analisis sentimen pada Microblog. Dalam penelitian tersebut, fiturnya adalah twitter specific features,

Words untuk identifikasi ujaran kebencian,

dilihat dari penelitian (Siddiqua, Ahsan, & Chy, 2016), (George & Joseph, 2014), dan (Sun, et al., 2015) kedua fitur ini mempunyai peran yang penting. Diharapkan penelitian ini dapat mencegah segala jenis ujaran kebencian dalam media sosial yang bisa mengurangi aksi kekerasan dan bentuk kejahatan lainnya.

2. METODE USULAN

Pada penelitian ini tahapan proses yang dilakukan antara lain adalah preprocessing, estraksi fitur dengan bag of words dan lexicon

based features , kemudian dilakukan proses

klasifikasi atau identifikasi dengan

backpropagation neural network . Dalam preprocessing sendiri memiliki tahapan, yaitu cleaning , case folding, tokenizing, filtering, stemming serta pengurutan ascending. Setelah

textual features , parts-of-speech (POS) features, lexicon based features , and bag-of-words (BoW) feature dengan fitur lexicon based features

Classifier dengan Ensemble of Feature Sets dan

Pertumbuhan media sosial dan layanan web

, Bayesian Logistic Regression, Random

microblogging seperti Twitter, memungkinkan

untuk menganalisis tweet pengguna hampir real-

time dapat dilakukan. Melalui tweet ini sumber

data yang diperoleh bisa dianalisis, mengingat pengguna lebih cenderung mengekspresikan tingkat emosi terhadap setiap peristiwa ke sebuah postingan atau tweet (Burnap & Williams, 2014). Dengan analisis ini maka akan bisa diidentifikasi tweet mana saja yang mengandung ujaran kebencian dan dalam tweet ini sering didasari oleh motif-motif tertentu. Berbagai motif yang didasari antara lain motif agama, politik, sosial, dan ekonomi serta SARA bisa menjadikan pemicu munculnya ujaran kebencian yang bisa menyebabkan potensi- potensi yang mengarah ke kerusuhan. Identifikasi ujaran kebencian merupakan sarana untuk mencegah tindakan kerusuhan yang bisa memecah belah persatuan bangsa khususnya Indonesia.

Pada permasalahan ujaran kebencian telah dilakukan penelitian untuk mengumpulkan data dalam Bahasa Indonesia (Alfina, et al., 2017). Penelitian tersebut mengumpulkan data dari Twitter dengan tweet yang berhubungan dengan Pemilihan Kepala Daerah (Pilkada) DKI Jakarta 2017. Metode yang digunakan adalah Naïve

Bayes

Forest Decision Tree , dan Support Vector Machine dengan fitur n-gram dan negative sentiment . Hasil dari penelitian bahwa metode Random Forest Decision Tree menggunakan fitur n-gram mendapatkan F-measure tertinggi dibanding metode lainnya dengan 93,5%.

Pada penelitian sebelumnya oleh (Siddiqua, et al., 2016) yang mengombinasikan Rule-based

Dalam identifikasi ujaran kebencian ada beberapa metode yang telah digunakan. Metode pertama Logistic Regression with L2

Regularization dalam mendeteksi ujaran

kebencian dan masalahnya terhadap offensive

language menghasilkan akurasi precision 0,91, recall 0,90, sedangkan 40% salah dalam hasil

klasifikasi (Davidson, et al., 2017). Metode kedua Convolutional Neural Network (CNN) dalam mengklasifikasikan ujaran kebencian memiliki banyak model fitur tapi F-score-nya hanya 78,3% (Gambäck & Sikdar, 2017). Metode selanjutnya Backpropagation Neural

Network (BPNN) yang digunakan untuk filter spam email memiliki tingkat akurasi yang tinggi

dimana precision 98,42%, dan recall-nya 93,5% (Tuteja & Bogiri, 2016).

melalui proses preprocessing maka akan masuk ke tahap ekstraksi fitur. Ekstraksi pertama adalah

bag of words dimana hasil dari preprocessing

tweet dari mention, hashtag, link dan karakter lainnya (kecuali emoticon).

atau Backpropagation adalah pelatihan terawasi dengan menggunakan banyak lapisan untuk mengubah bobot-bobot yang terhubung dengan neuron-neuron yang ada pada lapisan tersembunyi. Metode Backpropagation merupakan kesalahan keluaran untuk mengubah nilai bobot-bobotnya secara mundur (backward). Tapi sebelum mendapatkan kesalahan ini, tahap perambahan maju harus dikerjakan terlebih dahulu (forward

2.3 Backpropagation Neural Network (BPNN) Backpropagation Neural Network (BPNN)

bersentiment) dan menghitung frekuensi kemunculannya pada dokumen teks. Sentimen dalam penelitian ini yang digunakan adalah ujaran kebencian atau bukan ujaran kebencian.

dictionaries (data yang berisi kata-kata

metode yang digunakan untuk proses analisis sentimen, dimana prosesnya menggunakan suatu leksikal atau sumber bahasa sebagai kamus. Prinsip kerja dari metode ini adalah dengan mencocokan kata yang berada di sentiment

2.2 Lexicon Based Features (LBF) Lexicon Based Features (LBF) adalah

6. Sorting Ascending, digunakan untuk mengurutkan hasil preprocessing sesuai dengan urutan kecil ke besar atau A-Z.

5. Stemming, tahapan yang memiliki tujuan untuk mengembalikan sebuah kata menjadi kata dasar yang menyusun kata tersebut, pengubahan ini sesuai dengan algoritme yang digunakan.

4. Filtering, tahapan untuk menghapus kata- kata yang tidak memiliki makna yang berasal dari proses tokenizing.

3. Tokenizing, tahap untuk melakukan pemisahan kalimat atau dokumen mejadi kata-kata yang menyusun kalimat tersebut.

2. Case Folding, tahapan yang bertujuan untuk merubah semua huruf yang ada menjadi huruf kecil atau lowercase.

Cleaning, bertujuan untuk membersihkan

akan menjadi fitur masukan, kemudian akan dicocokan terhadap masing-masing dokumen atau tweet dalam data latih apakah kata tersebut ada atau tidak. Yang kedua adalah lexicon based

tahapan berdasarkan (Triawati, 2009) beserta penjelasannya yang telah dimodifikasi adalah sebagai berikut: 1.

preprocessing sendiri mempunyai tahapan-

mempersiapkan teks sebelum diproses lebih lanjut, dimana tahapannya akan menyesuaikan dengan proses lanjut yang akan digunakan. Dalam preprocessing, teks yang ada memiliki struktur tersendiri, dan kemudian harus dipisahkan sesuai dengan tingkatannya. Tingkatan dalam teks atau dokumen ini meliputi bab, sub-bab, paragraf, kalimat dan terakhir akan menjadi kata atau token penyusun kalimat. Selain memisahkan strukturnya juga terdapat proses untuk menghapus karakter atau huruf yang dinilai tidak bermaksa seperti digit angka, huruf kapital, atau karakter-karakter lainnya (Feldman & Sanger, 2007). Dalam

Preprocessing adalah tahapan untuk

Gambar 1. Diagram Alir Sistem

Dalam penelitian ini data yang digunakan berasal dari penelitian sebelumnya tentang ujaran kebencian (Alfina, et al., 2017). Dengan rincian data latih 400 data dan data uji 100 data, dengan kelas ujaran kebencian dan bukan ujaran kebencian masing-masing kelas berjumlah setengah dari data latih dan uji.

tahapan proses pelatihan terhadap data latih dan proses pengujian terhadap data uji. Tahapan alur proses sistem dapat ditunjukkan pada Gambar 1.

backpropagation neural network dengan

sama seperti pada bag of words. Kemudian setelah data input didapatkan dari ekstraksi fitur maka kemudian akan dilakukan proses klasifikasi atau identifikasi dengan

emoticon ) kemudian dicocokan dengan data latih

empat (kata positif, negatif, netral, dan

features dimana fitur yang digunakan berjumlah

2.1 Preprocessing

propagation ) (Haryati, et al., 2016). Metode 8.

Jika iterasi atau target MSE sudah tercapai,

Backpropagation ini merupakan metode yang maka akan menyimpan bobot yang

memaksimalkan hasil akhir melalui perubahan digunakan untuk proses pengujian.

bobot lewat kesalahan keluaran yang terjadi atau meminimalkan kesalahan yang terjadi. Tahapan

3. HASIL DAN PEMBAHASAN

dalam metode BPNN ditunjukkan pada Gambar

3.1 Pengujian Pengaruh Max Epoch 2.

Pada proses pengujian pertama dilakukan untuk mengetahui pengaruh maximum epoch terhadap hasil evaluasi sistem yang telah diimplementasikan. Dalam pengujian nilai max yang dipilih adalah 50, 100, 150, 200, 250,

epoch

300, 350, 400, 450, dan 500. Dalam pengujian ini dari setiap pengujian fold akan dirata-rata untuk semua skenario pengujian. Untuk nilai hasil evaluasi pengujian pengaruh max epoch telah tersaji pada Tabel 1.

Tabel 1. Hasil Pengujian Pengaruh Max Epoch Hasil Evaluasi Rata-Rata (%) Jumlah

Max Epoch Precision Recall F-Measure 50 84,848 64,32 72,682 100 81,296 71,28 75,525

150 80,263 73,12 76,130 200 79,913 72,8 75,872 250 80,990 72,88 76,328 300 80,450 72,96 76,127 350 81,652 73,2 76,772 400 80,909 73,84 76,697 450 80,274 72,16 75,659 Gambar 2. Diagram Alir BPNN 500 81,045 72,6 76,157

Berikut ini adalah grafik hubungan antara Keterangan: pengaruh max epoch dengan hasil evaluasi

1. Memasukan data latih dari hasil ekstraksi sistem telah disajikan pada grafik pengaruh max fitur BoW dan LBF, menentukan iterasi epoch pada Gambar 3. maksimum, dan nilai target MSE.

2. Menentukan nilai bobot dan bias dengan menggunakan bilangan acak.

3. Melakukan inisialisasi untuk nilai iterasi awal.

4. Masuk ke tahapan propagasi maju kemudian menghitung nilai MSE.

5. Setelah MSE didapat, maka akan dilakukan pengecekan apakah nilai MSE kurang dari sama dengan target MSE atau jumlah iterasi maksimum, jika tidak maka akan dilakukan proses propagasi mundur.

Gambar 3. Grafik Hasil Pengujian Pengaruh Max 6.

Masuk ke proses perhitungan perubahan

Epoch

bobot dan bias, kemudian melakukan Bersadarkan Tabel 1. dan juga Gambar 3. perbaruan bobot. bisa dilihat hasil evaluasi sistem pada pengujian 7. Kemudian melakukan penambahan iterasi ini tidak berbeda jauh antara nilai evaluasi satu

1, dan kembali ke langkah 4 untuk kembali dengan yang lainnya, walaupun max epoch yang melakukan proses BPNN. digunakan berbeda-beda. Nilai evaluasi

precision mengalami kondisi nilai yang naik

learning rate satu sama lain tidak signifikan.

Berikut ini merupakan grafik hubungan antara pengaruh learning rate dengan hasil evaluasi sistem telah disajikan pada Gambar 4.

turun, pada max epoch 50 ke 100 mengalami penurunan nilai yang lumayan tinggi, sedangkan pada max epoch lainnya perubahan yang terlihat tidak begitu besar. Untuk nilai evaluasi precision nilai tertinggi yang dicapai adalah pada max

1. Hasil nilai dari evaluasi precision, recall dan

f-measure memiliki grafik perubahan yang

cenderung sama, pada semua nilai antara

precision, recall dan f-measure mengalami

kondisi grafik naik turun. Dapat dilihat bahwa grafik menunjukan perubahan antara nilai

Untuk nilai precision tertinggi terdapat pada nilai learning rate 0,4 dengan nilai rata-rata 82,429%, recall mendapatkan hasil evaluasi maksimal pada kondisi learning rate 0,4 dengan nilai rata-rata evaluasi yang didapat adalah 73,76%, sedangkan nilai f-measure mendapatkan nilai rata-rata evaluasi tertinggi 77,385% ketika nilai learning rate 0,4. Ketika nilai learning rate semakin kecil learning rate maka akan lama mencapai proses konvergensi tetapi lebih akurat, sedangkan saat nilai learning

Dari grafik pada Gambar 4. bisa dilihat bahwa hasil evaluasi sistem pada pengujian ini tidak berbeda jauh antara nilai evaluasi ketika nilai learning rate berubah-ubah dari 0,1 sampai

epoch 350 yang memiliki nilai f-measure 76,772%.

mengalami perubahan yang signifikan, dengan hasil rata-rata f-measure terbesar pada max

max epoch diatas 100 cenderung tidak

besar pada nilai evaluasi yang dihasilkan. Nilai

max epoch menunjukan bahwa perubahan nilai max epoch tidak terlalu memberikan pengaruh

Hasil yang diperoleh pada grafik pengaruh

nilai evaluasi recall dan f-measure grafiknya cenderung memiliki kesamaan, pada max epoch 50 ke 100 mengalami perubahan yang besar dan cenderung naik, sedangkan pada max epoch lainnya tidak mengalami perubahan yang signifikan. Nilai evaluasi untuk recall tertinggi ada pada max epoch 400 dengan nilai rata-rata 73,84% dan untuk f-measure nilai rata-rata tertinggi pada max epoch 350 dengan nilai rata- rata f-measure 76,772%.

epoch 50 dengan nilai rata-rata 84,848%. Untuk

Gambar 4. Grafik Hasil Pengujian Pengaruh Max Epoch

3.2 Pengujian Pengaruh Learning Rate

Learning Rate (α) Hasil Evaluasi (%)

Tabel 2. Hasil Pengujian Pengaruh Learning Rate Nilai

Hasil dari pengujian ini telah tersaji pada Tabel 2.

Cross Validation , maka nilai yag digunakan disini merupakan nilai rata-rata dari semua fold.

ini adalah 0,1; 0,2; 0,3 sampai dengan 1. Karena pada pengujian menggunakan metode 5-Fold

rate . Nilai learning rate yang dalam pengujian

Pada pengujian ini akan dilihat nilai evaluasi sistem yang dihasilkan, apakah dipengaruhi oleh perubahan dari nilai learning

rate semakin besar maka proses konvergensi lebih cepat dan kurang akurat.

Pada hasil yang diperoleh pada pengujian pengaruh learning rate menunjukan bahwa perubahan nilai learning rate tidak terlalu memberikan pengaruh yang signifikan pada nilai evaluasi yang dihasilkan. Nilai learning rate dari 0,1 sampai 1 memberikan perubahan yang tidak signifikan pada hasil evaluasi, dengan rata-rata f-

measure terbesar pada learning rate 0,4 dengan nilai evaluasi 77,385%.

3.3 Pengujian Pengaruh Lexicon Based Features (LBF)

Pengujian ketiga ini digunakan untuk mengetahui pengaruh fitur lexicon based

Precision Recall F-Measure 0,1 80,473 73,44 76,346 0,2 79,573 73,36 76,000 0,3 81,166 72,8 76,445 0,4 82,429 73,76 77,385 0,5 80,800 73,6 76,594 0,6 82,083 73,52 77,108 0,7 81,425 73,6 76,859 0,8 81,782 73,6 76,947 0,9 81,159 73,04 76,433 1 82,034 73,2 76,989

features terhadap nilai evaluasi sistem yang

2 350 0,8 87,509 86,4 86,907

Pada pengujian ini fitur bag of words akan dilihat pengaruhnya terhadap nilai evaluasi sistem yang dihasilkan. Disini pengujian yang dilakukan, hanya menggunakan fitur bag of

words . Nilai max epoch dan learning rate

merupakan nilai yang diambil pada pengujian sebelumnya. Pengujian dilakukan dengan melakukan proses running sistem dengan data uji sebanyak lima kali untuk setiap fold. Dari lima kali proses pengujian akan dilakukan rata- rata untuk evaluasi precision, recall, dan f-

measure untuk memaksimalkan nilai dari

variabel bobot. Hasil pengujian pengaruh bag of words dapat dilihat pada Tabel 4.

Tabel 4. Hasil Pengujian Pengaruh BoW Fold ke Jum lah

Max Epo ch

Nilai Learning Rate

(α) Hasil Evaluasi (%) Precision Recall

F- Measure Fold

1 250 0,6 77,597 66,4 71,534

Fold

adalah lexicon yang digunakan pada penelitian ini merupakan lexicon secara umum. Sedangkan, pada penelitian ini data tweet ujaran kebencian yang digunakan sangat spefisik yakni mengenai pilkada DKI 2017. Sehingga kata-kata yang biasanya bukan merupakan ujaran kebencian dalam penelitian ini dianggap sebagai ujaran kebencian. Jadi, kesimpulannya bahwa ketika hanya menggunakan lexicon based features maka proses identifikasi menjadi gagal atau tidak berjalan.

3 350 0,3 88,603 73,2 80,101

Fold

4 400 0,9 73,390 80,4 76,721

Fold

5 200 0,4 79,988 59,2 67,928

Rata-rata 81,417 73,12 76,638

Pada Tabel 4. dapat dilihat bahwa dari hasil pengujian nilai evaluasi yang didapatkan sangat beragam. Nilai rata-rata evaluasi yang didapat pada precision adalah 81,417%, recall 73,12%, dan nilai evaluasi f-measure 76,638%. Dari semua fold didapatkan nilai evaluasi precision tertinggi adalah 88,603%, sedangkan untuk

recall 86,4%, dan nilai f-measure adalah

86,907%. Dari hasil pengujian ini menunjukan fitur bag of words sangat sesuai untuk metode

Backpropagation Neural Network (BPNN),

karena pelatihan yang dihasilkan berhasil mengidentifikasi ujaran kebencian dan bukan ujaran kebencian.

Hasil tersebut menunjukan bahwa fitur bag

of words merupakan fitur yang tepat untuk

3.4 Pengujian Pengaruh Bag of Words (BoW)

based features disini sangat buruk hasilnya

dihasilkan. Pada pengujian ini fitur yang digunakan hanya dengan lexicon based features. Nilai max epoch dan learning rate merupakan nilai yang diambil pada pengujian sebelumnya. Pengujian dilakukan dengan melakukan proses

Fold

running sistem dengan data uji sebanyak lima

kali untuk setiap fold. Dari lima kali proses pengujian akan dilakukan rata-rata untuk evaluasi precision, recall, dan f-measure untuk memaksimalkan nilai bobot yang bervariasi karena inisialisasinya yang random. Hasil dari pengujian pengaruh lexicon based features telah tersaji pada Tabel 3.

Tabel 3. Hasil Pengujian Pengaruh LBF Fold ke Jumlah

Max Epoch Nilai

Learning Rate (α) Hasil Evaluasi (%)

Precision Recall

F- Measure Fold

1 250 0,6

Fold

2 350 0,8

Fold

3 350 0,3

4 400 0,9

Faktor lain yang menyebabkan lexicon

Fold

5 200 0,4

Rata-rata

Terlihat pada Tabel 3. hasil nilai evaluasi sistem mendapatkan persentase 0% mulai dari

precision , recall, dan f-measure. Hasil evaluasi

yang bernilai 0% dikarenakan pada lexicon

based features hanya menggunakan empat fitur

saja, sedangkan data yang digunakan pada data latih adalah 400. Hal ini menunjukan bahwa data uji akan cenderung menghasilkan identifikasi kedalam kelas bukan ujaran kebencian.

Hasil yang diperoleh pada pengujian pengaruh lexicon based features menunjukkan bahwa walaupun ketika nilai max epoch dan

learning rate sudah optimal, tetapi pada hasil

evaluasi bisa dikatakan sangat buruk. Hasil ini bisa terjadi karena ketika menggunakan lexicon

based features fitur yang dipakai hanya

berjumlah empat, sehingga kurang bervariasi dan tidak bisa digunakan untuk melakukan pengujian terhadap data uji.

digunakan dalam metode BPNN. Hal ini dikarenakan dalam bag of words jumlah fitur yang digunakan sangat dinamis tergantung pada jumlah data latih, semakin besar data latih maka jumlah fitur bag of words akan semakin banyak. Ketika jumlah fitur bag of words ini semakin besar, dalam data latih metode BPNN akan sangat bervariasi.

Pengaruh lain yang menyebabkan bag of

Dari grafik pada Gambar 5. bisa dilihat bahwa hasil evaluasi sistem pada pengujian ini antara fitur BoW dengan BoW + LBF tidak terdapat perbedaan yang signifikan. Disini untuk hasil f-measure fold 1, fold 2, dan fold 3 fitur BoW + LBF yang memiliki hasil lebih tinggi, sedangkan untuk fold 4 dan fold 5 fitur BoW memiliki hasil yang tinggi walaupun perbedaannya tidak signifikan. Untuk nilai f-

3.6 Analisis Perbandingan Metode BPNN berbasis Lexicon Based Features dan

Jadi, bisa disimpulkan bahwa LBF dapat digunakan untuk meningkatkan akurasi evaluasi apabila dikombinasikan dengan BoW, tetapi sangat jelek ketika LBF hanya digunakan sebagai fitur tunggal untuk metode BPNN. Dan selisih yang didapat ketika BoW dikombinasikan dengan LBF mengalami peningkatan sekitar 1,443%.

Hasil rata-rata f-measure yang didapat yaitu 0% untuk LBF, 76,638% untuk BoW, dan 78,081% ketika fitur BoW dikombinasikan dengan LBF.

Validation didapatkan hasil tiga fold dengan nilai f-measure tertinggi diantara fitur lainnya.

Dari hasil tersebut juga didapat bahwa ketika LBF dan BoW dikombinasikan dan dilakukan pengujian dengan 5-Fold Cross

menggunakan LBF mendapat f-measure tertinggi 86,907%, sedangkan fitur LBF + BoW menghasilkan nilai untuk f-measure tertinggi dari ketiga fitur yakni 88,705%.

measure yang didapat 0%, fitur BoW tanpa

Pada hasil yang diperoleh pada pengujian pengaruh perbandingan evaluasi metode BPNN menggunakan LBF dan BoW menunjukan bahwa ketika fitur LBF digunakan tanpa dikombinasikan dengan fitur BoW maka nilai f-

88,705%.

measure yang tertinggi ada pada fitur BoW + LBF pada fold 2 dengan nilai evaluasinya

Gambar 5. Grafik Hasil Perbandingan Evaluasi BPNN dengan LBF dan BoW

words sangat relevan digunakan untuk metode

Dan untuk grafik perbandingan antara kedua fitur LBF dan BoW dengan hasil evaluasi sistem telah disajikan pada Gambar 5.

Rerata 76,638 78,081

Fold 1 71,534 76,231 BoW + LBF Fold 2 86,907 88,705 BoW + LBF Fold 3 80,101 82,007 BoW + LBF Fold 4 76,721 76,005 BoW Fold 5 67,928 67,458 BoW

Tabel 5. Hasil Perbandingan Evaluasi BPNN dengan LBF dan BoW Hasil Evaluasi (%) Fitur Terbaik LBF BoW BoW + LBF

kali. Dari lima kali proses pengujian akan dilakukan rata-rata untuk evaluasi f-measure untuk memaksimalkan nilai bobot. Hasil dari pengujian perbandingan metode BPPN dengan LBF dan BoW telah disajikan pada Tabel 5.

running sistem dengan data uji sebanyak lima

Pengujian kelima disini dimaksudkan untuk mencari fitur terbaik yang digunakan untuk metode Backpropagation Neural Network (BPNN) dalam identifikasi ujaran kebencian. Disini pengujian yang dilakukan menggunakan kombinasi fitur yaitu BPNN dengan LBF, BPNN dengan BoW, dan BPNN dengan LBF + BoW. Pengujian dilakukan dengan melakukan proses

Based Features dan Bag of Words

Jadi, kesimpulan yang didapat adalah ketika metode Backpropagation Neural Network (BPNN) menggunakan fitur bag of words, maka proses identifikasi akan berhasil dengan nilai rata-rata evaluasi f-measure sebesar 76,638%.

words merupakan fitur hasil ekstraksi data latih yang digunakan.

BPNN adalah fitur yang digunakan untuk membuat pola pembelajaran BPNN akan menyesuaikan dari data latihnya. Hal ini bisa terjadi karena fitur yang digunakan ketika metode BPNN dikombinasikan dengan bag of

3.5 Pengujian Perbandingan Evaluasi Metode BPNN menggunakan Lexicon

Bag of Words dengan RFDT menggunakan fitur n-gram

of Words dapat diimplementasikan pada

metode Random Forest Decision Tree menggunakan n-gram fitur. Karena fitur yang digunakan dalam ekstraksi fitur yakni Lexicon

Based Features belum maksimal dan random forest masih lebih baik untuk meningkatkan

hasil identifikasi.

4. KESIMPULAN

Berdasarkan pada hasil pengujian yang telah dilakukan sebelumnya, maka dapat disimpulkan mengenai implementasi metode

Backpropagation Neural Network berbasis Lexicon Based Features

dan Bag Of Words untuk identifikasi ujaran kebencian pada Twitter adalah sebagai berikut: 1.

Metode Backpropagation Neural Network berbasis Lexicon Based Features dan Bag

identifikasi ujaran kebencian dengan hasil identifikasi berupa ujaran kebencian dan bukan ujaran kebencian. Data latih datih dan uji diproses melalui tahapan

Jadi, kesimpulan yang didapat bahwa metode Backpropagation Neural Network berbasis Lexicon Based Features dan Bag of

Preprocessing , kemudian hasil Preprocessing dilakukan ekstraksi fitur

dengan Bag of Words dan Lexicon Based

Features , dan fitur tersebut digunakan

untuk proses pembelajaran pada metode

Backpropagation Neural Network

kemudian dilakukan pengujian dengan data uji untuk mendapatkan identifikasi berupa ujaran kebencian dan bukan ujaran kebencian.

2. Hasil pengujian nilai-nilai parameter

Backpropagation Neural Network yaitu

nilai learning rate yang diuji tidak memberikan pengaruh yang signifikan, karena hasil yang didapat cenderung tidak mengalami perubahan terhadap hasil evaluasi precision, recall dan f-measure. Juga untuk nilai max epoch yang diujikan sesuai dengan skenario tidak memberikan hasil perubahan yang signifikan, ini dibuktikan dengan hasil evaluasi yang tidak mengalami peningkatan yang besar, tetapi menunjukan hasil yang cenderung stabil. Parameter terbaik yang didapatkan dari hasil pengujian, yaitu max epoch 350 dan

Words tidak lebih baik dibandingkan dengan

memberikan dugaan yang lebih tinggi akurasinya dibandingkan hanya dengan pohon tunggal.

Analisis disini dimaksudkan untuk mengetahui perbandingan hasil dari Metode

merupakan hasil dari penelitian sebelumnya (Alfina, et al., 2017). Sedangkan dalam penelitian ini ketika menggunakan metode

Backpropagation Neural Network (BPNN)

berbasis Bag of Words (BoW) dan Lexicon

Based Features (LBF) dengan Random Forest Decision Tree (RFDT) menggunakan fitur n- gram. Dari penelitian sebelumnya diambil hasil

terbaik dan penelitian ini diambil hasil terbaik dari metode yang digunakan, dan perancangan analisis disajikan pada Tabel 6.

Tabel 6. Hasil Perbandingan Metode BPNN berbasis Lexicon Based Features dan Bag of Words dengan RFDT menggunakan fitur n-gram

Fitur Hasil Evaluasi F-Measure (%) BPNN RFDT Terbaik 88,705 93,5

Dari Tabel 6. diperoleh hasil bahwa metode terbaik yang digunakan untuk identifikasi ujaran kebencian adalah dengan metode Random

Forest Decision Tree (RFDT) menggunakan n- gram fitur dengan hasil f-measure 93,5% yang

Backpropagation Neural Network (BPNN)

random forest

berbasis Lexicon Based Features dan Bag of Words mendapatkan hasil f-measure 88,705%.

Hasil dari analisis disini bahwa metode BPNN berbasis Lexicon Based Features dan Bag

of Words yang digunakan tidak lebih baik dari

penelitian sebelumnya. Hal ini bisa terjadi karena pada penelitian ini fitur yang menjadi kombinasi Lexicon Based Features masih belum maksimal untuk digunakan identifikasi ujaran kebencian. Pada pengujian pengaruh Lexicon

Based Features hasil yang didapatkan bahwa

fitur ini gagal untuk melakukan identifikasi karena sistem cenderung mengidentifikasikan ke kelas bukan ujaran kebencian.

Faktor lain yang menyebabkan kurang bagusnya hasil dari metode pada penelitian ini adalah pada penelitian sebelumnya menggunakan RFDT dengan n-gram fitur. Metode RFDT merupakan metode dengan

random forest yakni merupakan gabungan dari

beberapa pohon keputusan. Pohon keputusan yang digabung menjadi

learning rate sebesar 0,4.

3. Pada evaluasi sistem didapatkan sebagai hasil berikut: ketika hanya menggunakan

Lexicon Based Features belum maksimal

Hall. Fawcett, T., 2006. Anintroduction to ROC

Networks: Architecture, Algorithms, and Aplications. New Jersey: Prentice

Fausett, L., 1994. Fundamentals of Neural

USA: Cambridge University Press. Gambäck, B. & Sikdar, U. K., 2017. Using

Lexicon Based Features nilai rata-rata f- measure sebesar 0%, lebih buruk

Convolutional Neural Networks to Classify Hate-Speech. Proceedings of

the First Workshop on Abusive Language Online, pp. 85-90.

George, S. K. & Joseph, S., 2014. Text Classification by Augmenting Bag of Words (BOW) Representation with Co- occurrence Feature. IOSR Journal of

Computer Engineering (IOSR-JCE), pp.

34-38. Gorunescu, F., 2011. Data Mining Concept Model and Techniques. Berlin: Springer.

dan random forest masih lebih baik untuk meningkatkan hasil identifikasi.

menggunakan n-gram fitur. Karena fitur yang digunakan dalam ekstraksi fitur yakni

Handbook Advanced Approaches in Analyzing Unstructured Data.

Random Forest Decision Tree

masih tidak lebih baik dibandingkan dengan

Backpropagation Neural Network berbasis Lexicon Based Features dan Bag of Words

4. Hasil perbandingan metode

of Words dapat meningkatkan performa pada sistem.

dapat disimpulkan bahwa kombinasi dua fitur yakni Lexicon Based Features dan Bag

measure 78,081%. Dengan hasil berikut

menghasilkan nilai f-measure tertinggi dari fitur sebelumnya dengan nilai rata-rata f-

Features dan Bag of Words dikombinasikan

sebesar 76,638%, dan ketika Lexicon Based

Words yang nilai rata-rata f-measure

dibandingkan dengan menggunakan Bag of

Analysis. Pattern Recognition Letters, Volume 27, pp. 861-874. Feldman, R. & Sanger, J., 2007. The Text Mining

5. DAFTAR PUSTAKA

Serpong: s.n. Direktorat Tindak Pidana Siber Bareskrim, 2016.

Eleventh International AAAI Conference on Web and Social Media (ICWSM 2017).

Davidson, T., Warmsley, D., Macy, M. & Weber, I., 2017. Automated Hate Speech Detection and the Problem of Offensive Language. Proceedings of the

Burnap, P. & Williams, M. L., 2014. Hate Speech, Machine Classification and Statistical Modelling of Information Flows on Twitter: Interpretation and Communication for Policy Decision Making.

Conference on Advanced Computer Science and Information Systems 2017 (ICACSIS).

Alfina, I., Mulia, R., Fanany, M. I. & Ekanata, Y., 2017. Hate Speech Detection in the Indonesian Language: A Dataset and Preliminary Study. 9th International

Haryati, D. F., Abdillah, G. & Hadiana, A. I., 2016. Klasifikasi Jenis Batubara menggunakan Jaringan Syaraf Tiruan dengan Algoritma Backpropagation.

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016).

Hastuti, K., 2012. Analisis Komparasi Algoritma Klasifikasi Data Mining. Seminar

Nasional Teknologi Informasi & Komunikasi Terapan 2012, pp. 241-249.

Hermawan, A., 2006. Jaringan Syaraf Tiruan (Teori dan Aplikasi). Yogyakarta: Andi. Lan, M., Tan, C. L. & Su, J., 2007. Supervised and Traditional Term Weighting

Methods for Automatic Text Categorization. Journal of IEEE PAMI, 10(10), pp. 1-36.

Mangantibe, V., 2016. Ujaran Kebencian dalam Surat Edaran Kapolri Nomor: SE/6/X/2015 Tentang Penanganan Ucapan Kebencian (Hate Speech).

Siddiqua, U. A., Ahsan, T. & Chy, A. N., 2016.

Combining a Rule-based Classifier with Ensemble of Feature Sets and Machine Learning Techniques for Sentiment Analysis on Microblog. International

Dewa, P. E., 2014. Menguak Jejaring Sosial.

Conference on Computer and Information Technology.

Sun, X., Xiao, Y., Wang, H. & Wang, W., 2015.

On Conceptual Labeling of a Bag of Words. Proceedings of the Twenty-

Fourth International Joint Conference on Artificial Intelligence.

Tala, F. Z., 2003. A Study of Stemming Effect on

Information Retrieval in Bahasa Indonesia.

Netherland: Universiteti van Amsterdam. Triawati, C., 2009. Metode Pembobotan

Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia. Bandung: Institut Teknologi Bandung.

Turban, E., Sharda, R., Delen, D. & King, D., 2010. Bussiness Intelligence A

Managerial Approach. United States: Prentice Hall.

Tuteja, S. K. & Bogiri, N., 2016. Email Spam Filtering using BPNN Classification.

International Conference on Automatic Control and Dynamic Optimization Techniques (ICACDOT).

Wahid, D. H. & Azhari, S. N., 2016. Peringkasan Sentimen Esktraktif di Twitter Menggunakan Hybrid TF-IDF dan Cosine Similarity. IJCCS (Indonesian

Journal of Computing and Cybernetics Systems), pp. 207-218.

Implementasi Metode Backpropagation Neural Network berbasis Lexicon Based Features dan Bag of Words Untuk Identifikasi Ujaran Kebencian Pada Twitter

2.1 Preprocessing

3.2 Pengujian Pengaruh Learning Rate

3.5 Pengujian Perbandingan Evaluasi Metode BPNN menggunakan Lexicon

5. DAFTAR PUSTAKA

Dokumen yang terkait

Support Vector Regression Untuk Peramalan Permintaan Darah: Studi Kasus Unit Transfusi Darah Cabang – PMI Kota Malang

Faktor-Faktor Yang Memengaruhi Minat Nasabah Dalam Menggunakan Layanan Internet Banking Dengan Menggunakan UTAUT (Unified Theory Of Acceptance And Use Of Technology) (Studi Pada Pengguna Internet Banking BRI)

Implementasi Autentikasi Mode Multi-Auth Pada Jaringan Local Area Network Berbasis Kabel Menggunakan Protokol IEEE 802.1X Dan Radius Server

Implementasi High Availability pada Gateway Wireless Sensor Network dengan Protokol Komunikasi Message Queuing Telemetry Transport

Optimasi Metode Extreme Learning Machine Dalam Penentuan Kualitas Air Sungai Menggunakan Algoritme Genetika

Pembangkitan Aturan Pengenalan Emosi Pada Twitter Menggunakan Metode Fuzzy-C Means

Pengenalan Emosi Berdasarkan Ekspresi Mikro Menggunakan Metode Local Binary Pattern

Evaluasi Biaya Pengembangan Perangkat Lunak Dengan Menggunakan Metode Cocomo II (Studi Kasus: PT DOT Indonesia)

Implementasi Modul Monitoring Kapasitas Baterai Pada Perangkat Embedded

Analisis Dan Desain Proses Bisnis Penanganan Perkara Hukum Menggunakan Konsep Vertikal Abstraksi Pada Lembaga Pengkajian Dan Konsultan Badan Hukum (LPKBH) Al-Baihaqy

Dukungan

Links

Implementasi Metode Backpropagation Neural Network berbasis Lexicon Based Features dan Bag of Words Untuk Identifikasi Ujaran Kebencian Pada Twitter

2.1 Preprocessing

3.2 Pengujian Pengaruh Learning Rate

3.5 Pengujian Perbandingan Evaluasi Metode BPNN menggunakan Lexicon

5. DAFTAR PUSTAKA

Dokumen yang terkait

Support Vector Regression Untuk Peramalan Permintaan Darah: Studi Kasus Unit Transfusi Darah Cabang – PMI Kota Malang

Faktor-Faktor Yang Memengaruhi Minat Nasabah Dalam Menggunakan Layanan Internet Banking Dengan Menggunakan UTAUT (Unified Theory Of Acceptance And Use Of Technology) (Studi Pada Pengguna Internet Banking BRI)

Implementasi Autentikasi Mode Multi-Auth Pada Jaringan Local Area Network Berbasis Kabel Menggunakan Protokol IEEE 802.1X Dan Radius Server

Implementasi High Availability pada Gateway Wireless Sensor Network dengan Protokol Komunikasi Message Queuing Telemetry Transport

Optimasi Metode Extreme Learning Machine Dalam Penentuan Kualitas Air Sungai Menggunakan Algoritme Genetika

Pembangkitan Aturan Pengenalan Emosi Pada Twitter Menggunakan Metode Fuzzy-C Means

Pengenalan Emosi Berdasarkan Ekspresi Mikro Menggunakan Metode Local Binary Pattern

Evaluasi Biaya Pengembangan Perangkat Lunak Dengan Menggunakan Metode Cocomo II (Studi Kasus: PT DOT Indonesia)

Implementasi Modul Monitoring Kapasitas Baterai Pada Perangkat Embedded

Analisis Dan Desain Proses Bisnis Penanganan Perkara Hukum Menggunakan Konsep Vertikal Abstraksi Pada Lembaga Pengkajian Dan Konsultan Badan Hukum (LPKBH) Al-Baihaqy

Dokumen yang Anda mencari sudah siap untuk unduhkan