ANALISIS DAN IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER TERHADAPA PEMILIHAN GUBERNUR JAWA BARAT 2018 PADA MEDIA ONLINE
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1678
ANALISIS DAN IMPLEMENTASI ALGORITMA NAÏVE BAYES CLASSIFIER
TERHADAPA PEMILIHAN GUBERNUR JAWA BARAT 2018 PADA MEDIA
ONLINE
Resky Nadia, Dr.Kemas Muslim L, Fhira Nhita,S.T.,M.T
1,2,3
Fakultas Informatika, Universitas Telkom, Bandung [email protected], [email protected], [email protected].
Abstrak
Berita mengenai pemilihan Gubernur Jawa Barat 2018 akan menjadi bahasan penting untuk dianalisis
kebenarannya, dikarenakan banyaknya media online yang dalam penyebaran judul beritanya cenderung
menampilkan kalimat yang mempengaruhi mindset pembacanya hanya dengan sekali lihat. Adanya judul
berita yang bersifat positif ,negative atau netral. Hal tersebut dikhawatirkan dapat mengubah cara
pandang masyarkat terkait suatu hal yang sebenarnya belum sesuai dengan judul yang tertera dan menarik
perhatian masyarakat umum maka dari itu diperlukan klasifikasi.
Makalah ini memaparkan sebuah hasil analisis dan klasifikasi yang terbagi menjadi tiga kelas yaitu positif
negative dan netral, dengan step awal yaitu dengan melakukan survey kepada 5 orang untuk pemberian
kelas terhadapt 5 media online yaitu Kompas.com, Detik.com, Liputan6.scom, Tribunnews.com dan
Republikaonline.com. selanjutnya akan dilakukan klasifikasi menggunakan Algoritma Naïve Bayes
Classifier dan akan menghasilkan sebuah akurasi dari setiap kelas dengan menganalisis 3 skenario.Dengan menggunakan Algoritma Naive Bayes maka didapatkan hasil klasifikasi dengan akurasi masing
masingDetik.com dengan akurasi makro 78% dan mikro 80%, Kompas.com 48% dan48%, Liputan6.com 65% dan
65%, Tribunnews.com 65% dan 65% serta Republikaonline.com 77% dan 77%.Kata kunci : Kata Kunci : Naïve Bayes, Media Online, Pilgub Jawa Barat. Abstract
News about the election of West Java Governor 2018 will be an important topic to be analyzed the truth,
because the number of online media in the spread of news titles tend to display sentences that affect themindset readers only with one look. The existence of a news headline that is positive, negative or neutral.
It is feared to change the way the society view of a matter that is not yet in accordance with the title listed
and attract the attention of the general public therefore the required classification.This paper describes an analysis and classification result that is divided into three classes that is positive
and neutral positive, with the first step is to conduct a survey to 5 people for the provision of class to 5online media that is Kompas.com, Detik.com, Liputan6.scom, Tribunnews .com and Republikaonline.com.
will then be classified using the Naïve Bayes Classifier Algorithm and will generate an accuracy of each class by analyzing 3 scenarios.By using Naive Bayes Algorithm then got the result of classification with each accuracy is Detik.com with
78% macro accuracy and 80% micro, Kompas.com 48% and 48%, Liputan6.com 65% and 65%, Tribunnews.com 65% and 65% and Republikaonline.com 77% and 77%.Keywords: Keywords: Naïve Bayes, Online Media, Pilgub West Java.
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1679
Drama menjelang pemilihan gubernur jawa barat masih terus berlangsung, masing-masing kandidat bersama sama menunjukkan eksistensinya melalui kegiatan yang dinilai akan menarik simpati masyarakat jawa barat dan sekitarnya. Hal tersebut justru menarik perhatian media masa online dalam melakukan pemberitaan dengan menuliskan berbagai judul yang semenarik mungkin untuk menarik minat pembaca, namun apakah semua media massa online tersebut dalam penyebaran beritanya besifat transparan? Atau justru bersifat positif ataupun negatif? Berdasarkan berlimpahnya judul berita di media massa yang menarik perhatian pembaca dan terkadang cenderung memihak atau memojokkan sesuatu, maka dari itu penulis akan melakukan klasifikasi untuk mengetahui apakah suatu media online dalam penyebaran beritanya cenderung netral, positif atau bahkan negatif. Informasi yang menyebar sangat cepat dan diiringi dengan kebebasan mengeluarkan pendapat dapat menimbulkan berbagai jenis opini, baik opini negatif atau positif. Opini negatif disini mengandung arti bahwa kata atau opini yang dapat menimbulkan permusuhan, penghinaan, perdebatan dan perselisihan di dunia maya. Sedangkan opini positif yaitu kata atau opini yang sifatnya positif dan tidak menimbulkan permusuhan, penghinaan, perdebatan, dan perselisihan di dunia maya[8].
Teknik data mining yang dilakukan pada proses penelitian ini adalah Algoritma Naïve Bayes yang merupakan sebuah pengklasifikasian probabilitas sederhana yang mengaplikasikan Teorema Bayes. Ide dasar dari Teorema Bayes adalah menangani masalah yang bersifat hipotesis yakni mendesain suatu klasifikasi untuk memisahkan objek.
Agar permasalahan yang terjadi dapat ditangani dengan baik dan terarah maka perlu adanya batasan masalah, adapun batasan masalah yaitu pokok pembahasan yang berfokus kepada perhitungan Algoritma Naïve Bayes dan keluaran dari software yang sudah ada yaitu positif negative dan netral. Attribute yang digunakan ada 2 yaitu judul berita dan kelasnya. Sebagai data media online yang digunakan adalah Detik.com, Kompas.com, Liputan6.com, Tribunnews.com dan RepublikaOnline.com. data yang di crawling bersifat manual yang di ambil dari bulan November-Desember tahun 2017 karena dianggap sebagai waktu yang pas untuk menangkap isu isu politik yang beredar. Hasil analisa berfokus memberikan informasi kelas yang digunakan sebagai label dan akurasi dari naïve bayes itu sendiri.
Tujuan yang ingin di capai adalah menghasilkan akurasi sistem dan hasil klasifikasi dari data yang telah di prediksi suatu media online.Manfaat dari tugas akhir kali ini bagi masyarakat adalah untuk mengetahui media mana yang cenderung mencantmkan judul berita yang tidak ideal sementara dalam bidang politik tugas akhir ini dapat digunakan untuk peta politik dari pada calon gubernur itu sendiri.
Batasan Masalah
Batasan masalah pada penelitian ini adalah data yang di ambil hanya melalui judul berita pada media online yaitu Detik.com, Kompas.com, Liputan6.com, Tribunnews.com dan RepublikaOnline.com. yang di ambil dari bulan November dan Desember 2017.
2. Dasar Teori
2.1. Media Online
Pengertian umum media online yaitu segala jenis atau format media yang hanya bisa diakses melalui internet berisikan teks, foto, video dan suara. Dalam pengertian umum ini, media online juga bisa dimaknai sebagai sarana komunikasi secara online. Pengertian secara khusus dari media online adalah media yang menyajikan karya jurnalistik (berita, artikel, feature) secara online. Secara teknis dan fisik media online adalah media berbasis telekomuniskasi dan multimedia (computer dan internet).. Termasuk kategori media online adalah portal, website (situs web, termasuk blog), radio online, TV online dan email[1].
2.2. Machine Learning
Machine Learning (ML) atau pembelajaran mesin merupakan teknik yang paling popular karena banyak digunakan untuk menggantikan atau menirukan prilaku manusia untuk emnyesuaikan maslaah. Sesuai
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1680
2.3. Data Mining
Data mining merupakan proses pengektraksian informasi dari sekumpulan data yang snagat besar melalui penggunaaan algoritma dna teknik penarikan dalam bidang statistik, pembelajaran mesin dan sisten manajemen berbasis data. Data mining merupakan disiplin ilmu yang mempelajari metode untuk mengektsrak pengetahuan atau menemukan pola dari suatu data. Hasil dari pengolahan data untuk mengambil keputusan di mas adepan. Data mining ini juga dikenal sebagai istilah pattern recognitions [3].
2.4. Naïve Bayes Classifier
Naïve Bayes merupakan metode klasifikasi berdasarkan teori probabilitas dan teorema Bayesian dengan asumsi bahwa setiap variable atau parameter penentu keputusan bersifat bebas (independence) sehingga keberadaan setiap variable tidak ada kaitannya dengan keberadaan atribut yang lain. Teorema bayes yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Torema tersebut dikombinasikan dengan naïve dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi naïve bayes diasumsikan bahwa ada atau tidak ada hubungannya dengan ciri khas lainnya[8]. Persamaan nya adalah sebagai berikut:
(1) ( ( | ) ( ))
( | ) = ( ( ))
Keterangan : = sampel data yang label kelasnya tidak diketahui.
A = kelas-kelas hasil klasifikasi. B
P(A|B) = probabilitas terjadinya A jika B diketahui. Disebut probabilitas posterior,
karena peluang A bergantung dari nilai B tertentu. P(B|A) = probabilitas terjadinya B jika A diketahui. Disebut likelihood function. P(A) = probabilitas prior A yang mendahului terjadinya B. Disebut “prior”, karena nilainya bisa diperoleh tanpa perlu mempertimbangkan informasi apapun mengenai B terlebih dahulu.
P(A) juga berarti probabilitas ini diperoleh dari data sampel yang telah diketahui
berkelas A.P(B) = probabilitas prior B, dan bertindak sebagai normalizing constant. Secara
intuitif , teorema Bayes menggambarkan bahwa perubahan pada “A” dapat diamati apabila “B” terlebih dahulu diamati 3.Metodelogi Penelitian
Pada tugas akhir ini akan dilakukan klasifikasi judul berita menggunakan Algoritma Naive Bayes . Sistem yang digunakan pada pengerjaan tugas akhir ini menggunakan dataset dari judul berita yang berjumlah 900
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1681
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1682
Berdasarkan gambar di 3.1 di atas adalah flowchart sistem yang di bangun. Yang memiliki beberapa proses. Dimana proses pertama adalah pencarian secara manual agar menghindari kemungkinan error jika menggunakan software lain. Data di ambil dari bulan November dan Desember karena dianggap cukup untuk sebuah sampel, data mengenai hal yang berkaitan dengan ketiga calon kandidat pilgub yaitu Ridwan kamil, Deddy Mizwar dan Dedi Mulyadi yang di dapatkan dari 5 media online. Lalu data yang sudah di dapat diberi label positif, negative atau netral sesuai dengan parameter. Kemudian data yang di dapat harus melalui tahap Preprocessing dengan melalui tahap Tokenizing, Stopword dan Stemming. Setelah itu data harus di bagi menjadi dua yaitu data training dan data testing. Pada Klasifikasi menggunakan Naïve Bayes memerlukan data training sebagai proses belajar untuk membentuk suatu model. Setelah Naïve Bayes melakukan pemberlajaran, maka data testing akan digunakan sebagai data masukan atau inputan. Dalam tahap akhir ini system akna menampilkan akurasi dari setiap media online yang sudah di masukkan serta mengukur kinerja dari sistem yang dibangun.
3.2. Data
Dalam pengujian ini data yang di gunakan adalah dataset dari judul berita yang berjumlah 900 judul yang terdiri dari 5 media online yaitu :
1.Detik.com,
2.Kompas.com,
3.Liputan6.com,
4.Tribunnews.com 5.RepublikaOnline.com. Data tersebut di ambil selama dua bulan yaitu bulan November dan Desember 2017 karena di anggap cukup sebagai sampel. Kemudia satu persatu data diberi label positif, negatif dan netral sesuai dengan parameter acuan sebagai berikut:
Kalimat Berita Positif
Yang dimaksud dengan kalimat berita positif adalah kaimat berita yang di dalamnya tidak terdapat pengingkaran.
Kalimat Berita Negatif
Berbeda dengan kalimat berita positif, pada kalimat berita negatif terdapat pengingkaran yang dicirikan dengan kata tidak, bukan. Ini merupak kebalikan dari kalimat berita positif.
Kalimat Berita Netral
Merupakan kalimat berita yang didalamnya tidak terdapat pengingkaran dan tidak menjurus kesesuatu objek tertentu.
Pengujian dilakukan dengan menggunakan data training dan data testing dari setiap masing-masing data yang akan diklasifikasikan menggunakan Naïve Bayes.
Tabel.1 Spesifikasi Pengambilan Data
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1683
Pada proses pengujian menggunakan dua proporsi pembagian data training dan testing dengan pembagian scenario sebagai berikut : Tabel.2 Skenario Data Testing dan Training
Pada skenario 1, data training di ambil 100% sementara data testing 10% dari jumlah data testingnya. Pada skenario kedua, data training diambil semua sementara data testing diambil 20% dari data trainingnya, pada skenario ketiga dilakukan pengujian yang sama dengan proses data training sebanyak 30%.
3.3. Pre-Processing Text
Sebelum masuk ke Algoritma Naïve Bayes Classifier. Data terlebih dahulu harus memasuki tahap preprocessing. Dti tahap preprocessing, dilakukan perlakuan terhadap data mnetah yang telah di crawling agar menjadi suatu data yang berkulitas. Beberapa Tahap Preprocessing yang dilakukan pada tugas akhir kali ini adalah sebagai berikut[5][6].
3.3.1 Case Folding Merupakan tahap pengubahan setiap huruf yang terdapat dalam kalimat menjadi huruf kecil semua.
Tidak semua dokumen teks konsisten dalam penggunaan huruf capital. Oleh kerena itu peran case-folding
dibutuhkan dalam mengkonversi keseluruhan teks dalam dokumen menjadi suatu bentuk standar (biasanya huruf
kecil) [5][6].3.3.2 Tokenizing Tokenizing
adalah tugas pemotongan urutan karakter dan sebuha set dokumen yang diberikan mnejadi potongan-potongan kata atau karakter yang sesuai dengan kebutuhan system. Potongan-potongan tersebut terkeneal dengan istilah token[5][6].
3.3.3 Stopword Removal Stopword Removal dapat di artikan sebagai menghilangkan karakter, tanda baca, serta kata-kata
umum yang tidak memiliki makna atau informasi yang dibutuhkan. Stopwords umumnya digunakan dalam pengambilan informasi salah satu contohnya adlaah mesin pencai Google. Pengurangan ukuran indeks dalam tesk dengan penghilangan beberapa kata kerja, kata sifat dan kata keterangan lainnya dapat dimasukkan ke dalam daftar stopwords [5][6].
3.3.4 Steeming Stemming
merupakan salah satu proses dari mengubah token yang berimbuhan menjadi kata dasar, dengan menghilangkan semua imbuhan yang ada pada token tersebut. Pentingnya stemming dalam proses pembuatan system adlaah untuk menghilangkan imbuhan pada awalan dan akhiran[5][6].
3.4 Kamus Besar Bahasa Indonesia (KBBI) Online
Bahasa Indonesia memiliki kekayaan kosakata kamus KBBI kini kaya akan istilah bidang ilmu fisika, kimia, matematika, dan biologi yang sudah sangat lazim digunakan. Definisi kata-kata itu diambil dari kamus istilah bidang ilmu yang dikembangkan oleh para pakar bersama Pusat Bahasa, Departemen Pendidikan Nasional. Dengan memasukkan istilah-istilah itu, kamus ini dapat menjadi rujukan awal yang dapat digunakan oleh masyarakat umum untuk memahami konsep-konsep dasar keilmuan itu. Kegunaan Kamus Bahasa Indonesia disini digunakan sebagai pengganti kamus Bahasa yang terkandung didalam kalimat judul berita dalam Pre-Processing sebagai acuan[11].
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1684
3.5 Klasifikasi Naïve Bayes
Naïve Bayes merupakan metode klasifikasi berdasarkan teori probabilitas dan teorema Bayesian dengan asumsi bahwa setiap variable atau parameter penentu keputusan bersifat bebas (independence) sehingga keberadaan setiap variable tidak ada kaitannya dengan keberadaan atrbut yang lain. Teorema bayes yaitu memprediksi peluang di masa depan berdasarkan pengalaman dimasa sebelumnya sehingga dikenal sebagai Teorema Bayes. Torema tersebut dikombinasikan dengan naïve dimana diasumsikan kondisi antar atribut saling bebas. Klasifikasi naïve bayes diasumsikan bahwa ada atau tidak ada hubungannya dengan ciri khas lainnya.[8]
Persamaan nya adalah sebagai berikut: (1)
( ( | ) ( )) ( | ) =
( ( ))
Keterangan : = sampel data yang label kelasnya tidak diketahui.
A = kelas-kelas hasil klasifikasi. B
P(A|B) = probabilitas terjadinya A jika B diketahui. Disebut probabilitas posterior,
karena peluang A bergantung dari nilai B tertentu. P(B|A) = probabilitas terjadinya B jika A diketahui. Disebut likelihood function. P(A) = probabilitas prior A yang mendahului terjadinya B. Disebut “prior”, karena nilainya bisa diperoleh tanpa perlu mempertimbangkan informasi apapun mengenai B terlebih dahulu.
P(A) juga berarti probabilitas ini diperoleh dari data sampel yang telah diketahui
berkelas A.P(B) = probabilitas prior B, dan bertindak sebagai normalizing constant. Secara
intuitif , teorema Bayes menggambarkan bahwa perubahan pada “A” dapat diamati apabila “B” terlebih dahulu diamatiSehingga Naïve Bayes Classifier dapat didefinisikan juga sebagai metode klasifikasi yang berdasarkan teori probabilitas dan teorema Bayesian dengan asumsi bahwa setiap variable atau parameter penentu (independence) sehingga keberadaan setiap variable tidak ada kaitannya dengan keberadaan attribute yang lain[4].
3.6 Peforming Measure
Langkah yang terakhir dari penelitian ini merupakan proses analisis dari sitem yang kita buat untuk mengukur akurasi dari sistem yang kita rancang sendiri. Pada tugas akhir kali ini proses pengukuran perofmansi diukur dari Precission, Recall,F-Measure dan Akurasi.
3.6.1 Confusion Matrix
Merupakan salah satu metode yang dapat digunakan untuk mengukur kinerja suatu metode klasifikasi pada dasarnya confusion matrix itu sendiri mengandung informasi yang membandingkan hasil klasifikasi yang dilakukan oleh sistem dengan hasil klasifikasi yang seharusnya.
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1685
3.6.2 Precision
Precision merupakan jumlah data yang benar diklasifikasikan dengan sebuah kelas dibagi dengan jumlah total data yang telah diklasifikasikan ke dalam kelas tersebut dengan rumus sebagai berikut[8].Niali precision digunakan untuk mengukur ketepatan rekomendasi yang dihasilkan oleh sistem[15].
( ) = ( + )
Dimana: TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan benar oleh sistem FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi salah oleh sistem
3.6.3 Recall
Recall adalah jumlah data yang benar diklasifikasikan dalam sebuah kelas dibagi dengan jumlah total data dalam kelas tersebut[12].
( ) = ( + )
Dimana: TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan benar oleh sistem. FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah oleh sistem.
3.6.4 F-Measure F-Measure digunakan untuk mengevaluasi rata-rata nilai Precision dan Recall hasil klasifikasi[8].
− = 2
- Dimana perhitungannya adalah 2 dikali dengan Precision dikali dengan hasil Recall dibagi jumlah Precision ditambah Recall
3.6.5 Akurasi
Akurasi merupakan parameter evaluasi terhadap sistem yang di bangun dalam penelitian tugas kahir ini. Berikut adalah rumus akurasi[5][6][14].
- =
( + + + )
Dimana: TP adalah True Positive, yaitu jumlah data positif yang terklasifikasi dengan benar oleh sistem. TN adalah True Negative, yaitu jumlah data negatif yang terklasifikasi dengan benar oleh sistem. FN adalah False Negative, yaitu jumlah data negatif namun terklasifikasi salah oleh sistem. FP adalah False Positive, yaitu jumlah data positif namun terklasifikasi salah oleh sistem.
3.6.6 Micro Pecision dan Recall
micro procession dan recall adalah hasil procession dan recall yang di dapat dari penjumlahan 3 confusion matrix.
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1686
4. Hasil dan Analisis
Berikut merupakan hasil dari perhitungan Peforming measure Gambar 1
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1687
Gambar 3 Analisis dari penelitian yang dibuat adalah : 1. Proses pemberian kelas (label) menggunakan sistem survei dianggap kurang efisien karena menyebabkan terlalu banyaknya perspektif yang terjadi sehingga menyebabkan akurasi menjadi bervariasi tergantung perspektif tiap pemberi surveinya.
2. Implementasi Naïve Bayes Classifier (NBC) dalam kasus pemilihan kepala daerah merupakan langkah yang baik dalam perhitungan akurasi dengan menggunakan 3 skenario.
3. Penggunaan Kamus Besar Bahasa Indoesia (KBBI) dianggap kurang ideal karena banyaknya kosakata yang tidak terdapat di KBBI sehingga di dalam sistem di anggap Null (tidak ada/data tidak tersedia).
4. Dari segi efisiensi waktu, KBBI online juga dianggap kurang ideal dikarenakan pencarian setiap kata kedalam sebuah website online dengan kecepatan proses preprocessingnya tergantung koneksi internet yang tersedia.
5. Skenario yang digunakan adalah menjadi 3 skenario yaitu skenario Pada skenario 1, data training di ambil 100% sementara data testing 10% dari jumlah data testingnya. Pada skenario kedua, data training diambil semua sementara data testing diambil 20% dari data trainingnya, pada skenario ketiga dilakukan pengujian yang sama dengan proses data training sebanyak 30%. Dengan rata rata akurasi ketiga skenario adalah Detik.com dengan akurasi makro 78% dan mikro 80%, Kompas.com 48% dan 48%, Liputan6.com 65% dan 65%, Tribunnews.com 65% dan 65% serta Republikaonline.com 77% dan 77%.
5. Evaluasi
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1688
Daftar Pustaka [1]Jurnal Library Binus, Romelteamedia.com;20014;BAB II Landasan Teori, Definis Media Online.[2]Ahmad Abu;Juni 2017;Mengenal Artificial Intelligence,Machine Learning,Neural Networkdan Deep Learning [3]Gufroni Irham Acep,Sulastri Heni; 02 (2017);PENERAPAN DATA MINING DALAM PENGELOMPOKAN PENDERITA THALASSAEMI; Tasikmalaya; http://teknosi.fti.unand.ac.id/ [4]Nofriansyah Dicky, Erwansyah Kamil, Ramadahn Mukhlis; 2 Mei 2016; Penerapan Data Mining dengan Algoritma Naive Bayes Clasifier untuk Mengetahui Minat Beli Pelanggan terhadap Kartu Internet XL (Studi Kasus di CV. Sumber Utama Telekomunikasi) [5]Sofiana Ika,Atastina Imelda, Suryani Ardiyanti Arie; 2012; ANALISIS PENGARUH FEATURE SELECTION MENGGUNAKAN INFORMATION GAIN DAN CHI-SQUARE UNTUK KATEGORISASI TEKS BERBAHASA INDONESIA; Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom.
[6]Ling Juen, Kencana N Eka Putu I, Oka bagus tjokorda; (3), Agustus 2014; ANALISIS SENTIMEN MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER DENGAN SELEKSI FITUR CHI SQUARE [7]Yunita Norma; 2 - AGUSTUS 2016;ANALISIS SENTIMEN BERITA ARTIS DENGAN MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE DAN PARTICLE SWARM OPTIMIZATION.
[8]Sembodo Eka Jaka; 2015; Analisis dan Implementasi Algoritma Naive Bayes Classifier untuk Kurator Berita di Twitter;Bandung. [9] Redakasi Sugono Dendi,Sugiyono,Maryani Yeyen, Qudrotillah taqdir meity dan Team;KAMUS BAHASA
INDONESIA ; 2008; PUSAT BAHASA DEPARTEMEN PENDIDIKAN NASIONAL;Jakarta.
[10] Dr. Taufik Fuadi Abidin, S.Si., M.Tech; Accuracy Measure Accuracy Measure Precision, Recall & F Precision, Recall & F-Measure; ProgramStudi Teknik Informatika FMIPA Universitas Syiah Kuala [11]Rosandy Triowali ;01 Mei 2016; PERBANDINGAN METODE NAIVE BAYES CLASSIFIER DENGAN METODE DECISION TREE (C4.5) UNTUK MENGANALISA KELANCARAN PEMBIAYAAN (Study Kasus : KSPPS / BMT AL-FADHILA); Informatics and Business Institute Darmajaya.
[12]Ariadi Dio dan Fithriasari Kartika; Klasifikasi Berita Indonesia Menggunakan Metode Naive Bayesian Classification dan Support Vector Machine dengan Confix Stripping Stemmer; Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember Jl. Arief Rahman Hakim, Surabaya 6011.
[13] Asch Vincent Van; September 9, 2013; Macro- and micro-averaged evaluation measures [[BASIC DRAFT]. [14] Safuan, Wahono Romi Satria, dan Supriyanto Catur ; Journal of Intelligent Systems, Vol. 1, No. 2, December 2015 ; Penanganan Fitur Kontinyu dengan Feature Discretization Berbasis Expectation Maximization Clustering untuk Klasifikasi Spam Email Menggunakan Algoritma ID3; Fakultas Ilmu Komputer, Universitas
Berikut hasil sentimen dari 5 media Detik.com
Skenario 1 Skenario 2
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1689
6. Lampiran
Skenario 3
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1690
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1691
Kompas Skenario 1 Skenario 2
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1692
Skenario 3
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1693
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1694
Liputan6 Skenario 1 Skenario 2 Skenario 3
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1695
Tribunnews Skenario 1 Skenario 2
Skenario 3
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1696
Republika Skenario 1
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1697
Skenario 2
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1698
Skenario 3
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1699
ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1700