PHP Analisis Sentimen Pengguna Twitter Terhadap Partai Politik Peserta Pemilu 2014 Menggunakan Algoritma C4.5 Decision Tree Learning

Pernyataan print hanya akan membalikan satu nilai keluaran saja. Printf memiliki aturan seperti dibawah ini. 2. pernyataan echo echo memiliki tujuan yang sama dengan print meskipun ada perbedaan teknis antara echo dan print. Echo memiliki struktur dibawah ini. 3. Variabel Variabel adalah sebuah simbol yang dapat menyimpan nilai yang berbeda pada waktu yang berbeda. Dalam mendeklarasikan sebuah variabel, dimulai dengan menulis tanda dolar , yang kemudian diikuti oleh nama variabel. Nama variabel dapat dimulai dengan huruf atau garis bawah, karakter ASCII 127 sampai 255 karakter. Contoh penulisan variabel yang valid adalah color, model_, operating_system, atau _schema. 4. Ekspresi Ekspresi merupakan sebuah frasa yang mengekspresikan keterangan aksi dalam suatu program. Ekspresi terdiri dari operand dan operator. Operand merupakan masukan dari sebuah ekspresi. 5. Struktur Kontrol ?php print“pBaju saya berwarna kuning.p”; ? ?php hello = “Selamat Pagi”; echo hello.” dunia”; ? sum = var1 + var2; sum, var1, var2 adalah operand a++; a adalah operand Gambar 2.12 Pernyataan print Gambar 2.13 Pernyataan echo Gambar 2.14 Ekspresi Struktur kontrol menerangkan alur kode yang terdapat dalam sebuah aplikasi. Mendefinisikan pengeksekusian karakteristik seperti bagaimana dan berapa kali kode tersebut di eksekusi. a. Pernyataan Kondisi Pernyataan kondisi memungkinkan sebuah program untuk melakukan berbagai macam input, menggunakan bermacam kondisi yang didasari dengan sebuah nilai masukan. a Pernyataan if b Pernyataan else c Pernyataan else-if b. Pernyataan Perulangan Pernyataan perulangan memungkinkan sebuah program untuk melakukan sebuah instruksi yang berulang sampai kondisi yang diinginkan tercapai. a Pernyataan while b Pernyataan do-while c Pernyataan for d Pernyataan foreach 35 BAB 3 ANALISIS DAN PERANCANGAN

3.1 Analisis Sistem

Dalam proses pembuatan suatu sistem dilakukan analisis terhadap sistem yang akan dibangun. Analisis yang dilakukan untuk membangun aplikasi analisis sentimen pengguna twitter terhadap partai politik peserta PEMILU 2014 menggunakan pohon keputusan yang dibangun oleh algoritma C4.5.

3.1.1 Analisis Masalah

Masalah yang timbul dalam sistem analisis sentimen pengguna twitter terhadap partai politik peserta PEMILU 2014 adalah mengklasifikasikan tweet ke dalam opini positif dan negatif menggunakan algoritma C4.5.

3.1.2 Analisis Proses

Analisis proses ini akan menjelaskan mengenai proses yang digunakan aplikasi analisis sentimen pengguna twitter terhadap partai politik peserta PEMILU 2014 menggunakan pohon keputusan yang dibangun oleh algoritma C4.5.

3.1.2.1 Proses Text Pre-processing

Proses Text Pre-processing dilakukan untuk mempersiapkan data sebelum ke proses selanjutnya, yaitu pemberian kelas kata untuk setiap kata dalam suatu tweet dan klasifikasi sentimen positif dan negatif. Terdapat beberapa sub proses dari text pre-processing, yaitu tokenization, case folding, dan stemming .

3.1.2.1.1 Tokenization

Tokenization dilakukan untuk memecah suatu kalimat dalam seluruh isi dokumen menjadi sekumpulan kata. Setiap kata yang telah dipecah dari kalimattweet akan disimpan ke basis data dengan atributnya yaitu id tweet. Gambar 3.1 Tokenization

3.1.2.1.2 Casefolding

Case folding adalah proses mengubah semua huruf yang ada pada seluruh dokumen menjadi huruf ke cil. Huruf “a” sampai dengan “z”yang akan diproses, karakter selain huruf akan dianggap delimiter. Proses ini dilakukan untuk menghindari duplikasi data sehingga kata yang memiliki perbedaan huruf kecil dan besar tetapi sama maka kata tersebut tidak akan disimpan. Gambar 3.2 Casefolding

3.1.2.1.3 Stemming

Algoritma stemming yang digunakan pada penelitian ini adalah algoritma nazief dan adriani yang dibuat oleh Bobby Nazief dan Mirna Adriani Gambar 3.3 Stemming

3.1.2.2 Proses Pembentukan Pohon Keputusan

Data hasi text preprocessing selanjutnya diklasifikasikan menggunakan pohon keputusan yang dibangun algoritma C4.5. Sebelum pohon keputusan digunakan untuk mengklasifikasikan ke data sebenarnya, model pohon keputusan belajar dari data training yang telah mempunyai kelas, yaitu negatif dan positif. Pada seluruh dokumen tweet yang ada, setiap kata yang muncul dijadikan atribut untuk perhitungan entropi dan gain. nilai dari atribut tersebut adalah biner 0 dan 1., dimana nilai 0 mengartikan tidak munculnya kata tersebut pada tweet, dan nilai 1 mengartikan bahwa kata tersebut muncul pada tweet. Pada tabel III.1 adalah data latih yang digunakan dan tabel III.2 adalah implementasi perhitungan kasus algoritma C4.5 untuk membangun model pohon keputusan dengan atribut semua kata yang muncul dengan nilai 1 atau 0, dan atribut tujuan opini dengan nilai positif dan negatif. Tabel 3.1 Training Data No. Training Data Kelas 1 dukung caleg pejuang partai abc Positif 2 masih muda sudah dibohongi partai abc Negatif 3 tidak jadi Dukung partai abc Negatif 4 Wiranto memiliki pergaulan internasional yang cukup baik. Positif 5 gua bilang partai abc partai korupsi Negatif 6 caleg dari partai abc bersih dari korupsi Positif