4.3.2 Proses Input Bobot
Menginput bobot berfungsi untuk memberi nilai dalam setiap term yang digunakan dalam proses WEKA berupa nilai dari tiap
bobot yang digunakan ditiap term dalam dokumen.
try { BufferedReader br = new BufferedReadernew
InputStreamReadernew FileInputStreamd:\\skripsi\\bobot_6.txt; String it = ;
while it = br.readLine = null { String[] vals = it.split;;
String nama = vals[0]; Instance inst = new DenseInstanceinstances.numAttributes;
inst.setDatasetinstances; inst.setValueinstances.attributeNAMA, nama;
for String i : cls { if nama.containsi {
inst.setValueinstances.attributeKELAS, i; break;
} }
for int i = 1; i vals.length - 2; i++ { inst.setValuei + 1, Double.parseDoublevals[i];
} instances.addinst;
} br.close;
} catch IOException e { e.printStackTrace;
}
List Code 4. 9 Create instances
4.3.3 Mengunkan WEKA
Berisi perintah untuk memanggil metode yang dimiliki oleh libary dari WEKA ini memanggil sekaligus proses yang sudah
dibuat untuk input data yang sudah disiapkan oleh proses yang dibuat penulis.
try { ArrayListPrediction preds = new
EvaluationUtils.getCVPredictionssmo, instCopy, 5; ArrayListPrediction preds3 = new
EvaluationUtils.getTrainTestPredictionssmo, instCopy, instCopy; ConfusionMatrix cm = new ConfusionMatrixcls.toArraynew
String[0]; ConfusionMatrix cm3 = new ConfusionMatrixcls.toArraynew
String[0]; cm.addPredictionspreds;
cm3.addPredictionspreds3; System.out.println;
System.out.printlnHasil Akurasi : ; System.out.println- cross-validation : + cm.correct 100d
preds.size; System.out.println- use training set : + cm3.correct 100d
preds3.size; System.out.println;
} catch Exception ex { Logger.getLoggerSVM_WEKA.class.getName.logLevel.SEVERE, null,
ex; }
List Code 4. 10 Menghitung akurasi mengunklan library WEKA
50
BAB V ANALISIS HASIL
5.1 Skema Pengujian
Pengujian dilakukan dengan menggunakan metode k-fold cross validation. Dimana data training akan dibagi ke dalam sejumlah k fold.
Setiap fold akan diisi dengan data training tiap kategori secara merata. Setiap fold akan diperlakukan sebagai data testing dan data training
secara bergantian sesuai dengan dengan tahapan penghitungan akurasi, dimana banyaknya tahapan penghitungan akurasi sama dengan jumlah fold.
Setelah semua tahapan proses penghitungan akurasi dilakukan, maka seluruh data training yang diuji akan terklasifikasi, kemudian dihitung
persentase data yang terklasifikasi dengan tepat sesuai dengan kategori awal.
Dalam pengujian ini akan dilakukan sebanyak 2 kali yaitu yang pertama 5 fold cross validation untuk dokumen yang mengandung enam
kategori dengan jumlah data sebanyak 108 data, kedua menggunakan 5 fold cross validation untuk dokumen yang mengandung 6 kategori dengan
jumlah data 36 data. Setiap pengujian disertakan dengan pengujian dimana data test merupakan data traning.
Berikut ini rincian data yang akan dilakukan pengujian : 1.
Pengujian 1 Diuji dengan metode akurasi cross-falidation. 5 fold cross
validation untuk. Jumlah data yang dipakai 108 data ,berikut data yang diuji :