4.3.2 Proses Input Bobot
Menginput bobot berfungsi untuk memberi nilai dalam setiap term yang digunakan dalam proses WEKA berupa nilai dari tiap
bobot yang digunakan ditiap term dalam dokumen.
try { BufferedReader br = new BufferedReadernew
InputStreamReadernew FileInputStreamd:\\skripsi\\bobot_6.txt; String it = ;
while it = br.readLine = null { String[] vals = it.split;;
String nama = vals[0]; Instance inst = new DenseInstanceinstances.numAttributes;
inst.setDatasetinstances; inst.setValueinstances.attributeNAMA, nama;
for String i : cls { if nama.containsi {
inst.setValueinstances.attributeKELAS, i; break;
} }
for int i = 1; i vals.length - 2; i++ { inst.setValuei + 1, Double.parseDoublevals[i];
} instances.addinst;
} br.close;
} catch IOException e { e.printStackTrace;
}
List Code 4. 9 Create instances
4.3.3 Mengunkan WEKA
Berisi perintah untuk memanggil metode yang dimiliki oleh libary dari WEKA ini memanggil sekaligus proses yang sudah
dibuat untuk input data yang sudah disiapkan oleh proses yang dibuat penulis.
try { ArrayListPrediction preds = new
EvaluationUtils.getCVPredictionssmo, instCopy, 5; ArrayListPrediction preds3 = new
EvaluationUtils.getTrainTestPredictionssmo, instCopy, instCopy; ConfusionMatrix cm = new ConfusionMatrixcls.toArraynew
String[0]; ConfusionMatrix cm3 = new ConfusionMatrixcls.toArraynew
String[0]; cm.addPredictionspreds;
cm3.addPredictionspreds3; System.out.println;
System.out.printlnHasil Akurasi : ; System.out.println- cross-validation : + cm.correct 100d
preds.size; System.out.println- use training set : + cm3.correct 100d
preds3.size; System.out.println;
} catch Exception ex { Logger.getLoggerSVM_WEKA.class.getName.logLevel.SEVERE, null,
ex; }
List Code 4. 10 Menghitung akurasi mengunklan library WEKA
50
BAB V ANALISIS HASIL
5.1 Skema Pengujian
Pengujian dilakukan dengan menggunakan metode
k-fold cross validation.
Dimana data
training
akan dibagi ke dalam sejumlah
k fold.
Setiap
fold
akan diisi dengan data
training
tiap kategori secara merata. Setiap
fold
akan diperlakukan sebagai data
testing
dan data
training
secara bergantian sesuai dengan dengan tahapan penghitungan akurasi, dimana banyaknya tahapan penghitungan akurasi sama dengan jumlah
fold.
Setelah semua tahapan proses penghitungan akurasi dilakukan, maka seluruh data
training
yang diuji akan terklasifikasi, kemudian dihitung persentase data yang terklasifikasi dengan tepat sesuai dengan kategori
awal. Dalam pengujian ini akan dilakukan sebanyak 2 kali yaitu yang
pertama 5
fold cross validation
untuk dokumen yang mengandung enam kategori dengan jumlah data sebanyak 108 data, kedua menggunakan 5
fold cross validation
untuk dokumen yang mengandung 6 kategori dengan jumlah data 36 data. Setiap pengujian disertakan dengan pengujian dimana
data test merupakan data traning. Berikut ini rincian data yang akan dilakukan pengujian :
1. Pengujian 1
Diuji dengan metode akurasi
cross-falidation
. 5
fold cross validation
untuk. Jumlah data yang dipakai 108 data ,berikut data yang diuji :