Analisis SVM Training Analisis Klasifikasi Kalimat Menggunakan Metode SVM
Tabel 3.12 Proses SVM Training
Kalimat Term
Label S1
pemerintah malaysia libur sekolah dua hari lindung anak kabut asap asal indonesia senin
1 S2
indeks polusi udara berbagai wilayah negeri jiran sentuh level sangat tidak sehat
1 S3
otoritas paksa tutup sekolah hari selasa besok 1
S4 shah alam selangor indeks polusi udara turun cukup tajam
1 S5
angka indeks aman moderat tidak sehat sangat bahaya 1
S6 dapat area malaysia utama wilayah utara level tidak sehat buruk penang
level 1
S7 kabut asap paksa berapa bandara malaysia tutup minggu
1 S8
acara lari maraton kuala lumpur batal 1
Dari Tabel 3.8 didapat hasil pembobotan tf-idf diketahui bobot setiap kata term dari semua kalimat. Selanjutnya data tersebut diubah formatnya ke dalam
format data SVM, dapat dilihat pada lampiran tabel perhitungan Tabel 7 Format Data SVM. Untuk label dalam setiap kalimat dapat dilihat pada lampiran tabel
perhitungan Tabel 8 Label Data SVM. Kemudian tahap selanjutnya adalah melakukan perhitungan
dimana , = , . . , �. Untuk adalah seluruh nilai
yang diambil dari kolom S1, = S2 sampai
= S8. Sedemikian sehingga setiap kalimat untuk nilai
dapat diubah sesuai hasil pembobotan tf-idf menjadi bentuk sebagai berikut, sebagai contoh bentuk pada kalimat pertama:
= [0.903, 0.426, 0.903, 0.602, 0.903, 0.602, 0.903, 0.903, 0.602, 0.602, 0.903, 0.903, 0.903, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] Kemudian data vektor setiap kalimat sesuai dengan hasil pembobotan tf-idf
pada setiap kalimatnya. Dilakukan perhitungan pada setiap kalimat, sebagai
contoh dilakukan perhitungan pada kalimat pertama sebagai berikut: = [0.903, 0.426, 0.903, 0.602, 0.903, 0.602, 0.903, 0.903, 0.602, 0.602, 0.903,
0.903, 0.903, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] [0.903, 0.426, 0.903, 0.602,
0.903, 0.602, 0.903, 0.903, 0.602, 0.602, 0.903, 0.903, 0.903, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0] = 0.816 + 0.181 + 0.816 + 0.362 + 0.816 + 0.362 + 0.816 + 0.816 + 0.362 +
0.362+ 0.816 + 0.816 + 0.816 = 8.156
Setelah dilakukan perhitungan pada seluruh kalimat, maka matriks yang terbentuk dari hasil perhitungan
adalah sebagai berikut:
=
[ .
. .
. .
. .
. .
.
. .
. .
. .
. .
. .
. .
. .
. .
. .
] Kemudian tahap selanjutnya adalah melakukan perhitungan
dimana , = , . . , �. Untuk nilai
adalah nilai dari label yang diberikan. Sesuai pada lampiran tabel perhitungan Tabel 8 Label Data SVM, sehingga matriks yang
terbentuk dari hasil perhitungan adalah hasilnya sebagai berikut:
=
[ ]
Kemudian tahap selanjutnya adalah mencari nilai , didapatkan dengan
menggunakan persamaan 2.25. Proses mendapatka nilai diawali dengan
mengubah setiap kalimat menjadi nilai vektor support vector =
.
Nilai x didapatkan menggunakan persamaan 2.23 sehingga didapatkan untuk nilai x pada
setiap kalimat pada Tabel 3.13 berikut:
Tabel 3.13 Nilai x Setiap Kalimat
Kalimat S1
S2 S3
S4 S5
S6 S7
S8 X
9.968 7.523
5.437 6.887
5.62 8.339
5.89 4.893
Nilai y didapatkan menggunakan persamaan 2.24, sehingga didapatkan untuk
nilai x pada setiap kalima pada Tabel 3.14 berikut: Tabel 3.14 Nilai y Setiap Kalimat
Kalimat S1
S2 S3
S4 S5
S6 S7
S8 Y
8 8
8 8
8 8
8 8
Seteleh nilai x dan y didapatkan, substitusikan nilai tersebut ke persamaan 2.22. Sebagai contoh perhitungan dilakukan pada kalimat pertama S1, proses
perhitungan sebagai berikut: = � [ .
] = [ . − .
+ . −
. − + .
− ] = [ .. ]
Setelah dilakukan perhitungan terhadap seluruh kalimat, maka didapatkan hasilnya pada Tabel 3.15 sebagai berikut:
Tabel 3.15 Support Vector Setiap Kalimat
Kalimat S1
S2 S3
S4 S5
S6 S7
S8 Support
Vector [ .. ] [
. .
] [ .. ] [ .
. ] [ .. ] [
. .
] [ .. ] [ .
. ]
Setelah itu masing-masing support vector diberi nilai bias 1. Untuk mendapatkan jarak tegak lurus yang optimal dengan mempertimbangkan vektor
positif, serta membantu mendapatkan nilai b atau nilai hyperplane[3], hasilnya dapat dilihat pada Tabel 3.16 berikut:
Tabel 3.16 Support Vector Bias
Kalimat S1
S2 S3
S4 S5
S6 S7
S8 Support
Vector Bias
[ .
. ] [
. .
] [ .
. ] [
. .
] [ .
. ] [
. .
] [ .
. ] [
. .
]
Kemudian kalikan setiap kalimat menggunakan persamaan 2.25, sebagai contoh dilakukan perhitungan pada kalimat pertama S1 berikut:
[
. .
]
∗
[
. .
]
= .
Setelah dilakukan perhitungan pada seluruh kalimat.
Kemudian cari parameter menggunakan persamaan 2.26, dengan cara substitusikan nilai hasil dari
perhitungan menggunakan persamaan 2.25, sehingga bentuknya dapat dilihat sebagai berikut:
79.867 +47.406
+136.950 +63.268
+124.775 +41.751
+108.329 +178.049
= 1 47.406
+29.676 +85.985
+39.874 +78.413
+25.546 +68.166
+111.484 = 1
136.590 +85.985
+253.531 +116.478
+231.057 +73.316
+200.630 +329.168
= 1 63.268
+39.874 +116.478
+53.808 +106.200
+34.101 +92.285
+151.073 = 1
124.775 +78.413
+231.057 +106.200
+210.584 +66.856
+182.866 +299.958
= 1 41.751
+25.546 +73.316
+34.101 +66.856
+22.292 +58.122
+95.098 = 1
108.329 +68.166
+200.630 +92.285
+182.866 +58.122
+158.814 +260.413
= 1 178.049
+111.484 +329.168
+151.073 +299.958
+95.098 +260.413
+427.485 = 1
Sedemikian sehingga didapatlah nilai untuk sampai
berikut:
= 0.005, = 3.143,
= 4.398, = -4.550,
= -1.661, = -0.064,
= 2.958, = -3.216
Setelah didapatkan nilai masukkan ke persamaan 2.26 sesuai Tabel 3.16 seperti berikut:
� ̃
= .
[
. .
]
+ .
[
. .
]
+ .
[
. .
]
+ − .
[
. .
]
+
− .
[
. .
]
+ − .
[
. .
]
+ .
[
. .
]
+ − .
[
. .
]
=
[ .
. .
] + [ .
. .
] + [ .
. .
] + [ − .
− . − .
] + [ − .
− . − .
] + [ − .
− . − .
] + [ .
. .
] + [
− . − .
− . ]
= [
. .
. ]
Kemudian hasil yang didapatkan melalui perhitungan dengan menggunakan persamaan 2.27, digunakan persamaan 2.28 dengan hasil yang didapatkan:
= [
. .
. .
] = [ ] dan =
. .
= 13.507
Sedemikian sehingga didapatkanlah nilai hyperplane untuk mengklasifikasikan kedua kelas, yaitu 13.507.