hingga maksimal untuk 100. Pada predict data penerbangan linear terdapat 5 data domestik.penerbangan dan 3 data internasional penerbangan.sehingga totalnya ada 8
data test untuk prediksi. Tahapan klasifikasi yang menggunakan model untuk mengklasifikasi teks dan menghasilkan perkiraan prediksi. Hasil prediksi ini dapat
mengandung keluaran informasi yang bersifat benar dan salah. Pada tahapan pengklasifikasian dokumen jenis penerbangan angkutan udara
adalah suatu tahap pemberian kategori yang telah didefinisikan kepada dokumen angkutan udara yang belum memiliki kategori. Mengklasifikasikan dokumen jenis
penerbangan merupakan cara untuk mengorganisasikan dokumen penerbangan angkutan udara. Dokumen-dokumen penerbangan yang memiliki isi yang sama akan
dikelompokkan ke dalam kategori yang sama. Dengan demikian orang-orang yang melakukan pencarian informasi yang berhubungan dengan data angkutan udara dapat
dengan mudah melewatkan kategori yang tidak berkaitan dengan informasi penerbangan yang dicari. Tahapan pengklasifikasian data penerbangan yaitu
menggunakan model dari training data penerbangan angkutan udara dan menghasilkan perkiraan atau prediksi. Hasil prediksi ini dapat mengandung keluaran
yang benar dan salah.
IV.2 Analisis Training dan Testing Set Menggunakan ROC
Untuk mengklasifikasikan data sehingga mendapatkan model terbaik dari SVM maka perlu dilakukan langkah-langkah sebagai berikut :
Data yang telah diinputkan dibagi dalam 2 bagian yakni training set dan testing set. Adapun pembagian untuk data training set adalah sebesar 75 dari data awal
sedangkan sisanya untuk data testing set sebesar 25 yang diambil secara random. x = {x
, x
1
, x
2,
x
3, …,
x
n
} y = {y
: sampel training , y
1,
… , y
m
Sebelum data diolah dengan menggunakan metode support vector machine, maka dilakukan preprocessing data terlebih dahulu. Yakni dengan menormalisasikannya
menggunakan library RWeka dari perangkat lunak R. Hal ini dilakukan untuk mendapatkan hasil analisis yang lebih akurat tanpa merubah informasi yang
dikandung didalamnya. Setelah melakukan tahap pembelajaran dan dihasilkan model klasifikasi, langkah selanjutnya adalah melakukan pengklasifikasian terhadap data
testing. Evaluasi hasil didasarkan pada tingkat keakurasian data yang terklasifikasi }Ć {±1} : label data training
Universitas Sumatera Utara
dengan benar. Semakin tinggi nilai akurasi, maka akan menunjukkan tingkat keberhasilan yang pula dari system dalam mengklasifikasikan data ke dalam kategori-
kategorinya. Model pada penelitian ini juga dibangun menggunakan SVM Light yang terdapat
pada perangkat lunak R.Model yang didapat diuji keakuratannya dengan menggunakan Receiver Operating Characteristics ROC yang terdapat didalam paket
versi coTools 1.10 pada R.Model yang akurat adalah model yang memiliki nilai Area Under Curve AUC mendekati satu dan nilai kurva ROC 0,5.
Gambar 4.2. Kurva ROC dengan luas area AUC terbaik
AUC Area Under Curve adalah luas daerah di bawah kurva ROC. Apabila nilainya mendekati satu, maka model yang didapat lebih akurat. Berdasarkan gambar
di atas maka dapat dilihat karakteristik dari AUC adalah sebagai berikut : -
Area maksimum adalah 1 -
Jika ROC = 0,5 maka model yang dihasilkan belum terlihat optimal -
Sedangkan jika ROC 0,5 maka model yang dihasilkan akan lebih baik.
Gambar 4.2 adalah kurva ROC yang memiliki luas area AUC hanya sebesar 84,31. Artinya model yang terbaik yaitu berdasarkan kurva ROC yang tertinggi
Interpretasi Kurva ROC
Universitas Sumatera Utara
sebesar 84,31 dengan parameternya kernel linear. Model yang didapat telah lebih bagus sebesar 84,31.
Pada data.penerbangan, model yang dihasilkan oleh kernel linear berdasarkan kurva ROC dari kategori diatas adalah diatas 50. Akurasi model tertinggi
berdasarkan kurva ROC dihasilkan oleh kernel linear adalah sebesar 84,31 artinya model yang dihasilkan memiliki keakuratan hingga 84,31 dengan support vector
sebanyak 4 support vector pada garis hyperplane yang terdapat pada satu bidang untuk kelas penerbangan domestik dan kelas penerbangan internasional, support
vector yang dihasilkan oleh model pengklasifikasian. Pada tahapan pengklasifikasian dokumen jenis penerbangan angkutan udara
adalah suatu tahap pemberian kategori yang telah didefinisikan kepada dokumen angkutan udara yang belum memiliki kategori. Mengklasifikasikan dokumen jenis
penerbangan merupakan cara untuk mengorganisasikan dokumen penerbangan angkutan udara. Dokumen penerbangan yang memiliki isi yang sama akan
dikelompokkan ke dalam kategori yang sama. Dengan demikian orang yang melakukan pencarian informasi yang berhubungan dengan data angkutan udara dapat
dengan mudah melewatkan kategori yang tidak berkaitan dengan informasi penerbangan. Tahapan pengklasifikasian data penerbangan yaitu menggunakan model
dari training data penerbangan angkutan udara yang menghasilkan prediksi.
IV.3 Tampilan Listing Program Analisis Training Set dan Testing Set