25
BAB III ANALISIS DAN DESAIN
Bab ini berisi analisis dan rancangan sistem yang digunakan dalam penelitian ini meliputi diskripsi sistem, data, penyimpanan data, struktur data, dari
sistem.
3.1 Diskripsi sistem
Sistem yang dibangun merupakan sebuah sistem pemerolehan informasi, yang mempunyai fungsi untuk melakukan identifikasi makna
kata sabar pada sebuah Karya Sastra Indonesia. Proses idenfikasi atau
klasifikasi menggunakan metode Support Vector Machine SVM kenel
Polinomial. Data yang digunakan berupa data yang berformat .txt, data tersebut
dibagi menjadi dua bagian sebagai data test dan data trening. Kegunaan data traning sebagai sebuah data yang akan digunakan sebagai pembanding yang
benar dimana pembandingnya adalah data test. Data traning merupakan data yang yang akan diklasifikasikan atau diproses dengan metode SVM kernel
Polinomial. Sedang data test akan dibandingkan atau akan diuji dengan hasil dari data traning apakah data test tersebut dapat terklasifikasi dengan tepat
atau tidak. Hasil akhirnya adalah berupa akurasi, hasil akurasi adalah perbandingan antara hasil data test yang sudah dianalisa dangan sistem
dengan hasil data test sesuai dengan sumber. Dalam artian singkat apabila hasil dari sistem yang menguji data test dapat sama dengan hasil sumber
makas sistem atau metode yang klasifikasi SVM kernel polinomial berhasil. Semua data yang akan diproses dengan sistem akan dilakukan
preprocessing dimana tahapan ini untuk memberikan bobot untuk setiap kata yang akan diproses. Tahapannya adalah tokenisasi pemenggalan kata
dan penghapusan tanda baca, case folding mengubah kata kedalam huruf kecil, stopword penghapusan kata-kata yang tidak penting, stemming
pengembalian kata ke bentuk dasar, dan menghitung tf jumlah kemunculan kata yang sama dalam sebuah dokumen. Proses ini perlu
dilakukan dikarena SVM menggunakan data yang memiliki nilai sedang kata tidak memiliki nilai sehingga pengganti nilai menggunakan bobot ini
sama gunanya sebagai data yang memiliki nilai.
Gambar 3. 1 Skema Diskripsi Proses Klasifikasi SVM kernel Polinomial
Penghitungan akurasi melalui tahapan yang telah disediakan oleh library WEKA. Metode yang digunakan dari WEKA menggunkan input
data yang telah diproses terdahulu oleh system. 3.2
Data
Dalam penelitian ini, sistem mengklasifikasikan makna kata sabar dalam karya sastra yang didefinisikan menggunakan metode SVM. Data
diambil dari web corci.org sebagai data acuan dan data pendukung PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
penelitian ini. Data yang dipakai sebanyak 108 dokumen. Data ini dibagi menjadi data tranning dan data testing. Semua data disimpan dalam format
.txt .
3.3 Penyimpanan Data