Diskripsi sistem ANALISIS DAN DESAIN

25

BAB III ANALISIS DAN DESAIN

Bab ini berisi analisis dan rancangan sistem yang digunakan dalam penelitian ini meliputi diskripsi sistem, data, penyimpanan data, struktur data, dari sistem.

3.1 Diskripsi sistem

Sistem yang dibangun merupakan sebuah sistem pemerolehan informasi, yang mempunyai fungsi untuk melakukan identifikasi makna kata sabar pada sebuah Karya Sastra Indonesia. Proses idenfikasi atau klasifikasi menggunakan metode Support Vector Machine SVM kenel Polinomial. Data yang digunakan berupa data yang berformat .txt, data tersebut dibagi menjadi dua bagian sebagai data test dan data trening. Kegunaan data traning sebagai sebuah data yang akan digunakan sebagai pembanding yang benar dimana pembandingnya adalah data test. Data traning merupakan data yang yang akan diklasifikasikan atau diproses dengan metode SVM kernel Polinomial. Sedang data test akan dibandingkan atau akan diuji dengan hasil dari data traning apakah data test tersebut dapat terklasifikasi dengan tepat atau tidak. Hasil akhirnya adalah berupa akurasi, hasil akurasi adalah perbandingan antara hasil data test yang sudah dianalisa dangan sistem dengan hasil data test sesuai dengan sumber. Dalam artian singkat apabila hasil dari sistem yang menguji data test dapat sama dengan hasil sumber makas sistem atau metode yang klasifikasi SVM kernel polinomial berhasil. Semua data yang akan diproses dengan sistem akan dilakukan preprocessing dimana tahapan ini untuk memberikan bobot untuk setiap kata yang akan diproses. Tahapannya adalah tokenisasi pemenggalan kata dan penghapusan tanda baca, case folding mengubah kata kedalam huruf kecil, stopword penghapusan kata-kata yang tidak penting, stemming pengembalian kata ke bentuk dasar, dan menghitung tf jumlah kemunculan kata yang sama dalam sebuah dokumen. Proses ini perlu dilakukan dikarena SVM menggunakan data yang memiliki nilai sedang kata tidak memiliki nilai sehingga pengganti nilai menggunakan bobot ini sama gunanya sebagai data yang memiliki nilai. Gambar 3. 1 Skema Diskripsi Proses Klasifikasi SVM kernel Polinomial Penghitungan akurasi melalui tahapan yang telah disediakan oleh library WEKA. Metode yang digunakan dari WEKA menggunkan input data yang telah diproses terdahulu oleh system. 3.2 Data Dalam penelitian ini, sistem mengklasifikasikan makna kata sabar dalam karya sastra yang didefinisikan menggunakan metode SVM. Data diambil dari web corci.org sebagai data acuan dan data pendukung PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI penelitian ini. Data yang dipakai sebanyak 108 dokumen. Data ini dibagi menjadi data tranning dan data testing. Semua data disimpan dalam format .txt .

3.3 Penyimpanan Data