Proses Pengecekan Akurasi Hasil Training

sebanyak 75 file. Ukuran file utuh pdf yang digunakan antara 75,509 byte sampai 178,805 byte. Ukuran file utuh rtf yang digunakan antara 255,469 byte sampai 437,361 byte. Ukuran file utuh doc yang digunakan antara 93,696 byte sampai 109,568 byte. Selanjutnya, file fragment yang digunakan sebanyak 240 file. Ukuran file fragment pdf yang digunakan antara 167,770 byte sampai 204,648 byte. Ukuran file fragment rtf yang digunakan antara 252,133 byte sampai 575,967 byte. Ukuran file fragment doc yang digunakan antara 107,520 byte sampai 167,936 byte. File -file yang sudah dikumpulkan terbagi menjadi dua dataset, yaitu: training dataset atau data pelatihan, dan testing dataset atau dataset pengujian yang berupa file -file fragment. Sebelum dilakukan pengujian untuk mengidentifikasi file fragment, program akan terlebih dahulu diuji untuk mengidentifikasi file utuh dari masing- masing tipe data.

3.7. Proses Pengecekan Akurasi

Akurasi identifikasi tipe file dari file fragment akan dilakukan dengan cara sebagai berikut: 1. Pengelompokan file fragment pdf, gif, dan doc ke dalam folder yang terpisah. 2. Program melakukan identifikasi LCS dengan menghitung tingkat persentase kemiripan LCS pada folder file fragment pdf, serta menghitung tingkat persentase kemiripan LCS pada signature trailer dan menghitung akurasi program mengidentifikasi file-file di dalam folder tersebut sebagai pdf, rtf, dan doc. 3. Dilakukan perhitungan akurasi keseluruhan. BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM Bab ini membahas hasil penelitian yang dilakukan dari identifikasi tipe file dari file fragment dengan metode Longest Common Subsequences LCS sesuai dengan spesifikasi penerapan yang telah dibahas pada Bab 3. Bab ini akan menjabarkan hasil dari akurasi metode LCS dalam mengidentifikasi tipe file serta hasil validasi dari file tersebut.

4.1. Hasil Training

Pada bagian ini akan dijabarkan hasil training yang dilakukan. Training dilakukan dengan menggunakan tiga tipe data, yaitu jpg, rtf, dan doc dengan jumlah 100 file per tipe data. Prosedur training LCS yang dilakukan adalah dengan memasukkan seluruh file training dengan tipe data yang serupa ke dalam folder, kemudian program akan membaca file yang terdapat pada folder tersebut satu per satu. Program akan mengambil input berupa dua buah file, kemudian mengubah hex number file tersebut menjadi string, dan melakukan aplikasi algoritma LCS untuk mendapatkan LCS dari kedua file tersebut. Setelah itu, program kemudian akan mengambil sebuah file sebagai input selanjutnya kemudian dibandingkan hex number file tersebut dengan output yang dihasilkan pada training kedua file sebelumnya. Bila seluruh file sudah selesai dilatih, maka program akan berhenti dan hasil akhir akan didapat. Hasil training LCS pada tipe data pdf, rtf, dan doc dapat dilihat pada gambar 4.1, 4.2, dan 4.3 secara berturut-turut. Sedangkan rincian hasil training dapat dilihat pada lampiran B. Gambar 4.1. Hasil training LCS PDF Hasil training LCS pdf pada gambar 4.1 di atas menghasilkan LCS sepanjang 25 karakter. Gambar 4.2. Hasil training LCS RTF Hasil training LCS rtf pada gambar 4.2 menghasilkan LCS sepanjang 116 karakter. Gambar 4.3. Hasil training LCS DOC Hasil training LCS doc pada gambar 4.3 menghasilkan LCS.sepanjang 13 karakter.

4.2. Hasil Testing