sebanyak 75 file. Ukuran file utuh pdf yang digunakan antara 75,509 byte sampai 178,805 byte. Ukuran file utuh rtf yang digunakan antara 255,469 byte sampai
437,361 byte. Ukuran file utuh doc yang digunakan antara 93,696 byte sampai 109,568 byte. Selanjutnya, file fragment yang digunakan sebanyak 240 file. Ukuran
file fragment pdf yang digunakan antara 167,770 byte sampai 204,648 byte. Ukuran
file fragment rtf yang digunakan antara 252,133 byte sampai 575,967 byte. Ukuran file
fragment doc yang digunakan antara 107,520 byte sampai 167,936 byte.
File -file yang sudah dikumpulkan terbagi menjadi dua dataset, yaitu: training
dataset atau data pelatihan, dan testing dataset atau dataset pengujian yang berupa
file -file fragment. Sebelum dilakukan pengujian untuk mengidentifikasi file fragment,
program akan terlebih dahulu diuji untuk mengidentifikasi file utuh dari masing- masing tipe data.
3.7. Proses Pengecekan Akurasi
Akurasi identifikasi tipe file dari file fragment akan dilakukan dengan cara sebagai berikut:
1. Pengelompokan file fragment pdf, gif, dan doc ke dalam folder yang terpisah.
2. Program melakukan identifikasi LCS dengan menghitung tingkat persentase
kemiripan LCS pada folder file fragment pdf, serta menghitung tingkat persentase kemiripan LCS pada signature trailer dan menghitung akurasi
program mengidentifikasi file-file di dalam folder tersebut sebagai pdf, rtf, dan doc.
3. Dilakukan perhitungan akurasi keseluruhan.
BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM
Bab ini membahas hasil penelitian yang dilakukan dari identifikasi tipe file dari file fragment dengan metode Longest Common Subsequences LCS sesuai dengan
spesifikasi penerapan yang telah dibahas pada Bab 3. Bab ini akan menjabarkan hasil dari akurasi metode LCS dalam mengidentifikasi tipe file serta hasil validasi dari file
tersebut.
4.1. Hasil Training
Pada bagian ini akan dijabarkan hasil training yang dilakukan. Training dilakukan dengan menggunakan tiga tipe data, yaitu jpg, rtf, dan doc dengan jumlah 100 file per
tipe data. Prosedur training LCS yang dilakukan adalah dengan memasukkan seluruh file training
dengan tipe data yang serupa ke dalam folder, kemudian program akan membaca file yang terdapat pada folder tersebut satu per satu. Program akan
mengambil input berupa dua buah file, kemudian mengubah hex number file tersebut menjadi string, dan melakukan aplikasi algoritma LCS untuk mendapatkan LCS dari
kedua file tersebut. Setelah itu, program kemudian akan mengambil sebuah file sebagai input selanjutnya kemudian dibandingkan hex number file tersebut dengan
output yang dihasilkan pada training kedua file sebelumnya. Bila seluruh file sudah selesai dilatih, maka program akan berhenti dan hasil akhir akan didapat. Hasil
training LCS pada tipe data pdf, rtf, dan doc dapat dilihat pada gambar 4.1, 4.2, dan
4.3 secara berturut-turut. Sedangkan rincian hasil training dapat dilihat pada lampiran B.
Gambar 4.1. Hasil training LCS PDF
Hasil training LCS pdf pada gambar 4.1 di atas menghasilkan LCS sepanjang 25 karakter.
Gambar 4.2. Hasil training LCS RTF
Hasil training LCS rtf pada gambar 4.2 menghasilkan LCS sepanjang 116
karakter.
Gambar 4.3. Hasil training LCS DOC
Hasil training LCS doc pada gambar 4.3 menghasilkan LCS.sepanjang 13 karakter.
4.2. Hasil Testing