sebanyak 75 file. Ukuran
file
utuh pdf yang digunakan antara 75,509 byte sampai 178,805 byte. Ukuran
file
utuh rtf yang digunakan antara 255,469 byte sampai
437,361 byte. Ukuran
file
utuh doc yang digunakan antara 93,696 byte sampai 109,568 byte. Selanjutnya,
file fragment
yang digunakan sebanyak 240
file
. Ukuran
file fragment
pdf yang digunakan antara 167,770 byte sampai 204,648 byte. Ukuran
file fragment
rtf yang digunakan antara 252,133 byte sampai 575,967 byte. Ukuran
file fragment
doc yang digunakan antara 107,520 byte sampai 167,936 byte.
File
-
file
yang sudah dikumpulkan terbagi menjadi dua dataset, yaitu:
training dataset
atau data pelatihan,
dan testing dataset
atau dataset pengujian yang berupa
file
-
file fragment
. Sebelum dilakukan pengujian untuk mengidentifikasi file
fragment
, program akan terlebih dahulu diuji untuk mengidentifikasi
file
utuh dari masing- masing tipe data.
3.7. Proses Pengecekan Akurasi
Akurasi identifikasi tipe
file
dari
file fragment
akan dilakukan dengan cara sebagai berikut:
1. Pengelompokan
file fragment
pdf, gif, dan doc ke dalam folder yang terpisah. 2.
Program melakukan identifikasi LCS dengan menghitung tingkat persentase kemiripan LCS pada folder
file fragment
pdf, serta menghitung tingkat persentase kemiripan LCS pada
signature trailer
dan menghitung akurasi program mengidentifikasi
file
-
file
di dalam folder tersebut sebagai pdf, rtf, dan doc.
3. Dilakukan perhitungan akurasi keseluruhan.
BAB 4
IMPLEMENTASI DAN PENGUJIAN SISTEM
Bab ini membahas hasil penelitian yang dilakukan dari identifikasi tipe
file
dari
file
fragment dengan metode
Longest Common Subsequences
LCS sesuai dengan spesifikasi penerapan yang telah dibahas pada Bab 3. Bab ini akan menjabarkan hasil
dari akurasi metode LCS dalam mengidentifikasi tipe
file
serta hasil validasi dari
file
tersebut.
4.1. Hasil
Training
Pada bagian ini akan dijabarkan hasil
training
yang dilakukan.
Training
dilakukan dengan menggunakan tiga tipe data, yaitu jpg, rtf, dan doc dengan jumlah 100
file
per tipe data. Prosedur
training
LCS yang dilakukan adalah dengan memasukkan seluruh
file training
dengan tipe data yang serupa ke dalam folder, kemudian program akan membaca
file
yang terdapat pada folder tersebut satu per satu. Program akan mengambil input berupa dua buah
file
, kemudian mengubah
hex number file
tersebut menjadi string, dan melakukan aplikasi algoritma LCS untuk mendapatkan LCS dari
kedua
file
tersebut. Setelah itu, program kemudian akan mengambil sebuah
file
sebagai input selanjutnya kemudian dibandingkan
hex number file
tersebut dengan output yang dihasilkan pada
training
kedua
file
sebelumnya. Bila seluruh
file
sudah selesai dilatih, maka program akan berhenti dan hasil akhir akan didapat. Hasil
training
LCS pada tipe data pdf, rtf, dan doc dapat dilihat pada gambar 4.1, 4.2, dan
4.3 secara berturut-turut. Sedangkan rincian hasil training dapat dilihat pada lampiran B.
Gambar 4.1. Hasil
training
LCS PDF
Hasil training LCS pdf pada gambar 4.1 di atas menghasilkan LCS sepanjang 25 karakter.
Gambar 4.2. Hasil
training
LCS RTF
Hasil training LCS rtf pada gambar 4.2 menghasilkan LCS sepanjang 116
karakter.
Gambar 4.3. Hasil
training
LCS DOC
Hasil training LCS doc pada gambar 4.3 menghasilkan LCS.sepanjang 13 karakter.
4.2. Hasil