4.2. Hasil
Testing
Pada bagian ini, akan dilakukan pengujian untuk menghitung kemiripan antara hasil LCS
fase training
dengan
file fragment
. Pengujian dilakukan dengan cara membandingkan
file
yang diinput dengan LCS yang dihasilkan pada
fase training
dengan menggunakan metode
Longest Common Subsequences
. Hasil pengujian dapat dilihat pada tabel 4.1.
Tabel 4.1. Tabel Perbandingan LCS File Utuh dengan File Fragment Tipe
Data Fragmented
Banyak File Persentase Kemiripan
Persentase Terendah
Persentase Tertinggi
Pdf
1-10 20
23 65
11-30 20
23 23
31-50 20
61.5 61.5
50 20
65 65
Rtf 1-10
20 11
98 11-30
20 15
15 31-50
20 15
16 50
20 16
16
Doc
1-10 20
84 84
11-30 20
69 84
31-50 20
15 15
50 20
84 84
Hasil pengujian menunjukkan persentase kemiripan LCS
fase training
dengan
file fragment
. Hasil yang ditunjukkan hanya hasil dengan tingkat kemiripan tertinggi dan terendah dari keseluruhan pengujian yang dibagi berdasarkan tipe file untuk
menentukan apakah tipe file dapat dideteksi hanya dengan menguji kemiripan antara LCS
fase training
dengan
file fragment
. Persentase kemiripan yang rendah menunjukkan bahwa
sequence
yang merupakan bagian dari LCS
fase training
sebagian besar terdapat pada
header file
. Oleh karena itu,
file fragment
akan sulit dideteksi apabila hanya dilakukan satu kali pengujian LCS.
Selanjutnya, pengujian LCS dilakukan hanya pada bagian
trailer file fragment
. Apabila keseluruhan
file fragment
tidak tertimpa, kemungkinan besar
hex number
pada bagian
trailer file fragment
juga tidak ikut tertimpa. Pada pengujian ini, akan dilakukan identifikasi kemiripan
trailer file fragment
terhadap
signature trailer file
yang hendak kita tentukan tipe datanya, yakni : .pdf, .rtf, dan .doc. Hasil pengujian
dapat dilihat pada tabel 4.2.
Tabel 4.2. Tabel Perbandingan LCS
Trailer File
Utuh dengan
File Fragment
Tipe Data Fragmented
Banyak File
Persentase Kemiripan Persentase
Terendah Persentase
Tertinggi
PDF 1-10
20 57
100 11-30
20 71
100 31-50
20 57
100 50
20 57
100 RTF
1-10 20
85 100
11-30 20
85 100
Tabel 4.2. Tabel Perbandingan LCS
Trailer File
Utuh dengan
File Fragment
lanjutan Tipe Data
Fragmented Banyak
File Persentase Kemiripan
Persentase Terendah
Persentase Tertinggi
RTF 31-50
20 85
100 50
20 100
DOC 1-10
20 85
90 11-30
20 85
90 31-50
20 85
90 50
20 85
90
Hasil pengujian pada tabel 4.2 menunjukkan bahwa persentase kemiripan antara
trailer file
dengan
trailer file fragment
mencapai persentase yang tinggi. Maka dari itu,
pointer
pertama dalam mengidentifikasi tipe
file
dari
file fragment
adalah dengan mengidentifikasi kemiripan
trailer
dari
file fragment
. Kemudian, akan dijabarkan hasil
testing
perbandingan
hex number
dari
file fragment
terhadap LCS hasil
training
.
Testing
akan dilakukan terlebih dahulu menggunakan
file
utuh, kemudian akan dilanjutkan dengan pengujian
file fragment
dengan tiga tipe file berbeda yang sudah dikategorikan pada bagian 3.2.
File fragment
yang digunakan untuk pengujian adalah
file fragment
yang telah tertimpa oleh
file
lain.
Program pertama kali akan memeriksa kemiripan yang terdapat pada
trailer file
, apabila persentase kemiripan mencapai 70, maka program akan melanjutkan pengecekan keseluruhan
hex number
dan dihitung persentase kemiripannya, angka 70 diambil dari nilai rata-rata dari persentase terendah pada tabel 4.2, apabila
persentase kemiripan
trailer file
tidak mencapat 70, maka program akan mengidentifikasi
file
tersebut bukan sebagai
file
dengan tipe data pdf, rtf, maupun doc. Selanjutnya, persentase kemiripan LCS trailer file dengan LCS keseluruhan
hex number
akan dijumlahkan dan dibagi dua, apabila hasil akhir mencapai 50 yang didapat dari hasil rata-rata persentase terendah pada tabel 4.1 dan tabel 4.2, maka
program dapat mengidentifikasi tipe data dari
file
tersebut. Sebelum pengujian dilakukan terhadap
file fragment
, pengujian akan terlebih dahulu dilakukan terhadap
file
utuh untuk melihat kemampuan program dalam mengidentifikasi tipe data. Akurasi hasil pengujian dengan data uji
file
utuh dapat dilihat pada tabel 4.3.
Tabel 4.3. Tabel Akurasi Hasil Pengujian dengan Data Uji
File
Utuh Tipe
File
Banyak
File
Akurasi PDF
25 96
RTF
25 100
DOC 25
96
Selanjutnya, dikarenakan akurasi program dalam mengidentifikasi
file
utuh mencapai angka yang tinggi yakni dengan rata-rata 97.3, maka akan dilanjutkan
dengan identifikasi
file fragment
. Hasil akhir daripada proses pengujian dapat dilihat pada tabel 4.4.
Tabel 4.4. Akurasi Hasil Pengujian dengan Data Uji
File Fragment
Tipe data Fragmented
Banyak
File
Akurasi Pdf
1-10 20
75 11-30
20 70
31-50 20
95 50
20 95
Rtf 1-10
20 100
11-30 20
100 31-50
20 100
50 20
100
Doc 1-10
20 95
11-30 20
100 31-50
20 85
50 20
100
Rata-rata pengujian dengan data uji
file fragment
92.91
Pada dasarnya, hasil yang diperkirakan adalah bahwa semakin besar ukuran penimpaan pada suatu
file
, maka akurasi pengujian akan semakin rendah, tetapi pada pengujian yang dihasilkan, yaitu pada kolom akurasi .pdf dan .doc pada tabel 4.4 tidak
menunjukkan hasil demikian. Hal ini dapat terjadi dikarenakan
file
yang digunakan untuk menimpa
file fragment
berbeda-beda, sehingga kemungkinan pada
file
dengan fragmentasi yang lebih tinggi,
file
yang menimpa
file
tersebut memiliki struktur file
yang mirip, misalnya
file
.doc memiliki struktur
file
yang serupa dengan
file
dengan ekstensi .ppt atau .xlc.
Hasil identifikasi menunjukkan pada
file
pdf dengan fragmentasi sebanyak 0- 10, terdapat 5
file
yang tidak dapat teridentifikasi serta 15
file
lainnya berhasil diidentifikasi sebagai pdf. Pada fragmentasi sebanyak 11-30, terdapat 6
file
yang tidak teridentifikasi serta 14
file
yang berhasil diidentifikasi sebagai pdf. Program juga dapat mengidentifikasi sebanyak 19
file
dan 1
file
tidak dapat teridentifikasi pada masing-masing persentase fragmentasi sebesar 31-50. Hasil serupa juga didapati
pada fragmentasi di atas 50, yakni dengan 19
file
berhasil diidentifikasi dan 1
file
tidak berhasil diidentifikasi. Grafik hasil identifikasi dapat dilihat pada gambar 4.4.
Gambar 4.4. Grafik Hasil Identifikasi dengan Tipe File Fragment PDF
Sedangkan pada gambar 4.5, dapat dilihat bahwa program dapat mengidentifikasi seluruh
file fragment
dengan tipe data rtf. Hasil identifikasi dari tipe
file
rtf dengan fragmentasi sebesar 0-10, 11-30, 31-50, dan 50 mencapai persentase 100 dari 80
file fragment
.
2 4
6 8
10 12
14 16
18 20
0-10 11-30
31-50 50
Juml ah
F il
e
Persentase Fragmentase
Pdf Rtf
Doc Unidentified
Gambar 4.5. Grafik Hasil Identifikasi dengan Tipe File Fragment RTF
Pada gambar 4.6, grafik identifikasi file fragment doc menunjukkan bahwa pada tingkat fragmentasi dengan persentase 0-10, program berhasil mengidentifikasi
19
file
dan 1
file
tidak dapat teridentifikasi, sedangkan pada tingkat fragmentasi dengan persentase 31-50, terdapat 17
file
yang berhasil diidentifikasi dan 3
file
tidak dapat teridentifikasi. Akan tetapi, pada persentase 11-30 dan di atas 50, program
berhasil mengidentifikasi seluruh
file
dengan benar.
Gambar 4.6. Grafik Hasil Identifikasi dengan Tipe File Fragment DOC
2 4
6 8
10 12
14 16
18 20
0-10 11-30
31-50 50
Juml ah
F il
e
Persentase Fragmentase
Pdf Rtf
Doc Unidentified
2 4
6 8
10 12
14 16
18 20
0-10 11-30
31-50 50
Juml ah
F il
e
Persentase Fragmentase
Pdf Rtf
Doc Unidentified
Akurasi hasil pengujian menunjukkan bahwa metode LCS mampu mengatasi permasalahan identifikasi tipe data pada
file fragment
yang bertipe data pdf, rtf, dan doc dengan tingkat akurasi mencapai 92.91 dari 240
file fragment
. Selanjutnya untuk mengetahui apakah program dapat mengidentifikasi tipe
file
lain sebagai
file
yang tidak dapat diidentifikasi, akan dilakukan pengujian dengan tipe
file
lain, dalam hal ini penulis memakai tipe
file
dengan ekstensi .html. Pengujian akan dilakukan dengan menggunakan 25
file
.html dan akan dibandingkan dengan LCS
file
.pdf, .rtf, dan .doc. Spesifikasi file .html yang diidentifikasi dapat dilihat pada tabel 4.5.
Tabel 4.5. Tabel Spesifikasi
File
HTML Banyak File
Ukuran File Minimum byte
Ukuran File Maksimum byte
25 44,214
53,481
Hasil identifikasi
hex number file
.html terhadap LCS .pdf, .rtf, dan .doc dapat dilihat pada tabel 4.6.
Tabel 4.6. Hasil Identifikasi
File
HTML File HTML
Teridentifikasi sebagai PDF
RTF DOC
Unidentified
25 file 22 file
0 file 0 file
3 file
Hasil identifikasi menunjukkan dari 25
file
html yang diidentifikasi, terdapat 23
file
terdeteksi sebagai pdf dan 3
file
terdeteksi sebagai
unidentified
. Kemungkinan
hasil tersebut diperoleh dikarenakan metode yang dipakai untuk mengidentifikasi
file fragment
tidak dapat digunakan untuk mengidentifikasi
file
yang tidak dilatih. Untuk menentukan apakah metode yang digunakan memang tidak dapat
mengidentifikasi
file
yang tidak dilatih, maka
file
html akan dilatih dan dilakukan
testing
. Hasil identifikasi setelah
file
html dilatih dapat dilihat pada tabel 4.7.
Tabel 4.7. Tabel Hasil Identifikasi HTML Setelah
Training
File HTML Akurasi
Persentase Kemiripan Tertinggi
Persentase Kemiripan Terendah
25 file 100
97,7 97,7
Hasil identifikasi menunjukkan bahwa program dapat mengenali tipe
file
yang sudah dilatih. Program dapat mengenal tipe
file
HTML dengan persentase kemiripan semuanya bernilai 97.7 dari 25
file
HTML.
4.3. Validasi