Hasil Testing Kesimpulan Dan Saran

4.2. Hasil Testing

Pada bagian ini, akan dilakukan pengujian untuk menghitung kemiripan antara hasil LCS fase training dengan file fragment. Pengujian dilakukan dengan cara membandingkan file yang diinput dengan LCS yang dihasilkan pada fase training dengan menggunakan metode Longest Common Subsequences. Hasil pengujian dapat dilihat pada tabel 4.1. Tabel 4.1. Tabel Perbandingan LCS File Utuh dengan File Fragment Tipe Data Fragmented Banyak File Persentase Kemiripan Persentase Terendah Persentase Tertinggi Pdf 1-10 20 23 65 11-30 20 23 23 31-50 20 61.5 61.5 50 20 65 65 Rtf 1-10 20 11 98 11-30 20 15 15 31-50 20 15 16 50 20 16 16 Doc 1-10 20 84 84 11-30 20 69 84 31-50 20 15 15 50 20 84 84 Hasil pengujian menunjukkan persentase kemiripan LCS fase training dengan file fragment . Hasil yang ditunjukkan hanya hasil dengan tingkat kemiripan tertinggi dan terendah dari keseluruhan pengujian yang dibagi berdasarkan tipe file untuk menentukan apakah tipe file dapat dideteksi hanya dengan menguji kemiripan antara LCS fase training dengan file fragment. Persentase kemiripan yang rendah menunjukkan bahwa sequence yang merupakan bagian dari LCS fase training sebagian besar terdapat pada header file. Oleh karena itu, file fragment akan sulit dideteksi apabila hanya dilakukan satu kali pengujian LCS. Selanjutnya, pengujian LCS dilakukan hanya pada bagian trailer file fragment. Apabila keseluruhan file fragment tidak tertimpa, kemungkinan besar hex number pada bagian trailer file fragment juga tidak ikut tertimpa. Pada pengujian ini, akan dilakukan identifikasi kemiripan trailer file fragment terhadap signature trailer file yang hendak kita tentukan tipe datanya, yakni : .pdf, .rtf, dan .doc. Hasil pengujian dapat dilihat pada tabel 4.2. Tabel 4.2. Tabel Perbandingan LCS Trailer File Utuh dengan File Fragment Tipe Data Fragmented Banyak File Persentase Kemiripan Persentase Terendah Persentase Tertinggi PDF 1-10 20 57 100 11-30 20 71 100 31-50 20 57 100 50 20 57 100 RTF 1-10 20 85 100 11-30 20 85 100 Tabel 4.2. Tabel Perbandingan LCS Trailer File Utuh dengan File Fragment lanjutan Tipe Data Fragmented Banyak File Persentase Kemiripan Persentase Terendah Persentase Tertinggi RTF 31-50 20 85 100 50 20 100 DOC 1-10 20 85 90 11-30 20 85 90 31-50 20 85 90 50 20 85 90 Hasil pengujian pada tabel 4.2 menunjukkan bahwa persentase kemiripan antara trailer file dengan trailer file fragment mencapai persentase yang tinggi. Maka dari itu, pointer pertama dalam mengidentifikasi tipe file dari file fragment adalah dengan mengidentifikasi kemiripan trailer dari file fragment. Kemudian, akan dijabarkan hasil testing perbandingan hex number dari file fragment terhadap LCS hasil training. Testing akan dilakukan terlebih dahulu menggunakan file utuh, kemudian akan dilanjutkan dengan pengujian file fragment dengan tiga tipe file berbeda yang sudah dikategorikan pada bagian 3.2. File fragment yang digunakan untuk pengujian adalah file fragment yang telah tertimpa oleh file lain. Program pertama kali akan memeriksa kemiripan yang terdapat pada trailer file , apabila persentase kemiripan mencapai 70, maka program akan melanjutkan pengecekan keseluruhan hex number dan dihitung persentase kemiripannya, angka 70 diambil dari nilai rata-rata dari persentase terendah pada tabel 4.2, apabila persentase kemiripan trailer file tidak mencapat 70, maka program akan mengidentifikasi file tersebut bukan sebagai file dengan tipe data pdf, rtf, maupun doc. Selanjutnya, persentase kemiripan LCS trailer file dengan LCS keseluruhan hex number akan dijumlahkan dan dibagi dua, apabila hasil akhir mencapai 50 yang didapat dari hasil rata-rata persentase terendah pada tabel 4.1 dan tabel 4.2, maka program dapat mengidentifikasi tipe data dari file tersebut. Sebelum pengujian dilakukan terhadap file fragment, pengujian akan terlebih dahulu dilakukan terhadap file utuh untuk melihat kemampuan program dalam mengidentifikasi tipe data. Akurasi hasil pengujian dengan data uji file utuh dapat dilihat pada tabel 4.3. Tabel 4.3. Tabel Akurasi Hasil Pengujian dengan Data Uji File Utuh Tipe File Banyak File Akurasi PDF 25 96 RTF 25 100 DOC 25 96 Selanjutnya, dikarenakan akurasi program dalam mengidentifikasi file utuh mencapai angka yang tinggi yakni dengan rata-rata 97.3, maka akan dilanjutkan dengan identifikasi file fragment. Hasil akhir daripada proses pengujian dapat dilihat pada tabel 4.4. Tabel 4.4. Akurasi Hasil Pengujian dengan Data Uji File Fragment Tipe data Fragmented Banyak File Akurasi Pdf 1-10 20 75 11-30 20 70 31-50 20 95 50 20 95 Rtf 1-10 20 100 11-30 20 100 31-50 20 100 50 20 100 Doc 1-10 20 95 11-30 20 100 31-50 20 85 50 20 100 Rata-rata pengujian dengan data uji file fragment 92.91 Pada dasarnya, hasil yang diperkirakan adalah bahwa semakin besar ukuran penimpaan pada suatu file, maka akurasi pengujian akan semakin rendah, tetapi pada pengujian yang dihasilkan, yaitu pada kolom akurasi .pdf dan .doc pada tabel 4.4 tidak menunjukkan hasil demikian. Hal ini dapat terjadi dikarenakan file yang digunakan untuk menimpa file fragment berbeda-beda, sehingga kemungkinan pada file dengan fragmentasi yang lebih tinggi, file yang menimpa file tersebut memiliki struktur file yang mirip, misalnya file .doc memiliki struktur file yang serupa dengan file dengan ekstensi .ppt atau .xlc. Hasil identifikasi menunjukkan pada file pdf dengan fragmentasi sebanyak 0- 10, terdapat 5 file yang tidak dapat teridentifikasi serta 15 file lainnya berhasil diidentifikasi sebagai pdf. Pada fragmentasi sebanyak 11-30, terdapat 6 file yang tidak teridentifikasi serta 14 file yang berhasil diidentifikasi sebagai pdf. Program juga dapat mengidentifikasi sebanyak 19 file dan 1 file tidak dapat teridentifikasi pada masing-masing persentase fragmentasi sebesar 31-50. Hasil serupa juga didapati pada fragmentasi di atas 50, yakni dengan 19 file berhasil diidentifikasi dan 1 file tidak berhasil diidentifikasi. Grafik hasil identifikasi dapat dilihat pada gambar 4.4. Gambar 4.4. Grafik Hasil Identifikasi dengan Tipe File Fragment PDF Sedangkan pada gambar 4.5, dapat dilihat bahwa program dapat mengidentifikasi seluruh file fragment dengan tipe data rtf. Hasil identifikasi dari tipe file rtf dengan fragmentasi sebesar 0-10, 11-30, 31-50, dan 50 mencapai persentase 100 dari 80 file fragment. 2 4 6 8 10 12 14 16 18 20 0-10 11-30 31-50 50 Juml ah F il e Persentase Fragmentase Pdf Rtf Doc Unidentified Gambar 4.5. Grafik Hasil Identifikasi dengan Tipe File Fragment RTF Pada gambar 4.6, grafik identifikasi file fragment doc menunjukkan bahwa pada tingkat fragmentasi dengan persentase 0-10, program berhasil mengidentifikasi 19 file dan 1 file tidak dapat teridentifikasi, sedangkan pada tingkat fragmentasi dengan persentase 31-50, terdapat 17 file yang berhasil diidentifikasi dan 3 file tidak dapat teridentifikasi. Akan tetapi, pada persentase 11-30 dan di atas 50, program berhasil mengidentifikasi seluruh file dengan benar. Gambar 4.6. Grafik Hasil Identifikasi dengan Tipe File Fragment DOC 2 4 6 8 10 12 14 16 18 20 0-10 11-30 31-50 50 Juml ah F il e Persentase Fragmentase Pdf Rtf Doc Unidentified 2 4 6 8 10 12 14 16 18 20 0-10 11-30 31-50 50 Juml ah F il e Persentase Fragmentase Pdf Rtf Doc Unidentified Akurasi hasil pengujian menunjukkan bahwa metode LCS mampu mengatasi permasalahan identifikasi tipe data pada file fragment yang bertipe data pdf, rtf, dan doc dengan tingkat akurasi mencapai 92.91 dari 240 file fragment. Selanjutnya untuk mengetahui apakah program dapat mengidentifikasi tipe file lain sebagai file yang tidak dapat diidentifikasi, akan dilakukan pengujian dengan tipe file lain, dalam hal ini penulis memakai tipe file dengan ekstensi .html. Pengujian akan dilakukan dengan menggunakan 25 file .html dan akan dibandingkan dengan LCS file .pdf, .rtf, dan .doc. Spesifikasi file .html yang diidentifikasi dapat dilihat pada tabel 4.5. Tabel 4.5. Tabel Spesifikasi File HTML Banyak File Ukuran File Minimum byte Ukuran File Maksimum byte 25 44,214 53,481 Hasil identifikasi hex number file .html terhadap LCS .pdf, .rtf, dan .doc dapat dilihat pada tabel 4.6. Tabel 4.6. Hasil Identifikasi File HTML File HTML Teridentifikasi sebagai PDF RTF DOC Unidentified 25 file 22 file 0 file 0 file 3 file Hasil identifikasi menunjukkan dari 25 file html yang diidentifikasi, terdapat 23 file terdeteksi sebagai pdf dan 3 file terdeteksi sebagai unidentified. Kemungkinan hasil tersebut diperoleh dikarenakan metode yang dipakai untuk mengidentifikasi file fragment tidak dapat digunakan untuk mengidentifikasi file yang tidak dilatih. Untuk menentukan apakah metode yang digunakan memang tidak dapat mengidentifikasi file yang tidak dilatih, maka file html akan dilatih dan dilakukan testing . Hasil identifikasi setelah file html dilatih dapat dilihat pada tabel 4.7. Tabel 4.7. Tabel Hasil Identifikasi HTML Setelah Training File HTML Akurasi Persentase Kemiripan Tertinggi Persentase Kemiripan Terendah 25 file 100 97,7 97,7 Hasil identifikasi menunjukkan bahwa program dapat mengenali tipe file yang sudah dilatih. Program dapat mengenal tipe file HTML dengan persentase kemiripan semuanya bernilai 97.7 dari 25 file HTML.

4.3. Validasi