13 Table MFT untuk setiap file memiliki pengalokasian daftar cluster untuk
penyimpanan file tersebut. Oleh karena itu, recovery file yang telah mengalami fragmentasi masih dapat dilakukan Casey, 2010.
2.3. Jenis-Jenis File
2.3.1. PDF
PDF atau Portable Document Format adalah tipe file dokumen umum yang mewakili berbagai jenis tipe file dokumen lain yang terdapat di internet sejak tahun 1993
Taft, et al. 2004. Pada 14 tahun terakhir, dibantu dengan membludaknya penggunaan internet, PDF menjadi tipe file yang paling sering digunakan sebagai media pertukaran
dokumen-dokumen. Berikut adalah detail dari perkembangan PDF :
1 PDF 1.0 Acrobat 1.0 1993.
2 PDF 1.1 Acrobat 2.0 1994.
3 PDF 1.2 Acrobat 3.0 1996.
4 PDF 1.3 Acrobat 4.0 1999.
5 PDF 1.4 Acrobat 5.0 2001.
6 PDF 1.5 Acrobat 6.0 2003.
7 PDF 1.6 Acrobat 7.0 2005.
8 PDF 1.7 Acrobat 8.0 2006.
9 PDF 1.7 Acrobat 9.0 Adobe Extension Level 3 2008.
10 PDF 1.7 Acrobat 9.1 Adobe Extension Level 5 2009.
PDF memiliki 4 komponen bagian seperti pada Gambar 2.3, yakni :
1 Objek
Sebuah file PDF adalah sebuah struktur data yang dibentuk dari sekumpulan tipe dasar dari objek data. Objek dari PDF menjelaskan syntax dan sifat mendasar dari
file PDF itu sendiri.
14 2
Struktur file Struktur sebuah file PDF menentukan bagaimana objek-objek PDF disimpan di
dalam file PDF, bagaimana mereka diakses, dan bagaimana mereka diperbarui. Struktur dari PDF ini sendiri bersifat terpisah dari semantik objek-objek tersebut.
3 Struktur dokumen
Struktur sebuah dokumen PDF menjelaskan bagaimana tipe objek sederhana digunakan untuk menunjukkan komponen-komponen dari sebuah dokumen PDF
seperti halaman, font, anotasi, dan seterusnya. 4
Content Streams Content stream
dari sebuah PDF berisi sebuah rangkaian instruksi yang mendeskripsikan penampilan dari sebuah halaman. Instruksi ini, walau
menggambarkan sebuah objek, secara konseptual berbeda dengan objek-objek yang merepresentasikan struktur dokumen dan diuraikan secara terpisah Adobe,
2008.
Gambar 2.3. Komponen dari file PDF Adobe, 2008
Struktur file PDF sebenarnya relatif sederhana, sekumpulan data yang berisi sejumlah objek teks dan gambar dalam bermacam format. Objek tersebut disatukan
oleh font, layout, formatting, dan informasi lainnya. Tabel 2.2 merupakan rincian komposisi struktur daripada file dengan format .pdf.
15
Tabel 2.2. Komposisi Struktur dari File PDF Roussev Garfinkel, 2009
Encoding Count
Avg SizeKB Total MB
Deflate 10,406,780
4,11 41,730
49.1 Image jpegjpeg2000
853,321 25,88
21,570 25.4
BW Image faxJBIG2 756,532
12,82 9,470
11.2
PDF-Characteristic 8,236
9,7
ApplicationXMLForm 520,220
3,18 1,614
1,9 ASCII85ASCIIHex
205,421 4,51
905 1,1
LZWRunLength 64,911
7,70 488
0,6 Fonts
10,005 1,14
11 0.0
Other 412,570
2,23 899
1,1
Grand Total 13,229,760
6,57 84,921
100
Kolom pertama merupakan metode encoding untuk objek PDF, sedangkan kolom yang lain merupakan jumlah angka dari objek yang ada di dalam PDF, ukuran
rata-rata, total ukuran keseluruhan dan persentase dari keseluruhan bagian yang terdapat dalam file PDF Roussev Garfinkel, 2009. Contoh isi hex number dari tipe
file PDF dapat dilihat pada Gambar 2.4.
Gambar 2.4. Contoh rangkaian hex number dari random PDF Roussev
Garfinkel, 2009
16 Sedangkan struktur dokumen PDF, tersusun atas 4 bagian utama, yakni:
1 PDF Header
Baris pertama pada PDF yang mendefinisikan versi dari format file PDF. Dari header PDF kita juga dapat menemukan informasi dasar dari sebuah file PDF,
misalnya header “PDF-1.5” menunjukkan magic bytes PDF yakni “PDF”
serta “1.5” yang menjelaskan versi PDF tersebut, yakni versi PDF 1.5. 2
PDF Body Body
pada file PDF mengandung objek-objek yang memuat konten dari dokumen tersebut. Objek-objek ini meliputi data berupa gambar, font, anotasi,
hyperlinks , bookmark, teks stream dan sebagainya. Pengguna PDF juga dapat
mengimplementasikan fitur yang terdapat didalamnya, seperti fitur pengamanan yang membatasi dokumen agar tidak dapat dicetak, dilihat, diedit,
maupun dimodifikasi. 3
Cross-Reference Table Cross-reference table
atau dapat disebut juga dengan xref table memuat hubungan antara objek atau elemen yang terdapat di dalam file.
4 Trailer
Trailer pada PDF memuat hubungan pada cross-reference table dan selalu
diakhiri dengan “EOF” untuk menandakan akhir dari sebuah file PDF. Jika baris tersebut hilang, maka file PDF tidak dapat diproses secara benar.
2.3.2. RTF
RTF atau Rich Text Format adalah format file dokumen yang dipubikasikan oleh Microsoft Corporation
pada tahun 1987 untuk mentransfer dokumen teks dengan platform
Microsoft. Meskipun format file RTF termasuk sebagai dokumen, namun file RTF tetap
menggunakan standar pengodean ANSI ASCII, PC-8, Macintosh, Unicode atau IBM PC Character Set untuk mengontrol representasi maupun format dari dokumen.
17 Format file RTF juga mendukung grafik dan tabel dalam dokumen. Contoh
rangkaian hex number pada file RTF dapat dilihat pada gambar 2.5. Berikut adalah detail dari perkembangan RTF untuk Microsoft Word:
1 RTF versi 1.0 untuk Microsoft Word 3 1987.
2 RTF versi 1.1 untuk Microsoft Word 4 1989.
3 RTF versi 1.2 untuk Microsoft Word 5 1993.
4 RTF versi 1.3 untuk Microsoft Word 6 1994.
5 RTF versi 1.4 untuk Microsoft Word 95Word 7 1995.
6 RTF versi 1.5 untuk Microsoft Word 97Word 8 1997.
7 RTF versi 1.6 untuk Microsoft Word 2000Word 9 1999.
8 RTF versi 1.7 untuk Microsoft Word 2002Word 10 2001.
9 RTF versi 1.8 untuk Microsoft Word 2003Word 11 2004.
10 RTF versi 1.9.1 untuk Microsoft Word 2007Word 12 2008. Microsoft
Corporation, 2007.
Gambar 2.5. Contoh rangkaian hex number dari random RTF
2.3.4. DOC
DOC atau document adalah salah satu ekstensi tipe file dokumen pengolah kata. DOC merupakan format file binary yang digunakan oleh aplikasi Microsoft Word 97,
Microsoft Word 2000, Microsoft Word 2002, dan Microsoft Office Word 2003 Microsoft, 2014. DOC memiliki rangkaian hex number
berupa „D0 CF 11 E0 A1 B1 1A E1‟.
Sebuah file DOC memuat informasi berupa: 1
Main Stream 2
Summary Information Stream
18 3
Table Stream 4
Data Stream 5
Custom XML Storage Microsoft Word 2007 6
Bit 0 atau object stream yang memuat data privat untuk objek OLE 2.0 Object Linking and Embedding 2.0
yang di-embed ke dokumen Word Microsoft, 2007. Contoh hex number dari tipe file DOC terdapat pada Gambar 2.6.
Gambar 2.6. Contoh rangkaian hex number dari random DOC
2.4. Binary File