Text File Kompresi Data

Data merupakan salah satu hal utama yang dikaji dalam masalah teknologi informasi. Penggunaan dan pemanfaatan data sudah mencakup banyak aspek. Berikut adalah pembahasan definisi data berdasarkan berbagai sumber. Data menggambarkan sebuah representasi fakta yang tersusun secara terstruktur. Selain deskripsi dari sebuah fakta, data dapat pula merepresentasikan suatu objek sebaga imana bahwa “Data adalah nilai yang merepresentasikan deskripsi dari suatu objek atau kejadian event “ Dengan demikian dapat dijelaskan kembali bahwa data merupakan suatu objek, kejadian, atau fakta yang terdokumentasikan dengan memiliki modifikasi terstruktur untuk suatu atau beberapa entitas Sarifah, 2010.

2.2 Text File

Text file disebut juga dengan flat file adalah salah satu jenis file komputer yang tersusun dalam suatu urutan baris Text File. Data teks biasanya diwakili oleh 8 bit kode ASCII atau EBCDIC. Akhir dari sebuah file teks sering ditandai dengan penempatan satu atau lebih karakter – karakter khusus yang dikenal dengan tanda end-of-file setelah baris terakhir di suatu file teks. File teks biasanya mempunyai jenis MIME Multipurpose Internet Mail Extension textplain, biasanya sebagai informasi tambahan yang menandakan suatu pengkodean. pada sistem operasi Windows , suatu file dikenal sebagai suatu file teks jika memiliki extention misalnya txt, rtf, doc dan lain – lain Sarifah, 2010.

2.3 Teknik Kompresi

Kompresi mempunyai bermacam-macam jenis kompresi antara lain adalah sebagai berikut:

2.3.1 Lossless Compression

Algoritma pengkompresi ini dapat mengembalikan data yang sudah dikompresi sama atau sesuai dengan data asli data sebelum dikompresi. Contoh algoritma ini dapat ditemukan pada pengkompresian teks Nurjaman, 2011. Prinsip dasar eksploitasi data statistik citra: a. Menghasilkan citra hasil kompresi yang tepat sama dengan citra semula. b. Dalam proses kompresinya, tidak ada informasi yang hilang. c. Rasio kompresi sangat rendah terbatas. d. Contoh aplikasi: citra medis, citra biner facsimile, dll Universitas Sumatera Utara Algoritma kompresi lossless dibagi dalam dua kategori, yaitu 1. Dictionary-based Technique Menghasilkan file kompresi yang berisi fixed-length code 12 – 16 bits yang merepresentasikan sequence bytes file asli, misalnya Run-Length Encoding dan LZW encoding. 2. Variable Length Coding Merepresentasikan karakter yang sering muncul dalam bit yang lebih kecil, misalnya Dynamic Markov Compression, Huffman Coding. Contoh format file dengan kompresi lossless: GIF, PCX, BMP, TIFF, TRG, PGM.

2.3.2 Lossy Compression

Algoritma pengkompresi ini bersifat terbalik dengan algoritma lossless karena tidak dapat mengembalikan data yang sudah dikompresi sesuai atau sama dengan data asli data sebelum dikompresi. Contoh algoritma ini misalnya pada pengkompresian gambar, suara dan video Nurjaman, 2011. Prinsip atau ciri-ciri umum pada lossy compression adalah: 1. Menghasilkan citra hasil kompresi yang hampir sama dengan citra semula. Dalam proses kompresinya, ada informasi yang hilang namun dalam batas toleransi tertentu. 2. Rasio kompresi tinggi. 3. Contoh aplikasi: transmisi citra pada bandwidth saluran komunikasi terbatas. 4. Algoritma kompresi lossy telah banyak dikembangkan, diantaranya menggunakan kuantisasi, fraktal, wavelet, dll. 5. Contoh format file dengan kompresi lossy : JPEG, MPEG.

2.4 Kompresi Data

Kompresi berarti memampatkanmengecilkan ukuran. Kompresi data adalah proses mengkodekan informasi menggunakan bit atau information-bearing unit yang lain yang lebih rendah daripada representasi data yang tidak terkodekan dengan suatu sistem encoding tertentu Taryani, 2008. Universitas Sumatera Utara Pemampatan merupakan salah satu dari bidang teori informasi yang bertujuan untuk menghilangkan redudansi dari sumber. Pemampatan bermanfaat dalam membantu mengurangi konsumsi sumber daya yang mahal, seperti ruang hard disk atau pemindahan data melalui internet Razi, 2009. Data dan informasi adalah dua hal yang berbeda. Pada data terkandung suatu informasi. Namun tidah semua bagian data terkait dengan informasi tersebut atau pada suatu data terdapat bagian-bagian data yang berulang untuk mewakili informasi yang sama. Bagian data yang tidak terkait atau bagian data yang berulang tersebut disebut dengan data berlebihan redundancy data. Tujuan daripada kompresi data tiada lain adalah untuk mengurangi data berlebihan tersebut sehingga ukuran data menjadi lebih kecil dan lebih ringan dalam proses transmisi Putra, 2010. Kompresi citra image compression adalah proses untuk meminimalisasi jumlah bit yang merepresentasikan suatu citra sehingga ukuran data citra menjadi lebih kecil. Pengiriman data hasil kompresi dapat dilakukan jika pihak pengirim yang melakukan kompresi dan pihak penerima memiliki aturan yang sama dalam hal kompresi data. Pihak pengirim harus menggunakan algoritma kompresi data yang sudah baku dan pihak penerima juga menggunakan teknik dekompresi data yang sama dengan pengirim sehingga data yang diterima dapat dibaca kembali dengan benar. Kompresi data menjadi sangat penting karena memperkecil kebutuhan penyimpanan data, mempercepat pengiriman data, memperkecil kebutuhan bandwidth Taryani, 2008. Dalam teknik kompresi data, redundansi dari data menjadi masalah utama. Kompresi data ditujukan untuk mereduksi penyimpanan data yang redundan atau dalam istilah lain kompresi citra digital dilakukan untuk dengan cara meminimalkan jumlah bit yang diperlukan untuk merepresentasikan suatu data citra, namun seringkali kualitas gambar yang dihasilkan jauh lebih buruk dari aslinya karena keinginan kita untuk memperoleh rasio kompresi yang tinggi. Secara mendasar standar teknik kompresi gambar memiliki 2 teknik kompresi yaitu teknik kompresi secara lossy dan lossles. Untuk teknik kompresi secara lossy ada sebagian dari informasi yang hilang dalam gambar tersebut sehingga jika dilakuakan proses edit akan susah dilakukan. Sedangkan teknik kompresi secara lossless tidak menghilangkan informasi sedikitpun. Universitas Sumatera Utara Secara umum proses kompresi dan dekompresi dapat diliha pada gambar di bawah ini: Data Asli Data Hasil Kompresi Kompresi Dekompresi Ukurn Data Hasil Ukuran Data Hasil Kompresi Gambar 2.1 Alur Kompresi-Dekompresi Data Sarifah, 2010.

2.5 Kompresi Citra