Kesimpulan Saran Text File

BAB 5 KESIMPULAN DAN SARAN

5.1. Kesimpulan

Kesimpulan yang dapat diambil dari penelitian ini adalah: 1. Aplikasi yang dirancang telah mampu melakukan kompresi dan dekompresi string dengan menggunakan algoritma Inverted Elias Gamma dan Capocelli. 2. Berdasarkan pengujian yang dilakukan dengan menggunakan String yang tidak mengandung perulangan frase, diperoleh kesimpulan yang menunjukkan bahwa algoritma Inverted Elias Gamma lebih unggul dibandingkan algoritma Capocelli dalam melakukan proses kompresi. 3. Dalam proses dekompresi, algoritma Capocelli membutuhkan real running time yang lebih sedikit dibandingkan algoritma Invertde Elias Gamma.

5.2. Saran

Saran yang dapat diberikan Penulis untuk pengembangan dan perbaikan sistem lebih lanjut adalah: 1. Aplikasi yang di rancang diharapkan dapat mengkompresi jenis file teks lainnya seperti .rtf dan .pdf 2. Aplikasi yang dirancang diharapkan dapat mendeteksi apakah file tersebut mengandung frase yang berulang atau tidak. 3. Agar dapat mengkompresi komponen lain yang terdapat pada file document seperti gambar, grafik, tabel, dan lainnya. Universitas Sumatera Utara BAB 2 TINJAUAN PUSTAKA Pada bab ini penulis memaparkan teori-teori ilmiah yang didapat dari metode pencarian fakta yang digunakan untuk mendukung penulisan skripsi ini dan sebagai dasar pengembangan sistem sehingga dapat diimplementasikan dengan baik dan benar.

2.1. Kompresi Data

Kompresi data adalah proses mengubah sebuah aliran data input menjadi aliran data baru yang memiliki ukuran lebih kecil. Aliran yang dimaksud adalah berupa file ataupun buffer dalam memori. Kebutuhan terhadap kompresi data dipengaruhi oleh dua alasan, yaitu kecenderungan manusia untuk mengumpulkan data dan kebutuhan terhadap proses transfer data yang cepat. Karena itu metode-metode untuk mengkompresi data semakin berkembang Salomon, 2004. Sering terjadi mispersepsi mengenai data dan informasi, padahal data dan informasi adalah dua hal yang berbeda. Pada data terkandung suatu informasi. Namun tidak semua bagian data terkait dengan informasi tersebut atau pada suatu data terdapat bagian-bagian data yang berulang untuk mewakili informasi yang sama. Bagian data yang tidak terkait atau bagian data yang berulang tersebut disebut dengan data yang berlebihan redudancy data. Tujuan daripada kompresi data tidak lain adalah untuk mengurangi data berlebihan tersebut sehingga ukuran data menjadi lebih kecil dan lebih ringan dalam proses transmisi Putra, 2010. Di dalam penelitian ini, file yang akan diteliti berfokus pada jenis file teks, dengan ekstensi txt dan doc. File teks flat file adalah salah satu jenis file komputer yang tersusun dalam suatu urutan baris data teks biasanya diwakili oleh 8 bit kode ASCII Solihin, 2013. Universitas Sumatera Utara

2.1.1. Teknik Kompresi Data

Berdasarkan kemungkinan data yang telah dikompresi dapat dikembalikan ke data sebelum dikompresi atau data aslinya, teknik kompresi data dikelompokkan menjadi dua bagian yaitu kompresi data lossless dan kompresi data Lossy Pu, 2006 : 1. Kompresi Data Losless Kompresi data lossless adalah teknik kompresi data dimana data yang telah dikompresi dapat dikembalikan ke data aslinya dengan tidak mengurangi informasi yang ada pada data tersebut. Dalam teknik kompresi ini, pada saat proses kompresi dihasilkan sebuah data yang berbeda dengan data aslinya. Karena setiap bit yang terdapat pada data di-encode sehingga dihasilkan bit yang baru yang lebih pendek. Data tersebut dikembalikan ke data aslinya data sebelum dikompresi pada saat proses dekompresi. Teknik kompresi lossless digunakan pada data yang tergolong penting sehingga tidak boleh ada banyak atau sebagian informasi yang hilang. Seperti misalnya pada file teks, jika terdapat sedikit saja perubahan pada data itu maka akan sangat mudah kelihatan. Gambar 2.1. Kompresi Lossless Pu, 2006 Contoh aplikasi lossles compression yaitu WINRAR dan WINZIP. Contoh format file lossles compression: .zip, .rar, document file .doc, .xls, .ppt, file executable .exe Universitas Sumatera Utara 2. Kompresi Data Lossy Kompresi data Lossy adalah teknik kompresi data dimana data mengalami sedikit atau banyak kehilangan pada saat proses kompresi.Sama seperti data aslinya hanya saja ada perubahan kerapatan ataupun resolusi pada data tersebut. Oleh karena itu sangat kecil kemungkinan dan bahkan tidak akan pernah bisa data yang telah dikompresi dengan teknik kompresi Lossy dapat dikembalikan seperti data sebelum dikompresi atau data aslinya. Perubahan yang terjadi pada data pada saat proses kompresi tidaklah terlalu kelihatan. Teknik kompresi ini biasanya digunakan pada data berupa gambar, suara dan video. Karena pada data tersebutlah kehilangan akan informasi yang detail itu mungkin tidak dapat dirasakan oleh sistem kerja indera penglihatan dan pendengaran manusia. Contoh algoritma kompresi Lossy adalah Fractal Compression, Wavelet Compression, Wyner-Ziv Coding WZC, dan lain-lain. Gambar 2.2. Ilustrasi Kompresi LossySayood, 2006 Contoh aplikasi lossy compression : aplikasi pengkompres suara mp3 compressor,ambar adobe photoshop, paint, video xilisoft. Contoh format file lossy compression yaitu MP3, JPEG, MPEG

2.1.2. Pengukuran Kinerja Kompresi Data

Pada suatu teknik yang digunakan dalam proses kompresi data terdapat beberapafaktor atau variabel yang biasa digunakan untuk mengukur kualitas dari suatu teknikkompresi data tersebut, yaitu Salomon Motta, 2010: Universitas Sumatera Utara 1. Ratio of Compression Rc Ratio of Compression Rc adalah perbandingan antara ukuran data sebelum dikompresi dengan ukuran data setelah dikompresi. = ℎ 2. Compression Ratio Cr Compression Ratio Cr adalah persentasi besar data yang telah dikompresi yang didapat dari hasil perbandingan antara ukuran data setelah dikompresi dengan ukuran data sebelum dikompresi. = ℎ 100 3. Space Savings SS Space Savings SS adalah persentase selisih antara data yang belum dikompresi dengan besar data yang dikompresi. = 100 − 4. Waktu kompresi dan dekompresi Waktu kompresi dan dekompresi adalah waktu yang dibutuhkan untuk melakukan proses kompresi dan dekompresi. Semakin kecil waktu yang diperoleh maka semakin efisien metode yang digunakan dalam proses kompresi dan dekompresi itu.

2.2. Text File

Text file disebut juga dengan flat file adalah salah satu jenis file komputer yang tersusun dalam suatu urutan baris data teks biasanya diwakili oleh 8 bit kodeAmerican Standard Code for Information Interchange ASCII dan Extended Binary Coded Universitas Sumatera Utara Decimal Interchange Code EBCDIC merupakan cikal bakal dari set karakter lainnya. ASCII American Standard Code for Information Interchange merupakan suatu standar internasional dalam kode huruf dan simbol seperti Hex dan Unicode tetapi ASCII lebih bersifat universal. ASCII digunakan oleh komputer dan alat komunikasi lain untuk menunjukkan teks. Kode ASCII memiliki komposisi bilangan biner sebanyak 8 bit, dimulai dari 00000000 hingga 11111111. Total kombinasi yang dihasilkan sebanyak 256, dimulai dari kode 0 hingga 255 dalam sistem bilangan desimal. Format file teks yang akan digunakan dalam penelitian ini adalah : 1. Format data teks Format data teks merupakan format teks yang digunakan untuk menyimpan huruf, angka, karakter, kontrol tabulasi, pindah baris, dan sebagainya atau simbol-simbol lain yang biasa digunakan dalam tulisan seperti titik, koma, tanda petik, dan sebagainya. Satu huruf, angka, karakter, kontrol atau simbol pada arsip teks memakan tempat satu byte. Berbeda dengan jenis teks terformat yang satu huruf saja dapat memakan tempat beberapa byte untuk menyimpan format dari huruf tersebut seperti font, ukuran, tebal atau tidak dan sebagainya. Kelebihan dari format data teks ini adalah ukuran datanya yang kecil karena tiadanya fitur untuk memformat tampilan teks. Saat ini perangkat lunak yang paling banyak digunakan untuk memanipulasi format data ini adalah Notepad. Pramilo, 2008 2. Format data dokumen Doc merupakan ekstensi arsip dokumen perangkat lunak Microsoft Word yang paling banyak digunakan dalam penulisan laporan, makalah dan sebagainya. Doc merupakan jenis teks terformat yang tidak hanya dapat mengatur tampilan teks seperti styles font, ukuran huruf dan sebagainya, namun juga dapat menyisipkan gambar. Kekurangan format teks dokumen ini terletak pada ukuran datanya yang besar. Pramilo, 2008 Universitas Sumatera Utara

2.3. Algoritma Inverted Elias Gamma