BAB 5
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Kesimpulan yang dapat diambil dari penelitian ini adalah: 1.
Aplikasi yang dirancang telah mampu melakukan kompresi dan dekompresi string dengan menggunakan algoritma Inverted Elias Gamma dan Capocelli.
2. Berdasarkan pengujian yang dilakukan dengan menggunakan String yang tidak
mengandung perulangan frase, diperoleh kesimpulan yang menunjukkan bahwa algoritma Inverted Elias Gamma lebih unggul dibandingkan algoritma
Capocelli dalam melakukan proses kompresi. 3.
Dalam proses dekompresi, algoritma Capocelli membutuhkan real running time yang lebih sedikit dibandingkan algoritma Invertde Elias Gamma.
5.2. Saran
Saran yang dapat diberikan Penulis untuk pengembangan dan perbaikan sistem lebih lanjut adalah:
1. Aplikasi yang di rancang diharapkan dapat mengkompresi jenis file teks
lainnya seperti .rtf dan .pdf 2.
Aplikasi yang dirancang diharapkan dapat mendeteksi apakah file tersebut mengandung frase yang berulang atau tidak.
3. Agar dapat mengkompresi komponen lain yang terdapat pada file document
seperti gambar, grafik, tabel, dan lainnya.
Universitas Sumatera Utara
BAB 2
TINJAUAN PUSTAKA
Pada bab ini penulis memaparkan teori-teori ilmiah yang didapat dari metode pencarian fakta yang digunakan untuk mendukung penulisan skripsi ini dan sebagai
dasar pengembangan sistem sehingga dapat diimplementasikan dengan baik dan benar.
2.1. Kompresi Data
Kompresi data adalah proses mengubah sebuah aliran data input menjadi aliran data baru yang memiliki ukuran lebih kecil. Aliran yang dimaksud adalah berupa file
ataupun buffer dalam memori. Kebutuhan terhadap kompresi data dipengaruhi oleh dua alasan, yaitu kecenderungan manusia untuk mengumpulkan data dan kebutuhan
terhadap proses transfer data yang cepat. Karena itu metode-metode untuk mengkompresi data semakin berkembang Salomon, 2004.
Sering terjadi mispersepsi mengenai data dan informasi, padahal data dan informasi adalah dua hal yang berbeda. Pada data terkandung suatu informasi. Namun
tidak semua bagian data terkait dengan informasi tersebut atau pada suatu data terdapat bagian-bagian data yang berulang untuk mewakili informasi yang sama.
Bagian data yang tidak terkait atau bagian data yang berulang tersebut disebut dengan data yang berlebihan redudancy data. Tujuan daripada kompresi data tidak lain
adalah untuk mengurangi data berlebihan tersebut sehingga ukuran data menjadi lebih kecil dan lebih ringan dalam proses transmisi Putra, 2010. Di dalam penelitian ini,
file yang akan diteliti berfokus pada jenis file teks, dengan ekstensi txt dan doc. File teks flat file adalah salah satu jenis file komputer yang tersusun dalam suatu urutan
baris data teks biasanya diwakili oleh 8 bit kode ASCII Solihin, 2013.
Universitas Sumatera Utara
2.1.1. Teknik Kompresi Data
Berdasarkan kemungkinan data yang telah dikompresi dapat dikembalikan ke data sebelum dikompresi atau data aslinya, teknik kompresi data dikelompokkan menjadi
dua bagian yaitu kompresi data lossless dan kompresi data Lossy Pu, 2006 : 1.
Kompresi Data Losless Kompresi data lossless adalah teknik kompresi data dimana data yang telah
dikompresi dapat dikembalikan ke data aslinya dengan tidak mengurangi informasi yang ada pada data tersebut. Dalam teknik kompresi ini, pada saat proses kompresi
dihasilkan sebuah data yang berbeda dengan data aslinya. Karena setiap bit yang terdapat pada data di-encode sehingga dihasilkan bit yang baru yang lebih pendek.
Data tersebut dikembalikan ke data aslinya data sebelum dikompresi pada saat proses dekompresi. Teknik kompresi lossless digunakan pada data yang tergolong
penting sehingga tidak boleh ada banyak atau sebagian informasi yang hilang. Seperti misalnya pada file teks, jika terdapat sedikit saja perubahan pada data itu maka akan
sangat mudah kelihatan.
Gambar 2.1. Kompresi Lossless Pu, 2006
Contoh aplikasi lossles compression yaitu WINRAR dan WINZIP. Contoh format file lossles compression: .zip, .rar, document file .doc, .xls, .ppt,
file executable .exe
Universitas Sumatera Utara
2. Kompresi Data Lossy
Kompresi data Lossy adalah teknik kompresi data dimana data mengalami sedikit atau banyak kehilangan pada saat proses kompresi.Sama seperti data aslinya hanya saja ada
perubahan kerapatan ataupun resolusi pada data tersebut. Oleh karena itu sangat kecil kemungkinan dan bahkan tidak akan pernah bisa data yang telah dikompresi dengan
teknik kompresi Lossy dapat dikembalikan seperti data sebelum dikompresi atau data aslinya. Perubahan yang terjadi pada data pada saat proses kompresi tidaklah terlalu
kelihatan. Teknik kompresi ini biasanya digunakan pada data berupa gambar, suara dan video. Karena pada data tersebutlah kehilangan akan informasi yang detail itu
mungkin tidak dapat dirasakan oleh sistem kerja indera penglihatan dan pendengaran manusia. Contoh algoritma kompresi Lossy adalah Fractal Compression, Wavelet
Compression, Wyner-Ziv Coding WZC, dan lain-lain.
Gambar 2.2. Ilustrasi Kompresi LossySayood, 2006
Contoh aplikasi lossy compression : aplikasi pengkompres suara mp3 compressor,ambar adobe photoshop, paint, video xilisoft. Contoh format file lossy
compression yaitu MP3, JPEG, MPEG
2.1.2. Pengukuran Kinerja Kompresi Data
Pada suatu teknik yang digunakan dalam proses kompresi data terdapat beberapafaktor atau variabel yang biasa digunakan untuk mengukur kualitas dari suatu
teknikkompresi data tersebut, yaitu Salomon Motta, 2010:
Universitas Sumatera Utara
1. Ratio of Compression Rc
Ratio of Compression Rc adalah perbandingan antara ukuran data sebelum dikompresi dengan ukuran data setelah dikompresi.
= ℎ
2. Compression Ratio Cr
Compression Ratio Cr adalah persentasi besar data yang telah dikompresi yang didapat dari hasil perbandingan antara ukuran data setelah dikompresi dengan
ukuran data sebelum dikompresi.
= ℎ
100
3. Space Savings SS
Space Savings SS adalah persentase selisih antara data yang belum dikompresi dengan besar data yang dikompresi.
= 100 −
4. Waktu kompresi dan dekompresi
Waktu kompresi dan dekompresi adalah waktu yang dibutuhkan untuk melakukan proses kompresi dan dekompresi. Semakin kecil waktu yang diperoleh maka
semakin efisien metode yang digunakan dalam proses kompresi dan dekompresi itu.
2.2. Text File
Text file disebut juga dengan flat file adalah salah satu jenis file komputer yang tersusun dalam suatu urutan baris data teks biasanya diwakili oleh 8 bit kodeAmerican
Standard Code for Information Interchange ASCII dan Extended Binary Coded
Universitas Sumatera Utara
Decimal Interchange Code EBCDIC merupakan cikal bakal dari set karakter lainnya. ASCII American Standard Code for Information Interchange merupakan
suatu standar internasional dalam kode huruf dan simbol seperti Hex dan Unicode tetapi ASCII lebih bersifat universal. ASCII digunakan oleh komputer dan alat
komunikasi lain untuk menunjukkan teks. Kode ASCII memiliki komposisi bilangan biner sebanyak 8 bit, dimulai dari 00000000 hingga 11111111. Total kombinasi yang
dihasilkan sebanyak 256, dimulai dari kode 0 hingga 255 dalam sistem bilangan desimal. Format file teks yang akan digunakan dalam penelitian ini adalah :
1. Format data teks
Format data teks merupakan format teks yang digunakan untuk menyimpan huruf, angka, karakter, kontrol tabulasi, pindah baris, dan sebagainya atau simbol-simbol
lain yang biasa digunakan dalam tulisan seperti titik, koma, tanda petik, dan sebagainya. Satu huruf, angka, karakter, kontrol atau simbol pada arsip teks memakan
tempat satu byte. Berbeda dengan jenis teks terformat yang satu huruf saja dapat memakan tempat beberapa byte untuk menyimpan format dari huruf tersebut seperti
font, ukuran, tebal atau tidak dan sebagainya. Kelebihan dari format data teks ini adalah ukuran datanya yang kecil karena tiadanya fitur untuk memformat tampilan
teks. Saat ini perangkat lunak yang paling banyak digunakan untuk memanipulasi format data ini adalah Notepad. Pramilo, 2008
2. Format data dokumen
Doc merupakan ekstensi arsip dokumen perangkat lunak Microsoft Word yang paling banyak digunakan dalam penulisan laporan, makalah dan sebagainya. Doc merupakan
jenis teks terformat yang tidak hanya dapat mengatur tampilan teks seperti styles font, ukuran huruf dan sebagainya, namun juga dapat menyisipkan gambar.
Kekurangan format teks dokumen ini terletak pada ukuran datanya yang besar. Pramilo, 2008
Universitas Sumatera Utara
2.3. Algoritma Inverted Elias Gamma