9 2.1.2 Compression Ratio
Compression Ratio atau rasio kompresi adalah rasio atau perbandingan antara ukuran data yang dikompresi dengan ukuran data asli. Misalkan rasio kompresi suatu data
adalah 30, maka 30 data semula telah berhasil dikompres. Secara matematis rasio kompresi dapat ditulis sebagai berikut Salomon, 2008 :
Rasio Kompresi = −
Hasil Kompresi Audio Asli x
. Sedangkan untuk menghitung laju dari data yang dikompresi rate of compression
dapat dihitung :
Laju Kompresi = Rasio Kompresi .
2.1.3 Redundansi Redundansi atau duplikasi merupakan suatu keadaan dimana representasi suatu
elemen data tidak bernilai signifikan dalam merepresentasikan keseluruhan data. Keadaan ini menyebabkan data keseluruhan dapat direpresentasikan secara lebih
kompak dengan cara menghilangkan representasi dari sebuah elemen data yang redundan.
2.2 Pengertian Audio
Audio adalah fenomena fisik yang dihasilkan oleh getaran suatu benda yang berupa sinyal analog dengan amplitudo yang berubah ubah secara kontinyu terhadap waktu
yang disebut frekuensi. Selama bergetar, perbedaan tekanan terjadi di udara sekitarnya. Pola osilasi yang terjadi dinamakan sebagai gelombang. Gelombang
mempunyai pola sama yang berulang pada interval tertentu yang disebut sebagai periode.
Universitas Sumatera Utara
10
Benda bergetar
Melewati udara Gelombang
Perbedaan tekanan udara
Melewati udara gelombang
Pendengar
Gambar 2.2 Alur Gelombang Suara Mukhlis, 2012
2.2.1 Representasi Audio Digital Setiap citra dilakukan proses digitasi dan diubah ke bentuk piksel-piksel, dimana tiap-
tiap piksel merupakan gabungan dari angka. Sama seperti citra, audio juga dilakukan proses digitasi dan diubah ke dalam bentuk angka atau dikatakan dengan tahap
kuantisasi Salomon, et al, 2010. Gelombang suara analog tidak dapat lansung direpresentasikan pada komputer.
Komputer hanya mampu mengenal sinyal dalam bentuk digital. Bentuk digital yang dimaksud adalah tegangan yang diterjemahkan dalam angka 0 dan 1, yang disebut
dengan istilah bit. Dengan kecepatan perhitungan yang dimiliki komputer, komputer mampu melihat angka 0 dan 1 ini menjadi kumpulan bit-bit dan menerjemahkan bit-
bit tersebut menjadi sebuah informasi yang bernilai. Untuk memasukkan suara analog sehingga dapat dimanipulasi oleh peralatan
elektronik yang ada menggunakan alat. Alat yang diperlukan untuk melakukan ini adalah transducer yaitu sebuah peralatan yang dapat mengubah tekanan udara yang
kita dengar sebagai suara ke dalam tegangan elektrik yang dapat dimengerti oleh perangkat elektronik, serta sebaliknya. Contoh dari transducer adalah mikrofon dan
speaker. Mikrofon dapat mengubah tekanan udara menjadi tegangan elektrik, sementara speaker mengubah tegangan elektrik menjadi tekanan udara.
Tegangan elektrik ini akan diproses menjadi sinyal digital oleh sound card. Ketika suara direkam ke dalam komputer, sound card akan mengubah gelombang
suara bisa dari mikrofon atau stereo set menjadi data digital, dan ketika suara itu dimainkan kembali, sound card akan mengubah data digital menjadi suara yang kita
dengar melalui speaker, atau disebut juga dengan gelombang analog. Proses pengubahan gelombang suara menjadi data digital ini dinamakan
Analog-to-Digital Conversion ADC, dan kebalikannya, pengubahan data digital menjadi gelombang suara dinamakan Digital-to-Analog Conversion DAC.
Proses pengubahan dari tegangan analog ke data digital ini terdiri atas beberapa tahap yaitu:
Universitas Sumatera Utara
11
1. Membuang frekuensi tinggi dari sumber sinyal Filtering. 2. Mengambil sampel pada interval waktu tertentu Sampling.
3. Menyimpan amplitudo sampel dan mengubahnya ke dalam bentuk diskrit kuantisasi.
4. Merubah bentuk menjadi data digital dengan nilai biner.
Band limiteng Filter
Sample-and-hold Quantizer
Sinyal Analog Suara
Terdigitasi Analog to digital
Converter Encoder
Gambar 2.3 Proses Digitasi Mukhlis, 2012
Proses pengubahan sinyal analog menjadi digital harus memenuhi sebuah kriteria, yaitu kriteria Nyquist Salomon, et al, 2010. Kriteria ini mengatakan bahwa
untuk memperoleh representasi akurat dari suatu sinyal analog secara lossless, amplitudonya harus diambil sampel setidaknya pada kecepatan rate sama atau lebih
besar dari 2 kali komponen frekuensi maksimum yang akan didengar. Misalkan, jika frekuensi audio di atas 2000 Hz, maka sampel yang diambil harus lebih dari 4000 Hz.
2.2.2 Kelebihan Audio Digital Kelebihan audio digital adalah kualitas reproduksi yang sempurna. Kualitas
reproduksi yang sempurna yang dimaksud adalah kemampuannya untuk menggandakan sinyal audio secara berulang-ulang tanpa mengalami penurunan
kualitas suara. Kelebihan lain dari audio digital adalah ketahanan terhadap noise sinyal yang
tidak diinginkan. Pada saat transmisi data dan pemrosesan dengan komponen- komponen elektrik, pada sinyal analog sangat mudah sekali terjadi gangguan-
gangguan berupa noise. Suara desis pada kaset rekaman merupakan salah satu contoh terjadinya noise berupa gangguan pada frekuensi tinggi. Dalam dunia audio digital,
Universitas Sumatera Utara
12 ada beberapa istilah yaitu sampling rate laju pencuplikan, bit per sample, bit rate
laju bit, channel jumlah kanal.
2.2.3 Sampling Rate Ketika sound card mengubah audio menjadi data digital, sound card akan memecah
suara tadi menurut nilai menjadi potongan-potongan sinyal dengan nilai tertentu. Proses sinyal ini bisa terjadi ribuan kali dalam satuan waktu. Banyak pemotongan
dalam satu satuan waktu ini dinamakan sampling rate laju pencuplikan. Satuan sampling rate yang biasa digunakan adalah Hz Hertz.
Kerapatan laju pencuplikan ini menentukan kualitas sinyal analog yang akan diubah menjadi data digital. Makin rapat sampling rate ini, kualitas suara yang
dihasilkan akan makin mendekati suara aslinya. Sebagai contoh, lagu yang disimpan dalam Compact Disc Audio CDA memiliki sampling rate 44100 Hz, yang berarti
lagu ini dicuplik sebanyak 44100 kali dalam satu detik untuk memastikan kualitas suara yang hampir sama persis dengan aslinya.
Sampling rate yang umumnya digunakan antara lain 8000 Hz, 11000 Hz, 16000 Hz, 22000 Hz, 24000 Hz, 44000 Hz, 88000 Hz. Makin tinggi sampling rate,
semakin baik kualitas audio. Teori Nyquist menyatakan bahwa sampling rate yang diperlukan minimal 2 kali bandwidth sinyal. Hal ini berkaitan dengan kemampuan
untuk merekonstruksi ulang sinyal audio.
Tabel 2.1 Tabel Frekuensi Sampling dan Kualitas Suara yang Dihasilkan
Sampling Rate Aplikasi
11,025 22,025
32,075 44,1
48 Radio AM
Mendekati Radio FM Lebih baik dari Radio FM
Compact Disc Audio CDA Digital Audio Tape DAT
2.2.4 Bit per Sample Bit per sample menyatakan seberapa banyak bit yang diperlukan untuk menyatakan
hasil sampel tersebut, hal ini berkaitan dengan proses kuantisasi. Bit rate yang digunakan adalah 8 bit per sample atau 16 bit per sample. Proses kuantisasi akan
mengubah amplitudo sinyal audio menjadi suatu level sinyal tertentu. Dengan 8 bit
Universitas Sumatera Utara
13 per sample akan ada 256 level pilihan sedangkan 16 bit per sample akan ada 65.536
level pilihan. Makin tinggi bit per sample makin teliti proses kuantisasi. Dalam contoh ini, penggunaan 16 bit per sample dibandingkan penggunaan 8 bit per sample akan
mempertinggi ketelitian kualitas kuantisasi sebanyak 256 kali.
2.2.5 Bit Rate Istilah bit rate merupakan gabungan dari istilah sampling rate dan bit per sample. Bit
rate menyatakan banyaknya bit yang diperlukan untuk menyimpan audio selama satu detik, satuannya adalah bit per detik. Bit rate dengan satuan bit per detik diperoleh
dengan rumus yang sederhana yaitu perkalian antara jumlah kanal, sampling rate dengan satuan Hertz dan bit per sample dengan satuan bit.
Tabel 2.2 Tabel Penyimpanan Berbagai Konfigurasi Audio Digital Sampling rate
Bit per sample
Jumlah kanal
Bit rate Byte rate 1
byte = 8 bit Byte rate
per menit
12 kHz 8
1 96.000
12.000 720 KB
12 kHz 8
2 192.000
24.000 1,44 MB
12 kHz 16
1 192.000
24.000 1,44 MB
12 kHz 16
2 348.000
48.000 2,88 MB
24 kHz 8
1 192.000
24.000 1,44 MB
24 kHz 8
2 348.000
48.000 2,88 MB
24 kHz 16
1 348.000
48.000 2,88 MB
24 kHz 16
2 768.000
96.000 5,76 MB
44.1 kHz 8
1 352.800
44.100 2,646 MB
44.1 kHz 8
2 705.600
88.200 5,292 MB
44.1 kHz 16
1 705.600
88.200 5,292 MB
44.1 kHz 16
2 1.411.200
176.400 10,584 MB
Audio sekualitas CD Audio menggunakan sampling rate 44,1 kHz, 16 bit per sample, 2 kanal. Total media yang diperlukan untuk menyimpan data audio ini
perdetik adalah 176.400 byte, untuk durasi 1 menit diperlukan 10,584 MB. Jika rata- rata durasi satu lagu selama 5 menit, maka dibutuhkan tempat lebih dari 50 MB untuk
menyimpan data audio lagu tersebut jika diasumsikan 1 KB = 1.000 byte dan 1 MB = 1.000 KB = 1.000.000 byte.
2.2.6 MP3 MPEG-1 Layer 3 Sejarah Mp3 dimulai dari tahun 1991 saat proposal dari philips Belanda, CCET
Perancis, dan Fur Rundfunktechnik Jerman memenangkan proyek untuk DAB
Universitas Sumatera Utara
14 Digital Audio Broadcast. Produk mereka Musicam yang dikenal dengan Layer 2
terpilih karena kesederhanaan, ketahanan terhadap kesalahan, dan perhitungan komputasi yang sederhana untuk melakukan pengkodean yang menghasilkan keluaran
yang memiliki kualitas tinggi. Pada akhirnya ide dan teknologi yang dikembangkan menjadi MPEG-1 Layer 3.
Mp3 merupakan salah satu format audio digital yang memiliki teknik kompresi sendiri yang bersifat lossy yaitu menghilangkan beberapa bagian audio yang tidak
dapat dideteksi pendengaran manusia. Mp3 dibuat dengan mengambil data audio dari file Wav dan diproses dengan sebuah algoritma untuk mengurangi besarnya ukuran
audio. Oleh karena itu, mp3 lebih popular dan banyak dipakai untuk perdagangan musik di internet dibanding file Wav yang berukuran besar.
Sebuah file Mp3 terdiri dari header dan audio data serta pada akhir dari file biasanya terdapat ID3 Tag yang berisi informasi judul lagu, artis, album, dan lain lain
yang tidak diperlukan dalam proses encoding ataupun decoding, dapat dilihat seperti Gambar 2.4.
Header Data
Audio Side
Info
Gambar 2.4 Struktur File Mp3
Header Mp3 memegang peranan peranan penting dalam proses decoding. Header terdiri dari 32 bit, dimana bit-bit tersebut merupakan informasi dari tipe audio data.
Gambar 2.5 Header Mp3 Raissi, 2002
Universitas Sumatera Utara
15 Informasi yang dapat diperoleh dari header dan keterangan tiap-tiap bit dijelaskan
pada Tabel 2.3.
Tabel 2.3 Tabel Keterangan Header Mp3
Panjang Bit
Posisi Bit
Deskripsi
11 31-21
Bit untuk sinkronisasi frame 2
20-19 Versi MPEG audio
Bit Versi MPEG audio
00 MPEG versi 2.5
01 Cadangan
10 MPEG versi 2
11 MPEG versi 1
2 18-17
Deskripsi layer Bit
Deskripsi layer
00 Cadangan
01 Layer 3
10 Layer 2
11 Layer 1
1 16
Bit proteksi CRC 16 nilai = terproteksi 4
15-12 Index Bitrate
Bit Versi1,
Layer1 Versi1,
Layer2 Versi1,
Layer3 Versi3,
Layer1 Versi2,
Layer2 Versi2,
Layer3 0000
Free Free
Free Free
Free Free
0001 32
32 32
32 32
8 0010
64 48
40 64
48 16
0011 96
56 48
96 56
24 0100
128 64
56 128
64 32
0101 160
80 64
160 80
64 0110
192 96
80 192
96 80
0111 224
112 96
224 112
56 1000
256 128
112 256
128 64
1001 288
160 128
288 160
128 1010
320 192
160 320
192 160
1011 352
224 192
352 224
112 1100
384 256
224 384
256 128
1101 416
320 256
416 320
256 1110
448 384
320 448
384 320
1111 Bad
Bad Bad
Bad Bad
Bad
Universitas Sumatera Utara
16
Tabel 2.3 Tabel Keterangan Header Mp3 Lanjutan
Panjang Bit
Posisi Bit
Deskripsi
2 11-10
Index Sampling Frekuensi Bit
MPEG 1 MPEG 2
MPEG 2.5
00 44100
22050 11025
01 48000
24000 12000
10 32000
16000 8000
11 Cadangan
Cadangan Cadangan
1 9
Bit Padding nilai 0 = frame tidak di pad 1
8 Private bit
2 7-6
Mode Channel Bit
Channel
00 Stereo
01 Joint Stereo
10 Dual Channel Stereo
11 Single Channel mono
2 5-4
Mode ekstension hanya pada mode joint Stereo Bit
Intensity Stereo Ms Stereo
00 Off
Off 01
On Off
10 Off
On 11
On On
1 3
Copyright nilai 0= audio tidak di copyright 1
2 Original nilai = copy dari media oriiginal
2 1-0
Emphasis Bit
Value
00 None
01 5015
10 Cadangan
11 CCIT J.17
Berikut ilustrasi contoh suatu header 32 bit pada file Mp3. Suatu sampel audio yang bernilai :
FF FB
90 04
Berarti nilai bitnya : 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1
Bit ke- 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16
Universitas Sumatera Utara
17
1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 Bit ke-
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
Dari ilustrasi diatas maka bit ke- 31 sampai 21 adalah sinkronisasi frame. Bit ke-20 dan ke-19, keduanya bernilai 1 yang menunjukkan versi MPEG versi 1. Bit ke-
18 dan ke-17 bernilai 0 dan 1 sehingga layernya adalah layer 3. Bit ke-16 bernilai 1 berarti tidak ada 16 bit CRC. Bit ke-15 sampai 12 bernilai 1001, menunjukkan bahwa
bitrate-nya adalah 128 kbps. Bit ke-11 dan ke-10 bernilai 0 berarti frekuensi samplingnya adalah 44.1 kHz, bit ke-9 bernilai 0 menunjukkan bahwa tidak terdapat
padding dan untuk bit ke-8 bernilai 0, untuk kepentingan pribadi serta untuk bit ke-7 dan 6 bernilai 0 berarti mode adalah stereo.
Bit ke-5 dan 4 bernilai 0 yang berarti intensitas stereo dan Ms stereo keduanya off, bit ke-3 bernilai 0 menunjukkan tidak di copyright dan bit ke-2 bernilai 1 berarti
file tidak di copy dari media original sedangkan untuk bit ke-1 dan ke-0 bernilai 0 maka emphasis bernilai none.
2.3 Penelitian Sebelumnya