Pengertian Audio Implementasi Algoritma Shannon-Fano Pada Kompresi Audio

9 2.1.2 Compression Ratio Compression Ratio atau rasio kompresi adalah rasio atau perbandingan antara ukuran data yang dikompresi dengan ukuran data asli. Misalkan rasio kompresi suatu data adalah 30, maka 30 data semula telah berhasil dikompres. Secara matematis rasio kompresi dapat ditulis sebagai berikut Salomon, 2008 : Rasio Kompresi = − Hasil Kompresi Audio Asli x . Sedangkan untuk menghitung laju dari data yang dikompresi rate of compression dapat dihitung : Laju Kompresi = Rasio Kompresi . 2.1.3 Redundansi Redundansi atau duplikasi merupakan suatu keadaan dimana representasi suatu elemen data tidak bernilai signifikan dalam merepresentasikan keseluruhan data. Keadaan ini menyebabkan data keseluruhan dapat direpresentasikan secara lebih kompak dengan cara menghilangkan representasi dari sebuah elemen data yang redundan.

2.2 Pengertian Audio

Audio adalah fenomena fisik yang dihasilkan oleh getaran suatu benda yang berupa sinyal analog dengan amplitudo yang berubah ubah secara kontinyu terhadap waktu yang disebut frekuensi. Selama bergetar, perbedaan tekanan terjadi di udara sekitarnya. Pola osilasi yang terjadi dinamakan sebagai gelombang. Gelombang mempunyai pola sama yang berulang pada interval tertentu yang disebut sebagai periode. Universitas Sumatera Utara 10 Benda bergetar Melewati udara Gelombang Perbedaan tekanan udara Melewati udara gelombang Pendengar Gambar 2.2 Alur Gelombang Suara Mukhlis, 2012 2.2.1 Representasi Audio Digital Setiap citra dilakukan proses digitasi dan diubah ke bentuk piksel-piksel, dimana tiap- tiap piksel merupakan gabungan dari angka. Sama seperti citra, audio juga dilakukan proses digitasi dan diubah ke dalam bentuk angka atau dikatakan dengan tahap kuantisasi Salomon, et al, 2010. Gelombang suara analog tidak dapat lansung direpresentasikan pada komputer. Komputer hanya mampu mengenal sinyal dalam bentuk digital. Bentuk digital yang dimaksud adalah tegangan yang diterjemahkan dalam angka 0 dan 1, yang disebut dengan istilah bit. Dengan kecepatan perhitungan yang dimiliki komputer, komputer mampu melihat angka 0 dan 1 ini menjadi kumpulan bit-bit dan menerjemahkan bit- bit tersebut menjadi sebuah informasi yang bernilai. Untuk memasukkan suara analog sehingga dapat dimanipulasi oleh peralatan elektronik yang ada menggunakan alat. Alat yang diperlukan untuk melakukan ini adalah transducer yaitu sebuah peralatan yang dapat mengubah tekanan udara yang kita dengar sebagai suara ke dalam tegangan elektrik yang dapat dimengerti oleh perangkat elektronik, serta sebaliknya. Contoh dari transducer adalah mikrofon dan speaker. Mikrofon dapat mengubah tekanan udara menjadi tegangan elektrik, sementara speaker mengubah tegangan elektrik menjadi tekanan udara. Tegangan elektrik ini akan diproses menjadi sinyal digital oleh sound card. Ketika suara direkam ke dalam komputer, sound card akan mengubah gelombang suara bisa dari mikrofon atau stereo set menjadi data digital, dan ketika suara itu dimainkan kembali, sound card akan mengubah data digital menjadi suara yang kita dengar melalui speaker, atau disebut juga dengan gelombang analog. Proses pengubahan gelombang suara menjadi data digital ini dinamakan Analog-to-Digital Conversion ADC, dan kebalikannya, pengubahan data digital menjadi gelombang suara dinamakan Digital-to-Analog Conversion DAC. Proses pengubahan dari tegangan analog ke data digital ini terdiri atas beberapa tahap yaitu: Universitas Sumatera Utara 11 1. Membuang frekuensi tinggi dari sumber sinyal Filtering. 2. Mengambil sampel pada interval waktu tertentu Sampling. 3. Menyimpan amplitudo sampel dan mengubahnya ke dalam bentuk diskrit kuantisasi. 4. Merubah bentuk menjadi data digital dengan nilai biner. Band limiteng Filter Sample-and-hold Quantizer Sinyal Analog Suara Terdigitasi Analog to digital Converter Encoder Gambar 2.3 Proses Digitasi Mukhlis, 2012 Proses pengubahan sinyal analog menjadi digital harus memenuhi sebuah kriteria, yaitu kriteria Nyquist Salomon, et al, 2010. Kriteria ini mengatakan bahwa untuk memperoleh representasi akurat dari suatu sinyal analog secara lossless, amplitudonya harus diambil sampel setidaknya pada kecepatan rate sama atau lebih besar dari 2 kali komponen frekuensi maksimum yang akan didengar. Misalkan, jika frekuensi audio di atas 2000 Hz, maka sampel yang diambil harus lebih dari 4000 Hz. 2.2.2 Kelebihan Audio Digital Kelebihan audio digital adalah kualitas reproduksi yang sempurna. Kualitas reproduksi yang sempurna yang dimaksud adalah kemampuannya untuk menggandakan sinyal audio secara berulang-ulang tanpa mengalami penurunan kualitas suara. Kelebihan lain dari audio digital adalah ketahanan terhadap noise sinyal yang tidak diinginkan. Pada saat transmisi data dan pemrosesan dengan komponen- komponen elektrik, pada sinyal analog sangat mudah sekali terjadi gangguan- gangguan berupa noise. Suara desis pada kaset rekaman merupakan salah satu contoh terjadinya noise berupa gangguan pada frekuensi tinggi. Dalam dunia audio digital, Universitas Sumatera Utara 12 ada beberapa istilah yaitu sampling rate laju pencuplikan, bit per sample, bit rate laju bit, channel jumlah kanal. 2.2.3 Sampling Rate Ketika sound card mengubah audio menjadi data digital, sound card akan memecah suara tadi menurut nilai menjadi potongan-potongan sinyal dengan nilai tertentu. Proses sinyal ini bisa terjadi ribuan kali dalam satuan waktu. Banyak pemotongan dalam satu satuan waktu ini dinamakan sampling rate laju pencuplikan. Satuan sampling rate yang biasa digunakan adalah Hz Hertz. Kerapatan laju pencuplikan ini menentukan kualitas sinyal analog yang akan diubah menjadi data digital. Makin rapat sampling rate ini, kualitas suara yang dihasilkan akan makin mendekati suara aslinya. Sebagai contoh, lagu yang disimpan dalam Compact Disc Audio CDA memiliki sampling rate 44100 Hz, yang berarti lagu ini dicuplik sebanyak 44100 kali dalam satu detik untuk memastikan kualitas suara yang hampir sama persis dengan aslinya. Sampling rate yang umumnya digunakan antara lain 8000 Hz, 11000 Hz, 16000 Hz, 22000 Hz, 24000 Hz, 44000 Hz, 88000 Hz. Makin tinggi sampling rate, semakin baik kualitas audio. Teori Nyquist menyatakan bahwa sampling rate yang diperlukan minimal 2 kali bandwidth sinyal. Hal ini berkaitan dengan kemampuan untuk merekonstruksi ulang sinyal audio. Tabel 2.1 Tabel Frekuensi Sampling dan Kualitas Suara yang Dihasilkan Sampling Rate Aplikasi 11,025 22,025 32,075 44,1 48 Radio AM Mendekati Radio FM Lebih baik dari Radio FM Compact Disc Audio CDA Digital Audio Tape DAT 2.2.4 Bit per Sample Bit per sample menyatakan seberapa banyak bit yang diperlukan untuk menyatakan hasil sampel tersebut, hal ini berkaitan dengan proses kuantisasi. Bit rate yang digunakan adalah 8 bit per sample atau 16 bit per sample. Proses kuantisasi akan mengubah amplitudo sinyal audio menjadi suatu level sinyal tertentu. Dengan 8 bit Universitas Sumatera Utara 13 per sample akan ada 256 level pilihan sedangkan 16 bit per sample akan ada 65.536 level pilihan. Makin tinggi bit per sample makin teliti proses kuantisasi. Dalam contoh ini, penggunaan 16 bit per sample dibandingkan penggunaan 8 bit per sample akan mempertinggi ketelitian kualitas kuantisasi sebanyak 256 kali. 2.2.5 Bit Rate Istilah bit rate merupakan gabungan dari istilah sampling rate dan bit per sample. Bit rate menyatakan banyaknya bit yang diperlukan untuk menyimpan audio selama satu detik, satuannya adalah bit per detik. Bit rate dengan satuan bit per detik diperoleh dengan rumus yang sederhana yaitu perkalian antara jumlah kanal, sampling rate dengan satuan Hertz dan bit per sample dengan satuan bit. Tabel 2.2 Tabel Penyimpanan Berbagai Konfigurasi Audio Digital Sampling rate Bit per sample Jumlah kanal Bit rate Byte rate 1 byte = 8 bit Byte rate per menit 12 kHz 8 1 96.000 12.000 720 KB 12 kHz 8 2 192.000 24.000 1,44 MB 12 kHz 16 1 192.000 24.000 1,44 MB 12 kHz 16 2 348.000 48.000 2,88 MB 24 kHz 8 1 192.000 24.000 1,44 MB 24 kHz 8 2 348.000 48.000 2,88 MB 24 kHz 16 1 348.000 48.000 2,88 MB 24 kHz 16 2 768.000 96.000 5,76 MB 44.1 kHz 8 1 352.800 44.100 2,646 MB 44.1 kHz 8 2 705.600 88.200 5,292 MB 44.1 kHz 16 1 705.600 88.200 5,292 MB 44.1 kHz 16 2 1.411.200 176.400 10,584 MB Audio sekualitas CD Audio menggunakan sampling rate 44,1 kHz, 16 bit per sample, 2 kanal. Total media yang diperlukan untuk menyimpan data audio ini perdetik adalah 176.400 byte, untuk durasi 1 menit diperlukan 10,584 MB. Jika rata- rata durasi satu lagu selama 5 menit, maka dibutuhkan tempat lebih dari 50 MB untuk menyimpan data audio lagu tersebut jika diasumsikan 1 KB = 1.000 byte dan 1 MB = 1.000 KB = 1.000.000 byte. 2.2.6 MP3 MPEG-1 Layer 3 Sejarah Mp3 dimulai dari tahun 1991 saat proposal dari philips Belanda, CCET Perancis, dan Fur Rundfunktechnik Jerman memenangkan proyek untuk DAB Universitas Sumatera Utara 14 Digital Audio Broadcast. Produk mereka Musicam yang dikenal dengan Layer 2 terpilih karena kesederhanaan, ketahanan terhadap kesalahan, dan perhitungan komputasi yang sederhana untuk melakukan pengkodean yang menghasilkan keluaran yang memiliki kualitas tinggi. Pada akhirnya ide dan teknologi yang dikembangkan menjadi MPEG-1 Layer 3. Mp3 merupakan salah satu format audio digital yang memiliki teknik kompresi sendiri yang bersifat lossy yaitu menghilangkan beberapa bagian audio yang tidak dapat dideteksi pendengaran manusia. Mp3 dibuat dengan mengambil data audio dari file Wav dan diproses dengan sebuah algoritma untuk mengurangi besarnya ukuran audio. Oleh karena itu, mp3 lebih popular dan banyak dipakai untuk perdagangan musik di internet dibanding file Wav yang berukuran besar. Sebuah file Mp3 terdiri dari header dan audio data serta pada akhir dari file biasanya terdapat ID3 Tag yang berisi informasi judul lagu, artis, album, dan lain lain yang tidak diperlukan dalam proses encoding ataupun decoding, dapat dilihat seperti Gambar 2.4. Header Data Audio Side Info Gambar 2.4 Struktur File Mp3 Header Mp3 memegang peranan peranan penting dalam proses decoding. Header terdiri dari 32 bit, dimana bit-bit tersebut merupakan informasi dari tipe audio data. Gambar 2.5 Header Mp3 Raissi, 2002 Universitas Sumatera Utara 15 Informasi yang dapat diperoleh dari header dan keterangan tiap-tiap bit dijelaskan pada Tabel 2.3. Tabel 2.3 Tabel Keterangan Header Mp3 Panjang Bit Posisi Bit Deskripsi 11 31-21 Bit untuk sinkronisasi frame 2 20-19 Versi MPEG audio Bit Versi MPEG audio 00 MPEG versi 2.5 01 Cadangan 10 MPEG versi 2 11 MPEG versi 1 2 18-17 Deskripsi layer Bit Deskripsi layer 00 Cadangan 01 Layer 3 10 Layer 2 11 Layer 1 1 16 Bit proteksi CRC 16 nilai = terproteksi 4 15-12 Index Bitrate Bit Versi1, Layer1 Versi1, Layer2 Versi1, Layer3 Versi3, Layer1 Versi2, Layer2 Versi2, Layer3 0000 Free Free Free Free Free Free 0001 32 32 32 32 32 8 0010 64 48 40 64 48 16 0011 96 56 48 96 56 24 0100 128 64 56 128 64 32 0101 160 80 64 160 80 64 0110 192 96 80 192 96 80 0111 224 112 96 224 112 56 1000 256 128 112 256 128 64 1001 288 160 128 288 160 128 1010 320 192 160 320 192 160 1011 352 224 192 352 224 112 1100 384 256 224 384 256 128 1101 416 320 256 416 320 256 1110 448 384 320 448 384 320 1111 Bad Bad Bad Bad Bad Bad Universitas Sumatera Utara 16 Tabel 2.3 Tabel Keterangan Header Mp3 Lanjutan Panjang Bit Posisi Bit Deskripsi 2 11-10 Index Sampling Frekuensi Bit MPEG 1 MPEG 2 MPEG 2.5 00 44100 22050 11025 01 48000 24000 12000 10 32000 16000 8000 11 Cadangan Cadangan Cadangan 1 9 Bit Padding nilai 0 = frame tidak di pad 1 8 Private bit 2 7-6 Mode Channel Bit Channel 00 Stereo 01 Joint Stereo 10 Dual Channel Stereo 11 Single Channel mono 2 5-4 Mode ekstension hanya pada mode joint Stereo Bit Intensity Stereo Ms Stereo 00 Off Off 01 On Off 10 Off On 11 On On 1 3 Copyright nilai 0= audio tidak di copyright 1 2 Original nilai = copy dari media oriiginal 2 1-0 Emphasis Bit Value 00 None 01 5015 10 Cadangan 11 CCIT J.17 Berikut ilustrasi contoh suatu header 32 bit pada file Mp3. Suatu sampel audio yang bernilai : FF FB 90 04 Berarti nilai bitnya : 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 Bit ke- 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 Universitas Sumatera Utara 17 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 Bit ke- 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Dari ilustrasi diatas maka bit ke- 31 sampai 21 adalah sinkronisasi frame. Bit ke-20 dan ke-19, keduanya bernilai 1 yang menunjukkan versi MPEG versi 1. Bit ke- 18 dan ke-17 bernilai 0 dan 1 sehingga layernya adalah layer 3. Bit ke-16 bernilai 1 berarti tidak ada 16 bit CRC. Bit ke-15 sampai 12 bernilai 1001, menunjukkan bahwa bitrate-nya adalah 128 kbps. Bit ke-11 dan ke-10 bernilai 0 berarti frekuensi samplingnya adalah 44.1 kHz, bit ke-9 bernilai 0 menunjukkan bahwa tidak terdapat padding dan untuk bit ke-8 bernilai 0, untuk kepentingan pribadi serta untuk bit ke-7 dan 6 bernilai 0 berarti mode adalah stereo. Bit ke-5 dan 4 bernilai 0 yang berarti intensitas stereo dan Ms stereo keduanya off, bit ke-3 bernilai 0 menunjukkan tidak di copyright dan bit ke-2 bernilai 1 berarti file tidak di copy dari media original sedangkan untuk bit ke-1 dan ke-0 bernilai 0 maka emphasis bernilai none.

2.3 Penelitian Sebelumnya