lebih lanjut mengenai kedua protokol ini akan diuraikan pada sub bab selanjutnya.
4. Codec
Codec merupakan kependekan dari CompressorDecompressor. Codec merupakan teknologi yang memaketkan data voice ke dalam format lain dengan
perhitungan matematis tertentu, sehingga menjadi lebih teratur dan mudah dipaketkan. Codec bertujuan untuk mengurangi penggunaan bandwith di dalam
transmisi sinyal pada setiap pemanggilan dan sekaligus berfungsi untuk mengingkatkan jumlah panggilan. Dengan adanya codec, penggunaaan
bandwith pada jaringan VoIP dapat dihemat. Banyak sekali jenis protokol vioce codec yang tersedia untuk implementasi VoIP. Voice Codec yang umum
dikenal adalah : G.711, G.723, G.726, G.728, G.729 dan GSM 06.10.
2.1.4 Compressor-decompressor Codec pada VoIP
Pengkodean suara merupakan pengalihan kode analog menjadi kode digital agar suara dapat dikirim dalam jaringan komputer Purbo, 2007. Pengkodean
dikenal dengan istilah codec, yang merupakan singkatan dari coder-decoder atau compressor-decompressor. Berbagai jenis codec dikembangkan untuk memampatkan
suara agar bisa menggunakan bandwidth secara hemat tanpa mengorbankan kualitas suara suara yang keluar masih dapat didengar dengan baik Wahyuddin M. I. 2009.
Perbedaan skema kompresi dapat dibandingkan dengan 4 parameter, yaitu Boger, Y.:
1. Compressed voice rate, codec mengkompres suara berkisar dari 64 kbps
sampai bit rate yang lebih rendah. 2.
Complexity, semakin tinggi tingkat kerumitan codec, semakin tinggi resource komputer yang diminta.
3. Voice quality, pengompresan suara di beberapa codec menghasilkan kualitas
yang sangat bagus, sedangkan yang lain menyebabkan degradasi yang signifikan.
4. Digitalizing delay, setiap algoritma membutuhkan waktu untuk mem-buffer
percakapan sebelum pengompresan, inilah yang disebut dengan digitalizing delay. Delay ini dimasukkan ke dalam delay end-to-end secara keseluruhan.
Codec mempengaruhi kebutuhan bandwidth untuk VoIP, semakin kecil bit rate sinyal digital yang dihasilkan codec, maka semakin baik codec tersebut. Namun
perhitungan matematis yang dilakukannya menjadi semakin rumit dan ini mempengaruhi kualitas suara setelah di-decode. Kualitas suara biasanya dihitung
dengan metode Mean Opinion Score MOS. Metode ini memberi nilai rata-rata kualitas suara antara 1 sampai 5 dimana 1 artinya buruk dan 5 artinya baik. Codec
mengconverter sinyal analog menjadi digital untuk pemancaran melalui rangkaian data.
1. Codec G.711 G.711 adalah suatu standar Internasional untuk kompresi audio dengan
menggunakan teknik Pulse Code Modulation PCM dalam pengiriman suara. PCM mengkonversikan sinyal analog kebentuk digital dengan melakukan
sampling sinyal analog tersebut 8000 kali perdetik dan dikodekan dalam kode angka. Jarak antar sampel adalah 125 μ detik. Sinyal analog pada suatu
percakapan diasumsikan berfrekuensi 300 Hz-3400 Hz. Sinyal tersampel lalu dikonversikan ke bentuk diskrit. Sinyal diskrit ini direpresentasikan dengan kode
yang disesuaikan dengan amplitudo dari sinyal sampel. Format PCM menggunakan 8 bit untuk pengkodeannya. Laju transmisi diperoleh dengan
mengkalikan 8000 sampel perdetik dengan 8 bit persampel, menghasilkan 64.000 bit perdetik. Bit rate 64 Kbps ini merupakan standar transmisi untuk satu kanal
telepon digital. Percakapan berupa sinyal analog yang melalui jaringan PSTN mengalami
kompresi dan pengkodean menjadi sinyal digital oleh PCM G.711 sebelum memasuki VoIP gateway. Pada VoIP gateway, di bagian terminal, terdapat audio
codec melakukan proses framing pembentukan frame datagram IP yang dikompresi dari sinyal suara terdigitasi hasil PCM G.711 dan juga melakukan
rekonstruksi pada sisi receiver. Frame yang merupakan paket-paket informasi ini lalu ditransmisikan melalui jaringan IP dengan suatu standar komunikasi jaringan
packetbased. Standar G.711 merupakan teknik kompresi yang tidak efisien, karena akan memakan bandwidth 64 Kbps untuk kanal pembicaraan.
Codec G.711 dibagai menjadi 2, yaitu G.711 U-law standar Amerika Serikat dan Jepang dan G.711 A-law standar Eropa dan negara lainnya selain Amerika
Serikat dan Jepang. U-law berkaitan dengan penggunaan kabel T1 yang digunakan di Amerika Utara dan Jepang sedangkan A-law berkaitan dengan
kabel E1 yang digunakan di Eropa dan negara – negara lainnya. Kabel T1 terdiri dari 24 kanal dengan kecepatan keseluruhan 1544 Mbit per detik. Sedangkan
kabel E1 terdiri dari 31 kanal dengan kecepatan total 2048 Mbit per detik. G.711 A-law dan G.711 U-law memiliki perbedaan pada algoritma yang
digunakan. Codec G.711 A-law melakukan sampling sinyal suara menjadi 13 bit, sedangkan codec G.711 U-law melakukan sampling sinyal suara menjadi 14 bit
Brokish, C.W. Lewis, M. 1997. Perbedaan kualitas suara yang dihasilkan
juga terjadi antara codec G.711 A-law dan U-law walaupun sedikit, dimana kedua codec tersebut memiliki bit rate yang hampir sama besar. Perbedaan ini
disebabkan karena perbedaan algoritma yang digunakan oleh kedua codec tersebut, codec G.711 A-law menggunakan algoritma yang lebih sederhana
dibandingkan dengan yang digunakan oleh G.711 U-law. Proses encoder dan decoder pada codec G.711 A-Law dan U-Law dapat
dilihat pada block diagram di bawah ini :
Gambar 2.2 Block diagram encoder pada G.711
Penjelasan dari block diagram di atas adalah : •
Konversi sinyal A-Law atau U-Law ke uniform linear PCM. •
Menghitung perbedaan sinyal dengan mengurangkan perkiraan sinyal input dari sinyal input itu sendiri.
• Mengeksekusi adaptif 31-, 15-, 7- atau 4-level kuantisasi untuk menetapkan
lima, empat, tiga atau dua digit biner, untuk nilai sinyal yang digunakan pada transmisi.
• Menghitung perkiraan sinyal input yang diharapkan.
Gambar 2.3 Block diagram decoder pada G.711 Penjelasan block diagram decoder di atas adalah :
• Sebuah quantizer menghasilkan perbedaan sinyal terkuantisasi dari lima,
empat, tiga atau dua digit biner. •
Perkiraan sinyal ditambahkan pada perbedaan sinyal terkuantisasi untuk menghasilkan versi rekonstruksi dari sinyal input.
• Kedua sinyal tersebut diproses oleh adaptive predictor yang menghitung
perkiraan sinyal yang diharapkan, menyusun sinyal dari yang berbeda menjadi seragam linear PCM.
• Mengkompresi sinyal PCM linear sesuai dengan A-Law atau U-Law.
2. Codec GSM 06.10 Codec GSM 06.10 adalah suatu standar internasional yang dimiliki oleh
European Telecommunications Standards Institute ETSI. GSM 06.10 memiliki bit rate yang jauh berbeda dari codec G.711 A-law maupun G.711 U-law. Codec
GSM 06.10 memiliki bit rate 13 kbps sedangkan codec G.711 A-law dan G.711 U-law memiliki bit rate sebesar 64 kbps Purbo, O.W. Raharja, A. 2010. Hal
inilah yang menyebabkan besarnya perbedaan kualitas suara yang dihasilkan oleh codec GSM 06.10 dan G.711.
GSM yang digunakan pada asterisk merupakan GSM-FR yang biasa disebut juga GSM 06.10. Codec ini menggunakan Linear Predictive Coding with
Regular Pulse Excitation LPC-RPE. GSM-FR merupakan codec suara yang beroperasi pada 13.2 kbps dengan lebar paket 20ms. Setiap paket berisi payload
sebesar 264 bit atau sekitar 33 byte. Perhitungan pemakaian bandwidth untuk codec ini dapat dijabarkan sebagai berikut Zuhdan, 2008.
• Bit rate Br = 13,2 kbps = 13200 bps
• Packet length = 20 ms
• Packets Ps = 120ms
= 10.02s = 50 packets
• Payload = Br Ps
= 13200 bps 50 = 264bit = 33 Byte
• IP header IP + UDP + RTP = 40 Byte
• Bandwidth = payload + IP header X packets X 8 bitByte
Bandwidth = 33 + 40 X 50 X 8 = 29,2 Kbps
Linear Prediction
Synthesis Filter
Long term prediction
Excitation analysis Packet Suara 20 ms
36 bit
36 bit
206 bit error
- +
Gambar 2.4 Diagram codec GSM Encoder
• input speech frame, terdiri dari 160 sample sinyal uniform 13 bit PCM
sample, pertama kali di pre-proses untuk menghasilkan offset free signal yang akan menjadi urutan pertama dalam pre-emphasis filter.160 sample
sinyal yang diperoleh kemudian dianalisa untuk menentukan koefisien untuk filter analisis jangka pendek analisis LPC. Parameter ini kemudian
digunakan untuk penyaringan 160 sampe yang sama. Hasilnya adalah 160 sample dari short term residu signal. Filter parameter, disebut koefisien
refleksi ditransformasikan ke area log rasio, LARs sebelum ditransmisikan. Speech frame dibagi menjadi 4 sub-frame dengan 40 sample pada setiap
frame. Setiap sub frame diproses berdasarkan blok oleh elemen fungsional berikutnya.
• sebelum pemrosesan sub-blok dari 40 short term sample, parameter dari long
term analisis filter, LTP lag dan LTP gain diperkirakan dan diupdate pada blok LTP analisis, pada dasar sub blok yang sekarang dan urutan yang
tersimpan dari 120 sample short term sebelumnya. •
sebuah blok dari 40 sample long term residual didapatkan dengan mengurangi perkiraan 40 short term residual signal itu sendiri. Menghasilkan 40 blok long
term residual sample diumpankan ke Regular Pulse Excitation Analysis yang menghasilkan kompresi dasar dari algoritma
• Sebagai hasil dali RPE-analysis, 40 blok input long term residual signal
diwakili oleh salah satu dari 4 kandidat dari masing-masing 13 getaran. Sub- urutan terpilih diidentifikasi ole RPE grid position M. 13 getaran RPE
diencode menggunakan Adaptive Pulse Code Modulation APCM dengan perkiraan dari amplitudo sub-blok yang ditransmisikan ke decoder sebagai
informasi tambahan. RPE parameter juga diumpankan ke sebuah decoing RPE lokal dan modul rekonstruksi yang menghasilkan 40 blok short term residual
signal baru dari versi kuantisasi dari long term residual signal. •
Dengan menambahkan 40 sample terkuantisasi dari long term residual signal ke blok sebelumnya dari short term residual signal memperkirakan, sebuah
versi rekonstruksi dari short term residual signal yang sekarang yang dihasilkan. Blok dari short term residual signal yang direkonstruksi ini
kemudian diumpankan ke long term analysis filter yang menghasilkan 40 blok baru dari short term residual signal yang digunakan untuk sub blok
selanjutnya untuk melengkapi feedback loop.
Decoder •
Decoder memiliki feedback loop yang sama dengan encoder. Dalam transmisi bebas error, output dari tahap ini adalah short term residual sample yang telah
direkonstruksi. Sample ini kemudian diterapkan pada short term synthesis filter diikuti dengan de-emphasis filter menghasilkan speech signal yang
direkonstruksi. •
GSM 06.10 menjelaskan pemetaan detail antara input blok dari 160 speech sample dalam bentuk 13 bit uniform PCM ke 260 bit blok yang diencode dan
dari 260 bit blok yang diencode ke output blok yang terdiri dari 160 sample yang telah direkonstruksi. Sampling 8000 sampledetik menghasilkan rata-rata
bit rate untuk bit stream encode sebesear 13 kbits
2.2 Session Initiation Protocol SIP