Analisis perbandingan efisiensi dan efektifitas antara codec H.264 dan VP7 pada sistem Video Conference

(1)

ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS

ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO

CONFERENCE

MUHAMAD HAYKAL 105097003207

PROGRAM STUDI FISIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA


(2)

ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS

ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO

CONFERENCE

Skripsi

Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains

Oleh:

MUHAMAD HAYKAL 105097003207

PROGRAM STUDI FISIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH

JAKARTA


(3)

LEMBAR PENGESAHAN

ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE

Skripsi

Duajukan untuk memenuhi Persyaratan Memperoleh Gelar Sarjana Sains pada Fakultas Sains dan Teknologi

Universitas Islam Negeri Syarif Hidayatullah Jakarta

Oleh :

MUHAMAD HAYKAL 105097003207

Menyetujui,

Pembimbing I Pembimbing II

Arif Tjahjono, M. Si Ambran Hartono, M. Si NIP. 1975110720070 11015 NIP.19710408200212 1002

Mengetahui,

Ketua Program Studi Fisika

Drs. Sutrisno, M. Si NIP. 19590202 198203 1005


(4)

PENGESAHAN UJIAN

Skripsi berjudul “ANALISIS PERBANDINGAN EFISIENSI DAN EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE” yang ditulis oleh Muhamad Haykal dengan NIM 105097003207 telah diuji dan dinyatakan lulus dalam sidang Munaqosyah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 23 Februari 2011. Skripsi ini telah diterima sebagai salah satu syarat untuk memperoleh gelar sarjana Strata Satu (S1) Program Studi Fisika.

Jakarta, Februari 2011

Tim Penguji,

Penguji I Penguji II

Drs. Sutrisno, M. Si Asrul Azis, M.Sc NIP. 19590202 198203 1005 NIP. 19510617 198503 1001

Mengetahui,

Dekan Fakultas Sains dan Teknologi Ketua Program Studi Fisika

DR. Syopiansyah Jaya Putra, M. Sis Drs. Sutrisno, M. Si NIP. 19680117 200112 1 001 NIP. 19590202 198203 1005


(5)

PERNYATAAN

DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI ADALAH BENAR HASIL KARYA SAYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI, LEMBAGA, ATAU INSTANSI MANA PUN.

Jakarta , 23Februari 2011 Pembuat Pernyataan,

MUHAMAD HAYKAL 105097003207


(6)

i

ABSTRAK

Konferensi videoadalah satu set teknologi telekomunikasi interaktif yang memungkinkan dua lokasi atau lebih untuk berinteraksi melalui transmisi video dan audio dua arah secara bersamaan. Dalam kerjanya dibutuhkan sebuah codec yang berfungsi untuk mengkompresi data video dan audio yang terkirim selama berlangsungnya konferensi video tersebut agar data yang terkirim tersebut lebih hemat sumber daya (CPU, RAM, dan bandwidth) sehingga layanan ini dapat berlangsung dengan lebih cepat dan hemat. Dalam penelitian ini dibandingkan dua jenis codec video, yaitu codec VP7 pada layanan konferensi video Skype dan codec H.264 pada Google Video Chat untuk menentukan layanan mana yang lebih cocok untuk digunakan oleh konsumen kelas menengah ke bawah. Dengan membandingkan besar konsumsi sumber daya dengan kualitas gambar yang dihasilkan oleh kedua codec tersebut, maka dapat diketahui bahwa codec H.264 lebih efektif dan efisien karena konsumsi sumber daya yang rendah dan dapat menghasilkan kualitas gambar yang cukup baik, dimana codec VP7 menghabiskan sumber daya yang jauh lebih besar hanya dengan kualitas gambar yang sedikit lebih baik. Sehingga dapat disimpulkan bahwa layanan konferensi videoGoogle Video Chat dengan codec H.264 lebih cocok untuk digunakan oleh konsumen kelas menengah ke bawah.


(7)

ii

ABSTRACT

Video conferencing is a set of interactive telecommunication technologies which allow two or more locations to interact via two-way video and audio transmission simultaneously. It requires a codec that serves to compress video and audio data sent during a video conference so that sent data is more resources efficient (CPU, RAM, and bandwidth) and the services would be more efficient. In this research, two types of video codecs is compared, namely VP7 codec on the Skype video conferencing service and H.264 codecs on Google Video Chat to determine which service is more suitable for use by lower-middle class consumers. By comparing the consumption of resources with the quality of images produced by both codecs, it’s proven that the H.264 codec is more effective and efficient because of low resource consumption and can produce a fairly good picture quality, when the VP7 codec spend much larger resources, only with slightly better picture quality. So, it can be concluded that the Google Video Chat video conference service with H.264 video codec is more suitable for use by lower-middle class consumers.


(8)

iii

KATA PENGANTAR

Puji syukur kepada Allah swt yang telah melimpahkan rahmat dan karunia serta hidayah-Nya sehingga penulis dapat menyelesaikan penulisan Tugas Akhir ini. Tugas Akhir ini diajukan untuk memenuhi tugas mata kuliah skripsi pada Program Studi Fisika Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta (UIN) dengan judul “ANALISIS PERBANDINGAN

EFISIENSI DAN EFEKTIFITAS ANTARA CODEC H.264 DAN VP7 PADA SISTEM VIDEO CONFERENCE”

Pada kesempatan ini penulis mengucapkan terima kasih yang sebesar-besarnya kepada:

1. Ibunda tercinta, Dra. Astuty Muchtar, yang selalu sabar dalam membimbing dan memberi semangat dan cintanya yang tak pernah terputus sehingga penulis dapat belajar mengerti hidup ini. Serta kakak-kakak, Muhammad Iqbal dan Muhammad Fadhlan yang senantiasa mengayomi penulis hingga kini. Kepada Almarhum Papa, dr. Djonny Anwar Boer, semoga tenang Di Sana Selamanya.

2. Bapak Arif Tjahjono, M. Si selaku pembimbing I Tugas Akhir ini. Terima kasih untuk semua saran, kritik, dan arahan yang sangat berharga, serta kesabarannya.

3. Bapak Ambran Hartono, M. Si selaku pembimbing II. Terima kasih untuk bimbingan, masukan, serta motivasi yang telah diberikan.

4. Bapak Sutrisno, M. Si selaku ketua Prodi Fisika UIN Jakarta. Terima kasih atas segala perhatian dan kemudahan yang diberikan.


(9)

iv 5. Bapak Drs. Sutrisno, M. Si dan Bapak Asrul Azis, M.Sc. selaku penguji Tugas Akhir ini, terima kasih atas pertanyaan dan masukan yang telah diberikan.

6. Kawan-kawan keluarga besar Quantum, Adit, Ardial, Bobby, Erik, Fitrah, Geary, Popay, Rio, Lulut, dan Nadia. Berkat kalian pula skripsi saya tertunda begitu lama. Sebuah penundaan yang sungguh indah. Ingat, perjuangan kita belum berakhir. Dan juga untuk 9Glow dan Boysansin.

7. Rizmal Bachri dan Mursyallim serta kawan-kawan seperjuangan di fisika yang telah memberikan bantuan, dorongan, dan semangat dalam penyusunan Tugas Akhir ini.

8. Para staf dosen Program Studi Fisika FST UIN Jakarta, yang telah memberikan bekal pengetahuan kepada penulis.

9. Serta semua pihak yang telah memberikan bantuan dalam bentuk apapun, yang tidak dapat penulis sebutkan satu per satu.

Penulis menyadari bahwa penulisan Tugas Akhir ini masih jauh dari sempurna karena keterbatasan yang ada pada diri penulis, untuk itu penulis mengharapkan kritik dan saran yang membangun demi kesempurnaan Tugas Akhir ini.

Jakarta, Februari 2011

Penulis Muhamad Haykal


(10)

v

DAFTAR ISI

ABSTRAK ... ...i

ABSTRACT ... ..ii

KATA PENGANTAR ... .iii

DAFTAR ISI ... ..v

DAFTAR GAMBAR ... ...ix

DAFTAR TABEL ... .xi

BAB I PENDAHULUAN 1.1 Latar Belakang ...1

1.2 Tujuan Penelitian ...4

1.3 Pembatasan Masalah ...4

1.4 Manfaat Penelitian ...5

1.5 Sistematika Penulisan ...5

BAB II LANDASAN TEORI 2.1 Pengertian Video Digital ...7

2.1.1 Frame Rate ...7

2.1.2 Aspect Ratio ...8


(11)

vi

2.1.4 Level Bit ...9

2.1.5 Laju Bit (Bit Rate) ...10

2.2 Konsep Dasar Video Conference ...10

2.3 Coding dan Decoding ...14

2.3.1 Pencuplikan (sampling) ...15

2.3.2 Kuantisasi ...20

2.4 Kompresi Data ...24

2.4.1 Teori Kompresi Data ...24

2.4.2 Pemodelan Sumber (Source Modeling) ...26

2.4.3 Jenis-Jenis Algoritma Kompresi Data ...30

2.4.4 Algoritma Kompresi Huffman ...30

2.5 Discrete Cosine Transform (DCT) ...37

2.5.1 Standar Kompresi Video ...37

2.5.2 Algoritma kompresi JPEG ...41

2.5.2 Algoritma Kompresi H.261 ...43

2.5.3 Algoritma kompresi MPEG ...45

2.6 Gelombang Elektromagnetik ...47


(12)

vii

BAB III METODE PENELITIAN

3.1 Waktu dan Tempat Penelitian ...52

3.2 Perangkat yang digunakan ...52

3.2.1 Perangkat Keras ...52

3.2.2 Perangkat Lunak ...54

3.3 Tahapan Penelitian ...57

3.3.1 Pengamatan Paket ...58

3.3.2 Pengukuran Delay ...59

3.3.3 Pengukuran Bandwidth ...61

3.3.4 Pengukuran Throughput Jaringan ...61

3.3.5 Kualitas Gambar ...62

3.3.6 Efisiensi dan Efektifitas ...62

3.4 Pengolahan Data ...63

3.4.1 Estimasi MOS dengan standart ITU-T P.800 ...63

3.4.2 Estimasi MOS dengan Metode E-Model (ITU-T G.107) ...64

3.4.3 Estimasi Pengukuran Packet loss terhadap Kualitas Video ...66

BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Pengujian Codec pada PC ...68


(13)

viii

4.3 Hasil Perhitungan Dengan Metode MPQM ...73

4.4 Perbandingan Penggunaan Sumber Daya Antara VP7 dan H.264 ...75

BAB V KESIMPULAN DAN SARAN 5.1 Kesimpulan ...81

5.2 Saran ...81

DAFTAR PUSTAKA ... 83


(14)

ix

DAFTAR GAMBAR

Gambar 2.1 Sinyal analog sebelum dan sesudah dicuplik ...16

Gambar 2.2 Rekonstruksi sinyal kontinyu dari sinyal diskrit ...17

Gambar 2.3 Aliasing frekuensi 1.1 ...18

Gambar 2.4 Berbagai jenis aliasing frekuensi ...19

Gambar 2.5 Contoh dari sebuah pengkuantisasi linier ...23

Gambar 2.6 Distribusi pada Node 1 ...31

Gambar 2.7 Distribusi pada Node 2 ...32

Gambar 2.8 Distribusi pada Node 3 ...32

Gambar 2.9 Distribusi pada Node 4 ...32

Gambar 2.10 Distribusi pada Node 5 ...33

Gambar 2.11 Distribusi pada Node 6 ...33

Gambar 2.12 Distribusi pada Node 7 ...34

Gambar 2.13 Distribusi pada Node 8 ...34

Gambar 2.14 Motion Vector...40

Gambar 2.15 Proses kompresi gambar diam ...41

Gambar 2.16 Makroblok kompresi h.261 ...43


(15)

x

Gambar 2.18 Gelombang elektromagnetik ...50

Gambar 2.19 Rangkaian / Sirkuit Osilasi LC ...51

Gambar 3.1 Tampilan Skype ...55

Gambar 3.2 Tampilan Google Video Chat ...56

Gambar 3.3 Bagan Alur Penelitian Perbandingan Codec Video ...57

Gambar 4.1 Pengambilan Data Pada Perangkat Penguji PC ...70

Gambar 4.2 Pengambilan Data Pada Perangkat Penguji Laptop ...73

Gambar 4.3 Grafik PerbandinganNilai MOS ...76

Gambar 4.4 Grafik Perbandingan Nilai Konsumsi CPU ...77

Gambar 4.5 Grafik Perbandingan Nilai Konsumsi RAM ...78

Gambar 4.6 Grafik Perbandingan Nilai Konsumsi Bandwidth ...79


(16)

xi

DAFTAR TABEL

Tabel 2.1 Kompresi Suara ...11

Tabel 2.2 Kompresi Bandwidth ...13

Tabel 2.3 Standar untuk konversi analog-ke-digital dari sinyal audio ...24

Tabel 2.4 Distribusi frekuensi ACDABA ...31

Tabel 3.1 Spesifikasi PC dan laptop yang digunakan ...53

Tabel 3.2 Spesifikasi webcam yang digunakan ...54

Tabel 3.3 Keterangan Nilai MOS ...62

Tabel 4.1 Data Pengujian Pada PC ...68

Tabel 4.2 Data Pengujian Pada Laptop ...71


(17)

1

BAB I

PENDAHULUAN

Latar Belakang

Perkembangan teknologi komunikasi membawa perubahan pada proses penyampaian informasi. Bentuk informasi yang disampaikan tidak hanya audio, tetapi juga visual. Konferensi video (video conference) menggunakan telekomunikasi audio dan video untuk membawa orang-orang di berbagai tempat mengadakan rapat bersama. Sebuah konferensi video (juga dikenal sebagai

videoteleconference) adalah satu set teknologi telekomunikasi interaktif yang memungkinkan dua lokasi atau lebih untuk berinteraksi melalui transmisi video dan audio dua arah secara bersamaan. Selain pengiriman audio dan visual kegiatan pertemuan, konferensi video dapat digunakan untuk berbagi dokumen, informasi yang diperlihatkan komputer, dan papan tulis.

Sistem konferensi video biasanya terdiri dari dua sistem sirkuit televisi tertutup yang terhubung melalui kabel. Contohnya adalah pada jaringan German Reich Postzentralamt (Kantor Pos) yang didirikan di kota Berlin dan di beberapa kota lainnya dari tahun 1936 ke tahun 1940. Dari masa itu hingga tahun 70-an, perkembangan teknologi konferensi video masih belum bisa menjadi pilihan utama bagi masyarakat luas karena biaya operasional-nya yang sangat tinggi karena belum ditemukan teknologi kompresi video untuk menghemat biaya operasional. Baru pada tahun 80-an, teknologi telepon digital yang menggunakan teknik kompresi menjadi mungkin.


(18)

2 Akhirnya, pada 1990-an, konferensi video berbasis Internet Protocol atau IP menjadi mungkin dan teknologi kompresi video yang lebih efisien telah dikembangkan sehingga memungkinkan desktop atau komputer pribadi yang berbasis konferensi video. Mulai tahun 2000-an, telekonferensi video sudah hadir ke tengah-tengah masyarakat luas dalam bentuk layanan gratis, web plugin dan perangkat lunak, seperti Skype, Google Chat, NetMeeting, MSN Messenger, Yahoo Messenger, SightSpeed, dan lain-lain, secara virtual bisa menghubungkan semua tempat yang memiliki koneksi internet, dengan biaya yang murah bahkan gratis, meskipun berkualitas rendah.

Teknologi kompresi yang digunakan dalam konferensi video ini adalah

codec. Codec merupakan kependekan kata dari compressor-decompressor atau lebih umum sebagai coder-decoder. Fungsi codec di sini adalah menyandi ulang sinyal audio dan video yang ditransmisikan agar ukurannya menjadi lebih kecil sehingga dapat lebih menghemat bandwidth dan kerja prosesor serta perangkat keras lainnya. Dengan begitu, teknologi konferensi video dapat dinikmati juga dengan biaya yang murah tanpa harus memiliki koneksi internet yang super cepat dan spesifikasi komputer yang tinggi. Oleh karenanya, menjadi sangat menarik untuk dilakukan penelitian tentang kualitas dan efisiensi kerja codec H.264 dan VP7.

Dalam penelitian ini, codec video yang akan dibahas adalah codec H.264, sebuah video codec yang dikembangkan oleh Joint Video Team (JVT), sebuah tim yang terdiri dari para pengembang codec video, yaitu Video Coding Experts Group (VCEG), pengembang codec H.261 dan H.263, dengan Moving Picture


(19)

3 Experts Group (MPEG), pengembang codec MPEG, termasuk juga MP3. Codec H.264 sendiri sudah sudah menjadi standar internasional dan digunakan pada Blu-Ray Disc, IPod Video, Youtube, Google Video Chat, dll. Untuk mengetahui kinerja codec H.264 ini dalam konferensi video, digunakan layanan Google Video Chat yang sudah menggunakan codec H.264. Google Video Chat sendiri merupakan sebuah layanan chatting yang terintegrasi dalam layanan Google Mail (Gmail). Untuk menggunakan layanan chat ini, para penggunanya hanya perlu menginstall sebuah plugin tambahan untuk web-browser tanpa perlu menginstall software lainnya.

Sebagai pembanding, digunakan codec TrueMotion VP7 yang dikembangkan oleh On2 Technologies yang merupakan anak perusahaan dari Google. On2 mengklaim bahwa codec VP7 ini dapat melakukan kompresi yang lebih baik dari codec H.264. On2 sendiri sebelumnya telah mengembangkan beberapa codec, antara lain ; VP3, VP5, dan TrueMotion VP6. Untuk mengetahui kinerja codec VP7 ini, digunakan software Skype, sebuah software yang memungkinkan para penggunanya untuk melakukan panggilan suara (voice call) dan panggilan video (video call). Skype sudah menggunakan codec VP7 untuk layanan video call-nya sejak tahun 2005.

Komponen perangkat keras (hardware) yang digunakan berupa sebuah PC dengan spesifikasi standar komputer personal yang terkoneksi ke internet yang dilengkapi dengan komponen-komponen yang dibutuhkan untuk melakukan layanan konferensi video, yaitu sebuah webcam sebagai video input, sebuah layar


(20)

4 monitor sebagai video output, sebuah mikropon sebagai audio input, dan sebuah

speaker sebagai audio output.

Tujuan Penelitian

Penulisan penelitian ini bertujuan sebagai sebagai berikut :

1. Membandingkan dua codec video yang cukup popular digunakan, yaitu H.264 dan VP7 berdasarkan kualitas dan efisiensi kompresi. 2. Melakukan perbandingan antara dua layanan video chatting, yaitu

Skype yang menggunakan codec video VP7 dan Google Video Chat yang menggunakan codec video H.264 agar dapat menentukan layanan mana yang lebih murah dan hemat.

Pembatasan Masalah

Untuk lebih mengarahkan isi dan penulisan penelitian mengenai perbandingan codec H.264 dengan VP7 pada layanan video chatting Skype dan Google Video Chat, dibuat batasan-batasan masalah, antara lain:

1. Hanya membandingkan codec video H.264/ dengan VP7 pada layanan video chatting Skype dan Google Video Chat.

2. Tidak membandingkan codec audio dari kedua layanan tersebut.

3. Hanya membandingkan kedua codec tersebut dalam hal kualitas dan efisiensi kerja codec dalam memproses sinyal video digital untuk menentukan layanan konferensi video yang lebih murah.


(21)

5 4. Melakukan perbandingan kualitas dan efisiensi kerja codec dengan software Fraps untuk mengukur frame rate video, Net Meter untuk mengukur besar bandwidth yang terpakai, dan Windows Task Manager untuk mengukur besar konsumsi CPU dan RAM.

Manfaat Penelitian

Jika tujuan penelitian ini dapat tercapai, maka penelitian ini dapat memberikan manfaat sebagai berikut:

 Mengetahui codec mana yang lebih baik antara codec H.264 dan VP7, dalam hal kualitas dan efisiensi kerja.

 Memberikan solusi konferensi video yang lebih hemat bandwidth dan

resource pada computer. Sehingga dapat lebih dimanfaatkan oleh konsumen yang tidak memiliki koneksi internet yang cepat dan spesifikasi yang tinggi.

Sistematika Penulisan

Penelitian ini terdiri dari lima bab dengan rincian sebagai berikut :

BAB I : Pendahuluan

Merupakan inti penelitian ini yang berisikan latar belakang masalah, tujuan penelitian, batasan masalah, metodelogi penelitian dan sistematika penulisan.


(22)

6

BAB II : Landasan Teori

Menjelaskan dasar teori dan teori pendukung yang berhubungan dengan teknologi konferensi video, codec H.264, codec VP7, layanan Google Video Chat dan Skype, serta pengukuran kualitas, efektifitas, dan efisiensi codec video tersebut.

BAB III : Metode Penelitian

Berisi tentang waktu dan tempat penelitian, perangkat keras dan perangkat lunak yang digunakan, tahapan penelitian codec video, dan pengolahan data.

BAB IV : Hasil dan Pembahasan

Berisi tentang hasil pengamatan dan pembahasan data hasil pengamatan..

BAB V : Kesimpulan dan Saran

Bab in berisi tentang kesimpulan yang diperoleh dari penelitian dan saran penulis untuk pengembangan penelitian lebih lanjut.


(23)

7

BAB II

LANDASAN TEORI

2.1 Pengertian Video Digital

Video digital adalah jenis sistem perekam video yang bekerja menggunakan sistem digital dibandingkan dengan analog dalam hal representasi videonya. Biasanya video digital direkam dalam tape, kemudian didistribusikan melalui optical disc, misalnya VCD dan DVD. Salah satu alat yang dapat digunakan untuk menghasilkan video digital adalah camcorder, yang digunakan untuk merekam gambar-gambar video dan audio. Biasanya sebuah camcorder

akan terdiri dari camera dan recorder. Sebuah video terdiri dari beberapa element seperti frame rate, aspect ratio, resolusi spasial, level bit, dan laju bit.

2.1.1 Frame rate

Ketika serangkaian gambar mati yang bersambung dimainkan dengan cepat dan dilihat oleh mata manusia, maka gambar-gambar tersebut akan terlihat seperti sebuah pergerakan yang halus. Jumlah gambar yang terlihat setiap detik disebut dengan frame rate. Diperlukan frame rate minimal sebesar 10 fps (frame per second) untuk menghasilkan pergerakan gambar yang halus. Film-film yang dilihat di gedung bioskop adalah film yang diproyeksikan dengan frame rate

sebesar 24 fps, sedangkan video yang dilihat pada televisi memiliki frame rate

sebesar 30 fps (tepatnya 29.97 fps). Frame rate digunakan sebagai format standar NTSC, PAL dan SECAM yang berlaku pada negara-negara didunia.


(24)

8

2.1.2 Aspect Ratio

Pixel aspect ratio menjelaskan tentang ratio atau perbandingan antara lebar dengan tinggi dari sebuah piksel dalam sebuah gambar. Frame aspect ratio

menggambarkan perbandingan lebar dengan tinggi pada dimensi frame dari sebuah gambar. Sebagai contoh, D1 NTSC memiliki pixel aspect ratio 0.9 (0.9 lebar dari 1 unit tinggi) dan memiliki pula pixel aspect ratio 4:3 (4 unit lebar dari 3 unit tinggi). Beberapa format video menggunakan frame aspect ratio yang sama tetapi memakai pixel aspect ratio yang berbeda. Sebagai contoh, beberapa format NTSC digital menghasilkan sebuah 4:3 frame aspect ratio dengan square pixel

(1.0 pixel aspect ratio) dan dengan resolusi 640 x 480. sedangkan D1 NTSC menghasilkan frame aspect ratio yang sama yaitu 4:3 tetapi menggunakan

rectangular pixel (0.9 pixel aspect ratio) dengan resolusi 720 x 486. Piksel yang dihasilkan oleh format D1 akan selalu bersifat rectangular atau bidang persegi, akan berorientasi vertikal dalam format NTSC dan akan berorientasi horisontal dalam format PAL. Jika menampilkan rectangular pixel dalam sebuah monitor

square pixel tanpa alterasi maka gambar yang bergerak akan berubah bentuk atau mengalami distorsi. Contohnya lingkaran akan berubah menjadi oval. Tetapi bagaimanapun juga apabila ditampilkan pada monitor broadcast, gambar gerak akan ditampilkan secara benar.


(25)

9

2.1.3 Resolusi Spasial dan Frame Size

Lebar dan tinggi frame video disebut dengan frame size, yang menggunakan satuan piksel, misalnya video dengan ukuran frame 640×480 piksel. Dalam dunia video digital, frame size disebut juga dengan resolusi. Semakin tinggi resolusi gambar maka semakin besar pula informasi yang dimuat, berarti akan semakin besar pula kebutuhan memory untuk membaca informasi tersebut. Misalnya untuk format PAL D1/DV berukuran 720×576 piksel, format NTSC DV 720×480 piksel dan format PAL VCD/VHS (MPEG-1) berukuran 352×288 piksel sedangkan format NTSC VCD berukuran 320×240 piksel.

2.1.4 Level Bit

Dalam dunia komputer, satuan bit merupakan unit terkecil dalam penyimpanan informasi. Level bit atau bit depth menyatakan jumlah atau banyaknya bit yang disimpan untuk mendeskripsikan warna suatu piksel. Sebuah gambar yang memiliki 8 bit per piksel dapat menampilkan 256 warna, sedangkan gambar dengan 24 bit dapat menampilkan warna sebanyak 16 juta warna. Komputer (PC) menggunakan 24 bit RGB sedang sinyal video menggunakan standar 16 bit YUV sehingga memiliki jangkauan warna yang terbatas. Untuk itu perlu berhati-hati apabila membuat video untuk ditayangkan di TV, karena tampilan warna di layar monitor PC berbeda dengan tampilan di layar TV. Penentuan bit depth ini tergantung pada sudut pemisah antara gambar yang diterima oleh kedua mata. Sebagai contoh, pada layar datar, persepsi kedalaman suatu benda berdasarkan subyek benda yang tampak.


(26)

10

2.1.5 Laju Bit (Bit Rate)

Laju bit disebut juga dengan nama laju data. Laju bit menentukan jumlah data yang ditampilkan saat video dimainkan. Laju data ini dinyatakan dalam satuan bps (bit per second). Laju data berkaitan erat dengan pemakaian dan pemilihan codec (metode kompresi video). Beberapa codec menghendaki laju data tertentu, misalnya MPEG-2 yang digunakan dalam format DVD dapat menggunakan laju bit maksimum 9800 kbps atau 9,8 Mbps, sedangkan format VCD hanya mampu menggunakan laju bit 1,15 Mbps.

2.2 Konsep Dasar Video Conference

Dalam perencanaan untuk mengimplementasikan video conference pada

Local Area Network (LAN), perlu memperhitungkan kebutuhan bandwidth, karena saat pengiriman video estimasi alokasi bandwidth menjadi sangat penting karena akan memakan sebagian besar bandwidth komunikasi yang ada. Sehingga teknik-teknik untuk melakukan kompresi data menjadi sangat strategis untuk memungkinkan penghematan bandwidth komunikasi.

Sebagai gambaran sebuah kanal gambar (video) yang baik tanpa di kompresi akan mengambil bandwidth sekitar 9Mbps, sedangkan sebuah kanal suara (audio) yang baik tanpa di kompresi akan mengambil bandwidth sekitar 64Kbps. Dari gambaran diatas dapat diasumsikan bahwa kebutuhan minimal

bandwidth yang dibutuhkan untuk mengirimkan gambar dan suara adalah sebesar 9,064 Mbps, memang akan membutuhkan bandwidth yang sangat lebar. Namun dengan teknik kompresi yang ada, sebuah kanal suara dan gambar sebelum


(27)

11 dilewatkan dalam jaringan TCP/IP akan terlebih dahulu melalui proses kompresi sehingga dapat menghemat sebuah kanal video menjadi sekitar 30Kbps dan kanal suara menjadi 6Kbps (half-duplex), artinya sebuah saluran Local Area Network (LAN) yang memiliki bandwidth sebesar 10/100 Mbps sebetulnya dapat digunakan untuk menyalurkan video dan audio sekaligus. Tentunya untuk kebutuhkan konferensi yang multiuser akan dibutuhkan multi bandwidth pula, artinya minimal sekali kita harus menggunakan kanal 32-36Kbps dikalikan dengan berapa user konferensi dilakukan dalam jaringan.

2.2.1 Kompresi Suara

Pada tabel terlampir daftar beberapa teknik kompresi suara yang sering digunakan dengan beberapa parameter yang mencerminkan kinerja dari teknik kompresi suara tersebut.

Tabel 2.1 Kompresi Suara1

Kompresi Kbps MIPS ms MOS

G.711PCM 64 0.34 0.125 4.1

G.726 ADPCM 32 14 0.125 3.85

G.728 LD-CELP 16 33 0.625 3.61

G.729 CS-ACELP 8 20 10 3.92

G.729 x2 Encoding 8 20 10 3.27

G.729 x3 Encoding 8 20 10 2.68

1 Standart G*, http://www.itu.int/ITU-T/publications


(28)

12

G.729a CS-ACELP 8 10.5 10 3.7

G.723.1 MPMLQ 6.3 16 30 3.9

G.723.1 ACELP 5.3 16 30 3.65

Kolom Kbps memperlihatkan berapa lebar bandwidth yang di ambil untuk mengirimkan suara yang di kompres menggunakan teknik kompresi tertentu. MIPS (Mega Instruction Per Second) memperlihatkan berapa kebutuhan waktu pemrosesan data pada saat melakukan kompresi suara dalam juta instruksi per detik. Mili-detik (ms) adalah waktu yang dibutuhkan untuk melakukan kompresi. Mean Opinion Score (MOS) adalah nilai opini pendengar di penerima. Pada saat manusia berkomunikasi & berkonferensi menggunakan MS NetMeeting biasanya G.729 atau G.723.1 akan digunakan untuk mengkompres suara agar menghemat

bandwidth saluran komunikasi pada jaringan.

Kompresi Video

Pada teknik kompresi video ada dua buah standar yang umum digunakan, dalam pengiriman video melalui saluran komunikasi yang sempit, yaitu:

 H.261 – biasanya menggunakan kanal ISDN dengan kecepatan p x 64Kbps, dimana p adalah 1, 2, 3, …, 30.

 H.263 – di arahkan untuk mengirimkan gambar video berkecepatan rendah mulai dari 20-30Kbps ke atas.


(29)

13 Pada saat ini standar H.263 merupakan standar kompresi video yang sering digunakan dalam konferensi video melalui jaringan. Beberapa hal yang perlu di perhatikan adalah:

 Jika menggunakan video hitam-putih, maka akan memakan bandwidth

lebih kecil daripada jika melakukan konferensi menggunakan video berwarna.

 Jika menggunakan kecepatan pengiriman frame per second (fps) video yang rendah, maka akan memakan bandwith yang rendah dibandingkan frame per second (fps) yang tinggi.

Video yang cukup baik biasanya dikirim dengan kecepatan frame per second (fps) sekitar 30 fps. Jika dikirimkan tanpa kompresi, sebuah video dengan 30 fps akan mengambil bandwidth kira-kira 9Mbps, amat sangat besar untuk ukuran kanal komunikasi data. Untuk memberikan gambaran bagaimana upaya untuk penghematan bandwidth dan rasio kompresi yang dibutuhkan, dapat dilihat pada tabel 2.2 berikut ini

Tabel 2.2 Kompresi Bandwidth2

Keterangan Rata-rata PSNR

(dB)

Bitrate

(Kbit/s)

Rasio Kompresi

Orisinil, 30 fps - 9124 1:1

10fps, 20Kbps 38.51 22.81 133:1

10fps, 50Kbps 41.75 56.70 54:1


(30)

14

10fps, 100Kbps 43.98 112.09 27.1

10fps, 500Kbps 48.38 505.61 6:1

Terlihat pada tabel, sebuah pengiriman video yang asli (tidak di kompres) dengan kecepatan 30 fps akan memakan bandwidth 9Mbps. Dalam pengiriman video untuk konferensi video melalui LAN, biasanya dikurangi jumlah frame yang dikirim, misalnya menjadi 10 fps. Beberapa teknik kompresi digunakan mulai dari yang paling kecil hasilnya yaitu 133:1 sampai dengan yang akan membutuhkan banyak bandwidth (500Kbps) dengan rasio kompresi 6:1. Terlihat bahwa video 10 fps hasil kompresi 133:1 dapat dikirimkan dalam kanal 23Kbps dengan rata-rata Signal To Noise Ratio 38.51dB, Tentunya jika ingin memperoleh kualitas yang lebih baik, PSNR yang lebih baik, kompresi dapat dikurangi hingga rasio 6:1 atau lebih rendah lagi.

2.3 Coding dan Decoding

Salah satu kompenen yang terpenting dalam video conference adalah peralatan codec (coder dan decoder), codec menggunakan teknik penyamplingan sinyal analog untuk dirubahmenjadi sinyal digital lalu mereduksi lebar pita sinyal sesuai dengan kebutuhan. Algoritma sebagai proses pengkodean sinyal-sinyal informasi sehingga lebar pita sinyal tersebut dapat direduksi, dipakai pada alat codec ini untuk pengkompresan data yang telah didapat dari hasil sampling. Peranan encoding adalah mendefinisikan dan memanipulasi karakteristik sinyal


(31)

15 untuk merepresentasikan informasi. Decoding digunakan oleh penerima sinyal untuk mengembalikan pola-pola sinyal tersebut menjadi data aslinya.

Codec (codec-decoder) melakukan encoding dan decoding. Sinyal-sinyal analog di-dijitalisasi_kan oleh codec. Piranti codec ini akan mengambil sampel -sampel dari sinyal analog sebanyak 8000 kali per detik untuk menghasilkan sebuah bilangan 7 atau 8 bit. Apabila sampling yang digunakan dilakukan dengan laju yang lebih rendah, data akan hilang sedangkan apabila laju sampling-nya lebih tinggi tidak akan ada informasi tambahan apapun yang dapat diperoleh dari sinyal analog. Gagasan dasar teknik digitasi (digitalization) adalah membandingkan amplitudo sebuah sinyal analog dengan seperangkat nilai ambang yang disebut level kuantisasi. Jarak antara satu level kuantisasi ke level kuantisasi berikutnya ditetapkan secara logaritmik, karena hal ini akan menghasilkan resolusi yang lebih baik untuk sinyal-sinyal yang berdaya rendah. Representasi digital dari amplitudo sebuah sinyal analog adalah bilangan kuantisasi terdekat dengan sampel amplitudo tersebut. Sebanyak 8000 sampel amplitudo dalam setiap detik dibandingkan terhadap 256 nilai level kuantisasi yang berbeda untuk menghasilkan bilangan – bilangan digital sebanyak 8-bit. Skema ini menghasilkan bandwidth standar sebesar 64 kbps , untuk satu kanal suara.

2.3.1 Pencuplikan (sampling)

adalah proses pengambilan sampel sinyal suara (tegangannya) pada interval waktu yang tetap. Sampling merupakan komponen penting dalam komunikasi suara. Dimana sinyal analog diubah menjadi sinyal diskrit. Secara


(32)

16 matematis, proses sampling (pencuplikan) dapat didefinisikan sebagai hasil perkalian dari sebuah barisan gelombang berkala tak terbatas pada amplitudo 1 (dengan periode sesuai dengan periode sampling) oleh sinyal waktu kontinyu asli untuk dicuplik. Ini mengarah pada representasi waktu diskrit PAM (gelombang modulasi amplitudo) dari sinyal tersebut (Gambar 2.1).

Gambar 2.1 Sinyal analog sebelum dan sesudah dicuplik

Dari sinyal PAM, adalah mungkin untuk memperbarui suatu sinyal kontinyu. Ini diperlukan setiap kali hasil algoritma pengolahan sinyal perlu diputar ulang. Misalnya, sebuah konverter diskrit-ke-kontinu (D/C) sederhana bisa menghasilkan bukit linier yang menghubungkan setiap nilai gelombang, kemudian menyaring frekuensi tinggi yang dihasilkan oleh diskontinuitas.

A

t A


(33)

17 Proses konversi analog ke digital kehilangan beberapa informasi yang terkandung dalam sinyal asli yang tidak pernah dapat dipulihkan (ini terlihat jelas pada Gambar 2.2). Hal ini sangat penting untuk memilih kecepatan sampel dan skala kuantisasi dengan benar dan tepat, karena hal ini secara langsung mempengaruhi kualitas output dari algoritma pemrosesan sinyal [A2, B1, B2].

Gambar 2.2 Rekonstruksi sinyal kontinyu dari sinyal diskrit

Teorema sampling menyatakan bahwa untuk proses sinyal waktu kontinyu dengan komponen frekuensi terdiri antara 0 dan Fmax, laju sampling harus minimal 2 * Fmax . Secara intuitif, dapat dipahami dengan melihat kuantisasi dari sebuah sinusoid murni. Dalam Gambar 2.3 sinyal asli frekuensi 1,1 dicuplik pada frekuensi 1. Sinyal PAM yang dihasilkan identik dengan hasil sampling pada frekuensi 1 dari sinyal pada frekuensi 0,1. Hal ini disebut sebagai fenomena aliasing.

Pada kenyataannya jika T adalah periode sampling (frekuensi radial

Ωr=2π/T ):

• Semua sinusoid dari frekuensi ωr + mr akan mempunyai representasi PAM yang sama dari frekuensi sinusoida ωr, karena cos( (ωr + m(2π/T) ) t ) dicuplik sebagai cos( (ωr + m(2π/T ) kT ) = cos(ωrkT + mk2π) = cos(ωr kT )


(34)

18 • Sinusoid dari frekuensi Ωr/2 + ωr dan Ωr/2 − ωr mempunyai representasi PAM yang sama karena:

cos((Ωr /2 ± ωr )kT ) = cos(πk ± ωr kT ) (1)

= cos(πk) cos(ωr kT ) sin(πk) sin(ωr kT ) = cos(πk) cos(ωr kT )

Hal ini diilustrasikan pada Gambar 2.4

Kesimpulannya adalah bahwa ada pemetaan satu-ke-satu (1-to-1) antara sebuah sinusoida dan representasi PAM-nya yang diambil pada frekuensi hanya jika sinusoid dibatasi pada jangkauan [0, /2].

Gambar 2.3 Aliasing frekuensi 1.1, dicuplik pada frekuensi 1, di-wrap


(35)

19

Gambar 2.4 Berbagai jenis aliasing frekuensi

Ini juga berlaku untuk semua sinyal yang terdiri dari sinusoid campuran. Sinyal seharusnya tidak memiliki komponen frekuensi di luar rentang [0,/2]. Hal ini dikenal sebagai teorema Nyquist, dan = 2ω disebut tingkat Nyquist (laju

sampling minimal yang diperlukan untuk sinyal dengan komponen frekuensi dalam rentang [0, ω]).

Teorema Nyquist (atau Shannon) juga membuktikan bahwa adalah mungkin untuk memulihkan kembali sinyal kontinyu asli dengan tepat dari representasi PAM, jika sampling rate berada pada atau diatas tingkat Nyquist. Dapat ditunjukkan bahwa spektrum frekuensi (transformasi Fourier) dari sinyal PAM dengan frekuensi sampling Fs sama dengan spektrum frekuensi dari sinyal asli, diulang secara berkala dengan periode Fs.

Spektrum sinyal fisik nyata (seperti sinyal listrik yang dihasilkan oleh mikrofon) tidak memiliki batas frekuensi yang didefinisikan dengan baik. Oleh karena itu, sebelum proses pengambilan sampel, perlu dilakukan pemotongan setiap komponen frekuensi di luar frekuensi Nyquist dengan menggunakan analog


(36)

20 „anti-aliasing‟ filter. Untuk menghindari komponen diskrit ini (tidak jelas untuk memperkirakan low-pass filter yang ideal dengan teknologi analog), konverter analog-ke-dijital pembentuk-derau oversampled yang modern (juga disebut coders sigma delta) menggunakan frekuensi sampling yang sangat tinggi (sinyal input seharusnya tidak memiliki komponen dengan frekuensi yang sangat tinggi) tetapi seharusnya filter yang menerapkan penipisan digital (subsampling) secara internal-lah yang melakukan tugas anti-aliasing sebelum sampling rate berkurang.

Nilai frekuensi sampling tidak hanya menentukan lebar-pita sinyal yang ditransmisikan tetapi juga berdampak pada jumlah informasi yang akan dikirim: misalnya, pita-lebar, sinyal audio berkualitas tinggi harus dicuplik pada frekuensi tinggi, tapi ini menghasilkan jauh lebih banyak informasi dari frekuensi sampling

8.000 Hz yang biasa digunakan dalam jaringan telepon.

2.3.2 Kuantisasi

Dengan dibahasnya proses sampling dalam paragraf sebelumnya, masih belum masuk ke dalam dunia digital. Sinyal PAM pada dasarnya adalah sebuah sinyal analog karena amplitudo dari setiap gelombang masih bernilai kontinyu yang tidak dicoba untuk ukur dengan angka. Nyatanya hanya kehilangan sebagian informasi sejauh ini (bagian dari sinyal yang dicuplik di atas satu-setengah dari frekuensi sampling). Akan kehilangan lebih banyak informasi ketika akan diukur amplitudo dari masing-masing gelombang.


(37)

21 Jika dibayangkan bahwa aturan lipat digunakan untuk mengukur amplitudo sinyal PAM. Tergantung dari kelulusan atau ketepatan skala, angka yang mewakili sinyal PAM bisa lebih atau kurang tepat.,tapi tidak akan pernah tepat. Sinyal PAM dapat diwakili oleh sinyal digital dengan pulsa yang sesuai dengan nilai yang terukur, ditambah sinyal PAM dengan pulsa yang merupakan kesalahan dari proses kuantisasi. Pengkodean sinyal di mana setiap sampel analog dari sinyal PAM dikodekan dalam sebuah kata kode biner disebut representasi PCM (modulasi kode pulsa) dari sinyal. Konversi analog-ke-digital disebut

kuantisasi.

Dengan proses kuantisasi yang lebih tepat, kita meminimalkan amplitudo derau, tetapi kita tidak dapat menghindari masuknya beberapa kebisingan dalam proses kuantisasi (derau kuantisasi). Setelah noise kuantisasi masuk dalam sebuah percakapan atau rantai transmisi audio, kualitas-nya tidak bisa lagi ditingkatkan dengan cara apapun. Ini memiliki konsekuensi penting: misalnya, adalah suatu hal yang mustahil untuk merancang penghilang-gema digital yang bekerja pada sebuah sinyal PCM dengan rasio sinyal-ke-gema di atas rasio sinyal-ke-derau sinyal PCM.Oleh karena ada 2 sumber informasi yang hilang ketika inisiasi sinyal untuk proses digital, yaitu:

 Hilangnya komponen frekuensi tinggi.

 Derau kuantisasi.

Keduanya harus diseimbangkan dengan baik dalam converter analog-ke


(38)

22 Jika kuantisasi seragam diterapkan („seragam‟ maksudnya skala dari „aturan lipat‟ adalah linier) daya dari derau kuantisasi dapat diperoleh dengan mudah. Semua ukuran langkah dari pengkuantisasi memiliki lebar D sama. Untuk pengkuantisasi seragam yang menggunakan bit N (N secara umum merupakan daya dari 2) rasio signal-to-noise dapat dicapai dalam decibel, diberikan oleh:

S N R(d B) =6.02N −1.73 (2)

Sebagai contoh, pemutar CD menggunakan pengkuantisasi linier 16-bit dan SNR maksimum yang dicapai adalah 94.6 dB. Bentuk yang mengesankan ini menyembunyikan beberapa masalah: nilai maksimum yang diperoleh untuk sebuah sinyal memiliki amplitudo maksimum (misalnya, sebuah sinusoida mulai dari -32.768 ke +32.767). Nyatanya, SNR berbanding lurus dengan daya sinyal itu: kurva yang mewakili SNR terhadap daya input sinyal adalah sebuah garis lurus. Jika input dikurangi dengan 10 dB, SNR juga dikurangi dengan 10 dB. Karena masalah ini, industri telekomunikasi pada umumnya menggunakan pengkuantisasi dengan rasio SNR konstan, terlepas dari kekuatan sinyal input. Ini membutuhkan pengkuantisasi nonlinier (Gambar 2.5).

Seperti yang telah diutarakan sebelumnya, frekuensi sampling dan jumlah bit yang digunakan dalam proses kuantisasi, berpengaruh. Baik pada kualitas sinyal digital dan laju informasi yang dihasilkan: beberapa kompromi perlu dibuat. Tabel 2.1 [A2] memberikan gambaran set parameter yang paling umum untuk transmisi suara dan sinyal audio (diasumsikan pengkuantisasi linear).


(39)

23 Bahkan percakapan telepon yang relatif berkualitas rendah menghasilkan

bitrate sekitar 100 kbit/s setelah konversi A/D. Hal ini menjelaskan, mengapa begitu banyak pekerjaan yang telah dilakukan untuk mengurangi bitrate ini sambil menjaga kualitas asli dari sinyal digital. Bahkan skema pengkodeaan A-law atau μ-law PCM G.711 pada 64 kbit/s yang terkenal dan telah digunakan di seluruh dunia di semua mesin pengubah-digital dan dalam banyak sistem transmisi

digital, dapat dilihat sebagai pengkode suara.

Gambar 2.5 Contoh dari sebuah pengkuantisasi linier. Setiap nilai milik [xiqi/2,xi+qi/2] terkuantisasi dan diubah dalam xi. Nilai derau berkisar pada


(40)

24

Tabel 2.3 Standar untuk konversi analog-ke-dijital dari sinyal audio

2.4 Kompresi Data

Kompresi data dilakukan untuk mereduksi ukuran data atau file. Dengan melakukan kompresi atau pemadatan data maka ukuran file atau data akan lebih kecil sehingga dapat mengurangi waktu transmisi sewaktu data dikirim dan tidak banyak banyak menghabiskan ruang media penyimpan.

2.4.1 Teori Kompresi Data

Dalam makalahnya di tahun 1948, “A Mathematical Theory of

Communication”, Claude E. Shannon merumuskan teori kompresi data. Shannon

membuktikan adanya batas dasar (fundamental limit) pada kompresi data jenis

lossless. Batas ini, disebut dengan entropy rate dan dinyatakan dengan simbol H. Nilai eksak dari H bergantung pada informasi data sumber, lebih terperinci lagi, tergantung pada statistikal alami dari data sumber. Adalah mungkin untuk mengkompresi data sumber dalam suatu bentuk lossless, dengan laju kompresi


(41)

25 (compression rate) mendekati H. Perhitungan secara matematis memungkinkan ini dilakukan lebih baik dari nilai H.

Shannon juga mengembangkan teori mengenai kompresi data lossy. Ini lebih dikenal sebagai rate-distortion theory. Pada kompresi data lossy, proses dekompresi data tidak menghasilkan data yang sama persis dengan data aslinya. Selain itu, jumlah distorsi atau nilai D dapat ditoleransi. Shannon menunjukkan bahwa, untuk data sumber (dengan semua properti statistikal yang diketahui) dengan memberikan pengukuran distorsi, terdapat sebuah fungsi R(D) yang disebut dengan rate-distortion function. Pada teori ini dikemukakan jika D bersifat toleransi terhadap jumlah distorsi, maka R(D) adalah kemungkinan terbaik dari laju kompresi.

Ketika kompresi lossless (berarti tidak terdapat distorsi atau D = 0), kemungkinan laju kompresi terbaik adalah R(0) = H (untuk sumber alphabet yang terbatas). Dengan kata lain, laju kompresi terbaik yang mungkin adalah entropy rate. Dalam pengertian ini, teori rate-distortion adalah suatu penyamarataan dari teori kompresi data lossless, dimana dimulai dari tidak ada distorsi (D = 0) hingga terdapat beberapa distorsi (D > 0).

Teori kompresi data lossless dan teori rate-distortion dikenal secara kolektif sebagai teori pengkodean sumber (source coding theory). Teori pengkodean sumber menyatakan batas fundamental pada unjuk kerja dari seluruh algoritma kompresi data. Teori tersebut sendiri tidak dinyatakan secara tepat bagaimana merancang dan mengimplementasikan algoritma tersebut. Bagaimana pun juga algoritma tersebut menyediakan beberapa petunjuk dan panduan untuk


(42)

26 memperoleh unjuk kerja yang optimal. Dalam bagian ini, akan dijelaskan bagaimana Shannon membuat model dari sumber informasi dalam istilah yang disebut dengan proses acak (random process). Di bagian selanjutnya akan dijelaskan mengenai teorema pengkodean sumber lossless Shannon, dan teori Shannon mengenai rate-distortion. Latar belakang mengenai teori probabilitas diperlukan untuk menjelaskan teori tersebut.

2.4.2 Pemodelan Sumber (Source Modeling)

Bayangkan bila kita pergi ke perpustakaan dimana perpustakaan tersebut mempunyai pilihan buku-buku yang banyak, katakanlah terdapat 100 juta buku dalam perpustakaan tersebut. Tiap buku dalam perpustakaan ini sangat tebal, sebagai contoh tiap buku mempunyai 100 juta karakter (atau huruf). Ketika anda pergi ke perpustakaan tersebut, mengambil sebuah buku secara acak dan meminjamnya. Buku yang dipilih tersebut merupakan informasi sumber yang akan dikompresi. Buku yang terkompresi tersebut disimpan pada zip disk untuk dibawa pulang, atau ditransmisi secara langsung melalui internet ke rumah anda ataupun bagaimana kasusnya.

Secara matematis buku yang dipilih tersebut didenotasikan sebagai:

X = (X1, X2, X3, X4, …)

Dimana X merepresentasikan seluruh buku, dan X1 merepresentasikan karakter pertama dari buku tersebut, X2 merepresentasikan karakter kedua, dan


(43)

27 seterusnya. Meskipun pada kenyataannya panjang karakter dalam buku tersebut terbatas, secara matematis diasumsikan mempunyai panjang karakter yang tidak terbatas. Alasannya adalah buku tersebut terlalu tebal dan dapat dibayangkan jumlah karakternya terlalu banyak. Untuk menyederhanakan hal tersebut, misalkan diasumsi semua karakter dalam buku tersebut terdiri atas huruf kecil („a‟ hingga „z‟) atau SPACE. Sumber alphabet misalkan A didefinisikan merupakan kumpulan dari 27 kemungkinan nilai dari tiap karakter:

Sekarang jika seorang yang ingin merancang suatu algoritma kompresi maka sangat sulit baginya untuk mengetahui buku yang mana yang akan dipilih. Orang tersebut hanya mengetahui bahwa seseorang akan memilih sebuah buku dari perpustakaan tersebut. Dengan cara pandangnya, karakter-karakter dalam buku merupakan (Xi, i = 1, 2 , …) merupakan variabel acak yang diambil dari

nilai alphabet A. Keseluruhan buku, X merupakan urutan tak berhingga dari variabel acak, makanya X merupakan suatu proses acak. Ada beberapa cara untuk menyatakan model statistik dari buku tersebut:

A. Zero-Order Model. Tiap karakter distatistik secara bebas dari semua karakter dan 27 kemungkinan nilai dalam alphabet A dinyatakan sama seperti yang muncul. Jika model tersebut akurat, maka cara tipikal untuk membuka sebuah buku adalah seperti berikut ini (semua contoh berasal


(44)

28 dari paper Shannon “A Mathematical Theory of Communication“ di

tahun 1948)

xfoml rxkhrjffjuj zlpwcfwkcyj ffjeyvkcqsghyd qpaamkbzaacibzlhjqd

B. First-Order Model. Dalam bahasa Inggris diketahui beberapa huruf

muncul lebih sering dibandingkan huruf yang lain. sebagai contoh, huruf „a‟ dan „e‟ lebih umum daripada huruf „q‟ dan „z‟. Jadi dalam model ini karakter masih secara bebas terhadap satu sama lain, tetapi distribusi probabilitas dari karakter-karakter tersebut menurut distribusi statistikal urutan pertama dari teks bahasa Inggris. Teks yang secara tipikal dari model ini berbentuk seperti ini:

ocroh hli rgwr nmielwis eu ll nbnesebya th eei alhenhttpa oobttva nah brl

C. Second-Order Model. Dua model sebelumnya diasumsi menurut statistik

secara bebas dari satu karakter hingga karakter berikutnya. Ini tidak begitu akurat dibandingkan dengan bahasa alami Inggris. Sebagai contoh, beberapa huruf dalam kalimat tersebut hilang. Bagaimanapun juga, kita masih dapat menerka huruf-huruf tersebut dengan mencarinya pada konteks kalimat. Ini mengimplikasikan beberapa ketergantungan antara karakter-karakter. Secara alami, karakter yang saling berhubungan dekat lebih saling bergantung daripada karakter yang berhubungan jauh satu sama lainnya. Pada model ini, karakter yang ada Xi bergantung pada


(45)

29 karakter sebelumnya Xi−1, tetapi secara kondisional tidak bergantung dengan semua karakter (X1, X2, …, Xi−2). Menurut model ini, distribusi probabilitas dari karakter Xi beragram menurut karakter sebelumnya Xi−1. Sebagai contoh, huruf „u‟ jarang muncul (probabilitas = 0.022). Bagaimanapun juga, jika dinyatakan karakter sebelumnya adalah „q‟ maka probabilitas dari „u‟ dalam karakter berikutnya lebih tinggi (probabilitas = 0.995). Teks tipikal untuk model ini terlihat seperti berikut:

on ie antsoutinys are t inctore st be s deamy achin d ilonasive tucoowe at teasonare fuso tizin andy tobe seace ctisbe

D. Third-Order Model. Ini merupakan pengembangan model sebelumnya.

Berikut ini merupakan karakter Xi yang bergantung pada dua karakter sebelumnya (Xi−2, Xi−1) tetapi secara kondisional tidak bergantung pada semua karakter sebelumnya sebelum: (X1, X2,…, Xi−3). Pada model ini, distribusi dari Xi beragam menurut (Xi−2, Xi−1). Teks tipikal dari model ini seperti bentuk berikut ini:

in no ist lat whey cratict froure birs grocid pondenome of demonstures of the reptagin is regoactiona of cre

Penyusunan kembali menjadi teks Inggris asli akan memudahkan tiap teks di atas dapat dibaca.

E. General Model. Pada model ini, buku X merupakan proses acak


(46)

30 terlalu kompleks untuk dipertimbangkan sebagai tujuan praktikal. Model ini disukai hanya dalam sudut pandang teoritikal saja.

Model A di atas merupakan kasus khusus dari model B. Model B merupakan kasus spesial dari Model C. Model C merupakan kasus spesial dari model D. Model D merupakan kasus spesial dari model E.

2.4.3 Jenis-Jenis Algoritma Kompresi Data

Algoritma kompresi untuk jenis kompresi lossless (tanpa kehilangan data) yang banyak digunakan diantaranya : Huffman, RLE, LZ77, LZ78 dan LZW. Sedangkan untuk jenis kompresi lossy (kehilangan beberapa bagian data), algoritma yang banyak digunakan antara lain: Differential Modulation, Adaptive Coding dan Discrete Cosine Transform (DCT).

2.4.4 Algoritma Kompresi Huffman

Algoritma kompresi Huffman dinamakan sesuai dengan nama penemunya yaitu David Huffman, seorang profesor di MIT (Massachusets Instuate of Technology).

Kompresi Huffman merupakan algoritma kompresi lossless dan ideal untuk mengkompresi teks atau file program. Ini yang menyebabkan mengapa algoritma ini banyak dipakai dalam program kompresi.

Kompresi Huffman termasuk dalam algoritma keluarga dengan variable codeword length. Ini berarti simbol individual (karakter dalam sebuah file teks sebagai contoh) digantikan oleh urutan bit yang mempunyai suatu panjang yang


(47)

31 nyata (distinct length). Jadi simbol yang muncul cukup banyak dalam file akan memberikan urutan yang pendek sementara simbol yang jarang dipakai akan mempunyai urutan bit yang lebih panjang.

Contoh praktis berikut ini menunjukkan cara kerja dari algoritma Huffman. Misalkan akan dikompresi potongan data seperti berikut ini:

ACDABA

Distribusi frekuensi untuk karakter di atas seperti dalam tabel berikut ini:

Tabel 2.4 Distribusi frekuensi ACDABA

Karakter A B C D

Frekuensi 3 1 1 1

Selanjutnya dibentuk node seperti bentuk berikut ini berdasarkan frekuensi di atas, disusun mulai dari frekuensi terbesar hingga terkecil. Kemudian dibentuk pohon Huffman agar didapat kode simbol atau kode pengganti untuk karakter-karakter di atas.

A

3

B

1

C

1

D

1

Gambar 2.6 Distribusi pada Node 1


(48)

32 A 3 B 1 C 1 D 1

Gambar 2.7 Distribusi pada Node 2

Selanjutnya dua buah node terkecil digabung membentuk satu node baru dimana frekuensinya merupakan penjumlahan dari keduanya.

D 1 A 3 C 1 B 1 2

Gambar 2.8 Distribusi pada Node 3

Setelah itu diurutkan kembali berdasarkan frekuensi tiap node secara urutan menaik. D 1 A 3 C 1 B 1 2

Gambar 2.9 Distribusi pada Node 4

Kemudian dua buah node terkecil digabung menjadi satu kembali untuk membentuk node baru.

D 1 A 3 C 1 B 1 2 3


(49)

33 Setelah itu diurutkan kembali berdasarkan frekuensi tiap node secara urutan menaik. D 1 A 3 C 1 B 1 2 3

Gambar 2.11 Distribusi pada Node 6

Kemudian dua node terakhir ini digabung membentuk satu pohon tunggal yang disebut dengan pohon Huffman dengan node paling atas merupakan root.

D 1 A 3 C 1 B 1 2 3 6

Gambar 2.12 Distribusi pada Node 7

Langkah terakhir adalah memberikan label bit “0” untuk setiap sisi kiri dari pohon dan label bit “1” untuk setiap sisi kanan dari pohon.


(50)

34 D 1 A 3 C 1 B 1 2 3 6 0 0 0 1 1 1

Gambar 2.13 Distribusi pada Node 8

Karena potongan data tersebut terdiri atas 6 karakter, maka teks tersebut terdiri atas 6 byte atau 48 bit. Dengan Huffman encoding, akan dicari simbol yang paling sering muncul (dalam kasus ini adalah karakter „A‟ muncul sebanyak 3 kali). dan kemudian sebuah pohon (tree) akan dibentuk untuk menggantikan simbol dengan urutan bit yang lebih pendek. Pada kasus khusus ini, algoritma akan menggunakan tabel pengganti sebagai berikut: A = 1, B = 010, C = 011, D = 00. Jika code word dipakai untuk mengkompresi file, maka data yang telah dikompresi akan terlihat seperti berikut ini. ACDABA

10110010101

Ini berarti hanya 11 bit yang dipakai selain 48 bit, berarti rasio kompresi adalah 4 : 1 untuk file tersebut.


(51)

35 Huffman encoding dapat dioptimalkan dengan dua cara yang berbeda yaitu sebagai berikut:

1. Adaptive Huffman Code secara dinamis mengubah code word menurut perubahan dari probabilitas dari simbol.

2. Extended Huffman Compression dapat meng-encode grup dari simbol daripada pada melakukan encode pada simbol tunggal.

Algoritma kompresi Huffman secara umum efisien dalam mengkompresi teks atau file program. Untuk file image biasanya dipakai algoritma yang lain. Kompresi Huffman secara umum dipakai dalam program kompresi seperti PKZip, LHA, GZ, ZOO, dan ARJ. Algoritma ini juga dipakai dalam kompresi JPEG dan MPEG.

Adapun bentuk algoritma dari Huffman dalam membentuk sebuah pohon biner adalah sebagai berikut:

1. Dimulai dengan penyusunan frekuensi simbol sebagai frekuensi dari pohon

2. Jika terdapat lebih dari satu pohon:

a. Carilah dua pohon dengan jumlah weight yang paling kecil

b. Gabungkan dua pohon tersebut menjadi satu dan mempunyai nilai setara dengan jumlah keduanya, atur salah satunya yang bernilai paling kecil sebagai child sisi kiri dan yang lainnya sebagai child

sisi kanan


(52)

36 4. Untuk setiap child sisi kiri beri simbol „0‟ dan beri simbol „1‟ untuk

merepresentasi child sisi kanan

2.5 Discrete Cosine Transform (DCT)

Perkembangan aplikasi gambar digital telah meningkatkan kebutuhan akan teknik kompresi gambar dan video yang standar dan efektif. Standar yang banyak digunakan adalah JPEG untuk gambar, MPEG untuk video dan H.261 untuk video teleconference. Ketiga standar tersebut menggunakan teknik dasar yang disebut Discrete Cosine Transform (DCT). Discrete Cosine Transform

adalah sebuah teknik untuk mengubah sebuah sinyal kedalam komponen frekuensi dasar. Teknik ini biasanya digunakan dalam kompresi gambar dan video.

2.5.1 Standar Kompresi Video

Antara tahun 80 – 90an, algoritma kompresi berbasis Discrete Cosine Transform (DCT) dan standar internasional dikembangkan untuk mengurangi peyimpanan dan keterbatasan bandwidth yang disebabkan oleh gambar digital dan aplikasi video.Sekarang ada tiga standar berbasis DCT yang banyak digunakan dan diterima secara luas.

- JPEG (Joint Photographic Expert Group) - H.261 (Video codec for audiovisual service) - MPEG (Motion Picture Expert Group)


(53)

37 kompressi gambar, H.261 untuk konferensi video, dan MPEG untuk system multimedia berkualitas tinggi.

Skema kompresi standar secara sederhana adalah sebagai berikut: bagi gambar dalam 8 x 8 blok, tentukan informasi penting dari gambar yang akan dikompres, abaikan informasi yang tidak terlalu penting, dan sandikan informasi gambar yang penting dengan jumlah bit seminimal mungkin.

Fungsi yang biasa digunakan antara lain:

DCT dan Zig-Zag Scanning

Discrete Cosine Transform berhubungan erat dengan Discrete Fourier Transform (FFT) dan, sehingga menjadikan data direpresentasikan dalam komponen frekuensinya. Demikian pula, dalam aplikasi pemrosesan gambar, DCT dua dimensi (2D) memetakan sebuah gambar atau sebuah segmen gambar kedalam komponen frekuensi 2D (dua dimensi nya).

Untuk aplikasi kompresi video, jika variasi dalam blok cenderung rendah, kebanyakan transformasi ini akan menghasilkan representasi blok yang lebih kompak . Blok dipadatkan dalam „bin‟ dengan frekuensi yang lebih rendah yang sesuai.

Kuantisasi

Kuantisasi adalah data sumber utama yang hilang dalam algoritma kompresi image yang berbasis DCT. Kuantisasi mengurangi jumlah informasi


(54)

38 yang dibutuhkan untuk merepresentasikan frekuensi bin dengan mengkonversi amplitude dalam range tertentu mejadi satu dalam kumpulan level kuatisasi. Secara sederhana, semau standar dari semua algoritam kompresi image menggunakan kuantisasi linier dimana level dari ukuran kuantisasi adalah konstan.

Kuantisasi dalam domain frekuensi mempunyai banyak keuntunagan secara langsung dalam mengkuantisasi nilai pixel. Kuantisasi dalam nilai pixel

menghasilkan efek fisual yang dinamakan distorsi kontu dimana perubahan kecil amplitude dalam wilayah gradient menyebabkan perubahan peningkatan ukuran dalam rekonstruksi simpangan. Kecuali untuk DC bin, kesalahan kuantisasi untuk tiap-tiap tempat penyimpanan frekuensi rata-rata mendekati 0 untuk blok 8x8.

Entropy Coding

Entropy coding adalah sebuah skema lossless kompresi berbasis pada properti statistik dari gambar atau aliran informasi yang dikompres. Meskipun

entropy coding diimplementasikan secara berbeda untuk tiap-tiap standar, dasar dari skema entropy coding adalah dengan menyandikan pola yang paling sering muncul dengan jumlah bit yang paling kecil. Dengan cara ini, data dapat dimampatkan dengan faktro tambahan dari 3 atau 4.

Entropy coding untuk aplikasi pemampatan video mempunyai dua proses : Zero-Length Coding (RLC) dan kode Huffman. Data RLC adalah representasi simbolik dari tempat penampung yang terkuantisasi yang memanfaatkan sepasang angka. Angka pertama merepresentasikan jumlah dari 0 yang berturutan


(55)

39 sedangkan yang kedua melambangkan jumlah dari nilai antara panjang zero-run. Sebagai contoh kode RLC(5,8) melambangkan urutan angka dari (0,0,0,0,0,8).

Kode Huffman menempatkan variable panjang kode menjadi data RLC, menghasilkan variable panjang data aliran bit. Hal ini memerlukan table Huffman yang dapat di komputasi kembali yang berbasis pada properti statistic dari image (sebagaimana dalam JPEG) atau dapat kembali ditentukan kembali jika table default sedang digunakan. Dalam kasus yang lain, table yang sama digunakan untuk mendecode aliran bit data.

Seperti dijelaskan diatas, pola RLC yang sering muncul disandikan dengan jumlah bit yang paling kecil. Dalam hal ini aliran digital, yang merupakan representasi digital dari image, tidak memiliki batasan atau panjang yang tetap. Informasi ini sekarang dapat disimpan atau disiapkan untuk pengiriman.

Motion Estimation

Secara umum, motion video yang berurutan cenderung mempunyai hubungan erat, sehingga, pergantian gambar ditampilkan dalam waktu yang sangat cepat dalma periode waktu yang singkat. Hal ini mengakibatkan perbedaan secara aritmatika antara gambar sangat kecil. Untuk alasan ini, rasio kompresi untuk motion video yang berurutan meningkat dengan menyandikan perbedaan aritmatika diantara dua atau lebih frame yang saling berhubungan.

Perkiraan motion adalah proses dimana elemen dalam gambar mempunyi korelasi terbaik dengan elemen di gambar yang lain (didepan atau dibelakang) dengan memperkirakan jumlah dari motion. Jumlah dari motion dibungkus dalam


(56)

40 vektor motion. Motion vector selanjutnya mengacu pada motion vector yang ada sebelumya.

Gambar 2.14 Motion Vector

Algoritama perkiraan motion yang efisien meningkatkan korelasi frame, dimana dapat meminimalkan pixel perbedaan aritmatik. Menghasilkan bukan hanya rasio kompresi yang tinggi tapi juga kualitas video yang didecode. Perkiraan pergerakan sesaat merupakan operasi komputansi intensif yang sulit untuk diimplementasikan secara real-time.

2.5.2 Algoritma Kompresi JPEG

Algoritma JPEG dibuat untuk menghasilkan kompresi gambar film secara efisien. Dalam penggunaan kompresi gambar film, JPEG juga sudah disesuaikan untuk penggunaan dengan gerakan video yang berurutan. Penyesuaian ini menggunakan algoritma JPEG untuk mengkompres setiap frame sendiri-sendiri pada urutan gerakan video.


(57)

41

Gambar 2.15 Proses kompresi gambar diam

Setiap bagian warna dari gambar film diperlakukan sebagai gambar yang terpisah oleh JPEG. Meskipun JPEG memungkinkan beberapa pembagian warna, gambar biasanya dibedakan dalam warna merah, hijau , biru. Atau Luminance (Y), dengan perbedaan warna biru dan merah (U=B-Y, V=R-Y). Pembagian dalam bagian warna YUV memungkinkan algorima ini untuk memanfaatkan kelemahan sensitifitas mata manusia.

JPEG membagi setiap komponen warna gambar dalam 8x8 blok pixel. DCT 8x8 diterapkan pada setiap blok. Untuk kuantisasi, JPEG menggunakan matriks. JPEG memungkinkan perbedaan matriks kuantisasi ditentukan untuk setiap bagian warna. Penggunaan matriks kuantisasi memungkinkan setiap frekuensi untuk dikuantisasi pada setiap tahapan yang berbeda. Secara umum, frekuensi yang lebih rendah pada komponen dikuantisasi menjadi tahapan yang kecil dan frekuensi tingginya menjadi tahapan yang besar. Hal ini menguntungkan karena mata manusia tidak terlalu sensitif pada frekuensi yang tinggi, tapi lebih sensitif pada frekuensi yang lebih rendah.

Modifikasi pada matriks kuantisasi adalah cara yang utama untuk mengontrol kualitas dan rasio kompresi pada JPEG. Meskipun ukuran tahapan kuantisasi untuk setiap frekuensi dapat dimodifikasi, sebagian besar teknik adalah


(58)

42 untuk memperhitungkan elemen matriks bersama-sama.

Tahapan terakhir dari kompresi adalah zig-zag scanning dan pengkodean entropi. Meskipun JPEG memungkinkan 2 jenis entropy coder, penerapan JPEG lebih mirip menggunakan pilihan pengkodean Huffman. Standar JPEG memungkinkan untuk menggunakan table kode Huffman yang didefinisikan sendiri. Untuk melakukan dekompres pada gambar JPEG, setiap proses ditunjukkan dalam urutan yang terbalik.

2.5.2 Algoritma Kompresi H.261

Algoritma H.261 dimaksudkan untuk diterapkan pada aplikasi Video conferencing dan video telephony. Pada aplikasi ini, keterbatasan gerakan video menjadi bagian terpenting. Agar lebih efektif , H.261 menentukan banyak parameter system. Hanya pembagian warna YUV dengan perbandingan 4:2:0 dapat digunakan secara standar. Sebagai tambahan, H.261 hanya menggunakan 2 ukuran frame, CIF (352 x 288) dan QCIF (176 x 144).

Seperti standar JPEG, setiap bagian warna gambar dibagi dalam 8 x 8 blok

pixel. Disamping mengkodekan setiap blok secara terpisah, H.261 mengelompokkan 4 blok Y , 1 blok U, dan 1 blok V bersama-sama dalam satu unit yang disebut makroblock. Makroblock adalah unit dasar untuk kompresi.


(59)

43

Gambar 2.16 Makroblok kompresi h.261

Untuk mengkompres setiap makroblock, standar H.261 memungkinkan kompresor untuk memilih dari beberapa pilihan kompresi. Standar H.261 hanya menentukan proses decoding dari setiap pilihan kompresi. Cara yang digunakan tidak dibakukan. Hal ini memungkinkan untuk menghasilkan produk yang berbeda dengan menggunakan cara yang berbeda efektifitasnya. Salah satu cara yang digunakan untuk mengkompres H.261 adalah sebagai berikut.

Pertama, perkiraan gerakan ditunjukkan pada setiap macroblock. Karena objek dalam frame mungkin bergerak dalam arah yang berbeda, setiap macro block dapat mempunyai vektor gerakan yang berbeda. Vektor gerakan digunakan sebagai vektor pemindahan untuk mengambil sebuah macroblock dari frame yang sebelumnya untuk digunakan sebagai perkiraan. Perkiraan gerakan dalam H.261 adalah relatif pada frame yang sebelumya, dan pada pencetakan full- pixel

mencapai maksimal pada +/- 15 arah vertikal dan horizontal

Selanjutnya, keputusan harus dibuat untuk mengkodekan perbedaan aritmatik antara prediksi pada macroblock dan macroblock yang sebenarnya atau


(60)

44 mengkodekan macroblock dari rancangan yang dibuat. Karena perbedaan aritmatik biasanya kecil, pengkodeaan perbedaan aritmatik menghasilkan kompresi yang lebih baik.

Tahapan terakhir pada proses kompresi adalah zig-zag scanning, run-length encoding dan entropy coding. Tidak seperti JPEG, H.261 menentukan table kode Huffman untuk mengkodekan entropi. Untuk melakukan decompress sebuah proses pembalikan frame H.261 dilakukan dalam urutan yang terbalik. Perkiraan gerakan tidak diperlukan karena vektor gerakan sudah termasuk dalam bit hasil kompresi. Dekompresor H.261 secara mudah menerapkan pencetakan vektor gerakan untuk menerima kembali perkiraan jika diperlukan.

2.5.3 Algoritma kompresi MPEG

Algoritma kompresi MPEG dikembangkan untuk memenuhi kebutuhan akan gambar dengan kualitas yang lebih baik dan untuk meningkatkan fleksibilitas system yang diperlukan oleh system multimedia. Karena dikembangkan lebih akhir, MPEG dapat meningkatkan usaha dibalik pengembangan algoritma JPEG dan H.261.

Sebagaimana H.261, MPEG standar hanya menggunakan pemisahan komponen warna YUV dengan sampling ratio 4:2:0. Tidak seperti H.261, ukuran

frame tidak dibatasi, walaupun ukuran frame 352 x 240 biasa digunakan. MPEG mengadopsi macroblock dari H.261 (4 blok Y, 1 blok U, dan 1 blok V) sebagai unit dasar kompresi. Untuk mengkompres tiap macroblock, MPEG standar mengizinkan kompresor untuk memilih dari beberapa pilihan kompresi.


(61)

45

Gambar 2.17 Kompresi MPEG

Ada lebih banyak pilihan yang tersedia dalam MPEG standar dari pada H.261. Sebagaimana H.261, MPEG standar hanya menspesifikasikan decoding

pada setiap pilihan kompresi. Metode untuk memilih pilihan tersebut tidak distandardisasi, sehingga memungkinkan vendor untuk membedakan produk mereka dengan menyediakan metoda dengan biaya dan kualitas yang berbeda. Berikut ini adalah metoda yang biasa digunakan dalam kompresi MPEG.

Pertama, estimasi pergerakan dilakukan pada tiap macroblock. MPEG mampu melakukan prediksi terhadap frame sebelumnya, sesudahnya atau kombinasi dari keduanya. Karena objek dalam frame tidak bergerak secara tetap dari frame ke frame, setiap macroblock dapat memiliki motion vector hingga dua buah (satu untuk frame sebelumnya dan satu lagi untuk frame sesudahnya). Untuk melakukan prediksi terhadap frame selanjutnya, harus dilakukan buffer terhadap


(62)

46 Estimasi pergerakan juga dapat dilakukan hingga range yang lebih besar (hingga ± 1023) dan dengan resolusi half-pixel. Loop-filter pada H.261 tidak dimasukkan dalam MPEG karena half-pixel motion vector menyediakan fungsi yang sama. MPEG dapat melakukan prediksi yang dibentuk dari perbedaan arimatika antara macroblock sekarang dengan macroblock dari frame sebelumnya,

frame selanjutnya, rata-rata antara frame sebelumnya dengan frame selanjutnya atau mengkodekan macroblock sekarang dari awal. Sebuah DCT 8x8 diaplikasikan kedalam masing-masing blok pada macroblock sekarang. MPEG menggunakan matriks (seperti JPEG) dan faktor skala untuk kuantisasi. Karena

DC bin adalah yang paling penting, maka dikuantisasikan dalam 8 skala bit tetap. Karena efek visual dari kuantisasi frequency bin berbeda antara blok perkiraan dengan blok sekarang, MPEG dapat menggunakan dua matriks (masing – masing satu untuk tiap tipe). Biasanya, matriks tersebut diset sekali untuk urutan gambar dan skala kuantisasinya disesuaikan untuk mengontrol rasio kompresi.

Tahap paling akhir dari kompresi adalah zig-zag scanning, run-length encoding dan entropy coding. Seperti H.261, MPEG menspesifikasikan tabel kode Huffman untuk entropy coding. Untuk mendekompres frame MPEG, setiap operasi dilakukan secara terbalik, kecuali untuk estimasi pergerakan. Karena vektor pergerakan dimasukkan dalam bit-stream yang dikompresi, dekompresor MPEG hanya cukup menerapkan vektor pergerakan untuk memprediksi frame

sebelumnya maupun frame selanjutnya jika diperlukan


(63)

47 Gelombang Elektromagnetik adalah gelombang yang dapat merambat walau tidak ada medium. Energi elektromagnetik merambat dalam gelombang dengan beberapa karakter yang bisa diukur, yaitu: panjang gelombang/wavelength, frekuensi, amplitude/amplitude, kecepatan. Amplitudo adalah tinggi gelombang, sedangkan panjang gelombang adalah jarak antara dua puncak. Frekuensi adalah jumlah gelombang yang melalui suatu titik dalam satu satuan waktu. Frekuensi tergantung dari kecepatan merambatnya gelombang. Karena kecepatan energi elektromagnetik adalah konstan (kecepatan cahaya), panjang gelombang dan frekuensi berbanding terbalik. Semakin panjang suatu gelombang, semakin rendah frekuensinya, dan semakin pendek suatu gelombang semakin tinggi frekuensinya.

Energi elektromagnetik dipancarkan, atau dilepaskan, oleh semua masa di alam semesta pada level yang berbeda-beda. Semakin tinggi level energi dalam suatu sumber energi, semakin rendah panjang gelombang dari energi yang dihasilkan, dan semakin tinggi frekuensinya. Perbedaan karakteristik energi gelombang digunakan untuk mengelompokkan energi elektromagnetik.

Beberapa kaidah tentang kemagnetan dan kelistrikan yang mendukung perkembangan konsep gelombang elektromagnetik antara lain:

1. Hukum Coulomb mengemukakan : “Muatan listrik statik dapat menghasilkan medan listrik.”.

2. Hukum Biot & Savart mengemukakan : “Aliran muatan listrik (arus listrik) dapat menghasilkan medan magnet”.


(64)

48 3. Hukum Faraday mengemukakan : “Perubahan medan magnet dapat

menghasilkan medan listrik”.

Berdasarkan Hukum Faraday, Maxwell mengemukakan hipotesa sebagai berikut: ”Perubahan medan listrik dapat menimbulkan medan magnet”. Hipotesa ini sudah teruji dan disebut dengan Teori Maxwell. Inti teori Maxwell mengenai gelombang elektromagnetik adalah:

a. Perubahan medan listrik dapat menghasilkan medan magnet.

b. Cahaya termasuk gelombang elektromagnetik. Cepat rambat gelombang elektromagnetik (c) tergantung dari permitivitas () dan permeabilitas (μ) zat.

Menurut Maxwell, kecepatan rambat gelombang elektromagnetik dirumuskan sebagai berikut

c =

o oμ

ε

1

(3)

dimana,

c = Cepat rambat gelombang elektromagnetik

 = Permitivitas, dan μ = Permeabilitas zat.

Ternyata perubahan medan listrik menimbulkan medan magnet yang tidak tetap besarannya atau berubahubah. Sehingga perubahan medan magnet tersebut akan menghasilkan lagi medan listrik yang berubahubah.


(65)

49 Proses terjadinya medan listrik dan medan magnet berlangsung secara bersamasama dan menjalar kesegala arah. Arah getar vektor medan listrik dan medan magnet saling tegak lurus. Jadi gelombang elektromagnetik adalah gelombang yang dihasilkan dari perubahan medan magnet dan medan listrik secara berurutan, dimana arah getar vektor medan listrik dan medan magnet saling tegak lurus.

Gambar 2.18 Gelombang elektromagnetik

E = medan listrik (menjalar vertikal) B = medan magnet (menjalar horizontal.)

Gejala seperti ini disebut terjadinya gelombang elektromagnetik (gelombang yang mempunyai medan magnet dan medan listrik).

Vektor Medan Listrik

Vektor Medan Magnet

Gelombang

B E


(66)

50

2.6.1 Osilator Penghasil Gelombang Elektromagnetik

Gelombang elektromagnetik telah diketahui keberadaannya. Permasalahannya dapatkah gelombang elektromagnetik diproduksi terus-menerus. Berdasarkan hukum Ampere dan hukum Faraday berhasil diketemukan bahwa rangkaian oscilasi listrik dapat menghasilkan gelombang elektromagnetik terus menerus. Frekuensi yang dihasilkan gelombang elektromagnetik disebut frekuensi resonansi.

Sumber energi

Sirkuit LC

Anten

i

Gambar 2.19 Rangkaian/sirkuit osilasi LC dihubungkan dengan sumber energi dan antena dapat menghasilkan perubahan medan listrik AC


(67)

51 Prinsip ini dipakai dalam teknologi penyiaran baik gelombang TV, gelombang radar, gelombang mikro, maupun gelombang radio. Gambar 21 menunjukkan rangkaian pengirim gelombang elektromagnetik. Di sisi lain gelombang elektromagnetik yang terpancar itu dapat ditangkap melalui rangkaian penerima gelombang elektromagnetik.

BAB III

METODE PENELITIAN

3.1 Waktu dan Tempat Penelitian

Penelitian dilaksanakan selama 6 bulan di Pusat Pengembangan Informatika Nuklir (PPIN), BATAN Serpong dengan alamat Gedung 71, Kawasan Puspiptek Serpong, Tangerang.

Pusat Pengembangan Informatika Nuklir BATAN (PPIN) adalah merupakan salah satu unit kerja di Badan Tenaga Nuklir Nasional yang bertugas melaksananakan pembangunan dan pengembangan infrastruktur jaringan komunikasi dan sistem komputer untuk menyediakan sarana, prasarana komputasi dan fasilitas akses ke jaringan dalam lingkungan BATAN, jaringan nasional dan jaringan internasional.

3.2 Perangkat yang digunakan

Dalam penelitian ini digunakan perangkat-perangkat yang terdiri dari perangkat keras dan perangkat lunak.


(68)

52

3.2.1 Perangkat Keras

Perangkat keras digunakan antara lain, seperangkat komputer personal (PC) dan laptop dengan spesifikasi yang cukup untuk menjalankan program-program perangkat yang dibutuhkan dan mempunyai koneksi internet yang memadai, sebuah webcam sebagai video input, layar monitor sebagai video output, mikrofon sebagai audio input, dan speaker sebagai audio output.

Spesifikasi PC dan laptop yang digunakan dapat dilihat pada tabel 3.1 berikut:

Tabel 3.1 Spesifikasi PC dan laptop yang digunakan

Item PC Laptop Acer Aspire 2920

Monitor 1440 x 900 pixels 1200 x 800 pixels RAM 4 GB (hanya terpakai 3.2 GB) 1 GB

HDD 1.5 TB 250 GB

Webcam Prolink PCC5020 Integrated webcam

Processor Atlhon X2 7850+ 2.80 GHz Intel Core 2 Duo 2.0 GHz VGA ATI Radeon HD 5750 512 MB Intel GMA X3100 358 MB Speaker Sonicgear Spectra 2000 5.1 Stereo speaker Microphone Built-in dari webcam On board


(69)

53 Dalam penelitian yang membandingakan codec video ini, webcam menjadi salah satu perangkat keras yang paling penting. Oleh karena itu menjadi sangat penting pula untuk mengetahui spesifikasi webcam yang digunakan. Untuk perbandingan spesifikasi webcam yang digunakan dapat dilihat pada tabel 3.2 berikut.

Tabel 3.2 Spesifikasi webcam yang digunakan

Fitur Prolink PCC5020 Acer Aspire 2920 Webcam

Resolusi Foto 1280 x 960 pixels 640 x 480 pixels Resolusi Video 320 x 240 pixels 640 x 480 pixels

Frame Rate 15 fps 30 fps

Built-In Mic Iya Tidak

3.2.2 Perangkat Lunak

Perangkat lunak yang digunakan untuk membandingkan codec video H.264 dengan VP7 tentu saja sudah seharusnya untuk menggunakan perangkat lunak yang meng-implementasi-kan kedua codec video tersebut yaitu Skype dan Google Video Chat. Digunakan pula perangkat lunak Fraps yang digunakan untuk menghitung frame rate dari panggilan video yang dilakukan, perangkat lunak Net Meter untuk mengetahui besar bandwidth internet yang terpakai oleh layanan panggilan video tersebut. Agar dapat menentukan kualitas dan tingkat efisiensi


(70)

54 kedua codec video tersebut. Selain itu, digunakan pula perangkat lunak Wireshark untuk mengukur nilai QoS (quality of service) dari masing-masing codec video.

a. Skype

Dipilihnya perangkat lunak Skype sebagai perwakilan dari codec VP7 karena perangkat lunak Skype ini sudah mulai melayani konsumennya sebagai penyedia layanan panggilan suara (voice call) gratis sejak Agustus 2003 dan memulai untuk menambahkan fitur panggilan dan konferensi video (video call & conference) sejak Januari 2006.

Gambar 3.1. Tampilan Skype

Skype sudah merambah pasar yang lebih luas, dapat digunakan pada system operasi Windows, Mac, dan Linux. Bahkan dapat digunakan pada ponsel berbasis Android, Symbian, dan juga pada iPhone. Hingga saaat ini Skype masih merupakan salah satu pilihan utama konsumen.


(71)

55 Sedangkan dipilihnya perangkat lunak Google Video Chat sebagai perwakilan dari codec video H.264 dikarenakan perangkat lunak ini dikembangkan oleh Google yang merupakan salah satu perusahaan besar yang bergerak dalam bidang industri perangkat lunak komputer dan internet yang bermula dari sebuah mesin pencari web.

Gambar 3.2. Tampilan Google Video Chat

Google sudah banyak mengembangkan perangkat lunak yang menjadi pesaing perangkat-perangkat lunak dan layanan-layanan yang telah lama menjadi pilihan konsumen. Beberapa contohnya antar lain, Gmail (Google Mail) yang menjadi pesaing Yahoo Mail, Google Talk yang menjadi pesaing Yahoo Messenger, Google Chrome yang menjadi pesaing Internet Explorer dan Mozilla Firefox. Sebagian besar perangkat lunak yang dikembangkan oleh Google langsung menjadi pilihan alternatif konsumen karena didukung oleh nama Google


(72)

56 itu sendiri. Dapat diperkirakan pula bahwa perangkat lunak Google Video Chat ini pun dapat menjadi pesaing Skype dalam hal layanan panggilan video.


(73)

57 Perancangan Perangkat

Pengujian

Codec H.264 Codec VP7

Pengujian Efisiensi dan Efektifitas Codec

Analisis Hasil Penelitian

Kesimpulan Studi Literatur

Berikut ini merupakan bagan diagram alur dari tahap awal hingga tahap akhir dalam penelitan ini:

Gambar 3.3. Bagan Alur Penelitian Perbandingan Codec Video


(1)

85

LAMPIRAN I

DATA PENGUJIAN EFISIENSI DAN EFEKTIFITAS CODEC

Tabel Data Pengujian codec H.264 pada PC

Parameter No. CPU (%)

Bandwidth (kbps)

1. 11 293.7

2. 14 313.6

3. 17 348.2

4. 16 353.5

5. 13 341.4

6. 18 282.2

7. 21 369.3

8. 23 372.1

9. 14 412.2

10. 13 383.8


(2)

86

Tabel Data Pengujian codec VP7 pada PC

Parameter No. CPU (%)

Bandwidth (kbps)

1. 29 583.4

2. 33 617.3

3. 35 648.5

4. 41 651.7

5. 44 676.6

6. 48 623.8

7. 37 634.2

8. 26 640.1

9. 39 652.2

10. 38 672.2


(3)

87

Tabel Data Pengujian codec H.264 pada Laptop

Parameter No. CPU (%)

Bandwidth (kbps)

1. 19 332.5

2. 22 321.2

3. 24 347.9

4. 23 353.7

5. 21 372.8

6. 17 364.3

7. 25 358.2

8. 26 371.4

9. 24 361.3

10. 29 356.7


(4)

88

Tabel Data Pengujian codec VP7 pada Laptop

Parameter No. CPU (%)

Bandwidth (kbps)

1. 33 973.2

2. 36 995.3

3. 32 1024.5

4. 41 1203.7

5. 45 1400.8

6. 49 1375.6

7. 51 1117.5

8. 48 1049.7

9. 47 873.9

10. 48 985.8


(5)

89

LAMPIRAN II

Perbandingan Kualitas Gambar pada PC

Google Video Chat pada PC


(6)

90

Perbandingan Kualitas Gambar pada Laptop

Google Video Chat pada Laptop