Urgensi Keutamaan Penelitian PROSIDING KONFERENSI NASIONAL TEKNOLOGI INFORMASI DAN KOMUNIKASI.
keterbatasan pendengaran. Alasan digunakannya video menurut paper tersebut adalah karena video mampu merebut 94 saluran masuknya pesan atau informasi ke dalam jiwa manusia melalui mata dan
telinga serta mampu untuk membuat orang pada umumnya mengingat 50 dari apa yang mereka lihat dan dengar tayangan program. Pesan yang disampaikan melalui media video dapat mempengaruhi emosi
yang kuat dan juga dapat mencapai hasil cepat yang tidak dimiliki oleh media lain. Produk yang dihasilkan oleh penelitain tersebut adalah : Presenter bahasa isyarat + visualisasi teks; Presenter bahasa
isyarat + drama bahasa isyarat + teks; dan Presenter bahasa isyarat + animasi + teks. Penelitian lainnya adalah Penggunaan Media Ceritera Bergambar Berbasis Pendekatan
Komunikasi Total untuk Meningkatkan Kemampuan Bahasa Anak Tunarungu Kelas Rendah Di SLB Bagian B YPTB Malang, yang dilakukan oleh Efendi dan kawan-kawan [3]. Dari penelitian tersebut
disimpulkan bahwa penggunaan media dalam pembelajaran ternyata mampu meningkatkan gairah belajar siswa, sebab melalui media yang digunakan perhatian siswa tergiring pada fakta yang ditampilkan dalam
media tersebut. Siswa dapat mengembangkan pemehaman terhadap makna yang dikemas dalam media, dengan cara mengasosiasikan antar bagian yang ditampilkan dalam gambar dan paparan yang
menyertainya. Dapaknya siswa tidak hanya sekedar mengerti dan memahami secara verbal apa yang dipelajari, akan tetapi mereka juga memiliki wawasan secara faktual setiap aspek dari materi yang
dipelajari. Paper ini membahas hasil penelitian penggunaan aplikasi Text to Speech sebagai media ajar bagi
siswa tuna wicara dalam melatih diri mampu mengucapkan kata-kata dengan jelas. Sistem Text To Speech TTS adalah sistem yang mengkonversi teks pada bahasa dialek tertentu ke bentuk suara pada bahasa
dialek yang sama [8]. Sistem ini terdiri dari dua bagian, yaitu bagian depan front-end dan bagian belakang back-end [2]. Bagian depan berguna untuk mengkonversi teks yang terdiri dari simbol seperti
angka dan singkatan ke bentuk kata yang sama. Proses ini sering disebut normalisasi teks text normalization, pre–processing atau tokenizing. Kemudian front-end mengubah transkripsi phonetic ke
penggalan huruf, membagi dan menandai teks ke dalam unit prosodic, seperti frase, klausa, dan kalimat. Proses ini disebut dengan text to phoneme atau grapheme to phoneme conversion. Transkripsi phonetic
dan informasi prosody bersama – sama membuat representasi simbol bahasa yang merupakan keluaran dari front-end. Back-end sering diartikan sebagai synthesizer yang berfungsi mengkonversi representasi
simbol bahasa ke dalam bentuk suara. Gambar di bawah ini menjelaskan proses yang terjadi antara front- end dan back-end.
Gambar 1: Proses front-end dan back-end [2].
Linguistic analysis
Utterence composed
of Text
Analysis Wave form
Generatin Speech
Utterence composed
of Words Duration
Intonation Phrasing
Text
Suara tiruan dapat dibuat oleh bagian-bagian dari rekaman yang tersimpan di dalam database. Sistem dibedakan ke dalam ukuran unit suara yang disimpan; sebuah sistem yang menyimpan phone atau
diphone membentuk interval keluaran yang besar, tetapi dapat mengurangi kejernihan suara. Phone adalah kata – kata yang biasa, seperti aku, dia, atau, dan lain sebagainya. Sedangkan diphone adalah
gabungan dari kata – kata yang memiliki lafal yang berbeda, misalkan kenapa, langka, mengapa, dan lain sebagainya.
Untuk mendapatkan ucapan yang lebih alami, ucapan yang dihasilkan harus memiliki intonasi prosody. Secara kuantisas, intonasi adalah perubahan nilai pitch frekuensi dasar selama pengucapan
kalimat dilakukan atau pitch sebagai fungsi waktu. Pada prakteknya, informasi pembentuk intonasi berupa data pitch dan durasi pengucapan untuk setiap fonem yang dibangkitkan. Nilai-nilai yang
dihasilkan diperoleh dari suatu model intonasi. Intonasi bersifat sangat spesifik untuk setiap bahasa, sehingga model yang diperlukan untuk membangkitkan data intonasi menjadi sangat spesifik juga untuk
suatu bahasa. Konverter fonem ke ucapan harus memiliki pustaka setiap unit ucapan dari suatu bahasa. Pada
sistem yang menggunakan teknik diphone concatenation, sistem harus didukung oleh suatu diphone database yang berisi rekaman segmen-segmen ucapan yang berupa diphone. Ucapan dalam suatu bahasa
dibentuk dari satu set bunyi yang mungkin berbeda untuk setiap bahasa, oleh karena itu setiap bahasa harus dilengkapi dengan diphone database yang berbeda.
Gambar 2.2. Menjelaskan tahapan lengkap dari proses TTS.
Gambar 2: Urutan Proses Konversi dari Teks ke Ucapan 1
HASIL DAN PEMBAHASAN 1. Sistem yang dirancang
Sistem yang dibangun ini terdiri dari dua bagian yaitu modul untuk latihan pengucapan dengan cara siswa mengetikkan sendiri kata-kata yang ingin diucapkan atau ditiru ucapannya, dan modul latihan
ucapan sambil mengenal bagian tubuh, angka, serta hitung menghitung. Modul 1.
Modul 2
Gambar 3. Diagram Blok Sistem