Teori Umum Suara Proses Produksi Suara

Impuls tekanan pada umumnya disebut sebagai pitch impulses dan frekuensi sinyal tekanan adalah pitch frequency atau fundamental frequency. Pada Gambar 2.2 sederetan impuls fungsi tekanan suara dihasikan oleh vocal cords untuk sebuah suara. Ini merupakan bagian dari sinyal voice suara yang mendefinisikan speech melody melodi wicara. Ketika seseorang berbicara dengan sebuah frekuensi pitch konstan, suara sinyal wicara monotonous tetapi dalam kasus normal sebuah perubahan permanen pada frekuensi terjadi. Ketika seseorang berbicara dengan frekuensi pitch constant, maka impuls pitch akan terlihat seperti pada Gambar 2.2. Variasi frekuensi pitch dapat dilihat seperti yang terlihat pada Gambar 2.3 di bawah ini. Gambar 2.2 Sederet Impuls yang sama Gambar 2.3 Variasi Frekuensi Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu nasals juga merangsang nasal cavity rongga hidung. Ketika rongga beresonansi, akan menimbulkan radiasi sebuah gelombang suara yang mana merupakan sinyal wicara. Kedua rongga beraksi sebagai resonators dengan karakteristik frekuensi resonansi masing-masing, yang disebut formant frequencies. Pada saat rongga mulut dapat mengalami perubahan besar, manusia mampu untuk menghasilkan beragam pola ucapan suara yang berbeda. Mampu pula untuk menghasilkan beragam pola ucapan suara yang berbeda. Di dalam kasus unvoiced sounds suara tak terucap, eksitasi pada vocal tract lebih menyerupai noise derau. Gambar 2.4 menampilkan proses produksi suara-suara “a”, dan “f”. Untuk sementara perbedaan bentuk dan posisi pada organ artikulasi diabaikan saja. Gambar 2.4 Proses Produksi Suara Ucapan ‘a’ dan Ucapan ‘f’ Berbagai informasi yang dapat diperoleh dari suara yang berasal dari mulut manusia dapat dilihat pada Tabel 2.1 di bawah ini. Tabel 2.1 Informasi Suara No Informasi Suara 1 Identitas pengucap 2 Jenis kelamin No Informasi Suara 3 Usia 4 Tingkat Kejenuhan 5 Emosi 6 Jarak 7 Pengenalan kata 8 Kondisi kesehatan 9 Logat 10 Laju suara 11 Tingkat kebisingan 12 Kualitas bahasa Setiap ucapan yang dikeluarkan dari mulut manusia akan mengandung berbagai informasi seperti pada Tabel 2.2, baik itu disadari maupun tidak. Misalkan Wisnu mengucapkan kata “diam” kepada Arif dengan nada keras, maka kata “diam” tersebut dapat diklasifikasikan seperti dalam Tabel 2.2 [2]. Tabel 2.2 Jenis Klasifikasi Suara No Informasi Jenis KlasifikasiIdentifikasi 1 Identitas pengucap Wisnu 2 Jenis gender Pria 3 Usia 20-25 tahun 4 Ekspresiemosi Marah 5 Jarak sumber suara ± 5 meter 6 Pengenalan kata Diam 7 Dialeklogatsuku Jawa 8 Laju suara Cepat 9 Tingkat kebisingan 0,8 interval 0-1 10 Tingkat kejenuhan 0,6 interval 0-1 11 Kualitas bahasa Terdidik, pasaran, normal 12 Kondisi kesehatan Normal

2.2.1 Jenis Suara Manusia

Manusia memiliki ciri khas suara yang berbeda-beda. Ciri khas tersebut dibedakan melalui nilai fitur pitch dan formant. Jenis-jenis suara manusia ada yang tinggi, sedang, dan rendah. Dalam skripsi ini dilakukan penelitian hanya untuk suara tinggi dan rendah yang diantaranya suara pria tinggi tenor, suara pria rendah bass, suara wanita tinggi sopran, dan suara wanita rendah alto [19]. Berikut dijelaskan dalam Tabel 2.3 di bawah ini. Tabel 2.3 Jenis Suara Manusia Pria Wanita Tenor tinggi Bass rendah Sopran tinggi Alto rendah 130.81 Hz - 523.25 Hz 82.407 Hz - 329.63 Hz 261.63 Hz - 1046.5 Hz 174.61 Hz - 698.46 Hz

2.2.2 Pitch

Pitch merupakan frekuensi fundamental F dari sinyal suara yang merupakan hasil akustik kecepatan getaran pita suara. Semakin besar getaran pita suara, maka akan semakin tinggi nilai pitch. Periode pitch berkisar antara 10 sampai 20 milidetik. Setiap manusia mempunyai kisaran pitch tersendiri, tergantung dari pangkal tenggorok yang dimiliki. Kisaran pitch yang khas habitual pitch dimiliki oleh kebanyakan pria sebesar 50 Hz – 250 Hz, sedangkan wanita memiliki pitch habitual pitch yang lebih tinggi dibandingkan dengan pria, yaitu berkisar antara 120 Hz – 500 Hz. Frekuensi fundamental ini berubah secara konstan dan memberikan informasi linguistic seseorang seperti pembeda antara intonasi dan emosi. Pada pria ketika bersuara trakea dan laring pada tenggorokan membuka lebih lebar dibandingkan pada wanita. Ukuran pita suara pada pria berkisar antara 17.5 mm sampai 25 mm, sedangkan pada wanita ukuran pita suaranya berkisar antara 12.5 sampai 17.5 mm. Karena ukuran pita suara wanita lebih kecil, maka suara yang dihasilkan oleh wanita akan lebih tinggi [1][7].

2.2.3 Formant

Formant adalah frekuensi resonansi alami yang terjadi didalam rongga bidang suara, tergantung pada bentuk dan ukuran bidang suara dan lebih menyerupai gaung [1]. Frekuensi formant bersifat tidak terbatas namun, untuk mengidentifikasi seseorang paling tidak ada 3 tiga format yang dianalisa, yaitu formant 1 F 1 , formant 2 F 2 , dan formant 3 F 3 [3]. Formant pertama dan formant kedua berkaitan dengan posisi lidah ketika berbicara, sedangkan formant ketiga berpengaruh terhadap warna suara yang dihasilkan. Nilai formant pertama F 1 berkaitan dengan posisi lidah terhadap langit-langit rongga mulut. Semakin dekat lidah dengan langit-langit, maka frekuensi yang dihasilkan semakin kecil. Nilai formant kedua F 2 berkaitan dengan posisi lidah depan dan belakang. Nilai formant F 2 yang tinggi dihasilkan ketika posisi lidah berada di depan, jika posisi lidah berada di belakang, maka nilai formant kedua F 2 akan lebih kecil dibandingkan dengan yang posisi lidah di depan.

2.3 Kecerdasan Buatan

Kecerdasan buatan atau Artificial Intelligence AI merupakan cabang ilmu yang berusaha memahami kecerdasan manusia. AI berusaha membangun entitas-entitas cerdas yang sesuai dengan pemahaman manusia. Entitas-entitas cerdas yang dibangun AI ini ternyata sangat menarik dan mempercepat proses pemahaman terhadap kecerdasan manusia [13]. Stuart Russel dan Peter Norvig mengelompokan definisi AI ke dalam empat kategori, yaitu :

2.3.1 Thinking Humanly

Pendekatan ini dilakukan dengan dua cara, yaitu : 1. Melalui introspeksi : mencoba menangkap pemikiran kita sendiri pada saat berfikir. Tetapi seorang psikolog barat mengatakan “how do you know that you understand?” bagaimana anda tahu bagaimana anda mengerti? Karena pada saat anda menyadari pemikiran anda, ternyata pemikiran tersebut sudah lewat dan digantikan kesadaran anda. Sehingga definisi ini terkesan mengada-ada dan tidak mungkin dilakukan. 2. Melalui eksperimen psikologi

2.3.2 Acting Humanly

Pada tahun 1950, Alan Turing merancang suatu ujian bagi komputer berintelejensia untuk menguji apakah komputer tersebut mampu mengelabuhi seorang manusia yang menginterogasinya melalui teletype komunikasi berbasis teks jarak jauh.

2.3.3 Thinking Rationally

Terdapat dua masalah dalam pendekatan ini, yaitu : 1. Tidak mudah untuk membuat pengetahuan informasi informal dan menyatakan pengetahuan tersebut ke dalam formal term yang diperlukan oleh notasi logika, khususnya ketika pengetahuan tersebut memiliki kepastian kurang dari 100. 2. Terdapat perbedaan besar antara dapat memecahkan masalah “dalam prinsip” dan memecahkannya “dalam dunia nyata”.

2.3.4 Acting Rationally

Membuat inferensi yang logis merupakan bagian dari suatu rational agent. Hal ini disebabkan satu-satunya cara untuk melakukan aksi secara rasional adalah dengan menalar secara logis. Dengan menalar secara logis, maka bisa didapatkan kesimpulan bahwa aksi yang diberikan akan mencapai tujuan atau tidak. Jika mencapai tujuan, maka agent bisa melakukan aksi berdasarkan kesimpulan tersebut. Thinking humanly dan acting humanly adalah dua definisi dalam arti yang sangat luas. Sampai saat ini, pemikiran manusia yang diluar rasio, yakni refleks dan intuitif berhubungan dengan perasaan, belum dapat ditirukan sepenuhnya oleh komputer. Dengan demikian, kedua definisi ini dirasa kurang tepat untuk saat ini. Jika kita menggunakan definisi ini, maka banyak produk komputasi cerdas saat ini yang tidak layak disebut sebagai produk AI. 1. Definisi thinking rationally terasa lebih sempit daripada acting rationally. Oleh karena itu, definisi AI yang paling tepat untuk saat ini adalah acting rationally dengan pendekatan normal agent. Hal ini berdasarkan