Impuls tekanan pada umumnya disebut sebagai pitch impulses dan frekuensi sinyal tekanan adalah pitch frequency atau fundamental frequency. Pada
Gambar 2.2 sederetan impuls fungsi tekanan suara dihasikan oleh vocal cords untuk sebuah suara. Ini merupakan bagian dari sinyal voice suara yang
mendefinisikan speech melody melodi wicara. Ketika seseorang berbicara dengan sebuah frekuensi pitch konstan, suara sinyal wicara monotonous tetapi
dalam kasus normal sebuah perubahan permanen pada frekuensi terjadi. Ketika seseorang berbicara dengan frekuensi pitch constant, maka impuls pitch akan
terlihat seperti pada Gambar 2.2. Variasi frekuensi pitch dapat dilihat seperti yang terlihat pada Gambar 2.3 di bawah ini.
Gambar 2.2 Sederet Impuls yang sama
Gambar 2.3 Variasi Frekuensi
Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu nasals juga merangsang nasal cavity rongga hidung. Ketika rongga
beresonansi, akan menimbulkan radiasi sebuah gelombang suara yang mana
merupakan sinyal wicara. Kedua rongga beraksi sebagai resonators dengan karakteristik frekuensi resonansi masing-masing, yang disebut
formant frequencies. Pada saat rongga mulut dapat mengalami perubahan besar, manusia
mampu untuk menghasilkan beragam pola ucapan suara yang berbeda. Mampu pula untuk menghasilkan beragam pola ucapan suara yang berbeda.
Di dalam kasus unvoiced sounds suara tak terucap, eksitasi pada vocal tract lebih menyerupai noise derau. Gambar 2.4 menampilkan proses produksi
suara-suara “a”, dan “f”. Untuk sementara perbedaan bentuk dan posisi pada organ artikulasi diabaikan saja.
Gambar 2.4 Proses Produksi Suara Ucapan ‘a’ dan Ucapan ‘f’
Berbagai informasi yang dapat diperoleh dari suara yang berasal dari mulut manusia dapat dilihat pada Tabel 2.1 di bawah ini.
Tabel 2.1 Informasi Suara
No Informasi Suara
1 Identitas pengucap
2 Jenis kelamin
No Informasi Suara
3 Usia
4 Tingkat Kejenuhan
5 Emosi
6 Jarak
7 Pengenalan kata
8 Kondisi kesehatan
9 Logat
10 Laju suara
11 Tingkat kebisingan
12 Kualitas bahasa
Setiap ucapan yang dikeluarkan dari mulut manusia akan mengandung berbagai informasi seperti pada Tabel 2.2, baik itu disadari maupun tidak.
Misalkan Wisnu mengucapkan kata “diam” kepada Arif dengan nada keras, maka
kata “diam” tersebut dapat diklasifikasikan seperti dalam Tabel 2.2 [2]. Tabel 2.2 Jenis Klasifikasi Suara
No Informasi
Jenis KlasifikasiIdentifikasi
1 Identitas pengucap
Wisnu 2
Jenis gender Pria
3 Usia
20-25 tahun 4
Ekspresiemosi Marah
5 Jarak sumber suara
± 5 meter 6
Pengenalan kata Diam
7 Dialeklogatsuku
Jawa 8
Laju suara Cepat
9 Tingkat kebisingan
0,8 interval 0-1 10
Tingkat kejenuhan 0,6 interval 0-1
11 Kualitas bahasa
Terdidik, pasaran, normal 12
Kondisi kesehatan Normal
2.2.1 Jenis Suara Manusia
Manusia memiliki ciri khas suara yang berbeda-beda. Ciri khas tersebut dibedakan melalui nilai fitur pitch dan formant. Jenis-jenis suara manusia ada
yang tinggi, sedang, dan rendah. Dalam skripsi ini dilakukan penelitian hanya untuk suara tinggi dan rendah yang diantaranya suara pria tinggi tenor, suara
pria rendah bass, suara wanita tinggi sopran, dan suara wanita rendah alto
[19]. Berikut dijelaskan dalam Tabel 2.3 di bawah ini. Tabel 2.3 Jenis Suara Manusia
Pria Wanita
Tenor tinggi Bass rendah
Sopran tinggi Alto rendah
130.81 Hz - 523.25 Hz
82.407 Hz - 329.63 Hz
261.63 Hz - 1046.5 Hz
174.61 Hz - 698.46 Hz
2.2.2 Pitch
Pitch merupakan frekuensi fundamental F dari sinyal suara yang
merupakan hasil akustik kecepatan getaran pita suara. Semakin besar getaran pita suara, maka akan semakin tinggi nilai pitch. Periode pitch berkisar antara 10
sampai 20 milidetik. Setiap manusia mempunyai kisaran pitch tersendiri, tergantung dari pangkal tenggorok yang dimiliki. Kisaran pitch yang khas
habitual pitch dimiliki oleh kebanyakan pria sebesar 50 Hz – 250 Hz, sedangkan wanita memiliki pitch habitual pitch yang lebih tinggi dibandingkan dengan
pria, yaitu berkisar antara 120 Hz – 500 Hz. Frekuensi fundamental ini berubah secara konstan dan memberikan informasi linguistic seseorang seperti pembeda
antara intonasi dan emosi. Pada pria ketika bersuara trakea dan laring pada tenggorokan membuka
lebih lebar dibandingkan pada wanita. Ukuran pita suara pada pria berkisar antara 17.5 mm sampai 25 mm, sedangkan pada wanita ukuran pita suaranya berkisar
antara 12.5 sampai 17.5 mm. Karena ukuran pita suara wanita lebih kecil, maka
suara yang dihasilkan oleh wanita akan lebih tinggi [1][7].
2.2.3 Formant
Formant adalah frekuensi resonansi alami yang terjadi didalam rongga bidang suara, tergantung pada bentuk dan ukuran bidang suara dan lebih
menyerupai gaung [1]. Frekuensi formant bersifat tidak terbatas namun, untuk
mengidentifikasi seseorang paling tidak ada 3 tiga format yang dianalisa, yaitu formant 1 F
1
, formant 2 F
2
, dan formant 3 F
3
[3]. Formant pertama dan
formant kedua berkaitan dengan posisi lidah ketika berbicara, sedangkan formant ketiga berpengaruh terhadap warna suara yang dihasilkan. Nilai formant pertama
F
1
berkaitan dengan posisi lidah terhadap langit-langit rongga mulut. Semakin dekat lidah dengan langit-langit, maka frekuensi yang dihasilkan semakin kecil.
Nilai formant kedua F
2
berkaitan dengan posisi lidah depan dan belakang. Nilai formant F
2
yang tinggi dihasilkan ketika posisi lidah berada di depan, jika posisi lidah berada di belakang, maka nilai formant kedua F
2
akan lebih kecil dibandingkan dengan yang posisi lidah di depan.
2.3 Kecerdasan Buatan
Kecerdasan buatan atau Artificial Intelligence AI merupakan cabang ilmu yang berusaha memahami kecerdasan manusia. AI berusaha membangun
entitas-entitas cerdas yang sesuai dengan pemahaman manusia. Entitas-entitas cerdas yang dibangun AI ini ternyata sangat menarik dan mempercepat proses
pemahaman terhadap kecerdasan manusia [13]. Stuart Russel dan Peter Norvig
mengelompokan definisi AI ke dalam empat kategori, yaitu :
2.3.1 Thinking Humanly
Pendekatan ini dilakukan dengan dua cara, yaitu : 1. Melalui introspeksi : mencoba menangkap pemikiran kita sendiri pada
saat berfikir. Tetapi seorang psikolog barat mengatakan “how do you know that you understand?” bagaimana anda tahu bagaimana anda
mengerti? Karena pada saat anda menyadari pemikiran anda, ternyata pemikiran tersebut sudah lewat dan digantikan kesadaran anda.
Sehingga definisi ini terkesan mengada-ada dan tidak mungkin dilakukan.
2. Melalui eksperimen psikologi
2.3.2 Acting Humanly
Pada tahun 1950, Alan Turing merancang suatu ujian bagi komputer berintelejensia untuk menguji apakah komputer tersebut mampu mengelabuhi
seorang manusia yang menginterogasinya melalui teletype komunikasi berbasis teks jarak jauh.
2.3.3 Thinking Rationally
Terdapat dua masalah dalam pendekatan ini, yaitu : 1. Tidak mudah untuk membuat pengetahuan informasi informal dan
menyatakan pengetahuan tersebut ke dalam formal term yang diperlukan oleh notasi logika, khususnya ketika pengetahuan tersebut
memiliki kepastian kurang dari 100. 2. Terdapat perbedaan besar antara dapat memecahkan masalah “dalam
prinsip” dan memecahkannya “dalam dunia nyata”.
2.3.4 Acting Rationally
Membuat inferensi yang logis merupakan bagian dari suatu rational agent. Hal ini disebabkan satu-satunya cara untuk melakukan aksi secara rasional adalah
dengan menalar secara logis. Dengan menalar secara logis, maka bisa didapatkan kesimpulan bahwa aksi yang diberikan akan mencapai tujuan atau tidak. Jika
mencapai tujuan, maka agent bisa melakukan aksi berdasarkan kesimpulan tersebut.
Thinking humanly dan acting humanly adalah dua definisi dalam arti yang sangat luas. Sampai saat ini, pemikiran manusia yang diluar rasio, yakni refleks
dan intuitif berhubungan dengan perasaan, belum dapat ditirukan sepenuhnya oleh komputer. Dengan demikian, kedua definisi ini dirasa kurang tepat untuk saat
ini. Jika kita menggunakan definisi ini, maka banyak produk komputasi cerdas saat ini yang tidak layak disebut sebagai produk AI.
1. Definisi thinking rationally terasa lebih sempit daripada acting rationally. Oleh karena itu, definisi AI yang paling tepat untuk saat ini adalah acting
rationally dengan pendekatan normal agent. Hal ini berdasarkan