Teori bahasa dan otomata
I. PENDAHULUAN
♦ Komputer digunakan sebagai alat bantu untuk menyelesaikan pekerjaan(task). Dua pertanyaan yang seringkali muncul sehubungan dengan pekerjaan tersebut adalah :
1. Dapatkah pekerjaan tersebut dilaksanakan oleh komputer?
2. Bila jawabannya dapat, bagaimana cara komputer melaksanakan pekerjaan tersebut?
Model komputasi berguna untuk menjawab kedua pertanyaan tersebut diatas. ♦ Terdapat tiga jenis struktur yang digunakan dalam model komputasi :
1. Grammar (tata bahasa)
Digunakan untuk membangkitkan kalimat dari suatu bahasa dan untuk memeriksa apakah suatu kalimat termasuk di dalam bahasa tersebut.
2. Finite State Machine(FSM)
Digunakan untuk mengenali kalimat dari suatu bahasa dan untuk menghasilkan keluaran sesuai dengan spesifikasi yang digunakan.
Konsep tatabahasa dan FSM keduanya saling berkaitan, dan antara keduanya dapat saling ditransformasikan satu sama lain.
3. Mesin Turing
Merupakan pengenal bahasa yang lebih kompleks, yang dalam pengenalannya mesin ini dilengkapi dengan memori. Mesin turing dapat mengenali kalimat yang tidak dapat dikenali oleh FSM sekalipun. Mesin turing adalah model komputasi yang paling umum serta dapat melakukan pekerjaan apa saja yang dapat dilaksanakan oleh komputer.
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
DOSEN: Mira Kania S.,ST.,MT
Utami Dewi W.,S.Kom
IF
(2)
I.1. Bahasa Alami dan Bahasa Formal
♦ Menurut kamus Webster, bahasa adalah ”the body of words and methods of combining words used and understood by a considerable community”. ♦ Sedangkan menurut Kamus Besar Bahasa Indonesia(KBBI), bahasa adalah
:
1. Sistem lambang bunyi berartikulasi (yang dihasilkan oleh alat-alat ucap) yang bersifat sewenang-wenang dan konvensional yang dipakai sebagai alat komunikasi untuk melahirkan perasaan dan pikiran.
2. Perkataan-perkataan yang dipakai oleh suatu bangsa.
♦ Menurut kedua definisi diatas, ungkapan dari suatu bahasa adalah kalimat atau perkataan. Kalimat dalam sebuah bahasa dibentuk dengan menggabungkan satu atau lebih kata-kata.
♦ Dalam pembentukan kalimat, perhatian tertuju pada sintaks dan bentuk kalimat, bukan pada semantik atau makna kalimatnya. Sebagai contoh :
Elang menyambar ayam Adik makan dengan lahap
Adalah kalimat yang sah sesuai dengan kaidah tata bahasa dari Bahasa Indonesia. Contoh kalimat berikut :
Rudi menggigit anjing
Juga benar secara sintaks meskipun maknanya secara sense tidak ada. Sedangkan kalimat berikut :
dengan cepat ayah matematika menutup bukan kalimat yang sah secara sintaks karena tidak mengikuti kaidah tata bahasa.
♦ Bahasa Alami adalah bahasa komunikasi yang digunakan oleh manusia, yaitu bahasa ucap seperti Bahasa Indonesia, Inggris, dll. Sintaks bahasa alami sangat rumit dan kita tidak mungkin menspesifikasikan semua aturan sintaksnya.
♦ Bahasa Formal adalah bahasa yang kaidah sintaksnya dapat dispesifikasikan secara matematis dengan baik. Kaidah bahasa dalam teori bahasa formal tidak hanya bermanfaat untuk studi linguistik bahasa alami
(3)
seperti penterjemahan secara otomatis dari suatu bahasa ke bahasa lain, tetapi juga berguna untuk studi bahasa pemrograman.
I.2. Alfabet, String, dan Bahasa
♦ Di dalam teori bahasa formal, bahasa didefinisikan secara matematis. Sebelum membahas lebih lanjut mengenai definisi bahasa, kita harus mengerti beberapa terminologi(istilah) yang digunakan disini.
♦ Alfabet (adalah vocabulary) adalah himpunan terbatas simbol. Contoh :
a. Alfabet Latin {A, B, C, .., Z) b. Alfabet Yunani {α, , ,..,ω} c. Alfabet Biner, {0,1}
♦ String adalah barisan(sequence) yang disusun oleh simbol-simbol alfabet. Sebuah string dengan panjang n (n >= 1) yang dibentuk dari alfabet A disusun oleh barisan n simbol :
a1a2a3,..an, aI Є A istilah lain untuk string adalah kalimat atau word.
o Panjang string x dituliskan sebagai ІxІ. String kosong (null string atau empty sentence (ε)) adalah barisan simbol dengan panjang 0 dan tidak berisi simbol apapun.
o Jika A adalah alfabet, maka An menyatakan himpunan semua string dengan panjang n yang dibentuk dari himpunan A.
o A* adalah himpunan semua rangkaian simbol dari himpunan A yang terdiri dari 0 simbol (string kosong), satu simbol, dua simbol, tiga simbol,.., atau dinyatakan sebagai :
A* = A0 U A1 U A2 U...
Himpunan A* disebut transitive closure atau Kleen Closure. o A+ ( positive closure ) untuk menyatakan himpunan V* - Є. Jadi,
A+ diperoleh dari A* dengan mengeluarkan string kosong, atau : A+ = A1 U A2 U A3 U...
(4)
o Contoh :
Misalkan A={0,1} adalah sebuah alphabet yang disusun dari simbol 0 dan 1. Maka A* :
A0={ ε } A1={ 0,1 }
A2={ 00,01,10,11 }, dan seterusnya Apabila A+ :
A1={ 0,1 }
A2={ 00,01,10,11 }, dan seterusnya
♦ Definisi bahasa(language)
Jika A adalah alfabet, maka bahasa (pada alfabet A) adalah bagian dari dari himpunan A*. Sebagai contoh, misalkan {a,b,c}, maka himpunan-himpunan berikut ini merupakan bahasa pada alfabet A :
L1 = {a, aa, bc, ac, abc, cab} L2 = {aba, aabaa}
L3 = { }
L4 = {aicbi І i>=1}
(Keterangan : pada L4 ai berarti barisan i buah a. Jadi aicbi berarti kalimat yang disusun oleh i buah a diikuti dengan c, diikuti dengan i buah b)
I.3 Tata Bahasa
Jika diberikan spesifikasi suatu bahasa, ada dua masalah utama yang berkaitan dengan masalah tersebut :
1. Bagaimana membangkitkan satu atau lebih kalimat didalam bahasa tersebut ?
Masalah pembangkitan (Generation)
2. Bagaimana menentukan apakah suatu kalimat termasuk di dalam bahasa tersebut atau tidak?
(5)
Aturan yang digunakan untuk membangkitkan atau mengenali kalimat di dalam suatu bahasa dinamakan tata bahasa(grammar).
Contoh : Tata bahasa dibawah ini adalah sebagian dari tata bahasa untuk membangkitkan atau mengenali kalimat di dalam Bahasa Inggris :
1. Sebuah sentence dibentuk dari noun phrase diikuti dengan verb phrase. 2. Sebuah sentence dibentuk dari noun phrase diikuti dengan verb phrase dan
noun phrase. 3. dll
Kita dapat menuliskan semua kaidah tata bahasa di atas secara ringkas sebagai berikut :
<sentence> → <noun phrase> <verb phrase>
<sentence> → <noun phrase> <verb phrase> <noun phrase> <noun phrase> → <adjective><noun phrase>
<noun phrase> → <adjective><singular noun > <verb phrase > → <singular verb> <adverb> <verb phrase > → <singular verb>
<adjective> → the <adjective> → a <adjective> → little <singular noun> → boy <singular noun> → dog <singular verb> → runs <singular verb> → bites <adverb> → quickly
Tanda panah (→) pada kaidah di atas menyatakan bahwa item di sebelah kiri panah dapat diganti dengan item di sebelah kanan panah.
Proses pembangkitan kalimat the little boy runs quickly dapat diturunkan sebagai berikut :
<sentence> → <noun phrase> <verb phrase> → <adjective> <noun phrase> <verb phrase>
(6)
→ the <noun phrase> <verb phrase>
→ the <adjective> <singular noun > <verb phrase> → the little <singular noun > <verb phrase>
→ the little boy <verb phrase>
→ the little boy <singular verb> <adverb> → the little boy runs <adverb>
→ the little boy runs quickly
Proses pembangkitan kalimat diatas juga dapat digambarkan dalam suatu diagram pohon- yang disebut pohon parsing.
Unsur-unsur tata bahasa :
Secara formal, suatu tata bahasa terdiri dari empat unsur : 1. Himpunan berhingga terminal T
2. Himpunan berhingga non –terminal N 3. Himpunan berhingga aturan produksi P
4. Simbol awal S
є
N Penjelasan :
1. Simbol terminal didalam T adalah symbol yang dapat digunakan untuk membuat kalimat/string di dalam bahasa itu. Simbol terminal biasanya dilambangkan dengan huruf kecil, seperti a,b,c,… atau angka 0,1,..
Contoh : T = {a,b,c}
2. Simbol non terminal di dalam N adalah lambang antara yang digunakan untuk mendeskripsikan struktur kalimat. Simbol non-terminal biasanya dilambangkan dengan hruf besar, seperti A,B,C,..
Contoh : N = {S,A,B}
3. Produksi adalah kaidah/aturan tata bahasa yang mengatur cara pembentukan kalimat di dalam bahasa.
Setiap aturan dituliskan dalam bentuk :
α
→
β
yang dalam hal ini, α dan β adalah string yang dibentuk dari himpunan T U N, dan α harus berisi paling sedikit satu simbol non-terminal.
(7)
4. Simbol awal adalah simbol non-terminal khusus yang mengawali pembangkitan kalimat di dalam bahasa tersebut.
Keempat unsur tata bahasa tersebut sering dilambangkan dengan : G = (T,N,P,S)
Bahasa yang dihasilkan oleh G ditulis sebagai L(G), yaitu himpunan string yang dapat diturunkan dan simbol awal S dengan menerapkan aturan produksi yang terdapat di dalam P.
Contoh :
Tinjau tata bahasa G = (T,N,P,S), dengan T={a,b}, N={S,A}, P={S→aA,S→b, A→aa}
Apakah L(G) dari Tata bahasa G ?
Dengan mencoba semua aturan produksi dari simbol awal S sebagai berikut : ( i ) S → aA
→ aaa ( i ) S → b
maka hanya terdapat dua string yang dapat dibangkitkan, yaitu b dan aaa, tidak ada yang lain. Jadi L(G) = {b, aaa}.
1.4 Kelas Tata Bahasa dan kelasa Bahasa
♦ Berdasarkan bentuk aturan produksi α→ , tata bahasa formal dibagi ke dalam empat kelas (jenis). Keempat kelas itu disebut juga dengan Hirarki Chomsky, sebagaimana diklasifikasikan oleh Noam Chomsky.
♦ Kelas bahasa ditentukan oleh kelas bahasanya. Jadi, bahasa kelas i adalah bahasa yang dapat dispesifikasi oleh tata bahasa kelas i.
♦ Di dalam pembahasan berikut, kita menggunakan A dan B untuk menyatakan non-terminal, a dan b untuk menyatakan terminal, dan α dan untuk menyatakan string yang dibentuk dari simbol terminal dan simbol non terminal.
♦ Keempat kelas tata bahasa tersebut adalah sebagai berikut : 1. Kelas tata bahasa regular (regular grammar)
(8)
♦ Merupakan kelas tata bahasa jenis-3. Kelas ini dicirikan jika semua aturan produksinya berbentuk :
α→
dimana : α Є N, Є T U N dengan ketentuan sebagai berupa terminal atau sebuah terminal diikuti dengan sebuah non-terminal. Contoh : A
→ a ; A → aA
♦ Bahasa yang dispesifikasi oleh tata bahasa ini disebut bahasa regular (regular language)
♦ Mesin yang mengenal bahasa regular adalah Finite State Automata. 2. Kelas tata bahasa bebas konteks (context free grammar)
♦ Merupakan kelas tata bahasa jenis-2. Kelas ini dicirikan jika semua aturan produksinya berbentuk :
α→
dimana :
αЄ N, dengan ketentuan sebuah non-terminal
Є T U N.
ІαІ <= І І
♦ Contoh : A → aBB ; A → aA ; B→bA
♦ Mesin yang mengenal bahasa bebas konteks adalah Push Down Automata (PDA).
3. Kelas tata bahasa peka-konteks (context sensitive grammar)
♦ Merupakan kelas tata bahasa jenis-1. Kelas ini dicirikan jika semua aturan produksinya berbentuk :
α→
dimana :
αЄ T U N
Є T U N
ІαІ <= І І
♦ Contoh : S → aSBC ; S → aBC ; CB→BC ; bB→bb ; bC→bc; cC→cc
(9)
♦ Mesin yang mengenal bahasa peka-konteks adalah Linear Bounded Automata (LBA).
4. Kelas tata bahasa tanpa-pembatasan (urestricted grammar)
Merupakan kelas tata bahasa jenis-0. Kelas ini tidak memiliki pembatasan untuk aturan produksinya
♦ Contoh : aS → aSBC ; S → aBC ; CbB→BC ; bB→bb ; bC→bc; cC→ccB
♦ Mesin yang mengenal bahasa tanpa-pembatasan adalah Mesin Turing (Turing Machine).
(10)
LATIHAN
1. Pilihlah dari sekian aturan produksi dibawah ini kedalam level-level bahasa yang ada:
a. E Æ fgH b. E Æ HgB c. EF Æ a d. AÆ aeGab e. Abc Æ dEF f. D Æ Ddd g. A Æ AAA h. FGH Æ abc
(11)
I.3 Tata Bahasa
Jika diberikan spesifikasi suatu bahasa, ada dua masalah utama yang berkaitan dengan masalah tersebut :
1. Bagaimana membangkitkan satu atau lebih kalimat didalam bahasa tersebut ?
Masalah pembangkitan (Generation)
2. Bagaimana menentukan apakah suatu kalimat termasuk di dalam bahasa tersebut atau tidak?
Masalah Pengenalan (Recognition)
Aturan yang digunakan untuk membangkitkan atau mengenali kalimat di dalam suatu bahasa dinamakan tata bahasa(grammar).
Contoh : Tata bahasa dibawah ini adalah sebagian dari tata bahasa untuk membangkitkan atau mengenali kalimat di dalam Bahasa Inggris : 1. Sebuah sentence dibentuk dari noun phrase diikuti dengan verb
phrase.
2. Sebuah sentence dibentuk dari noun phrase diikuti dengan verb phrase dan noun phrase.
3. dll
Kita dapat menuliskan semua kaidah tata bahasa di atas secara ringkas sebagai berikut :
<sentence> → <noun phrase> <verb phrase>
<sentence> → <noun phrase> <verb phrase> <noun phrase> <noun phrase> → <adjective><noun phrase>
<noun phrase> → <adjective><singular noun > <verb phrase > → <singular verb> <adverb> <verb phrase > → <singular verb>
<adjective> → the <adjective> → a <adjective> → little
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
PENDAHULUAN
LANJUTAN
(12)
<singular noun> → boy <singular noun> → dog <singular verb> → runs <singular verb> → bites <adverb> → quickly
Tanda panah (→) pada kaidah di atas menyatakan bahwa item di sebelah kiri panah dapat diganti dengan item di sebelah kanan panah.
Proses pembangkitan kalimat the little boy runs quickly dapat diturunkan sebagai berikut :
<sentence> → <noun phrase> <verb phrase>
→ <adjective> <noun phrase> <verb phrase>
→ the <noun phrase> <verb phrase>
→ the <adjective> <singular noun > <verb phrase>
→ the little <singular noun > <verb phrase>
→ the little boy <verb phrase>
→ the little boy <singular verb> <adverb>
→ the little boy runs <adverb>
→ the little boy runs quickly
Proses pembangkitan kaliamat diatas juga dapat digambarkan dalam suatu diagram pohon- yang disebut pohon parsing.
Unsur-unsur tata bahasa :
Secara formal, suatu tata bahasa terdiri dari empat unsur : 1. Himpunan berhingga terminal T
2. Himpunan berhingga non –terminal N
3. Himpunan berhingga aturan produksi P
4. Simbol awal S
є
N Penjelasan :
1. Simbol terminal didalam T adalah symbol yang dapat digunakan untuk membuat kalimat/string di dalam bahasa itu. Simbol terminal biasanya dilambangkan dengan huruf kecil, seperti a,b,c,… atau angka 0,1,..
(13)
Contoh : T = {a,b,c}
2. Simbol non terminal di dalam N adalah lambang antara yang digunakan untuk mendeskripsikan struktur kalimat. Simbol non-terminal biasanya dilambangkan dengan hruf besar, seperti A,B,C,.. Contoh : N = {S,A,B}
3. Produksi adalah kaidah/aturan tata bahasa yang mengatur cara pembentukan kalimat di dalam bahasa.
Setiap aturan dituliskan dalam bentuk :
α
→
β
yang dalam hal ini, α dan β adalah string yang dibentuk dari himpunan T U N, dan α harus berisi paling sedikit satu simbol non-terminal.
4. Simbol awal adalah simbol non-terminal khusus yang mengawali pembangkitan kalimat di dalam bahasa tersebut.
Keempat unsur tata bahasa tersebut sering dilambangkan dengan : G = (T,N,P,S)
Bahasa yang dihasilkan oleh G ditulis sebagai L(G), yaitu himpunan string yang dapat diturunkan dan simbol awal S dengan menerapkan aturan produksi yang terdapat di dalam P.
Contoh :
Tinjau tata bahasa G = (T,N,P,S), dengan T={a,b}, N={S,A}, P={S→aA,S→b, S→aa}
Apakah L(G) dari Tata bahasa G ?
Dengan mencoba semua aturan produksi dari simbol awal S sebagai berikut :
( i ) S → aA → aaa
( i ) S → b
maka hanya terdapat dua string yang dapat dibangkitkan, yaitu b dan aaa, tidak ada yang lain. Jadi L(G) = {b, aaa}.
(14)
(15)
I.1 Pengelompokan Bahasa
Tata Bahasa (grammer) bisa didefinisikan secara formal sebagai kumpulan dari
himpunan-himpunan variabel, simbol-simbol terminal, simbol awal, yang dibatasi oleh
aturan-aturan produksi. Pada tahun 1959 seorang ahli bernama Noam Chomsky
melakukan pengelompokkan tingkatan bahasa menjadi empat, yang disebut dengan
Hirarki chomsky. Pengelompokkan tersebut dapat dilihat pada tabel berikut :
Bahasa Mesin Automata Aturan Produksi
Regular (Tipe 3) FSA meliputi DFA, NFA α adalah sebuah simbol variabel.
β maksimal memiliki sebuah simbol variabel yang bila ada terletak diposisi paling kanan.
Bebas Konteks (Tipe 2)
Push Down Automata α berupa sebuah simbol variable
Context Sensitive (Tipe 1)
Linear Bounded Automata | α | ≤ | β | Natural Language
(Tipe 0)
Mesin Turing Tidak ada batasan
Disini semua aturan produksi dalam bentuk α Æ β ( ‘dibaca α menghasilkan β’ ), dimana : α menyatakan simbol-simbol pada ruas kiri aturan produksi dan β menyatakan simbol-simbol pada ruas kanan aturan produksi (atau hasil produksi). Simbol-simbol
tersebut dapat berupa simbol terminal (non variabel) atau simbol variabel. Simbol
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
DOSEN: Mira Kania S.,S.T.,MT
Utami Dewi W.,S.Kom
IF
BAB I
(16)
terminal adalah simbol-simbol yang tidak dapat diturunkan kembali, sedangkan simbol
variabel adalah simbol yang masih bisa diturunkan kembali. Dalam penulisannya,
simbol-simbol variabel digunakan huruf kapital (‘A’, ‘B’ dll), sedangkan simbol-simbol
terminal digunakan huruf kecil (‘a’, ‘b’, dll).
I.2 Level-level Bahasa
Dalam hirarki chomsky, terdapat empat level bahasa yaitu level 0 (Natural Language),
level 1 (Contex sensitive), level 2 (Bebas Konteks), dan level 3 (Regular). Dari setiap
level tersebut terdapat aturan-aturan produksi yang membatasinya. Contoh-contoh aturan
produksi untuk setiap level bahasa :
1. Level 0 (Natural Language)
Bahasa manusia termasuk kedalam tipe ini, dimana tidak ada batasan untuk aturan
produksinya.
Contoh :
a. Abc Æ aa b. Bc Æ aBaB c. CaB Æ aaBaaBa 2. Level 1 (Contex sensitive)
Panjang string di ruas kiri (α) ≤ panjang string ruas kanan (β ). Contoh :
a. Ab Æ aBa b. cD Æ aB c. dEd Æ FabCa
(17)
3. Level 2 (Bebas Konteks)
α adalah sebuah simbol variabel, dan batasannya bertambah bahwa ruas kiri harus tetap satu simbol variabel.
Contoh :
a. A Æ aa b. B Æ aBD c. C Æ FGaa 4. Level 3 (Regular)
Batasannya bertambah lagi, dimana ruas kanan maksimal memiliki sebuah simbol
variabel yang terletak paling kanan. Artinya bisa memiliki simbol terminal dengan
jumlah tidak dibatasi, tetapi bila terdapat simbol variabel maka simbol variabel
tersebut hanya berjumlah satu (1) dan terletak paling kanan.
Contoh :
a. A Æ aa b. B Æ aaB c. C Æ aaaaa
(18)
Latihan 1
1. Pilihlah dari sekian aturan produksi dibawah ini kedalam level-level bahasa yang ada:
a. E Æ fgH b. E Æ HgB c. EF Æ a d. AÆ aeGab e. Abc Æ dEF f. D Æ Ddd g. A Æ AAA h. FGH Æ abc
(19)
Teknik penurunan yang dipelajari dalam TBA yaitu ada tiga (3), diantaranya : penurunan
dari paling kiri, penurunan dari paling kanan, dan penurunan pohon. Dari ketiga teknik
penurunan ini dapat digunakan untuk membuktikan suatu string atau karakter apakah
diterima atau ditolak oleh suatu aturan produksi atau suatu tata bahasa. Untuk dapat lebih
memahami lebih dalam lagi, berikut ini adalah aturan produksi untuk suatu kalkulator
sederhana yang dapat diaplikasikan untuk ketiga teknik penurunan tersebut.
ATURAN PRODUKSI KALKULATOR SEDERHANA
E Æ E + T | E – T | T
T Æ T + F | T – F | F
F Æ (E) | D
D Æ 0 | 1 | 2 | 3 | … | 9 |
0D | 1D | 2D | 3D | …| 9D
II.1 Penurunan dari Paling Kiri
Dalam teknik penurunan dari paling kiri, simbol-simbol terminal yang terbentuk diawali
dari posisi paling kiri kemudian bergeser ke simbol sebelah kanannya. Jadi dalam
penurunan dari paling kiri ini, simbol-simbol terminal diproduksi dahulu dari posisi yang
paling kiri kemudian bergeser sampai dengan posisi paling kanan.
Contoh 1 Apakah string : ‘ 2 + 5 – 1 ‘ diterima oleh aturan produksi kalkulator
sederhana?
Bukti : E Æ E – T
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB II
(20)
E Æ E + T – T
E Æ T + T – T
E Æ F + T – T
E Æ D + T – T
E Æ 2 + T – T
E Æ 2 + F – T
E Æ 2 + D – T
E Æ 2 + 5 – T
E Æ 2 + 5 – F
E Æ 2 + 5 – D
E Æ 2 + 5 – 1
Jadi string ‘2 + 5 - 1’ diterima !
Keterangan :
1. Perhatikan : string yang pertama di hasilkan yaitu ‘2’ diposisi paling kiri.
Selanjutnya bergeser ke string ‘5’ dan terakhir string ‘1’.
2. Setiap baris aturan produksi yang berubah ada tepat satu dan hanya satu perubahan.
3. Tidak boleh lebih dari satu perubahan dalam setiap baris tahap perubahannya.
II.2
Penurunan dari Paling Kanan
Dalam teknik penurunan dari paling kanan, simbol-simbol terminal yang terbentuk
diawali dari posisi paling kanan kemudian bergeser ke simbol sebelah kirinya. Jadi dalam
penurunan dari paling kanan ini, simbol-simbol terminal diproduksi dahulu dari posisi
(21)
Contoh 2 Apakah string : ‘ 2 + 5 – 1 ‘ diterima oleh aturan produksi kalkulator
sederhana?
Bukti : E Æ E – T
E Æ E – F
E Æ E – D
E Æ E – 1
E Æ E + T – 1
E Æ E + F – 1
E Æ E + D – 1
E Æ E + 5 – 1
E Æ T + 5 – 1
E Æ F + 5 – 1
E Æ D + 5 – 1
E Æ 2 + 5 – 1
Jadi string ‘2 + 5 - 1’ diterima !
Perhatikan : string yang pertama di hasilkan yaitu ‘1’ diposisi paling kanan. Selanjutnya
bergeser ke string ‘5’ dan terakhir string ‘2’.
II.3
Penurunan Pohon
Dalam teknik penurunan pohon, simbol-simbol terminal yang terbentuk diawali dari
posisi paling kanan kemudian bergeser ke simbol sebelah kirinya atau simbol-simbol
terminal yang terbentuk diawali dari posisi paling kiri kemudian bergeser ke simbol
(22)
menggunakan patokan penurunan dari paling kiri, kana, atau gabungan dari kedua teknik
tersebut.
Contoh 3 Apakah string : ‘ 2 + 5 – 1 ‘ diterima oleh aturan produksi kalkulator
sederhana?
Bukti :
Jadi string ‘2 + 5 - 1’ diterima ! 1 F E
E – T
E
E + T
F
D
T
F
D
2
D
(23)
Latihan 2
1. Buktikan dengan teknik penurunan dari paling kiri untuk string-string berikut,
apakah diterima atau ditolak oleh aturan produksi kalkulator sederhana :
a. 1 – 3 + 6 b. ( 9 – 3 ) * 5
c. ( 4 ÷ 2 ) + 8 d. ( 5 + 2 ) ÷ ( 7 * 2 )
2. Buktikan dengan teknik penurunan dari paling kiri untuk string-string berikut,
apakah diterima atau ditolak oleh aturan produksi kalkulator sederhana :
a. 7 – 3 + 9 b. ( 2 – 6 ) * 3
c. ( 6 ÷ 2 ) + 1 d. ( 7 + 8 ) ÷ ( 4 * 1 )
3. Buktikan dengan teknik penurunan dari paling kiri untuk string-string berikut,
apakah diterima atau ditolak oleh aturan produksi kalkulator sederhana :
a. 8 – 5 + 2 b. ( 4 – 5 ) * 2
(24)
Finite state automata (FSA) bukanlah mesin fisik tetapi suatu model matematika dari suatu sistem yang menerima input dan output. FSA merupakan mesin automata dari bahasa regular (tipe 3). Suatu FSA memiliki state yang banyaknya berhingga, dan dapat berpindah dari suatu state ke state lain. Perubahan state dinyatakan oleh fungsi transisi. Suatu FSA secara formal dinyatakan oleh 5 (lima) tupel M = (Q, Σ, δ, S, F) dimana : Q = Himpunan state / kedudukan
Σ = Himpunan simbol input / masukan
δ = Fungsi transisi
S = State awal / kedudukan awal F = Himpunan state akhir
FSA berdasar pada pendefinisian kemampuan berubah state-statenya bisa dikelompokkan kedalam Deterministic Finite Automata dan Non Deterministic Finite Automata.
III.1 Deterministic Finite Automata (DFA)
Pada DFA dari suatu state ada tepat satu state berikutnya untuk setiap simbol input (masukan) yang di terima.
Contoh 1
Konfigurasi DFA contoh 1 secara formal adalah sebagai berikut : Q = {q0, q1, q2}
Σ = {a, b}
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB III
FINITE STATE AUTOMATA
a
q0 b q1
a b
q2 a
(25)
S = q0 F = {q2}
Fungsi-fungsi transisinya sebagai berikut :
δ (q0, a) = q0, δ (q0, b) = q1,
δ (q1, a) = q1, δ (q1, b) = q2,
δ (q2, a) = q1, δ (q2, b) = q2. Jika disajikan dalam tabel transisi :
δ a b
q0 q0 q1
q1 q1 q2
q2 q1 q2
* Dalam DFA, selalu dan pasti terdapat satu state berikutnya untuk setiap pasangan state-input.
III.2 Non Deterministic Finite Automata
(NFA)
Pada NFA dari suatu state bisa terdapat nol (0), satu (1), atau lebih busur keluar (transisis) berlabel simbol yang sama. Jadi setiap pasangna state-input, kita bisa memiliki 0 atau lebih pilihan untuk state berikutnya.
Contoh 2
a
q0 a,b q1
(26)
Pada NFA contoh 2 diatas terdapat dua busur keluar berlabel input ‘a’. Dari state q0 bila
mendapat input ‘a’ bisa berpindah ke state q0 atau q1 yang secara formal dinyatakan : δ
(q0, a) = {q0, q1}
Konfigurasi NFA contoh 2 secara formal adalah sebagai berikut : Q = {q0, q1 }
Σ = {a, b} S = q0 F = {q1}
Fungsi-fungsi transisinya sebagai berikut :
δ (q0, a) = {q0,q1}, δ (q0, b) = q1,
δ (q1, a) = q1, δ (q1, b) = q1,
Jika disajikan dalam tabel transisi :
δ a b
q0 {q0,q1} {q1}
q1 {q1} {q1}
* Perhatikan : Dalam cara penulisan state hasil transisi pada tabel transisi untuk NFA, digunakan kurung kurawal ‘{‘ dan ‘}’karena hasil transisisnya merupakan suatu himpunan state.
* Pada bagian ini dapat dilihat NFA dengan lebih dari satu pilihan state berikutnya. Contoh 3
b
q0 a q1
(27)
Konfigurasi NFA contoh 3 secara formal adalah sebagai berikut : Q = {q0, q1 }
Σ = {a, b} S = q0 F = {q1}
Fungsi-fungsi transisinya sebagai berikut :
δ (q0, a) = q1, δ (q0, b) = q0,
δ (q1, a) = q0, δ (q1, b) = Ø,
Jika disajikan dalam tabel transisi :
δ a b
q0 {q1} {q0}
q1 {q0} Ø
III.3 Ekivalensi Non Deterministic Finite
Automata dengan Deterministic
Finite Automata
Dari sebuah NFA dapat dibuat bentuk DFA nya yang ekivalen (bersesuaian). Ekivalen disini artinya mampu memproduksi atau menerima bahasa yang sama. Adapun tahap pembuatan DFA yang ekivalen dari suatu NFA adalah sebagai berikut:
Contoh 4 Diketahui NFA sebagai berikut
Konfigurasi NFA contoh 4 secara formal adalah sebagai berikut : 0
q0 0,1 q1
1
(28)
Q = {q0, q1 }
Σ = {0, 1} S = q0 F = {q1}
Tabel transisinya :
δ 0 1
q0 {q0, q1} {q1}
q1 Ø {q0, q1}
- Kita mulai dengan state {q0}
Telusuri state berikutnya :
• δ (q0, 0) = {q0, q1 }
• δ (q0, 1) = {q1}
Hasilnya :
- Selanjutnya telusuri untuk setiap state baru yang terbentuk :
• δ (q1, 0) = Ø
• δ (q1, 1) = {q0, q1}
• δ ({q0,q1}, 0) = {q0, q1} adalah hasil gabungan dari
{q0}
{q0}
{q0, q1} 0
{q1} 1
(29)
δ (q0, 0) = {q0, q1}dengan δ (q1, 0) = Ø
• δ ({q0,q1}, 1) = {q0, q1} adalah hasil gabungan dari
δ (q0, 1) = {q1}dengan δ (q1, 0) = {q0, q1}
Hasilnya :
- Selanjutnya telusuri state baru yang terbentuk :
• δ (Ø, 0) = Ø
• δ (Ø, 0) = Ø
Hasilnya :
- Selanjutnya kita ingat bahwa F = {q1} maka himpunan state akhir (F) sekarang
adalah semua yang mengandung state q1. {q0}
{q0, q1} 0
{q1} 1
0
{ Ø } 1
0,1
{q0}
0
{q1} 1
0 1 {q0, q1}
0,1
{ Ø } 0,1
(30)
F = {{q1}, {q0, q1}} Hasilnya :
{q0}
0
{q1} 1
0 1 {q0, q1}
0,1
{ Ø } 0,1
(31)
Latihan 3
Buatlah DFA yang ekivalen !
1. Diketahui NFA sebagai berikut :
Dengan tabel transisi sebagai berikut :
δ 0 1
q0 {q0, q1} {q1}
q1 Ø Ø
2. Diketahui NFA sebagai berikut :
Σ = {0, 1}, F = {q0}, S = q0.
q0 a,b
a
q1
(32)
(33)
Bahasa regular (tipe 3) dapat dibagi kembali menjadi dua yaitu right linear
grammer (RLG) dan left linear grammer (LLG). Dari keduanya sebenarnya dalam segi
batasan aturan produksi sama, kecuali posisi dari simbol variabelnya. Jika RLG maka
posisi simbol variabelnya dipaling kanan, sedangkan jika LLG posisi simbol variabelnya
dipaling kiri.
IV.1 Right linear Grammer (RLG)
Ruas kanan (β) maksimal memiliki sebuah simbol variabel yang bila ada terletak diposisi paling kanan, dan apabila terdapat simbol terminal maka jumlahnya tidak dibatasi.
Contoh :
a. A Æ aaC c. C Æ B e. dll b. B Æ bbbD d. D Æ ddddddd
IV.2 Left Linear Grammer (LLG)
Ruas kanan (β) maksimal memiliki sebuah simbol variabel yang bila ada terletak diposisi paling kiri, dan apabila terdapat simbol terminal maka jumlahnya tidak dibatasi.
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB IV
RIGHT LINEAR GRAMMER DAN
LEFT LINEAR GRAMMER
α a β
a
α β a
(34)
Contoh :
a. A Æ Caa c. C Æ B e. dll b. B Æ Dbbb d. D Æ ddddddd
IV.3 Right Linear Grammer dan Left
Linear Grammer yang Identik
Dari suatu right linear grammer (RLG) dapat dirancang suatu left linear grammer (LLG)
yang identik, dan jika terdapat suatu left linear grammer (LLG) maka dapat pula
dirancang suatu right linear grammer (RLG) yang identik pula.
Identik disini maksudnya adalah menghasilkan, atau memproduksi suatu string yang
sama.
Contoh 1 : Diketahui RLG sebagai berikut
S Æ aaA A Æ B B Æ bb
Tentukan LLG yang identik !
Jawab :
• Pertama-tama kita tentukan string yang diproduksi oleh RLG tersebut. String yang diproduksi : ‘aabb’
• Selanjutnya kita rancang LLG yang memproduksi string ‘aabb’ Pilihan 1 : Pilihan 2 : Pilihan 3 :
S ÆAb S Æ Abb S Æ Abb A ÆBb A ÆB A Æ Bb
(35)
B Æbb B Æ bb B Æ b
• Terakhir, cek string yang diproduksi oleh RLG sama dengan string yang diproduksi oleh LLG. Jika sama berarti RLG tersebut identik dengan LLG diatas.
Contoh 2 : Diketahui LLG sebagai berikut
S Æ Baa B Æ Ab A Æ b
Tentukan LLG yang identik !
Jawab :
• Pertama-tama kita tentukan string yang diproduksi oleh RLG tersebut. String yang diproduksi : ‘bbaa’
• Selanjutnya kita rancang LLG yang memproduksi string ‘bbaa’ Pilihan 1 : Pilihan 2 : Pilihan 3 :
S ÆbA S Æ bbA S Æ bbA A ÆbB A ÆB A Æ Ba B Æaa B Æ aa B Æ a
• Terakhir, cek string yang diproduksi oleh LLG sama dengan string yang diproduksi oleh RLG. Jika sama berarti LLG tersebut identik dengan RLG diatas.
(36)
Latihan 4
1. Diketahui RLG sebagai berikut :
E Æ 00A A Æ 1A | 1
Tentukan LLG yang identik !
2. Diketahui RLG sebagai berikut :
E Æ 1A A Æ 1A | 0B B Æ 0B | 0
Tentukan LLG yang identik !
3. Diketahui LLG sebagai berikut :
E Æ Aaa A Æ Ab | bb
Tentukan RLG yang identik !
4. Diketahui LLG sebagai berikut :
E Æ Aaa A Æ Ab | Bb B Æ Ba | a
(37)
Tata Bahasa (grammer) didefinisikan dengan empat (4) tupel G = ({V, T, P, S}) dimana : V = Himpunan simbol variabel / non terminal
T = Himpunan simbol terminal P = Kumpulan aturan produksi S = Simbol awal
V.1 Aturan Produksi Bahasa Reguler
Kita masih ingat dengan aturan produksi dari bahasa regular (tipe 3) yaitu :
α Æ β
α adalah sebuah simbol variabel.
β maksimal memiliki sebuah simbol variabel yang bila ada terletak diposisi paling kanan.
Batasannya bertambah lagi, dimana ruas kanan maksimal memiliki sebuah simbol variabel yang terletak paling kanan. Artinya bisa memiliki simbol terminal dengan jumlah tidak dibatasi, tetapi bila terdapat simbol variabel maka simbol variabel tersebut hanya berjumlah satu (1) dan terletak paling kanan.
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB V
ATURAN PRODUKSI UNTUK SUATU FINITE STATE AUTOMATA
(38)
V.2 Mengkonstruksi Aturan Produksi
dari Suatu Finite State Automata
Dalam mengkonstruksi aturan produksi tata bahasa regular dari suatu FSA , perlu kita ingat yang menjadi perhatian adalah state-state yang bisa menuju ke state akhir.
Contoh 1 : Mesin FSA
Pada mesin FSA contoh 1, memiliki simbol input ‘a’ dan ‘b’.
• Misal kita identikan state awal qo dengan simbol awal S.
δ (q0, a) = q1 Dapat ditulis : S Æ aE
Dimana E kita identikan dengan q1.
• Dari q1 terdapat transisi :
δ (q1, ε) = q2 dan δ (q1, ε) = q3 Dapat ditulis :
E Æ A E Æ B
Dimana A kita identikan dengan q2 dan B kita identikan dengan q3. q0 a q1
q2
q3
ε ε
q4 b
a
b
(39)
• Selanjutnya dapat kita lihat, dari state q2 dengan input ‘a’ kembali ke state q2 dan dari state q3 dengan input ‘b’ kembali ke state q3.
δ (q2, a) = q2 dan δ (q3, b) = q3 Dapat ditulis :
A Æ aA B Æ bB
• Selanjutnya, dari state q2 dengan input ‘b’ menuju state q4 dan dari state q3 dengan input ‘b’ menuju ke state q4. Sementara q4 adalah himpunan state akhir dan dari state q4 tidak ada lagi busur keluar, maka :
δ (q2, b) = q4 dan δ (q3, b) = q4 Dapat ditulis :
A Æ b B Æ b
• Kumpulan aturan produksi yang kita peroleh bisa ditulis sebagai berikut : S Æ aE
E Æ A | B A Æ aA | b B Æ bB | b
Secara formal dapat ditulis : V = {S, E, A, B}
T = {a, b}
P = { S Æ aE , E Æ A | B , A Æ aA | b , B Æ bB | b } S = S
(40)
V.3
Finite State Automata untuk
Suatu Tata Bahasa Reguler
Jika sebelumnya dari suatu diagram transisi FSA dapat dibuat aturan-aturan produksi tata bahasa regularnya, maka sebaliknya bisa juga mengkonstruksi diagram transisi FSA untuk suatu tata bahasa regular yang diketahui aturan-aturan produksinya.
Contoh 2 : Tata bahasa regular S Æ aB | bA | ε
A Æ abaS B Æ babS
Kita dapat langsung gambar atau rancang diagram transisi FSA nya! S identik dengan q0 ; A identik dengan q1; dan B identik dengan q4. Lengkapnya adalah sebagai berikut :
q1 a
a
q0 b q2 a q3
b
q4 b
q5
(41)
Latihan 5
1. Diketahui FSA sebagai berikut :
Kontruksi tata bahasa regular nya !
2. Buatlah FSA dari aturan-aturan produksi tata bahasa regular berikut ini : S Æ 0A
A Æ 10A | ε
3. Buatlah FSA dari aturan-aturan produksi tata bahasa regular berikut ini : A Æ 00B | 11D | 0
B Æ 00D | 11C | 1 C Æ 00B | 11D | 0 D Æ 00D | 1
q0 b a
q1 a
b q2
a
(42)
VI.1 Mesin moore
Suatu keterbatasan dari Finite State Automata yang sudah dipelajari adalah keputusannya
terbatas pada diterima atau ditolak saja. Automata tersebut disebut sebagai accepter,
dalam hal ini disebut Fiite State Accepter.
Kita dapat mengkonstruksi suatu Finite State Automata yang memiliki keputusan
beberapa keluaran atau output, dalam hal ini disebut Finite State Transducer. Pada mesin
Moore, output akan berasosiasi dengan state.
Mesin Moore memiliki 6 (Enam) tupel, M = (Q, Σ, δ, S, Δ, λ). Dimana : Q = Himpunan State
Σ = Himpunan Simbol Input
δ = Fungsi Transisi S = State Awal
Δ = Himpunan Output
λ = Fungsi Output untuk setiap State
Keterangan : Komponen state akhir dari Deterministic Finite Automata dihilangkan,
karena disini keputusan dimunculkan sebagai output.
Contoh 1 :
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB VI
FINITE STATE AUTOMATA DENGAN OUTPUT
(43)
Penerapan Mesin Moore
Kita akan mencari nilai sisa pembagian (modulus) suatu bilangan dengan 3. Dimana
input dinyatakan dalam biner.
Konfigurasi :
Q = {q0, q1, q2}
Σ = {0, 1} (input dalam biner) S = q0
Δ = {0, 1, 2} (untuk outputnya pada kasus mod dengan 3 maka sisanya kemungkinan adalah 0, 1, 2)
λ(q0) = 0
λ(q1) = 1
λ(q2) = 2
Gambar Mesin Moore untuk modulus 3 :
Pembuktian :
• 5 mod 3 = ?
input 5 dalam biner 101
bila kita masukkan 101 kedalam mesin, urutan state yang dicapai adalah : q0, q1, q2, q2
State terakhir yang dicapai adalah q2, λ(q2) = 2 Maka 5 mod 3 = 2
• 10 mod 3 = ? q0
0
1
q2 0
1
q1 0 1
(44)
input 10 dalam biner 1010
bila kita masukkan 1010 kedalam mesin, urutan state yang dicapai adalah : q0, q1, q2, q2, q1
State terakhir yang dicapai adalah q1, λ(q1) = 1 Maka 10 mod 3 = 1
• 12 mod 3 = ?
input 12 dalam biner 1100
bila kita masukkan 1100 kedalam mesin, urutan state yang dicapai adalah : q0, q1, q0, q0
State terakhir yang dicapai adalah q0, λ(q0) = 0 Maka 12 mod 3 = 0
VI.1 Mesin
Mealy
Bila output pada mesin Moore berasosiasi dengan state, maka output pada Mesin Mealy
akan beasosiasi dengan transisi. Mesin Mealy didefinisikan dalam 6 (enam) tupel, yaitu :
Q = Himpunan State
Σ = Himpunan Simbol Input
δ = Fungsi Transisi S = State Awal
Δ = Himpunan Output
λ = Fungsi Output untuk setiap Transisi
Mesin ini akan mengeluarkan output apakah menerima (Y) atau menolak (T), suatu
masukan. Dimana mesin akan mengeluarkan output ‘Y’ bila menerima untai yagn
(45)
Misal string yang diterima oleh Mesin Mealy adalah : 00, 11, 011, 100, 11011, 0100,
010011, 010100, 101011, dll.
Konfigurasi Mesin Mealy tersebut :
Q = {q0, q1, q2}
Σ = {0, 1} (input dalam biner) S = q0
Δ = {Y, T}
λ(q0, 0) = T
λ(q0, 1) = T
λ(q1, 0) = Y
λ(q1, 1) = T
λ(q2, 0) = T
λ(q2, 1) = Y
Gambar Mesin Mealy
q2
0/T
1/Y q1 0/Y
1/T q0
0/T
(46)
VII.1 Tujuan
Penyederhanaan
Penyederhanaan tata bahasa bebas konteks bertujuan untuk melakukan pembatasan sehingga tidak menghasilkan pohon penurunan yang memiliki kerumitan yang tidak perlu atau aturan produksi yang tidak berarti.
Suatu tatabahasa bebas kontek dapat melakukan penyederhanaan dengan melakukan : a. Penghilangan Produksi Useless
b. Penghilangan Produksi Unit c. Penghilangan Produksi ε
VII.2
Penghilangan Produksi Useless
Disini produksi useless didefinisikan sebagai :
• Produksi yang memuat simbol variable yang tidak memiliki penurunan yang akan menghasilkan terminal-terminal seluruhnya (menuju terminal), produksi ini tidak berguna karena bila diturunkan tidak akan pernah selesai (masih ada simbolo variable tersisa).
• Produksi yang tidak akan pernah dicapai dengan penurunan apapun dari simbol awal, sehingga produksi itu redundan (berlebih).
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB VII
PENYEDERHANAAN TATA BAHASA BEBAS KONTEKS
(47)
Contoh 1 :
Diketahui tata bahasa bebas konteks sebagai berikut S Æ aSa | Abd | Bde
A Æ Ada B Æ BBB | a Bisa dilihat :
• Simbol variable A tidak memiliki penurunan yang menuju terminal, sehingga bisa dihilangkan.
• Konsekuensi no 1, aturan produksi S Æ Abd tidak memiliki penurunan Maka tata bahasa hasil penyederhanaan adalah :
S Æ aSa | Bde B Æ BBB | a Contoh 2 :
Diketahui tata bahasa bebas konteks sebagai berikut S Æ Aa | B
A Æ ab | D B Æ b | E C Æ bb E Æ aEa
(48)
Bisa dilihat :
• Aturan produksi A Æ D, simbol variable D tidak memiliki penurunan, sehingga bisa dihilangkan.
• Aturan produksi C Æ bb, jika dilakukan penurunan dari simbol awal S, dengan jalan manapun tidak akan pernah dicapai. Sehingga bisa dihilangkan.
• Simbol variable E tidak memiliki aturan produksi yang menuju terminal ( E Æ aEa ) satu-satunya aturan produksi dari E, sehingga bisa dihilangkan.
• Konsekuensi no 3, aturan produksi B Æ E, simbol variable E tidak memiliki penurunan, sehingga bisa dihilangkan.
Dapat dilihat, produksi yang useless adalah : A Æ D ; C Æ bb ; E Æ aEa ; B Æ E
Maka tata bahasa hasil penyederhanaan menjadi : S Æ Aa | B
A Æ ab B Æ b
VII.3 Penghilangan Produksi Unit
Produksi unit adalah produksi yang ruas kiri dan kanan aturan produksinya hanya berupa satu simbol variable. Dengan adanya bentuk prioduksi unit ini membuat tata bahasa memiliki kerumitan yang tidak perlu atau menambah panjang penurunan. Penyederhanaan ini dilakukan dengan melakukan penggantian aturan produksi unit.
(49)
Contoh 3 :
Diketahui tata bahasa bebas konteks sebagai berikut : S Æ Sb
S Æ C C Æ D C Æ ef D Æ dd
Kita lakukan penggantian berurutan mulai dari aturan produksi yang paling dekat menuju terminal-terminal (=> ‘ dibaca menjadi’)
• C Æ D => C Æ dd • S Æ C => S Æ dd | ef
Sehingga aturan produksi setelah penyederhanaan : S Æ Sb | dd | ef
C Æ dd | ef D Æ dd Contoh 4 :
Diketahui tata bahasa bebas konteks sebagai berikut : S Æ A
S Æ Aa A Æ B B Æ C B Æ b
(50)
C Æ D C Æ ab D Æ b
Penggantian yang dilakukan : • C Æ D => b
• B Æ C => B Æ b | ab, karena B Æ b sudah ada maka kita cukup tulis B Æ ab
• A Æ B => A Æ ab | b • S Æ A => S Æ ab | b
Sehingga aturan produksi hasil penyederhanaan : S Æ A => S Æ ab | b
S Æ Aa
A Æ B => A Æ ab | b B Æ ab
B Æ b C Æ b C Æ ab D Æ b
(51)
VII.4 Penghilangan Produksi Empty
Produksi ε (Empty) adalah produksi dalam bentuk α Æ ε atau bisa dianggap sebagai produksi kosong. Penghilangan produksi ε dilakukan dengan melakukan penggantian produksi yang memuat variable yang manuju produksi ε, atau bias disebut nullable. Prinsip penggantian bias dilihat kasus berikut :
Kasus 1. S Æ bcAd A Æε
Pada kasus 1, A nullable serta A Æ ε merupakan satu-satunya produksi dari A maka variable A bias ditiadakan. Maka hasil penyederhanaan adalah : S Æ bcd
Kasus 2. S Æ bcAd A Æ bd | ε
Pada kasus 2, A nullable, tapi A Æ ε bukan satu-satunya produksi dari A. Maka hasil penyederhanaan adalah :
S Æ bcAd | bcd A Æ bd
Contoh 5 : Diketahui tata bahasa bebas konteks sebagai berikut : S Æ Ab | Cd
(52)
C Æ ε
Variabel yang nullabel adalah C. karena penurunan C Æ ε merupakan penurunan satu-satunya dari C, maka kita ganti S Æ Cd manjadi S Æ d. kemudian produksi C Æ ε dihapus.
Tata bahasa bebas konteks setelah penyederhanaan : S Æ Ab | d
A Æ d Contoh 6 : S Æ dA | Bd A Æ bc A Æ ε B Æ c
Variabel yang nullable adalah A, A Æ ε bukan satu-satunya produksi dari A. Maka kita ganti S Æ dA manjadi S Æ dA | d kemudian A Æ ε dihapus.
Tata bahasa bebas konteks hasil penyederhanaan : S Æ dA | d | Bd
A Æ bc B Æ c
(53)
Latihan 6
1. Hilangkan semua produksi useless dari tata bahasa bebas konteks berikut : S Æ AB | CA
B Æ BC | AB A Æ a
C Æ aB | b
2. Hilangkan semua produksi unit dari tata bahasa bebas konteks berikut : S Æ A | aB
A Æ cD | B B Æ bB | D D Æ aa
3. Hilangkan semua produksi empty dari tata bahasa bebas konteks berikut : S Æ AaB | aaB
A Æε B Æ bbA | ε
4. Hilangkan produksi useless, unit dan empty dari tata bahasa bebas konteks berikut : S Æ a | aA | B | C
A Æ aB | ε B Æ Aa C Æ cCD D Æ ddd
(54)
VIII.1 Pengertian Bentuk Normal
Chomsky
Suatu tata bahasa bebas konteks dapat dikonstruksi menjadi bentuk normal chomsky (Chomsky Normal Form) jika tidak lagi mengandung produksi-produksi yang useless, unit, dan empty (ε). Dengan kata lain, untuk mengkonstruksi suatu CNF dari suatu tata bahas bebas konteks adalah dengan cara menghilangkan produksi-produksi useless, unit, dan ε.
Aturan produksi dari CNF adalah, ruas kanan adalah sebuah simbol terminal atau dua simbol variable.
Jadi dalam CNF, ruas kanan hanya boleh berupa sebuah simbol terminal atau dua buah simbol variable. Jika terdapat lebih dari satu simbol terminal maka harus dilakukan penggantian dan juga jika terdapat lebih dari dua buah simbol variable maka harus dilakukan perubahan..
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB VIII
(55)
VIII.2
Pembentukan Bentuk Normal
Chomsky
Langkah – langkah untuk mengkonstruksi CNF dari suatu tata bahasa bebas konteks : 1. Biarkan aturan-aturan produksi yang sudah dalam bentuk CNF.
2. Lakukan penggantian-penggantian terhadap aturan-aturan produksi yang ruas kanannya mengandung lebih dari satu simbol terminal.
3. Lakukan penggantian-penggantian terhadap aturan-aturan produksi yang ruas kanannya mengandung lebih dari dua simbol variabel.
4. Dalam melakukan penggantian ini dimungkinkan terciptanya suatu simbol-simbol variable baru dan aturan-aturan produksi baru.
5. Hasil akhir adalah gabungan dari aturan-aturan produksi yang sudah dalam bentuk CNF, aturan-aturan produksi yang telah dilakukan penggantian, dan aturan-aturan produksi yang baru.
Contoh 1 :
Diketahui tata bahasa bebas konteks (sudah tidak mengandung produksi useless, unit dan
ε) sebagai berikut : S Æ aB | SS | c B Æ BBB | cd | a
Langkah membuat CNF dari tata bahasa bebas konteks contoh 1 : • Biarkan aturan-aturan produksi yang sudah dalam bentuk CNF
S Æ SS ; S Æ c ; B Æ a
(56)
yang belum dalam bentuk CNF : S Æ aB => S Æ Z1B B Æ BBB => B Æ Z2 B
B Æ cd => B Æ Z3 d => B Æ Z3 Z4
• Simbol variable baru dan aturan produksi baru yang terbentuk : Z1Æ a Z2Æ BB Z3Æ c Z4Æ d
• Hasil akhir : S Æ SS | c | Z1B B Æ Z2B | Z3 Z4 | a Z1Æ a
Z2 Æ BB Z3 Æ c Z4Æ d Contoh 2 :
Diketahui tata bahasa bebas konteks sebagai berikut : S Æ aa | Ba | cd
B Æ AA | AAA | Dc A Æ abcd
D Æ De | ee | f
Langkah membuat CNF dari tata bahasa bebas konteks contoh 2 : • Biarkan aturan-aturan produksi yang sudah dalam bentuk CNF
(57)
• Lakukan penggantian aturan-aturan produksi yang belum dalam bentuk CNF yang belum dalam bentuk CNF :
S Æ aa => S Æ Z1 a => S Æ Z1 Z1 S Æ Ba => S Æ B Z1
S Æ cd => S Æ Z2 d => S Æ Z2 Z3 B Æ AAA => B Æ Z4 A
B Æ Dc => B Æ D Z2
A Æ abcd => A Æ Z1bcd => A Æ Z1 Z5 cd => A Æ Z1 Z5 Z2 d => A Æ Z1 Z5 Z2 Z3 => A Æ Z6 Z2 Z3 => A Æ Z6 Z7
• Simbol variable baru dan aturan produksi baru yang terbentuk :
Z1 Æ a Z3 Æ d Z5 Æb Z7 Æ Z2 Z3 Z2Æ c Z4Æ AA Z6Æ Z1 Z5
• Hasil akhir :
S Æ Z1 Z1 | B Z1 | S Æ Z2 Z3 B Æ Z4 A | D Z2
A Æ Z6 Z7
Z1 Æ a Z3 Æ d Z5 Æb Z7 Æ Z2 Z3 Z2 Æ c Z4 Æ AA Z6 Æ Z1 Z5
(58)
Latihan 7
1. Buatlah bentuk normal chomsky dati tata bahasa bebas konteks berikut ini : S Æ aSaA | A
A Æ abA | b
2. Buatlah bentuk normal chomsky dati tata bahasa bebas konteks berikut ini : S Æ abAB
A Æ bAB | ε B Æ BAa | A | ε
3. Buatlah bentuk normal chomsky dati tata bahasa bebas konteks berikut ini : S Æ abEab
E Æ AB
A Æ bA | BBBA B Æ BAa | AbCd
(59)
Dalam banyak penerapan tata bahasa, left linear grammer tak diinginkan. Untuk
menghindari penurunan yang bisa mengakibatkan loop perlu menghilangkan sifat left
linear grammer dari aturan produksi. Penghilangan left linear grammer disini
memungkinkan suatu tata bahasa bebas konteks nantinya diubah kedalam bentuk normal
greibach.
IX.1 Tahap Penghilangan Left Linear
Grammer
Langkah-langkahpenghilangan left linear grammer adalah sebagai berikut :
• Pisahkan aturan-aturan produksi yang left linear grammer dan yang tidak. Misal :
Aturan produksi yang left linear grammer : A Æ Aα1 | Aα2 | Aα3 |… Aαn Aturan produksi yang tidak left linear grammer : A Æβ1 | β2 | β3 |… βm
• Dari situ kita bisa tentukan α1, α2, α3,.. αn, dan β1, β2, β3,… βm dari setiap aturan produksi yang memiliki simbol ruas kiri yanG sama.
• Lakukan penggantian aturan produksi yang left linear grammer, menjadi sebagai berikut :
1. A Æβ1Z | β2Z |…. βmZ 2. Z Æα1 | α2 | α3 | …. αn 3. Z Æα1Z | α2Z | α3Z | …. αnZ
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB IX
PENGHILANGAN BENTUK LEFT LINEAR GRAMMER
(60)
Penggantian diatas dilakukan untuk setiap aturan produksi dengan simbol ruas kiri
yang sama. Bisa muncul simbol variabel baru Z1, Z2,.. Zn dan seterusnya sesuai
banyaknya variabel yang menghasilkan produksi yang left linear grammer.
• Hasil akhir berupa aturan produksi pengganti ditambah dengan aturan produksi semula yang tidak left linear grammer.
Contoh 1:
Diketahui tata bahasa bebas konteks sebagai berikut :
S Æ Sab | aSc | dd | ff | Sbd
• Pertama-tama lakukan pemisahan aturan produksi Aturan produksi yang left linear grammer :
S Æ Sab | Sbd
Dapat ditentukan untuk simbol ruas kiri S : α1 = ab ; α2 = bd Aturan produksi yang tidak left linear grammer :
S Æ aSc | dd | ff
Dapat ditentukan untuk simbol ruas kiri S : β1 = aSc ; β2 = dd ; β3 = ff ;
• Lakukan penggantian aturan produksi yang masih left linear grammer : Untuk simbol ruas kiri S : S Æ Sab | Sbd
i. S Æ aScZ1 | ddZ1 | ffZ1
ii. Z1 Æ ab | bd
iii. Z1 Æ abZ1 | bdZ1
(61)
S Æ aSc | dd | ff
S Æ aScZ1 | ddZ1 | ffZ1
Z1 Æ ab | bd
Z1 Æ abZ1 | bdZ1
Contoh 2 :
Tata bahasa bebas konteks :
S Æ Sab | Sb | cA
A Æ Aa | a | bd
• Pertama-tama lakukan pemisahan aturan produksi Aturan produksi yang left linear grammer :
S Æ Sab | Sb
A Æ Aa
Dapat ditentukan untuk simbol ruas kiri S : α1 = ab ; α2 = b Dapat ditentukan untuk simbol ruas kiri A : α1 = a
Aturan produksi yang tidak left linear grammer :
S Æ cA
A Æ a | bd
Dapat ditentukan untuk simbol ruas kiri S : β1 = cA
Dapat ditentukan untuk simbol ruas kiri A : β1 = a; β2 = bd
(62)
Untuk simbol ruas kiri S : S Æ Sab | Sb
i. S Æ cAZ1
ii. Z1 Æ ab | b
iii. Z1 Æ abZ1 | bZ1
Untuk simbol ruas kiri A : A Æ Aa
i. A Æ aZ2 | bdZ2
ii. Z2 Æ a
iii. Z2 Æ aZ2
• Hasil akhir adalah : S Æ cA
A Æ a | bd
S Æ cAZ1
Z1 Æ ab | b
Z1 Æ abZ1 | bZ1
A Æ aZ2 | bdZ2
Z2 Æ a
(63)
Latihan 8
1. Lakukan penghilangan bentuk left linear grammer dari tata bahasa bebas konteks
berikut :
A Æ Abd | d
B Æ Bac | a | BAd
2. Lakukan penghilangan bentuk left linear grammer dari tata bahasa bebas konteks
berikut :
S Æ Abd | d | Sad
A Æ Sa | aA | AA
(64)
XI. Ekspresi Reguler (ER)
♦ Sebuah bahasa dinyatakan regular jika terdapat finite state automata yang dapat menerimanya.
♦ Bahasa-bahasa yang diterima oleh FSA bisa dinyatakan secara sederhana dengan ekspresi regular (regular expression).
♦ Ekspresi regular memberikan suatu pola (pattern) atau template untuk untai/string dari suatu bahasa.
♦ Banyak masalah pada perangkat lunak yang bisa disederhanakan dengan melakukan pengubahan notasi ekspresi regular ke dalam implementasi komputer dari FSA yang bersangkutan.
♦ Contoh : Finite State Automata untuk mengenal bilangan bulat /integer tidak bertanda
♦ Ekspresi Regularnya adalah : misal 0..9 disimbolkan sebagai digit, maka ERnya adalah : (digit)(digit)*
10.1. Notasi Ekspresi Regular
♦ Notasi yang digunakan untuk ER adalah :
1. * : berarti bisa tidak muncul, bisa juga muncul berhingga kali (0-n)
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB XIEKSPRESI REGULER
q0 0..9 q2
(65)
2. + : berarti minimal muncul satu kali (1-n)
3. + : berarti union atau bisa diganti dengan notasi U
4. . : berarti konkatenasi, biasanya tanpa ditulis titiknya, misal ab sama dengan a.b
♦ Contoh ekspresi regular (ER) : 1. ER : ab*cc
Contoh string yang bisa dibangkitkan abcc, acc, abbcc, abbbcc, dst. (b
bisa tidak muncul atau muncul sejumlah berhingga kali) 2. ER : 010*
Contoh string yang bisa dibangkitkan 01,010, 0100,01000, dst. (0 bisa
tidak muncul atau muncul sejumlah berhingga kali) 3. ER : a+d
Contoh string yang bisa dibangkitkan ad,aad, aaad,aaaad dst. (a minimal muncul satu kali)
4. ER : a* U b*
Contoh string yang bisa dibangkitkan a, b, aa, bb, dst. 5. ER : 01*+0
Contoh string yang bisa dibangkitkan 0, 01,011, dst.
10.2. Hubungan ER dengan FSA
♦ Untuk setiap ER ada satu NFA dengan transisi ε (NFA ε-move) yang ekivalen.
(66)
♦ Sementara untuk setiap DFA ada satu ER dari bahasa yang diterima oleh DFA.
♦ Hubungannya dapat digambarkan sebagai berikut :
NFA
NFA ε-move ER
(1)
S Æ aSc | dd | ff
S Æ aScZ1 | ddZ1 | ffZ1 Z1 Æ ab | bd
Z1 Æ abZ1 | bdZ1
Contoh 2 :
Tata bahasa bebas konteks : S Æ Sab | Sb | cA
A Æ Aa | a | bd
• Pertama-tama lakukan pemisahan aturan produksi Aturan produksi yang left linear grammer :
S Æ Sab | Sb A Æ Aa
Dapat ditentukan untuk simbol ruas kiri S : α1 = ab ; α2 = b Dapat ditentukan untuk simbol ruas kiri A : α1 = a
Aturan produksi yang tidak left linear grammer : S Æ cA
A Æ a | bd
Dapat ditentukan untuk simbol ruas kiri S : β1 = cA
Dapat ditentukan untuk simbol ruas kiri A : β1 = a; β2 = bd
(2)
Untuk simbol ruas kiri S : S Æ Sab | Sb i. S Æ cAZ1
ii. Z1 Æ ab | b iii. Z1 Æ abZ1 | bZ1
Untuk simbol ruas kiri A : A Æ Aa i. A Æ aZ2 | bdZ2
ii. Z2 Æ a iii. Z2 Æ aZ2 • Hasil akhir adalah :
S Æ cA A Æ a | bd S Æ cAZ1 Z1 Æ ab | b Z1 Æ abZ1 | bZ1 A Æ aZ2 | bdZ2 Z2 Æ a
(3)
Latihan 8
1. Lakukan penghilangan bentuk left linear grammer dari tata bahasa bebas konteks berikut :
A Æ Abd | d B Æ Bac | a | BAd
2. Lakukan penghilangan bentuk left linear grammer dari tata bahasa bebas konteks berikut :
S Æ Abd | d | Sad A Æ Sa | aA | AA B Æ ac | a | BCad
(4)
XI. Ekspresi Reguler (ER)
♦ Sebuah bahasa dinyatakan regular jika terdapat finite state automata yang dapat menerimanya.
♦ Bahasa-bahasa yang diterima oleh FSA bisa dinyatakan secara sederhana dengan ekspresi regular (regular expression).
♦ Ekspresi regular memberikan suatu pola (pattern) atau template untuk untai/string dari suatu bahasa.
♦ Banyak masalah pada perangkat lunak yang bisa disederhanakan dengan melakukan pengubahan notasi ekspresi regular ke dalam implementasi
komputer dari FSA yang bersangkutan.
♦ Contoh : Finite State Automata untuk mengenal bilangan bulat /integer tidak bertanda
♦ Ekspresi Regularnya adalah : misal 0..9 disimbolkan sebagai digit, maka ERnya adalah : (digit)(digit)*
10.1. Notasi Ekspresi Regular
♦ Notasi yang digunakan untuk ER adalah :
1. * : berarti bisa tidak muncul, bisa juga muncul berhingga kali (0-n)
MODUL MATA KULIAH TEORI BAHASA DAN OTOMATA
IF
BAB XIEKSPRESI REGULER
q0 0..9 q2
(5)
2. + : berarti minimal muncul satu kali (1-n)
3. + : berarti union atau bisa diganti dengan notasi U
4. . : berarti konkatenasi, biasanya tanpa ditulis titiknya, misal ab sama
dengan a.b
♦ Contoh ekspresi regular (ER) : 1. ER : ab*cc
Contoh string yang bisa dibangkitkan abcc, acc, abbcc, abbbcc, dst. (b
bisa tidak muncul atau muncul sejumlah berhingga kali)
2. ER : 010*
Contoh string yang bisa dibangkitkan 01,010, 0100,01000, dst. (0 bisa
tidak muncul atau muncul sejumlah berhingga kali)
3. ER : a+d
Contoh string yang bisa dibangkitkan ad,aad, aaad,aaaad dst. (a minimal
muncul satu kali)
4. ER : a* U b*
Contoh string yang bisa dibangkitkan a, b, aa, bb, dst.
5. ER : 01*+0
Contoh string yang bisa dibangkitkan 0, 01,011, dst.
10.2. Hubungan ER dengan FSA
♦ Untuk setiap ER ada satu NFA dengan transisi ε (NFA ε-move) yang ekivalen.
(6)
♦ Sementara untuk setiap DFA ada satu ER dari bahasa yang diterima oleh DFA.
♦ Hubungannya dapat digambarkan sebagai berikut :
NFA
NFA ε-move ER