324016766 Paper Review Natural Language Processing

TUGAS MATRIKULASI
PAPER REVIEW
NATURAL LANGUAGE PROCESSING

Oleh:
AHMAD JURNAIDI WAHIDIN

1611600253

ANITA TRIANA

1611600352

ANGGER STYO YUNIARTI

1611600345

JONO AFRIANTO

1611600238


RATNASARI

1611600378

SARUNI DWI ASNAWATI

1611600246

PROGRAM MAGISTER ILMU KOMPUTER

UNIVERSITAS BUDI LUHUR – JAKARTA
TAHUN AKADEMIK
2016
Tugas Matrikulasi Struktur Data – Universitas Budi Luhur

Paper Review:
Natural Language Processing
Ahmad Jurnaidi Wahidin1, Anita Triana2, Angger Styo Yuniarti3, Jono Afrianto4,
Ratnasari5, Saruni Dwi Asnawati6
Program Magister Ilmu Komputer, Fakultas Pascasarjana, Universitas Budi Luhur

Jl. Raya Ciledug, Petukangan Utara, Kebayoran Lama, Jakarta Selatan 12260
E-mail : 1)ahmadjurnaidi@gmail.com, 2)anita.triana@gmail.com,
3)
angger.sangpemimpi@gmail.com, 4)jn.kete@gmail.com, 5)rathna.saery@gmail.com,
6)
saruni.dwiasnati25@gmail.com.

ABSTRAK
Bahasa alami (Natural Language) merupakan suatu bahasa yang diucapkan, ditulis dan
diisyaratkan oleh manusia untuk komunikasi umum. Pengambilan data dari bahasa alami
merupakan proses dalam penerapan Natural Language Processing. Natural Language Processing
merupakan salah satu turunan dari ilmu kecerdasan buatan (artificial intelligence). NLP
merupakan percobaan untuk mendapatkan representasi arti dari teks bebas yang lebih lengkap
[3]. Beberapa teknik dan pendekatan digunakan serta dikembangkan dengan tujuan agar
komputer mampu memahami instruksi/permintaan manusia melalui penggunaan bahasa seharihari (bahasa alami). Berdasarkan 10 jurnal nasional dan internasional yang sudah di-review
dimana dapat disimpulkan bahwasanya Natural Language Processing dapat diimplementasikan
dalam banyak bidang studi dengan memanfaatkan teks dan suara sebagai sumber pengambilan
data dan aplikasi yang dapat dibuat pada bidang bidang NLP adalah Text-based application dan
dialogue-based application.
Kata kunci : Paper Review, Natural Language Processing, Bahasa Alami

mengalihbahasakan bahasa daerah ke bahasa
1. PENDAHULUAN
Penggunaan bahasa alami (Natural
lain. Aplikasi ini menggunakan Natural
Language), bahasa keseharian seperti bahasa
Language Processing. Natural Language
Indonesia dalam era internet sekarang bukan
Processing (Pemrograman Bahasa Alami)
lagi merupakan domain ilmu sosial saja
adalah pembuatan program yang memiliki
namun juga ilmu eksak seperti komputasi
kemampuan untuk memahami bahasa
dengan tujuan interoperabilitas [5] (Jurnal ke
manusia. Pada prinsipnya bahasa alami
7).
adalah suatu bentuk representasi dari suatu
Bahasa alami merupakan suatu bahasa
pesan yang ingin dikomunikasikan antar
yang diucapkan, ditulis dan diisyaratkan
manusia. NLP adalah upaya untuk

oleh manusia untuk komunikasi umum.
mengekstrak lebih jauh representasi dari
Pengambilan data dari bahasa alami
suatu teks bebas. Hal ini dapat dimasukkan
merupakan proses dalam penerapan Natural
secara kasar seperti mencari siapa
Language Processing. Natural Language
melakukan apa kepada siapa, kapan, di
Processing merupakan salah satu turunan
mana, bagaimana dan mengapa. NLP
dari ilmu kecerdasan buatan (artificial
biasanya membuat penggunaan konsepintelligence).
konsep linguistic seperti kata benda, kata
Pada era globalisasi ini, sudah banyak
kerja, kata sifat, dan lainnya dan struktur
aplikasi
yang
digunakan
untuk
gramatikal (baik direpresentasikan sebagai

Paper Review : Natural Language Processing –Universitas Budi Luhur

ungkapan-ungkapan seperti frase nomina
atau frase preposisional, atau hubungan
ketergantungan seperti subjek dari- atau
objek-dari) [1].
2. LANDASAN TEORI
2.1 Bahasa Alami (Natural Language)
Penggunaan bahasa alami, bahasa
keseharian seperti bahasa Indonesia dalam
era internet sekarang bukan lagi merupakan
domain ilmu sosial saja namun juga ilmu
eksak seperti komputasi dengan tujuan
interoperabilitas[5] (jurnal ke 7).
Bahasa melibatkan proses pengenalan
bunyi atau huruf, sintaksis, kalimat, inferensi
semantik tingkat tinggi bahkan komunikasi
emosi lewat irama bicara. Untuk mengelola
kerumitan ini, para ahli bahasa telah
mendefinisikan tingkat analisis yang berbeda

untuk bahasa alami yaitu persanjakan,
fonologi, morfologi, sintaksis, semantik,
pragmatik, dan pengetahuan tentang dunia
sekitar [3]. Salah satu unit dasar bahasa
alami adalah kalimat. Kalimat menyatakan
pikiran secara lengkap dalam bentuk
pertanyaan, perintah, atau seruan. Kalimat
terdiri atas unit-unit individu yang disebut
kata.
2.2 Pemrosesan Bahasa Alami (Natural
Language Processing)
Natural Language Processing (NLP)
merupakan salah satu turunan dari ilmu
kecerdasan buatan (artificial intelligence).
NLP
merupakan
percobaan
untuk
mendapatkan representasi arti dari teks
bebas yang lebih lengkap [3].

Pengambilan kembali informasi yang
tersimpan
dalam
basis
data
bisa
dilaksanakan
dengan
menggunakan
pengolahan bahasa alami. Beberapa teknik
dan
pendekatan
digunakan
serta
dikembangkan dengan tujuan agar komputer
mampu memahami instruksi/permintaan
manusia melalui penggunaan bahasa seharihari (bahasa alami). Elemen pengolah
bahasa alami terdiri atas scanner, parser,

translator, dan evaluator sebagaimana

ditampilkan pada Gambar 1 berikut ini.

Gambar 1. Komponen pengolah bahasa
alami [6] (Jurnal no 5)
2.3 Terminologi NLP
Perkembangan NLP menghasilkan
kemungkinan dari interface bahasa natural
menjadi knowledge base dan penterjemahan
bahasa natural. [4] menjelaskan bahwa ada 3
(tiga) aspek utama pada teori pemahaman
mengenai natural language:
1. Syntax: menjelaskan bentuk dari
bahasa. Syntax biasa dispesifikasikan
oleh sebuah grammar. Natural
language jauh lebih daripada formal
language yang digunakan untuk
logika kecerdasan buatan dan
program komputer
2. Semantics: menjelaskan arti dari
kalimat dalam satu bahasa. Meskipun

teori semantics secara umum sudah
ada, ketika membangun sistem
natural language understanding
untuk aplikasi tertentu, akan
digunakan representasi yang paling
sederhana.

3. Pragmatics: menjelaskan bagaimana
pernyataan yang ada berhubungan
dengan dunia. Untuk memahami
bahasa,
agen
harus
mempertimbangan lebih dari hanya
sekedar kalimat. Agen harus melihat
lebih ke dalam konteks kalimat,
keadaan dunia, tujuan dari speaker
dan listener, konvensi khusus, dan
sejenisnya.


3. METODOLOGI PENELITIAN
Penelitian
ini
adalah
memahami
penerapan sistem pengolahan bahasa alami
(Natural Language Processing) Dalam
melakukan penelitian ini langkah yang
dilakukan adalah melakukan studi pustaka
yang berkaitan dengan sistem pengolahan
bahasa
alami
(Natural
Language
Processing) dimana dengan menganalisa 10
jurnal nasional maupun internasionnal yang
berhubungan dengan NLP. Kemudian
melakukan pengamatan terhadap obyekobyek yang terdapat disetiap jurnal,
dilanjutkan dengan mengelompokan jurnal
berdasarkan ketentuan yang disiapkan.

Setelah pengelompokan dilakukan dan
mendapatkan data berupa tabel yang
selanjutnya adalah membandingkan setiap
jurnal, yang terkahir mengambil kesimpulan.

Paper Review : Natural Language Processing –Universitas Budi Luhur

4. HASIL DAN PEMBAHASAN
4.1 Jurnal-Jurnal Yang Di Review
Berikut 10 jurnal yang menjadi bahan untuk direview:
Nama Peneliti
No
Judul Jurnal
Alat analisis dan unit analisis
Hipotesis penelitian
(tahun)
1
Nitesh
Patel Optimized Approach to Voice Terjemahan di komputer, laptop Mengembangkan sebuah model
dan V. N. Pati Translation
dan ponsel.
sistem baru untuk alat dan layanan
(2014)
terjemahan suara yang memproses
bahasa alami dan mengkonversi,
dengan memanfaatkan metode
parsing penelitian ini
lebih
berkonsetrasi menangkap kata
kunci dan menerjemahkannya.
2
Ying Li, Hojjat Determining the Reasons for Informasi pasien dan infromasi Menggunakan NLP untuk membuat
Salmasian
Medication Prescriptions in the dari Electronic Health Record sebuah aplikasi
yang dapat
MD-MPH,
EHR using Knowledge and (EHR)
membantu proses menentukan
Rave Harpaz Natural Language Processing
resep obat pada seorang pasien
PhD, Herbert
berdasarkan
informasi
yang
Chase
MD,
terkandung
dalam
Electronic
Carol
Health Record (EHR) sehingga
Friedman PhD
dapat membantu dokter.
(2011)
3
M ishalakshi, Automatic Generation of Commit File dari perangkat lunak yang Mengubah sebuah kode dari sebuah
Dr.V.
Messages using Natural Language berupa kode.
file dan diperbaharui menjadi
Krishnapriya
Processing
sebuah pesan untuk mempermudah
(2013)
untuk kegiatan pengembangan
sebuah proyek.
4
Nisa Kurniasih Implementasi Natural Language 20 abstak skripsi yang dapat di Kesalahan penulisan pada abstrak
Wangsanegara, Processing Dalam Pengukuran copy-paste ataupun menggunakan skripsi biasanya terletak pada
Beki Subaeki
Ketepatan
Ejaan
Yang upload-file (Doc, docx, txt, pdf)
kesalahan penulisan kata, tanda
(2015)
Disempurnakan (EYD) Pada
baca maupun huruf kapital.
Abstrak Skripsi Menggunakan
Aplikasi ini akan mengidentifikasi
Algoritma Fuzzy Logic
dan menghitung jumlah kesalahan

penulisan huruf kapital/ kata dan
tanda baca. Hasil pengujian
terhadap 20 abstrak skripsi
menunjukkan 70% sesuai dengan
pemeriksaanmanua
5

Hernawan
Sulistyanto
dan
Nurgiyatna
(2015)

Pengembangan Model Pencarian
Kamar Dalam Sistem Reservasi
Hotel Dengan Antarmuka Bahasa
Alami

Calon Tamu Hotel dan Scanner
(Analisis
Leksikal),
Parser
(Analisa Sintaks), Translator
(Analisis Semantik), Evaluator
(Analisis Pragmatik)

6

James Suciadi
(2001)

Studi Analisis Metode-Metode
Parsing Dan Interpretasi Semantik
Pada
Natural
Language
Processing

Tiga proses yang dilakukan untuk
mencapai tujuan adalah Parshing
atau analisis sintakis yang
memeriksa kebenaran struktur
kalimat berdasarkan gramer dan
lexicon.

7

Suwanto
Antarmuka Bahasa Alami Untuk
Raharjo
dan Melakukan
Query
Terhadap
Sri
Hartati. Terjemahan Al-Quran
(2014)

Al-Qur’an dan Scanner (Analisi
Leksikal),
Parser
(Analisis
Sintaks), Translator (Analisis
Semantik) Evaluator (Analisis
Pragmatik)

8

Ngurah Agus
Sanjaya ER

XCODE dan Scanner (Analisi
Leksikal), Parser (Analisis

Purwarupa Aplikasi Perangkat
Bergerak Untuk Alihbahasa

Paper Review : Natural Language Processing –Universitas Budi Luhur

Aplikasi Sistem Reservasi dengan
mengimplementasikan
bahasa
alami mampu melaksanakan query
terhadap data yang tersimpan dalam
basis data dengan menggunakan
bahasa Indonesia
Jika aplikasi NLP yang dibuat
menggunakan
grammar
yang
kompleks,
makaparser
yang
menggabungkan metode top-down
dan bottom-up merupakan pilihan
yang terbaik karena mengatasi
kekurangan pada masing-masing
metode. Word-sense hierarchy yang
digunakan
oleh
selectional
restrictions sangat membantu dalam
melakukan proses word-sense
disambiguation, sehingga lebihbaik
dibandingkan context activation.
Aplikasi Terjemahan Al-Qur’an
dengan
mengimplementasikan
bahasa alami mampu melaksanakan
query terhadap data yang terismpan
dalam
basis
data
dengan
menggunakan bahasa indonesia.
Aplikasi Alih Bahasa dari Bahasa
Inggris Ke Bahasa Bali dengan

dan Agus
Muliantara.
(2014)

Kalimat Bahasa Inggris Ke
Bahasa Bali Menggunakan
Pendekatan Berbasis Aturan

9

Setyawan
Wibisono
(2013)

10

Herny
Februariyanti
dan Eri
Zuliarso
(2013)

Aplikasi Pengolah Bahasa Alami
Untuk Query Basis data
Akademik Dengan Format Data
Xml
Membangun Aplikasi Natural
Language Processing
Menggunakan Instant Messenger
Untuk Informasi Bencana

Sintaks), Analisis Alih Bahasa

mengimplementasikan bahasa
alami mampu melaksanakan query
terhadap data yang terismpan dalam
basis data dengan menggunakan
bahasa Bali.
Data akademik mahasiswa dari Proses yang dilakukan oleh aplikasi
sistem akademik Universitas ini adalah mengidentifikasi kataStikubank Semarang
kata dalam kalimat alami dan
melihat struktur kalimat.
Intant Messager dengan
Instant Messaging untuk bertukar
memanfaatkanlayanan Google
informasi seputar bencana alam
Talt dan mempunyai account
sebelum dan sesudah bencana itu
email Gmail
terjadi serta memiliki fasilitas
Question Answer yang dapat
menjawab kebutuhan request
informasi bencana dari pengguna

4.2 Aplikasi Dalam Bidang Natural
Language
Jenis aplikasi yang dapat dibuat pada
bidang bidang NLP adalah: Text-based
application dan dialogue-based application.
Text-based application mencakup segala
macam aplikasi yang melakukan proses
terhadap aplikasi tertulis seperti misalnya
buku, berita,surat kabar, email dan lain-lain.
Dialogue – based applications idealnya
pendekatan ini melibatkjan bahasa lisan atau
pengenalan suara,akan tetapi bidang ini juga
memasukkan
interaksi
dengan
cara
memasukkan teks pertanyaan memalui
kybord. Berikut pengelompokan 10 jurnal
yang telah direview berdasarkan jenis
aplikasinya:
Jenis Aplikasi
DialogueJurnal
Text-based
based
application
application

[1]

[2]

[3]

[4]

[5]


[6]

[7]

[8]

[9]

[10]
Tabel 2. Pengelompokan jurnal berdasarkan
aplikasi dalam bidang NLP
4.3 Jenis Data dan Bidang Studi
Berikut pengelompokan 10 jurnal yang telah
direview berdasarkan data dan bidang studi:
Data yang
Bidang Studi
Jur
didapat
nal
Text Suara A B C D E F G


√ √ √ √
[1]


[2]

√ √
[3]


[4]

√ √
[5]





[6]

√ √

[7]

√ √

[8]

√ √
[9]


√ √ √

[10]
Tabel 3. Pengelompokan jurnal berdasarkan
jenis data dan bidang studi
Keterangan bidang studi:
[A] Terjemahan Mesin
[B] Pengolahan teks bahasa alami
[C] User interface
[D] Multibahasa dan pengambilan informasi
bahasa silang
[E] Pengenalan suara
[F] Kecerdasan buatan
[G] Sistem pakar
4.4 Area Utama Penelitian Pada Field
NLP
Pustejovsky
dan
Stubbs
(2012)
menjelaskan bahwa ada beberapa area utama
penelitian pada field NLP[2], diantaranya:
1. Question Answering Systems (QAS).
Kemampuan komputer untuk menjawab
pertanyaan yang diberikan oleh user.
Daripada memasukkan keyword ke
dalam browser pencarian, dengan QAS,
user bisa langsung bertanya dalam
bahasa natural yang digunakannya, baik
itu
Inggris,
Mandarin,
ataupun
Indonesia.
2. Summarization. Pembuatan ringkasan
dari sekumpulan konten dokumen atau
email. Dengan menggunakan aplikasi
ini,
user
bisa
dibantu
untuk
mengkonversikan dokumen teks yang
besar ke dalam bentuk slide presentasi.
3. Machine Translation. Produk yang
dihasilkan adalah aplikasi yang dapat
memahami bahasa manusia dan
menterjemahkannya ke dalam bahasa
lain. Termasuk di dalamnya adalah
Google Translate yang apabila dicermati
semakin membaik dalam penterjemahan

Paper Review : Natural Language Processing –Universitas Budi Luhur

bahasa. Contoh lain lagi adalah
BabelFish yang menterjemahkan bahasa
pada real time.
4. Speech
Recognition.
Field
ini
merupakan cabang ilmu NLP yang
cukup sulit. Proses pembangunan model
untuk digunakan telpon/komputer dalam
mengenali bahasa yang diucapkan sudah
banyak dikerjakan. Bahasa yang sering
digunakan adalah berupa pertanyaan
dan perintah.
5. Document classification. Sedangkan
aplikasi ini adalah merupakan area
penelitian NLP Yang paling sukses.
Pekerjaan yang dilakukan aplikasi ini
adalah menentukan dimana tempat
terbaik dokumen yang baru diinputkan
ke dalam sistem. Hal ini sangat berguna
pada aplikasi spam filtering, news
article classification, dan movie review.
Berikut pengelompokan 10 jurnal yang telah
direview berdasarkan area utama penelitian:
Jurn
al

QAS

Sum
mari
zatio
n

Mac
hine
Tran
slati
on


Spee
ch
Reco
gniti
on

Docu
ment
class
ificat
ion

[1]

[2]

[3]
[4]

[5]


[6]
[7]

[8]


[9]


[10]
Tabel 4. Pengelompokan jurnal berdasarkan
area utama penelitian
5. PENUTUP
5.1. Kesimpulan
Berdasarkan
hasil
pembahasan
mengenai Natural Language Processing
dapat
disimpulkan
bahwa
NLP

menggunakan
bahasa
alami
dalam
penerapannya. Dimana aplikasi yang dapat
dibuat adalah alihbahasa dan banyak
lainnya, jenis aplikasi yang dapat dibuat
pada bidang bidang NLP adalah Text-based
application dan dialogue-based application.
Pendekatan NLP dikembangkan dengan
tujuan agar komputer mampu memahami
instruksi/permintaan
manusia
melalui
penggunaan bahasa bahasa alami.
Hasil review terhadap 10 jurnal
menyimpulkan jenis data yang didapat
sebagai sumber bahasa adalah teks dan
suara.
5.2. Saran
Setelah melakukan review pada 10
jurnal, maka penulis memilik saran untuk
pengembangan
aplikasi
selanjutnya
memanfaatkan suara sebagai sumber data
dan Dialogue-based application sebagai
jenis aplikasi yang digunakan karena masih
sedikit dalam penerapannya.

DAFTAR PUSTAKA
[1]

Daeli, Irlani. Natural Language
Processing Analysis Of Sentences With
Turbo Prolog. Universitas Gunadarma

[2] Pustejovsky, J., Stubbs A. (2012).
Natural Language Annotation for
Machine Learning. Beijing: O’Reilly
[3] Kao, A., Poteet, S. R. (2007). Natural
Language Processing and Text
Mining. USA: Springer.
[4] Poole L. David dan Mackworth K. Alan
(2010),”Artifical
Intelligence”
University of British Columbia:
Vancouver
[5] Wicaksana, I.W.S, Wulandari, L, dan
Wirawan, S. (2005), “Pentingnya
Peranan
Bahasa
dalam

Interoperabilitas
Informasi
berbasiskan
Komputer
karena
Keragaman
Semantik”
Prosiding
Seminar Ilmiah Nasional (PESAT
2005),
Universitas
Gunadarma,
Jakarta, halaman S9-S16, 2005

[10] Agus, Ngurah, Muliantara Agus (2014),
“Purwarupa
Aplikasi
Perangkat
Bergerak Untuk Alihbahasa Kalimat
Bahasa Inggris Ke Bahasa Bali
Menggunakan Pendekatan Berbasis
Aturan”,
Universitas
Udayana:
Bandung.

[6]

Sulistyanto, Hernawan, Nurgiyatna,
(2015),
“Pengembangan
Model
Pencarian Kamar Dalam Sistem
Reservasi Hotel Dengan Antarmuka
Bahasa
Alami”,
Universitas
Muhammadiyah Surakarta: Surakarta.

[7]

Raharjo, Suwanto, Hartati, Sri, (2014)
“Antarmuka Bahasa Alami Untuk
Melakukan
Query
Terhadap
Terjemahan
Al-Quran’.UGM.
Yogyakarta.

[12] Patel Nitesh , Patil V. N. (2012),
”Optimized Approach to Voice
Translation”,
Talegaon Dabhade
Taluka Maval Dist: Pune Maharashtra

[8] Wibisono, Setyawan (2013), “Aplikasi
Pengolah Bahasa Alami untuk Query
Basisdata Akademik dengan Format
Data
Xml”,
Universitas
Stikubank:Semarang.

[13] Li Ying (2011),”Determining the
Reasons for Medication Prescriptions
in the EHR using Knowledge and
Natural
Language
Processing ”,
Department
of
Biomedical
Informatics, Columbia University,
New York

[9]

Kurniasih, Nisa, dkk, (2015), ”
Implementasi
Natural
Language
Processing
Dalam
Pengukuran
Ketepatan Ejaan Yang Disempurnakan
(EYD)
Pada
Abstrak
Skripsi
Menggunakan
Algoritma
Fuzzy
Logic”, UIN Sunan Gunung Djati:
Bandung.

[11] Suciadi James (2004),” Studi Analisis
Metode-Metode
Parsing
dan
Interpretasi Semantik Pada Natural
Language Processing”, Universistas
Kristen Petra: Surabaya.

[14] Ishalakshi
M., Krishnapriya V.
(2013),” Automatic Generation of
Commit Messages using Natural
Language Processing”, Department of
Computer Science, Sri Ramakrishna
College of Arts and Science for
Women, Coimbatore.

Paper Review : Natural Language Processing –Universitas Budi Luhur