BAB 2 TINJAUAN PUSTAKA - Penerapan Metode Semantic Search Dalam Mencari Relasi Kata Yang Terdapat Pada Al-Qur’an Terjemahan Bahasa Indonesia

BAB 2 TINJAUAN PUSTAKA

2.1. Pencarian Pencarian adalah proses untuk menemukan suatu informasi yang kita butuhkan.

  Misalnya, kita ingin mencari sebuah kata didalam dokumen digital yang kita miliki. Kita dapat mencarinya dengan beberapa cara misalnya dengan cara yang paling lambat yaitu membaca dokumen tersebut secara perlahan agar lebih teliti dalam menemukan kata yang ingin kita cari. Atau dengan cara yang lebih cepat namun akan mengurangi ketelitian dalam menemukan kata yang kita cari dengan memanfaatkan fitur pencarian yang telah disediakan di komputer.

  Kedua cara tersebut memiliki kelebihan dan kekurangan. Pada cara yang pertama, kelebihan yang akan kita dapatkan adalah kita lebih teliti dalam mencari kata yang ingin kita temukan dan sebagai hasilnya kita dapat menemukan kata yang kita cari atau menemukan kata yang berkaitan maknanya dengan kata yang kita cari. Dengan demikian, kita tetap menemukan kata yang dicari walaupun dalam bentuk penulisan yang berbeda. Kekurangannya adalah kita akan membutuhkan waktu yang lama untuk menemukannya.

  Cara kedua juga demikian, ada kelebihan dan kekurangannya. Kelebihannya, waktu yang digunakan jauh lebih singkat dan ketepatan hasil pencariannya pun baik. Akan tetapi, jika tidak ditemukan kata yang serupa dengan kata yang kita inputkan maka hasilnya tidak ada. Sehingga, komputer akan memberitahukan bahwa kata yang kita cari tidak ada didalam dokumen tersebut. Kurangnya ketelitian dari sistem pencarian tersebut merupakan penyebabnya dan hal tersebut akan menjadi masalah bagi para pengguna.

  Permasalahan pencarian merupakan permasalahan yang sering muncul ketika hasil pencarian yang dihasilkan tidak sesuai dengan yang diinginkan. Beragam mesin pencari terus bersaing untuk memenuhi kebutuhan masyarakat akan perolehan informasi secara tepat dan cepat (Sarno, et al. 2012).

2.2. Semantic Search

  

Semantic atau dalam Bahasa Indonesia semantik, adalah ilmu tentang makna kata dan

  kalimat; pengetahuan mengenai seluk-beluk dan pergeseran arti kata; bagian struktur bahasa yang berhubungan dengan makna ungkapan atau struktur makna suatu wicara. Tujuan pencarian semantik adalah mencari konten yang sesuai dengan konteks yang diinginkan pengguna (Rahutomo, 2009).

  Ada dua jenis pencarian semantik menurut Pollock (2009). Jenis yang pertama adalah pencarian semantik dengan memberikan hasil berupa navigasi. Pengguna menggunakan mesin pencari sebagai alat navigasi untuk mengarahkan ke dokumen yang diinginkan. Navigasi ini dapat berupa link. Jenis yang kedua adalah dengan memasukkan frase atau kalimat yang menunjukkan keinginan pengguna untuk mendapatkan informasi. Pada jenis yang kedua ini, pengguna akan mendapatkan keseluruhan dokumen yang akan memberikan informasi secara lengkap. Intinya, pencarian semantik memberikan saran bagi pengguna berdasarkan penarikan kesimpulan yang dilakukan oleh sistem berdasarkan batasan-batasan tertentu (Sarno, et al. 2012).

  Untuk mendukung proses pencarian semantik maka diperlukan pemodelan data yang bisa digunakan ulang (Pollock, 2009). Bentuk pemodelan data yang mendukung proses pencarian semantic antara lain weighted tree similarity, ontologi, dan weighted directed acyclic graph. Dan pemodelan data yang akan penulis gunakan pada penelitian ini adalah ontologi. Ontologi ini tersusun berdasarkan konsep triple yang menggunakan property sebagai penghubung (relasi) antar data yang tersusun di dalamnya. Di dalam property itulah nantinya diinputkan pengetahuan kepada sistem apakah antar kata tersebut berelasi atau tidak.

2.2.1. Perbedaan semantic search dengan semantic web Ada perbedaan yang cukup jelas diantara semantic search dengan semantic web.

  DiSilvestro (2013) menulis pada sebuah situs online bahwa semantic search adalah proses pengetikan sesuatu ke dalam sebuah mesin pencari dan kemudian mendapatkan hasil pencarian yang selain menghasilkan kata kunci yang dicari juga menghasilkan kata lain yang terkait. Sedangkan semantic web adalah satu set teknologi untuk mewakili, menyimpan, dan melakukan query terhadap suatu informasi.

  2.2.2. Tujuan semantic search

  Tujuan utama dari semantic search adalah untuk menyediakan dokumen web yang paling relevan kepada para pengguna sesuai dengan query yang mereka gunakan dengan menggunakan domain ontologi yang spesifik (Mustapha et al. 2010).

  2.2.3. Semantic search processing

  Pada prosesnya, semantic search melakukan pencarian dengan cara mencocokkan

  

query yang tepat dan hubungannya diantara kata kunci dalam otologi. Karena user

lebih suka hasil yang meliputi semua kata kunci (Lee et al. 2009).

  Semantic search meningkatkan metode information retrieval (IR)

  konvensional dengan melihat pada perspektif yang berbeda seperti, arti kata yang dapat diformalkan dan diproses pada mesin yang menggunakan bahasa ontologi seperti RDF (Resource Description Framework) dan OWL (Ontology Web Language) (Wei et al. 2008). Semantic search framework dapat dilihat pada gambar 2.1.

Gambar 2.1 A semantic search framework (Wei, et al. 2008)

2.3. Resource Description Framework

  RDF (Resource Description Framework) adalah sebuah aplikasi dari XML yang memungkinkan penyusunan suatu resource description yang kaya, terstruktur, dan dapat dibaca oleh mesin (Trust, 2008). RDF merupakan sebuah framework untuk menjelaskan suatu halaman web. RDF memungkinkan pengembang web untuk membuat statement terhadap resources yang ada dari sebuah web (Daum, 2003). RDF

  

statement memiliki struktur yang sederhana. Tiap statement memiliki bentuk yang

disebut triple yang terdiri dari predicate, subject, dan object (Daum, 2003).

  Contohnya, dalam sebuah kalimat “John has phone number 777-717-0077”, subjeknya adalah

  “John”, predikatnya adalah “has phone number”, dan objeknya adalah “415- 555-6789 ”. Semua statement dalam RDF memiliki bentuk yaitu Subject has property. Pada contoh statement sebelumnya, property-nya adalah

  “phone number”. Property memiliki dua tipe, yaitu object property dan literal. Object property adalah sebuah objek dari suatu statement yang dapat mengarahkan/mereferensikan kepada resources yang lain. Literal adalah objek dari suatu stement yang bernilai string. Berikut ini adalah anatomi dari sebuh RDF statement yang dapat dilihat pada gambar 2.2.

Gambar 2.2 Anatomi dari sebuah RDF statement

2.3.1. RDF/XML

  RDF/XML merupakan salah satu bahasa ontologi. RDF/XML adalah sintaks yang digunakan untuk mengekspresikan RDF graph sebagai sebuah dokumen XML. Pada

gambar 2.3 dapat dilihat contoh RDF statement yang ditulis dengan sintaks RDF/XML.Gambar 2.3 Contoh sintaks RDF/XML Dari gambar 2.3 dapat dilihat bahwa struktur penulisan RDF statement mengikuti struktur penulisan pada dokumen XML. Tag (contoh: <p:PhoneNo>) menunjukkan nama property sedangkan nilai dari property dinyatakan sebagai konten elemen (contoh: 415-55-6789).

  2.3.2. Hubungan data dalam dokumen RDF

  

Resource description framework merupakan sebuah bahasa untuk merepresentasikan

  informasi tentang resource yang ada di dunia (Yu, 2011). RDF juga merupakan model berbentuk graf untuk merepresentasikan resource dan relasinya. Resource yang direpresentasikan adalah seluruh pengetahuan manusia yang kemudian dimodelkan kedalam bentuk subyek, predikat, dan objek. Statement RDF berupa triple, yaitu

  

subject, predicate, object (Manola et al, 2004). Contoh: Ari Rifki is the author of the

resourceKalimat tersebut memiliki beberapa

  bagian seperti:

Gambar 2.4 Contoh statement RDF

  Kita dapat melihat bahwa pola subyek, predikat, dan objek yang dibentuk hampir sama dengan pembentukan pola kalimat dalam bidang ilmu linguistik. Dimana sebuah kalimat terdiri dari subyek, predikat, dan objek. Namun, pada konsep triple ini tidak ada yang namanya keterangan waktu, tempat, dsb. Subyek dan objek pada konsep

  

triple merupakan entitas fisik (nyata). Sedangkan predikat pada konsep tersebut

  merupakan entitas virtual (tidak nyata) seperti sebuah relasi yang menyatakan adanya hubungan namun tidak dapat dipegang/disentuh. Sehingga dapat digambarkan sebagai berikut:

  Author Ari Rifki http://tugas-akhir.com/semantic-search/

Gambar 2.5 Contoh statement RDF dalam graf Agar RDF dapat dipahami oleh computer maka diperlukan sebuah identifier. Nantinya identifier ini akan diberikan pada entitas yang memiliki informasi yang saling berkaitan. Bentuk identifier pada RDF adalah URI (uniform resource identifier) yang merupakan sebuah string yang mirip dengan URL (uniform resource locator). URI & URL sama-sama berfungsi untuk mengarahkan user ke suatu alamat (resource) di internet yang memiliki informasi yang dicari .

  Setiap resource yaitu subyek, predikat, dan objek akan diberikan sebuah URI. Tetapi khusus untuk objek, identifier-nya dapat berupa URI atau literal. Karena terkadang informasi yang terkandung pada resource objek merupakan sebuah/beberapa kata (string) yang tidak mengarahkan ke alamat resource lain. Walaupun URI berbentuk seperti URL dan mengarahkan ke suatu alamat resource di internet, alamat URI tidak benar-benar harus ada di internet. Meskipun demikian, URI tersebut tetap valid.

  URI yang diberikan kepada resource sering sering kali sangat panjang sehingga jika terus dipergunakan berulang-ulang akan sangat tidak efisien. Maka dari itu URI tersebut haruslah kita buat lebih singkat (padat). URI yang dipadatkan disebut

compact URI. Cara memadatkan URI adalah dengan menggunakan XML namespace.

  XML namespace ini adalah sebuah referensi yang digunakan untuk mengarahkan kesebuah prefix tertentu.

2.4. RDFS (

  Resource Description Framework Schema)

  RDF schema adalah satu set semantik yang didefinisikan dalam sebuah namespace untuk digunakan dengan model data RDF yang spesifik (Trust, 2008). RDF schema menyediakan kosakata pemodelan data (data-modelling vocabulary) untuk data RDF (http://www.w3.org/TR/rdf-schema/).

  RDFS menyediakan mekanisme untuk menggambarkan kelompok sumber daya (resources) terkait dan hubungan (relationship) diantara sumber daya tersebut (Brickley, et al. 2014). Kosakata (vocabulary) RDFS diidentifikasi oleh IRI (Internationalized Resource Identifier) yaitu http://www.w3.org/2000/01/rdf-schema#.

  IRI tersebut berisikan berbagai kosakata (vocabulary) yang dapat digunakan untuk menggambarkan resource RDF lain yang terdapat pada suatu aplikasi RDF yang spesifik. RDFS menggunakan prefix rdfs: dan RDF menggunakan prefix rdf: dengan IRI-nya yaitu http://www.w3.org/1999/02/22-rdf-syntax-ns#.

  2.5. RDF API for PHP (RAP)

  RAP atau RDF API for PHP adalah sebuah semantic web toolkit untuk para pengembang PHP (Oldakowski, et al. 2004). RAP diawali sebagai proyek open source oleh Freie Universitat Berlin pada 2002 dan telah mengalami perkembangan di komunitas web semantik. Inti dari RAP meliputi dua implementasi atas penyimpanan

  

statement , yaitu apakah menyimpan graph RDF dalam memory sistem maupun dalam

database relational (Awaludin, 2009).

  2.6. SPARQL ( Simple Protocol and RDF Query Language)

  Model data RDF berupa suatu statement dalam bentuk triple yang terdiri dari subyek, prdikat, objek. Untuk mendapatkan informasi dari suatu graph RDF dibutuhkn suatu

  

query . SPARQL adalah query untuk RDF/OWL, query ini digunakan untuk

  mengambil data yang ditulis dengan menggunakan RDF/OWL atau XML. Query ini menggunakan URI (Universal Resource Identifier) untuk me-reatrive struktur RDF/OWL. SPARQL memungkinkan untuk melakukan beberapa hal yaitu, mengambil nilai dari data yang terstruktur maupun data yang semi terstruktur, mengembangkan data dengan melakukan query terhadap suatu relasi yang tidak diketahui, melakukan query operasi join yang kompleks pada database yang berlainan secara lebih sederhana, dan mengubah suatu data RDF menjadi vocabulary yang lain. Hasil dari query SPARQL dapat mengembalikan nilai dalam beberapa format data yang antara lain: XML, RDF, dan HTML (Awaludin, 2009). Berikut ini adalah contoh sederhana dari SPARQL:  Data:

  <http:://example.org/book/book1> <http://purl.org/dc/elements/1.1/title>

  “SPARQL Tutorial”  Query:

  SELECT ?title WHERE { <http://example.org/book/book1> <http://purl.org/dc/elements/1.1/title> ?title . }

   Hasil:

  title “SPARQL Tutorial”

  Variable SPARQL dimulai dengan tanda “?” dan merupakan suatu node (resource atau literal) dalam RDF triple

  . Sedangkan pernyataan “SELECT” mengembalikan suatu tabel dari variable dan nilai dideskripsikan dalam query (Awaludin, 2009).

2.7. Penelitian Terdahulu

  Pembuatan fitur pencarian pada ayat-ayat Al- Qur’an sudah banyak dibuat. Namun, beberapa masih menggunakan metode pencarian berbasis teks (text based) artinya pencarian yang dilakukan hanya berdasarkan kata yang diinputkan. Jika terjadi kesalahan input atau kata tersebut memang tidak ada didalam dokumen, maka tidak ada hasil yang ditampilkan kepada pengguna.

  Herdianto (2010) telah berhasil membuat sistem untuk pencarian ayat-ayat Al- Qur’an dengan memanfaatkan metode korelasi sehingga pengguna dapat mengajukan pertanyaan yang kemudian sistem akan menganalisa tiap kata yang ada pada pertanyaan tersebut dan memberikan sebuah jawaban. Dan dari jawaban tersebut ditampilkan ayat-ayat yang menjawab pertanyaan yang diinputkan oleh pengguna (user).

  Ridwan (2010) telah berhasil membuat sebuah sistem pencarian ayat-ayat Al- Qur’an dengan tiga cara yaitu mencari terjemahan ayat berdasarkan juz, surat, dan kata.

  Istiadi (2012) telah menghasilkan sebuah mesin pencari (Lafzi) ayat Al- Qur’an yang mampu melakukan pencarian ayat berdasarkan lafaz yang diingat oleh pengguna

  (user) dengan penulisan aksara latin. Contohnya, user mengingat ada kata “jannah” di dalam Al-

  Qur’an, maka ia hanya perlu mengetikkan kata tersebut dalam bentuk penulisan aksara latin pada form input di Lafzi dan kemudian akan memberikan hasil berupa ayat Al-

  Qur’an dalam bahasa Arab dengan Lafaz yang mirip dengan lafal kata “jannah” tadi.

Tabel 2.1 Penelitian terdahulu Nama (tahun) Penelitian Teknik

  Herdianto (2010) Pencarian ayat-ayat Al- Qur’an berdasarkan konten menggunakan text

  mining berbasis aplikasi desktop.

  Menggabungkan text mining dengan metode korelasi.

  Ridwan (2010) Istiadi (2012)

  Learning and searching

  terjemahan ayat-ayat Al- Qur’an.

  Sistem Pencarian Ayat Al- Qur’an Berbasis Kemiripan Fonetis

  Membuat aplikasi Al- Qur’an berbasis web yang mudah dimengerti oleh pengguna (user-friendly) yang ingin belajar dan mencari terjemahan ayat Al- Qur’an.

  Mencari ayat Al- Qur’an berdasarkan lafaz yang diingat dengan penulisan aksara latin.