Penggunaan Linked Data Sebagai Sumber Da

SKRIPSI PENGGUNAAN LINKED DATA SEBAGAI SUMBER DATA PADA APLIKASI BERBASIS WEB

(Studi Kasus: Pembuatan Situs Informasi Perfilman)

LINKED DATA USAGE AS DATASET RESOURCE FOR WEB BASED APPLICATION

(Case Study: Building Movie Sites )

Ahmad Muiz Lidinillah 08/273420/EPA/00928 PROGRAM STUDI S1 SWADAYA ILMU KOMPUTER JURUSAN ILMU KOMPUTER DAN ELEKTRONIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA YOGYAKARTA

SKRIPSI PENGGUNAAN LINKED DATA SEBAGAI SUMBER DATA PADA APLIKASI BERBASIS WEB

(Studi Kasus: Pembuatan Situs Informasi Perfilman)

LINKED DATA USAGE AS DATASET RESOURCE FOR WEB BASED APPLICATION

(Case Study: Building Movie Sites )

Diajukan untuk memenuhi salah satu syarat memperoleh derajat Sarjana Ilmu Komputer

Ahmad Muiz Lidinillah

08/273420/EPA/00928

PROGRAM STUDI S1 SWADAYA ILMU KOMPUTER JURUSAN ILMU KOMPUTER DAN ELEKTRONIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA YOGYAKARTA

HALAMAN PENGESAHAN SKRIPSI PENGGUNAAN LINKED DATA SEBAGAI SUMBER DATA PADA APLIKASI BERBASIS WEB

(Studi Kasus: Pembuatan Situs Informasi Perfilman)

Telah dipersiapkan dan disusun oleh

Ahmad Muiz Lidinillah 08/273420/EPA/00928

Telah dipertahankan di depan Tim Penguji

pada tanggal 18 Juli 2011

Susunan Tim Penguji

Pembimbing

Penguji I

Khabib Mustofa, Dr., S.Si., M.Kom Ahmad Ashari, Dr., M.Kom

Penguji II

Afia Hayati, S.Kom., M.Cs

PERNYATAAN

Dengan ini saya menyatakan bahwa Laporan Skripsi ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar Ahli Madya/kesarjanaan di suatu Perguruan Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka.

Yogyakarta, Juli 2011

Ahmad Muiz Lidinillah

HALAMAN PERSEMBAHAN

Untuk kedua orang tuaku dan ketiga adikku yang tercinta Sebagai ungkapan terima kasihku selama ini Untuk semua perhatian dan pengorbanan yang telah kalian berikan untukku Inna ma’al ’usri yusra wa man yattaqillaha yaj’al lahu makhraja

PRAKATA

Segala puji hanyalah milik Allah SWT, yang dengan kasih sayang, rahmat, dan ridho-Nya, penulis dapat menyelesaikan tugas akhir yang berjudul “Penggunaan Linked Data Sebagai Sumber Data Pada Aplikasi Berbasis Web”.

Penulis menyadari bahwa penulisan tugas akhir ini tidak terlepas dari bimbingan dan bantuan dari berbagai pihak. Untuk itu penulis menyampaikan ucapan terima kasih kepada :

1. Ayahku dan Ibuku tersayang yang senantiasa mendoakan serta memberikan dukungan, juga untuk ketiga adikku, Faza Karimatul Akhlaq, Zahriyyatul Humairah,dan Himayatus Shalihah.

2. Bapak Retantyo Wardoyo, Drs., M.Sc, Ph.D, selaku dosen wali yang telah memberikan bimbingan selama penulis mengikuti masa studi di S1 Swadaya Ilmu Komputer UGM.

3. Bapak Khabib Mustofa, Dr., S.Si, M.Kom, selaku dosen pembimbing yang telah memberikan bimbingan, arahan, dan dorongan selama menyusun skripsi.

4. Bapak dan Ibu Dosen, serta seluruh karyawan Fakultas MIPA yang telah memberikan banyak ilmu dan pelajaran yang sangat berharga.

5. Special thank’s for: Huda, Topik, Falaq (thank’s buat koreksi dan perbaikannya), dan Diko (thank’s for sharing idea). Terima kasih atas kerja samanya selama ini.

6. Teman-teman Ilkom ’08: Lelet, Rinu, Anung, Munir, Tri, Wahyu, Mita, Okta, dan semua sahabat Ilkom ’08.

7. Teman-teman CIS ‘05 Satya, Taufik T, Hafiz, Ivan, dan teman-teman KOMSI lainnya yang telah memberi dukungan kepada penulis, baik secara langsung maupun tidak.

8. Teman-teman kos and others (‘Rip, ‘Qon, ‘Beng), teman-teman alumni Ali Maksum ‘04 , serta semua pihak yang tidak dapat disebutkan satu persatu yang telah memberikan nasihat dan semangat dalam mengarungi perjalanan penulis di Jogja ini dan dalam penulisan tugas akhir ini.

Penulis menyadari dalam skripsi ini, masih terdapat banyak kekurangan dan kelemahannya. Untuk itu penulis sangat mengharapkan masukan berupa kritik dan saran yang bersifat membangun.

Akhirnya penulis berharap semoga tugas akhir ini dapat memberikan manfaat bagi penulis, pembaca, dan semua pihak yang berkepentingan dengan tugas akhir ini.

Yogyakarta, Juli 2011

Ahmad Muiz Lidinillah

DAFTAR ISI

HALAMAN PERSEMBAHAN iv PRAKATA

v DAFTAR ISI

vi DAFTAR GAMBAR

ix DAFTAR TABEL

xi INTISARI

xii ABSTRACT

xiii

BAB I. PENDAHULUAN

1.1 Latar Belakang

1.2 Rumusan Masalah

1.3 Batasan Masalah

1.4 Tujuan Penelitian

1.5 Manfaat Penelitian

1.6 Metode Penelitian

1.7 Sistematika Penulisan

BAB II. TINJAUAN PUSTAKA

BAB III. LANDASAN TEORI

3.1 Semantic Web

3.1.1 Arsitektur semantic web

3.1.2 Perkembangan semantic web saat ini

3.2 RDF (Resource Descriptor Framework)

3.2.1 Model data RDF

3.2.2 Blank nodes

3.2.3 Format serialisasi RDF

3.3 RDF Schema

3.4 OWL (Ontology Web Language)

3.4.1 Jenis-jenis OWL 20

3.4.2 Elemen OWL 22

3.6 Linked Data

3.6.1 Prinsip dasar linked data

3.6.2 Content negotiation

3.6.3 Vocabulary pada linked data

3.6.4 Sumber dataset di linked data

3.6.5 Open World Assumption dan No Uniques Name

Assumption

3.7 Jena Framework

3.7.1 Reasoner engine pada Jena

3.7.2 Contoh inferensi menggunakan Jena

3.8 JSP dan Struts

3.8.1 JSP (Java Server Pages)

BAB IV. ANALISIS DAN PERANCANGAN SISTEM

4.1 Gambaran Umum Sistem

4.2 Spesifikasi Kebutuhan

4.2.1 Kebutuhan fungsional

4.2.2 Kebutuhan non-fungsional

4.3 Perancangan Ontologi

4.4 Perancangan Aplikasi Situs Perfilman Berbasis Web

4.4.1 Gambaran umum aplikasi

4.4.2 Perancangan model sistem

4.4.3 Perancangan antarmuka

BAB V. IMPLEMENTASI

5.1 Implementasi Fungsi Penarikan Data dari DBPedia

5.2 Implementasi Fungsi Pencarian Artis dan Film

5.2.1 Pencarian quick search

5.2.2 Pencarian artis

5.2.3 Pencarian film

5.3 Implementasi fungsi reasoning data

5.4 Implementasi Fungsi Penyajian Informasi

5.4.1 Halaman daftar artis

5.4.2 Halaman kategori artis

5.4.3 Halaman daftar film

5.4.4 Halaman kategori film

5.4.5 Form pembuatan berita

BAB VI. HASIL PENELITIAN DAN PEMBAHASAN

6.1 Penarikan Data ke DBPedia Endpoint

6.2 Reasoning Data

6.3 Pembuatan Berita

6.4 Pencarian Data

6.4.1 Pencarian data film

6.4.2 Pencarian data artis

6.4.3 Penelusuran hypertext link pada halaman depan

Situs

94

BAB VII. KESIMPULAN DAN SARAN

DAFTAR PUSTAKA

99

LAMPIRAN A. ONTOLOGI DBPedia

DAFTAR GAMBAR

1. Gambar 3.1 Semantic web layer cake

2. Gambar 3.2 Contoh representasi data dalam bentuk graf

3. Gambar 3.3 Skema rancangan URI

4. Gambar 3.4 Contoh relasi antar node pada model graf

5. Gambar 3.5 Contoh format RDF/XML

6. Gambar 3.6 Contoh statemen menggunakan format Turtle

7. Gambar 3.7 Penulisan beberapa statemen menggunakan format Turtle

8. Gambar 3.8 Deklarasi tipe class pada resource

9. Gambar 3.9 Contoh pendeklarasian property menggunakan RDF Schema

10. Gambar 3.10 Pendeklarasian class ex:Manusia

11. Gambar 3.11 Kumpulan dataset yang tergabung dalam linked data 27

12. Gambar 3.12 Mekanisme content negotiation

13. Gambar 3.13 Contoh baris kode untuk proses inferensi

14. Gambar 3.14 Alur pemrosesan pada JSP

15. Gambar 3.15 Diagram alur MVC pada Struts

16. Gambar 4.1 Potongan hirarki class ontologi DBPedia

17. Gambar 4.2 Gambaran umum aplikasi

18. Gambar 4.3 Diagram use-case pada pengguna umum sistem

19. Gambar 4.4 Diagram use case pada administrator sistem

20. Gambar 4.5 Diagram aktifitas pencarian quick search

21. Gambar 4.6 Diagram aktifitas pencarian kategori artis dan kategori film

22. Gambar 4.7 Diagram aktifitas login

23. Gambar 4.8 Diagram aktifitas penarikan sumber data dari luar

24. Gambar 4.9 Diagram aktifitas proses inferensi pada graf data sumber

25. Gambar 4.10 Diagram aktifitas pembuatan halaman berita

26. Gambar 4.11 Diagram aktifitas pengaturan pada aplikasi

27. Gambar 4.12 Diagram aktifitas pengubahan username dan password

28. Gambar 4.13 Antamuka halaman depan

29. Gambar 4.14 Antarmuka halaman kategori film

30. Gambar 4.15 Antarmuka halaman deskripsi film

31. Gambar 4.16 Antarmuka halaman deskripsi artis

32. Gambar 4.17 Antarmuka halaman daftar film

33. Gambar 4.18 Antamuka halaman daftar artis

34. Gambar 4.19 Antarmuka halaman login

35. Gambar 4.20 Antarmuka halaman penarikan data

36. Gambar 4.21 Antarmuka halaman proses inferensi

37. Gambar 4.22 Antarmuka halaman berita

38. Gambar 5.1 Tampilan form penarikan data

39. Gambar 5.2 Cuplikan kode Javascript untuk me-request data ke DBPedia

40. Gambar 5.3 Cuplikan kode Javascript untuk memicu request URI 65

41. Gambar 5.4 Cuplikan kode Java untuk menelusuri URI RDF

42. Gambar 5.5 Cuplikan kode pada pencarian quick search

43. Gambar 5.6 Tampilan halaman depan

44. Gambar 5.7 Cuplikan kode pada pencarian aktor/artis

45. Gambar 5.8 Tampilan halaman pencarian aktor/artis

46. Gambar 5.9 Cuplikan kode pada pencarian film

47. Gambar 5.10 Tampilan halaman pencarian film

48. Gambar 5.11 Tampilan halaman form reasoning data

49. Gambar 5.12 Cuplikan kode pada proses inferensi data

50. Gambar 5.13 Tampilan halaman daftar artis

51. Gambar 5.14 Cuplikan kode untuk menampilkan daftar artis

52. Gambar 5.15 Tampilan halaman kategori artis

53. Gambar 5.16 Cuplikan kode untuk daftar artis per kategori

54. Gambar 5.17 Tampilan halaman daftar film

55. Gambar 5.18 Cuplikan kode untuk menampilkan daftar film

56. Gambar 5.19 Tampilan halaman kategori film

57. Gambar 5.20 Cuplikan kode untuk daftar film per kategori

58. Gambar 5.21 Form pembuatan berita

59. Gambar 5.22 Cuplikan kode untuk menyimpan input pada form pembuatan berita

60. Gambar 6.1 Query SPARQL untuk menampilkan daftar film

61. Gambar 6.2 Pengisian input pada form penarikan data

62. Gambar 6.3 Tampilan log pada form penarikan data

63. Gambar 6.4 Tampilan log pada layar console di NetBeans

64. Gambar 6.5 Instance model “Data Film” yang berhasil dibuat

65. Gambar 6.6 String rule yang disertakan pada proses reasoning

66. Gambar 6.7 Pengisian input pada form reasoning

67. Gambar 6.8 Log aktifitas di layar console NetBeans

68. Gambar 6.9 Pengisian input pada form pembuatan berita

69. Gambar 6.10 Tabel data hasil tes pada query SPARQL

70. Gambar 6.11 Data berita yang berhasil disimpan

71. Gambar 6.12 Informasi berita pada halaman depan situs

72. Gambar 6.13 Query SPARQL yang dihasilkan pada pencarian film 88

73. Gambar 6.14 Tabel data hasil pencarian film

74. Gambar 6.15 Query SPARQL yang dihasilkan pada pencarian film 89

75. Gambar 6.16 Tabel data hasil pencarian film

76. Gambar 6.17 Query SPARQL pada pencarian artis

77. Gambar 6.18 Tabel data hasil pencarian artis

78. Gambar 6.19 Query SPARQL pada pencarian artis

79. Gambar 6.20 Tabel data hasil pencarian artis

80. Gambar 6.21 Halaman profil artis “Dany Glover”

81. Gambar 6.22 Halaman informasi film ”Harimaya Bridge”

DAFTAR TABEL

18

1. Tabel 3.1 Kumpulan class pada RDF

19

2. Tabel 3.2 Kumpulan property pada RDF

41

3. Tabel 4.1 Daftar properti pada class Artis

42

4. Tabel 4.2 Daftar properti pada class Film

INTISARI

Penggunaan Linked Data Sebagai Sumber Data Pada Aplikasi Berbasis Web

Oleh

Ahmad Muiz Lidinillah 08/273420/EPA/00928

World Wide Web telah mengubah cara manusia dalam berinteraksi dan berbagi pengetahuan terhadap sesama. Kumpulan informasi yang ada disajikan dalam format yang mudah dipahami seperti HTML, sedangkan proses penelusuran dilakukan dengan memanfaatkan link hyperteks yang terkandung didalamnya. Namun sayangnya, proses yang demikian tidak memungkinkan komputer untuk memproses informasi tersebut secara semantik. Jenis format yang digunakan saat ini lebih menekankan pada layout supaya mudah dipahami oleh manusia, bukan komputer. Dibutuhkan sebuah format yang dapat merepresentasikan informasi tersebut tanpa harus kehilangan nilai semantik yang terkandung di dalamnya. Selain itu, perlu adanya keterlibatan dari banyak pihak agar pemakaiannya dapat diterapkan secara meluas.

Linked data ditujukan untuk mengatasi permasalahan tersebut dengan menyediakan sejumlah petunjuk bagaimana mempublikasikan informasi tersebut tanpa harus kehilangan nilai semantik yang ada. Informasi yang ada diidentifikasi menggunakan URI dan disajikan dalam dua format , yaitu format HTML untuk manusia dan format RDF untuk komputer. Selain itu terdapat mekanisme pengaturan konten untuk memilih format pada saat proses request dilakukan. Hingga tahun 2009 diperkirakan lebih dari 4,7 milyar RDF triples tersedia pada linked data dan bebas dikonsumsi oleh siapa saja.

Pada penelitian ini akan dibangun sebuah aplikasi web yang menggunakan dataset yang bersumber dari linked data dengan studi kasus berupa situs informasi perfilman. Adapun library yang digunakan diantaranya Jena untuk memproses data RDF dan Struts sebagai framework pembuatan sistem. Tujuannya adalah mengeksplorasi sekaligus menunjukkan pemanfaatan linked data sebagai sumber data utama pada aplikasi yang dibangun.

Kata kunci : Semantic Web, RDF, Linked Data

ABSTRACT

Linked Data Usage As Dataset Resource For Web Based Application

by

Ahmad Muiz Lidinillah 08/273420/EPA/00928

The World Wide Web has altered the way human interact and share knowledge with others. Every information is available in format that easy to understand like HTML, while navigating process can be done by traversing a hypertext link inside the document. Unfortunately, the way information is provided make a computer unable to process the information semantically. The format to represent information impress to the layout that can be understood by human, not computer. Therefore, we need an alternative format to keep the semantic value inside. Besides, a lot of participants are needed to implement it on

a global scale.

Linked data aimed to solve this problem by providing a set of guidence on how to publish this information without losing the semantic values. Every information identified by URI and provided in two format, HTML for human and RDF for computer. Also, there is a content negotiation mechanism to handle the right format while a request is coming. Estimated by 2009, more than 4.7 billion RDF triples available in linked data and free consumed by anyone.

In this research, we will build a web application about movie sites by using dataset from linked data. We used Jena library for RDF processing and Struts as framework for building system. The purpose is to explore and show the benefit from linked data while implemented as dataset resource for application.

Keywords: Semantic Web, RDF, Linked Data

BAB I PENDAHULUAN

1.1. Latar Belakang

Teknologi internet telah merubah cara manusia dalam berbagi pengetahuan. Beragam informasi tentang berbagai macam hal kini tersedia dan dapat diakses oleh setiap orang dimanapun dia berada. Untuk mengakses informasi tersebut, pengguna cukup menelusuri link yang disediakan. Apabila dirasa masih kurang, layanan pencarian yang ditawarkan oleh sejumlah search engine seperti Google atau Yahoo dapat dimanfaatkan untuk membantu operasi pencarian yang lebih spesifik.

Umumnya informasi yang beredar saat ini disajikan dalam format yang hanya dapat dipahami oleh manusia, salah satunya HTML. Format ini disajikan dalam bentuk kumpulan tag terstruktur untuk merepresentasikan layout dari halaman web yang ada sehingga informasi yang disajikan dapat dengan mudah dipahami manusia, namun tidak oleh mesin. Struktur yang ada menghilangkan nilai semantik pada informasi. Apabila semantik tersebut tetap dipelihara, maka sejumlah keuntungan dapat diperoleh seperti proses otomatisasi, integrasi, dan penggunaan kembali data pada berbagai aplikasi.

Beberapa pendekatan dilakukan untuk tetap mempertahankan semantik pada format HTML yang digunakan, salah satunya dengan menyediakan metadata berupa tag <META> . Dengan tag ini dapat disediakan sejumlah kata kunci terkait dengan informasi pada halaman web tersebut. Namun sayangnya, kata kunci yang dapat disertakan sifatnya masih umum dan terbatas. Selain itu, pada tag ini tidak dimungkinkan untuk menyertakan link ke sumber lain untuk memperkaya kata kunci yang disajikan (Hebeler, 2009).

Linked data menawarkan solusi dimana sejumlah data dipublikasikan sebagai data bersama untuk dikonsumsi publik. Semantik pada data tetap tersimpan dengan memanfaatkan model RDF sebagai format penyimpanan data Linked data menawarkan solusi dimana sejumlah data dipublikasikan sebagai data bersama untuk dikonsumsi publik. Semantik pada data tetap tersimpan dengan memanfaatkan model RDF sebagai format penyimpanan data

Berdasarkan uraian di atas, pada penelitian ini akan difokuskan pada bagaimana memanfaatkan linked data sebagai sumber data pada sistem untuk memperoleh informasi yang diperlukan.

1.2. Rumusan Masalah

Berdasarkan latar belakang di atas, maka rumusan permasalahannya adalah bagaimana membangun sebuah sistem yang dapat menyajikan informasi dengan memanfaatkan linked data sebagai sumber data sistem dan disertai fitur pencarian data.

1.3. Batasan Masalah

Untuk memfokuskan arah penelitian serta memperjelas penyelesaian penelitian, maka diperlukan adanya pembatasan masalah, yaitu sebagai berikut:

1. Penelitian difokuskan pada bagaimana menggunakan sumber data dari luar sistem berupa linked data dalam format triple RDF untuk disertakan ke dalam aplikasi sistem. Hal lain yang terkait seperti isu trust didalam pemakaian data tersebut tidak dibahas.

2. Data yang digunakan bersumber dari DBPedia.

3. Pada aplikasi disediakan fungsi pencarian agar didapat informasi yang lebih relevan.

4. Domain data yang digunakan dibatasi seputar dunia perfilman.

5. Aplikasi dibangun dengan menggunakan framework semantic web yaitu Jena dan teknologi Java Server Pages.

1.4. Tujuan Penelitian

Tujuan penelitian ini adalah membuat sebuah aplikasi berbasis web yang didalamnya disajikan informasi seputar perfilman dengan memanfaatkan sumber data dari luar berupa linked data dalam format RDF.

1.5. Manfaat Penelitian

Manfaat yang diharapkan dari penulisan tugas akhir ini adalah:

1. Mengkaji dan mengeksplorasi pemanfaatan teknologi semantic web yang berkembang saat ini, terutama di bidang Linked Data.

2. Sebagai salah satu model alternatif dalam pembangunan aplikasi berbasis web saat ini, dimana sumber data tidak semata-mata berasal dari dalam sistem melainkan memanfaatkan sumber data dari luar. Hal ini bertujuan untuk memperkaya informasi yang akan disajikan oleh sistem.

3. Sebagai bahan referensi untuk penelitian yang serupa di masa mendatang.

1.6. Metode Penelitian

Metode penelitian yang digunakan dalam penulisan skripsi ini adalah :

1. Metode Studi Literatur Studi literatur dilakukan dengan mempelajari sejumlah referensi yang berkaitan erat dengan materi penelitian baik melalui buku atau media internet.

2. Analisis dan Perancangan Sistem Mengidentifikasi karakteristik sistem beserta kebutuhannya untuk mendapatkan gambaran menyeluruh tentang aplikasi yang hendak dibangun.

3. Implementasi dan Pengujian Pembuatan aplikasi dilakukan dengan menggunakan librari Jena sebagai engine sistem untuk memparsing data dalam format RDF dan SPARQL sebagai bahasa query untuk menampilkan data.

4. Pembahasan dan Penulisan Tugas Akhir Meliputi pembahasan dari analisis sistem hingga pembuatan aplikasi berbasis teknologi semantic web untuk dijadikan dasar dalam penulisan skripsi.

1.7. Sistematika Penulisan

Sistematika penulisan laporan ini meliputi :

BAB 1

PENDAHULUAN

Bab ini menjelaskan tentang latar belakang masalah, rumusan masalah, batasan masalah, maksud dan tujuan penelitian, metode pengumpulan data, dan sistematika penulisan.

BAB II

TINJAUAN PUSTAKA

Bab ini memuat uraian sistematis tentang informasi hasil penelitian terdahulu yang berhubungan dengan penelitian yang dilakukan saat ini. Informasi hasil penelitian tersebut digunakan sebagai acuan dalam penelitian ini.

BAB III

LANDASAN TEORI

Bab ini menjelaskan tentang berbagai hal umum dan mendasar yang mendukung penelitian ini.

BAB IV ANALISIS DAN PERANCANGAN SISTEM

Bab ini menjelaskan tentang analisis terhadap kebutuhan sistem dan perancangan sistem yang akan dibuat.

BAB V

IMPLEMENTASI

Bab ini menjelaskan tentang implementasi penggunaan linked dataset ke dalam sistem beserta perancangan fungsi pencarian secara semantik pada sistem yang akan dibuat.

BAB VI HASIL PENELITIAN DAN PEMBAHASAN

Bab ini membahas hasil penelitian yang telah dilakukan beserta pengujian terhadap sistem yang telah dibangun.

BAB VII

PENUTUP

Bagian terakhir ini akan memaparkan hal-hal yang dapat disimpulkan berdasar pembahasan sebelumnya beserta saran-saran yang sekiranya dapat diberikan untuk pembuatan program serupa dan pengembangannya di kemudian hari.

BAB II TINJAUAN PUSTAKA

Saat ini penelitian mengenai aplikasi terkait semantic web berbasis linked data sudah mulai banyak dilakukan. Penelitian ini umunya berfokus pada pemanfaatan sekumpulan dataset di luar sistem untuk diintegrasikan ke dalam sistem yang dibangun. Salah satunya penelitian tentang Researchers Map Application yang dilakukan oleh Hartig dkk (2009) dimana aplikasi tersebut dapat menunjukkan peta lokasi tempat kerja para professor Jerman serta menampilkan profil dan daftar karya mereka yang telah dipublikasikan. Tak hanya itu, aplikasi ini juga menyediakan fungsi filtering dalam menampilkan daftar nama professor tersebut berdasarkan bidang penelitiannya, semisal query optimization atau data warehousing . Adapun data yang digunakan berasal dari file RDF dipublikasikan oleh professor tersebut di blog miliknya. Aplikasi ini sendiri memanfaatkan API Google Maps dalam menampilkan peta lokasi para professor tersebut di wilayah Jerman.

Selain itu terdapat penelitian yang dilakukan oleh Bastian (2009) mengenai aplikasi gFacet yang menyajikan visualisasi pada model data graph disertai fungsi filtering dari banyak segi. gFacet dirancang sebagai RDF browser untuk mengeksplorasi sekumpulan sumber data RDF di luar dengan memanfaatkan relasi yang terjalin antara satu entitas dengan entitas lainnya. Di sini Bastian mencoba memodifikasi gFacet yang sudah ada dengan tujuan untuk mengoptimalkan proses querying data pada aplikasi. Operasi query data sepenuhnya diletakkan disisi client tanpa melalui server terlebih dahulu sehingga proses penelusuran data lebih efisien dan waktu tunggu respon dapat diminimalisir. Selain itu pada query yang digunakan ditambahkan SPARQL ekstension berupa OFFSET dan LIMIT untuk membatasi baris data yang diminta. Adapun sumber data yang digunakan berupa DBPedia sebagai sumber data utama ditambah dengan MusicBrainz dan DBTune untuk menyediakan informasi seputar Selain itu terdapat penelitian yang dilakukan oleh Bastian (2009) mengenai aplikasi gFacet yang menyajikan visualisasi pada model data graph disertai fungsi filtering dari banyak segi. gFacet dirancang sebagai RDF browser untuk mengeksplorasi sekumpulan sumber data RDF di luar dengan memanfaatkan relasi yang terjalin antara satu entitas dengan entitas lainnya. Di sini Bastian mencoba memodifikasi gFacet yang sudah ada dengan tujuan untuk mengoptimalkan proses querying data pada aplikasi. Operasi query data sepenuhnya diletakkan disisi client tanpa melalui server terlebih dahulu sehingga proses penelusuran data lebih efisien dan waktu tunggu respon dapat diminimalisir. Selain itu pada query yang digunakan ditambahkan SPARQL ekstension berupa OFFSET dan LIMIT untuk membatasi baris data yang diminta. Adapun sumber data yang digunakan berupa DBPedia sebagai sumber data utama ditambah dengan MusicBrainz dan DBTune untuk menyediakan informasi seputar

Selanjutnya mengenai paper yang ditulis oleh Hausenblas (2009). Disini Hausenblas menggambarkan contoh nyata penggunaan linked data sebagai sumber data pada situs BBC Music beta. Situs ini memanfaatkan sumber data dari DBpedia untuk menyediakan informasi biografi artis musik dan MusicBrainz sebagai metadata sekaligus identifier yang merujuk ke artis musik tertentu. Selain itu, dijelaskan pula secara singkat tahapan-tahapan yang harus dilakukan di dalam memanfaatkan linked data sebagai sumber data pada aplikasi yang dibangun.

Mengenai penelitian yang berasal dari UGM, penulis menemukan beberapa yang membahas tentang semantic web, namun sejauh pengamatan penulis sumber data yang digunakan masih bersifat lokal belum memanfaatkan dataset dari luar sistem. Contohnya mengenai penelitian yang dilakukan oleh Nurkamid (2009) dengan membangun sebuah aplikasi pencarian untuk bibliografi perpustakaan dengan menggunakan RDF/OWL sebagai bagian dari teknologi semantic web . Nurkamid menggunakan pendekatan SKOS (Simple Knowledge Organization System) untuk membantu merepresentasikan dan mengatur kosakata di dalam teknologi semantic web. Untuk membangun ontologi beserta instance data yang diperlukan, digunakan tool Protege. Ontologi dan instance data ini nantinya yang menjadi sumber data bagi aplikasi yang dibuat.

Selain itu penelitian yang dilakukan oleh Bendi (2010) tentang sistem question answering berbasis ontologi dengan area informasi seputar dunia perfilman. Sistem ini nantinya menerima query yang diajukan dalam bahasa alami, mencari jawaban pada sekumpulan dokumen atau pada sebuah basis data pengetahuan, mengestraknya dan kemudian memformulasikan jawaban yang ringkas bagi pengguna. Pemanfaatan ontologi sebagai model representasi pengetahuan dipandang dapat meningkatkan kinerja sistem dikarenakan query Selain itu penelitian yang dilakukan oleh Bendi (2010) tentang sistem question answering berbasis ontologi dengan area informasi seputar dunia perfilman. Sistem ini nantinya menerima query yang diajukan dalam bahasa alami, mencari jawaban pada sekumpulan dokumen atau pada sebuah basis data pengetahuan, mengestraknya dan kemudian memformulasikan jawaban yang ringkas bagi pengguna. Pemanfaatan ontologi sebagai model representasi pengetahuan dipandang dapat meningkatkan kinerja sistem dikarenakan query

BAB III LANDASAN TEORI

3.1 Semantic Web

Berners-Lee menggambarkan teknologi semantic web sebagai perluasan dari web yang ada saat ini, dimana informasi memiliki arti yang terdefinisi secara lebih baik dengan mengupayakan persamaan persepsi antara konsep-konsep yang ada, sehingga memungkinkan manusia dan komputer untuk bekerjasama secara lebih optimal (Berners-Lee, 2001). Hal ini dilakukan dengan cara menyediakan metadata yang diperuntukkan khusus untuk mesin, sehingga mesin mampu memproses nilai semantik yang terkandung dalam dokumen tersebut.

Umumnya informasi yang ada saat ini disajikan dalam format yang dapat dibaca oleh manusia, tidak oleh komputer. Komputer lebih ditujukan untuk memproses struktur tampilan dalam menyajikan suatu informasi, bukan untuk memproses nilai semantik dari informasi tersebut. Contohnya pada format halaman web seperti HTML, yang merepresentasikan layout halaman web berdasarkan kumpulan tag element yang didefinisikan oleh W3C (World Wide Web Consortium) . Format ini ditujukan agar informasi yang disajikan dapat dipahami oleh manusia, namun tidak oleh mesin. Andaikata disediakan mekanisme untuk menyimpan sekaligus memproses semantik dari informasi yang ada, sejumlah keuntungan dapat diperoleh seperti automatic reasoning atau inference deduction untuk membentuk informasi baru.

3.1.1 Arsitektur semantic web

Pengembangan teknologi semantic web dilakukan secara bertahap dan digambarkan sebagai suatu tumpukan layer teknologi dari komponen pembangunnya. W3C menyebutnya sebagai semantic web layer cake dan dapat dilihat pada Gambar 3.1.

Gambar 3.1 Semantic web layer cake (Bratt, 2007)

W3C merekomendasikan didalam semantic web activity terdapat beberapa layer arsitektur dari semantic web. Pada bagian paling bawah adalah layer Unicode dan URI (Uniform Resource Identifiers) yang memastikan penggunaan sekumpulan karakter yang telah disepakati secara internasional dan menyediakan alat untuk mengidentifikasi obyek di semantic web. Jenis URI yang paling umum dan banyak digunakan yaitu URL (Uniform Resource Locator).

Diatas layer Unicode dan URI (Uniform Resource Identifier) terdapat XML dan RDF sebagai format pertukaran data. RDF digunakan untuk merepresentasikan knowledge base yang ada dalam bentuk triple statement dan tersedia dalam beberapa macam format serialisasi seperti RDF/XML, Turtle, N- Triples dan N3.

Selanjutnya setelah itu terdapat SPARQL, RDF Schema, OWL dan RIF. SPARQL merupakan bahasa query sekaligus protokol yang digunakan dalam mengakses data pada semantic web. RDF Schema dan OWL digunakan untuk mengekspresikan semantik dari data yang ada dan ditulis dalam format RDF. Adapun RIF (Rule Interchange Format) dirancang untuk menangani masalah interoperabilitas pada bahasa rule yang digunakan, bagaimana suatu rule yang ada dapat dipertukarkan dan digunakan oleh sistem lainnya. Untuk bahasanya sendiri, Selanjutnya setelah itu terdapat SPARQL, RDF Schema, OWL dan RIF. SPARQL merupakan bahasa query sekaligus protokol yang digunakan dalam mengakses data pada semantic web. RDF Schema dan OWL digunakan untuk mengekspresikan semantik dari data yang ada dan ditulis dalam format RDF. Adapun RIF (Rule Interchange Format) dirancang untuk menangani masalah interoperabilitas pada bahasa rule yang digunakan, bagaimana suatu rule yang ada dapat dipertukarkan dan digunakan oleh sistem lainnya. Untuk bahasanya sendiri,

Selanjutnya untuk ketiga layer diatasnya yaitu Unifying Logic, Proof dan Trust , hingga saat ini masih dalam proses perkembangan. Layer Proof dan Trust bertujuan untuk memastikan keabsahan dan derajat kepercayaan didalam pemakaian informasi tersebut.

Mengenai layer paling atas yaitu User Interface & Application, hal ini mengacu pada aplikasi atau software agent yang dibangun tepat diatas semantic web dan bagaimana layout yang disajikan dalam mewadahi interaksi dengan para penggunanya. Hal ini penting mengingat ekspresi kaya yang dapat dimunculkan serta eksploitasi yang dapat dilakukan terhadap struktur data dari semantic web tersebut.

3.1.2 Perkembangan semantic web saat ini

Ide dari semantic web adalah dimungkinkannya proses inferensi oleh mesin komputer terhadap data-data yang tersebar di internet. Untuk itu diperlukan adanya publikasi data oleh berbagai pihak dalam format yang disepakati, yaitu RDF. Selanjutnya upaya tersebut mulai diwujudkan oleh sejumlah pihak, seperti DBPedia yang mempublikasikan data-data dari Wikipedia ke dalam format RDF. Ada pula layanan jejaring sosial seperti LiveJournal.com dan Tribe yang mengekspor data para anggotanya menjadi file FOAF (Friend of a Friend) dalam format RDF (Golbeck dan Rothstein, 2008). Semuanya ini berujung pada penyediaan data yang dapat diakses via web menggunakan format RDF.

Meskipun upaya penyediaan data ini mulai membuahkan hasil, namun dalam perkembangannya semantic web masih menghadapi sejumlah tantangan (Heath dkk, 2009). Beberapa isu yang dihadapi saat ini diantaranya seperti mapping ontology dan data fusion, bagaimana mengatasi ketidak-sesuaian disaat menggabungkan sejumlah data dari sumber yang berbeda dan memetakan skema ontologi yang digunakan. Ada lagi tentang social networks, bagaimana menerapkan teknologi semantic web ke sejumlah layanan jejaring sosial untuk menganalisis data-data sosial yang terkandung di dalamnya. Dan terakhir terkait Meskipun upaya penyediaan data ini mulai membuahkan hasil, namun dalam perkembangannya semantic web masih menghadapi sejumlah tantangan (Heath dkk, 2009). Beberapa isu yang dihadapi saat ini diantaranya seperti mapping ontology dan data fusion, bagaimana mengatasi ketidak-sesuaian disaat menggabungkan sejumlah data dari sumber yang berbeda dan memetakan skema ontologi yang digunakan. Ada lagi tentang social networks, bagaimana menerapkan teknologi semantic web ke sejumlah layanan jejaring sosial untuk menganalisis data-data sosial yang terkandung di dalamnya. Dan terakhir terkait

3.2 RDF (Resource Descriptor Framework)

RDF adalah bahasa yang digunakan untuk merepresentasikan informasi pada web dan direkomendasikan W3C sebagai format standar penyimpanan data pada teknologi semantic web (Brickley dan Guha, 2004). Tiap dokumen RDF merupakan kumpulan statemen yang terdiri dari subyek, predikat dan obyek yang disebut juga sebagai triples. Kumpulan statemen ini apabila digambarkan membentuk sekumpulan node yang saling terhubung oleh edge berbentuk arah panah sehingga membentuk suatu graf. Hal ini dapat dilihat pada Gambar 3.2.

John @yahoo.

live at

working at

hobby

live at

SaintHope Hospital

Reading

London

Gambar 3.2 Contoh representasi data dalam bentuk graf

RDF merupakan model data independen, tidak terikat dengan domain informasi yang disajikan alias bersifat netral (Lasilla dan Swick, 1999). Seluruh domain informasi apapun dapat direpresentasikan menggunakan format RDF. Hal ini menjadikan RDF sebagai sebuah bahasa yang fleksibel dan cocok untuk merepresentasikan basis pengetahuan pada semantic web. Tak hanya itu, RDF juga dirancang sebagai media pertukaran data. Terdapat sejumlah format serialisasi RDF yang cukup terkenal, seperti RDF/XML, Turtle (Terse RDF Triple Languange) dan N-Triples.

3.2.1 Model data RDF

RDF mendeskripsikan segala sesuatu yang ada di sekitar sebagai sebuah resource . Tiap-tiap resource ini diberi pengenal unik berupa URI (Universal Resource Identifier) . URI berfungsi seperti URL, namun lebih luas dimana

seluruh hal yang dapat ditelusuri baik secara eletronik ataupun tidak diberikan pengenal ini. Dengan URI, agen atau mesin dapat merujuk kepada resource yang direfer oleh URI tersebut secara konsisten dan bersifat global tidak terbatas hanya pada ruang lingkup sistem dimana resource tersebut dideskripsikan. Aplikasi atau dataset di luar sistem dapat merefer ke resource menggunakan URI yang didefinisikan oleh sistem tersebut.

URI pada dasarnya merupakan untaian string yang tersusun dari URI schema, lalu diikuti titik dua dan dua garis miring (://), lalu hostname dan port number (opsional) dan terakhir alamat spesifik berupa hierarchical path yang mengarah ke resource yang direpresentasikan (Segaran, 2009). URI scheme mengidentifikasi protokol yang digunakan oleh URI dan kebanyakan berupa http atau https. Pada bagian alamat atau path yang merefer ke resource, masing- masing organisasi bebas menentukan penamaan sekaligus hirarki pada path tersebut berdasarkan pada hostname yang mereka pegang, sehingga mencegah adanya URI yang sama untuk dua entitas yang berbeda. Dengan demikian URI dapat juga dikatakan sebagai strong identifier. Gambar 3.3 menampilkan contoh skema rancangan pada URI.

Gambar 3.3 Skema rancangan URI

Dalam format RDF, subyek pada statemen terdiri dari resource atau blank node , predikat selalu terdiri dari resource dan obyek pada statemen terdiri dari resource , literal, atau blank node. Literal merepresentasikan nilai data konkret

seperti angka atau string, sedangkan blank nodes digunakan untuk seperti angka atau string, sedangkan blank nodes digunakan untuk

3.2.2 Blank nodes

Tidak semua node pada graf RDF memiliki URI sebagai identifiernya. Terdapat kemungkinan suatu node yang merepresentasikan resource tertentu tidak diberikan URI karena tidak dimungkinkannya pemberian URI yang cocok untuk mengalamati resource tersebut (Segaran, 2009). Node yang demikian disebut sebagai anonymous node atau blank node. Pada blank node ini nantinya diberikan penamaan unik yang bersifat lokal, hanya berlaku pada konteks dokumen RDF dimana resource tersebut didefinisikan sehinga tidak dapat direfer diluar dokumen RDF tersebut.

Blank node pada dasarnya digunakan untuk merepresentasikan existential variable (Hebeler, 2009). Hal ini dapat diibaratkan dalam kehidupan disekitar dimana terdapat pernyataan “terdapat pasangan hidup untuk setiap orang dimuka bumi”. Disini “pasangan hidup” dapat dianggap sebagai sebuah existential variable yang menggambarkan keberadaan seseorang namun tidak dapat diidentifikasi dengan pasti siapa orang tersebut sebenarnya. Entitas yang hendak direpresentasikan disini tidaklah sepenuhnya jelas melainkan masih bersifat abstrak.

3.2.3 Format serialisasi RDF

Model data RDF berguna dalam menyajikan informasi, namun masih dalam bentuk abstrak. Serialisasi menjadikan model RDF yang tadinya masih bersifat abstrak ke dalam persistent form seperti text file, sehingga dimungkinkannya proses pertukaran data antar komputer yang berbeda. Adapun format serialisasi RDF yang cukup populer dan banyak digunakan diantaranya:

1. RDF/XML RDF/XML merupakan format serialisasi RDF dimana sintak penulisannya didasarkan pada aturan penulisan XML. Tiap statemen pada RDF diawali mengunakan elemen <rdf:Desciption>. Pada <rdf:Description> terdapat 1. RDF/XML RDF/XML merupakan format serialisasi RDF dimana sintak penulisannya didasarkan pada aturan penulisan XML. Tiap statemen pada RDF diawali mengunakan elemen <rdf:Desciption>. Pada <rdf:Description> terdapat

Gambar 3.4 Contoh relasi antar node pada model graf

Gambar graf diatas dapat dinyatakan dalam format RDF/XML sebagaimana yang tersaji pada Gambar 3.5.

<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:foaf=”http://xmlns.com/foaf/0.1/”> <rdf :Description rdf :About=”http://example.org/toby.rdf #ts> <foaf:knows> <rdf :Description rdf :About=”http://example.org/people/colin”>

<foaf:name>Colin Evans</foaf:name> </rdf :Description> </foaf:knows> </rdf :Description> </rdf :RDF >

Gambar 3.5 Contoh format RDF/XML

Pada RDF/XML, untuk menyingkat penulisan URI digunakan aliasing mengunakan standar XML namespace dengan tujuan menghindari penulisan URI yang panjang berulang-ulang sehingga lebih singkat dan Pada RDF/XML, untuk menyingkat penulisan URI digunakan aliasing mengunakan standar XML namespace dengan tujuan menghindari penulisan URI yang panjang berulang-ulang sehingga lebih singkat dan

2. Turtle (Terse RDF Triple Languange) Format serialisasi RDF selanjutnya adalah Turtle. Turtle menyajikan tatacara penulisan sintak yang lebih simple dan mudah dibaca bagi manusia. Pada Turtle tiap statemen ditulis dalam satu baris dan diakhiri dengan tanda titik. Gambar 3.6 menampilkan contoh statemen menggunakan format Turtle.

people:Ryan ext :w orksWit h people:John .

Gambar 3.6 Contoh statemen menggunakan format Turtle

Apabila terdapat kumpulan statemen yang memiliki bagian subyek yang sama, maka penulisan dapat dipersingkat. Pada baris pertama cukup ditulis subyek statemen, lalu pada baris selanjutnya cukup ditulis predikat dan obyek dari statemen. Masing-masing baris kecuali pada baris terakhir diakhiri dengan tanda titik koma (;) untuk menandakan statemen tersebut merefer ke subyek yang sama dengan statemen diatasnya. Adapun contohnya dapat dilihat pada Gambar 3.7.

people:Andrew foaf:knows people:Matt ; foaf:surname "Perez-Lopez" .

Gambar 3.7 Penulisan beberapa statemen menggunakan format

Turtle

Sedangkan apabila kumpulan statemen RDF hanya berbeda pada obyeknya saja, maka penulisan dapat dipersingkat menjadi satu baris dengan urutan subyek, predikat, lalu kumpulan obyek dari masing-masing statemen dipisah oleh tanda koma dan terakhir ditutup dengan tanda titik.

3. N-Triples N-Triples memiliki tata cara penulisan sintak yang mirip dengan Turtles, namun lebih terbatas. Pada N-Triples, tiap subyek, predikat, maupun obyek pada statemen ditulis dalam satu baris dan dicantumkan URI yang 3. N-Triples N-Triples memiliki tata cara penulisan sintak yang mirip dengan Turtles, namun lebih terbatas. Pada N-Triples, tiap subyek, predikat, maupun obyek pada statemen ditulis dalam satu baris dan dicantumkan URI yang

3.3 RDF Schema

RDF Schema merupakan perluasan semantik pada RDF untuk menggambarkan resource yang ada. Pada RDF Schema disediakan mekanisme untuk mengelompokkan sekumpulan resource yang sejenis ke dalam class-class tertentu serta relationship pada masing-masing resource tersebut dapat ditentukan (Brickley dan Guha, 2004). Sekumpulan vocabulary pada RDF Schema nantinya digunakan untuk mendeskripsikan karakteristik dari resource dalam konteks domain tertentu, seperti rdfs:range, rdfs:domain dan lain-lain.

3.3.1 Class

Untuk mengelompokkan resource ke dalam ke dalam class-class tertentu, dapat digunakan vocabulary rdf:class. Dimisalkan terdapat statemen yang menyatakan bahwa Andi adalah manusia. Statemen ini dapat dinyatakan ke dalam format RDF Turtles sebagaimana yang tersaji pada Gambar 3.8.

@prefix ex: <http://example.org/>. ex:Manusia rdf :type rdfs:Class . ex:Andi rdf :type ex:Manusia .

Gambar 3.8 Deklarasi tipe class pada resource

Beberapa vocabulary yang digunakan untuk mendefinisikan class diantaranya seperti rdfs:Resource, rdfs:Literal, rdfs:Datatype, rdf:XMLLiteral dan rdf:Property.

3.3.2 Property

Property pada RDF dapat dianggap sebagai sekumpulan atribut yang menggambarkan karakteristik dari resource . Property tersebut juga merepresentasikan relasi yang terjadi antara satu resource dan resource lainnya. Untuk menyatakan relationship pada suatu resource, dapat digunakan sejumlah vocabulary yang berasal dari RDF Schema, diantaranya rdf:range atau rdf:domain. rdf:range digunakan untuk menentukan instance dari class apa saja yang dapat menjadi obyek suatu statemen berpasangan dengan predikat yang disebutkan oleh rdf:type. Adapun rdf:domain digunakan untuk menentukan instance dari class apa saja yang dapat menjadi subyek suatu statemen berpasangan dengan predikat yang disebutkan oleh rdf:domain. Pada Gambar 3.9 disajikan contoh relationship yang muncul antara manusia dengan hewan.

ex:makan rdf:type rdf :Property . ex:makan rdfs:domain ex:Manusia . ex:makan rdfs:range ex:Hewan . ex:Ayam rdf:type ex:Hewan . ex:Andi ex:makan ex:Ayam .

Gambar 3.9 Contoh pendeklarasian property menggunakan RDF Schema

Vocabulary yang disebutkan diatas hanyalah beberapa dari sekian vocabulary yang terdapat pada RDF Schema. Tabel 3.1 dan Tabel 3.2 memuat kumpulan vocabulary yang tersedia pada RDF Schema.

Tabel 3.1 Kumpulan class pada RDF (Brickley dan Guha, 2004) Class name

rdfs:Resource rdfs:Literal rdf:XMLLiteral rdfs:Class rdf:Property rdfs:Datatype rdf:Statement rdf:Bag rdf:Seq rdf:Alt rdfs:Container

Tabel 3.2 Kumpulan property pada RDF (Brickley dan Guha, 2004)

Property name domain range rdf:type rdfs:Resource rdfs:Class rdfs:subClassOf rdfs:Class rdfs:Class rdfs:subPropertyOf rdf:Property rdf:Property rdfs:domain rdf:Property rdfs:Class rdfs:range rdf:Property rdfs:Class rdfs:label rdfs:Resource rdfs:Literal rdfs:comment rdfs:Resource rdfs:Literal rdfs:member rdfs:Resource rdfs:Resource rdf:first rdf:List rdfs:Resource rdf:rest rdf:List rdf:List rdfs:seeAlso rdfs:Resource rdfs:Resource rdfs:isDefinedBy rdfs:Resource rdfs:Resource rdf:value rdfs:Resource rdfs:Resource rdf:subject rdf:Statement rdfs:Resource rdf:predicate rdf:Statement rdfs:Resource rdf:object rdf:Statement rdfs:Resource

3.4 OWL (Ontology Web Language)

OWL adalah bahasa yang dibangun sebagai perluasan dari RDF Schema dengan beberapa tambahan yang dapat meningkatkan ekspresi ontologi pada web (Hebeler, 2009). Ontologi sendiri merupakan istilah yang dipinjam dari ilmu filsafat yang merujuk pada disiplin ilmu yang mendeskripsikan entitas yang ada didunia dan bagaimana entitas tersebut saling berelasi antara satu sama lain. OWL lebih ekspresif dibandingkan dengan RDF Schema dalam mendefinisikan suatu class beserta property-nya sehingga dimungkinkkan proses reasoning yang lebih powerfull .

OWL umumnya disimpan dalam bentuk dokumen pada web. Tiap dokumen ini terdiri dari ontology header, annotation dan definisi dari class dan property . Dikarenakan OWL direpresentasikan menggunakan model RDF , maka tidak ada batasan yang jelas antara ontologi dengan data yang dideskripsikan oleh ontologi tersebut. Suatu ontologi beserta instance data dapat disajikan dalam satu dokumen yang sama. Untuk itu, sebaiknya dipisahkan antara dokumen yang OWL umumnya disimpan dalam bentuk dokumen pada web. Tiap dokumen ini terdiri dari ontology header, annotation dan definisi dari class dan property . Dikarenakan OWL direpresentasikan menggunakan model RDF , maka tidak ada batasan yang jelas antara ontologi dengan data yang dideskripsikan oleh ontologi tersebut. Suatu ontologi beserta instance data dapat disajikan dalam satu dokumen yang sama. Untuk itu, sebaiknya dipisahkan antara dokumen yang

Pada OWL, vocabulary yang ada didefinisikan pada namespace http://www.w3c.org/2002/07/owl# dan umumnya menggunakan prefix owl . Vocabulary tersebut menyediakan perluasan fungsi yang tidak dimiliki oleh vocabulary pada RDF Schema. Beberapa fungsi tersebut diantaranya (Antoniou dan Hermelen, 2008):

1. Property Restriction , yaitu menentukan class apa saja yang merupakan bagian dari range suatu property secara lebih ketat. Pada RDF Schema, batasan yang diberikan bersifat global, tidak dapat diterapkan hanya untuk class -class tertentu saja. Sedangkan pada OWL, batasan yang diberikan dapat bersifat lokal.

2. Cardinality Restrictions , yaitu menentukan berapa banyak jumlah suatu property yang dapat digunakan pada instance dari class tertentu. Misalnya diberikan suatu statemen bahwa sesorang memiliki maksimal dua orang tua. Dengan cardinality restrictions, batasan tersebut dapat diberikan menggunakan owl:maxCardinality.

3. Disjointness of Classes , yaitu menyatakan bahwa suatu class merupakan himpunan saling asing dengan class lainnya. Contohnya pada class male dan female, dimana tiap orang hanya bisa menjadi instance dari salah satu class tersebut, tidak kedua-duanya.

3.4.1 Jenis-jenis OWL

OWL menyediakan tiga jenis sub-bahasa yang berbeda tingkatannya dan dirancang untuk memenuhi berbagai kebutuhan tertentu dari penggunanya. Tiap sub-bahasa tersebut merupakan perluasan dari sub-bahasa terdahulu yang lebih sederhana. Ketiga jenis sub-bahasa ini terdiri atas OWL-Lite, OWL-DL dan OWL-Full.

Berikut ini penjelasan tentang ketiga jenis sub-bahasa tersebut:

1. OWL-Lite Dilihat dari sintaksnya, OWL-Lite paling sederhana. Jenis ini digunakan jika pengguna hanya membutuhkan hirarki class yang sederhana dengan batasan yang sederhana pula. Contohnya, pada OWL-Lite ini disediakan dukungan cardinality constraint dengan batasan nilai yang diizinkan hanya 0 atau 1. OWL-Lite menyediakan cara yang cepat untuk berpindah dari thesaurus dan hirarki sederhana yang sudah ada. Kelemahan utama dari OWL-Lite ini terletak pada derajat ekspresi yang ditawarkan sangat terbatas.

2. OWL-DL OWL-DL jauh lebih ekspresif dibanding OWL-Lite. Proses komputasi di OWL-DL sangat lengkap dan pasti selesai dalam hitungan waktu tertentu. OWL-DL dapat menghasilkan hirarki klasifikasi secara otomatis dan mampu mengecek konsistensi dalam suatu ontologi karena OWL-DL mendukung reasoning.