+term_id +term
+dfk +nidfk
+posting_term
Term
+tfik +ntfik
+w +jurnal_posting
posting_term_table
+jurnal_id +judul
+tahun +nama_penulis
+path +maxjtfij
jurnal
1
1
Gambar 3.22. Rancangan database index ready ORDBMS dalam bentuk diagram
kelas 3.4.2
Logical Database Design
Hubungan relasi antar tabel pada database text RDBMS ditunjukkan pada Gambar 3.23.
Status id_status PK
description Documents
id_document PK title
path authors
year id_status_ready FK
id_status2 FK id_status3FK
max_term Posting
id_document FK id_term FK
frequency ntfik
w Terms
id_term PK stemmed_words
dfk nidfk
Posting_stopword id_document FK
id_stopword FK frequency
Stopwords id_stopword PK
stopword Dictionary
id_dictionary PK root_word
Administrator id_administrator PK
username pasword
Sourceterm id_sourceterm PK
id_term FK word
is_root_word
Gambar 3.23 . Hubungan relasi antar tabel pada database teks RDBMS
3.4.3 Physical Database Design
Desain database text RDBMS dengan menggunakan teknologi RDBMS yang akan digunakan pada
subsistem operasi teks
dapat dijabarkan sebagai berikut:
1. Tabel Status Tabel status adalah tabel yang berisikan daftar status dari dokumen.
Tabel 3.7 . Tabel Status
Nama Field Tipe Data
Ukuran Keterangan
id_status NUMBER
- Primary key
untuk tabel status
Description VARCHAR2
20 Deskripsi status
2. Tabel Documents Tabel documents adalah tabel yang berisikan keterangan dari suatu dokumen.
Tabel 3.8 . Tabel Documents
Nama Field Tipe Data
Ukuran Keterangan
id_document NUMBER
- Primary
key untuk
tabel documents
title VARCHAR2 256
Judul dari dokumen path
VARCHAR2 256 Nama file dari dokumen
max_term NUMBER
- Frekuensi terbesar dari sebuah
dokumen authors
VARCHAR2 100 Penulis dari dokumen
year NUMBER
- Tahun dari dokumen
id_status_ready NUMBER -
Status untuk dokumen id_status2
NUMBER -
Status untuk
untuk sistem
pencarian id_status3
NUMBER -
Status untuk
untuk sistem
pencarian
3. Tabel Posting Tabel posting adalah tabel relasi dari tabel documents dan tabel terms.
Tabel 3.9. Tabel Posting
Nama Field Tipe Data
Ukuran Keterangan
id_document NUMBER - Foreign key
dari tabel documents id_term
NUMBER - Foreign key
dari tabel terms frequency
NUMBER - Frekuensi kata pada dokumen
ntfik NUMBER -
Hasil perhitungan
frequency max_term
w NUMBER -
Bobot dari sebuah term dengan rumus perhitungannya ntfiknidfk
4. Tabel Terms Tabel terms adalah tabel yang berisikan daftar term yang telah dilakukan
proses tokenizer, stemming, atau belum di-stemming dari dokumen.
Tabel 3.10 . Tabel Terms
Nama Field Tipe Data
Ukuran Keterangan
id_term NUMBER
- Primary key
untuk tabel terms
stemmed_word VARCHAR2 50
Term setelah proses stemming
dfk NUMBER
- Jumlah
dokumen yang
mengandung term nidfk
NUMBER -
Hasil perhitungan
dari logndfklog n
5. Tabel Posting_stopword Tabel posting_stopword adalah tabel relasi dari tabel documents dan tabel
terms .
Tabel 3.11 . Tabel Posting_Stopword
Nama Field Tipe Data
Ukuran Keterangan
id_document NUMBER
- Foreign
key dari
tabel documents
id_stopword NUMBER
- Foreign
key dari
tabel stopwords
frequency NUMBER
- Frekuensi
stopword pada
dokumen
6. Tabel Stopwords Tabel stopwords adalah tabel yang berisikan daftar kata buang.
Tabel 3.12 . Tabel Stopwords
Nama Field Tipe Data
Ukuran Keterangan
id_stopword NUMBER
- Primary key
untuk tabel stopwords
stopword VARCHAR2
20 Daftar kata buang
7. Tabel Dictionary Tabel dictionary adalah tabel yang berisikan daftar kata dasar Bahasa
Indonesia.
Tabel 3.13 . Tabel Dictionary
Nama Field Tipe Data
Ukuran Keterangan
id_dictionary NUMBER
- Primary key
untuk tabel dictionary
root_word VARCHAR2
20 Daftar kata dasar Bahasa
Indonesia
8. Tabel Administrator Tabel administrator adalah tabel yang berisikan daftar administrator.
Tabel 3.14 . Tabel Administrator
Nama Field Tipe Data
Ukuran Keterangan
id_administrator NUMBER -
Primary key untuk tabel
administrator username
VARCHAR2 10 Username
pasword VARCHAR2 20
Password
9. Tabel Sourceterm Tabel sourceterm adalah tabel untuk menyimpan daftar term tanpa proses
stemming dari dokumen.
Tabel 3.15 . Tabel Sourceterm
Nama Field Tipe Data
Ukuran Keterangan
id_sourceterm NUMBER -
Primary key
untuk tabel
sourceterm id_term
NUMBER -
Foreign key dari tabel terms
word VARCHAR2 50
Term tanpa proses stemming
is_root_word CHAR
1 Keterangan apakah terms ada
di kamus
Desain database index ready ORDBMS dengan menggunakan teknologi ORDBMS yang akan digunakan pada proses pencarian makalah
ilmiah di subsistem pencarian makalah ilmiah berbahasa Indonesia terdapat 2 tabel dan 1 nested table yang dijabarkan sebagai berikut :
1. Tabel Jurnal Tabel jurnal adalah tabel yang berisikan keterangan dari suatu jurnal.
Tabel 3.16 . Tabel Jurnal
Nama Field Tipe Data
Ukuran Keterangan
jurnal_id NUMBER
- Primary key
untuk tabel jurnal judul
VARCHAR2 256 Judul dari dokumen jurnal
tahun NUMBER
- Tahun dari dokumen jurnal
nama_penulis VARCHAR2 100
Nama penulis dari dokumen jurnal path
VARCHAR2 256 Nama file dari dokumen jurnal
MAXJTFIJ NUMBER
- Frekuensi terbesar dari sebuah
dokumen 2. Tabel Term
Tabel term yang merupakan kumpulan kata-kata terdiri dari kolom term_id sebagai Primary Key, kolom term, kolom dfk, kolom nidfk, dan kolom
posting_term bertipe data nested table yang mempresentasikan posting list
untuk menyimpan jurnal. Sedangkan pada nested table terdapat jurnal- _posting
yang akan digunakan untuk mereferensikan ke tabel jurnal.
Tabel 3.17 . Tabel Term
Nama Field Tipe Data
Ukuran Keterangan
term_id NUMBER
- Primary key
untuk tabel term term
VARCHAR2 50 Term
dfk NUMBER
- Jumlah
dokumen yang
mengandung term nidfk
NUMBER -
Hasil perhitungan
dari logndfklog n
posting_term PostingListN
estedType -
Posting list dari nested table
Nama Field Tipe Data
Ukuran Keterangan
tfk NUMBER
- Frekuensi
dari term
dalam dokumen
ntfik NUMBER
- Hasil perhitungan tfikMaxjtfij
w NUMBER
- Bobot dari sebuah term dengan
rumus perhitungannya ndfikntfik jurnal_posting
REF -
Field untuk merujuk ke obyek tabel jurnal
3.4.4 Proses Query pada ORDBMS