Physical Database Design Perancangan Database

+term_id +term +dfk +nidfk +posting_term Term +tfik +ntfik +w +jurnal_posting posting_term_table +jurnal_id +judul +tahun +nama_penulis +path +maxjtfij jurnal 1 1 Gambar 3.22. Rancangan database index ready ORDBMS dalam bentuk diagram kelas 3.4.2 Logical Database Design Hubungan relasi antar tabel pada database text RDBMS ditunjukkan pada Gambar 3.23. Status id_status PK description Documents id_document PK title path authors year id_status_ready FK id_status2 FK id_status3FK max_term Posting id_document FK id_term FK frequency ntfik w Terms id_term PK stemmed_words dfk nidfk Posting_stopword id_document FK id_stopword FK frequency Stopwords id_stopword PK stopword Dictionary id_dictionary PK root_word Administrator id_administrator PK username pasword Sourceterm id_sourceterm PK id_term FK word is_root_word Gambar 3.23 . Hubungan relasi antar tabel pada database teks RDBMS

3.4.3 Physical Database Design

Desain database text RDBMS dengan menggunakan teknologi RDBMS yang akan digunakan pada subsistem operasi teks dapat dijabarkan sebagai berikut: 1. Tabel Status Tabel status adalah tabel yang berisikan daftar status dari dokumen. Tabel 3.7 . Tabel Status Nama Field Tipe Data Ukuran Keterangan id_status NUMBER - Primary key untuk tabel status Description VARCHAR2 20 Deskripsi status 2. Tabel Documents Tabel documents adalah tabel yang berisikan keterangan dari suatu dokumen. Tabel 3.8 . Tabel Documents Nama Field Tipe Data Ukuran Keterangan id_document NUMBER - Primary key untuk tabel documents title VARCHAR2 256 Judul dari dokumen path VARCHAR2 256 Nama file dari dokumen max_term NUMBER - Frekuensi terbesar dari sebuah dokumen authors VARCHAR2 100 Penulis dari dokumen year NUMBER - Tahun dari dokumen id_status_ready NUMBER - Status untuk dokumen id_status2 NUMBER - Status untuk untuk sistem pencarian id_status3 NUMBER - Status untuk untuk sistem pencarian 3. Tabel Posting Tabel posting adalah tabel relasi dari tabel documents dan tabel terms. Tabel 3.9. Tabel Posting Nama Field Tipe Data Ukuran Keterangan id_document NUMBER - Foreign key dari tabel documents id_term NUMBER - Foreign key dari tabel terms frequency NUMBER - Frekuensi kata pada dokumen ntfik NUMBER - Hasil perhitungan frequency max_term w NUMBER - Bobot dari sebuah term dengan rumus perhitungannya ntfiknidfk 4. Tabel Terms Tabel terms adalah tabel yang berisikan daftar term yang telah dilakukan proses tokenizer, stemming, atau belum di-stemming dari dokumen. Tabel 3.10 . Tabel Terms Nama Field Tipe Data Ukuran Keterangan id_term NUMBER - Primary key untuk tabel terms stemmed_word VARCHAR2 50 Term setelah proses stemming dfk NUMBER - Jumlah dokumen yang mengandung term nidfk NUMBER - Hasil perhitungan dari logndfklog n 5. Tabel Posting_stopword Tabel posting_stopword adalah tabel relasi dari tabel documents dan tabel terms . Tabel 3.11 . Tabel Posting_Stopword Nama Field Tipe Data Ukuran Keterangan id_document NUMBER - Foreign key dari tabel documents id_stopword NUMBER - Foreign key dari tabel stopwords frequency NUMBER - Frekuensi stopword pada dokumen 6. Tabel Stopwords Tabel stopwords adalah tabel yang berisikan daftar kata buang. Tabel 3.12 . Tabel Stopwords Nama Field Tipe Data Ukuran Keterangan id_stopword NUMBER - Primary key untuk tabel stopwords stopword VARCHAR2 20 Daftar kata buang 7. Tabel Dictionary Tabel dictionary adalah tabel yang berisikan daftar kata dasar Bahasa Indonesia. Tabel 3.13 . Tabel Dictionary Nama Field Tipe Data Ukuran Keterangan id_dictionary NUMBER - Primary key untuk tabel dictionary root_word VARCHAR2 20 Daftar kata dasar Bahasa Indonesia 8. Tabel Administrator Tabel administrator adalah tabel yang berisikan daftar administrator. Tabel 3.14 . Tabel Administrator Nama Field Tipe Data Ukuran Keterangan id_administrator NUMBER - Primary key untuk tabel administrator username VARCHAR2 10 Username pasword VARCHAR2 20 Password 9. Tabel Sourceterm Tabel sourceterm adalah tabel untuk menyimpan daftar term tanpa proses stemming dari dokumen. Tabel 3.15 . Tabel Sourceterm Nama Field Tipe Data Ukuran Keterangan id_sourceterm NUMBER - Primary key untuk tabel sourceterm id_term NUMBER - Foreign key dari tabel terms word VARCHAR2 50 Term tanpa proses stemming is_root_word CHAR 1 Keterangan apakah terms ada di kamus Desain database index ready ORDBMS dengan menggunakan teknologi ORDBMS yang akan digunakan pada proses pencarian makalah ilmiah di subsistem pencarian makalah ilmiah berbahasa Indonesia terdapat 2 tabel dan 1 nested table yang dijabarkan sebagai berikut : 1. Tabel Jurnal Tabel jurnal adalah tabel yang berisikan keterangan dari suatu jurnal. Tabel 3.16 . Tabel Jurnal Nama Field Tipe Data Ukuran Keterangan jurnal_id NUMBER - Primary key untuk tabel jurnal judul VARCHAR2 256 Judul dari dokumen jurnal tahun NUMBER - Tahun dari dokumen jurnal nama_penulis VARCHAR2 100 Nama penulis dari dokumen jurnal path VARCHAR2 256 Nama file dari dokumen jurnal MAXJTFIJ NUMBER - Frekuensi terbesar dari sebuah dokumen 2. Tabel Term Tabel term yang merupakan kumpulan kata-kata terdiri dari kolom term_id sebagai Primary Key, kolom term, kolom dfk, kolom nidfk, dan kolom posting_term bertipe data nested table yang mempresentasikan posting list untuk menyimpan jurnal. Sedangkan pada nested table terdapat jurnal- _posting yang akan digunakan untuk mereferensikan ke tabel jurnal. Tabel 3.17 . Tabel Term Nama Field Tipe Data Ukuran Keterangan term_id NUMBER - Primary key untuk tabel term term VARCHAR2 50 Term dfk NUMBER - Jumlah dokumen yang mengandung term nidfk NUMBER - Hasil perhitungan dari logndfklog n posting_term PostingListN estedType - Posting list dari nested table Nama Field Tipe Data Ukuran Keterangan tfk NUMBER - Frekuensi dari term dalam dokumen ntfik NUMBER - Hasil perhitungan tfikMaxjtfij w NUMBER - Bobot dari sebuah term dengan rumus perhitungannya ndfikntfik jurnal_posting REF - Field untuk merujuk ke obyek tabel jurnal

3.4.4 Proses Query pada ORDBMS