Data jurnal Tabel kata dasar

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

3.1. Analisis Data

Data yang digunakan untuk membangun aplikasi Pendeteksian Kesamaan Pada Dokumen Teks ini terdiri dari 3 tabel data utama, yaitu data jurnal, kata dasar, dan stoplist.

3.1.1. Data jurnal

Sumber jurnal dalam penelitian ini diperoleh dari jurnal mahasiswa USU data akses: repositori USU. Jurnal yang digunakan sebanyak 625 buah. Dan sebagai bahan pengujian digunakan 20 jurnal dari prodi Teknologi Informasi dan Ilkom. Jurnal- jurnal tersebut dibagi atas 35 kategori. Database untuk data jurnal dibagi atas 2 tabel, yaitu: a. Tabel Kategori Tabel kategori merupakan tabel yang menyimpan data kategori dari beberapa jurnal. Tabel ini memiliki 2 field, yaitu id dan kategori. Rancangan tabel dapat dilihat pada Tabel 3.1. Tabel 3.1. Tabel Kategori id kategori 1 Agripet 2 Agrisol 3 Analisis Administrasi dan Kebijakan 4 Atrium 5 Bahasa dan Sastra Logat 6 Bearing 7 Ekonomi 8 Englonesian 9 Ensikom 10 Equality id kategori 11 Etnomusikologi 12 Etnovisi 13 Harmoni Sosial 14 Info Kesehatan Masyarakat 15 Jurnal Biologi Sumatera 16 Jurnal Ekonom 17 Jurnal Manajemen Bisnis 18 Jurnal Teknologi Proses 19 Kerabat 20 Komunikasi Penelitian-Humaniora 21 Tabel 3.1. Tabel Kategori lanjutan id kategori 21 Komunikasi Penelitian-MIPA 22 Komunikasi Penelitian-Rekayasa 23 Kultura 24 Majalah Kedokteran Nusantara 25 Pemberdayaan Komunitas 26 Peronema 27 Pustaha 28 Rufaidah id kategori 29 Sains Kimia 30 Simetrika 31 Sistem Teknik Industri 32 Wahana Hijau 33 Wawasan 34 ILKOM 35 Teknologi Informasi b. Tabel Keyword Tabel keyword merupakan tabel yang menyimpan data dari proses stemming dan winnowing. Tabel ini memiliki 9 field, yaitu id, nama_file, teks_keyword, teks_tanpa_stemming, fingerprint_tanpa_stemming, hash_tanpa_stemming, fingerprint_keyword, hash_keyword, kategori. Tabel dapat dilihat pada Tabel 3.2.

3.1.2. Tabel kata dasar

Tabel kata dasar merupakan tabel yang menyimpan data kata dasar bahasa Indonesia yang bersumber dari KBBI online. Tabel ini memiliki 3 field, yaitu id_ktdasar, katadasar, dan tipe_katadasar. Rancangan tabel dapat dilihat pada Tabel 3.3. Tabel 3.3. Tabel Kata Dasar id_ktdasar katadasar tipe_katadasar 1 a Nomina 2 ab Nomina … … … 28532 sesuai Partikel 28533 sei Nomina

3.1.3. Tabel stoplist