BAB 3 ANALISIS DAN PERANCANGAN SISTEM
3.1. Analisis Data
Data yang digunakan untuk membangun aplikasi Pendeteksian Kesamaan Pada Dokumen Teks ini terdiri dari 3 tabel data utama, yaitu data jurnal, kata dasar, dan
stoplist.
3.1.1. Data jurnal
Sumber jurnal dalam penelitian ini diperoleh dari jurnal mahasiswa USU data akses: repositori USU. Jurnal yang digunakan sebanyak 625 buah. Dan sebagai bahan
pengujian digunakan 20 jurnal dari prodi Teknologi Informasi dan Ilkom. Jurnal- jurnal tersebut dibagi atas 35 kategori.
Database untuk data jurnal dibagi atas 2 tabel, yaitu: a. Tabel Kategori
Tabel kategori merupakan tabel yang menyimpan data kategori dari beberapa jurnal. Tabel ini memiliki 2 field, yaitu id dan kategori. Rancangan tabel dapat dilihat pada
Tabel 3.1.
Tabel 3.1. Tabel Kategori id
kategori
1 Agripet
2 Agrisol
3 Analisis Administrasi dan Kebijakan
4 Atrium
5 Bahasa dan Sastra Logat
6 Bearing
7 Ekonomi
8 Englonesian
9 Ensikom
10 Equality
id kategori
11 Etnomusikologi 12 Etnovisi
13 Harmoni Sosial 14 Info Kesehatan Masyarakat
15 Jurnal Biologi Sumatera 16 Jurnal Ekonom
17 Jurnal Manajemen Bisnis 18 Jurnal Teknologi Proses
19 Kerabat 20 Komunikasi Penelitian-Humaniora
21
Tabel 3.1. Tabel Kategori lanjutan id
kategori
21 Komunikasi Penelitian-MIPA 22 Komunikasi Penelitian-Rekayasa
23 Kultura 24 Majalah Kedokteran Nusantara
25 Pemberdayaan Komunitas 26 Peronema
27 Pustaha 28 Rufaidah
id kategori
29 Sains Kimia 30 Simetrika
31 Sistem Teknik Industri 32 Wahana Hijau
33 Wawasan 34 ILKOM
35 Teknologi Informasi
b. Tabel Keyword Tabel keyword merupakan tabel yang menyimpan data dari proses stemming dan
winnowing. Tabel ini memiliki 9 field, yaitu id, nama_file, teks_keyword, teks_tanpa_stemming,
fingerprint_tanpa_stemming, hash_tanpa_stemming,
fingerprint_keyword, hash_keyword, kategori. Tabel dapat dilihat pada Tabel 3.2.
3.1.2. Tabel kata dasar
Tabel kata dasar merupakan tabel yang menyimpan data kata dasar bahasa Indonesia yang bersumber dari KBBI online. Tabel ini memiliki 3 field, yaitu id_ktdasar,
katadasar, dan tipe_katadasar. Rancangan tabel dapat dilihat pada Tabel 3.3.
Tabel 3.3. Tabel Kata Dasar id_ktdasar
katadasar tipe_katadasar
1 a
Nomina 2
ab Nomina
… …
… 28532
sesuai Partikel
28533 sei
Nomina
3.1.3. Tabel stoplist