BAB 3 METODE PENELITIAN
3.1. Tahap Pembentukan Knowledge Graph
Sekumpulan kata-kata dalam suatu dokumen tidak akan terepresentasi sepenuhnya ke dalam graf. Bagian inti dokumen yang akan menyebabkan
kehilangan makna jika dihilangkan yang akan menjadi node dalam graf. Pengambilan bagian-bagian inti dokumen ini harus melewati beberapa tahap
dengan tujuan mengurangi kehilangan makna dari beberapa kata yang dihilangkan. Salah satu jenis kata yang tidak boleh terpecah karena penghilangan
bagian-bagian dokumen adalah frase. Frase adalah sekumpulan kata dasar yang memiliki sifat kata benda atau
kata kerja, yang akan memberikan makna baru ketika sekumpulan kata tersebut digabungkan. Makna baru yang dihasilkan dari penggabungan sekumpulan kata
tersebut yang menjadi penyebab tidak bolehnya sekumpulan kata tersebut terhilangkan. Asumsi pengenalan frase yang digunakan dalam penelitian ini
adalah sekumpulan dua kata saja. Hal ini dengan pertimbangan sebagian frase dalam Bahasa Indonesia terdiri atas dua kata.
Kamus frase yang dibentuk dari hasil pelatihan akan disimpan dalam server dan akan terus diperbaharui setiap ada dokumen pengujian yang diuji ke dalam
sistem. Kamus frase ini akan berbentuk dokumen berekstensi .txt, hal ini dengan tujuan kecepatan akses pencarian ke dokumen teks biasa lebih cepat daripada
perangkat basis data yang enterprise. Selain itu, hal yang mendukung lainnya dalam penggunaan dokumen teks sebagai media penyimpanan adalah basis
pengembangan aplikasi yang dalam basis desktop. Langkah berikutnya adalah melakukan pengenalan sifat kata kerja dan
pemangkasan imbuhan untuk mendapatkan kata dasarnya stemming. Metode stemming
yang akan dilakukan adalah menggunakan metode table lookup brute force
. Tabel yang dibentuk akan menggunakan bantuan Kamus Besar Bahasa Indonesia. Hal ini dilakukan untuk mendapatkan hasil yang sangat akurat dari
proses stemmingnya.
Proses ekstraksi kalimat diharapkan mampu menyaring kalimat-kalimat yang benar-benar mencirikan dokumen. Hal ini dengan tujuan, proses analisis
kausalitas hanya fokus pada kalimat-kalimat inti saja. Penentuan variabel-variabel yang akan digunakan sebagai perhitungan dalam kombinasi linear akan dianalisis
berikut bobot untuk tiap variabelnya. Langkah
penelitian berikutnya
adalah analisis
kausalitas dan
merepresentasikannya ke dalam graf. Analisis hubungan kausalitas ini dapat dilakukan pertama-tama dengan mengenali sifat kata kerja penghubung antara
subjek dengan objeknya. Kata kerja ini akan direpresentasikan ke dalam verteks, sementara subjek dan objek akan direpresentasikan ke dalam node. Verteks-
verteks dalam Knowledge Graph akan memiliki beberapa simbol berbeda untuk beberapa sifat kata kerja.
3.2. Analisis Frase