Tahap Pembentukan Knowledge Graph

BAB 3 METODE PENELITIAN

3.1. Tahap Pembentukan Knowledge Graph

Sekumpulan kata-kata dalam suatu dokumen tidak akan terepresentasi sepenuhnya ke dalam graf. Bagian inti dokumen yang akan menyebabkan kehilangan makna jika dihilangkan yang akan menjadi node dalam graf. Pengambilan bagian-bagian inti dokumen ini harus melewati beberapa tahap dengan tujuan mengurangi kehilangan makna dari beberapa kata yang dihilangkan. Salah satu jenis kata yang tidak boleh terpecah karena penghilangan bagian-bagian dokumen adalah frase. Frase adalah sekumpulan kata dasar yang memiliki sifat kata benda atau kata kerja, yang akan memberikan makna baru ketika sekumpulan kata tersebut digabungkan. Makna baru yang dihasilkan dari penggabungan sekumpulan kata tersebut yang menjadi penyebab tidak bolehnya sekumpulan kata tersebut terhilangkan. Asumsi pengenalan frase yang digunakan dalam penelitian ini adalah sekumpulan dua kata saja. Hal ini dengan pertimbangan sebagian frase dalam Bahasa Indonesia terdiri atas dua kata. Kamus frase yang dibentuk dari hasil pelatihan akan disimpan dalam server dan akan terus diperbaharui setiap ada dokumen pengujian yang diuji ke dalam sistem. Kamus frase ini akan berbentuk dokumen berekstensi .txt, hal ini dengan tujuan kecepatan akses pencarian ke dokumen teks biasa lebih cepat daripada perangkat basis data yang enterprise. Selain itu, hal yang mendukung lainnya dalam penggunaan dokumen teks sebagai media penyimpanan adalah basis pengembangan aplikasi yang dalam basis desktop. Langkah berikutnya adalah melakukan pengenalan sifat kata kerja dan pemangkasan imbuhan untuk mendapatkan kata dasarnya stemming. Metode stemming yang akan dilakukan adalah menggunakan metode table lookup brute force . Tabel yang dibentuk akan menggunakan bantuan Kamus Besar Bahasa Indonesia. Hal ini dilakukan untuk mendapatkan hasil yang sangat akurat dari proses stemmingnya. Proses ekstraksi kalimat diharapkan mampu menyaring kalimat-kalimat yang benar-benar mencirikan dokumen. Hal ini dengan tujuan, proses analisis kausalitas hanya fokus pada kalimat-kalimat inti saja. Penentuan variabel-variabel yang akan digunakan sebagai perhitungan dalam kombinasi linear akan dianalisis berikut bobot untuk tiap variabelnya. Langkah penelitian berikutnya adalah analisis kausalitas dan merepresentasikannya ke dalam graf. Analisis hubungan kausalitas ini dapat dilakukan pertama-tama dengan mengenali sifat kata kerja penghubung antara subjek dengan objeknya. Kata kerja ini akan direpresentasikan ke dalam verteks, sementara subjek dan objek akan direpresentasikan ke dalam node. Verteks- verteks dalam Knowledge Graph akan memiliki beberapa simbol berbeda untuk beberapa sifat kata kerja.

3.2. Analisis Frase