Pengkajian Polisemi dan Sinonim

VI.8 Pengkajian Polisemi dan Sinonim

Misalkan terdapat kata ‘komputer’ dan kata ‘hardware’ pada koleksi dokumen yang terdiri dari 4 buah dokumen. Polisemi dan sinonim antara kata ‘komputer’ dan kata ‘hardware’ dapat dihitung dengan langkah-langkah sebagai berikut:

1. Membangun vektor yang berisi frekuensi kemunculan kata pada dokumen- dokumen. Contoh:

  dokumen 1 dokumen 2 dokumen 3 dokumen 4  x 1 

  komputer 

 dokumen 1 dokumen 2 dokumen 3 dokumen 4  x 2 

 hardware 

Vektor x 1 menunjukkan frekuensi kemunculan k ata ‘komputer’ pada dokumen 1, dokumen 2, dokumen 3, dan dokumen 4.

 Vektor x 2 menunjukkan frekuensi kemunculan kata ‘hardware’ pada dokumen 1, dokumen 2, dokumen 3, dan dokumen 4.

2. Menghitung nilai similarity (subbab II.2) antara x 1 dan x 2 , yaitu

Secara umum, langkah-langkah menghitung nilai hasil kali titik antara 2 (dua) kata adalah sebagai berikut:

1. Diketahui A adalah matriks kata-dokumen. Setelah langkah-langkah pada subbab III.29 dikerjakan, matriks T U

r , S r , dan V r diperoleh, dengan r  rank (A ) .

2. Matriks A r adalah matriks kata-dokumen setelah noise dibuang

3. Vektor baris ke- i dari matriks A r adalah vektor yang menunjukkan frekuensi kemunculan kata ke- i dalam dokumen-dokumen.

4. Similarity antara 2 (dua) kata untuk semua kata dalam dokumen dapat dihitung dengan

U S U A A A (    ................................................(VI.4)

Contoh: Vektor kolom ke-2 dari matriks kata-dokumen menunjukkan frekuensi kemunculan kata-kata yang terdapat dalam dokumen ke-2. Gambar VI-6 menunjukkan cuplikan beberapa kata di dokumen ke-2 matriks kata-dokumen. Frekuensi kemunculan kata ke-169 pada dokumen ke-2 di matriks kata-dokumen adalah 0 (nol) seperti pada gambar VI.6. Selanjutnya, matriks kata-dokumen

didekomposisi SVD menjadi U , S , dan T V . Matriks U merupakan matriks dengan kolom-kolom adalah vektor kata. Frekuensi kemunculan kata ke-169 di dokumen ke-2 pada matriks U adalah 0.5992 seperti pada gambar VI-7. Hal ini menunjukkan bahwa kata ke-169 di dokumen ke-2 mempunyai frekuensi kemunculan tidak sama dengan nol meskipun pada matriks kata-dokumen frekuensi kemunculan adalah nol.

Dokumen ke

Kata ke

Kata ke

Kata ke

Kata ke

Kata ke

Kata ke

Kata ke

Gambar VI-6 Cuplikan beberapa kata di dokumen ke-2 matriks kata-dokumen

Dokumen ke

Kata ke

Kata ke

Kata ke

Kata ke

Kata ke

Kata ke

Kata ke

Gambar VI-7 Cuplikan beberapa kata di dokumen ke-2 matriks U

Kemudian pertanyaan yang muncul adalah: “Kata apakah di dokumen ke-2 yang mempunyai nilai similarity paling tinggi dengan kata ke- 169 ?”

Kata ke-169 dalam koleksi dokumen ADI ada lah kata ‘index’, hendak dicari kata- kata dalam dokumen ke-2 yang memiliki nilai similarity paling tinggi. Nilai r yang memberikan nilai NIAP maksimum berdasarkan trial-and-error adalah 60. Jadi nilai

 r  yang digunakan dalam perhitungan.

Langkah-langkah untuk menghitung nilai similarity antara kata ke-169 dengan kata-kata di dokumen ke-2 adalah

1. Berdasarkan rumus VI.4, dihitung matriks

60 60 U S U S r r  .

2. Dari matriks

60 60 U S baris ke-169 diambil, 169 x

. 169 x

merupakan vektor

yang berisi frekuensi kemunculan untuk kata ke-169 , yaitu ‘index’.

3. Dari matriks kata-dokumen, terlihat bahwa kata-kata yang ada di dokumen ke-2 dimulai dari kata ke-69 sampai dengan kata ke-90. Jadi baris ke-69 sampai dengan kata ke-90 diambil dan dibentuk matriks M .

4. Nilai similarity dihitung antara 169 x

dan M .

Hasil perhitungan similarity antara kata ‘index’ dan kata-kata di dokumen ke-2 dapat dibaca pada gambar IV-8. Kata di dokumen ke-2 yang memiliki similarity paling besar dengan kata ‘index’ adalah kata ‘includ’. Apabila koleksi dokumen ADI ditilik, diperoleh bahwa kata ‘index’ muncul bersamaan sebanyak 3 (tiga) kali di dokumen yang sama, yaitu dokumen ke- 6 bagian Title, kata ‘including‘ dan kata ‘index’, kata ‘include‘ dan kata index di bagian Isi; dokumen ke-15 bagian isi, kata ‘including’ dengan kata ‘indexes’.

No. Kata-Kata di Dokumen ke-2 Similarity dengan K ata ‘index’

Gambar VI-8 Tabel Similarity antara kata ‘index’ dan kata di dokumen ke-2

Dokumen yang terkait

SALINAN KEPUTUSAN KETUA TIM PERCEPATAN AKUNTABILITAS KEUANGAN PEMERINTAH NOMOR: KEP- 01PPA.01III2010 TENTANG HASIL PELATIHAN AKUNTANSI PEMERINTAHAN PADA PROGRAM PERCEPATAN AKUNTABILITAS KEUANGAN PEMERINTAH ANGKATAN VI SAMPAI DENGAN X WILAYAH SURABAYA, ANG

0 4 73

PENGARUH MOTIVASI BELAJAR DAN METODE PEMBELAJARAN TERHADAP HASIL BELAJAR IPS TERPADU KELAS VIII SMP PGRI 16 BRANGSONG KABUPATEN KENDAL

1 1 6

Hubungan Antara Self Efficacy dengan Prestasi Belajar Siswa Akselerasi HUBUNGAN SELF EFFICACY DENGAN PRESTASI BELAJAR SISWA AKSELERASI Febrin a Handayani Psikologi, Fakultas Ilmu Pendidikan, Universitas Negeri Surabaya e-mail : handayani.febrinagmail.com

0 0 5

PENDEKATAN DAN METODE PENDIDIKAN ISLAM (Sebuah Perbandingan dalam Konsep Teori Pendidikan Islam dan Barat)

0 0 13

ANALISIS KORELASI MOTIVASI KERJA DENGAN KINERJA GURU Oleh Dionisius Sihombing dan Mayor Sihombing Abstract - Analisis Korelasi Motivasi Kerja dengan Kinerja Guru

1 1 5

PENINGKATAN KETERAMPILAN MEMBACA AKSARA JAWA DENGAN MENGGUNAKAN MODEL PEMBELAJARAN DISCOVERY STRATEGY PADA SISWA KELAS X TKJ A SMK TARUNA ABDI BANGSA MIRIT KABUPATEN KEBUMEN TAHUN PELAJARAN 20132014

0 0 6

ANALISA ELEMEN SEKTOR MASYARAKAT YANG TERPENGARUH DENGAN ADANYA GREEN LOGISTIC AGROINDUSTRI KARET MENGGUNAKAN METODA ISM

0 1 11

PERANCANGAN KOMUNIKASI VISUAL MANFAAT TANAMAN LIDAH MERTUA DENGAN TEKNIK MOTION GRAFIK BERBASIS ANDROID PADA LEAFLET AUGMENTED REALITY

0 0 14

PEMAHAMAN PENULISAN KARYA ILMIAH AGAR MEMENUHI KEPATUTAN SERTA KAITANNYA DENGAN USULAN KENAIKKAN JENJANG KEPANGKATAN

0 0 12

HUBUNGAN LABA AKUNTANSI, NILAI BUKU, DAN TOTAL ARUS KAS DENGAN MARKET VALUE: STUDI AKUNTANSI RELEVANSI NILAI Oleh Indra, SE,MSi,Ak & Fazli Syam BZ,SE,MSi,Ak ABSTRACT - Metodologi Penelitian Pertemuan 11

0 0 15