Perbandingan Efisiensi Model Ruang Vektor pada Sistem Temu Kembali Informasi

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR
PADA SISTEM TEMU KEMBALI INFORMASI

ARI ALKAUTSAR

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

1

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR
PADA SISTEM TEMU KEMBALI INFORMASI

ARI ALKAUTSAR

Skripsi
Sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer pada

Departemen Ilmu Komputer

DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2012

2

ABSTRACT
ARI ALKAUTSAR Comparison of Efficiency Vector Space Model on Information Retrieval
System. Supervised by SONY HARTONO WIJAYA.
Information retrieval system is a system to represent, store, organize, and process
informations. Discovered documents were ranked by vector space model . Normalization of the
vector space models similarity consist of cosine, Jaccard, and Dice. This research aims to compare
efficiency of three vector space models based on recall and average precision (AVP), computation
time, and algorithm complexcity. A thousand document were used in this research. The result
showed that each coefficient of vector space model yield equal value for recall and AVP. The
measure of similarity in cosine coefficient vector space model better than Jaccard coefficient and

Dice coefficient, in terms of algorithms complexity and 3.1% faster than Jaccard coefficient and
9.4% than Dice coefficient, in terms of computation time.
Keywords : cosine, Dice, Information Retrieval System, Jaccard, tf-idf, Vector Space Model.

3

Judul Skripsi
Nama
NRP

: Perbandingan Efisiensi Model Ruang Vektor pada Sistem Temu Kembali
Informasi
: Ari Alkautsar
: G64096011

Disetujui
Pembimbing

Sony Hartono Wijaya, S.Kom, M.Kom
NIP 198108092008121002


Diketahui
Ketua Departemen Ilmu Komputer

Dr. Ir. Agus Buono, M.Si, M.Kom
NIP 196607021993021001

Tanggal Lulus:

4

PRAKATA

Puji dan syukur penulis panjatkan ke hadirat Tuhan Yang Maha Esa karena berkat rahmat
dan karunia-Nya penulis dapat menyelesaikan skripsi ini. Skripsi ini merupakan hasil penelitian
yang dilakukan dari bulan September sampai bulan Februari dengan bidang kajian Perbandingan
Efisiensi Model Ruang Vektor pada Sistem Temu Kembali Informasi.
Pembuatan skripsi ini tak lepas dari dukungan dan bantuan dari berbagai pihak. Oleh karena
itu, penulis menyampaikan rasa terima kasih kepada:
1

2
3

4
5
6
7
8
9

Tuhan Yang Maha Esa atas rahmat dan karunia-Nya.
Bapa, Mamah, Ira, Teteh, A Iwan, dan Rafi yang selalu memberikan dukungan,
motivasi, kasih sayang, serta doanya.
Bapak Sony Hartono Wijaya, S. Kom, M.Kom selaku dosen pembimbing tugas akhir.
Terima kasih atas kesabaran, bimbingan serta dukungan dalam penyelesaian tugas akhir
ini.
Bapak Ir. Julio Adisantoso, M.Kom dan Bapak Ahmad Ridha, S.Kom, MS selaku dosen
penguji.
Teman-teman satu bimbingan, Selamat Subu dan Debi, terima kasih atas semangat dan
kebersamaannya selama penyelesaian tugas akhir ini

Teman-teman seperjuangan Ekstensi Departemen Ilmu Komputer angkatan 4.
Teman-teman seperjuangan Manajemen Informatika angkatan 43.
Teman-teman kosan White House beserta Dell Inspiron-ku.
Seluruh pihak yang turut membantu baik secara langsung maupun tidak langsung dalam
pelaksanaan tugas akhir.

Semoga hasil penelitian ini dapat bermanfaat dan dapat terus dikembangkan di masa
mendatang.

Bogor, April 2012

Ari Alkautsar

5

RIWAYAT HIDUP
Penulis yang dilahirkan di Serang pada tanggal 10 November 1988 merupakan anak kedua
dari tiga bersaudara dengan ayah bernama Dedi Cunyadi Atmadipraja dan ibu bernama Mei
Heryati. Pada tahun 2006 penulis lulus dari Sekolah Menengah Atas (SMA) Negeri 1 Serang dan
diterima di Diploma Tiga Program Keahlian Manajemen Informatika, Institut Pertanian Bogor

(IPB) setelah lulus pada tahun 2009, kemudian melanjutkan kuliah untuk gelar sarjana pada tahun
2009 di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, IPB.
Pada tahun 2009 penulis berkerja di perusahaan Property Manajemen Mall (PT. Bogor
Anggana Cendekia) sebagai IT Support dan pada tahun 2011 penulis bergabung dengan Team
Rainvolution untuk mengerjakan project system.

6

DAFTAR ISI

Halaman
DAFTAR TABEL...................................................................................................................... vi
DAFTAR GAMBAR ................................................................................................................. vi
DAFTAR LAMPIRAN .............................................................................................................. vi
PENDAHULUAN
Latar Belakang ....................................................................................................................... 1
Tujuan .................................................................................................................................... 1
Ruang Lingkup ....................................................................................................................... 1
Manfaat .................................................................................................................................. 1
TINJAUAN PUSTAKA

Sistem Temu Kembali Informasi ............................................................................................. 1
Pembobotan tf-idf ................................................................................................................... 1
Model Ruang Vektor............................................................................................................... 2
Kompleksitas Algoritme ......................................................................................................... 2
Evaluasi Sistem Temu Kembali Informasi ............................................................................... 2
METODE PENELITIAN
Koleksi Dokumen Pengujian ................................................................................................... 3
Praproses ................................................................................................................................ 3
Pemrosesan Dokumen ............................................................................................................. 3
Evaluasi .................................................................................................................................. 4
Lingkungan Pengembangan .................................................................................................... 4
HASIL DAN PEMBAHASAN
Koleksi Dokumen Pengujian ................................................................................................... 4
Praproses ................................................................................................................................ 4
Pemrosesan Dokumen ............................................................................................................. 4
Waktu Komputasi ................................................................................................................... 5
Kompleksitas Algoritme ......................................................................................................... 5
Evaluasi .................................................................................................................................. 7
KESIMPULAN DAN SARAN
Kesimpulan ............................................................................................................................ 8

Saran ...................................................................................................................................... 8
DAFTAR PUSTAKA ................................................................................................................. 8
LAMPIRAN ..............................................................................................................................10

7

DAFTAR TABEL
Halaman
1
2
3
4
5
6

Ilustrasi Recall dan Precision ................................................................................................. 3
Kompleksitas algoritme koefisien cosine. ............................................................................... 5
Kompleksitas algoritme koefisien Jaccard. ............................................................................. 6
Kompleksitas algoritme koefisien Dice ................................................................................... 6
Nilai rata-rata waktu komputasi untuk masing-masing koefisien.............................................. 7

Nilai perbandingan kompleksitas Algoritme............................................................................ 8

DAFTAR GAMBAR
Halaman
1 Diagram Alur Metode Penelitian ........................................................................................... 3
2 Grafik recall precision........................................................................................................... 7

DAFTAR LAMPIRAN
Halaman
1
2
3
4
5
6

Contoh Koleksi Dokumen .....................................................................................................11
Daftar Kueri dan Dokumen yang Relevan ..............................................................................12
Tampilan Sistem ...................................................................................................................19
Tabel Recall dan Preccision untuk Semua Ukuran Kesamaan.................................................20

Grafik Waktu Komputasi.......................................................................................................21
Tabel Waktu Komputasi ........................................................................................................22

1

PENDAHULUAN

precision,
waktu
komputasi,
kompleksitas algoritme.

dan

Latar Belakang
Semakin populernya penggunaan internet
memengaruhi jumlah sumber daya informasi
yang semakin besar keragamannya. Informasi
yang jumlahnya sedikit dapat dicari secara
manual dengan mudah, namun untuk

informasi yang jumlahnya besar dibutuhkan
suatu sistem yang dapat mencari dengan
cepat informasi tersebut. Masalah lain yang
dihadapi adalah sistem tidak mampu
memeringkat
dokumen relevan
yang
diinginkan pengguna berdasarkan urutan
awal hasil pencarian. Untuk memecahkan
masalah tersebut, salah satu pendekatan yang
digunakan adalah sistem temu kembali
informasi. Sistem temu kembali informasi
digunakan
untuk
menemukembalikan
informasi yang dianggap relevan terhadap
kebutuhan
pengguna.
Temu kembali
informasi yang baik menghasilkan dokumen
relevan pada urutan awal hasil pencarian.
Banyak model yang dapat digunakan
untuk memeringkat dokumen hasil temu
kembali informasi, salah satunya adalah
model ruang vektor. Idenya adalah
memeringkat dokumen hasil temu kembali
informasi berdasarkan tingkat relevansi suatu
dokumen. Dalam ukuran kesamaan model
ruang vektor, terdapat tiga buah koefisien,
yaitu koefisien cosine, koefisien Jaccard, dan
koefisien Dice.
Penelitian model ruang vektor umumnya
menggunakan koefisien cosine, seperti Paiki
(2006), Rusidi (2008), dan Rahayuni (2011)
untuk memeringkat dokumen hasil pencarian.
Intan & Defeng (2006) menggabungkan
metode tf-idf dan koefisien Jaccard dalam
memperkenalkan suatu algoritme search
engine berdasarkan konsep High Accuracy
Retrieval
from
Documents
(HARD).
Nurhanifah (2001) menggunakan metode
trigram dengan ukuran kesamaan Dice dalam
bentuk
hypertext.
Penelitian-penelitian
tersebut hanya menggunakan satu koefisien
model dalam penelitiannya dan tidak ada
yang membandingkan kinerja dari model
model ruang vektornya.

Tujuan
Penelitian ini bertujuan membandingkan
efisiensi ukuran koefisien kesamaan model
ruang vektor berdasarkan recall dan average

Ruang Lingkup
Ruang lingkup penelitian ini ialah:
1 Model sistem temu kembali informasi
yang digunakan adalah model ruang
vektor.
2 Terbatas pada perbandingan koefisien
model ruang vektor yang dilihat
berdasarkan recall dan average precision,
waktu komputasi, dan kompleksitas
algoritme.
Manfaat
Kinerja
mesin
pencari
dapat
dikembangkan berdasarkan berbagai macam
model. Dari penelitian ini, diharapkan dapat
diketahui hasil perbandingan pemeringkatan
model ruang vektor dan dapat menjadi
pembanding kinerja model lain.

TINJAUAN PUSTAKA
Sistem Temu Kembali Informasi
Temu kembali informasi mempelajari
algoritme dan model untuk memperoleh
informasi dari koleksi dokumen. Sistem temu
kembali informasi merupakan sistem untuk
merepresentasikan,
menyimpan,
mengorganisasikan,
dan
memproses
informasi. Sistem temu kembali informasi
menyediakan kemudahan akses informasi
bagi
pengguna.
Pengguna
harus
menerjemahkan kebutuhan informasinya ke
dalam bentuk kueri. Dengan adanya kueri
yang diberikan pengguna, tujuan utama dari
sistem temu kembali informasi adalah
mengembalikan informasi yang relevan
dengan kueri dan informasi yang tidak
relevan sesedikit mungkin (Baeza-Yates &
Ribeiro-Neto 1999).
Pembobotan tf-idf
Metode tf-idf merupakan suatu cara untuk
memberikan bobot hubungan suatu kata
(term)
terhadap
dokumen.
Menurut
Robertson (2005) dalam Intan & Defeng
(2006), metode ini menggabungkan dua
konsep untuk perhitungan bobot yaitu,
frekuensi kemunculan sebuah kata di dalam
sebuah dokumen tertentu dan inverse
dokumen frekuensi yang mengandung kata
tersebut.

2

Persamaan metode tf-idf
sebagai berikut:

secara umum



Wij = tfij × (log( � ))

3 Koefisien Dice ditemukan oleh Lee
Raymond Dice yang merupakan metode
ukuran kesamaan yaang berhubungan
dengan koefisien Jaccard. Persamaannya
sebagai berikut:

dengan:
Wij

:

bobot kata/term
dokumen di

tj

terhadap

tfij

:

jumlah kemunculan kata/term tj
dalam di

N

:

jumlah semua dokumen yang ada
dalam pangkalan data

n

:

jumlah
dokumen
yang
mengandung
kata/term
tj
(minimal ada satu kata yaitu term
tj)

Model Ruang Vektor
Pengukuran
kesamaan
(similarity
measure) model ruang vektor digunakan
untuk memeringkat dokumen hasil temu
kembali informasi. Salton (1989) dalam
Adisantoso (1996) melakukan normalisasi
ukuran koefisien kesamaan ini menjadi tiga,
yaitu:
1 Koefisien cosine merupakan metode
ukuran kesamaan yang paling popular,
yaitu dengan menghitung sudut antara
vektor dokumen dengan vektor kueri.
Persamaannya sebagai berikut:
similarity dj ,q =

|dj ∙q |
dj x q

dengan:
dj: vektor dokumen
q : vektor kueri

similarity dj ,q =

2|dj ∙q |
dj x q

dengan:
dj: vektor dokumen
q : vektor kueri

Kompleksitas Algoritme
Untuk menyelesaikan suatu masalah
pemrograman, terdapat berbagai algoritme
yang dapat digunakan. Dalam algoritme,
harus ada parameter yang bisa dibandingkan
agar dapat diselesaikan secara efektif.
Dalam aplikasinya, setiap algoritme
memiliki dua buah ciri khas yang dapat
digunakan sebagai parameter pembanding,
yaitu jumlah proses yang dilakukan dan
jumlah memori yang digunakan untuk
melakukan proses. Jumlah proses ini dikenal
sebagai
kompleksitas
waktu
yang
disimbolkan dengan T(n), sedangkan jumlah
memori ini dikenal sebagai kompleksitas
ruang yang disimbolkan dengan S(n).
Kompleksitas waktu diukur berdasarkan
jumlah proses khas suatu algoritme, bukan
berdasarkan run-time secara nyata ketika
aplikasi dilakukan. Hal ini disebabkan oleh
arsitektur komputer dan kompilator yang
berbeda-beda sehingga suatu algoritme yang
sama akan menghasilkan waktu eksekusi
yang berbeda, pada komputer dan penyusun
yang berbeda (Rheinadi 2009).
Evaluasi Sistem Temu Kembali Informasi

2 Koefisien Jaccard adalah salah satu
metode yang dipakai untuk menghitung
similarity antara dua obyek. Ditemukan
oleh Paul Jaccard yang merupakan
metode ukuran kesamaan yang digunakan
untuk membandingkan kesamaan dan
keragaman set sampel. Persamaannya
sebagai berikut:
|dj ∙q |
similarity dj ,q =
dj x q -|dj ∙q |
dengan:
dj: vektor dokumen
q : vektor kueri

Terdapat banyak jenis ukuran yang dapat
digunakan untuk mengevaluasi kinerja suatu
sistem temu kembali informasi. Pengukuran
yang paling umum menggunakan recall dan
precision.
Recall adalah rasio jumlah dokumen
relevan yang ditemukan kembali dengan total
jumlah dokumen dalam kumpulan dokumen
yang dianggap relevan, sedangkan precision
adalah rasio jumlah dokumen relevan yang
ditemukan dengan total jumlah dokumen
yang ditemukembalikan (Manning et al.
2008). Ilustrasi recall dan precision dapat
dilihat di Tabel 1.

3

Tabel 1 Ilustrasi recall dan precision
Relevan

Non relevan

Retrieved

tp

fp

Non
retrieved

fn

tn

Recall=

|tp|
(|tp|+|fn|)

|tp|
Precision=
(|tp|+|fp|)
Pengukuran kinerja pemeringkatan dapat
dilakukan dengan interpolasi average
precision. Interpolasi average precision
adalah suatu ukuran evaluasi kinerja
temukembali
yang
diperoleh
dengan
menghitung rata-rata precision pada berbagai
tingkat recall. Standar yang digunakan adalah
standar tingkat recall, yaitu 0.0, 0.1, 0.2, 0.3,
0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 0.10. Average
precision diformulasikan sebagai berikut:


=


�=1

�� ( )


adalah average precision pada level

recall r, Nq adalah jumlah kueri yang
digunakan, dan Pi (r) adalah precision pada
level recall r untuk kueri ke-i (Baeza-Yates
& Ribeiro-Neto 1999).
METODE PENELITIAN
Tahapan yang akan dilakukan pada
penelitian secara umum terdiri atas tiga tahap,
yaitu:
1 praproses,
2 pemrosesan dokumen, dan
3 evaluasi.
Koleksi Dokumen Pengujian
Data didapat dari 1000 dokumen
pertanian yang ada di pangkalan data
Laboratorium Temu Kembali Informasi,
Departemen Ilmu Komputer, Institut
Pertanian Bogor hasil penelitian Adisantoso
& Ridha (2004).
Praproses
Pada praproses akan dilakukan tiga tahap,
yaitu:

1 Proses tokenisasi (tokenizing) yang
membagi teks input menjadi unit-unit
kecil yang disebut token, yang dapat
berupa suatu kata, suatu angka, atau suatu
tanda baca.
2 Proses pembuangan kata yang tidak perlu
digunakan (stopwords) seperti “dan” atau
“yang”.
3 Proses
indexing
menggunakan
pembobotan tf-idf.
Gambaran sistem dalam penelitian ini
dapat dilihat pada Gambar 1.
Kueri

Dokumen

Praproses

Praproses

Pemrosesan Dokumen
Ukuran
kesamaan
koefisien
cosine

Ukuran
kesamaan
koefisien
Jaccard

Ukuran
kesamaan
koefisien
Dice

Hasil

Evaluasi

Gambar 1 Diagram alur metode penelitian.
Pemrosesan Dokumen
Pengukuran kesamaan yang dibandingkan
menggunakan metode dari model ruang
vektor yaitu koefisien cosine, Jaccard, dan
Dice.
Hasil temu kembali dari masing-masing
ukuran
koefisien
kesamaan
akan
dibandingkan berdasarkan 3 hal yaitu recall
dan average precision, waktu komputasi dan
kompleksitas algoritme.

4

Evaluasi
Pengukuran yang digunakan untuk
mengevaluasi kinerja suatu sistem temu
kembali informasi dalam penelitian ini adalah
recall dan precision. Hasil perhitungan recall
dan
precision
untuk
masing-masing
pembobotan akan digambarkan
dalam
bentuk
grafik,
kemudian
dilakukan
perhitungan interpolasi maksimum untuk
mendapatkan nilai average precision yang
akan digambarkan melalui tabel. Dihitung
juga nilai kompleksitas algoritme dan waktu
komputasi, kemudian dibandingkan untuk
masing-masing koefisien.
Lingkungan Pengembangan
Penelitian
ini
dilakukan
dengan
menggunakan bantuan perangkat keras dan
perangkat lunak dengan spesifikasi sebagai
berikut:
 Perangkat lunak: Microsoft Windows 7
Ultimate, xampp sebagai web server.
 Perangkat keras: AMD E-350 Processor
1.6 GHz, 2 GB RAM, Hard disk 300 GB.

HASIL DAN PEMBAHASAN
Koleksi Dokumen Pengujian
Koleksi dokumen yang digunakan untuk
menguji sistem berasal dari korpus yang
sudah tersedia di Laboratorium Temu
Kembali Informasi, Departemen Ilmu
Komputer IPB. Koleksi terdiri atas 1000
dokumen dengan format teks (.txt) dengan
struktur tag XML pada masing-masing
dokumen. Contoh dokumen uji dapat dilihat
di Lampiran 1. Tag yang digunakan dalam
dokumen, yaitu :

mewakili
keseluruhan
dokumen. Di dalamnya terdapat tag lain
yang mendeskripsikan isi dokumen lebih
jelas.
 mewakili ID dokumen.
ID yang dipakai merupakan kombinasi
nama sumber berita, tanggal, dan urutan
berita pada tanggal yang sama.
 mewakili judul dokumen.
 mewakili penulis
dokumen.
 mewakili isi dokumen.
Jumlah kueri uji yang akan digunakan
dalam penelitian ini adalah 30 kueri uji
dokumen pertanian yang berasal dari

Laboratorium Temu Kembali Informasi.
Daftar kueri uji yang digunakan dalam
penelitian ini dapat dilihat pada Lampiran 2.
Praproses
Praproses dilakukan dengan tahapan
tokenisasi, pembuangan kata yang tidak
perlu, dan pembobotan. Tahap tokenisasi
dilakukan dengan pembacaan karakter per
karakter. Tujuannya untuk membedakan
karakter-karakter yang bersifat separator.
Separator yang dihilangkan, yaitu: karakter
pemisah indeks istilah (whitespace), karakter
angka, titik, koma, dan karakter lainnya yang
dianggap kurang representasif dalam
mencirikan suatu dokumen.
Tahap pembuangan stopword dilakukan
setelah hasil tokenisasi dokumen didapatkan.
Hasil tokenisasi dibandingkan dengan
stopword. Jika token berada di dalam
stopword, token tersebut harus dihilangkan.
Pembuangan token juga dilakukan untuk
token yang terdiri atas dua huruf karena token
tersebut
kurang
representatif
dalam
mencirikan suatu dokumen.
Pembobotan
dimulai
dengan
mendapatkan frekuensi tiap token di dalam
setiap dokumen (tf), setelah itu dihitung
jumlah dokumen yang mengandung token
tertentu (df). Hasil dari df akan digunakan
untuk mendapatkan nilai idf (Inverse
document frequency) dari setiap token. Hasil
idf ini disimpan dalam file “Idf.txt”.
Pembobotan tf-idf didapatkan dari hasil
perkalian antara tf dan idf. Hasil perhitungan
tf-idf juga disimpan ke dalam file “tf-idf.txt”
untuk mempermudah proses perhitungan
selanjutnya. Hasil pemrosesan dokumen
digunakan untuk menghitung kesamaan kueri
dengan dokumen menggunakan tiga koefisien
model ruang vektor.
Pemrosesan Dokumen
Ukuran kesamaan yang digunakan untuk
Menghitung bobot antara dokumen dan kueri
yang pertama adalah koefisien cosine. Hasil
dari koefisien cosine akan diurutkan
berdasarkan dokumen yang memunyai
kesamaan terbesar sampai terkecil. Di bawah
ini adalah 10 hasil teratas dari dokumen
koefisien cosine dengan kueri “bencana
kekeringan”.

5

mediaindonesia110703 => 0.14686
gatra070203 => 0.1260200519299
indosiar310504 => 0.11737558600
mediaindonesia160603 => 0.1130521579
kompas250803 => 0.10169930497365
mediaindonesia260803 => 0.0963119982
indosiar170603 => 0.0863044
mediaindonesia050604-001 => 0.080123
indosiar010903 => 0.078978547799479
republika030903-002 => 0.07173908795
Ukuran kesamaan kedua adalah koefisien
Jaccard, dengan urutan yang tidak berbeda
jika dibandingkan dengan cosine. Di bawah
ini adalah 10 hasil teratas dari koefisien
Jaccard.
mediaindonesia110703 => 0.18368283
gatra070203 => 0.1765258240
indosiar310504 => 0.146857896
mediaindonesia160603 => 0.13315907
kompas250803 => 0.1203722
mediaindonesia260803 => 0.11458805
indosiar170603 => 0.105969455
mediaindonesia050604-001 => 0.09603
indosiar010903 => 0.08789476
republika030903-002 => 0.083524681
Begitu juga dengan koefisien Dice tidak
terlihat
perbedaan
urutan
dalam
pemeringkatan hasil temu kembali informasi.
Di bawah ini adalah 10 hasil teratas dari
koefisien Dice.
mediaindonesia110703 => 0.17214
gatra070203 => 0.144191010
indosiar310504 => 0.1329847
mediaindonesia160603 => 0.127462013
kompas250803 => 0.11321298707296
mediaindonesia260803 => 0.106576603
indosiar170603 => 0.094456514765376
mediaindonesia050604-001 => 0.087102
indosiar010903 => 0.085751040446215
republika030903-002 => 0.07728332306
Waktu Komputasi
Waktu komputasi dalam ukuran detik,
diambil sebanyak 5 kali, kemudian dibuat
nilai rata-rata dari masing-masing nilai
berdasarkan kueri. Grafik waktu komputasi
dapat dilihat di Lampiran 5 dan tabel waktu
komputasi dapat dilihat di Lampiran 6.

Kompleksitas Algoritme
Kompleksitas algoritme diambil dari
masing-masing nilai koefisien. Setiap proses
dihitung kompleksitasnya, kemudian dibuat
nilai notasi Big-O untuk hasilnya. Notai BigO yang digunakan karena notasi ini
mendeskripsikan kinerja kasus terburuk
(worst-case) dari suatu algoritme, sehingga
Big-O dapat menjamin bahwa suatu algoritme
tidak akan lebih buruk dari worst-case. Tabel
2, 3, dan 4 menunjukkan hasil perhitungan
kompleksitas untuk masing-masing koefisien
model ruang vektor.
Tabel 2

Kompleksitas algoritme koefisien
cosine.

Algoritme
procedure cosine()
cosine