PENDAHULUAN USER-BASED COLLABORATIVE FILTERING DENGAN MEMANFAATKAN PEARSON-CORRELATION UNTUK MENCARI NEIGHBORS TERDEKAT DALAM SISTEM REKOMENDASI.

BAB I
PENDAHULUAN

1.1. Latar Belakangg
Peneliti
tian seputar siste
em rekomendasi dalam satu ddekade
ekade terakhir ini
Penelitian
sistem
berkemba
bang dengann pe
pesa
at. Leb
bih
h ddari
arri 20
200 artikel
arti
ar
t ke

kell pe
penelitian yan
angg membahas
berkembang
pesat.
Lebih
yang
tent
ntang
tentang

si
ist
stem
em
sistem

rekomen
enda
dasi

rekomendasi

sudah

terpu
ubl
blik
ikasi
terpublikasi

(Bee
eel,
l,
(Beel,

2013).

Seiring

bertam

amba
bahn
hnya art
tik
ikel-artikel tersebut, algoritma rekomenda
dasi
s yan
ng di
dike
kemban
ngk
g an
bertambahnya
artikel-artikel
rekomendasi
yang
dikembangkan
dann di
diin
i ovas

asikan sesuai dengan kebutuhan masing-masing sis
ste
t m pu
punn semaki
kin
diinovasikan
sistem
semakin
ba
bany
nyak. Berdasarkan sudut pandang penyaringan informasin
nya
y , al
algo
gori
r tmaa
banyak.
informasinya,
algoritma
re

eko
k meendasi yang sering digunakan dalam sistem rekomendasi terb
bagi m
enjaadi
d
rekomendasi
terbagi
menjadi
tiga jenis,
jeenis, yaitu : Content-Based Filtering (CB), User-Based Co
ollaboraative
Collaborative
Filt
lter
e in
ing (UCF) dan Item-Based Collaborative Filtering (ICF).
Filtering
tersebut
Beberapa peneliti mengembangkan
mengemba

bang
ngka
kan ketiga algoritma penyaringan ter
erse
sebu
but
secara
menggabungkan
lebih
se
seca
caraa tterpisah,
erpi
er
p sah, namun ada juga peneliti yang meng
gga
g bungkan le
lebi
bihh da
dari

ri ssatu
atu
algoritma
mendapatkan
hasil
rekomendasi
al
algo
gori
ritma dengan ttujuan
ujua
uj
uan mendapat
atka
kann ha
hasi
sil rekomend
ndas
asii ya
yyang

ng terbaik ((Hu
Hu et al.,
Campos
2011),
) (De
(De C
amppos et al., 2010), (Chen et
am
et al. 2010). Untuk
Unttuk mengetahui
men
enge
geta
tahui apakah
mendapatkan
algoritma yang dikembangkan m
endapatkaan hasil yang terbaik atau tidak, para
peneliti menggunakan beberapa teknik eevaluasi
valuasi seperti Mean Absolute Error
Recall,

dan
(MAE), Precision Value, Recall
l, da
an lainnya. (Beel, 2013), (Jin, 2006),
(Claypool, 1999).
(Claypool
1999)
Dalam

penerapannya

pada

sistem

rekomendasi,

UCF

seringkali


dipasangkan dengan ICF karena memiliki banyak kesamaan dalam teknik

1

penyaringan dan bahkan dalam hal kekurangan dan kelebihannya. UCF
mengasumsikan bahwa untuk mencari sesuatu yang akan disukai oleh pengguna
A, maka harus dicari penggun
unaa llain
ain dengan ke
kece
c nderungan yang sama. Pengguna
pengguna
kecenderungan
lain yang memilikii ketertarikan
ketertarikan / kecenderungan yang sama
sam
a a dengan pengguna A
disebut dengan
deng

ngaan neighbor. Segala
la ses
e ua
u tu yyang
ang di
an
ddisukai
sukai oleh neig
ghb
h or akan menjadi
sesuatu
neighbor
sumber
er rekomendasi
si untuk
unt
ntuuk pengguna A. S
edik
d kit berbeda
berbeda dengann UCF, ICF
Sedikit
me
menampun
ng se
sega
gala item
m yang telah disukai oleh pengguna
peeng
nggu
g na A tterlebih
erle
er
lebih dahu
hulu dan
menampung
segala
dahulu
kemudi
dian
an mulai
ai menelusuri item lain yang akan disukai
disukkai olehh pengguna
peng
pe
nggunaa A.
kemudian
Pe
erbedaan
d
IICF
CF dan UCF terletak pada titik awal dalam menc
cari rrekomendasi
ekom
ek
o endaasi
s
Perbedaan
mencari
un
untu
tuk seorang
seeorang pengguna dan jenis neighbor-nya. (Lops et al., 2011
11), ((Sarwar
Sarw
Sa
rwaar et
untuk
2011),
2001).
al., 200
01).
rekomendasi,
Peran neighbor sangatlah penting dalam sistem rekomend
dasi,, selain
n
sebagai
rekomendasi,
berperan sebag
agai
ai ssumber
umbe
um
berr re
reko
k meend
n asi, ada
ada jjuga
ugaa da
ug
data
ta llain
ainn pa
ai
ppada
da neighborr yyang
angg
an
menghitung
na
nantinya
akan digunakan untuk meng
nghitung nilai prediksi. Dalam hal iini
ni ddata
ata
at
tersebut
nilai
rating
terhadap
rekomendasi.
Nilai
te
ters
rseb
ebut
u adalah
ada
dala
lahh ni
nila
laii ra
rati
ting
ng neighbor
nei
eigh
ghborr terhada
ap it
item
em re
reko
kome
mend
ndas
asii. N
ilaii pprediksi
il
redi
re
diks
ksii ini
nantinya
peneliti
na
nant
ntin
inya
ya digunakan
dig
gun
unak
akan
an ooleh
lehh pa
le
para
r pen
enel
elit
iti sebagai
seba
baga
gaii tolak
t laak ukur
to
uku seberapa
seb
ber
erap
apa “baik”
“baik”
dikembangkan.
algoritma rekomendasi
rekkomendasi yang sedang
sedan
ng dikemb
mbangkan.
peneliti
mencoba
Pada penelitian ini, pen
neliti men
ncoba memanfaatkan sebuah metode
mendapatkan
pengukuran dengan tujuan bisa m
endap
apatkan neighborr terbaik, sebagai dasar
pencarian rekomendasi dan nilai prediksi
pred
dik
iksi yang akurat. Metode pengukuran yang
digunakan adalah Pearson-Correlation Coefficient. Dengan memanfaatkan
metode pengukuran ini, peneliti ingin membuktikan seberapa besar pengaruh
relasi neighbor terhadap keakuratan rekomendasi dan prediksi.
2

Keakuratan rekomendasi dan prediksi dari penelitian ini akan dievaluasi
dengan menggunakan metode evaluasi Mean Absolute Error (MAE), Precision
dan Recall Value. Metode MAE
AE digunakan
digunakan untuk
unt
ntuk
u mengukur seberapa kuat akurasi
dari nilai prediksi ya
yan
ng diberikan oleh algoritma peneli
liti
ti dengan nilai ratingg yang
yang
peneliti
sudah diberi
ri oleh pengguna (ev
val
a ua
uasi
s secara
sec
ecar
araa of
offl
f ine). Precisionn dan Recall Value
(evaluasi
offline).
berfun
ngsi untuk mengetahui
meeng
nget
etah
ahui seberapa banyak
k rrekomendasi
ekom
ek
omeendasi item ya
yang “tepat”
berfungsi
di
iberikan un
untu
tukk ppenerima.
enerima
ma.
diberikan
untuk
1.2. Perumusan
Peru
Pe
rumusa
san Masalah
Da
ari latar belakang permasalahan tersebut diatas, dapat di
diam
mbi
bill ru
rumu
m sann
Dari
diambil
rumusan
ma
masalah
h sebagai berikut :
1. Bagaimana
Baagaimana menerapkan metode Pearson-Correlation kedal
lam sist
stem
m
kedalam
sistem
rek
komendasi?
rekomendasi?
22. Apakah

nilai

relasi

antara

ppengguna
engguna
en

terhadap

neighbor-nya

dapat
dap
apaat

mempengaruhi
me
memp
mpengaruhi keakuratan rekomendasi dan prediksi?
Batasan
1.3. Ba
1.3.
Bata
tasan Masalah
Masa
Ma
sala
lah
Pada
Pa
P
da penelitian ini lingkupp permasalahan
p rmassalahan dibatasi sebagaii bberikut
pe
erikut :
digunakan
untuk
1. Teknik pengukuran yang dig
gun
u akan unt
ntuk menentukan relasi antar pengguna
Pearson-Correlation
sistem adalah Pearson-Correlat
ation
22. Algoritma yang digunakan untukk menghitung nilai prediksi rekomendasi
adalah User-Based Collaborative Filtering dengan melibatkan nilai kedekatan
pengguna dengan neighbor-nya.

3

3. Teknik evaluasi yang digunakan untuk mengukur keakuratan nilai prediksi
adalah Mean Absolute Error (MAE).
4. Precision, Recall Value
Valu
luee ddigunakan
igunakan untuk mengukur
meng
nguk
u ur keakuratan rekomendasi.
1.4. Manfaat Pe
Penelitian
Pe
Penelitian
ni bermanfaat
ber
erma
m nfaaat un
untu
tukk para
paaraa ppeneliti
enel
en
elitti at
atau
aupun develo
ope
p r yang ingin
ini
untuk
ataupun
developer
me
engembang
ngka
kann sistem rek
ekom
omendasi. Hasil
H si
Ha
sill evaluasi
ev
darri al
aalgoritma
g ritma pr
go
pprediksi,
ediksi,
mengembangkan
rekomendasi.
dari
algori
ritm
ma re
rek
komeend
ndasi serta pencarian neighborr dapat ddigunakan
igunak
ig
akan
an ssebagai
ebagai bbahan
eb
ahan
algoritma
rekomendasi
tinj
jau
auan
an untuk
uk penelitian di masa mendatang.
tinjauan
1.5. Tuju
1.5.
juan Penelitian
Tujuan
Tujuan dari penelitian ini adalah untuk mengetahui apakah pemanfaatan
pemanfaata
tann
Pearso
on-Correlation dalam pencarian neighborr dan melibatkannya da
alam pproses
rosees
Pearson-Correlation
dalam
pena
awa
waran rekomendasi
rekomenddas
asii se
sert
rtaa pe
ppenghitungan
nghitungan nnilai
ilai
il
ai prediksi
pre
redi
d ksi dapat me
empengaru
ruhi
hi
penawaran
serta
mempengaruhi
kualitas rekomendasi.
Sistematika
1.6. Si
1.6.
S
stem
emat
atik
ikaa Penulisan
Penu
Pe
nuli
lisa
san
n
tesis
User-Based
Penulisann te
tesi
sis in
inii dengan
de n jjudul
udul
ud
ul : U
serse
r-Ba
Baseed Collaborative
Collaborativ
Co
ivee Filtering
Filltering
Fi
Memanfaatkan
Pearson-Correlation
Neighbor
Dengan M
emanfaatkan Pearson-C
em
Correlattion Untuk Mencarii Ne
Neig
ighb
hbor Terdekat
dalam
Dalam Sistem Rekomendasi, disusun da
alam lima bab, dengan sistematika
penulisan sebagai berikut.
Bab
Bab pertama Pendahuluan. B
ab ini menjelaskan secara singkat isi dari
tesis yang berisi latar belakang, perumusan masalah, batasan masalah dan manfaat
penelitian serta tujuan penelitian.

4

Bab kedua Tinjauan Pustaka. Bab ini akan menjelaskan teori yang
mendukung penyelesaian tesis yang berisi uraian penelitian pendahuluan,
algoritma User-Based Collabo
borrative Filteri
ring
ng,, Pearson-Correlation Coefficient,
Collaborative
Filtering,
Mean Absolute Erro
rorr, Precision dan Recall Value.
Error,
Ba
ab ketiga M
ettod
odol
o ogi Pe
P
n li
ne
litian
a . Ba
Babb in
inii menjelaskan
m njelaskan tentang
me
tent
ntang bahan atau
Bab
Metodologi
Penelitian.
mate
eri penelitia
ian,
n dataa da
ddan
n lang
gkaahh la
lang
ngka
kahh pe
ppenelitian.
nelitian
n.
materi
penelitian,
langkah-langkah
Bab kkeempat
Bab
eem
mpat Analisis dan Perancangan Sistem.

Babb in
inii me
m
mber
erikan
memberikan

penjelasan
akan
dibangun,
serta
penj
njel
elaasan ttentang
entang analisis dan desain perangkat lunak yang ak
kan
a dib
iban
angu
gun, ser
rta
t
si
sis
stem
e yang
yaang akan diterapkan.
sistem
Bab kelima Implementasi dan Pengujian Sistem. Dalam bab
ba ini akan
ak
kan
dibahas
untuk
mencari
ddi
bahaas implementasi dari teknik pengukuran Pearson-Correlation unt
tuk me
encarri
neighbor
neighb
hbor
or

dalam

Collaborative
Co
C
llaborative

ssistem
isttem
is

Filtering
g

rekomendasi
reko
re
k mendasi
dan

yang
ya

mengevaluasi
men
enge
gevaluasi

memanfaatkan
mem
emanfaatkan
hasil

yang

User-Based
U
ser-Bas
ased
ed

didapat

ddengan
enga
en
gan

menggunakan
me
meng
nggu
guna
n kan Mean Absolute Error dan Precision Value.
keenam
Kesimpulan
Bab
Ba ke
Bab
keen
enam
am K
esim
es
impuula
lan dan
n Sa
Saran. B
ab
b iini
ni berisi
beris
isii kesimpulan
kesi
ke
simp
mpul
ulan
an penelitian
pen
enelitian
serta saran-saran yang mungkin ddiberikan
iberikan uuntuk
ib
ntuk pengembangan lebih lanjut.

5