6
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI
2.1. Tinjauan Pustaka
Pada penelitian sebelumnya yang dilakukan oleh Zhang, L. Zhang, L., 2014, ia memanfaatkan algoritma User-Based Collaborative Filtering UCF
untuk mencari rekomendasi yang fokus pada penyajian item baru atau disebut novelty. Ia mengembangkan algoritma UCF dengan menambahkan faktor
dissimilarity item yang berbeda dari profil pengguna aktif dan faktor tingkat kepopuleran item dengan tujuan penambahan faktor-faktor tersebut dapat
membantu pengguna aktif mendapatkan item yang bersifat “baru” novelty. Kata “baru” atau novelty dalam penelitian ini merujuk pada item yang di rating oleh
pengguna aktif, namun item tersebut sama sekali tidak memiliki kesamaan profil dengan daftar rating pengguna. Manfaat yang didapat dari penelitian ini adalah
supaya rekomendasi yang ditawarkan tidak bersifat kaku dan tidak sempit lingkupnya.
Dalam perkembangannya, para peneliti mulai mengembangkan algoritma- algoritma rekomendasi yang sudah ada dengan tujuan mendapatkan akurasi dan
presisi rekomendasi yang lebih baik dari sebelumnya. Selain menambahkan variabel-variabel baru, beberapa peneliti memanfaatkan metode clustering seperti
K-Means untuk membagi data rating menjadi beberapa cluster. Inilah yang dilakukan oleh Zhang Zhang, L., 2014 dalam penelitiannya dengan fokus
pengembangan algoritma User-Based Clustering Collaborative Filtering. Hasil
2.1. Tinjauan Pus s
ta ta
k ka
Pada a
p enelitian sebelumn
m ya
y yan
an g
g di
di la
a ku
k kan oleh Zha
ang ng
, L. Zhang, L., 2014,
, i
ia memanfaa at
tkan an
algoritma User-Based d C
Col olla
laborative Filte tering UCF
un n
t tuk menc
nc ar
ar i
i re
r kome
e nd
nd as
i ya
ng fok us
pad a
pe ny
nyaj aj
ian it tem
em ba
ba ru atau
u disebut novelt
lt y
y. .
Ia Ia
m m
e en
gemb an
gkan algor itma
UCF d en
gan m
mena mb
mbah ah
ka ka
n fa fakt
k or
di i
ss ss
im i
il ilarit
t y
y item yang
b er
beda dar i
profil pen gg
una aktif d
d a
an fak akto
to r
r tingka kat
ke ke
po po
pule le
ra n
item dengan tu
juan pen
ambaha n
faktor-faktor te
terseb b
ut ut
d d
apat memba
antu pengg
un a
ak tif mend
ap atka
n item
ya ng bersi
fa t “baru”
no ovelty
. Ka
ata a
“baru” ”
atau novelty dalam pen
el it
ian ini merujuk pada item yang di
rating g ole
h h
g g
peng ggu
gu na
a ktif
, na mu
mu n
n it
it em
em te
te rs
rs ebut sama se
se ka
ka li
li t
t id
id ak
ak m
em il
iki ke
sa a
m maan pro
ro f
fi l
l dengan daftar rating pengguna. Ma
Ma nf
n aa
aa t
t yang didapat dari penelitian ini a a
da da
la lah
h su
supa pa
ya ya rekomendasi yang ditawarkan tidak bersifat kaku dan t
t id
id ak
ak s
sem em
pit li
li ng
ng ku
k pnya.
Da l
lam perkembangannya, ,
p para pe
e ne
n liti mulai mengemb
b angkan algoritma-
algoritma rekomendasi yang sud dah ada den
ngan tujuan mendapatkan akurasi dan presisi rekomendasi yang lebih
baik da ari sebelumnya. Selain menambahkan
variabel-variabel baru, beberapa pen n
el e
it t
i i memanfaatkan metode clustering seperti
g
7
dari penelitian ini menunjukkan bahwa dengan memanfaatkan clustering dalam algoritma rekomendasi dapat mengurangi masalah ketersebaran data dan
menambah kemampuan sistem rekomendasi dalam mencari neighbor yang baik. Tahap selanjutnya dalam perkembangan algoritma sistem rekomendasi
adalah menggabungkan dua atau lebih algoritma rekomendasi dengan tujuan supaya dapat saling menutupi kelemahan algoritma satu sama lain. Penelitian
yang dilakukan oleh Shinde Shinde, S. K., 2011 dengan menggabungkan User- Based
dan Item-Based Collaborative Filtering serta memanfaatkan K-Medoids clustering
dalam pembagian neighbor-nya, menunjukkan bahwa dengan memanfaatkan clustering dalam proses pencarian neighbor dapat menambah
kemampuan rekomendasi sistem. Selain berfokus pada penggabungan algoritma rekomendasi ataupun
clustering , De Campos De Campos et al., 2010 melakukan penelitian dengan
melibatkan “model” jaringan network pada sistem rekomendasi yang bersifat Hybrid
. Tujuan pemodelan ini adalah untuk mengatur peran dari algoritma rekomendasi gabungan yang diterapkan dalam sistem. Ia memanfaatkan Bayesian
Network Model supaya peran algoritma rekomendasi gabungannya Hybrid dapat
menghasilkan rekomendasi yang akurat. Beberapa peneliti lain yang seperti Formoso Formoso et al., 2013 lebih
memfokuskan penelitiannya pada efisiensi data. Pada penelitiannya, ia menekankan bahwa dalam penerapannya di dunia nyata online, faktor ukuran
data dan kecepatan penyajian rekomendasi sangatlah penting. Dengan cara menambah kemampuan sistem
m r
re k
komendas i
i da
da la
l m mencari neighbor yang baik.
r Tahap se
e la
lanjutnya dala a
m perkembangan algoritma ma sistem rekomendasi
adalah men enggabungk
g an
an d
d ua a
a ta
ta u
u le
le bi
bi h
al lgo
go r
ritm tm
a a
rekomendas i
i dengan tujuan
supa a
y ya dapat s
s aling
m menutupi kel
el em
em ah
ah an
an algoritma
a satu
s sama lain.
Penelitian y
yang dil l
ak ak
uk uk
an an
oleh h
S Sh
inde Shinde ,
S. K., 2011 den
ga gan meng
ng ga
ga bu
b ngkan
n User- Base
e d
d da
dan It t
e em
-Based Collaborative Filtering ser
ta mem
an nfa
f atka
ka n
n K K-
g Medo
oid i
s cl
l us
us te
te ring
g dalam pemba
gi an
g g
neig hb
or -nya,
me nunjukkan
ba b
hw w
a de de
ngan n
me memanf
f aa
tk an
clustering d
al am
pro se
s pe nc
ar ian
g neighbor
dap a
at m m
en enam
am bah
r kemam
mp uan rekome
nd as
i sistem .
Se lain
berfokus pa p
da penggabungan algo g
ritma rekome nd
as asi
i ataupu pu
n n
clustering , De Campos De Camp
mpo os et
t al al., 2010 melakukan penelitian de
e ng
ngan n
me meli
li ba
b tkan “model” jaringan network pada sistem rekomendasi yang
ng b b
er ersi
si f
fat kk
Hy Hy
br brid
id .
Tu Tu
ju juan
an p
p em
em od
od el
el an
an i
i ni
ni a ada
da la
a h
h un untu
tu k
k me
me ng
ng at
at ur
ur p
p er
er an
an d
d ar
ar i
i al algo
gori ritma
reko kome
m nd nd
as as
i i
g ga
bu bung
ng an
yang dite te
ra r
pkan dal al
a am sistem.
I I
a a
me m
ma ma
nf nf
aa aa
tk tkan
an B
Bayesian Network Model
supaya peran alg g
o oritma rek
k o
omendasi gabungannya Hybrid dapat d
d menghasilkan rekomendasi yang
ak a
urat. Beberapa peneliti lain yang
se s
pe perti Formoso Formoso et al., 2013 lebih
f k k li i
d fi i
i d
d li i
i
8
mengkompresi ukuran matrix user-item rating hingga 75 dari ukuran aslinya, Formoso menunjukkan bahwa kecepatan rekomendasi naik dua kali lipat
dibandingkan dengan rekomendasi yang masih menggunakan ukuran matrix aslinya.
Beberapa penelitian diatas memiliki fokusnya masing-masing, mulai dari penggabungan algoritma, clustering, hingga pemodelan jaringan dan
mempercepat kecepatan rekomendasi. Dalam penelitian kali ini, peneliti ingin lebih fokus pada peningkatan kualitas pencarian neighbor dengan memanfaatkan
Pearson-Correlation untuk menghitung seberapa dekat pengguna aktif dengan
pengguna lainnya. Semakin besar nilai yang dihasilkan dari pengukuran kedekatan tersebut, maka semakin besar kemungkinannya pengguna tersebut
adalah sumber rekomendasi yang baik bagi pengguna aktif. Baik atau tidaknya rekomendasi yang diberikan, nantinya akan terlihat
pada bagian evaluasi rekomendasi. Pada bagian evaluasi, sistem akan mencocokan seberapa banyak rekomendasi yang sudah di rating oleh pengguna.
Daftar tersebutlah yang disebut dengan rekomendasi yang akurat. Penelitian ini mencoba mencari tau seberapa akurat rekomendasi sistem
yang menerapkan User-Based Collaborative Filtering dan memanfaatkan Pearson-Correlation
sebagai dasar pencarian neighbor-nya. Peneliti memiliki asumsi bahwa pemilihan neighbor sangatlah berperan penting dalam keakuratan
rekomendasi. Untuk itu peneliti hanya akan mengambil semua neighbor yang memiliki koefisien relasi lebih dari 0,5 untuk nilai 1 yang berarti neighbor
dibandingkan dengan rekome me
nd ndasi yang m
mas a
ih menggunakan ukuran matrix aslinya.
Be e
b berapa pen
en el
l it
it ia
ia n diat
tas as m
mem emil
lik ik
i i
fo fo
ku u
sn sn
ya ya
masing-ma asi
si ng, mulai dari
peng g
g gabungan
n algor
r itma,
cl cl
us us
te te
ri ri
ng ng
, hi
hi ng
g ga
p p
emod d
el e
an an
jarin nga
g n dan
m memper
r ce
ce pa
pa t
t k
kece e
pa pa
ta n rekomendas
i. Dalam penel
it ia
ian n
kali i
i i
ni ni
, ,
pe p
neliti i
ingin lebih
h fo
fok kus pa
pa d
da penin gk
atan kualita s
pencarian ne ig
hbor de
ng ngan m
mem emanfaatk
kan Pe
Pe ar
ar so
s n-C
Co rrelation
untu k
menghitu ng
seber ap
a dekat penggu
n na a
a k
ktif if
d de
engan n
pe pe
ng n
gu n
na l
ai nn
ya .
Semaki n
besa r
ni lai
ya ng dihasilka
n dari
pen n
gu gu
ku k
ran n
kedeka a
ta n tersebut,
ma ka
s em
akin besar k
em un
gkin annya peng
gu una terse
e bu
bu t
ad adalah
h sumber
re komendasi ya
ng baik bagi pen
gguna aktif. Baik atau tidaknya rekom
m en
enda a
si si
yang diberikan, nantinya akan ter erli
liha ha
t pa
pada da bagian evaluasi rekomendasi. Pada bagian evaluasi, sist
st em
em a
a ka
k n
me me
nc n
oc ok
ok an
an s
s eb
eb er
er ap
ap a
a ba
ba ny
ny k
ak r
r ek
ekom omen
en da
dasi si
y yang
su su
da da
h h
di di
ra ra
ti ti
ng ng
o o
l le
h h pe
peng ng
g guna.
g g
Daft ft
ar ar
ter r
se se
b butlah
h y
y a
ang disebut de dengan rek
k o
omendasi yan n
g g
ak a
ur at
at. Penelitian ini mencoba m
mencari tau u seberapa akurat rekomendasi sistem
yang menerapkan User-Based Collabo
orative Filtering dan memanfaatkan
Pearson-Correlation sebagai dasar
p p
e encarian neighbor-nya. Peneliti memiliki
9
memiliki relasi kuat dengan pengguna aktif dengan pengguna aktif. Relasi dibawah batas tersebut dianggap relasi yang lemah dan tidak layak menjadi
sumber rekomendasi bagi pengguna aktif. sumber rekomendasi bagi peng
ng g
guna aktif.
10
Tabel 2.1 Tabel Rangkuman Tinjauan Pustaka
No Nama Peneliti, Tahun
Judul Penelitian Pokok Bahasan
1 Zhang, L., Peng, Li F., Phelan,
C.A., 2014 Novel Recommendation of
User-Based Collaborative Filtering
Penelitian ini membahas tentang pengembangan dari algoritma rekomendasi User-Based Collaborative Filtering dengan
melibatkan faktor “pembaruan” novelty pada item yang akan direkomendasikan.
2 Zhang, L., Qin, Tao, Teng,
PiQiang, 2014 An Improved Collaborative
Filtering Algorithm Based on User Interest
Pada penelitian ini, algoritma Collaborative Filtering dikembangkan dengan mengelompokkan para pengguna sistem
terlebih dahulu melalui clustering yang didasari dari ketertarikan tiap pengguna. Metode pencarian neighbor juga
dikembangkan untuk mengatasi ketersebaran data dalam sistem.
3 Shinde, S. K., Kulkarni, U. V.,
2011 Hybrid Personalized
Recommender System Using Fast K-medoids Clustering
Algorithm Penelitian ini menggabungkan User-Based dan Item-Based
Collaborative Filtering dan mengelompokkan pengguna dengan K-Medoids Clustering Algorithm dengan tujuan untuk
mencari rekomendasi yang berkualitas dan akurat bagi pengguna aktif.
4 Formoso, Vreixo, Fernandez,
D., Cacheda, F., Carneiro, V., 2013
Using Rating Matrix Compression Techniques to
Speed Up Collaborative Recommendations
Penelitian ini fokus pada cara untuk mengkompresi tabel rating menjadi sebuah matrix dengan tujuan untuk mempercepat
pencarian rekomendasi dan menghemat ukuran data.
5 Beel, J., Langer, S., Genzmehr, A Comparative Analysis of Pada penelitian ini membuktikan bahwa ada perbedaan hasil
Ta Tabel 2.1 Tabe
e l Rangkuman Tinjauan P
P us
ustaka
eneliti, Tahun Judu
du l Pene
e liti
ti an
n Pokok Baha
eng, Li F. .
, Phelan ,
, No
No vel Reco
co mm
mm endati
on o
f f
Us U
er-Ba Ba
se d
Collab or
ative Filt
lt er
in g
Pe Pe
ne n
litian ini i
m me
embahas te
te ntang pen
reko me
e nd
nd asi Us
Us er
er- -
Ba B
sed Collabo
meliba tkan
f f
ak a
tor “p “p
em emba
baruan n
” nov dire
ko mendas
ik kan
a .
Q Q
i in, Ta
a o,
o T
Teng g
, 4
An Impro ve
d Collab or
ative Filtering Al
go rithm Ba
se d on
User Interest Pada penelitian
ini, ,
a algoritm
ma di
ke mbangkan den
ga gan me
e ng
ng elompo
po te
rlebih dahulu me
melalu u
i i
c cluster
r ke
tertarikan tia
p pe ng
gguna a
. .
Me M
to to
d d
dike mb
an gk
an untuk mengata
asi i
sist em.
., K
Kulka a
rn rn
i, U U
. V., Hybrid Personalized
Re co
o mm
mm e
en d
der Sy
Sy stem Using
ng Fa
st K
-me d
do id
ids s
Cl C
uste e
ri ring
ng Algorithm
Penelitian ini mengg a
a bung
ng k
kan Us U
Co Co
ll ll
ab ab
or or
at at
iv e Fi
lt er
in n
g g dan me
m d
dengan K- M
Medoids Clustering g A
Alg lg
o mencari rekomendasi yang
ng b
be erk
pengguna aktif. reixo,
o, F
F er
er na
na nd
d ez
z ,
F., Ca Carn
rn ei
e ro,
V V.,
Us Us
in in
g g
Ra Ra
ti ti
ng ng
Matri i
x x
Co Comp
mp re
ress ss
io ion
T Te
ch chni
ni qu
qu es
es t
t o
o Sp
Spee ee
d d
U Up
C C
ollabo bo
r rative
e Re
Recommendations Pe
Pe ne
ne li
li ti
ti an
an i
i ni
ni f
f ok
ok us
us p d
ada a
ca cara
ra u u
n ntuk
me nj
nj ad
ad i
i se bu
bu ah
ah m
atrix de de
ng ngan tu
pencar ar
ia ia
n re reko
ko me
me nd
nd as
as i
i da dan
n menghem ger, S., Genzmehr,
A Comparative A Analysis o
of Pada penelitian ini membuktikan b
11
M., Gipp, B. and Nürnberger, A. 2013
Offline and Online Evaluations and Discussion of
Research Paper Recommender System
Evaluation evaluasi rekomendasi yang didapat pada lingkungan sistem
yang online dengan lingkungan sistem yang offline. Fokus pada penelitian ini adalah membandingkan hasil evaluasi pada
sistem online dan offline.
6 De Campos,L. M., Fernandez-
Luna,J. M., Huete,F. J., Rueda- Morales,M. A., 2010
Combining Content-Based And Collaborative
Recommendations: A Hybrid Approach Based On Bayesian
Networks Penelitian ini menggabungkan Content-Based Filtering dengan
Collaborative Filtering dan memodelkannya menggunakan pendekatan Bayesian Networks. Tujuan penggabungan kedua
algoritma tersebut adalah untuk meningkatkan kualitas rekomendasi sistem.
. and Nürnberger, Of Of
fl fline and
d Online
Evaluations and Di D
sc sc
us us
si i
on on
o o
f f
Resear ar
ch h
Pa Pa
pe pe
r r
Re R
comm mm
en en
de d
r System Ev
Ev aluation
evaluasi re e
ko ko
mendasi yang didapa ya
yang online deng ngan lingkungan si
pa pa
da da p
p en
en elitian ini
ad ad
alah memband sist
t em
em o o
nline da
d n offlin
ne. e
L. M., F Fernand
d ez
ez- -
Huete, e,
F F. J.,
R Rue
ueda da-
A., 2 2
010 Co
C mb
b in
in ing Content
- Based
An An
d d
Collab or
ative Recommendations: A
H ybrid
Approach B
as ed On Ba
ye sian
Networks Peneli
ti i
an an ini m
m en
engg ggab
a ungk
k a
an Cont Collabor
ativ e
e Filt
lt er
r in
in g
g da d
n me
m m
pend ek
atan B ay
y es
e ian Ne
Ne tw
tw orks.
Tu algo
ri tma ters
eb b
u ut
a ada
dala la
h un t
tuk re
ko mendasi sistem
.
12
2.2. Tinjauan Teoritis User-Based Collaborative Filtering