1
BAB I PENDAHULUAN
1.1. Latar Belakang
Penelitian seputar sistem rekomendasi dalam satu dekade terakhir ini berkembang dengan pesat. Lebih dari 200 artikel penelitian yang membahas
tentang sistem rekomendasi sudah terpublikasi Beel, 2013. Seiring bertambahnya artikel-artikel tersebut, algoritma rekomendasi yang dikembangkan
dan diinovasikan sesuai dengan kebutuhan masing-masing sistem pun semakin banyak. Berdasarkan sudut pandang penyaringan informasinya, algoritma
rekomendasi yang sering digunakan dalam sistem rekomendasi terbagi menjadi tiga jenis, yaitu : Content-Based Filtering CB, User-Based Collaborative
Filtering UCF dan Item-Based Collaborative Filtering ICF. Beberapa peneliti mengembangkan ketiga algoritma penyaringan tersebut
secara terpisah, namun ada juga peneliti yang menggabungkan lebih dari satu algoritma dengan tujuan mendapatkan hasil rekomendasi yang terbaik Hu et al.,
2011, De Campos et al., 2010, Chen et al. 2010. Untuk mengetahui apakah algoritma yang dikembangkan mendapatkan hasil yang terbaik atau tidak, para
peneliti menggunakan beberapa teknik evaluasi seperti Mean Absolute Error MAE, Precision Value, Recall, dan lainnya. Beel, 2013, Jin, 2006,
Claypool, 1999. Dalam penerapannya pada sistem rekomendasi, UCF seringkali
dipasangkan dengan ICF karena memiliki banyak kesamaan dalam teknik
1.1. Latar Belakang g
Peneliti tian seputar siste
e m
m rekomendasi dalam satu
d d
ekade terakhir ini berkemba
bang dengan n
pe pe
sa a
t. Leb b
ih h
d dar
r i
20 200
ar arti
t ke
ke l
l pe penelitian yan
ang g
membahas tent
nt an
g si i
st st
em em
rekomen en
da da
si sudah
t er
pu u
bl bl
ik ik
asi Bee ee
l, l,
2013. Seiring
bertam am
ba bahn
hnya art t
ik ik
el -a
rtikel tersebut, a
lgoritma rekom enda
dasi s
yan n
g g
di dike
ke mban
ngk g
an dan
n di
di in
i ovas
as ikan sesua
i de ngan keb
utuh an masin
g- masing s
is ste
t m
pu pun
n semaki
kin ba
ba ny
ny ak.
Be rdasarkan su
du t pand
an g
peny ar
in gan informas
in nya
y , al
al go
go ri
r tma
a re
e ko
k me
e ndasi yang sering di
gu na
kan da
lam si
st em rekom
en da
si ter b
bagi m
m en
ja a
di d
tiga j e
en is, yaitu : Cont
ent- Base
d Fi lt
erin g C
B , User-Based
C o
ollabora ativ
e Fi
lt lt
er e
in in
g UCF da
n Item-Based Collaborative Filtering ICF.
Beberapa peneliti mengemba bang
ngka ka
n ketiga algoritma penyaringan ter erse
sebu bu
t se
se ca
ca ra
a t
t er
er pi
p sah, namun ada juga peneliti yang meng
g ga
g bungkan le
le bi
bi h
h da da
ri ri
s s
a atu
al al
go go
ri ri
tma dengan t t
uj ujua
uan mendapat atka
kan n
ha hasi
sil rekome nd
nd as
as i
i ya
y ng terbaik
Hu Hu et al.,
2011, De
De C
C am
am p
pos et al., 2010, Chen
e et al. 2010. Unt
t uk
uk m
m en
en ge
ge ta
tahui apakah algoritma yang dikembangkan m
mendapatka an hasil yang terbaik atau tidak, para
peneliti menggunakan beberapa teknik e
e va
luasi seperti Mean Absolute Error MAE, Precision Value, Recall
l ,
da a
n lainnya. Beel, 2013, Jin, 2006,
Claypool 1999
2
penyaringan dan bahkan dalam hal kekurangan dan kelebihannya. UCF mengasumsikan bahwa untuk mencari sesuatu yang akan disukai oleh pengguna
A, maka harus dicari pengguna lain dengan kecenderungan yang sama. Pengguna lain yang memiliki ketertarikan kecenderungan yang sama dengan pengguna A
disebut dengan neighbor. Segala sesuatu yang disukai oleh neighbor akan menjadi sumber rekomendasi untuk pengguna A. Sedikit berbeda dengan UCF, ICF
menampung segala item yang telah disukai oleh pengguna A terlebih dahulu dan kemudian mulai menelusuri item lain yang akan disukai oleh pengguna A.
Perbedaan ICF dan UCF terletak pada titik awal dalam mencari rekomendasi untuk seorang pengguna dan jenis neighbor-nya. Lops et al., 2011, Sarwar et
al., 2001. Peran neighbor sangatlah penting dalam sistem rekomendasi, selain
berperan sebagai sumber rekomendasi, ada juga data lain pada neighbor yang nantinya akan digunakan untuk menghitung nilai prediksi. Dalam hal ini data
tersebut adalah nilai rating neighbor terhadap item rekomendasi. Nilai prediksi ini nantinya digunakan oleh para peneliti sebagai tolak ukur seberapa “baik”
algoritma rekomendasi yang sedang dikembangkan. Pada penelitian ini, peneliti mencoba memanfaatkan sebuah metode
pengukuran dengan tujuan bisa mendapatkan neighbor terbaik, sebagai dasar pencarian rekomendasi dan nilai prediksi yang akurat. Metode pengukuran yang
digunakan adalah Pearson-Correlation Coefficient. Dengan memanfaatkan metode pengukuran ini, peneliti ingin membuktikan seberapa besar pengaruh
relasi neighbor terhadap keakuratan rekomendasi dan prediksi. A, maka harus dicari penggun
un a
a l
la in
dengan ke
ke ce
c nderungan yang sama. Pengguna
lain yang memiliki i
k k
et ertarikan kecenderungan yang
s s
am a
a dengan pengguna A disebut deng
ng a
an neighbor. Segala la
ses e
ua u
tu tu
y y
an an
g di d
sukai oleh neig ghb
h or akan menjadi
sumber er
rekomendasi si
u u
nt nt
u uk pengguna A. S
S d edik
k i
it b
b e
erbeda dengan n
UCF, ICF me
menampun n
g g
se sega
ga la item
m ya
ng telah dis
uk ai oleh
pe e
ng ng
gu g
na A
A t ter
erle le
bih dahu hulu dan
kemudi di
an an
mulai ai
m enelusuri item
la in
yang akan d
is uk
k ai
ai oleh
h pe
peng ng
guna a A.
Pe e
rb rb d
edaan I
ICF dan UCF terletak p
ad a titik aw
al dalam m
en c
cari r rek
ekom o
enda asi
s un
un tu
tu k
se e
or an
g pengguna dan j
enis ne ig
hbor-n ya
. Lops et al., 20 11
11, Sa
Sarw rwa
ar et al., 200
1 .
Peran neighbor sang at
lah penting da lam sistem rekomend
dasi, ,
selain n
berperan seb
ag ag
ai ai s
s um
um be
be r
r re
re ko
k me
e nd
n asi, a
a da
da j j
ug ug
a a
da da
ta ta
l l
ai ain
n pa
p da
neighbor y yan
an g
g r
na nantinya akan digunakan untuk meng
ng hi
tung nilai prediksi. Dalam hal i i
n ni
d dat
ata te
te rs
rseb eb
ut u
a da
da la
la h
h ni
ni la
la i
i ra
ra ti
ti ng
ng n
n ei
ei gh
gh bor terhada
a p
p r
it it
em em
re re
ko ko
me me
nd nd
as as
i i.
N N
il ilai
i p
p re
redi diks
ks i
i ini na
nant ntin
inya ya
dig g
un un
ak akan
an o o
le le
h h
pa pa
ra r
pen en
el elit
iti seba ba
ga ga
i i
to t
la a
k k uk
uk ur
u seb
b er
er ap
ap a
“ “baik”
algoritma re k
komendasi yang sedan n
g g dikemb
mbangkan. Pada penelitian ini, pen
neliti men ncoba memanfaatkan sebuah metode
pengukuran dengan tujuan bisa m mendap
apatkan neighbor terbaik, sebagai dasar r
pencarian rekomendasi dan nilai pred d
ik iksi yang akurat. Metode pengukuran yang
3
Keakuratan rekomendasi dan prediksi dari penelitian ini akan dievaluasi dengan menggunakan metode evaluasi Mean Absolute Error MAE, Precision
dan Recall Value. Metode MAE digunakan untuk mengukur seberapa kuat akurasi dari nilai prediksi yang diberikan oleh algoritma peneliti dengan nilai rating yang
sudah diberi oleh pengguna evaluasi secara offline. Precision dan Recall Value berfungsi untuk mengetahui seberapa banyak rekomendasi item yang “tepat”
diberikan untuk penerima.
1.2. Perumusan Masalah