TESIS USER-BASED COLLABORATIVE FILTERING DENGAN MEMANFAATKAN PEARSON-CORRELATION UNTUK MENCARI NEIGHBORS TERDEKAT DALAM SISTEM REKOMENDASI.

TESIS
USER-BASED COLLABORATIVE FILTERING DENGAN
MEMANFAATKAN PEARSON-CORRELATION UNTUK
MENCARI NEIGHBORS TERDEKAT DALAM SISTEM
REKOMENDASI

ARVID THEODORUS
No. Mhs : 125301834/PS/MTF

PROGRAM STUDI MAGISTER TEKNIK INFORMATIKA
PROGRAM PASCASARJANA
UNIVERSITAS ATMA JAYA YOGYAKARTA
2016

UCAPAN TERIMA KASIH

Puji dan syukur penulis
pe
uhan yang telah memberikan
panjatkan kehadirat T
Tuhan

rahmat dan anu
ugerah, sehinggaa penulis dapat menyelesaikan
menyelesaika
kann Tesis dengan judu
anugerah,
judul
User-Base
ed Collabor
rativ
ivee Filter
rin
ingg Dengan
Deng
De
ngan
an Memanfaatkan
Mem
eman
anfa
faatkan Pearson

Pearrso
s n Correlation
User-Based
Collaborative
Filtering
Untukk Mencari Neighbors
Neig
Ne
i hbors Terdekat
Teerd
rdek
ekatt Dalam S
iste
is
tem
m Re
R
komenddas
asii.
Sistem

Rekomendasi.
Pe
enu
nuli
lissan laporan
laaporan ini merupakan kelengkapan dan pe
pemenu
nuha
hann da
dari sal
alah
a satu
Penulisan
pemenuhan
salah
syarat
at dalam
dal
alam memperoleh gelar Magister Teknik. Selain ituu bert
rtuj

ujua
uan mela
l tih
bertujuan
melatih
ma
aha
hasi
siswaa untuk dapat menghasilkan suatu karya yang dapat dipertanggungjawabkan
dipertan
nggunngj
gjaawabkaan
mahasiswa
se
seca
carra ilm
miah, sehingga dapat bermanfaat bagi penggunanya.
secara
ilmiah,
D

alam menyelesaikan pembuatan program dan laporan Tesis ini,, penuliss tel
lah
Dalam
telah
mene
nerim
ma bimbingan, saran, dan masukkan dari berbagai pihak, baik secara
seccara
ra llangsung
angssun
ung
menerima
maupun
segala
kerendahan
kesempatan
m
aupun tidak langsung. Untuk
Untukk itu
itu dengan

den
e gann se
sega
galla kerendah
han hati, pada kesem
mpa
pattan
ini
in
ni penulis
pe
menyampaikan ucapan terima kasih kepada :
Bapak
Budiyanto,
1. Ba
Bapa
pak
k Ir.
Ir A.
A. Djoko

Djo
joko
ko Bud
diy
iyan
anto
to,, M.Eng.,
M.En
Eng.
g., Ph.D.,
Ph.D.,
D selaku
sela
se
laku
ku ddosen
osen
pembimbing
memberikan
pe

pemb
mbim
imbbing
ng I yang telah
te
member
erik
ikan bimbingannya
bimb
mbin
i gaann
nnya
ya dengan
deng
de
ngan
an sabar dan
juga
baik kepada penulis, jug
ga kepada

bimbingan,
2. Ibu Dra. Ernawati, M.T.,
M.T., selaku
u dosen pembimbing II atas bimbingan
pengerjaan
dan masukkan selama pen
ngerjaan
an Tesis ini.
3. Keluarga tercinta yang telahh memberikan
memberikan semangat dan doa.
4. Teman-teman Gereja GBI Keluarga Allah Jogja dan kepada keluarga
KIMEO yang selalu mendukung dan menguatkan didalam doa.

DAFTAR ISI

................................................................................i
DAFTAR ISI ................................
.............................................................................................................i
............................................................................................iv
DAFTAR GAMBAR ....

..............................................................................................iv
L .................................................................
....................................v
DAFTAR TABEL
....................................................................................................
INTISARI ...............................................................................................................vi
.............................................................................................................................vi
BAB I .........................................................................................................................
......................................................................................................................................1
PEND
NDAHULUA
UAN ...................................................................................................
..................
..........................................................................................1
PENDAHULUAN
Lat
atar
ar B
elakan
angg .....................................................

............................................ 1
1.1 Latar
Belakang
.............................................................................................
1.22 Perumusan
Per
eruumussan Masalah .....................................................
......................................3
.....................................................................................
11.3
.3 Batasan
Batas
asan Masalah ................................................................
................................. 3
..........................................................................................
1.44 Manfaat
Manfaat Penelitian .................................................................
.......................... 4
1.4
.......................................................................................
1.5
.........................................................................................
1.5 Tujuan
Tujuan Penelitian ......................................................................
.......................4
1.6 Sistematika Penulisan ..................................................................................4
II .................................................................................................................
......6
BAB II
......................................................................................................................
TINJ
TI
N AUAN PUSTAKA DAN LANDASAN TEORI ..................................
.............6
TINJAUAN
.............................................
Tinjauaan Pu
Pust
s ak
a a ......
.............................................................................................................. 6
2.1 Tinjauan
Pustaka
..........................................................................................
. ...................................................................... 112
2
2.2 Tinjauan Teoritis .....................
........................................................................................
.................12
2.2.1 User-Based Collaborative Filtering ......................................
..................................................
22.2.2
.22.22 Pearson-Correlation
Pea
ears
rson
on-C
-Cor
orre
rela
lati
tion
on C
o fficcie
oe
ient
nt ...........................
.....................................16
Coefficient
.......................................................
22.
2.3 Evaluasi
Eva
valu
luas
asii Si
Sist
stem
em R
ekom
men
enda
dasi .....
.................................................................. 18
2.2.3
Sistem
Rekomendasi
..........................................................
III ..................................................................................................................
.................................................................................................................................... 21
BAB III
..............................................................................21
METODOLOGI PENELITIAN .............................................................................
3.1 Bahan Penelitian ........................................................................................ 21
.......................................................................... 21
3.2 Alat Penelitian ....................
............................................................................................
3.2.1 Kebutuhan Perangkat K
eras
as ..............................................................21
Keras
3.2.2 Kebutuhan Perangkat Lun
unak .............................................................21
Lunak
3.3 Langkah-Langkah Penelitian ..................................................................... 22
BAB IV .................................................................................................................. 26
ANALISIS DAN PERANCANGAN SISTEM .....................................................26

i

4.1 Analisis Sistem........................................................................................... 26
4.1.1 Perspektif Perangkat Lunak .............................................................. 26
g Perangkat
g Lunak ................................................................... 27
4.1.2 Fungsi
4.1.3 Karakteristik
k Pengguna
Pengguna Produk .........
................................................ 32
........................................................
4.1.4 Kebut
tuh
uhan Khusus ........................................
...................................... 32
Kebutuhan
............................................................................
4.1.4
4.11 Kebutuhan An
Antarmuka...........
....................................................... 32
4.1.4.1
Antarmuka...............................................................
4.2 Perancangan
Perancangan
n Per
eran
angkat L
unak
un
ak ...
.......................................................................... 34
Perangkat
Lunak
...................................................................
4.2.1 Perancangan
Per
e ancang
ngan
a Arsitektur La
aye
y r ....................
. .........................................34
Layer
...........................................................
4.2.2
.2 D
ekompo
ek
posi
sisii Data .............................................................................
...................................................................................34
Dekomposisi
44.2.2.1
.2.2.1 T
.2
abel Rating ...............................................
...................................35
Tabel
..............................................................................
4.2.2
.2.2 Tabel Pengguna (users) .............................................................
................................................................. 35
3
4.2.2.2
44.2.2.3
.2.2.3 Tabel Film (movies) ...................................................................
........................................................................ 366
4.2.2.4 Tabel Neighbor .................................................................
............ 36
..........................................................................
4.2.2.5 Tabel Neighbor Grouped ...........................................................37
37
4.2.2.6 Tabel Korelasi .........................................................................
... 388
...........................................................................
4.2.2.7 Tabel Rekomendasi ............................................................
........ 38
...................................................................
4.2.2.8 Ta
Tabe
bell P
redik
diksi
si..............................................................................
............................................................................... 339
9
Tabel
Prediksi
4.2.2.9 Tabel MAE (mean
an absolute
abssol
olute error) ........................................
.....3399
............................................
4.2.2.10 Tabel Presisi ..............................................................................
............................................................................... 40
40
44.3
.33 Perancangan
Peran
anca
cang
ngan
an A
ntar
nt
armu
muka
ka .............................................................................
................................................................................. 41
Antarmuka
4.3.1 Perancangan
Peran
nca
cang
ngan Proses ......
. .................................................................................43
...........................................................................
44.4
.4 A
nali
lisis
i Algoritma
Alggoritma Rekomendasi
Al
Rekom
mendasi ..............................................................
...................................................................46
Analisis
BAB V ...................................................................................................................
.................................................................................................................... 48
IMPLEMENTASI DAN PENGU
UJIAN .................................................................48
PENGUJIAN
5.1 Implementasi Perangkat Lu
Lunak .................................................................. 48
5.1.1 Implementasi Antarmu
uka Perangkat
Peerangkat Lunak ...................................... 49
Antarmuka
5.1.1.1 Implementasi Textb
box – Porsi Data .......................................... 49
Textbox
5.1.1.2 Implementasi Progress Bar ........................................................ 50
5.1.1.3 Implementasi Tombol : Buat Tabel Korelasi ............................ 51
5.1.1.4 Implementasi Tombol : Buat Tabel Neighbor ........................... 52

ii

5.1.1.5 Implementasi Tombol : Buat Tabel Neighbor ........................... 52
5.1.1.6 Implementasi Tombol : Grouping Neighbor ............................. 53
p
5.1.1.7 Implementasi
Tombol : Hitungg Korelasi ................................... 54
5.1.1.8 Implemen
enta
tasi Tombol : Buat T
abel Rekomendasi & Prediksi .. 55
ab
Implementasi
Tabel
5.1.1.9 Implementasi
Impplementasi Tombol : Cari Rekomendasi
Im
Rekomen
nda
dasi & Nilai Prediksi .... 56
5.1.1
1.10
1 Implementasii Tombol : Buat Tabel MAE & H
itung MAE ....... 57
5.1.1.10
Hitung
55.1.1.11
.1.1.11 Implementasi
Im
mpl
p em
emeentasi T
ombo
om
boll : Bu
Buatt T
abel
ab
e P
r sisi, Cari T
re
P dan FP &
Tombol
Tabel
Presisi,
TP
ri T
P ddan
an FN ...............................
..............................................59
Cari
TP
..........................................................................
55.2
.2 Pen
ngu
guji
jian
an Perangk
gkat
at Lunak ...........................
.................................................... 60
Pengujian
Perangkat
.......................................................................
5.
5.2
2.1 Pengu
gujjian Fungsionalitas ..................................
. ...................................... 60
5.2.1
Pengujian
..................................................................
5.3
.3 V
alidas
asi Perangkat Lunak ................................................
............................... 66
Validasi
..........................................................................
.............................................
55.4
.4 Kelebihan
Kel
elebihan dan Kelemahan Perangkat Lunak .......................
.......................... 771
1
BAB VII ..................................................................................................................
BAB
....................................................................................................................... 722
PE
PENUT
TUP..............................................................................................................
................................................................................................................... 72
72
PENUTUP
6.1 Kesimpulan ................................................................................................
................................................................................................. 722
6.2 Saran .......................................................................................................... 722
DA
AFT
FTAR
A PUSTAKA
A .............................................................................................
............
........................................................................................... 74
74
DAFTAR

iii

DAFTAR GAMBAR

Gambar 2.1 Skema Tahapan UCF
F ...............
............................................................ 13
.........................................................................
Gambar 2.2 Contoh Himp
mpunan Bilangan Yang Mem
mil
i iki Korelasi Positif dan
Himpunan
Memiliki
Negatif....................................................................................................................
....................................................................................................................... 17
Gambar 4.1 Arsitektur
Arsitektur Penerapa
an Algo
gori
r tma Re
ekomendasi Us
ser
er-Based
Penerapan
Algoritma
Rekomendasi
User-Based
Collaborat
ativ
ive Filtering
Filterin
ingg Dengan
De
M
eman
em
anfa
faat
a ka
kann Pe
Pear
arson-Correlatio
on ................... 27
Collaborative
Memanfaatkan
Pearson-Correlation
Gamb
bar 4.2 Perancangan
Perancang
ngan
an A
rsitektur Antarmuka-Database
Antarmuka-Da
Dataaba
base Pad
ada Algori
ritm
tma
Gambar
Arsitektur
Pada
Algoritma
Rekomendasi
Memanfaatkan
Pearson-Correlation
......................................
Reko
komendas
asii Ya
Yang Meman
anfa
faatk
tkan Pearson-Co
Corr
rrel
elation ........
.................................. 34
Gambar
G
ambarr 44.3
.33 Perancangan
Peranca
cangan Antarmuka Untuk Penerapan Algoritma
Alg
lgoritma
m User-Based
Use
s r-Baseed
Collaborative
...................
Collab
abor
orat
ativ
i e Filtering
Filltering Dengan Memanfaatkan Pearson-Correlation
Fi
Pearson-Corrrel
e ationn .....
................. 42
Gambar
Textbox
.............................................................................
Gamb
mbar
ar 5.1 T
extbox Porsi Data .....................................................
..............................49
49
Ga
Gamb
mbar 55.2
.2 Efek Perubahan Dari Fungsi Pada Textbox Porsi Data ..........
............. 500
Gambar
.....................
Ga
Gambar
r 5.3 Progress Bar ......................................................................
...................... 50
.......................................................................................
Gamba
ar 5.4 Gambar Keseluruhan Antarmuka Beserta Tombolnya .......
.................51
51
Gambar
......................
Gamba
ar 5.5 Spesifikasi Tabel Korelasi.................................................................. 522
Gambar
Gambar
................................................................
Ga
Gamb
mbaar 5.6 Spesifikasi Tabel Neighbor .......................................................
........... 552
2
Tabel
UserNeighbor
Yang
Sudah
Terisi
...................................
Gambar 5.7 Tab
abel
el U
serN
se
rNei
eigh
ghbor Ya
Y
ng Sud
udaah Ter
eris
isii Da
Data
ta .....
................................... 553
3
Ga
G
mbar 5.8 Tabel UserNeighborGrouped
UserNeighborGrooup
uped
ed Yang Sudah Terisi Data ................
....... 554
4
Gambar
.....................
Gambar
........................................
Ga
Gamb
mbar 5.9 Tabel Correlation Yang Sudah Terisi Data ............................
.................. 55
Gambar
Spesifikasi
Tabel
Rekomendasi
.......................................................
Ga
Gamb
mbar
ar 55.10
.10
10 Sp
Spes
esif
ifik
ikas
asii Ta
Tabe
bell Re
Reko
komend
ndas
asii ........................................
................... 56
Gambar
Spesifikasi
Tabel
Prediksi
................................................................
Ga
Gamb
mbar
ar 5.11 Sp
Spes
esif
ifik
ikassi Ta
Tabe
bell Pred
dik
iksi
si ..........
............................................................... 56
Gamb
bar 55.12
.12
12 Ta
Tabe
bel UCF_Recomm
mendation
on Yang Sudah Terisi
Teri
risi
si D
ataa .................. 57
at
Gambar
Tabel
UCF_Recommendation
Data
Gambar 5.13 Tabel UCF_Prediction
UCF_Predicti
tion Yang S
udah Terisi Data ..............................57
Sudah
Gambar 5.14 Spesifikasi Tabel U
CF_MAE .......................................................... 58
UCF_MAE
Gambar 5.15 Tabel UCF_MAE Ya
ang Sud
dah Terisi Data .....................................59
Yang
Sudah
Gambar 5.16 Spesifikasi Tabel UCF_
F_Prrecision .................................................... 60
UCF_Precision
Gambar 5.17 Tabel UCF
Precision Ya
ang Sudah Terisi Data ...............................60
UCF_Precision
Yang

iv

DAFTAR TABEL

Tabel 2.1 Tabel Rangkuman Tinjau
uan P
ustaka ..................................................... 10
us
Tinjauan
Pustaka
Tabel 2.2 Klasifikasi Dari
ri B
eberapa Kemungkinann Ha
H
sil Rekomendasi ..............19
Beberapa
Hasil
Tabel 4.1 Tabel Ra
Rati
ting ..........................................................
. ................................. 35
Rating
...........................................................................................
Tabel 4.2 Tabe
bel Pengguna .........
............................................................................................. 35
Tabel
......................................................................................
Tabel 4.33 Tabel Film
m ....
........................................................................................................ 36
..............................................................................................
Tabe
el 4.4 Tabe
el Neighb
hbor ...........
......................................................................................37
Tabel
Tabel
Neighbor
......................................................................................
Ta 4.5 Ta
Tabel
Tabe
bell N
eig
ghb
hbor Grouped .................................
. ........................................... 37
Tabel
Neighbor
.......................................................................
Tabe
el 4.
4.66 Ta
T
bel K
orelasi ...........................................................
. ................................... 38
Tabel
Tabel
Korelasi
........................................................................................
Tabe
bell 4.
44.7
7 Ta
abel Rekomendasi................................................................
.................... 338
Tabel
Tabel
................................................................................
Ta
Tabe
bell 4.8 T
abel Prediksi ....................................................................
........................ 399
Tabel
Tabel
........................................................................................
Tabel
4.9
.......................................................
Ta
Tabe
bel 4.
.9 Tabel MAE (Mean Absolute Error) ......................................
..................... 40
Tabel 44.10
.10 Tabel Presisi ......................................................................................... 40
Tabel 5.1 Tabel Pengujian Fungsionalitas Perangkat Lunak ................................. 611
Ta 5.2 Klasifikasi Hasil Rekomendasi Terhadap Data Rating ..................
Tabel
......... 67
..........................
Tabel 55.3
.3 Hasil Pe
Penc
ncarian TP, FP dan FN De
Den
ngan Batas K
orelasi Lebi
or
ih Dari 0 ..67
67
Pencarian
Dengan
Korelasi
Lebih
Tabel 5.4 Tabel Hasil Evaluasi UCF
CF D
enggan Memanfaatkan Pearson-Correla
en
ati
tion
on
Dengan
Pearson-Correlation
Dengan Batas Korelasi User-Neighbor Lebih Dari 0 ...................................
De
...........68
68
............................................
Ta
Tabe
bell 5.
55.5
5 Ha
Hasi
sill Pe
Penc
ncar
aria
iann TP
TP,, FP
F dan FN Dengan
Deng
ngan
an B
atas
at
as K
orel
or
elas
asii Le
Lebi
bih Da
Dari
ri 0,3
0,3
Tabel
Hasil
Pencarian
Batas
Korelasi
Lebih
.....
. .............................................................................................................................................69
................................................................................................................................
Ta
abe
bell 5.
5.66 Ta
Tabe
bell Ha
Hasi
sill Ev
Evaluasii U
CF D
engann M
emanf
nfaa
aatk
t an
nP
ears
ea
rson
on-C
-Corrrelation
Tabel
Tabel
Hasil
UCF
Dengan
Memanfaatkan
Pearson-Correlation
Dengan B
atas
at
as K
orelasi User-Neigh
ghbor Le
ebih Dari 0,3 .........................................69
Batas
Korelasi
User-Neighbor
Lebih
Tabel 5.7 Tabel Hasil Evaluasi U
CF Dengann Memanfaatkan Pearson-Correlation
UCF
Dengan Batas Korelasi User-Nei
igh
g bor Lebi
ih Dari 0,5 .........................................70
User-Neighbor
Lebih

v

User-Based Collaborative Filtering Dengan
Memanfaatkan Pearson-Correlation Untuk Mencari
Neighbors Terdekat Dalam Sistem Rekomendasi
Disusun Oleh :
Arvid Theodorus
Nomo
No
mor Maha
h si
sisw
swaa : 12
1253
5301
0183
834/
4/PS
PS/MTF
Nomor
Mahasiswa
125301834/PS/MTF
INTISARI

Da
Dala
lam sa
sat
tu dekade terakhir ini perkembangan yang
ng pes
sat sseputar
eput
ep
utar sis
istem
Dalam
satu
pesat
sistem
rekomendasi
mencari
teknik-teknik
reko
kome
mendassi mendorong para peneliti untuk terus menca
ari te
tekn
kniik-tekni
nik
rekomendasi
kepentingan
re
reko
komend
ndasi baru. Beberapa faktor seperti kebutuhan bisnis,, ke
epe
pent
ntin
ingann
penelitian
rekomendasi
peneliti
tian maupun kepentingan pribadi membuat sistem rekomend
dasi ssemakin
emak
kin
banyak
k variasinya.
Tujuan uutama
tam
ta
ma dari vari
variasi
rias
asi tersebut
ut adalah untu
untuk
tukk me
m
mencari
ncari teknik yyang
angg
an
te
terbaik
dalam memberi rekomendasi. N
amun, beberapa teknik rekomendasii ma
masi
sih
Namun,
masih
be
belu
lum
m me
memi
mili
liki
ki metode
met
etod
odee ya
yang
ng berfungsi untuk
unttuk m
enca
en
cari
ri rrelasi
elas
el
asii an
anta
tar pe
peng
nggu
guna.
belum
memiliki
mencari
antar
pengguna.
Un
Untu
tukk itu, penelitian
penel
elit
itia
iann ini
in
ni akan
ak
bberfokus
erfo
er
foku
kus pada
paada m
etod
odee pe
pencarian re
rela
lasi
si antar
Untuk
metode
relasi
penggunaa ddalam
alam sebuah sistem rekom
al
mendasi. Peneliti memanfaatkan
mem
eman
anffaatkan teknik
rekomendasi.
pengukuran Pearson-Correlatio
on dalam aalgoritma
lgoritma User-Based Collaborative
Pearson-Correlation
Filtering untuk menghitung relasi
relassi dan m
embuktikan seberapa besar pengaruh
membuktikan
relasi tersebut terhadap keakuratan re
ekoomendasi dan prediksi.
rekomendasi
Katakunci : User Based Collaborative Filtering, Pearson Correlation, Sistem
Rekomendasi, Evaluasi Sistem Rekomendasi

vi