PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING.

perpustakaan.uns.ac.id

digilib.uns.ac.id

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN
CONFIDENCE PADA SISTEM REKOMENDASI DENGAN

METODE ITEM BASED COLLABORATIVE FILTERING

SKRIPSI
Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu
Jurusan Informatika

Disusun Oleh:

SIGIT ANGGA PRASETYO
NIM. M0509065

JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET

SURAKARTA
commit
to user
2013

perpustakaan.uns.ac.id

digilib.uns.ac.id

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN
CONFIDENCE PADA SISTEM REKOMENDASI DENGAN

METODE ITEM BASED COLLABORATIVE FILTERING

SKRIPSI
Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu
Jurusan Informatika

Disusun Oleh:


SIGIT ANGGA PRASETYO
NIM. M0509065

JURUSAN INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SEBELAS MARET
SURAKARTA
2013
commit to user

i

perpustakaan.uns.ac.id

digilib.uns.ac.id

SKRIPSI
PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN
CONFIDENCE PADA SISTEM REKOMENDASI DENGAN


METODE ITEM BASED COLLABORATIVE FILTERING

Disusun oleh :
SIGIT ANGGA PRASETYO
NIM. M0509065

Skripsi ini telah disetujui untuk dipertahankan di hadapan Dewan Penguji
pada tanggal: 7 November 2013

Pembimbing I

Pembimbing II

Ristu Saptono, S.Si., M.T.
NIP. 19790210 200212 1 001

Rini Anggrainingsih, M.T.
NIP. 19780909 200812 2 002

commit to user


ii

perpustakaan.uns.ac.id

digilib.uns.ac.id

SKRIPSI

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN
CONFIDENCE PADA SISTEM REKOMENDASI DENGAN

METODE ITEM BASED COLLABORATIVE FILTERING
HALAMAN PENGESAHAN
Disusun oleh :
SIGIT ANGGA PRASETYO
NIM. M0509065
Telah dipertahankan di hadapan Dewan Penguji
Pada tanggal : 7 November 2013
Susunan Dewan Penguji

1. Ristu Saptono, S.Si., M.T.
NIP. 19790210 200212 1 001

(

)

2. Rini Anggrainingsih, M.T.
NIP. 19780909 200812 2 002

(

)

3. Sari Widya Sihwi, S.Kom., M.T.I.
NIP. 19830412 200912 2 003

(

)


4. Abdul Azis S.Kom., M.Cs.
NIP. 19810413 200501 1 001

(

)

Disahkan oleh
Dekan FMIPA UNS

Ketua Jurusan Informatika

Prof.Ir.Ari Handono Ramelan,M.Sc.(Hons),Ph.D
NIP. 19610223 198601 1 001
commit to user

iii

Umi Salamah, S.Si., M.Kom

NIP. 19700217 199702 2 001

perpustakaan.uns.ac.id

digilib.uns.ac.id

MOTTO
“Maka sesungguhnya bersama kesulitan ada kemudahan. Sesungguhnya bersama
kesulitan ada kemudahan. Maka apabila engkau telah selesai (dari sesuatu
urusan), tetaplah bekerja keras (untuk urusan yang lain)”
(Q.S Al Insyirah : 5-7)
“Mimpi-mimpi kamu, cita-cita kamu, keyakinan kamu, apa yang kamu
mau kejar, biarkan ia menggantung, mengambang 5 centimeter di depan
kening kamu. Jadi dia nggak akan pernah lepas dari mata kamu. Dan kamu
bawa mimpi dan keyakinan kamu itu setiap hari, kamu lihat setiap hari, dan
percaya bahwa kamu bisa”
(5cm)
“Aku Selalu percaya jika kau mengerjakan sesuatu maka hasilnya akan kau
dapatkan. Aku tidak melakukan sesuatu dengan setengah hati. Karena aku
tahu jika aku begitu, maka aku akan mendapatkan hasil yang

setengah-setengah.”
(Michael Jordan)
“Kesuksesan adalah puncak dari kemampuan mengendalikan kegagalan”
(Sylvester Stallone)

commit to user

iv

perpustakaan.uns.ac.id

digilib.uns.ac.id

PERSEMBAHAN

Kupersembahkan karya ini kepada :
-Orang tuaku tercinta dan sang motivator, Bunda Iis dan Ayah Giyanto-Ade kecil ku, Anggita Rahkma W-Sahabat-Sahabat ‘Independent Pember*ntak’-Dea, atas transferan inspirasi dan semangatnya-Semua teman Informatika UNS khususnya IF09-Bangsa Indonesia-

commit to user


v

perpustakaan.uns.ac.id

digilib.uns.ac.id

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN
CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE
ITEM BASED COLLABORATIVE FILTERING
SIGIT ANGGA PRASETYO
Jurusan Informatika. Fakultas MIPA. Universitas Sebelas Maret.

ABSTRAK
Sistem rekomendasi merupakan metode penyaringan informasi
menggunakan teknik analisa data untuk membantu pengguna menemukan item
yang diinginkan. Salah satu metode yang digunakan pada sistem rekomendasi
yaitu item-based collaborative filtering. Metode ini merupakan teknik untuk
menghitung nilai item similarity. Algoritma yang dapat digunakan untuk
menghitung nilai item similarity, yaitu cosine similarity dan confidence.
Permasalahannya yaitu belum diketahui algoritma item similarity yang lebih

akurat antara hasil rekomendasi menggunakan cosine similarity dan confidence.
Tujuan dari penelitian ini yaitu untuk mengetahui algoritma item similarity
yang lebih akurat antara cosine similarity dan confidence. Untuk mengukur hasil
rekomendasi digunakan receiver operating characteristic.
Pada pengujian dengan mengosongkan rating dari 10% hingga 40%,
metode item-based collaborative filtering menggunakan algoritma confidence
akan menghasilkan rekomendasi yang lebih akurat dibandingkan dengan
algoritma cosine similarity berdasarkan rata-rata nilai accuracy yang lebih tinggi.
Metode item-based collaborative filtering menggunakan algoritma confidence
akan menghasilkan kesesuaian antara hasil prediksi dengan rating asli positif yang
lebih baik berdasarkan rata-rata nilai sensitivity yang lebih tinggi, dan
menghasilkan kesesuaian antara rating asli dengan hasil prediksi positif yang
lebih baik berdasarkan rata-rata nilai positive predictive value yang lebih stabil.
Kata Kunci: Confidence, Cosine Similarity, Item Based, Receiver Operating
Characteristic.

commit to user

vi


perpustakaan.uns.ac.id

digilib.uns.ac.id

COMPARISON COSINE SIMILARITY AND CONFIDENCE
ALGORITHM IN RECOMMENDER SYSTEM USING ITEM BASED
COLLABORATIVE FILTERING METHOD

SIGIT ANGGA PRASETYO
Department of Informatics. Mathematic and Natural Science Faculty.
Sebelas Maret University

ABSTRACT
Recommendation system is a method of information filtering using data
analysis technic to help users finds the desired items. One of the method which
used in recommendation system is item-based collaborative filtering. This method
is a technic to calculate the item similarity values. The algorithm which can be
used to calculate the value of item similarity are cosine similarity and confidence.
The problem is not known more accurate item similarity algorithm between
recommendation using cosine similarity and confidence.
The purpose of this research is to know item similarity algorithm which is
more accurate between cosine similarity and confidence. To measure the
recommendation used receiver operating characteristic.
On testing with emptying the rating from 10% until 40%, item-based
collaborative filtering method using confidence algorithm produces
recommendation which is more accurate than cosine similarity algorithm based on
higher average accuracy value.Item-based collaborative filtering method using
confidence algorithm produces the suitability of the results predicted by the
original positives rating which is better based on higher average sensitivity value,
and suitability of the original rating with positives prediction result which is better
based on average positive prediction value that more stable.
Keywords: Confidence, Cosine Similarity, Item Based, Receiver Operating
Characteristic.

commit to user

vii

perpustakaan.uns.ac.id

digilib.uns.ac.id

KATA PENGANTAR
Bismillahirrahmaanirrahiim
Puji dan syukur penulis panjatkan kehadirat Alloh Subhanahu Wa Ta’ala
yang senantiasa memberikan nikmat dan karunia-Nya sehingga penulis dapat
menyelesaikan skripsi dengan judul “Perbandingan Algoritma Cosine Similarity
dan Confidence Pada Sistem Rekomendasi dengan Metode Item Based
Collaborative Filtering”, yang menjadi salah satu syarat wajib untuk memperoleh
gelar Sarjana Informatika di Universitas Sebelas Maret (UNS) Surakarta.
Penulis menyadari akan keterbatasan yang dimiliki, begitu banyak
bimbingan, bantuan, motivasi, serta semangat yang diberikan dalam proses
penyusunan skripsi ini. Oleh karena itu, ucapan terima kasih penulis sampaikan
kepada :
1. Bunda Iis dan Ayah Giyanto serta semua keluarga besar penulis di Tegal
Kota Bahari, yang telah memberikan doa, semangat, dukungan, nasihat,
energi positif dan motivasi kepada penulis selama proses penyusunan
skripsi ini.
2. Bapak Ristu Saptono, S.Si., M.T selaku Dosen Pembimbing I yang penuh
kesabaran membimbing, mengarahkan, dan memberi motivasi dan nasihat
kepada penulis selama proses penyusunan skripsi ini.
3. Ibu Rini Anggrainingsih, M.T. selaku Dosen Pembimbing II yang penuh
kesabaran membimbing, mengarahkan, dan memberi motivasi dan nasihat
kepada penulis selama proses penyusunan skripsi ini.
4. Ibu Umi Salamah,S.Si.,M.Kom, selaku Ketua Jurusan S1 Informatika
Universitas Sebelas Maret Surakarta.
5. Ibu Esti Suryani, S.Si., M.Kom. selaku Pembimbing Akademik yang telah
banyak memberi bimbingan dan pengarahan selama penulis menempuh
studi di Jurusan Informatika FMIPA Universitas Sebelas Maret Surakarta,
6. Bapak dan Ibu dosen serta karyawan di Jurusan Informatika FMIPA
Universitas Sebelas Maret Surakarta yang telah mengajar penulis selama
masa studi dan membantu dalam proses penyusunan skripsi ini,
7. Teman–teman Informatika khususnya IF09, Sahabat-sahabat “Independent
Pember*ntak”, dan Anak Kost “Setia Darma” yang telah memberikan
semangat kepada penulis selama ini.
Penulis berharap semoga skripsi ini dapat bermanfaat bagi semua pihak
yang berkepentingan.
Surakarta, November 2013
Penulis
commit to user

viii

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR ISI
HALAMAN PENGESAHAN ................................................................................ iii
MOTTO ................................................................................................................. iv
PERSEMBAHAN ................................................................................................... v
ABSTRAK ............................................................................................................. vi
ABSTRACT .......................................................................................................... vii
KATA PENGANTAR ......................................................................................... viii
DAFTAR ISI .......................................................................................................... ix
DAFTAR GAMBAR ............................................................................................. xi
DAFTAR TABEL ................................................................................................. xii
DAFTAR LAMPIRAN ....................................................................................... xiii
BAB 1 PENDAHULUAN ...................................................................................... 1
1.1. Latar Belakang ............................................................................................ 1
1.2. Rumusan Masalah ....................................................................................... 3
1.3. Batasan Masalah.......................................................................................... 3
1.4. Tujuan Penelitian ........................................................................................ 3
1.5. Manfaat Penelitian ...................................................................................... 4
1.6. Sistematika Penulisan ................................................................................. 4
BAB 2 TINJAUAN PUSTAKA ............................................................................. 5
2.1. Dasar Teori .................................................................................................. 5
2.1.1.

Konsep Sistem Rekomendasi............................................................. 5

2.1.2.

Representasi Pengguna ...................................................................... 7

2.1.3.

Inisialisasi Profile Generation ........................................................... 8

2.1.4.

Metode Sistem Rekomendasi............................................................. 9

2.1.5.

Collaborative Filtering .................................................................... 15

2.1.6.

Item-based Collaborative Filtering ................................................. 21

2.1.7.

Tolak Ukur Pengujian Akurasi ........................................................ 23

2.2. Penelitian Terkait ...................................................................................... 24
2.3. Rencana Penelitian .................................................................................... 27
BAB 3 METODOLOGI PENELITIAN................................................................ 28
3.1. Tahap Persiapan ........................................................................................ 28
3.1.1.
3.1.2.

Studi Literatur .................................................................................. 28
commit to user
Pengumpulan Data ...........................................................................
28

ix

perpustakaan.uns.ac.id

digilib.uns.ac.id

3.2. Tahap Pemodelan ...................................................................................... 29
3.2.1.

Pemodelan Data ............................................................................... 29

3.2.2.

Penerapan Metode Collaborative Filtering ..................................... 29

3.2.3.

Pemodelan Masalah ......................................................................... 29

3.3. Tahap Konstruksi ...................................................................................... 31
3.3.1.

Implementasi Basis Data ................................................................. 32

3.3.2.

Pengujian Perangkat Lunak ............................................................. 32

3.4. Tahap Pengujian Metode........................................................................... 32
BAB 4 PEMBAHASAN ....................................................................................... 35
4.1. Pemodelan Masalah .................................................................................. 35
4.1.1.

Representasi User Profile ................................................................ 35

4.1.2.

Contoh Kasus ................................................................................... 36

4.2. Hasil Pengujian ......................................................................................... 43
4.2.1.

Pengujian dengan receiver operating characteristic (ROC) ........... 43

4.2.2.

Pengosongan rating 10% ................................................................. 46

4.2.3.

Pengosongan rating 20% ................................................................. 47

4.2.4.

Pengosongan rating 30% ................................................................. 48

4.2.5.

Pengosongan rating 40% ................................................................. 49

4.2.6.

Perbandingan Hasil Pengujian ......................................................... 50

4.3. Pembahasan Hasil Pengujian .................................................................... 54
BAB 5 PENUTUP ................................................................................................ 58
5.1. Kesimpulan ............................................................................................... 58
5.2. Saran .......................................................................................................... 59
DAFTAR PUSTAKA ........................................................................................... 60
LAMPIRAN .......................................................................................................... 62

commit to user

x

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR GAMBAR

Gambar 2. 1 Ilustrasi Sistem Rekomendasi .............................................................6
Gambar 2. 2 Proses Collaborative Filtering ..........................................................16
Gambar 2. 3 Konsep Item-based Collaborative Filterng.......................................22
Gambar 2. 4 Konsep Receiver Operating Characteristic (ROC) ..........................23
Gambar 4. 1 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 10% ........................................................................................46
Gambar 4. 2 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 20% ........................................................................................47
Gambar 4. 3 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 30% ........................................................................................48
Gambar 4. 4 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 40% ........................................................................................49
Gambar 4. 5 Perbandingan nilai accuracy keseluruhan pengujian ........................50
Gambar 4. 6 Perbandingan nilai sensitivity keseluruhan pengujian .......................51
Gambar 4. 7 Perbandingan nilai positive predictive value keseluruhan
pengujian ...........................................................................................52
Gambar 4. 8 Screenshoot top-3 recommendation untuk salah satu user dengan
algoritma cosine similarity................................................................53
Gambar 4. 9 Screenshoot top-3 recommendation untuk salah satu user dengan
dengan algoritma confidence ............................................................53

commit to user

xi

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR TABEL

Tabel 2. 1 User-item rating matriks .......................................................................17
Tabel 3. 1 User-item rating matrix dengan m pengguna dan n tempat wisata ......30
Tabel 4. 1 Representasi matriks user-item rating ..................................................35
Tabel 4. 2 Representasi matriks user-item ratings untuk contoh kasus .................36
Tabel 4. 3 Tabel data rating ...................................................................................36
Tabel 4. 4 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 10% .............................................................................................46
Tabel 4. 5 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 20% .............................................................................................47
Tabel 4. 6 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 30% .............................................................................................48
Tabel 4. 7 Rata-rata hasil pengujian menggunakan ROC pada pengosongan
rating 40% .............................................................................................49
Tabel 4. 8 Perbandingan nilai accuracy keseluruhan pengujian ............................50
Tabel 4. 9 Perbandingan nilai sensitivity keseluruhan pengujian ..........................51
Tabel 4. 10 Perbandingan nilai positive predictive value ......................................52

commit to user

xii

perpustakaan.uns.ac.id

digilib.uns.ac.id

DAFTAR LAMPIRAN

LAMPIRAN A ..................................................................................................... 63
LAMPIRAN B ..................................................................................................... 67
LAMPIRAN C ..................................................................................................... 83

commit to user

xiii