Penerapan Kombinasi Algoritma Minhash Dan Binary Hamming Distance Pada Hybrid Perekomendasi Lagu

PENERAPAN KOMBINASI ALGORITMA MINHASH DAN

  BINARY HAMMING DISTANCE PADA HYBRID PEREKOMENDASI LAGU SKRIPSI

Diajukan untuk memenuhi salah satu syarat mencapai gelar Strata Satu Jurusan Informatika Disusun Oleh : LUTVI SATRIYO PUTRO M0509043 JURUSAN INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SEBELAS MARET SURAKARTA

  commit to user 2014 commit to user

commit to user

commit to user MOTTO

  Man Jadda, Wa Jadda!

  ( Negeri 5 Menara )

  Man Shobaro, Zhafira!

  ( Ranah 3 Warna )

  Man Saara ala Darbi Washala

  ( Rantau 1 Muara )

  Hidup itu Perjuangan, anda hidup, anda berjuang

  ( Penulis)

  

PERSEMBAHAN

  Saya persembahkan Karya Ini pada :

  Ibu Saya, Erny Kusminingsih Ayah Saya, Sri Desto Untung Raharjo Kakak Saya, Deani Wulan Gandes Putri Kakak Saya, Pitra Dwi Yuniatno Keponakan Saya, Shaquilla Adzkiya Putri dan Baraka Raihan Syahputra Kekasih Saya, Rahmadani Eva Rosari Sahabat-Sahabat Terhebat, Toto, Ferry,Teno,Andika,Udhi,Rosada,Betty Teman-Teman Informatika 2009 yang Sudah Menemani Selama ini

commit to user

  Civitas Informatika Universitas Sebelas Maret

  

KATA PENGANTAR

Assalamu’alaikum Wr.Wb.

  Puji syukur penulis panjatkan kehadirat Allah SWT Ya Rahman, Ya Rahhim karena atas limpahan rahmat dan hidayah-Nya penulis dapat menyelesaikan skripsi untuk menyelesaikan pendidikan strata satu Jurusan Informatika UNS yang berjudul ”Penerapan Kombinasi Algoritma Minhash dan

Binary Hamming Distance pada Hybrid Perekomendasi Lagu ”. Shalawat serta

  salam senantiasa tercurah kepada Baginda Rasulullah Muhammad SAW, yang dengan perantaraan dan perjuangan beliaulah, manusia kini berada di zaman yang penuh dengan ilmu pengetahuan.

  Di dalam penyusunan skripsi ini, penulis menyadari sepenuhnya bahwa isinya sangat sederhana bahkan dapat dikatakan jauh dari sempurna untuk disebut sebagai tulisan yang berbobot ilmiah. Namun bagi penulis hal itu sudah merupakan pengerahan tenaga dan pikiran semaksimal mungkin.

  Keberhasilan dalam penyusunan skripsi ini tidak terlepas dari bantuan beberapa pihak. Maka dari itu, dengan segenap hati penulis tidak lupa mengucapkan terima kasih yang sedalam

  • – dalamnya kepada : 1.

  AllAh SWT, Tuhan semesta alam, penguasa langit dan bumi yang selalu memberikan nikmat berupa kesehatan kepada penulis sehingga penulis dapat menyelesaikan karya tulis, 2. Ibu Umi Salamah, S.Si., M.Kom. selaku Ketua Jurusan Informatika

  FMIPA UNS, 3. Bapak Ristu Saptono, S.Si., M.T. dan Bapak Drs. Bambang Harjito,

  M.App.Sc. selaku pembimbing I dan penguji yang telah memberikan banyak bimbingan, pengarahan, dan motivasi kepada penulis selama proses penyusunan skripsi,

  

commit to user

  4. Ibu Rini Anggrainingsih, S.T., M.T. selaku Pembimbing Akademik dan pembimbing II yang telah banyak memberi bimbingan dan pengarahan akademik selama penulis menempuh studi di Jurusan Informatika FMIPA UNS, 5. Bapak dan Ibu dosen Jurusan Informatika FMIPA UNS yang telah memberikan pengajaran kepada penulis selama masa studi dan membantu dalam proses penyusunan skripsi ini, 6. Ibu Erni Kusminingsih yakni ibu penulis yang telah memelihara dan merawat penulis sejak kecil hingga dewasa ini dan telah memberikan dorongan materiil maupun spiritual selama penyusunan skripsi ini, 7. Bapak Sri Desto Untung Raharjo yakni ayah penulis yang telah mendukung bail materiil ataupun spiritual dan memberi semangat penulis dari awal pengerjaan skripsi hingga sripsi ini selesai, 8. Rahmadani Eva Rosari yang tidak pernah lelah untuk selalu memberikan semangat dan dorongan moral kepada penulis selama penyusunan skripsi, 9. Teman-teman sejawat Informatika 2009 yang telah memberikan kehangatan, kebersamaan dan kenangan selama menempuh studi di

  Jurusan Informatika UNS, 10. Semua pihak yang telah membantu dalam penyelesaian penulisan karya tulis ini yang tidak mungkin penulis sebutkan satu persatu.

  Semoga skripsi ini dapat memberikan manfaat bagi pembaca pada untuk dijadikan sebagai sebuah sumber inspirasi dan referensi dalam mengembangkan ilmu pengetahuan terutama di bidang informatika demi tercapainya Indonesia yang bermartabat dan berkepribadian luhur.

  Wassalamu’alaikum Wr.Wb.

  Surakarta, 13 Maret 2014

  

commit to user

  Penulis commit to user

  

PENERAPAN KOMBINASI ALGORITMA MINHASH DAN BINARY

HAMMING DISTANCE PADA HYBRID PEREKOMENDASI LAGU

LUTVI SATRIYO PUTRO

  Jurusan Informatika. Fakultas MIPA. Universitas Sebelas Maret

  

ABSTRAK

  Teknik yang biasanya digunakan untuk menghasilkan rekomendasi adalah content-based, social-based dan hybrid. Content-based dan social-based adalah teknik rekomendasi yang berdiri sendiri, sedangkan hybrid adalah kombinasi dari beberapa teknik rekomendasi, seperti kombinasi knowledge-based dan social-based pada aplikasi EntreeC dan kombinasi social-based dan content- based pada DailyLearner.. Teknik hybrid menghasilkan rekomendasi yang lebih baik daripada teknik rekomendasi yang berdiri sendiri, seperti meningkatkan akurasi rekomendasi dan mempercepatan produksi rekomendasi. Akan tetapi, berdasarkan penelitian sebelumnya, hybrid social-based dan content-based yang diterapkan pada data lagu, tidak menghasilkan rekomendasi yang lebih baik. Oleh karena itu, pada penelitian ini kombinasi social-based dan content-based yang diterapkan pada data lagu akan dikombinasikan dengan strategi switching,mixed, dan cascade yang diharapkan mampu menghasilkan keluaran yang lebih baik.

  Algoritma yang dipakai untuk mewakili social-based adalah minhash

  

association rules. Minhash association rules dipilih, karena algoritma ini baik

  digunakan untuk data yang memiliki nilai sparsity tinggi. Algoritma yang mewakili content-based adalah binary hamming distance. Binary hamming

  

distance dipilih untuk mempercepat proses pencarian. Fokus dari penelitian ini

  adalah akurasi yang dihasilkan hybrid yang menggabungkan social-based dengan content-based.

  Hasil dari penelitian ini, hybrid yang menggunakan strategi switching,

  

cascade, dan mixed mampu membuat rekomendasi yang nilai akurasinya melebihi

  rekomendasi yang dihasilkan social-based dan content-based murni pada data yang memiliki nilai sparsity 0.94. Hal ini dibuktikan dengan nilai rata-rata akurasi

  

hybrid yang mencapai 0,48, nilai minhash 0,17 dan nilai hamming 0,42.

  Sedangkan untuk data yang memiliki nilai sparsity 0,96, algoritma ini nilai akurasinya dibawah algoritma binary hamming distance. Hal ini dibuktikan dengan nilai rata-rata akurasi hybrid 0,4, nilai minhash 0,06 dan nilai binary hamming distance 0,41.

  Kata Kunci: Binary Hamming Distance, Content-based, Minhash, Social-based

commit to user

  

UTILIZATION OF COMBINATION MINHASH AND BINARY HAMMING

DISTANCE ALGORITHM FOR HYBRID SONG RECOMMENDATION

LUTVI SATRIYO PUTRO

Department of Informatic. Mathematic and Science Faculty.

  Sebelas Maret University

  

ABSTRACT

  Three techniques are commonly used to provide a recommendation i.e, content-based, social-based and hybrid. Content-based and social-based are stand- alone techniques, whereas hybrid is combination of several techniques such as combination of knowledge and social-based at EntreeC and combination of social and content-based at DailyLearner. Hybrid technique generally generates a better recommendation than content-based and social-based such as increase recommendation’s accuracy and speed up recommendation’s production. However, hybrid social-based and content-based, applied to song data, do not produce a better recommendation. Therefore, in this research, social - based and content-based will be combined by switching, mixing, and cascade strategy in order to get better output.

  The algorithm used to represent social-based is minhash association rules. These association rules are chosen, because the rules can be used for collecting data which high sparsity. The algorithm used to represent content-based is binary hamming distance. The hamming distance is chosen for speeding up the search process. The objective of this research is accuracy that produced by hybrid that combines social-based and content-based.

  The result of this research, hybrid that used switching, cascade and mixed produce better accuracy recommendation than social-based and content-based on data that have sparsity value 0.94. This is evidenced by the average accuracy value of hybrid reaches 0.48, minhash accuracy reaches 0.17 and hamming reaches 0.42. as for the data that have sparsity value 0.96, hybrid algorithm accuracy below binary hamming distance. This is evidenced by average accuracy value of hybrid reaches 0.4, minhash 0.06 and binary hamming distance 0.41.

  Keywords: Binary Hamming Distance, Content-based, Minhash, Social-based

commit to user

   DAFTAR ISI

  

  

  

  

  

  

  

  

  

  

  HALAMAN JUDUL ...................................................................................................... i HALAMAN PERSETUJUAN ...................................................................................... ii HALAMAN PENGESAHAN ...................................................................................... iii

  

  

  

  

  

  

  

  

  

  

  commit to user

  

  

  

  

  

  

  

  

  

  

  

  DAFTAR TABEL

Tabel 2.1.2.1 Kelebihan dan Kelemahan Masing-masing Teknik ................................ 9

  

Tabel 2.3 Tabel keterkaitan penelitian dengan penelitian sebelumnya....................... 19Tabel 4.1.1 Contoh Transaksi ..................................................................................... 26Tabel 4.1.2 Contoh Rule ............................................................................................. 26Tabel 4.1.3 Penyederhanaan Rule ............................................................................... 27Tabel 4.1.4 Rule dengan nilai confidence ................................................................... 27Tabel 4.1.5 Rule hasil penyaringan confidence .......................................................... 27Tabel 4.2.1.1 Contoh daftar lagu ................................................................................. 28Tabel 4.2.3.1 Contoh tabel Rule.................................................................................. 30Tabel 4.3.1 Hasil Pengujian Training Set 75% ........................................................... 31Tabel 4.3.2 Hasil Pengujian Training Set 50% ........................................................... 33

  commit to user

  DAFTAR GAMBAR

Gambar 3.1 Diagram alir metodologi penelitian......................................................... 20Gambar 3.2 Diagram alir Pemodelan Data ................................................................. 20Gambar 3.3 Diagram Alir Switching dan Mixed ........................................................ 23Gambar 3.4 Diagram Alir Cascade ............................................................................. 24Gambar 3.5 Diagram Alir Penerapan Algoritma ........................................................ 24Gambar 4.3.1 Pengujian Akurasi dengan Training Set 75% ...................................... 32Gambar 4.3.2 Pengujian Akurasi dengan Training Set 50% ...................................... 34

  commit to user