Sistem Rekomendasi Content Based Filtering

5

BAB II LANDASAN TEORI

A. Sistem Rekomendasi

Sistem Rekomendasi atau disebut juga Recommender system merupakan sebuah sistem yang memberikan satu atau lebih informasi yang dibutuhkan untuk menentukan pilihan. Nilai dari Recommender system terletak pada kemampuannya untuk mencocokkan dua hal yaitu bagian yang memproses data untuk menghasilkan informasi-informasi yang dibutuhkan sebagai pertimbangan untuk menentukan pilihan [Burke, 2007]. Tugas inti dari recommender system adalah untuk memprediksikan evaluasi subyektif yang akan diberikan pengguna terhadap item. Prediksi ini dihitung menggunakan sejumlah model prediktif yang memiliki karakteristik umum, yaitu mengeksploitasi evaluasi atau penilaian yang diberikan oleh pengguna untuk transaksi yang sebelumnya. [Burke, 2007]. Recommender system telah diklasifikasikan ke dalam empat kategori utama collaborative-based, content-based, knowledge-based, hybrid [Burke, 2007]. Sistem dengan pendekatan content-based hanya menggunakan preferensi dari pengguna saat ini, memprediksi peringkat untuk item yang tak terlihat berdasarkan seberapa banyak deskripsinya atau isinya mirip dengan pengguna [Pazzani dan Billsus, 2007].

B. Content Based Filtering

Satu aspek yang membedakan antara information filtering dan information retrieval adalah mengenai kepentingan pengguna. Pada information retrival pengguna menggunakan ad-hoc queries, sedangkan pada information filtering pengguna sudah mempunyai profil yang merepresentasikan kepentingan jangka panjang, dan sistem mencoba memberikan kepada setiap pengguna item yang relevan [Dai dan Mobasher, 2001]. 6 Berdasarkan pada ukuran kesamaan antara masing-masing profil, sistem memilih dan membuat peringkat pada item yang relevan, kemudian diberikan kepada pengguna. Terdapat dua pendekatan pada information filtering, yaitu collaborative filtering dan content-based filtering [Dai dan Mobasher, 2001]. Keuntungan dari pendekatan content-based filtering adalah pengguna mendapatkan wawasan tentang mengapa suatu item dianggap relevan untuk pengguna, karena konten di setiap itemnya diketahui dari representasinya. Namun pendekatan ini juga mempunyai kelemahan, misalnya kenyataan bahwa pendekatan ini berfokus pada kemiripan kata kunci. Pendekatan ini tidak mampu menangkap hubungan yang lebih kompleks pada level semantik yang lebih dalam, berdasarkan pada berbagai jenis atribut yang berhubungan dengan obyek terstruktur dari teks [Dai dan Mobasher, 2001]. Kesamaan antara representasi dari pengguna dan representasi dari item akan didasarkan pada prinsip kedekatan. Perinsip kedekatan ini menyatakan bahwa jarak dari dua deskripsi item secara langsung berkaitan dengan kesamaan mereka [Knappe, 2005].

C. Normalisasi