2.3. Content Based Recommendation
Content based recommendation merupakan sistem rekomendasi yang diberikan
kepada user dengan cara menganalisa sekumpulan dokumen dan dibandingkan dengan apa yang telah diakses sebelumnya atau user profile dari masing
– masing user. Salah satu metode yang bisa digunakan untuk content based recommendation adalah model
relevansi yang menggunakan vector space model dengan basis nilai TF-IDF Lops, 2011. Metode vector space model yang penulis gunakan adalah sparse matrix vector
multiplication yang akan penulis bahas pada bagian 2.7.
2.4. Sparse Matrix
Sparse matrix adalah sebuah matriks yang didalamnya didominasi oleh nilai 0. Secara
lebih jelas, jika jumlah nilai non-zero lebih sedikit dari jumlah nilai 0, maka itu disebut sparse matrix, akan tetapi jika nilai 0 lebih sedikit dari jumlah nilai non-zero,
maka itu disebut dense martix Stoer, et al. 2002. Menurut Bank 2001 penyimpanan data pada sparse matrix sama seperti
penyimpanan data matriks pada umumnya. Setiap item di dalam sparse matrix akan diakses melalui A
i,j
, I = menyatakan baris dan j = menyatakan kolom. Unutk efisiensi dalam penyimpanan, ada 5 jenis format kompresi dalam sparse matrix yaitu COO
coordinate storage, CSR Compressed Sparse Row, CCS Compressed Column Storage
, JDS Jagged Diagonal Storage dan TJDS Transposed Jagged Diagonal Storage
Shahnaz, et al. 2006. Dalam penelitian ini, penulis menggunakan format kompresi CSR yang akan
menempatkan nilai non-zero dalam 1 baris vector. Pada CSR terdapat 3 vektor yaitu val,
col_ind, row_ptr. Val merupakan vektor untuk menyimpan nilai non-zero dari sparse matrix
dengan proses pengambilannya dimulai dari kiri atas lalu kekanan sampai ke baris paling bawah dan akan disimpan dalam 1 baris. Col_ind merupakah
vektor yang menyimpan kolom pada sparse matrix dari setiap item val dan disimpan dalam 1 baris. Row_ptr merupakan vektor yang menyimpan indeks baris dengan cara
menambahkan jumlah item non-zero pada suatu baris dari sparse matrix Goharian, et
Universitas sumatera utara
al. 2001. Diberikan contoh matriks pada gambar 2.1 yang selanjutnya akan dibentuk dalam format CSR yang ditunjukkan pada gambar 2.2.
1 2
1 1
1
Gambar 2.1 Contoh sparse matrix
Gambar 2.2
Contoh hasil format kompresi CSR dari sparse matrix gambar 2.1
2.5. Information Filtering
Information filtering IF adalah penyaringan informasi berdasarkan user profile yang
dibentuk dengan menanyakan kepada user atau dengan memonitor perilaku user terhapat sistem Smirnov, et al. 2008. Dalam penelitian penulis metode untuk
Information filtering yang akan digunakan adalah bayesian framework for user
interest prediction dan lebih spesifik pada rekomendas berita personal yang
merupakan pengembangan dari rumus Naïve Bayes yang akan penulis bahas pada bagian 2.9.
2.6. Information Retrieval