Sparse Matrix Information Filtering

2.3. Content Based Recommendation

Content based recommendation merupakan sistem rekomendasi yang diberikan kepada user dengan cara menganalisa sekumpulan dokumen dan dibandingkan dengan apa yang telah diakses sebelumnya atau user profile dari masing – masing user. Salah satu metode yang bisa digunakan untuk content based recommendation adalah model relevansi yang menggunakan vector space model dengan basis nilai TF-IDF Lops, 2011. Metode vector space model yang penulis gunakan adalah sparse matrix vector multiplication yang akan penulis bahas pada bagian 2.7.

2.4. Sparse Matrix

Sparse matrix adalah sebuah matriks yang didalamnya didominasi oleh nilai 0. Secara lebih jelas, jika jumlah nilai non-zero lebih sedikit dari jumlah nilai 0, maka itu disebut sparse matrix, akan tetapi jika nilai 0 lebih sedikit dari jumlah nilai non-zero, maka itu disebut dense martix Stoer, et al. 2002. Menurut Bank 2001 penyimpanan data pada sparse matrix sama seperti penyimpanan data matriks pada umumnya. Setiap item di dalam sparse matrix akan diakses melalui A i,j , I = menyatakan baris dan j = menyatakan kolom. Unutk efisiensi dalam penyimpanan, ada 5 jenis format kompresi dalam sparse matrix yaitu COO coordinate storage, CSR Compressed Sparse Row, CCS Compressed Column Storage , JDS Jagged Diagonal Storage dan TJDS Transposed Jagged Diagonal Storage Shahnaz, et al. 2006. Dalam penelitian ini, penulis menggunakan format kompresi CSR yang akan menempatkan nilai non-zero dalam 1 baris vector. Pada CSR terdapat 3 vektor yaitu val, col_ind, row_ptr. Val merupakan vektor untuk menyimpan nilai non-zero dari sparse matrix dengan proses pengambilannya dimulai dari kiri atas lalu kekanan sampai ke baris paling bawah dan akan disimpan dalam 1 baris. Col_ind merupakah vektor yang menyimpan kolom pada sparse matrix dari setiap item val dan disimpan dalam 1 baris. Row_ptr merupakan vektor yang menyimpan indeks baris dengan cara menambahkan jumlah item non-zero pada suatu baris dari sparse matrix Goharian, et Universitas sumatera utara al. 2001. Diberikan contoh matriks pada gambar 2.1 yang selanjutnya akan dibentuk dalam format CSR yang ditunjukkan pada gambar 2.2. 1 2 1 1 1 Gambar 2.1 Contoh sparse matrix Gambar 2.2 Contoh hasil format kompresi CSR dari sparse matrix gambar 2.1

2.5. Information Filtering

Information filtering IF adalah penyaringan informasi berdasarkan user profile yang dibentuk dengan menanyakan kepada user atau dengan memonitor perilaku user terhapat sistem Smirnov, et al. 2008. Dalam penelitian penulis metode untuk Information filtering yang akan digunakan adalah bayesian framework for user interest prediction dan lebih spesifik pada rekomendas berita personal yang merupakan pengembangan dari rumus Naïve Bayes yang akan penulis bahas pada bagian 2.9.

2.6. Information Retrieval