5. Membentuk sparse matrix dengan cara memasukkan term sesuai kolom setiap baris matrix dengan masing
– masing dokumen 6. Membuat vector untuk query dengan mengikuti kolom dari
7. Lakukan kompresi sparse matrix ke dalam format CSR. 8. Lakukan algoritma CSR SpMV sesuai algoritma pada gambar 2.3.
2.8. Proximity Processing
Proximity processing yang merupakan pengembangan dari CSR SpMV. Metode
proximity processing dikembangkan oleh Goharian dkk pada tahun 2001 dalam
jurnalnya “On the Enhancements of a Sparse Matrix Information Retrieval Approach
”. Tujuan utama dari proximity processing dalam penelitian ini untuk memberikan hasil rekomendasi yang akurat dan term yang sesuai urutan antara query
dan dokumen Goharian, et al. 2001.
Gambar 2.4 Algoritma untuk proximity processing
Untuk melakukan proximity processing yang merupakan lanjutan setelah melakukan CSR SpMV yang telah penulis jelaskan pada bagian 2.7 diharuskan untuk
memodifikasi format CSR dengan menambahkan vektor yang kelima dan keenam, yaitu offset_vector dan offset_marker. Tujuan dari penambahan tersebut adalah untuk
mencatat posisi setiap dari setiap term pada masing – masing dokumen Goharian, et
al 2001.
FOR each document ranked with the highest similary score in the query processing using sparse matrix vector multiplication DO
Find from row_vector the element term id and the number of elements in col_vector belonging to that document and the start position in col_vector
IF the element term id mathes to any query term id Then DO FOR each found position in col_vector DO
Find the corresponding element in offset_marker Find the corresponding elements in offset_vector
END Build pairs in the order of query terms between the elements found in
offset_vector across each col_vector FOR each pair DO
Compute the difference between the elements of the pair IF the difference = 1 and = query window size
Then mark the pair for selection END
END END
Universitas sumatera utara
2.9. Rekomendasi Berita Personal
Rekomendasi berita personal merupakan bagian dari sistem rekomendasi yang
memberikan rekomendasi berita yang berbeda untuk setiap pembaca berita, sesuai dengan kesukaan berita yang pernah dibaca Liu, et al. 2010.
Rekomendasi berita personal dikembangkan dari Naïve Bayes untuk memprediksi news interest
dari setiap pembaca berita. Dalam penelitian ini penulis menggunakan bayesian framework for user interest
yang telah dikembangkan dalam penelitian Liu dkk pada tahun 2010.
� =
�
� =
� =
�
�
� = � �
� = �
�
2.1 Keterangan
� =
�
= probabilitas akses kategori pada waktu terakhir terhadap total click di semua kategori
� =
�
� = probabilitas akses kategori i dalam pada waktu t. sebelum dihitung akan dijabarkan lebih dahulu,
maka =
� � =
�
� =
�
�
� =
�
= probabilitas akses kategori padat waktu t terhadap total click disemua kategori pada waktu t
� = total click pada waktu t
2.10. Stopword Removal