Proximity Processing Rekomendasi Berita Personal

5. Membentuk sparse matrix dengan cara memasukkan term sesuai kolom setiap baris matrix dengan masing – masing dokumen 6. Membuat vector untuk query dengan mengikuti kolom dari 7. Lakukan kompresi sparse matrix ke dalam format CSR. 8. Lakukan algoritma CSR SpMV sesuai algoritma pada gambar 2.3.

2.8. Proximity Processing

Proximity processing yang merupakan pengembangan dari CSR SpMV. Metode proximity processing dikembangkan oleh Goharian dkk pada tahun 2001 dalam jurnalnya “On the Enhancements of a Sparse Matrix Information Retrieval Approach ”. Tujuan utama dari proximity processing dalam penelitian ini untuk memberikan hasil rekomendasi yang akurat dan term yang sesuai urutan antara query dan dokumen Goharian, et al. 2001. Gambar 2.4 Algoritma untuk proximity processing Untuk melakukan proximity processing yang merupakan lanjutan setelah melakukan CSR SpMV yang telah penulis jelaskan pada bagian 2.7 diharuskan untuk memodifikasi format CSR dengan menambahkan vektor yang kelima dan keenam, yaitu offset_vector dan offset_marker. Tujuan dari penambahan tersebut adalah untuk mencatat posisi setiap dari setiap term pada masing – masing dokumen Goharian, et al 2001. FOR each document ranked with the highest similary score in the query processing using sparse matrix vector multiplication DO Find from row_vector the element term id and the number of elements in col_vector belonging to that document and the start position in col_vector IF the element term id mathes to any query term id Then DO FOR each found position in col_vector DO Find the corresponding element in offset_marker Find the corresponding elements in offset_vector END Build pairs in the order of query terms between the elements found in offset_vector across each col_vector FOR each pair DO Compute the difference between the elements of the pair IF the difference = 1 and = query window size Then mark the pair for selection END END END Universitas sumatera utara

2.9. Rekomendasi Berita Personal

Rekomendasi berita personal merupakan bagian dari sistem rekomendasi yang memberikan rekomendasi berita yang berbeda untuk setiap pembaca berita, sesuai dengan kesukaan berita yang pernah dibaca Liu, et al. 2010. Rekomendasi berita personal dikembangkan dari Naïve Bayes untuk memprediksi news interest dari setiap pembaca berita. Dalam penelitian ini penulis menggunakan bayesian framework for user interest yang telah dikembangkan dalam penelitian Liu dkk pada tahun 2010. � = � � = � = � � � = � � � = � � 2.1 Keterangan � = � = probabilitas akses kategori pada waktu terakhir terhadap total click di semua kategori � = � � = probabilitas akses kategori i dalam pada waktu t. sebelum dihitung akan dijabarkan lebih dahulu, maka = � � = � � = � � � = � = probabilitas akses kategori padat waktu t terhadap total click disemua kategori pada waktu t � = total click pada waktu t

2.10. Stopword Removal