Information Retrieval CSR SpMV Sparse Matrix Vector Multiplication

al. 2001. Diberikan contoh matriks pada gambar 2.1 yang selanjutnya akan dibentuk dalam format CSR yang ditunjukkan pada gambar 2.2. 1 2 1 1 1 Gambar 2.1 Contoh sparse matrix Gambar 2.2 Contoh hasil format kompresi CSR dari sparse matrix gambar 2.1

2.5. Information Filtering

Information filtering IF adalah penyaringan informasi berdasarkan user profile yang dibentuk dengan menanyakan kepada user atau dengan memonitor perilaku user terhapat sistem Smirnov, et al. 2008. Dalam penelitian penulis metode untuk Information filtering yang akan digunakan adalah bayesian framework for user interest prediction dan lebih spesifik pada rekomendas berita personal yang merupakan pengembangan dari rumus Naïve Bayes yang akan penulis bahas pada bagian 2.9.

2.6. Information Retrieval

Information retrieval dalam arti sederhana mencari informasi, sedangkan dalam pengertian teknis adalah mendapatkan informasi yang relevan dengan informasi yang dibutuhkan dari sekumpulan dokumen dengan menggunakan algoritma yang mampu mengetahui ukuran kesamaan antara query dan dokumen Goker, 2009. Saat ini, user menginginkan hasil relevansi dalam bentuk ranking, maka dari itu penggunaan information retrieval dengan model vektor dan probabilitas menjadi pilihan utama Kneepkens, 2009. Algoritma information retrieval yang akan penulis gunakan dalam penelitian ini adalah CSR SpMV Sparse Matrix Vector Val = 1, 2, 1, 1, 1 Col = 0, 2, 3, 0, 2 Row Ptr = 0, 2, 3, 5 Universitas sumatera utara Multiplication dan proximity processing. CSR SpMV penulis jelaskan pada bagian 2.7 dan proximity processing penulis jelaskan pada 2.8.

2.7. CSR SpMV Sparse Matrix Vector Multiplication

CSR SpMV merupakan perkalian antara sparse matrix dengan vector pengali dengan melakukan perhitungan y = y + A x, dimana A menyatakan sparse matrix, y menyatakan baris dan x vector pengali yang sudah banyak diaplikasikan pada bidang ilmu science dan engineering untuk melakukan efisiensi pemrosesan Liu, et al. 2013. Salah satu penerapan sparse matrix untuk information retrieval, dengan membentuk format kompresi CSR lalu melakukan perkalian dengan query yang dibentuk dalam vector, sehingga untuk setiap baris memiliki nilai penjumlahan dari setiap perkalian Goharian, et al. 2001. Gambar 2.3 Algoritma CSR SpMV Goharian, et al. 2001. Sebelum dilakukan proses CSR SpMV ada beberapa tahapan proses yang akan dilakukan Goharian, et al. 2001 yaitu : 1. Mengubah dokumen yang berisi term menjadi term frequency tf 2. Mengindefikasi setiap jumlah term yang unik pada masing – masing dokumen untuk mendapatkan document frequency df 3. Menghitung nilai inverse document frequency idf untuk setiap term dengan rumus logddf, d menyatakan jumlah dokumen. 4. Membuat dokumen vektor dan query dengan panjang kolom n, dengan n menyatakan jumlah term yang unik yang tersedia secara kesuluruhan. forcount = 0; count D; count++ temp = 0; forrow_ind=row_vector[count]; row_ind = row_vector[count+1] - 1; row_ind++ col_ind = col_vector[row_ind]; temp = temp + non_zero_vector[row_ind] Q[col_ind]; end for CSR_output[count] = temp endfor Universitas sumatera utara 5. Membentuk sparse matrix dengan cara memasukkan term sesuai kolom setiap baris matrix dengan masing – masing dokumen 6. Membuat vector untuk query dengan mengikuti kolom dari 7. Lakukan kompresi sparse matrix ke dalam format CSR. 8. Lakukan algoritma CSR SpMV sesuai algoritma pada gambar 2.3.

2.8. Proximity Processing