al. 2001. Diberikan contoh matriks pada gambar 2.1 yang selanjutnya akan dibentuk dalam format CSR yang ditunjukkan pada gambar 2.2.
1 2
1 1
1
Gambar 2.1 Contoh sparse matrix
Gambar 2.2
Contoh hasil format kompresi CSR dari sparse matrix gambar 2.1
2.5. Information Filtering
Information filtering IF adalah penyaringan informasi berdasarkan user profile yang
dibentuk dengan menanyakan kepada user atau dengan memonitor perilaku user terhapat sistem Smirnov, et al. 2008. Dalam penelitian penulis metode untuk
Information filtering yang akan digunakan adalah bayesian framework for user
interest prediction dan lebih spesifik pada rekomendas berita personal yang
merupakan pengembangan dari rumus Naïve Bayes yang akan penulis bahas pada bagian 2.9.
2.6. Information Retrieval
Information retrieval dalam arti sederhana mencari informasi, sedangkan dalam
pengertian teknis adalah mendapatkan informasi yang relevan dengan informasi yang dibutuhkan dari sekumpulan dokumen dengan menggunakan algoritma yang mampu
mengetahui ukuran kesamaan antara query dan dokumen Goker, 2009. Saat ini, user menginginkan hasil relevansi dalam bentuk ranking, maka dari
itu penggunaan information retrieval dengan model vektor dan probabilitas menjadi pilihan utama Kneepkens, 2009. Algoritma information retrieval yang akan penulis
gunakan dalam penelitian ini adalah CSR SpMV Sparse Matrix Vector Val = 1, 2, 1, 1, 1
Col = 0, 2, 3, 0, 2 Row Ptr = 0, 2, 3, 5
Universitas sumatera utara
Multiplication dan proximity processing. CSR SpMV penulis jelaskan pada bagian
2.7 dan proximity processing penulis jelaskan pada 2.8.
2.7. CSR SpMV Sparse Matrix Vector Multiplication
CSR SpMV merupakan perkalian antara sparse matrix dengan vector pengali dengan
melakukan perhitungan y = y + A x, dimana A menyatakan sparse matrix, y menyatakan baris dan x vector pengali yang sudah banyak diaplikasikan pada bidang
ilmu science dan engineering untuk melakukan efisiensi pemrosesan Liu, et al. 2013. Salah satu penerapan sparse matrix untuk information retrieval, dengan
membentuk format kompresi CSR lalu melakukan perkalian dengan query yang dibentuk dalam vector, sehingga untuk setiap baris memiliki nilai penjumlahan dari
setiap perkalian Goharian, et al. 2001.
Gambar 2.3
Algoritma CSR SpMV Goharian, et al. 2001. Sebelum dilakukan proses CSR SpMV ada beberapa tahapan proses yang akan
dilakukan Goharian, et al. 2001 yaitu : 1. Mengubah dokumen yang berisi term menjadi term frequency tf
2. Mengindefikasi setiap jumlah term yang unik pada masing – masing dokumen
untuk mendapatkan document frequency df 3. Menghitung nilai inverse document frequency idf untuk setiap term dengan
rumus logddf, d menyatakan jumlah dokumen. 4. Membuat dokumen vektor dan query dengan panjang kolom n, dengan n
menyatakan jumlah term yang unik yang tersedia secara kesuluruhan.
forcount = 0; count D; count++ temp = 0;
forrow_ind=row_vector[count]; row_ind = row_vector[count+1] - 1; row_ind++ col_ind = col_vector[row_ind];
temp = temp + non_zero_vector[row_ind] Q[col_ind]; end for
CSR_output[count] = temp endfor
Universitas sumatera utara
5. Membentuk sparse matrix dengan cara memasukkan term sesuai kolom setiap baris matrix dengan masing
– masing dokumen 6. Membuat vector untuk query dengan mengikuti kolom dari
7. Lakukan kompresi sparse matrix ke dalam format CSR. 8. Lakukan algoritma CSR SpMV sesuai algoritma pada gambar 2.3.
2.8. Proximity Processing