Collaborative Tagging Vector Space Model

2.3. Collaborative Tagging

Collaborative tagging adalah sebuah proses dimana seorang pengguna secara bebas menggunakan sebuah tag sebagai keyword untuk sebuah item atau konten Golder et al, 2006. Tag yang dilakukan oleh pengguna pada suatu menunjukkan ketertarikan atau minat dari pengguna terhadap suatu item atau konten. Salah satu metode yang digunakan pada collaborative tagging adalah vector space model. Vector space model digunakan karena kemudahannya. Tag yang dilakukan oleh pengguna direpresentasikan dalam bentuk vektor dan untuk menghitung similarity dan memberikan rekomendasi digunakan dengan menggunakan cosine based similarity Alag,2007.

2.4. Vector Space Model

Vector Space Model VSM adalah metode untuk melihat tingkat kedekatan atau kesamaan smilarity term dengan cara pembobotan term. Dokumen dipandang sebagi sebuah vektor yang memiliki magnitude jarak dan direction arah. Pada Vector Space Model, sebuah istilah direpresentasikan dengan sebuah dimensi dari ruang vektor Alag,2007. - Dot Product Dimisalkan d adalah merupakan nilai sebuah vektor dari sebuah dokumen . Untuk menghitung kesamaan dua buah vektor adalah dengan menggunakan cosine similarity. Tahap awal adalah dengan menghitung vector normalizer atau vector length dari setiap vektor yang ada pada dokumen Alag,2007. Untuk menghitung similarity antara dua vektor dihitung menggunakan rumus : Sim d1,d2 = Dimana : • d1 merupakan nilai vektor dari dokumen 1 • d2 merupakan nilai vektor dari dokumen 2 2.1 Universitas Sumatera Utara • | d1 | | d2| merupakan nilai Euclidean length Nilai Euclidean Distance merupakan nilai jarak antara suatu vektor dengan vektor yang lainAlag,2007. Nilai Euclidean Distance dihitung dengan rumus : Dimana : • n adalah banyaknya jumlah vektor • vi adalah nilai yang ada pada vektor Dari rumus 2.1 , akan didapat nilai length-normalize dari setiap vektor. Rumus untuk menghitung length-normalize adalah : d1 = Dimana : • adalah nilai dari vektor pada dokumen 1 • | adalah nilai euclidean length dari vektor dokumen 1 Rumus untuk menghitung cosine similarity untuk vector : Sim d1,d2 = d1 . d2 Dimana : • d1 adalah nilai dari length-normalize vektor pada dokumen 1 • d2 adalah nilai dari length-normalize vektor pada dokumen 2 2.2 2.3 2.4 Universitas Sumatera Utara Pada sistem rekomendasi dengan tag, setiap tag yang dilakukan oleh pengguna direpresentasikan kedalam bentuk vector. Sebagai contoh, terdapat tiga buah artikel yaitu artikel A, artikel B dan artikel C telah diberikan tag oleh user sebagai berikut: • Artikel A telah diberikan tag dengan kata Recommender System oleh 4 user, Tag Based oleh 8 user, Collaborative Filtering oleh 6 user,Cosine Similarity oleh 3 user. • Artikel B telah diberikan tag dengan kata Tag Based oleh 5 user, Cosine Similarity oleh 8 user,vector oleh 5 user. • Artikel C telah diberikan tag dengan kata Recommender System oleh 1 user, Tag Based oleh 4 user, Cosine Similarity oleh 3 user, Dot Product 10 user. Tabel 3.1 Data artikel yang telah diberikan tagging oleh pengguna. Recommender System Tag Based Collaborative Filtering Cosine Similarity Vector Dot Product Artikel A 4 8 6 3 Artikel B 5 8 5 Artikel C 1 4 3 10 Dari tabel 3.1 dapat diketahui bahwa terbentuk 6 vector berdasarkan dari semua jumlah term yang ada.kemudian dihitung normalizer untuk setiap jurnal . Normalizer merupakan nilai dari Euclidean distance dan untuk menghitung nilai Euclidean Distance digunakan rumus 2.2 . Nilai normalizer untuk artikel A adalah = 11,18. Nilai normalizer untuk artikel B adalah =10,68 dan Nilai normalizer untuk artikel C adalah = 11,22. jumlah data tag artikel dan nilai normalizer akan dibuat didalam tabel 3.2. Universitas Sumatera Utara Tabel 3.2 Raw Data Jurnal. Recommender System Tag Based Collaborative Filtering Cosine Similarity Vector Dot Product Normalizer Artikel A 4 8 6 3 11,18 Artikel B 5 8 5 10,68 Artikel C 1 4 3 10 11,22 Setelah data normalizer didapatkan kemudian akan dihitung normalize dari setiap vector untuk setiap raw data jurnal. Untuk mendapatkan nilai normalized vector dihitung dengan menggunakan rumus 2.3. Sebagai contoh nilai normalized tag Recommender System pada artikel A adalah = 0,3578, nilai normalized tag Tag Based pada artikel A adalah = 0,7156 , nilai normalized tag Collaborative Filtering pada artikel A adalah = 0,5367. Nilai semua normalized diterangkan dengan tabel 3.3 Tabel 3.3 Normalized Vector jurnal Recommender System Tag Based Collaborative Filtering Cosine Similarity Vector Dot Product Artikel A 0,3578 0,7156 0,5367 0,2683 Artikel B 0,4682 0,7491 0,4682 Artikel C 0,0891 0,3563 0,2673 0,891 Setelah data normalized didapatkan kemudian dihitung similarity antara suatu artikel dengan artikel lainnya dengan menggunakan cosine similarity. Rumus untuk menghitung cosine similarity dapat dilihat pada rumus 2.4. Universitas Sumatera Utara Simjurnal A dan jurnal B = 0,71560,4682 + 0,26830,7491 = 0,5360 Simjurnal A dan jurnal C = 0,35780,0891 + 0,26830,2673 = 0,3586 SimJurnal B dan Jurnal C = 0,46820,3563 + 0,74910,2673 = 0,3671 Dari contoh diatas dapat diketahui bahwa artikel B lebih relevan dengan artikel A dibandingkan dengan artikel C dan artikel C lebih relevan dengan artikel B dibandingkan dengan artikel A. Selain untuk menghitung similarity antara suatu artikel dengan artikel lainnya, juga dapat juga digunakan untuk memberikan rekomendasi artikel kepada user. Sebagai contoh, terdapat dua buah pengguna yaitu dan telah memberikan tag pada tiga buah artikel dengan tag sebagai berikut: • telah memberikan tag pada artikel A dengan kata : Recommender System, Tag Based, Collaborative Filtering. • telah memberikan tag pada artikel B dengan kata : Cosine Similarity, Vector, Tag Based • telah memberikan tag pada artikel C dengan kata : Dot Product, Cosine Similarity, Tag Based. Dari data tag yang dilakukan oleh dan dapat diketahui jumlah tag yang terdapat pada sistem berjumalah enam yaitu : Recommender System, Tag Based, Collaborative Filtering, Cosine Similarity, Vector dan Dot Product. Tabel 3.4 Data Tagging user Recommender System Tag Based Collaborative Filtering Cosine Similarity Vector Dot Product U 1 1 2 1 1 1 U 2 1 1 1 Universitas Sumatera Utara Kemudian setelah data dari tag user didapatkan langkah selanjutnya adalah dengan menghitung normalizer atau jarak antara suatu vektor dengan vektor lainnya. Untuk menghitung nilai normalizer setiap vektor dihitung dengan menggunakan rumus 2.2. Sebagai contoh nilai normalizer untuk user A adalah = 2,83 dan nilai normalizer untuk user B adalah = 1,73. Hasil dari normalizer akan dijelaskan pada tabel 3.5 Tabel 3.5 Raw Data User Recommender System Tag Based Collaborative Filtering Cosine Similarity Vector Dot Product Normalizer U 1 1 2 1 1 1 2,83 U 2 1 1 1 1,73 Setelah data normalizerlength untuk setiap user didapatkan kemudian dihitung normalized untuk user. Untuk menghitung nilai normalized vektor dapat dihitung dengan menggunakan rumus 2.3. Hasil nilai dari normalized vektor pengguna dapat dilihat pada tabel 3.6. Tabel 3.6 Normalized vector User Recommender System Tag Based Collaborative Filtering Cosine Similarity Vector Dot Product U 1 0,3536 0,7071 0,3536 0,3536 0,3536 U 2 0,5773 0,5773 0,5773 Kemudian setelah didapatkan nilai normalized untuk setiap vector pada user akan dihitung dot product dengan menggunakan cosine similarity antara nilai normalized vector user dengan nilai normalized artikel. Perhitungan dot product dihitung dengan rumus 2.4. Hasil nilai dot product antara pengguna dan jurnal dapat dilihat pada tabel 3.7. Universitas Sumatera Utara Tabel 3.7 Dot Product User x Jurnal Artikel A Artikel B Artikel C U 1 0,917 0,7616 0,378 U 2 0,568 0,703 0,874

2.4. Bahasa Pemrograman PHP