2.3. Collaborative Tagging
Collaborative tagging adalah sebuah proses dimana seorang pengguna secara bebas menggunakan sebuah tag sebagai keyword untuk sebuah item atau konten Golder et
al, 2006. Tag yang dilakukan oleh pengguna pada suatu menunjukkan ketertarikan atau minat dari pengguna terhadap suatu item atau konten.
Salah satu metode yang digunakan pada collaborative tagging adalah vector space model. Vector space model digunakan karena kemudahannya. Tag yang dilakukan
oleh pengguna direpresentasikan dalam bentuk vektor dan untuk menghitung similarity dan memberikan rekomendasi digunakan dengan menggunakan cosine
based similarity Alag,2007.
2.4. Vector Space Model
Vector Space Model VSM adalah metode untuk melihat tingkat kedekatan atau kesamaan smilarity term dengan cara pembobotan term. Dokumen dipandang sebagi
sebuah vektor yang memiliki magnitude jarak dan direction arah. Pada Vector Space Model, sebuah istilah direpresentasikan dengan sebuah dimensi dari ruang
vektor Alag,2007. -
Dot Product Dimisalkan
d adalah merupakan nilai sebuah vektor dari sebuah dokumen . Untuk menghitung kesamaan dua buah vektor adalah dengan menggunakan cosine
similarity. Tahap awal adalah dengan menghitung vector normalizer atau vector length dari setiap vektor yang ada pada dokumen Alag,2007. Untuk menghitung
similarity antara dua vektor dihitung menggunakan rumus :
Sim d1,d2 = Dimana :
• d1 merupakan nilai vektor dari dokumen 1 • d2 merupakan nilai vektor dari dokumen 2
2.1
Universitas Sumatera Utara
• | d1 | | d2| merupakan nilai Euclidean length Nilai Euclidean Distance merupakan nilai jarak antara suatu vektor dengan vektor
yang lainAlag,2007. Nilai Euclidean Distance dihitung dengan rumus :
Dimana : • n adalah banyaknya jumlah vektor
• vi adalah nilai yang ada pada vektor Dari rumus 2.1 , akan didapat nilai length-normalize dari setiap vektor. Rumus
untuk menghitung length-normalize adalah :
d1 =
Dimana : •
adalah nilai dari vektor pada dokumen 1 •
| adalah nilai euclidean length dari vektor dokumen 1 Rumus untuk menghitung cosine similarity untuk vector :
Sim d1,d2 = d1 . d2
Dimana : •
d1 adalah nilai dari length-normalize vektor pada dokumen 1 •
d2 adalah nilai dari length-normalize vektor pada dokumen 2 2.2
2.3
2.4
Universitas Sumatera Utara
Pada sistem rekomendasi dengan tag, setiap tag yang dilakukan oleh pengguna direpresentasikan kedalam bentuk vector.
Sebagai contoh, terdapat tiga buah artikel yaitu artikel A, artikel B dan artikel C telah diberikan tag oleh user sebagai berikut:
• Artikel A telah diberikan tag dengan kata Recommender System oleh 4 user, Tag Based oleh 8 user, Collaborative Filtering oleh 6 user,Cosine
Similarity oleh 3 user. • Artikel B telah diberikan tag dengan kata Tag Based oleh 5 user,
Cosine Similarity oleh 8 user,vector oleh 5 user. • Artikel C telah diberikan tag dengan kata Recommender System oleh 1
user, Tag Based oleh 4 user, Cosine Similarity oleh 3 user, Dot Product 10 user.
Tabel 3.1 Data artikel yang telah diberikan tagging oleh pengguna.
Recommender System
Tag Based
Collaborative Filtering
Cosine Similarity
Vector Dot
Product
Artikel A
4 8
6 3
Artikel B
5 8
5
Artikel C
1 4
3 10
Dari tabel 3.1 dapat diketahui bahwa terbentuk 6 vector berdasarkan dari semua jumlah term yang ada.kemudian dihitung normalizer untuk setiap jurnal .
Normalizer merupakan nilai dari Euclidean distance dan untuk menghitung nilai Euclidean Distance digunakan rumus 2.2 . Nilai normalizer untuk artikel A adalah
= 11,18. Nilai normalizer untuk artikel B adalah =10,68 dan Nilai normalizer
untuk artikel
C adalah = 11,22. jumlah data tag artikel dan nilai normalizer akan
dibuat didalam tabel 3.2.
Universitas Sumatera Utara
Tabel 3.2 Raw Data Jurnal.
Recommender System
Tag Based
Collaborative Filtering
Cosine Similarity
Vector Dot
Product Normalizer
Artikel A
4 8
6 3
11,18
Artikel B
5 8
5 10,68
Artikel C
1 4
3 10
11,22
Setelah data normalizer didapatkan kemudian akan dihitung normalize dari setiap vector untuk setiap raw data jurnal. Untuk mendapatkan nilai normalized vector
dihitung dengan menggunakan rumus 2.3. Sebagai contoh nilai normalized tag Recommender System pada artikel A adalah
= 0,3578, nilai normalized tag Tag Based pada artikel A adalah
= 0,7156 , nilai normalized tag Collaborative Filtering pada artikel A adalah
= 0,5367. Nilai semua normalized diterangkan dengan tabel 3.3
Tabel 3.3 Normalized Vector jurnal
Recommender System
Tag Based
Collaborative Filtering
Cosine Similarity
Vector Dot
Product
Artikel A
0,3578 0,7156
0,5367 0,2683
Artikel B
0,4682 0,7491
0,4682
Artikel C
0,0891 0,3563
0,2673 0,891
Setelah data normalized didapatkan kemudian dihitung similarity antara suatu artikel dengan artikel lainnya dengan menggunakan cosine similarity. Rumus untuk
menghitung cosine similarity dapat dilihat pada rumus 2.4.
Universitas Sumatera Utara
Simjurnal A dan jurnal B = 0,71560,4682 + 0,26830,7491 = 0,5360 Simjurnal A dan jurnal C = 0,35780,0891 + 0,26830,2673 = 0,3586
SimJurnal B dan Jurnal C = 0,46820,3563 + 0,74910,2673 = 0,3671
Dari contoh diatas dapat diketahui bahwa artikel B lebih relevan dengan artikel A dibandingkan dengan artikel C dan artikel C lebih relevan dengan artikel B
dibandingkan dengan artikel A.
Selain untuk menghitung similarity antara suatu artikel dengan artikel lainnya, juga dapat juga digunakan untuk memberikan rekomendasi artikel kepada user.
Sebagai contoh, terdapat dua buah pengguna yaitu dan
telah memberikan tag pada tiga buah artikel dengan tag sebagai berikut:
• telah memberikan tag pada artikel A dengan kata : Recommender System,
Tag Based, Collaborative Filtering. •
telah memberikan tag pada artikel B dengan kata : Cosine Similarity, Vector, Tag Based
• telah memberikan tag pada artikel C dengan kata : Dot Product, Cosine
Similarity, Tag Based.
Dari data tag yang dilakukan oleh dan
dapat diketahui jumlah tag yang terdapat pada sistem berjumalah enam yaitu : Recommender System, Tag Based,
Collaborative Filtering, Cosine Similarity, Vector dan Dot Product.
Tabel 3.4 Data Tagging user
Recommender System
Tag Based
Collaborative Filtering
Cosine Similarity
Vector Dot
Product U
1
1 2
1 1
1
U
2
1 1
1
Universitas Sumatera Utara
Kemudian setelah data dari tag user didapatkan langkah selanjutnya adalah dengan menghitung normalizer atau jarak antara suatu vektor dengan vektor lainnya.
Untuk menghitung nilai normalizer setiap vektor dihitung dengan menggunakan rumus 2.2. Sebagai contoh nilai normalizer untuk user A adalah
= 2,83 dan nilai normalizer untuk user B adalah = 1,73. Hasil dari normalizer akan dijelaskan pada tabel 3.5
Tabel 3.5 Raw Data User
Recommender System
Tag Based
Collaborative Filtering
Cosine Similarity
Vector Dot
Product
Normalizer
U
1
1 2
1 1
1 2,83
U
2
1 1
1 1,73
Setelah data normalizerlength untuk setiap user didapatkan kemudian dihitung normalized untuk user. Untuk menghitung nilai normalized vektor dapat dihitung
dengan menggunakan rumus 2.3. Hasil nilai dari normalized vektor pengguna dapat dilihat pada tabel 3.6.
Tabel 3.6 Normalized vector User
Recommender System
Tag Based
Collaborative Filtering
Cosine Similarity
Vector Dot
Product U
1
0,3536 0,7071
0,3536 0,3536
0,3536 U
2
0,5773 0,5773
0,5773
Kemudian setelah didapatkan nilai normalized untuk setiap vector pada user akan dihitung dot product dengan menggunakan cosine similarity antara nilai normalized
vector user dengan nilai normalized artikel. Perhitungan dot product dihitung dengan rumus 2.4. Hasil nilai dot product antara pengguna dan jurnal dapat dilihat pada tabel
3.7.
Universitas Sumatera Utara
Tabel 3.7 Dot Product User x Jurnal
Artikel A Artikel B
Artikel C U
1
0,917 0,7616
0,378 U
2
0,568 0,703
0,874
2.4. Bahasa Pemrograman PHP