Pengumpulan Data

3.2.2.1 Konten artikel

Konten artikel diperoleh dengan memanfaatkan Google Web Search. Setiap pencarian di internet pastilah menpunyai acuan pencarian. Pada Google Web Search alamat acuan yang digunakan dalam melakukkan pencarian adalah :

https://ajax.googleapis.com/ajax/services/search/web

Sebagai contoh akan dikirimkan query request = “Paris Hilton” pada Google Web Search dengan url sebagai berikut :

https://ajax.googleapis.com/ajax/services/search/web?v=1.0&q=Paris %20Hilton

Maka query tersebut akan memberikan hasil sebagai berikut :

{"responseData": { "results": [ { "GsearchResultClass": "GwebSearch", "unescapedUrl": "http://en.wikipedia.org/wiki/Paris_Hilton", "url": "http://en.wikipedia.org/wiki/Paris_Hilton", "visibleUrl": "en.wikipedia.org", "cacheUrl": "http://www.google.com/search?q\u003dcache:TwrPfhd22hYJ:en.wikipedia.org", "title": "\u003cb\u003eParis Hilton\u003c/b\u003e - Wikipedia, the free encyclopedia", "titleNoFormatting": "Paris Hilton - Wikipedia, the free encyclopedia", "content": "\[1\] In 2006, she released her debut album..."

"GsearchResultClass": "GwebSearch", "unescapedUrl": "http://www.imdb.com/name/nm0385296/", "url": "http://www.imdb.com/name/nm0385296/", "visibleUrl": "www.imdb.com", "cacheUrl": "http://www.google.com/search?q\u003dcache:1i34KkqnsooJ:www.imdb.com", "title": "\u003cb\u003eParis Hilton\u003c/b\u003e", "titleNoFormatting": "Paris Hilton", "content": "Self: Zoolander. Socialite \u003cb\u003eParis Hilton\u003c/b\u003e..."

], "cursor": {

"pages": [ { "start": "0", "label": 1 }, { "start": "4", "label": 2 }, { "start": "8", "label": 3 }, { "start": "12","label": 4 }

], "estimatedResultCount": "59600000", "currentPageIndex": 0, "moreResultsUrl": "http://www.google.com/search?oe\u003dutf8\u0026ie\u003dutf8..."

} } , "responseDetails": null, "responseStatus": 200}

Dari hasil Google Web Search tersebut dapat dilihat ada banyak properties dari tiap konten seperti url,visibleUrl,cacheUrl, dan lain-lain. Namun pada tugas akhir ini hanya akan digunakan beberapa properties saja. Nilai dari properties yang digunakan akan disimpan ke dalam database sistem yang selanjutnya akan diolah sesuai dengan metode/algoritma yang telah ditentukan sebelumnya guna mendapatkan kandidat relevant content terbaik. Properties ini akan digunakan sebagai metadata konten. Berikut beberapa properties yang digunakan :

Tabel 4. 3 Metadata Kandidat Relevant Content Artikel

No Property

Keterangan

1 url Property ini menyimpan alamat link dari konten artikel

2 Title Property ini menyimpan judul dari konten artikel

3 Content Property ini menyimpan snippet dari konten. Snippet merupakan uraian singkat tentang isi konten artikel

Konten gambar diperoleh dengan memanfaatkan Google Image Search. Seperti hanya pada Google Web Search, Google Image Search juga memiliki alamat acuan yang digunakan dalam melakukkan pencarian. Adapun alamat acuan tersebut adalah :

https://ajax.googleapis.com/ajax/services/search/images

Sebagai contoh akan dikirimkan query request = “Fuzzy Monkey” pada Google Image Search API dengan url sebagai berikut :

https://ajax.googleapis.com/ajax/services/search/images?v=1.0&q=fuzzy%20monkey

Maka query request tersebut akan memberikan hasil sebagai berikut :

{"responseData": { "results": [ { "GsearchResultClass": "GimageSearch", "width": "450", "height": "450", "imageId": "Yt3TRC1vxzhazM", "tbWidth": "127", "tbHeight": "127", "unescapedUrl": "http://www.touchnote.com/files/assets/STAN009.jpg", "url": "http://www.touchnote.com/files/assets/STAN009.jpg", "visibleUrl": "www.touchnote.com", "title": "Touchnote - Personalised \u003cb\u003eFuzzy Monkey\u003c/b\u003e greeting cards

design by Dan \u003cb\u003e...\u003c/b\u003e", "titleNoFormatting": "Touchnote - Personalised Fuzzy Monkey greeting cards design by Dan

...", "originalContextUrl": "http://www.touchnote.com/photo/card-design/Fuzzy+Monkey", "content": "Card Design \u003cb\u003eFuzzy Monkey\u003c/b\u003e", "contentNoFormatting": "Card Design Fuzzy Monkey", "tbUrl": "http://images.google.com/images?q\u003dtbn:Yt3TRC1vxzhazM:www.touchnote.com/files/

assets/STAN009.jpg" }, {

"GsearchResultClass": "GimageSearch", "width": "640", "height": "480", "imageId": "c6093fGTdNvKOM", "tbWidth": "137", "tbHeight": "103", "unescapedUrl": "http://stuff.fuzzymonkeyphotography.com/front_page/NEW_NEW_logo3_480px.jpg",

"titleNoFormatting": "Fuzzy Monkey Photography", "originalContextUrl": "http://www.fuzzymonkeyphotography.com/", "content": "Welcome to \u003cb\u003eFuzzy Monkey\u003c/b\u003e", "contentNoFormatting": "Welcome to Fuzzy Monkey", "tbUrl": "http://images.google.com/images?q\u003dtbn:c6093fGTdNvKOM:stuff.

fuzzymonkeyphotography.com/front_page/NEW_NEW_logo3_480px.jpg" } ], "cursor": {

"pages": [ {"start": "0","label": 1}, {"start": "4","label": 2}, {"start": "8","label": 3}, {"start": "12","label": 4} ],

"estimatedResultCount": "578000", "currentPageIndex": 0, "moreResultsUrl": "http://www.google.com/images?oe\u003dutf8\u0026ie\u003dutf8\u0026source\u003duds\

u0026start\u003d0\u0026hl\u003den\u0026q\u003dfuzzy+monkey" } } , "responseDetails": null, "responseStatus": 200}

Dari hasil Google Image Search tersebut juga didapati berbagai properties. Namun hanya beberapa saja yang akan digunakan sebagai metadata pada kandidat relevant content yang berupa gambar. Beberapa properties tersebut diantaranya :

Tabel 4. 4 Metadata Kandidat Relevant Content Gambar

No Property

Keterangan

1 url Property ini menyimpan alamat link dari konten gambar

2 Title Property ini menyimpan judul dari konten gambar

3 Content Property ini menyimpan snippet dari konten. Snippet

merupakan uraian singkat tentang isi konten gambar

4 tbUrl Property tbUrl menyimpan alamat link dari thumbnail gambar

3.2.2.3 Konten video

Konten video diperoleh dengan memanfaatkan Google Video Search API. Alamat acuan yang digunakan dalam melakukan pencarian pada Google Video Search adalah :

https://ajax.googleapis.com/ajax/services/search/video

Google Video Search dengan url sebagai berikut : https://ajax.googleapis.com/ajax/services/search/video?v=1.0&q=drywall%20repair

Maka query request tersebut akan memberikan hasil sebagai berikut :

{"responseData": { "results": [ { "GsearchResultClass": "GvideoSearch", "title": "Easy Drywall Repair a typical home improvement", "titleNoFormatting": "Easy Drywall Repair a typical home improvement", "published": "Mon, 05 Feb 2007 20:10:38 PST", "content": "An easy way to repair holes in drywall. With this method of repair no nails/screws

wood required!do it youself and save dollars!", "publisher": "www.youtube.com", "tbUrl": "http://2.gvt0.com/vi/-zop6ND1h4o/default.jpg", "tbWidth": "320", "tbHeight": "240", "videoType": "YouTube", "url": "http://www.google.com/url?q\u003dhttp://www.youtube.com/watch%3Fv%3D-

zop6ND1h4o\u0026source\u003dvideo\u0026vgc\u003drss\u0026usg\u003dAFQjCN GzJTbL6mJ5nn-B_q41Of9EFSKe2Q", "playUrl": "http://www.youtube.com/v/-

zop6ND1h4o\u0026fs\u003d1\u0026source\u003duds\u0026autoplay\u003d1", "rating": "4.6581631", "duration": "230"

"GsearchResultClass": "GvideoSearch", "title": "How To Patch a Small Hole in Drywall", "titleNoFormatting": "How To Patch a Small Hole in Drywall", "published": "Fri, 23 Oct 2009 05:01:27 PDT", "content": "Learn how to patch a small hole in drywall so you don\u0026#39;t have to pay

someone to do it.", "publisher": "www.youtube.com", "tbUrl": "http://3.gvt0.com/vi/dqsIzriVgn8/default.jpg", "tbWidth": "320", "tbHeight": "240", "videoType": "YouTube",

"url": "http://www.google.com/url?q\u003dhttp://www.youtube.com/watch%3Fv%3DdqsIzriVgn

8\u0026source\u003dvideo\u0026vgc\u003drss\u0026usg\u003dAFQjCNE3sdTecOdP29y SuEJL_tqTOlT8eg",

"playUrl": "http://www.youtube.com/v/dqsIzriVgn8\u0026fs\u003d1\u0026source\u003duds

\u0026autoplay\u003d1", "rating": "4.65", "duration": "110"

} ], "cursor": {

"pages": [

{"start": "4","label": 2}, {"start": "8","label": 3}, {"start": "12","label": 4}

], "estimatedResultCount": "218", "currentPageIndex": 0, "moreResultsUrl": "http://video.google.com/videosearch?source\u003duds\u0026type\u003

dsearch\u0026q\u003dhow+to+patch+drywall+%28site%3Avideo.google.com+OR+site%3 Ayoutube.com+%29\u0026hl\u003den\u0026start\u003d0"

} } , "responseDetails": null, "responseStatus": 200}

Properties hasil dari Google Video Search yang akan digunakan sebagai metadata pada kandidat relevant content yang berupa video sama dengan properties yang digunakan pada hasil dari Google Image Search, yakni :

Tabel 4. 5 Metadata Kandidat Relevant Content Video

No Property

Keterangan

1 url Property ini menyimpan alamat link dari konten video

2 Title Property ini menyimpan judul dari konten video

3 content Property ini menyimpan snippet dari konten. Snippet merupakan uraian singkat tentang isi konten video

4 tbUrl Property tbUrl menyimpan alamat link dari thumbnail video. Thumbnail video merepresentasikan isi dari video.

Website yang akan digunakan dalam memperoleh kandidat relevant content dari external sistem dapat berasal dari website mana saja namun dalam penelitian ini hanya akan digunakan beberapa website saja. Adapun beberapa website yang digunakan dalam memperoleh data dari external sistem yang berupa artikel dan gambar ditunjukkan pada tabel 4.6. Sedangkan website untuk memperoleh data external sistem yang berupa video digunakan situs Youtube.

Tabel 4. 6 Website Acuan Konten Mashup

No Nama Website

Url

1 Detik travel