3 2.
Pihak manajemen atau pengelola suatu instansi Data statistik mengenai konten web yang dihasilkan bisa dijadikan acuan
dalam mengambil kebijakan untuk pengembangan konten website institusinya.
3. Peneliti bidang Web Mining
Bisa dijadikan bahan informasi tambahan bagi para peneliti tentang implementasi Algoritme Apriori dalam menganalisis keterhubungan antar
halaman Website.
Ruang Lingkup Penelitian dan Bahan Penelitian Berkaitan dengan rentang waktu pelaksanaan penelitian ini, maka perlu
dibatasi ruang lingkup penelitiannya supaya lebih terarah, yaitu sebagai berikut: 1.
Penelitian difokuskan pada satu area Web Mining yaitu Web Usage Mining WUM.
2. Aplikasi yang dikembangkan hanya untuk melakukan proses pre-processing dan pemodelan data untuk WUM menggunakan algoritme Apriori.
3. Bahan data yang akan diolah hanya untuk data clickstream dari Apache Web Server.
4. Hasil akhirnya berupa data statistik yang bisa dijadikan acuan dalam pengembangan isi dari Website
5. Menganalisis data offline yakni bukan menganalisis data realtime secara langsung. Data berasal dari file yang diambil dari file akses log access.log
yang diambil dari Web Server Departemen Pertanian Indonesia Deptan. 6. Dalam pelaksanaannya penelitian ini akan menggunakan bahan dan alat
sebagai berikut: a.
Data dasar adalah file access.log b. Perangkat pengolah data menggunakan satu set sistem komputer dengan
menggunakan Processor Intel Atom N4501.66Ghz c. Web Server yang digunakan adalah yang berbasis Open Source yaitu
Apache Web Server d. Editor teks menggunakan Open Office, Blue Fish dan Geany
e. Bahasa Pemrograman bebasis Web HTML, XML, JavaScript, AJAX, PHP dan CSS
f. Data Base Management System DBMS menggunakan MySql
5
2 TINJAUAN PUSTAKA
Data Clickstream Clickstream
yaitu proses pencatatan atau perekaman data klik pada layar komputer yang dilakukan oleh pengguna pada saat browsing web atau
menggunakan aplikasi perangkat lunak dengan lokasi analisis pada area halaman web
atau aplikasi, login pada klien atau di dalam web server, router, atau server proxy
Moe WW et al. 2004, atau Clickstream adalah serangkaian link yang sudah diklik oleh pengguna ketika mengakses halaman web freedictionary 2013.
Data clickstream ini biasanya disimpan dalam sebuah file access.log yang berada di web server. Setiap pengguna melakukan proses klik terhadap menu yang ada di
monitor dalam hal ini halaman web, maka Web server akan merekamnya dan disimpan dalam file access.log. Sehingga akan banyak informasi dan data yang
tersiimpan di dalamnya dan bisa dianalisis menggunakan metode yang ada dalam data mining
. Proses menganalisis data clickstream merupakan bagian dari Web Usage Mining
WUM yang melakukan discovery data dengan menggunakan data sekunder yang ada pada web server, yaitu meliputi data access log, browser log,
user profiles, registration data, user session, cookies, user queries dan juga data
mouse click Abdurrahman et al. 2006.
Web Mining Dengan adanya Website kita bisa menyampaikan informasi kepada khalayak
ramai dengan mudah dan cepat tanpa batas wilayah, sehingga siapapun bisa mengasksesnya dengan bebas pula, kecuali yang menyertakan beberapa syarat
akses. Sedangkan cara atau teknik data mining untuk mengekstrak data dari data Web
dikenal dengan istilah Web Mining Srivastava 2005. Ada tiga kelompok yang termasuk ke dalam Web Mining, yaitu :
1. Web Content Mining WCM
Merupakan kelompok Web Mining dengan melakukan proses ekstraksi menggunakan data yang berasal dari isi suatu dokumen Website J. Srivastava
2005. isi suatu dokumen web tersebut bisa berupa teks, gambar, audio, video dan data record dalam bentuk list dan tabel. Hasil dari penelitian bidang
WCM biasanya berupa klasifikasi Website dan implementasi pada mesin pencarian seperti Google.
2. Web Structure Mining WSM
Merupakan teknik dalam Web Mining dengan mengambil atau melakukan ekstraksi data yang berasal dari struktur halaman atau struktur dokumen
sebuah Website Srivastava, 2005. Halaman dianggap sebagai node dan hyperlink
dianggap sebagai edge, sehingga membentuk struktur data graph