dokumen, layanan, dan data pada World Wide Web Etzoni 1996. Web mining merupakan
bagian dari proses data mining yang khusus dilakukan pada sebuah situs web.
Klasifikasi web mining dapat dibagi dalam tiga kategori Huysmans et al. 2004, yaitu:
a. Web content mining
Web content mining adalah penggalian
informasi dari
konteninformasi dan
dokumen web untuk membantu pengunjung menemukan informasi yang diinginkannya.
b. Web structure mining
Web structure mining adalah ekstraksi
informasi struktur link situs web untuk mengelompokkan
interkoneksi dokumen
web sehingga
memudahkan pencarian
informasi dari situs web lain.
c. Web usage mining
Web usage mining adalah aplikasi teknik
data mining untuk mengetahui pola akses
pengunjung terhadap suatu situs web. Pola akses ini diolah dari data sekunder yang
menyimpan aktivitas pengunjung seperti data log server
, log proxy, log browser, session, cookies
, dan sebagainya.
METODOLOGI
Metodologi yang
digunakan dalam
penelitian ini mengikuti dan mengadaptasi semua tahapan pengembangan sistem sesuai
linear sequential model seperti berikut :
1. Analisis Pada tahapan ini akan dilakukan proses
analisis mengenai
permasalahan yang
berhubungan dengan kebutuhan sistem. Hasil analisis yang didapat adalah:
a. Sistem harus dapat menampilkan semua koleksi wallpaper dan informasi yang
berkaitan dengan walllpaper tersebut yang ada dalam basis data.
b. Sistem harus dapat mencatat setiap kali pengguna mengunduh sebuah koleksi
wallpaper .
c. Sistem harus dapat menghitung dan menentukan profil minat
dan profil perilaku setiap pengguna berdasarkan data
transaksi wallpaper yang telah diunduh. d. Sistem harus dapat membentuk matriks
vektor setiap pengguna berdasarkan profil pengguna pengguna.
e. Sistem harus dapat mengelompokkan setiap
pengguna ke
dalam cluster
berdasarkan jarak masing-masing vektor matriks setiap pengguna.
f. Sistem harus
dapat memberikan
rekomendasi koleksi wallpaper
yang belum diunduh kepada pengguna dari
koleksi yang sudah diunduh pengguna lain yang memiliki minat dan perilaku yang
mirip dengan pengguna di dalam kelompok cluster sama.
2. Desain Hal-hal yang akan dilakukan dan
diperoleh dalam tahap ini adalah : a. Membuat basis data yang akan berisikan
informasi-informasi yang berkaitan dengan koleksi wallpaper.
b. Membuat algoritma pencatatan yang akan mencatat setiap kali pengguna mengunduh
koleksi wallpaper. c. Membuat algoritma yang akan menghitung
dan menentukan profil minat dan profil perilaku setiap pengguna berdasarkan data
transaksi yang telah tercatat sebelumnya. d. Membuat
algoritma yang
dapat menghasilkan matriks vektor pengguna
berdasarkan profil minat dan profil perilaku setiap pengguna.
e. Membuat algoritma clustering dengan menggunakan Euclidean Distance untuk
mengelompokkan penguna berdasarkan jarak
masing-masing vektor
matriks pengguna.
f. Membuat algoritma
yang dapat
memberikan rekomendasi koleksi yang belum diunduh berdasarkan koleksi yang
sudah diunduh pengguna lain yang memilik profil minat dan perilaku yang
sama dengan pengguna di dalam satu cluster
pengguna. g. Membuat desain antarmuka pengguna
yang dapat menampilkan wallpaper yang ada di dalam basis data dan informasi-
informasi yang lain berkaitan dengan wallpaper
tersebut serta
dapat menampilkan rekomendasi koleksi untuk
masing-masing pengguna. 3. Pengkodean Code
Pada tahap ini akan dilakukan proses implementasi pengkodean program sesuai
analisis dan perancangan yang sudah dilakukan.
4. Pengujian Test Pada
tahap ini
dilakukan proses
pengujian dan percobaan terhadap terhadap sistem sesuai dengan spesifikasi yang
ditentukan sebelumnya. Faktor yang digunakan dalam percobaan
adalah nilai-nilai threshold yang digunakan dalam proses perhitungan.
Hal-hal yang akan diamati selama dilakukan proses pengujian terhadap sistem
yang dikembangkan: a. Jumlah cluster yang terbentuk.
dokumen, layanan, dan data pada World Wide Web Etzoni 1996. Web mining merupakan
bagian dari proses data mining yang khusus dilakukan pada sebuah situs web.
Klasifikasi web mining dapat dibagi dalam tiga kategori Huysmans et al. 2004, yaitu:
a. Web content mining