Web content mining Web structure mining Web usage mining

dokumen, layanan, dan data pada World Wide Web Etzoni 1996. Web mining merupakan bagian dari proses data mining yang khusus dilakukan pada sebuah situs web. Klasifikasi web mining dapat dibagi dalam tiga kategori Huysmans et al. 2004, yaitu:

a. Web content mining

Web content mining adalah penggalian informasi dari konteninformasi dan dokumen web untuk membantu pengunjung menemukan informasi yang diinginkannya.

b. Web structure mining

Web structure mining adalah ekstraksi informasi struktur link situs web untuk mengelompokkan interkoneksi dokumen web sehingga memudahkan pencarian informasi dari situs web lain.

c. Web usage mining

Web usage mining adalah aplikasi teknik data mining untuk mengetahui pola akses pengunjung terhadap suatu situs web. Pola akses ini diolah dari data sekunder yang menyimpan aktivitas pengunjung seperti data log server , log proxy, log browser, session, cookies , dan sebagainya. METODOLOGI Metodologi yang digunakan dalam penelitian ini mengikuti dan mengadaptasi semua tahapan pengembangan sistem sesuai linear sequential model seperti berikut : 1. Analisis Pada tahapan ini akan dilakukan proses analisis mengenai permasalahan yang berhubungan dengan kebutuhan sistem. Hasil analisis yang didapat adalah: a. Sistem harus dapat menampilkan semua koleksi wallpaper dan informasi yang berkaitan dengan walllpaper tersebut yang ada dalam basis data. b. Sistem harus dapat mencatat setiap kali pengguna mengunduh sebuah koleksi wallpaper . c. Sistem harus dapat menghitung dan menentukan profil minat dan profil perilaku setiap pengguna berdasarkan data transaksi wallpaper yang telah diunduh. d. Sistem harus dapat membentuk matriks vektor setiap pengguna berdasarkan profil pengguna pengguna. e. Sistem harus dapat mengelompokkan setiap pengguna ke dalam cluster berdasarkan jarak masing-masing vektor matriks setiap pengguna. f. Sistem harus dapat memberikan rekomendasi koleksi wallpaper yang belum diunduh kepada pengguna dari koleksi yang sudah diunduh pengguna lain yang memiliki minat dan perilaku yang mirip dengan pengguna di dalam kelompok cluster sama. 2. Desain Hal-hal yang akan dilakukan dan diperoleh dalam tahap ini adalah : a. Membuat basis data yang akan berisikan informasi-informasi yang berkaitan dengan koleksi wallpaper. b. Membuat algoritma pencatatan yang akan mencatat setiap kali pengguna mengunduh koleksi wallpaper. c. Membuat algoritma yang akan menghitung dan menentukan profil minat dan profil perilaku setiap pengguna berdasarkan data transaksi yang telah tercatat sebelumnya. d. Membuat algoritma yang dapat menghasilkan matriks vektor pengguna berdasarkan profil minat dan profil perilaku setiap pengguna. e. Membuat algoritma clustering dengan menggunakan Euclidean Distance untuk mengelompokkan penguna berdasarkan jarak masing-masing vektor matriks pengguna. f. Membuat algoritma yang dapat memberikan rekomendasi koleksi yang belum diunduh berdasarkan koleksi yang sudah diunduh pengguna lain yang memilik profil minat dan perilaku yang sama dengan pengguna di dalam satu cluster pengguna. g. Membuat desain antarmuka pengguna yang dapat menampilkan wallpaper yang ada di dalam basis data dan informasi- informasi yang lain berkaitan dengan wallpaper tersebut serta dapat menampilkan rekomendasi koleksi untuk masing-masing pengguna. 3. Pengkodean Code Pada tahap ini akan dilakukan proses implementasi pengkodean program sesuai analisis dan perancangan yang sudah dilakukan. 4. Pengujian Test Pada tahap ini dilakukan proses pengujian dan percobaan terhadap terhadap sistem sesuai dengan spesifikasi yang ditentukan sebelumnya. Faktor yang digunakan dalam percobaan adalah nilai-nilai threshold yang digunakan dalam proses perhitungan. Hal-hal yang akan diamati selama dilakukan proses pengujian terhadap sistem yang dikembangkan: a. Jumlah cluster yang terbentuk. dokumen, layanan, dan data pada World Wide Web Etzoni 1996. Web mining merupakan bagian dari proses data mining yang khusus dilakukan pada sebuah situs web. Klasifikasi web mining dapat dibagi dalam tiga kategori Huysmans et al. 2004, yaitu:

a. Web content mining