Nama folder aplikasi ini adalah analisis_clickstream
59 a. Beranda
Isinya hanya tentang apliasi dan petunjuk umum penggunaan aplikasi b. Olah Data
Tampilannya sebagai berikut :
Pada sub-menu Deskripsi Web berisi tentang keterangan suatu alamat url, misalkan http:deptan.go.id, deskripsinya adalah Website Kementerian
Pertanian, form-nya seperti berikut:
60
Pada sub-menu Direktori Web user dapat menambah atau menghapus direktori suatu web:
sub-menu Impor Data Log digunakan untuk memilih data log yang akan diolah:
61
sub-menu Bersihkan Data digunakan untuk membuang file dan string yang tidak digunakan dalam penelitian :
sub-menu Periksa Data Log digunakan untuk memeriksa data log kemudian disimpan ke dalam dalta log bersih.
62
sub-menu Aktivitas Host digunakan untuk melihat aktifitas yang dilakukan oleh host IP Address berdasarkan runtunan waktu time series.
Tombol Sinkronisasi digunakan untuk menyocokan astring aktivitas yang dilalui oleh host dengan kode node induk direktori agar runtunan aktifitasnya
bisa dikodekan.
sub-menu Apriori digunakan untuk menjalankan Algoritme Apriori dengan analisis basis data query.
ScanPrunning diilakukan selama dua kali karena kebetulan dalam penelitian ini sampai dua kali scan hasilnya frekuensi data sangat kecil. User bebas
memasukan nilai minimum support dengan berdasarkan data yang dilampirkan di bawahnya.
Tombol Simpan Data Scan Pertama digunakan untuk menyimpan data ke dalam tabel itemset_1. Kemudian setelah selesai secara otomatis akan
ditampilkan proses scan ke-2 dan dilakukan proses yang sama dengan menyimpan ke itemset_2.
63
sub-menu hasil digunakan untuk melihat hasil scan atau hasil dari algoritme apriori, terdiri dari hasil kandidat 1-itemset, kandidat 2-itemset, 1-itemset
dan 2-itemset
64
65
66
RIWAYAT HIDUP
Penulis dilahirkan di Subang pada tanggal 20 Juni 1980 sebagai anak pertama dari tiga bersaudara. Pendidikan sekolah dasar hingga menengah pertama
ditempuh di Subang dan melanjutkan sekolah menengah atas di Purwakarta. Kemudian melanjutkan pendidikan sarjana di STMIK Bandung Program Studi
Teknik Informatika. Setelah lulus tahun 2004 penulis mengajar di salah satu perguruan tinggi swasta di Karawang dan pada tahun 2005 diangkat menjadi
Dosen PNS Kopertis Wilayah IV Jawa Barat dan Banten dipekerjakan pada STMIK Kharisma Karawang sampai sekarang. Pada tahun 2011 penulis memulai
pendidikan Pascasarjana di Program Studi Ilmu Komputer Sekolah Pascasarjana IPB, Bogor.
1
1 PENDAHULUAN
Latar Belakang
Situs Web Website merupakan satu set halaman web yang saling berhubungan, biasanya meliputi sebuah homepage, umumnya terletak pada server
yang sama, disiapkan dan dipelihara sebagai kumpulan informasi oleh perorangan, kelompok atau organisasi. Semakin hari semakin banyak pengguna yang
mengakses Website, hal tersebut mengakibatkan terjadinya globalisasi informasi. Pengguna bisa dengan bebas mengunggah dan mengunduh data dalam berbagai
bentuk berkas digital melalui jaringan internet sesuai dengan kemampuan dan kebutuhan informasi yang dicari.
Hal utama yang melatarbelakangi penelitian ini adalah perilaku pengunjung sangat bervariasi tapi keseluruan aktifitasnya terekam semua oleh Web Server dan
disimpan dalam bentuk file offline. File tersebut dikenal dengan dama file access.log
atau session.log yang isinya terdiri dari data aktifitas log suatu server web. Data tersebut merupakan rekaman setiap kali pengguna melakukan
perubahan proses klik clickstream terhadap link yang ada dalam halaman web, dapat dianalisis, digali mining menjadi suatu informasi bagi pengembang web
dalam mengembangkan web-nya.
Penggalian data data mining pada sebuah server website mengenai kontennya biasanya dilakukan oleh pengembang dan pemilik web tersebut. Secara
umum ada tiga tahap penting dalam penggalian data website yang perlu dilakukan Srivastava et al. 2000, langkah pertama yaitu untuk membersihkan data sebagai
iterasi awal dan mempersiapkan untuk mengambil data pola penggunaan oleh pengguna situs Web. Langkah ke dua adalah mengekstrak pola penggunaan dari
data yang sudah diperoleh, dan langkah ke tiga adalah untuk membangun sebuah model prediktif didasarkan pada data yang sudah diekstrak sebelumnya. Seperti
yang dilakukan oleh Montgomery et al. 1999 yang dalam penelitiannya lebih menekankan pada rute path klik yang dilakukan oleh pengguna Website dengan
melakukan penambangan data mining secara real time. Kemudian Sule Gunduz dan Tamer Ozsu 2003 juga melakukan analisis Clickstream untuk
mengembangkan model prediksi dengan merepresentasikan prilaku pengguna situs Web dalam bentuk pohon prilaku tree. Penelitian tersebut lebih
menekankan pada penelahan data yang berkaitan dengan prilaku pengguna situs web
, sehingga data rekaman prilaku pengguna situs Web tersebut dapat digunakan pihak pengembang web.
Dengan memadukan analisis empiris, Tingliang Huang 2012 memanfaatkan analisis Clickstream untuk melakukan penelitian pada bidang
Management Inventory dengan fokus bahasan pada manfaat penelaahan pengguna
Web untuk mengelola data persediaan barang dengan menggunakan analisis empiris.
Analisis Clickstream yang berkaitan dengan prilaku pengguna merupakan
2 bagian dari teknik dalam Web Usage Mining WUM, yang bisa dikembangkan
sebagai Business Intelligence BI dengan melakukan klasifikasi pengguna Abdurrahman et al. 2009. Sehingga mendorong para peneliti untuk ikut
berpartisipasi dalam mengembangakan perangkat lunak untuk menganalisis data clickstream.
Ada yang menggunakan Pemrograman Java Dinucă 2012 dan algoritme apriori untuk mengembangkan aplikasi komputer yang bisa menggali
informasi dari data clickstream. Karena besarnya data teks yang diolah dibutuhkan banyak teknik untuk mereduksi waktu pengolahan data access log, seperti
menggunakan teknik komputasi paralel Wang Tong et al. 2005.
Perumusan Masalah Proses pembentukan data clickstream terjadi secara kontinyu tanpa henti
selama web server dinyalakan, dan semua aktifitas log direkam semua walaupun sebenarnya bisa diatur sesuai kebutuhan, sehingga data yang akan dijadikan bahan
kajian akan bercampur dengan data lainnya. Dengan melihat data clickstream tersebut dapat diperoleh rumusan masalah seperti berikut:
1. Proses perekaman data clickstream dilakukan tanpa henti dalam kurun waktu
pengujian tertentu, sehingga file teks yang terbentuk sangat banyak. 2. Bagaimana mengelompokan dan membersihkan data clickstream sesuai
dengan kebutuhan? 3. Bagaimana memetakan file dan folder yang ada dalam website ke dalam
bentuk struktur data pohon tree?
Tujuan Penelitian Penelitian ini merupakan salah satu penelitian pada bidang Web Usage
Mining, yang bertujuan untuk :
1. Menghasilkan data yang akurat sebagai acuan untuk mengembangkan
konten Website agar pada pengembangan berikutnya bisa menjadi lebih efisien sesuai dengan kebutuhan user..
2. Mengembangkan perangkat lunak yang dapat membantu mengelola data
Clickstream menjadi data statistik yang mudah dimengerti dan bermanfaat
untuk melihat tingkat frekuensi akses terhadap halaman Web.
Manfaat Penelitian Hasil akhir penelitian ini diharapkan dapat bermanfaat bagi beberapa pihak
terkait yaitu: