Nama folder aplikasi ini adalah analisis_clickstream

59 a. Beranda Isinya hanya tentang apliasi dan petunjuk umum penggunaan aplikasi b. Olah Data Tampilannya sebagai berikut : Pada sub-menu Deskripsi Web berisi tentang keterangan suatu alamat url, misalkan http:deptan.go.id, deskripsinya adalah Website Kementerian Pertanian, form-nya seperti berikut: 60 Pada sub-menu Direktori Web user dapat menambah atau menghapus direktori suatu web: sub-menu Impor Data Log digunakan untuk memilih data log yang akan diolah: 61 sub-menu Bersihkan Data digunakan untuk membuang file dan string yang tidak digunakan dalam penelitian : sub-menu Periksa Data Log digunakan untuk memeriksa data log kemudian disimpan ke dalam dalta log bersih. 62 sub-menu Aktivitas Host digunakan untuk melihat aktifitas yang dilakukan oleh host IP Address berdasarkan runtunan waktu time series. Tombol Sinkronisasi digunakan untuk menyocokan astring aktivitas yang dilalui oleh host dengan kode node induk direktori agar runtunan aktifitasnya bisa dikodekan. sub-menu Apriori digunakan untuk menjalankan Algoritme Apriori dengan analisis basis data query. ScanPrunning diilakukan selama dua kali karena kebetulan dalam penelitian ini sampai dua kali scan hasilnya frekuensi data sangat kecil. User bebas memasukan nilai minimum support dengan berdasarkan data yang dilampirkan di bawahnya. Tombol Simpan Data Scan Pertama digunakan untuk menyimpan data ke dalam tabel itemset_1. Kemudian setelah selesai secara otomatis akan ditampilkan proses scan ke-2 dan dilakukan proses yang sama dengan menyimpan ke itemset_2. 63 sub-menu hasil digunakan untuk melihat hasil scan atau hasil dari algoritme apriori, terdiri dari hasil kandidat 1-itemset, kandidat 2-itemset, 1-itemset dan 2-itemset 64 65 66 RIWAYAT HIDUP Penulis dilahirkan di Subang pada tanggal 20 Juni 1980 sebagai anak pertama dari tiga bersaudara. Pendidikan sekolah dasar hingga menengah pertama ditempuh di Subang dan melanjutkan sekolah menengah atas di Purwakarta. Kemudian melanjutkan pendidikan sarjana di STMIK Bandung Program Studi Teknik Informatika. Setelah lulus tahun 2004 penulis mengajar di salah satu perguruan tinggi swasta di Karawang dan pada tahun 2005 diangkat menjadi Dosen PNS Kopertis Wilayah IV Jawa Barat dan Banten dipekerjakan pada STMIK Kharisma Karawang sampai sekarang. Pada tahun 2011 penulis memulai pendidikan Pascasarjana di Program Studi Ilmu Komputer Sekolah Pascasarjana IPB, Bogor. 1 1 PENDAHULUAN Latar Belakang Situs Web Website merupakan satu set halaman web yang saling berhubungan, biasanya meliputi sebuah homepage, umumnya terletak pada server yang sama, disiapkan dan dipelihara sebagai kumpulan informasi oleh perorangan, kelompok atau organisasi. Semakin hari semakin banyak pengguna yang mengakses Website, hal tersebut mengakibatkan terjadinya globalisasi informasi. Pengguna bisa dengan bebas mengunggah dan mengunduh data dalam berbagai bentuk berkas digital melalui jaringan internet sesuai dengan kemampuan dan kebutuhan informasi yang dicari. Hal utama yang melatarbelakangi penelitian ini adalah perilaku pengunjung sangat bervariasi tapi keseluruan aktifitasnya terekam semua oleh Web Server dan disimpan dalam bentuk file offline. File tersebut dikenal dengan dama file access.log atau session.log yang isinya terdiri dari data aktifitas log suatu server web. Data tersebut merupakan rekaman setiap kali pengguna melakukan perubahan proses klik clickstream terhadap link yang ada dalam halaman web, dapat dianalisis, digali mining menjadi suatu informasi bagi pengembang web dalam mengembangkan web-nya. Penggalian data data mining pada sebuah server website mengenai kontennya biasanya dilakukan oleh pengembang dan pemilik web tersebut. Secara umum ada tiga tahap penting dalam penggalian data website yang perlu dilakukan Srivastava et al. 2000, langkah pertama yaitu untuk membersihkan data sebagai iterasi awal dan mempersiapkan untuk mengambil data pola penggunaan oleh pengguna situs Web. Langkah ke dua adalah mengekstrak pola penggunaan dari data yang sudah diperoleh, dan langkah ke tiga adalah untuk membangun sebuah model prediktif didasarkan pada data yang sudah diekstrak sebelumnya. Seperti yang dilakukan oleh Montgomery et al. 1999 yang dalam penelitiannya lebih menekankan pada rute path klik yang dilakukan oleh pengguna Website dengan melakukan penambangan data mining secara real time. Kemudian Sule Gunduz dan Tamer Ozsu 2003 juga melakukan analisis Clickstream untuk mengembangkan model prediksi dengan merepresentasikan prilaku pengguna situs Web dalam bentuk pohon prilaku tree. Penelitian tersebut lebih menekankan pada penelahan data yang berkaitan dengan prilaku pengguna situs web , sehingga data rekaman prilaku pengguna situs Web tersebut dapat digunakan pihak pengembang web. Dengan memadukan analisis empiris, Tingliang Huang 2012 memanfaatkan analisis Clickstream untuk melakukan penelitian pada bidang Management Inventory dengan fokus bahasan pada manfaat penelaahan pengguna Web untuk mengelola data persediaan barang dengan menggunakan analisis empiris. Analisis Clickstream yang berkaitan dengan prilaku pengguna merupakan 2 bagian dari teknik dalam Web Usage Mining WUM, yang bisa dikembangkan sebagai Business Intelligence BI dengan melakukan klasifikasi pengguna Abdurrahman et al. 2009. Sehingga mendorong para peneliti untuk ikut berpartisipasi dalam mengembangakan perangkat lunak untuk menganalisis data clickstream. Ada yang menggunakan Pemrograman Java Dinucă 2012 dan algoritme apriori untuk mengembangkan aplikasi komputer yang bisa menggali informasi dari data clickstream. Karena besarnya data teks yang diolah dibutuhkan banyak teknik untuk mereduksi waktu pengolahan data access log, seperti menggunakan teknik komputasi paralel Wang Tong et al. 2005. Perumusan Masalah Proses pembentukan data clickstream terjadi secara kontinyu tanpa henti selama web server dinyalakan, dan semua aktifitas log direkam semua walaupun sebenarnya bisa diatur sesuai kebutuhan, sehingga data yang akan dijadikan bahan kajian akan bercampur dengan data lainnya. Dengan melihat data clickstream tersebut dapat diperoleh rumusan masalah seperti berikut: 1. Proses perekaman data clickstream dilakukan tanpa henti dalam kurun waktu pengujian tertentu, sehingga file teks yang terbentuk sangat banyak. 2. Bagaimana mengelompokan dan membersihkan data clickstream sesuai dengan kebutuhan? 3. Bagaimana memetakan file dan folder yang ada dalam website ke dalam bentuk struktur data pohon tree? Tujuan Penelitian Penelitian ini merupakan salah satu penelitian pada bidang Web Usage Mining, yang bertujuan untuk : 1. Menghasilkan data yang akurat sebagai acuan untuk mengembangkan konten Website agar pada pengembangan berikutnya bisa menjadi lebih efisien sesuai dengan kebutuhan user.. 2. Mengembangkan perangkat lunak yang dapat membantu mengelola data Clickstream menjadi data statistik yang mudah dimengerti dan bermanfaat untuk melihat tingkat frekuensi akses terhadap halaman Web. Manfaat Penelitian Hasil akhir penelitian ini diharapkan dapat bermanfaat bagi beberapa pihak terkait yaitu:

1. Pengembang Website

Dalam mengelola dan mengembangkan isi dari halaman web nya agar memudahkan user dalam melakukan navigasi. 3 2. Pihak manajemen atau pengelola suatu instansi Data statistik mengenai konten web yang dihasilkan bisa dijadikan acuan dalam mengambil kebijakan untuk pengembangan konten website institusinya.

3. Peneliti bidang Web Mining

Bisa dijadikan bahan informasi tambahan bagi para peneliti tentang implementasi Algoritme Apriori dalam menganalisis keterhubungan antar halaman Website. Ruang Lingkup Penelitian dan Bahan Penelitian Berkaitan dengan rentang waktu pelaksanaan penelitian ini, maka perlu dibatasi ruang lingkup penelitiannya supaya lebih terarah, yaitu sebagai berikut: 1. Penelitian difokuskan pada satu area Web Mining yaitu Web Usage Mining WUM. 2. Aplikasi yang dikembangkan hanya untuk melakukan proses pre-processing dan pemodelan data untuk WUM menggunakan algoritme Apriori. 3. Bahan data yang akan diolah hanya untuk data clickstream dari Apache Web Server. 4. Hasil akhirnya berupa data statistik yang bisa dijadikan acuan dalam pengembangan isi dari Website 5. Menganalisis data offline yakni bukan menganalisis data realtime secara langsung. Data berasal dari file yang diambil dari file akses log access.log yang diambil dari Web Server Departemen Pertanian Indonesia Deptan. 6. Dalam pelaksanaannya penelitian ini akan menggunakan bahan dan alat sebagai berikut: a. Data dasar adalah file access.log b. Perangkat pengolah data menggunakan satu set sistem komputer dengan menggunakan Processor Intel Atom N4501.66Ghz c. Web Server yang digunakan adalah yang berbasis Open Source yaitu Apache Web Server d. Editor teks menggunakan Open Office, Blue Fish dan Geany e. Bahasa Pemrograman bebasis Web HTML, XML, JavaScript, AJAX, PHP dan CSS f. Data Base Management System DBMS menggunakan MySql