Memecah data log Memilih data Log

12

b. Konversi ke file .csv Comma Separated Value

Agar data bisa diolah lebih fleksibel, maka diubah terlebih dahulu ke dalam bentuk .csv, karena dari format csv bisa dikonversi kebentuk lain, seperti format sql atau spreadsheet. Gambar 4. Ilustrasi Proses konversi ke file csv c. Membersihkan data Pada tahapan ini dilakukan proses pembuangan string atau variabel yang tidak dibutuhkan dalam penelitian, hal ini sangat diperlukan karena data yang dianalisis merupakan data string yang cukup besar, sehingga apabila variabel yang tidak dibutuhkan dibuang maka waktu untuk pemrosesan data bisa lebih efisien. Data yang akan dibersihkan merupakan data log yang sudah dipecah dan sudah dalam bentuk csv. Karkteristik dari file csv adalah hanya memiliki satu string pemisah sparator dan satu string penutup tiap fields. Contoh baris data yang belum bersih : string= 66.249.73.7 04Nov2012:04:11:40] GET wapindex.php? option=component HTTP1.1 Seanjutnya apabila dengan kode PHP kita akan memisahkan string diatas berdasarkan sparator spasi kosong maka kodenya seperti berikut : data = str_getcsvstring , ; Artinya data string akan dipisahkan dengan spasi kosong menjadi array data berikut ini: 1 2 3 4 66.249.73. 7 04Nov2012:04:11:40] GET wapindex.php? option=component HTTP1.1 Akan tetapi yang akan jadi masalah adalah pada indek yang ke­3 yaitu data[3] = wapindex.php?option=component, yaitu adanya tanda petik ganda dan hal ini akan menyebabkan intruksi str_ getcsv menolaknya karena tanda petik ganda dan tanda petik adalah default penutup enclosed fields dari file csv. Oleh karena itu maka perlu dilakukan pembersihan tanda petik ganda dan tanda petik sebelum dimuat ke dalam database. access.log access.log_1 access.log_2 access.log_3 access.log_1.csv access.log_2.csv access.log_3.csv 13 Selain berdasarkan tanda petik di atas, data log juga dibersihkan berdasarkan kelompok atau tipe dari berkas file sebagai berikut: Tabel 3. Pengelompokan data log dan penggunaannya No Jenis berkas Keterangan Penggunaan 1 .css teks Cascading Style Sheet, merupakan kelompok file untuk mempercantik tampilan halaman web. diabaikan 2 .js teks Javascript, merupakan client side script yang berfungsi untuk membuat halaman web lebih interaktif, contohnya untuk membuat fungsi zoom gambar atau mesagebox ketika mau menghapus email. diabaikan 3 .xml teks eXtensible Markup Language, merupakan berkas atau bahasa untuk mengatur struktur data web dalam susunan tag yang independen. diabaikan 4 .bmp gambar Bitmap, merupakan file gambar yang sering disertakan dalam halaman web diabaikan 5 .gif gambar Graphics Interchange Format, merupakan file gambar yang sering disertakan dalam halaman web diabaikan 6 .jpg gambar Join Photographis, merupakan file gambar yang sering disertakan dalam halaman web diabaikan 7 .png gambar Portable Network Graphics, merupakan file gambar yang sering disertakan dalam halaman web diabaikan 8 .odt.doc teks Open Document Text Document, merupakan file dokumen teks words. digunakan 9 .ods.xls teks Open Document Sheet Excels, merupakan file sheet Spread sheet. digunakan 10 .pdf teks Portable Data Format, merupakan file teks portable yang biasanya readonly. digunakan 11 .mp3 audio Media Player 3, file audio untuk melengkapi halaman web diabaikan 12 .mp4.mpeg .video Media Player 4 Media Player Expert Graphics, file video untuk melengkapi halaman web diabaikan 13 .swf multimedia Flash file, merupakan berkas audio video biasanya dalam bentuk animasi diabaikan 14 .jsp teks Java Server Page, merupakan Server Side Script untuk mengembangkan Website. digunakan 15 .asp teks Active Server Page, merupakan Server Side Script untuk mengembangkan Website. digunakan 16 .html teks Hypertext Markup Language, merupakan Client Side Script untuk mengembangkan Website. digunakan 17 .php teks PHP Hypertext Preprocessor, merupakan Server Side Script untuk mengembangkan Website. digunakan