12
b. Konversi ke file .csv Comma Separated Value
Agar data bisa diolah lebih fleksibel, maka diubah terlebih dahulu ke dalam bentuk .csv, karena dari format csv bisa dikonversi kebentuk lain, seperti format
sql atau spreadsheet.
Gambar 4. Ilustrasi Proses konversi ke file csv c.
Membersihkan data Pada tahapan ini dilakukan proses pembuangan string atau variabel yang
tidak dibutuhkan dalam penelitian, hal ini sangat diperlukan karena data yang dianalisis merupakan data string yang cukup besar, sehingga apabila variabel yang
tidak dibutuhkan dibuang maka waktu untuk pemrosesan data bisa lebih efisien. Data yang akan dibersihkan merupakan data log yang sudah dipecah dan sudah
dalam bentuk csv. Karkteristik dari file csv adalah hanya memiliki satu string pemisah sparator dan satu string penutup tiap fields.
Contoh baris data yang belum bersih :
string= 66.249.73.7 04Nov2012:04:11:40] GET wapindex.php? option=component HTTP1.1
Seanjutnya apabila dengan kode PHP kita akan memisahkan string diatas berdasarkan sparator spasi kosong maka kodenya seperti berikut :
data = str_getcsvstring , ;
Artinya data string akan dipisahkan dengan spasi kosong menjadi array data berikut ini:
1 2
3 4
66.249.73. 7
04Nov2012:04:11:40] GET wapindex.php? option=component
HTTP1.1
Akan tetapi yang akan jadi masalah adalah pada indek yang ke3 yaitu data[3] =
wapindex.php?option=component,
yaitu adanya tanda petik ganda dan hal ini akan menyebabkan intruksi str_ getcsv menolaknya karena tanda petik ganda
dan tanda petik adalah default penutup enclosed fields dari file csv. Oleh karena itu maka perlu dilakukan pembersihan tanda petik ganda dan tanda petik
sebelum dimuat ke dalam database.
access.log access.log_1
access.log_2 access.log_3
access.log_1.csv access.log_2.csv
access.log_3.csv
13 Selain berdasarkan tanda petik di atas, data log juga dibersihkan berdasarkan
kelompok atau tipe dari berkas file sebagai berikut:
Tabel 3. Pengelompokan data log dan penggunaannya
No Jenis berkas Keterangan
Penggunaan
1 .css teks
Cascading Style Sheet, merupakan kelompok file untuk mempercantik tampilan halaman web.
diabaikan 2
.js teks Javascript, merupakan client side script
yang berfungsi untuk membuat halaman web lebih interaktif,
contohnya untuk membuat fungsi zoom gambar atau mesagebox ketika mau menghapus email.
diabaikan
3 .xml teks
eXtensible Markup Language, merupakan berkas atau bahasa untuk mengatur struktur data web dalam
susunan tag yang independen. diabaikan
4 .bmp
gambar Bitmap, merupakan file gambar yang sering disertakan
dalam halaman web diabaikan
5 .gif gambar Graphics Interchange Format, merupakan file gambar
yang sering disertakan dalam halaman web diabaikan
6 .jpg gambar Join Photographis, merupakan file gambar yang sering
disertakan dalam halaman web diabaikan
7 .png
gambar Portable Network Graphics, merupakan file gambar
yang sering disertakan dalam halaman web diabaikan
8 .odt.doc
teks Open Document Text Document, merupakan file
dokumen teks words. digunakan
9 .ods.xls
teks Open Document Sheet Excels, merupakan file sheet
Spread sheet. digunakan
10 .pdf teks Portable Data Format, merupakan file teks portable
yang biasanya readonly. digunakan
11 .mp3 audio Media Player 3, file audio untuk melengkapi halaman web
diabaikan 12 .mp4.mpeg
.video Media Player 4 Media Player Expert Graphics, file
video untuk melengkapi halaman web diabaikan
13 .swf multimedia
Flash file, merupakan berkas audio video biasanya dalam bentuk animasi
diabaikan 14 .jsp teks
Java Server Page, merupakan Server Side Script untuk mengembangkan Website.
digunakan
15 .asp teks Active Server Page, merupakan Server Side Script
untuk mengembangkan Website. digunakan
16 .html teks Hypertext Markup Language, merupakan Client Side
Script untuk mengembangkan Website. digunakan
17 .php teks PHP Hypertext Preprocessor, merupakan Server Side
Script untuk mengembangkan Website. digunakan