BAB IV
IMPLEMENTASI SISTEM
4.1 Spesifikasi Perangkat Keras dan Perangkat Lunak
Spesifikasi perangkat lunak yang digunakan dalam implementasi sistem adalah :
1. Sistem Operasi : Microsoft Windows 7 Ultimate
2. Bahasa pemrograman : Java Netbeans IDE 7.3
Spesifikasi perangkat keras yang digunakan dalam implementasi sistem adalah :
1. Processor : Intel Atom N570, 1.66 GHz
2. Memory : 2 GB DDR3
3. Harddisk : 320 GB
4.2 Implementasi Pemrosesan Data
4.2.1 Pembersihan Data
Data mentah yang diperoleh dari hasil query adalah sebanyak 450 data. Dalam satu data record query terdapat 43 atribut. Dari 43 atribut, yang
digunakan untuk penelitian ini 4 atribut yaitu : _source_audience_interest, _source_device_type, _source_location_city dan _source_created_.Contoh
data yang sudah dilakukan pembersihan seperti pada Tabel 4.1. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 4. 1 Contoh data yang sudah dilakukan pembersihan
_source__audience _interest
_source_device _type
_source _location
_city _source
_created Fashion
Personal computer Surabaya
1.42071E+12 Fashion
Smartphone Jakarta
1.42071E+12 Fashion
Personal computer Surabaya
1.42071E+12 Motorbike
Tabelt Depok
1.42074E+12 Motorbike
Smartphone Jakarta
1.42074E+12 Motorbike
Smartphone Jakarta
1.42074E+12 Smartphone
Smartphone Jakarta
1.42071E+12 Smartphone
Tabelt Jakarta
1.42071E+12 Smartphone
Tabelt Jakarta
1.42071E+12 Talisman
Smartphone Surabaya
1.4207E+12 Talisman
Smartphone Jakarta
1.42071E+12 Talisman
Personal computer Jakarta
1.42071E+12
4.2.2 Integrasi Data
Contoh file yang belum digabungkan dari file kategori fashionseperti pada Tabel 4.2.
Tabel 4. 2 Contoh file dari kategori fashion
_source__audience _source_device
_source _source
_interest _type
_location _created
_city Fashion
Personal computer
Surabaya 1.42E+12
Fashion Smartphone
Jakarta 1.42E+12
Fashion Personal
computer Surabaya
1.42E+12
Contoh file yang belum digabungkan dari file kategori smartphone seperti pada Tabel 4.3.
Tabel 4. 3 Contoh file dari kategori smartphone
_source__audience _source_device
_source _source
_interest _type
_location _created
_city Smartphone
Smartphone Jakarta
1.42E+12 Smartphone
Tabelt Jakarta
1.42E+12 Smartphone
Tabelt Jakarta
1.42E+12
Contoh file yang belum digabungkan dari file kategori motorbike seperti pada Tabel 4.4.
Tabel 4. 4 Contoh file dari kategori motorbike
_source__audience _source_device
_source _source
_interest _type
_location _created
_city Motorbike
Tabelt Depok
1.42E+12 Motorbike
Smartphone Jakarta
1.42E+12 Motorbike
Smartphone Jakarta
1.42E+12
Contoh file yang belum digabungkan dari file kategori talisman seperti pada Tabel 4.5.
Tabel 4. 5 Contoh file dari kategori talisman
_source__audience _source_device
_source _source
_interest _type
_location _created
_city Talisman
Smartphone Surabaya
1.42E+12 Talisman
Smartphone Jakarta
1.42E+12 Talisman
Personal computer
Jakarta 1.42E+12
Contoh file yang telah digabungkan dari 4 kategori seperti pada Tabel 4.6.
Tabel 4. 6 Contoh file yang telah digabungkan
_source__audience _interest
_source_device _type
_source _location
_city _source
_created Fashion
Personal computer Surabaya
1.42071E+12 Fashion
Smartphone Jakarta
1.42071E+12 Fashion
Personal computer Surabaya
1.42071E+12 Motorbike
Tabelt Depok
1.42074E+12 Motorbike
Smartphone Jakarta
1.42074E+12 Motorbike
Smartphone Jakarta
1.42074E+12 Smartphone
Smartphone Jakarta
1.42071E+12 Smartphone
Tabelt Jakarta
1.42071E+12 Smartphone
Tabelt Jakarta
1.42071E+12 Talisman
Smartphone Surabaya
1.4207E+12 Talisman
Smartphone Jakarta
1.42071E+12 Talisman
Personal computer Jakarta
1.42071E+12
4.2.3 Penyeleksian Data
Dari 43 atribut yang didapat kemudian dilakukan penyeleksian atribut yang bisa digunakan untuk penelitian ini. Atribut
– atribut asli yang belum
dilakukan seleksi seperti pada Tabel 4.7. Tabel 4. 7 Nama
– nama atribut yang belum diseleksi
No Nama atribut
1 took 2 timed_out
3 | 4 total
5 successful 6 failed
7 max_score 8 ||
9 _index 10 _type
11 _id 12 _score
13 _source__audience__interest 14 _source__audience__economy
15 _source__audience__age 16 _source__banner_id
17 _source__device__family 18 _source__device__name
19 _source__device__type 20 _source__filter__category
21 _source__filter__location 22 _source__filter__period
23 _source__filter__price 24 _source__filter__site
25 _source__ip 26 _source__location__country_code
27 _source__location__country_name 28 _source__location__region
29 _source__location__city 30 _source__location__latlong001
31 _source__location__latlong002 32 _source__page
33 _source__query 34 _source__profile_id
35 _source__session_id 36 _source__created
37 _source__os__family 38 _source__os__name
39 _source__user_agent__family 40 _source__user_agent__type
41 _source__user_agent__user_agent 42 _source__filter__location-
43 _source__filter__category-
Atribut yang sudah dilakukan seleksi seperti pada Tabel 4.8.
Tabel 4. 8 Hasil nama atribut yang telah diseleksi
_source__audience _source_device _source
_source _interest
_type _location
_created _city
4.2.4 Transformasi Data
Pada tahap ini data yang ditransformasi adalah data dari atribut _source_created. Pertama, data asli dibagi dengan 1000, berikut adalah contoh
transformasinya, seperti pada Tabel 4.9. Hasil1 =
1.42071E+12 1000
Tabel 4. 9 Contoh perhitungan waktu yang pertama
_source__created Hasil1
1.42071E+12 1420709258 1.42071E+12 1420709262
1.42071E+12 1420709283 1.42071E+12 1420709488
1.42071E+12 1420709579
Kedua, hasil yang telah dibagi dengan 1000 selanjutnya dihitung lagi dan didapat hasil seperti pada Tabel 4.10.
Hasil2 = 1420709258 86400+25569
Tabel 4. 10 Contoh perhitungan waktu yang kedua
Setelah di dapat hasil seperti di atas maka hasil2 dipecah menjadi waktu dan bulan dengan aturan yang ada pada tabel 3.2.
4.2.5 Penambangan Data
Penambangan Data pada tahap ini adalah melakukan perhitungan data sebagai berikut :
_source__created Hasil1
Hasil 2 1.42071E+12 1420709258
1815 9:27 1.42071E+12 1420709262
1815 9:27 1.42071E+12 1420709283
1815 9:28 1.42071E+12 1420709488
1815 9:31 1.42071E+12 1420709579
1815 9:32
a. Menghitung nilai entropy