Spesifikasi Perangkat Keras dan Perangkat Lunak Implementasi Pemrosesan Data

BAB IV IMPLEMENTASI SISTEM

4.1 Spesifikasi Perangkat Keras dan Perangkat Lunak

Spesifikasi perangkat lunak yang digunakan dalam implementasi sistem adalah : 1. Sistem Operasi : Microsoft Windows 7 Ultimate 2. Bahasa pemrograman : Java Netbeans IDE 7.3 Spesifikasi perangkat keras yang digunakan dalam implementasi sistem adalah : 1. Processor : Intel Atom N570, 1.66 GHz 2. Memory : 2 GB DDR3 3. Harddisk : 320 GB

4.2 Implementasi Pemrosesan Data

4.2.1 Pembersihan Data

Data mentah yang diperoleh dari hasil query adalah sebanyak 450 data. Dalam satu data record query terdapat 43 atribut. Dari 43 atribut, yang digunakan untuk penelitian ini 4 atribut yaitu : _source_audience_interest, _source_device_type, _source_location_city dan _source_created_.Contoh data yang sudah dilakukan pembersihan seperti pada Tabel 4.1. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Tabel 4. 1 Contoh data yang sudah dilakukan pembersihan _source__audience _interest _source_device _type _source _location _city _source _created Fashion Personal computer Surabaya 1.42071E+12 Fashion Smartphone Jakarta 1.42071E+12 Fashion Personal computer Surabaya 1.42071E+12 Motorbike Tabelt Depok 1.42074E+12 Motorbike Smartphone Jakarta 1.42074E+12 Motorbike Smartphone Jakarta 1.42074E+12 Smartphone Smartphone Jakarta 1.42071E+12 Smartphone Tabelt Jakarta 1.42071E+12 Smartphone Tabelt Jakarta 1.42071E+12 Talisman Smartphone Surabaya 1.4207E+12 Talisman Smartphone Jakarta 1.42071E+12 Talisman Personal computer Jakarta 1.42071E+12

4.2.2 Integrasi Data

Contoh file yang belum digabungkan dari file kategori fashionseperti pada Tabel 4.2. Tabel 4. 2 Contoh file dari kategori fashion _source__audience _source_device _source _source _interest _type _location _created _city Fashion Personal computer Surabaya 1.42E+12 Fashion Smartphone Jakarta 1.42E+12 Fashion Personal computer Surabaya 1.42E+12 Contoh file yang belum digabungkan dari file kategori smartphone seperti pada Tabel 4.3. Tabel 4. 3 Contoh file dari kategori smartphone _source__audience _source_device _source _source _interest _type _location _created _city Smartphone Smartphone Jakarta 1.42E+12 Smartphone Tabelt Jakarta 1.42E+12 Smartphone Tabelt Jakarta 1.42E+12 Contoh file yang belum digabungkan dari file kategori motorbike seperti pada Tabel 4.4. Tabel 4. 4 Contoh file dari kategori motorbike _source__audience _source_device _source _source _interest _type _location _created _city Motorbike Tabelt Depok 1.42E+12 Motorbike Smartphone Jakarta 1.42E+12 Motorbike Smartphone Jakarta 1.42E+12 Contoh file yang belum digabungkan dari file kategori talisman seperti pada Tabel 4.5. Tabel 4. 5 Contoh file dari kategori talisman _source__audience _source_device _source _source _interest _type _location _created _city Talisman Smartphone Surabaya 1.42E+12 Talisman Smartphone Jakarta 1.42E+12 Talisman Personal computer Jakarta 1.42E+12 Contoh file yang telah digabungkan dari 4 kategori seperti pada Tabel 4.6. Tabel 4. 6 Contoh file yang telah digabungkan _source__audience _interest _source_device _type _source _location _city _source _created Fashion Personal computer Surabaya 1.42071E+12 Fashion Smartphone Jakarta 1.42071E+12 Fashion Personal computer Surabaya 1.42071E+12 Motorbike Tabelt Depok 1.42074E+12 Motorbike Smartphone Jakarta 1.42074E+12 Motorbike Smartphone Jakarta 1.42074E+12 Smartphone Smartphone Jakarta 1.42071E+12 Smartphone Tabelt Jakarta 1.42071E+12 Smartphone Tabelt Jakarta 1.42071E+12 Talisman Smartphone Surabaya 1.4207E+12 Talisman Smartphone Jakarta 1.42071E+12 Talisman Personal computer Jakarta 1.42071E+12

4.2.3 Penyeleksian Data

Dari 43 atribut yang didapat kemudian dilakukan penyeleksian atribut yang bisa digunakan untuk penelitian ini. Atribut – atribut asli yang belum dilakukan seleksi seperti pada Tabel 4.7. Tabel 4. 7 Nama – nama atribut yang belum diseleksi No Nama atribut 1 took 2 timed_out 3 | 4 total 5 successful 6 failed 7 max_score 8 || 9 _index 10 _type 11 _id 12 _score 13 _source__audience__interest 14 _source__audience__economy 15 _source__audience__age 16 _source__banner_id 17 _source__device__family 18 _source__device__name 19 _source__device__type 20 _source__filter__category 21 _source__filter__location 22 _source__filter__period 23 _source__filter__price 24 _source__filter__site 25 _source__ip 26 _source__location__country_code 27 _source__location__country_name 28 _source__location__region 29 _source__location__city 30 _source__location__latlong001 31 _source__location__latlong002 32 _source__page 33 _source__query 34 _source__profile_id 35 _source__session_id 36 _source__created 37 _source__os__family 38 _source__os__name 39 _source__user_agent__family 40 _source__user_agent__type 41 _source__user_agent__user_agent 42 _source__filter__location- 43 _source__filter__category- Atribut yang sudah dilakukan seleksi seperti pada Tabel 4.8. Tabel 4. 8 Hasil nama atribut yang telah diseleksi _source__audience _source_device _source _source _interest _type _location _created _city

4.2.4 Transformasi Data

Pada tahap ini data yang ditransformasi adalah data dari atribut _source_created. Pertama, data asli dibagi dengan 1000, berikut adalah contoh transformasinya, seperti pada Tabel 4.9. Hasil1 = 1.42071E+12 1000 Tabel 4. 9 Contoh perhitungan waktu yang pertama _source__created Hasil1 1.42071E+12 1420709258 1.42071E+12 1420709262 1.42071E+12 1420709283 1.42071E+12 1420709488 1.42071E+12 1420709579 Kedua, hasil yang telah dibagi dengan 1000 selanjutnya dihitung lagi dan didapat hasil seperti pada Tabel 4.10. Hasil2 = 1420709258 86400+25569 Tabel 4. 10 Contoh perhitungan waktu yang kedua Setelah di dapat hasil seperti di atas maka hasil2 dipecah menjadi waktu dan bulan dengan aturan yang ada pada tabel 3.2.

4.2.5 Penambangan Data

Penambangan Data pada tahap ini adalah melakukan perhitungan data sebagai berikut : _source__created Hasil1 Hasil 2 1.42071E+12 1420709258 1815 9:27 1.42071E+12 1420709262 1815 9:27 1.42071E+12 1420709283 1815 9:28 1.42071E+12 1420709488 1815 9:31 1.42071E+12 1420709579 1815 9:32

a. Menghitung nilai entropy