Algoritma Decision Tree Pohon Keputusan Perhitungan Akurasi Pengenalan Data

2. Untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simple sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. 3. Bisa dijadikan sebagai tool pengambilan keputusan terakhir. 4. Mengubah keputusan yang kompleks menjadi lebih simple, spesifik dan mudah.

2.6.2 Kekurangan Decision Tree Pohon Keputusan

1. Kesulitan dalam mendesain pohon keputusan yang optimal. 2. Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan sangat tergantung pada bagaimana pohon tersebut didesain. 3. Terjadi overlap terutama ketika kelas – kelas dan kriteria yang digunakan jumlahnya sangat banyak. 4. Pengakumulasian jumlah error dari setiap tingkat dalam sebuah pohon keputusan yang besar.

2.7 Algoritma Decision Tree Pohon Keputusan

Algoritma ID3 1. Dimulai dari node akar. 2. Untuk semua fitur, hitung nilai entropy untuk semua sampel data latih pada node. 3. Pilih fitur dengan informasi gain yang maksimal. 4. Lakukan secara rekursif pada setiap cabang yang dibuat dengan mengulangi langkah 2 sampai 4 hingga semua data dalam setiap node hanya memberikan satu label kelas. Node yang tidak dapat dipecah lagi merupakan daun yang berisi keputusan label kelas.

2.8 Perhitungan Akurasi

Untuk menghitung nilai akurasi, maka digunakan rumus sebagai berikut : � � � = � ℎ_� _ � �_ � ℎ_� _ � �ℎ ∗ 100 2.3 BAB III Identifikasi Perhitungan dengan Decision Tree

3.1 Pengenalan Data

Www.inkuiri.com adalah sebuah situs pencarian yang digunakan untuk mencari beberapa barang yang diinginkan oleh pengguna. Dari query – query yang dimasukkan oleh pengguna maka data tersebut tersimpan dalam database. Ada 43 atribut yang dapat dilihat dari setiap query yang dimasukkan oleh pengguna. Dari 43 atribut tersebut akan dipilih beberapa yang dapat digunakan untuk penelitian tugas akhir ini. Data yang diperoleh dari perusahaan www.inkuiri.com berupa file spreadsheet. Kemudian data tersebut diolah dengan beberapa tahapan yang akan menghasilkan aturan – aturan untuk klasifikasi. Pada penelitian yang dilakukan ini menggunakan data yang di dapat dari www.inkuiri.com. Data yang digunakan adalah data query hasil dari pencarian kata yang dimasukkan oleh user. Atribut data mentah yang diperoleh dari perusahaan www.inkuiri.com seperti pada Tabel 3.1. Tabel 3. 1 Tabel atribut data mentah No Nama atribut Keterangan Nilai 1 took 2 timed_out 3 | 4 total 5 successful 6 failed 7 max_score 8 || 9 _index 10 _type 11 _id Atribut ini menyimpan identitas unik dari pelanggan QY62awHOTtGlVurnGd_On w 12 _score 13 _source__audience__interest Atribut ini menyimpan kategori pencarian Fashion, Smartphone, Motorbike, Talisman 14 _source__audience__econo my 15 _source__audience__age 16 _source__banner_id 17 _source__device__family 18 _source__device__name 19 _source__device__type Atribut ini menyimpan data perangkat yang digunakan untuk pencarian Personal computer, Smartphone, Tabelt 20 _source__filter__category 21 _source__filter__location Atribut ini menyimpan data lokasi dimana sedang melakukan pencarian Indonesia 22 _source__filter__period 23 _source__filter__price Atribut ini menyimpan data harga yang dicari 100000000:250000000, 250000000:500000000, 100000:1000000, 0:100000, dll 24 _source__filter__site Atribut ini menyimpan data kaskus.co.id, tokobagus.com, website yang dituju marketnesia.com, bukalapak.com, tokopedia.com, olx.co.id, berniaga.com, 25 _source__ip Atribut ini menyimpan data ip user 116.68.250.254,203.176.18 1.33, 202.67.40.50, 36.71.41.243, dll 26 _source__location__country_ code Atribut ini menyimpan data kode negara ID, EU,US, BD, SG, A1, A2, GB, CN, MO, dll 27 _source__location__country_ name Atribut ini menyimpan data nama negara Indonesia, United State, Europe, China, Anonymous Proxy, Singapore, Bangladesh, United Kingdom, Macau, dll 28 _source__location__region Atribut ini menyimpan data region negara 2, 4, 8, CA, 30, OR, 81, 10, 14, 32, 7, 11, 40, 26, 38, 22, 37, VA, dll 29 _source__location__city Atribut ini menyimpan data nama kota Surabaya, Jakarta, Denpaasar, Mountain View, Bandung, Tejgaon, Beijing, dll 30 _source__location__latlong0 01 Atribut ini menyimpan data titik koordinat 112.7508, 106.4989, 120, -97, dll 31 _source__location__latlong0 02 Atribut ini menyimpan data titik kooerdinat -7.2492, -6.3433 -5,38, dll 32 _source__page Atribut ini menyimpan data halaman yang dituju 1,2,3,4,5,6,7,8,9 33 _source__query Atribut ini menyimpan data query yang dimasukkan oleh user Lipstick, jam tangan, velg, hp android, batu bacan, dll 34 _source__profile_id Atribut ini menyimpan data profile_id 54ae4a4c2c3ee4.74521373 , 54aed5fecab629.31559420, dll 35 _source__session_id 36 _source__created Atribut ini menyimpan data waktu 1420709262000, dll 37 _source__os__family Atribut ini menyimpan data os_family Windows, Ios, Android 38 _source__os__name Atribut ini menyimpan data os_name Browser, Mobile browser 39 _source__user_agent__famil y Atribut ini menyimpan data browser yang digunakan oleh user Chrome, Chrome mobile, Firefox, Opera mini, dll 40 _source__user_agent__type 41 _source__user_agent__user_ agent 42 _source__filter__location- 43 _source__filter__category-

3.2 Pemrosesan data