2. Untuk mem-break down proses pengambilan keputusan yang kompleks
menjadi lebih simple sehingga pengambil keputusan akan lebih
menginterpretasikan solusi dari permasalahan.
3.
Bisa dijadikan sebagai tool pengambilan keputusan terakhir.
4. Mengubah keputusan yang kompleks menjadi lebih simple, spesifik dan
mudah.
2.6.2 Kekurangan Decision Tree Pohon Keputusan
1. Kesulitan dalam mendesain pohon keputusan yang optimal.
2. Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan
sangat tergantung pada bagaimana pohon tersebut didesain. 3.
Terjadi overlap terutama ketika kelas – kelas dan kriteria yang digunakan
jumlahnya sangat banyak. 4.
Pengakumulasian jumlah error dari setiap tingkat dalam sebuah pohon keputusan yang besar.
2.7 Algoritma Decision Tree Pohon Keputusan
Algoritma ID3 1.
Dimulai dari node akar. 2.
Untuk semua fitur, hitung nilai entropy untuk semua sampel data latih pada node.
3. Pilih fitur dengan informasi gain yang maksimal.
4. Lakukan secara rekursif pada setiap cabang yang dibuat dengan mengulangi
langkah 2 sampai 4 hingga semua data dalam setiap node hanya memberikan satu label kelas. Node yang tidak dapat dipecah lagi merupakan daun yang
berisi keputusan label kelas.
2.8 Perhitungan Akurasi
Untuk menghitung nilai akurasi, maka digunakan rumus sebagai berikut : � �
� = �
ℎ_� _
� �_ �
ℎ_� _
� �ℎ ∗ 100 2.3
BAB III
Identifikasi Perhitungan dengan Decision Tree
3.1 Pengenalan Data
Www.inkuiri.com adalah sebuah situs pencarian yang digunakan untuk mencari beberapa barang yang diinginkan oleh pengguna. Dari query
– query yang dimasukkan oleh pengguna maka data tersebut tersimpan dalam database.
Ada 43 atribut yang dapat dilihat dari setiap query yang dimasukkan oleh pengguna. Dari 43 atribut tersebut akan dipilih beberapa yang dapat digunakan
untuk penelitian tugas akhir ini. Data yang diperoleh dari perusahaan www.inkuiri.com berupa file spreadsheet. Kemudian data tersebut diolah dengan
beberapa tahapan yang akan menghasilkan aturan – aturan untuk klasifikasi.
Pada penelitian yang dilakukan ini menggunakan data yang di dapat dari www.inkuiri.com. Data yang digunakan adalah data query hasil dari pencarian
kata yang dimasukkan oleh user. Atribut data mentah yang diperoleh dari perusahaan www.inkuiri.com seperti pada Tabel 3.1.
Tabel 3. 1 Tabel atribut data mentah
No Nama atribut
Keterangan Nilai
1 took
2 timed_out
3 |
4 total
5 successful
6 failed
7 max_score
8 ||
9 _index
10 _type
11 _id
Atribut ini
menyimpan identitas
unik dari pelanggan
QY62awHOTtGlVurnGd_On w
12 _score
13 _source__audience__interest
Atribut ini
menyimpan kategori
pencarian Fashion,
Smartphone, Motorbike, Talisman
14 _source__audience__econo
my 15
_source__audience__age 16
_source__banner_id 17
_source__device__family 18
_source__device__name 19
_source__device__type Atribut
ini menyimpan data
perangkat yang digunakan untuk
pencarian Personal
computer, Smartphone, Tabelt
20 _source__filter__category
21 _source__filter__location
Atribut ini
menyimpan data lokasi
dimana sedang
melakukan pencarian
Indonesia
22 _source__filter__period
23 _source__filter__price
Atribut ini
menyimpan data harga yang dicari
100000000:250000000, 250000000:500000000,
100000:1000000, 0:100000, dll
24 _source__filter__site
Atribut ini
menyimpan data kaskus.co.id,
tokobagus.com,
website yang
dituju marketnesia.com,
bukalapak.com, tokopedia.com,
olx.co.id, berniaga.com,
25 _source__ip
Atribut ini
menyimpan data ip user
116.68.250.254,203.176.18 1.33, 202.67.40.50,
36.71.41.243, dll
26 _source__location__country_
code Atribut
ini menyimpan data
kode negara ID, EU,US, BD, SG, A1, A2,
GB, CN, MO, dll
27 _source__location__country_
name Atribut
ini menyimpan data
nama negara Indonesia, United State,
Europe, China, Anonymous Proxy,
Singapore, Bangladesh,
United Kingdom, Macau, dll 28
_source__location__region Atribut
ini menyimpan data
region negara 2, 4, 8, CA, 30, OR, 81, 10,
14, 32, 7, 11, 40, 26, 38, 22, 37, VA, dll
29 _source__location__city
Atribut ini
menyimpan data nama kota
Surabaya, Jakarta,
Denpaasar, Mountain View, Bandung,
Tejgaon, Beijing, dll
30 _source__location__latlong0
01 Atribut
ini menyimpan data
titik koordinat 112.7508, 106.4989,
120, -97, dll
31 _source__location__latlong0
02 Atribut
ini menyimpan data
titik kooerdinat -7.2492, -6.3433
-5,38, dll 32
_source__page Atribut
ini menyimpan data
halaman yang
dituju 1,2,3,4,5,6,7,8,9
33 _source__query
Atribut ini
menyimpan data query
yang dimasukkan oleh
user Lipstick, jam tangan, velg,
hp android, batu bacan, dll
34 _source__profile_id
Atribut ini
menyimpan data profile_id
54ae4a4c2c3ee4.74521373 ,
54aed5fecab629.31559420,
dll 35
_source__session_id 36
_source__created Atribut
ini menyimpan data
waktu 1420709262000, dll
37 _source__os__family
Atribut ini
menyimpan data os_family
Windows, Ios, Android
38 _source__os__name
Atribut ini
menyimpan data os_name
Browser, Mobile browser 39
_source__user_agent__famil y
Atribut ini
menyimpan data browser
yang digunakan oleh
user Chrome, Chrome mobile,
Firefox, Opera mini, dll
40 _source__user_agent__type
41 _source__user_agent__user_
agent 42
_source__filter__location- 43
_source__filter__category-
3.2 Pemrosesan data