3.6 Contoh Proses Perhitungan Data
Data yang digunakan dalam penelitian ini adalah data dari sebuah situs www.inkuiri.com. Dalam paparan di bawah ini digunakan data berjumlah 40,
yang terdiri dari 4 kategori yaitu :fashion, smartphone, motorbike dan talisman.
Contoh data yang akan diolah seperti pada Tabel 3.4. Tabel 3. 4 Tabel data yang akan diolah
Interest type
city waktu
bulan
Fashion Personal computer
Surabaya siang
awal Fashion
Smartphone Jakarta
siang awal
Fashion Personal computer
Surabaya siang
awal Fashion
Personal computer Denpasar
siang awal
Fashion Personal computer
Jakarta siang
awal Fashion
Smartphone Mountain View
siang awal
Fashion Smartphone
Jakarta siang
awal Fashion
Personal computer Jakarta
pagi awal
Fashion Personal computer
Jakarta pagi
awal Fashion
Personal computer Jakarta
pagi awal
Smartphone Smartphone
Jakarta siang
awal
4. Pengguna menekan tombol
Pengujian.
5. Sistem menampilkan hasil pengujian data.
Smartphone Tabelt
Jakarta siang
awal Smartphone
Tabelt Jakarta
siang awal
Smartphone Smartphone
Jakarta siang
tengah Smartphone
Smartphone Jakarta
siang tengah
Smartphone Personal computer
Pekanbaru siang
akhir Smartphone
Personal computer Kudus
siang akhir
Smartphone Personal computer
Pekanbaru siang
akhir Smartphone
Smartphone San Mateo
malam akhir
Smartphone Personal computer
Surabaya malam
akhir Motorbike
Tabelt Depok
malam awal
Motorbike Tabelt
Depok malam
awal Motorbike
Tabelt Depok
malam awal
Motorbike Smartphone
Jakarta malam
awal Motorbike
Smartphone Jakarta
malam tengah
Motorbike Smartphone
Jakarta malam
tengah Motorbike
Smartphone Jakarta
malam tengah
Motorbike Smartphone
Jakarta malam
akhir Motorbike
Smartphone Jakarta
malam akhir
Motorbike Smartphone
Jakarta malam
akhir Talisman
Personal computer Surabaya
pagi awal
Talisman Personal computer
Jakarta pagi
awal Talisman
Personal computer Jakarta
pagi awal
Talisman Personal computer
Surabaya pagi
awal Talisman
Personal computer Denpasar
pagi awal
Talisman Smartphone
Denpasar pagi
tengah Talisman
Smartphone Denpasar
siang tengah
Talisman Smartphone
Surabaya siang
tengah Talisman
Smartphone Surabaya
siang akhir
Talisman Smartphone
Jakarta siang
akhir
Setelah memperoleh data seperti di atas, selanjutnya data dikelompokkan berdasarkan nilai dalam setiap atribut seperti pada Tabel 3.5.
Tabel 3. 5 Tabel pengelompokkan data dari setiap atribut
Nama atribut
Keterangan Jumlah dalam kategori
Total Fashion
Smartphone Motorbike
Talisman Interest
TOTAL 10
10 10
10 40
type Personal
Computer 7
4 5
17 Smartphone
3 4
7 5
19 Tabelt
2 3
5
city Surabaya
1 1
4 6
Jakarta 6
5 7
3 21
Denpasar 2
3 5
Mountain View
1 1
2 Pekanbaru
2 2
Kudus 1
1 San Mateo
1 1
Depok 3
3
waktu pagi
3 6
9 siang
7 8
4 19
malam 2
10 12
bulan awal
10 3
4 5
22 tengah
2 3
3 8
akhir 5
3 2
10
Setelah data dikelompokan, untuk mengetahui node pertama terlebih dulu hitung nilai entropy dari setiap atribut berdasarkan data yang telah dikelompokan
dengan menggunakan Persamaan 2.2. Entropysemua = - p fashion|semua x log
2
p fashion|semua + p smartphone|semua xlog
2
p smarthphone|semua + p motorbike|semua x log
2
p motorbike|semua + p talisman|semua x log
2
p talisman|semua = - 1040 x log
2
1040 + 1040 x log
2
1040 + 1040 x log
2
1040 + 1040 x log
2
1040= 2 Setelah mendapatkan nilai entropy dan nilaigain dari semua data maka
selanjutnya dihitung nilai entopry untuk setiap atribut yang ada. Hasil nilai gain yang paling besar akan dijadikan sebagai node akar. Hasil perhitungan nilai
entropy dari semua atribut dapat dilihat pada Tabel 3.6.
Tabel 3. 6 Tabel perhitungan nilai entropy semua atribut
Node Jumlah
F S
M T
Entropy Gain 1
Total 40
10 10
10 10
2 type
0.345 Personal
16 7
4 5
1.545
computer Smartphone 19
3 4
7 5
1.93 Tabelt
5 2
3 0.969
city 0.629
Surabaya 6
1 1
4 1.248
Jakarta 21
6 5
7 3
1.93 Denpasar
5 2
3 0.969
Mountain View
2 1
1 1
Pekanbaru 2
2 Kudus
1 1
San Mateo 1
1 Depok
3 3
waktu 0.882
pagi 9
3 6
0.918 siang
19 7
8 4
1.517 malam
12 2
10 0.64
bulan 0.313
awal 22
10 3
4 5
1.829 tengah
8 2
3 3
1,562 akhir
10 5
3 2
1.483
Berdasarkan hasil perhitungan di atas nilai gain tertinggi ada pada atribut waktu. Maka, atribut waktu dijadikan sebagai node akar. Untuk cabangnya
digunakan 3 nilai di dalam node akar, yaitu „siang‟, „pagi‟, dan „malam‟.Dan terbentuk pohon awal seperti Gambar 3.3.
waktu
? ?
?
pagi siang
malam
Gambar 3. 3 Bentuk awal pohon dengan gain tertinggi waktu
Dalam perhitungan entropy dan gain berikutnya, atribut waktu tidak dilibatkan. Lakukan pengelompokkan kembali untuk node internal di cabang
malam, sehingga di dapat hasil seperti Tabel 3.7.
Tabel 3. 7 Perhitungan data pada cabang malam
Node Jumlah
F S
M T
Entropy Gain
2 Total
12 2
10 0.64
type 0.278
Personal computer
1 1
Smartphone 8 1
7 0.543
Tabelt 3
3 city
0.64 Surabaya
1 1
Jakarta 7
7 Denpasar
Mountain View
Pekanbaru
Kudus San Mateo
1 1
Depok 3
3 bulan
0.102 awal
4 4
tengah 3
3 akhir
5 2
3 0.969
Berdasarkan hasil perhitungan di atas nilai gain tertinggi ada pada atribut city. Maka, atribut city dijadikan sebagai node akar pada cabang malam. Untuk
cabangnya digunakan 4 nilai didalam node akar, yaitu „San Mateo‟, „Surabaya‟,
„Depok‟ dan „Jakarta‟. Lakukan juga klasifikasi pada tiap cabang yang ada. Dan pohon yang terbentuk seperti Gambar 3.4.
waktu
? city
? pagi
siang malam
San Mateo Surabaya
Depok Jakarta
Smartphone Smartphone Motorbike
Motorbike
Gambar 3. 4 Pembentukkan pohon untuk cabang malam
Lakukan pengelompokkan kembali untuk node internal di cabang pagi, sehingga di dapat hasil seperti Tabel 3.8.
Tabel 3. 8 Perhitungan data pada cabang pagi
Node Jumlah
F S
M T
Entropy Gain 3
Total 9
3 6
0.918 type
0.074 Personal
computer 8
3 5
0.951 Smartphone
1 1
Tabelt city
0.38 Surabaya
2 2
Jakarta 5
3 2
0.97 Denpasar
2 2
Mountain View
Pekanbaru Kudus
San Mateo Depok
bulan 0.074
awal 8
3 5
0.951 tengah
1 1
akhir
Berdasarkan hasil perhitungan di atas nilai gain tertinggi ada pada atribut city. Maka, atribut city dijadikan sebagai node akar pada cabang pagi. Untuk
cabangnya digunakan 3 nilai didalam node akar, yaitu „Jakarta‟, „Denpasar‟, dan „Surabaya‟.Dan pohon yang terbentuk seperti Gambar 3.5.
waktu
city city
? pagi
siang malam
San Mateo Surabaya
Depok Jakarta
? Surabaya
Jakarta Denpasar
Talisman Talisman
Smartphone Smartphone Motorbike
Motorbike
Gambar 3. 5 Pembentukan pohon untuk cabang pagi
Untuk node city dengan cabang Jakarta harus dilakukan perhitungan kembali karena masih belum terklasifikasi kedalam satu kelas keputusan,
sehingga masih harus dilakukan proses pencarian node selanjutnya. Hasil perhitungan nilai untuk cabang Jakarta dapat dilihat pada Tabel 3.9.
Tabel 3. 9 Perhitungan data pada cabang Jakarta
Node Jumlah F
S M
T Entropy Gain
4 Total
5 3
2 0.97
type Personal
computer 5
3 2
0.97
Smartphone 0 Tabelt
bulan awal
5 3
2 0.97
tengah akhir
Untuk hasil perhitungan dari cabang Jakarta ternyata didapat nilai yang sama antara atribut type dan atribut bulan. Maka, untuk berikutnya diambil atribut yang
terletak lebih awal, yaitu atribut type. Setelah atribut type menjadi node maka diambil atribut yang kedua yaitu bulan. Dan pohon yang terbentuk seperti
Gambar 3.6.
waktu city
city ?
pagi siang
malam
San Mateo Surabaya
Depok Jakarta
type Surabaya
Jakarta Denpasar
Personal Computer
bulan awal
Fashion Talisman
Talisman Smartphone
Smartphone Motorbike
Motorbike
Gambar 3. 6 Pembentukan pohon untuk cabang pagi dan city Jakarta
Lakukan pengelompokkan kembali untuk node internal di cabang siang, sehingga di dapat hasil seperti pada Tabel 3.10.
Tabel 3. 10 Perhitungan data pada cabang siang
Node Jumlah
F S
M T
Entropy Gain
5 Total
19 7
8 4
1.517 type
0.332 Personal
computer 7
4 3
0.982 Smartphone
10 3
3 4
1.566 Tabelt
2 2
city 0.563
Surabaya 4
2 2
1 Jakarta
9 3
5 1
1.35 Denpasar
2 1
1 1
Mountain View
1 1
Pekanbaru 2
2 Kudus
1 1
San Mateo Depok
bulan 0.591
awal 10
7 3
0.876 tengah
4 2
2 1
akhir 5
3 2
0.969
Berdasarkan hasil perhitungan di atas nilai gain tertinggi ada pada atribut bulan. Maka, atribut bulan dijadikan sebagai node akar pada cabang siang. Untuk
cabangnya digunakan 3 nilai didalam node akar, yaitu „awal‟, „tengah‟, dan „akhir‟. Lakukan juga klasifikasi pada tiap cabang yang ada. Dan pohon yang
terbentuk seperti Gambar 3.7.
waktu
city city
bulan pagi
siang malam
San Mateo Surabaya
Depok Jakarta
type Surabaya
Jakarta Denpasar
Personal Computer
bulan awal
Fashion Talisman
Talisman ?
? ?
awal tengah
akhir Smartphone
Smartphone Motorbike Motorbike
Gambar 3. 7 Pembentukan pohon untuk atribut bulan
Lakukan pengelompokkan untuk node internal di cabang awal, sehingga di dapat hasil seperti pada Tabel 3.11.
Tabel 3. 11 Perhitungan data pada cabang awal
Node Jumlah F
S M
T Entropy
Gain 6
Total 10
7 3
0.876 type
0.548 Personal
computer 4
4 Smartphone
4 3
1 0.821
Tabelt 2
2 city
0.279 Surabaya
2 2
Jakarta 6
3 3
1 Denpasar
1 1
Mountain View
1 1
Pekanbaru Kudus
San Mateo Depok
Dari perhitungan di atas nilai gain tertinggi ada pada atribut type. Maka, atribut type dijadikan sebagai node akar pada cabanag awal. Untuk cabangnya
digunakan 3 nilai didalamnya, yaitu „Personal Computer’ , ‘Smartphone’, dan „Tabelt‟. Dan pohon yang terbentuk seperti Gambar 3.8.
waktu city
city bulan
pagi siang
malam
San Mateo Surabaya
Depok Jakarta
type Surabaya
Jakarta Denpasar
Personal Computer
bulan awal
Fashion Talisman
Talisman type
? ?
awal tengah
akhir
Fashion Fashion
city Personal
Computer Smartphone
Tablet Smartpho
ne Smartpho
ne Motorbi
ke Motorbi
ke
Gambar 3. 8 Pembentukan pohon untuk cabang awal
Untuk node type dengan cabang Smartphone harus dilakukan perhitungan kembali karena masih belum terklasifikasi kedalam satu kelas keputusan,
sehinnga masih harus dilakukan proses pencarian node selanjutnya. Perhitungan untuk cabang Smartphoneseperti pada Tabel 3.12
Tabel 3. 12 Perhitungan data pada cabang Smartphone
Node Jumlah
F S
M T
Entropy Gain
7 Tota
l 4
3 1
0.821 city
0.671 Surabaya
Jakarta 3
2 1
0.14 Denpasar
Mountain View
1 1
Pekanbaru Kudus
San Mateo Depok
Untuk perhitungan dari cabang Smartphone, hanya ada satu atribut, yaitu city. Maka atribut city dijadikan node berikutnya dan terdapat satu cabang yang
mempunyai nilai tertinggi, yaitu „Jakarta‟. Dan pohon yang terbentuk seperti Gambar 3.9.
waktu city
city bulan
pagi siang
malam
San Mateo Surabaya
Depok Jakarta
type Surabaya
Jakarta Denpasar
Personal Computer
bulan awal
Fashion Talisman
Talisman type
? ?
awal tengah
akhir
Fashion Fashion
city Personal
Computer Smartphone
Tablet
Fashion Jakarta
Smartpho ne
Smartpho ne
Motorbi ke
Motorbi ke
Gambar 3. 9 Pembentukan pohon untuk bulan awal dan type Smartphone
Selanjutnya lakukan perhitungan untuk cabang tengah dan didapat hasil seperti pada Tabel 3.13.
Tabel 3. 13 Perhitungan data pada cabang tengah
Node Jumlah
F S
M T
Entropy Gain
8 Tota
l 8
2 3
3 1,562
type Personal
computer Smartphone
8 2
3 3
1.562 Tabelt
city 0.95
7 Surabaya
1 1
Jakarta 5
2 3
0.969 Denpasar
2 2
Mountain View
Pekanbaru Kudus
San Mateo Depok
Perhitungan selanjutnya nilai gain tertinggi ada pada atribut city. Maka atribut city dijadikan node selanjutnya untuk cabang tengah. Dan pohon yang terbentuk
seperti Gambar 3.10. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
waktu city
city bulan
siang malam
San Mateo Surabaya
Depok
type Surabaya
Denpasar Personal
Computer bulan
awal Fashion
Talisman Talisman
type ?
city awal
tengah akhir
Fash ion
city Personal
Computer Smartphone
Tablet Fash
ion Fashion
Jakarta Smartp
hone Talis
man Smartp
hone Surabaya
Jakarta Denpasar
Smartp hone
Smartp hone
Motor bike
Motor bike
Jakarta pagi
Gambar 3. 10 Pembentukan pohon untuk cabang tengah
Selanjutnya untuk perhitungan yang terakhir adalah perhitungan untuk cabang akhir. Dan didapat hasil seperti pada Tabel 3.14.
Tabel 3. 14 Perhitungan data pada cabang akhir
Node Jumlah F
S M
T Entropy
Gain 9
Total 5
3 2
0.97 type
0.97 Personal
computer 3
3 Smartphone 2
2 Tabelt
city 0.97
Surabaya 1
1
Jakarta 1
1 Denpasar
Mountain View
Pekanbaru 2
Kudus 1
1 San Mateo
Depok
Untuk hasil perhitungan dari cabang akhir ternyata didapat nilai yang sama antara atribut type dan atribut city. Maka, untuk berikutnya diambil atribut yang
terletak lebih awal, yaitu atribut type. Dan pohon yang terbentuk seperti Gambar 3.11.
waktu city
city bulan
siang malam
San Mateo Surabaya
Depok Jakarta
type Surabaya
Denpasar Personal
Computer bulan
awal Fashion
Talisman Talisman
type type
city awal
tengah akhir
Fash ion
city Personal
Computer Smartphone
Tablet Fash
ion Fashion
Jakarta Smartp
hone Talis
man Smartp
hone Surabaya
Jakarta Denpasar
Smartp hone
Smartp hone
Motor bike
Motor bike
Jakarta pagi
Smartphone Talisman
Personal Computer
Smartphone
Gambar 3. 11 Pembentukkan pohon untuk cabang akhir
Dengan memperhatikan pohon keputusan pada Gambar 3.11 di atas diketahui bahwa pohon keputusan telah terbentuk. Dan setelah didapatkan tree, tahap
selanjutnya adalah mengubahmenjadi rule. Berikut ini adalah bentuk tree yang diubah menjadi rule:
R1 : if waktu = siang bulan = awal type = Personal Computer THEN interest = Fashion
R2 : if waktu = siang bulan = awal type = Smartphone city = Jakarta THEN interest = Fashion
R3 : if waktu = siang bulan = awal type = Tabelt THEN interest = Fashion R4 : if waktu = siang bulan = tengah city = Surabaya THEN interest =
Smartphone R5 : if waktu = siang bulan = tengah city = Jakarta THEN interest =
Smartphone R6 : if waktu = siang bulan = tengah city = Denpasar THEN interest =
Talisman R7 : if waktu = siang bulan = akhir type = Personal Computer THEN interest
= Smartphone R8 : if waktu = siang bulan = akhir type = Smartphone THEN interest =
Talisman R9 : if waktu = pagi city = Surabaya THEN interest = Talisman
R10 : if waktu = pagi city = Jakarta type = Personal Computer bulan = awal THEN interest = Fashion
R11 : if waktu = pagi city = DenpasarTHEN interest = Talisman R12 : if waktu = malam city = San Mateo THEN interest = Smartphone
R13 : if waktu = malam city = Surabaya THEN interest = Smartphone R14 : if waktu = malam city = Depok THEN interest = Motorbike
R15 : if waktu = malam city = Jakarta THEN interest = Motorbike R16 : if waktu = siang bulan = tengah city = SurabayaTHEN interest =
Talisman Berikut ini adalah pola yang terbentuk berdasarkan rule yang telah
disederhanakan:
Pola 1 : if waktu = siang OR pagi bulan = awal city = Jakarta type =
Personal Computer OR Smartphone OR Tabelt THEN interest = Fashion
Pola 2 : if waktu = siang OR malam bulan = tengah OR akhir city = Surabaya
OR Jakarta OR San Mateo OR Surabaya type = Personal ComputerTHEN interest = Smartphone
Pola 3 : if waktu = malam city = Depok OR Jakarta THEN interest =
Motorbike
Pola 4 : if waktu = siang OR pagi bulan = tengah OR akhir city = Denpasar
OR Surabaya OR type = Smartphone THEN interest = Talisman PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.7 Perancangan Umum Sistem