Implementasi Algoritma C4.5 Untuk Perekrutan Karyawan Berbasis Android (Studi Kasus : Blackberry Service Center Medan)
BAB 2
TINJAUAN PUSTAKA
2.1. Sistem Pendukung Keputusan
Sistem Pendukung Keputusan (SPK) atau dikenal Decision Support System(DSS)
adalah sistem informasi interaktif yang menyediakan informasi, pemodelan dan
pemanipulasian data yang digunakan untuk membantu pengambilan keputusan pada
situasi yang semiterstruktur dan situasi yang tidak terstruktur dimana tak seorangpun
tahu secara pasti bagaimana keputusan seharusnya dibuat (Kadir, 2003).
2.1.1
Karakteristik Sistem Pendukung Keputusan
Adapun yang menjadi karakteristik SPK (Kadir, 2003) :
1.
Menawarkan keluwesan, kemudahan beradaptasi, dan tanggapan yang cepat.
2.
Memungkinkan pemakai memulai dan mengendalikan masukan dan keluaran.
3.
Dapat dioperasikan dengan sedikit atau tanpa bantuan pemrogram profesional.
4.
Menyediakan dukungan untuk keputusan dan permasalahan yang solusinya tak
dapat ditentukan di depan.
5.
2.1.2
Menggunakan analisis data dan perangkat pemodelan yang canggih.
Arsitektur Sistem Pendukung Keputusan
Menurut Kusrini (2009), aplikasi SPK bisa terdiri dari beberapa subsistem, yaitu :
1.
Subsistem manajemen data
Subsistem ini memasukkan satu database yang berisi data yang relevan untuk
suatu situasi dan dikelola oleh perangkat lunak yang disebut sistem manajemen
database (Data Base Management System/DBMS).
Universitas Sumatera Utara
6
2.
Subsistem manajemen model
Merupakan paket perangkat lunak yang memasukkan model keuangan, statistik,
ilmu manajemen, atau model kuantitatif lain yang memberikan kapabilitas
analitik dan manajemen perangkat lunak yang tepat.
3.
Subsistem antarmuka pengguna
Pengguna berkomunikasi dengan dan memerintahkan sistem pendukung
keputusan melalui subsistem tersebut. Pengguna adalah bagian
yang
dipertimbangkan dari sistem.
4.
Subsistem manajemen berbasis pengetahuan
Subsistem tersebut mendukung semua subsistem lain atau bertindak langsung
sebagai suatu komponen independen dan bersifat opsional.
2.1.3
Pandangan Pengguna Sistem Pendukung Keputusan
Pandangan pengguna SPK adalah salah satu yang mempengaruhi motivasi
penggunaan SPK. Hubungan antara pandangan pengguna SPK dan motivasi
penggunaan SPK diharapkan haruslah positif. Karena itu, motivasi untuk
menggunakan SPK diharapkakn meningkat ketika SPK dirasakan menjadi lebih
efektif ataupun efisien, atau lebih mudah penggunaannya. (Jao, 2010). Adapun yang
menjadi pandangan pengguna tersebut adalah :
1.
Keefektifan
Pengguna mungkin memposisikan keefektifan dan penggunaan lebih sedikit
usaha untuk mencapai target mereka ketika sadar akan keuntungan dari
meningkatkan hasil keputusan. Akibatnya, pertimbangan pengguna terhadap
hasil keputusan akan menuju kepada peningkatan penggunaan SPK.
2.
Efisiensi
Sebuah SPK dikatakan efisien jika dapat membantu pengguna dalam membuat
keputusan dalam waktu yang singkat.
3.
Usaha
Penelitian menunjukkan bahwa peningkatan penggunaan SPK meningkat ketika
sebuah SPK mengurangi usaha yang digunakan untuk mengimplementasi
strategi yang membutuhkan usaha penuh, dan ketika penggunaan SPK
meningkatkan kualitas dan akurasi keputusan.
Universitas Sumatera Utara
7
2.2 Android
Android merupakan sebuah sistem operasi perangkat mobile berbasis linux yang
mencakup sistem operasi, middleware, dan aplikasi. Untuk mengembangkan Android,
dibentuk OHA (Open Handset Aliance), konsorsium dari 34 perusahaan peranti keras
(Hardware), peranti lunak (Software), dan telekomunikasi, termasuk Google, HTC,
Intel, Motorola, Qualcomm, T-Mobile, dan Nvidia. Pada tanggal 5 November 2007,
Android dirilis pertama kali. Android bersama OHA menyatakan mendukung
pengembangan open source pada perangkat mobile.
Sekitar bulan September 2007, Google mengenalkan Nexus One, salah satu
jenis smartphone yang menggunakan Android sebagai sistem operasinya yang
diproduksi oleh HTC Corp. dan tersedia di pasaran pada tanggal 5 Januari 2008. Sejak
saat itu, Android berkembang pesat dan bersaing dengan Apple dalam sistem operasi
untuk PC Tablet. Terdapat dua jenis distributor sistem operasi Android. Pertama yang
mendapat dukungan penuh dari Google atau GMS (Google Mail Services), dan kedua
adalah yang benar-benar bebas distribusinya, tanpa dukungan langsung Google, atau
dikenal sebagai OHD (Open Handset Distribution). Hingga 14 Oktober 2013, Android
sudah merilis 31 versi mulai dari versi Beta yang belum memakai versi angka sampai
Kitkat versi 4.4. Semakin versi tinggi, fiturnya semakin canggih dan banyak.
2.3 Algoritma C4.5
Algoritma C4.5 adalah perluasan dari algoritma ID3 yang diciptakan Quinlan untuk
menghasilkan decision tree. Algoritma ini menggunakan konsep information gain atau
entropy reduction untuk memilih optimal split. C4.5 secara rekursif memeriksa setiap
decision node, memilih optimal split, sampai tak ada lagi kemungkinan melakukan
split (Larose & Larose, 2014).
Algoritma C4.5 adalah salah satu metode untuk membuat decision tree
berdasarkan data training yang telah disediakan (Adyatama, 2013). Teknik
pengklasifikasian C4.5 menggunakan entropy dan information gain untuk perluasan
pohon(tree) (Florence & Savithri, 2013). Secara umum proses algoritma C4.5 untuk
membangun pohon keputusan adalah sebagai berikut (Kusrini, 2009) :
1. Pilih atribut sebagai akar
2. Buat cabang untuk masing-masing nilai
3. Bagi kasus ke dalam cabang
Universitas Sumatera Utara
8
4. Ulangi proses untuk masing-masing cabang sampai semua kasus selesai.
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atributatribut yang ada. Untuk menghitung gain digunakan rumus :
���
�, � = � �
�
� � − ∑
�=
��
� �
�
� ��
Keterangan :
S
: Himpunan Kasus
A
: Atribut
n
: Jumlah Partisi Atribut A
Si
: Jumlah Kasus pada Partisi ke-i
S
: Jumlah Kasus dalam S
� �
�
� � = ∑− � × � � �
�=
Keterangan :
S
: Himpunan Kasus
A
: Fitur
N
: Jumlah partisi S
pi
: Proporsi dari Si terhadap S
Contoh kasus yang terjadi adalah untuk menyelesaikan kasus pertandingan tenis akan
dilakukan atau tidak, berdasarkan keadaan cuaca, suhu, kelembapan, dan angin seperti
pada Tabel 2.1.
Universitas Sumatera Utara
9
Tabel 2.1 Data Set Kasus Penentuan Pelaksanaan Pertandingan
No
Cuaca
Suhu
Kelembapan
Berangin
Main
1
Cerah
Panas
Tinggi
Salah
Tidak
2
Cerah
Panas
Tinggi
Benar
Tidak
3
Berawan
Panas
Tinggi
Salah
Ya
4
Hujan
Sejuk
Tinggi
Salah
Ya
5
Hujan
Dingin
Normal
Salah
Ya
6
Hujan
Dingin
Normal
Benar
Ya
7
Berawan
Dingin
Normal
Benar
Ya
8
Cerah
Sejuk
Tinggi
Salah
Tidak
9
Cerah
Dingin
Normal
Salah
Ya
10
Hujan
Sejuk
Normal
Salah
Ya
11
Cerah
Sejuk
Normal
Benar
Ya
12
Berawan
Sejuk
Tinggi
Benar
Ya
13
Berawan
Panas
Normal
Salah
Ya
14
Hujan
Sejuk
Tinggi
Benar
Tidak
Kemudian hitung entropy dengan rumus :
� �
�
� � = ∑− � × � � �
�=
Maka didapat :
� �
� � = −(
)� � (
) +
−(
)� � (
) = ,
Tabel 2.2 Hasil Perhitungan Entropy pada Data Set
Total Kasus
Sum(Ya)
Sum(Tidak)
14
10
4
Entropy Total
,
Universitas Sumatera Utara
10
Setelah mendapatkan entropy dari keseluruhan kasus pada Tabel 2.2, lakukan analisis
pada setiap atribut dan nilai-nilainya dan hitung entropynya.
Hitung gain setiap atribut dengan rumus :
���
���
���
�
�, � = � �
� � − ∑
− ((
)×
� ��� = ,
� ��� = ,
�=
)× +(
��
� �
�
,
� ��
+(
)× ,
)
Kemudian, hitung gain masing-masing atribut suhu, kelembapan, dan berangin. Hasil
perhitungan dari masing-masing atribut terlihat pada Tabel 2.3.
Tabel 2.3 Analisis Atribut, Nilai, Banyaknya Kejadian Nilai, Entropy dan Gain
Node
1
Atribut
Cuaca
Sum
Sum
Sum
(Nilai)
(Ya)
(Tidak)
Berawan
4
4
0
0
Hujan
5
4
1
0,721928095
Cerah
5
2
3
0,970950594
Nilai
Entropy
Gain
0,258521037
Suhu
Dingin
4
4
0
0
Panas
4
2
2
1
Sejuk
6
4
2
0,918295834
0,183850925
Kelembapan
Tinggi
7
3
4
0,985228136
Normal
7
7
0
0
0,370506501
Berangin
Salah
8
6
2
0,811278124
Benar
6
2
4
0,918295834
0,005977711
Universitas Sumatera Utara
11
Pada Gambar 2.1 di bawah dapat dilihat kelembapan sebagai node akar karena
kelembapan adalah atribut dengan nilai gain paling tinggi. Berdasarkan pembentukan
pohon keputusan, node 1.1 akan dianalisis lebih lanjut.
1
Kelembapan
Tinggi
Normal
1.1
?
Ya
Gambar 2.1 Pohon Keputusan Node 1 (root node)
Untuk mempermudah, tabel awal difilter dengan mengambil data yang memiliki
kelembapan = tinggi sehingga didapat data pada Tabel 2.4.
Tabel 2.4 Data dengan Kelembapan = Tinggi
No
Cuaca
Suhu
Kelembapan
Berangin
Main
1
Cerah
Panas
Tinggi
Salah
Tidak
2
Cerah
Panas
Tinggi
Benar
Tidak
3
Berawan
Panas
Tinggi
Salah
Ya
4
Hujan
Sejuk
Tinggi
Salah
Ya
5
Cerah
Sejuk
Tinggi
Salah
Tidak
6
Berawan
Sejuk
Tinggi
Benar
Ya
7
Hujan
Sejuk
Tinggi
Benar
Tidak
Lalu data di Tabel 2.4 dianalisis dan dihitung lagi nilai entropy atribut Kelembapan
Tinggi seperti terlihat pada Tabel 2.5.
Tabel 2.5 Hasil Perhitungan Entropy Atribut Kelembapan Tinggi
Kelembapan
Tinggi
7
Sum (Ya)
Sum (Tidak)
Entropy
3
4
0,985228136
Universitas Sumatera Utara
12
Lakukan lagi analisis terhadap atribut yang tersisa dan hitung nilai entropynya
masing-masing. Hasil analisis dapat dilihat pada Tabel 2.6.Setelah itu, tentukan pilih
atribut yang memiliki gain tertinggi untuk dibuatkan node berikutnya (node 1.1)
Tabel 2.6 Analisis Atribut untuk Node 1.1
No-
Atribut
de
1.1
Cuaca
Sum
Sum
Sum
(Nilai)
(Ya)
(Tidak)
Berawan
2
2
0
0
Hujan
2
1
1
1
Cerah
3
0
3
0
Nilai
Entropy
Gain
0,69951385
Suhu
Dingin
0
0
0
0
Panas
3
1
2
0,918295834
Sejuk
4
2
2
1
0,020244207
Berangin
Salah
4
2
2
1
Benar
3
2
1
0,918295834
0,020244207
Dari Tabel 2.6, gain tertinggi ada pada atribut Cuaca, dan nilai yang dijadikan daun
adalah Berawan dan Cerah. Maka akan didapat pohon keputusan seperti pada Gambar
2.2.
1
Kelembapan
Tinggi
Normal
1.1
Cuaca
Berawan
Ya
Hujan
1.1.2
?
Ya
Cerah
Tidak
Gambar 2.2 Pohon Keputusan Analisis Node 1.1
Universitas Sumatera Utara
13
Untuk menganalisis node 1.1.2, lakukan lagi langkah yang sama seperti sebelumnya.
Hasilnya ditampilkan pada Tabel 2.7, Tabel 2.8, Tabel 2.9 dan terbentuklah pohon
keputusan seperti pada Gambar 2.3.
Tabel 2.7 Hasil Analisis Node 1.1.2
No
Cuaca
Suhu
Kelembapan
Berangin
Main
1.
Hujan
Sejuk
Tinggi
Salah
Ya
2.
Hujan
Sejuk
Tinggi
Benar
Tidak
Tabel 2.8 Hasil Perhitungan Entropy Atribut Kelembapan Tinggi dan Hujan
Kelembapan
Tinggi dan Hujan
Sum (Ya)
Sum (Tidak)
Entropy
1
1
1
2
Tabel 2.9 Analisis Atribut untuk Node 1.1.2
Node
Atribut
1.1.2 Suhu
Sum
Sum
Sum
(Nilai)
(Ya)
(Tidak)
Dingin
0
0
0
0
Panas
0
0
0
0
Sejuk
2
1
1
1
Nilai
Entropy
Gain
0
Berangin
Salah
1
1
0
0
Benar
1
0
1
0
1
Universitas Sumatera Utara
14
1
Kelembapan
Tinggi
Normal
1.1
Cuaca
Berawan
Ya
Cerah
Hujan
1.1.2
Berangin
Ya
Salah
Ya
Tidak
Benar
Tidak
Gambar 2.3 Pohon Keputusan Akhir
Dari Gambar 2.3 didapat pola keputusan (rules), yaitu :
IF Kelembapan = Normal THEN Main = Ya
IF Kelembapan = Tinggi ^ Cuaca = Berawan THEN Main = Ya
IF Kelembapan = Tinggi ^ Cuaca = Cerah THEN Main = Tidak
IF Kelembapan = Tinggi ^ Cuaca = Hujan ^ Berangin = Salah THEN Main = Ya
IF Kelembapan = Tinggi ^ Cuaca = Hujan ^ Berangin = Benar THEN Main = Tidak
Universitas Sumatera Utara
TINJAUAN PUSTAKA
2.1. Sistem Pendukung Keputusan
Sistem Pendukung Keputusan (SPK) atau dikenal Decision Support System(DSS)
adalah sistem informasi interaktif yang menyediakan informasi, pemodelan dan
pemanipulasian data yang digunakan untuk membantu pengambilan keputusan pada
situasi yang semiterstruktur dan situasi yang tidak terstruktur dimana tak seorangpun
tahu secara pasti bagaimana keputusan seharusnya dibuat (Kadir, 2003).
2.1.1
Karakteristik Sistem Pendukung Keputusan
Adapun yang menjadi karakteristik SPK (Kadir, 2003) :
1.
Menawarkan keluwesan, kemudahan beradaptasi, dan tanggapan yang cepat.
2.
Memungkinkan pemakai memulai dan mengendalikan masukan dan keluaran.
3.
Dapat dioperasikan dengan sedikit atau tanpa bantuan pemrogram profesional.
4.
Menyediakan dukungan untuk keputusan dan permasalahan yang solusinya tak
dapat ditentukan di depan.
5.
2.1.2
Menggunakan analisis data dan perangkat pemodelan yang canggih.
Arsitektur Sistem Pendukung Keputusan
Menurut Kusrini (2009), aplikasi SPK bisa terdiri dari beberapa subsistem, yaitu :
1.
Subsistem manajemen data
Subsistem ini memasukkan satu database yang berisi data yang relevan untuk
suatu situasi dan dikelola oleh perangkat lunak yang disebut sistem manajemen
database (Data Base Management System/DBMS).
Universitas Sumatera Utara
6
2.
Subsistem manajemen model
Merupakan paket perangkat lunak yang memasukkan model keuangan, statistik,
ilmu manajemen, atau model kuantitatif lain yang memberikan kapabilitas
analitik dan manajemen perangkat lunak yang tepat.
3.
Subsistem antarmuka pengguna
Pengguna berkomunikasi dengan dan memerintahkan sistem pendukung
keputusan melalui subsistem tersebut. Pengguna adalah bagian
yang
dipertimbangkan dari sistem.
4.
Subsistem manajemen berbasis pengetahuan
Subsistem tersebut mendukung semua subsistem lain atau bertindak langsung
sebagai suatu komponen independen dan bersifat opsional.
2.1.3
Pandangan Pengguna Sistem Pendukung Keputusan
Pandangan pengguna SPK adalah salah satu yang mempengaruhi motivasi
penggunaan SPK. Hubungan antara pandangan pengguna SPK dan motivasi
penggunaan SPK diharapkan haruslah positif. Karena itu, motivasi untuk
menggunakan SPK diharapkakn meningkat ketika SPK dirasakan menjadi lebih
efektif ataupun efisien, atau lebih mudah penggunaannya. (Jao, 2010). Adapun yang
menjadi pandangan pengguna tersebut adalah :
1.
Keefektifan
Pengguna mungkin memposisikan keefektifan dan penggunaan lebih sedikit
usaha untuk mencapai target mereka ketika sadar akan keuntungan dari
meningkatkan hasil keputusan. Akibatnya, pertimbangan pengguna terhadap
hasil keputusan akan menuju kepada peningkatan penggunaan SPK.
2.
Efisiensi
Sebuah SPK dikatakan efisien jika dapat membantu pengguna dalam membuat
keputusan dalam waktu yang singkat.
3.
Usaha
Penelitian menunjukkan bahwa peningkatan penggunaan SPK meningkat ketika
sebuah SPK mengurangi usaha yang digunakan untuk mengimplementasi
strategi yang membutuhkan usaha penuh, dan ketika penggunaan SPK
meningkatkan kualitas dan akurasi keputusan.
Universitas Sumatera Utara
7
2.2 Android
Android merupakan sebuah sistem operasi perangkat mobile berbasis linux yang
mencakup sistem operasi, middleware, dan aplikasi. Untuk mengembangkan Android,
dibentuk OHA (Open Handset Aliance), konsorsium dari 34 perusahaan peranti keras
(Hardware), peranti lunak (Software), dan telekomunikasi, termasuk Google, HTC,
Intel, Motorola, Qualcomm, T-Mobile, dan Nvidia. Pada tanggal 5 November 2007,
Android dirilis pertama kali. Android bersama OHA menyatakan mendukung
pengembangan open source pada perangkat mobile.
Sekitar bulan September 2007, Google mengenalkan Nexus One, salah satu
jenis smartphone yang menggunakan Android sebagai sistem operasinya yang
diproduksi oleh HTC Corp. dan tersedia di pasaran pada tanggal 5 Januari 2008. Sejak
saat itu, Android berkembang pesat dan bersaing dengan Apple dalam sistem operasi
untuk PC Tablet. Terdapat dua jenis distributor sistem operasi Android. Pertama yang
mendapat dukungan penuh dari Google atau GMS (Google Mail Services), dan kedua
adalah yang benar-benar bebas distribusinya, tanpa dukungan langsung Google, atau
dikenal sebagai OHD (Open Handset Distribution). Hingga 14 Oktober 2013, Android
sudah merilis 31 versi mulai dari versi Beta yang belum memakai versi angka sampai
Kitkat versi 4.4. Semakin versi tinggi, fiturnya semakin canggih dan banyak.
2.3 Algoritma C4.5
Algoritma C4.5 adalah perluasan dari algoritma ID3 yang diciptakan Quinlan untuk
menghasilkan decision tree. Algoritma ini menggunakan konsep information gain atau
entropy reduction untuk memilih optimal split. C4.5 secara rekursif memeriksa setiap
decision node, memilih optimal split, sampai tak ada lagi kemungkinan melakukan
split (Larose & Larose, 2014).
Algoritma C4.5 adalah salah satu metode untuk membuat decision tree
berdasarkan data training yang telah disediakan (Adyatama, 2013). Teknik
pengklasifikasian C4.5 menggunakan entropy dan information gain untuk perluasan
pohon(tree) (Florence & Savithri, 2013). Secara umum proses algoritma C4.5 untuk
membangun pohon keputusan adalah sebagai berikut (Kusrini, 2009) :
1. Pilih atribut sebagai akar
2. Buat cabang untuk masing-masing nilai
3. Bagi kasus ke dalam cabang
Universitas Sumatera Utara
8
4. Ulangi proses untuk masing-masing cabang sampai semua kasus selesai.
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari atributatribut yang ada. Untuk menghitung gain digunakan rumus :
���
�, � = � �
�
� � − ∑
�=
��
� �
�
� ��
Keterangan :
S
: Himpunan Kasus
A
: Atribut
n
: Jumlah Partisi Atribut A
Si
: Jumlah Kasus pada Partisi ke-i
S
: Jumlah Kasus dalam S
� �
�
� � = ∑− � × � � �
�=
Keterangan :
S
: Himpunan Kasus
A
: Fitur
N
: Jumlah partisi S
pi
: Proporsi dari Si terhadap S
Contoh kasus yang terjadi adalah untuk menyelesaikan kasus pertandingan tenis akan
dilakukan atau tidak, berdasarkan keadaan cuaca, suhu, kelembapan, dan angin seperti
pada Tabel 2.1.
Universitas Sumatera Utara
9
Tabel 2.1 Data Set Kasus Penentuan Pelaksanaan Pertandingan
No
Cuaca
Suhu
Kelembapan
Berangin
Main
1
Cerah
Panas
Tinggi
Salah
Tidak
2
Cerah
Panas
Tinggi
Benar
Tidak
3
Berawan
Panas
Tinggi
Salah
Ya
4
Hujan
Sejuk
Tinggi
Salah
Ya
5
Hujan
Dingin
Normal
Salah
Ya
6
Hujan
Dingin
Normal
Benar
Ya
7
Berawan
Dingin
Normal
Benar
Ya
8
Cerah
Sejuk
Tinggi
Salah
Tidak
9
Cerah
Dingin
Normal
Salah
Ya
10
Hujan
Sejuk
Normal
Salah
Ya
11
Cerah
Sejuk
Normal
Benar
Ya
12
Berawan
Sejuk
Tinggi
Benar
Ya
13
Berawan
Panas
Normal
Salah
Ya
14
Hujan
Sejuk
Tinggi
Benar
Tidak
Kemudian hitung entropy dengan rumus :
� �
�
� � = ∑− � × � � �
�=
Maka didapat :
� �
� � = −(
)� � (
) +
−(
)� � (
) = ,
Tabel 2.2 Hasil Perhitungan Entropy pada Data Set
Total Kasus
Sum(Ya)
Sum(Tidak)
14
10
4
Entropy Total
,
Universitas Sumatera Utara
10
Setelah mendapatkan entropy dari keseluruhan kasus pada Tabel 2.2, lakukan analisis
pada setiap atribut dan nilai-nilainya dan hitung entropynya.
Hitung gain setiap atribut dengan rumus :
���
���
���
�
�, � = � �
� � − ∑
− ((
)×
� ��� = ,
� ��� = ,
�=
)× +(
��
� �
�
,
� ��
+(
)× ,
)
Kemudian, hitung gain masing-masing atribut suhu, kelembapan, dan berangin. Hasil
perhitungan dari masing-masing atribut terlihat pada Tabel 2.3.
Tabel 2.3 Analisis Atribut, Nilai, Banyaknya Kejadian Nilai, Entropy dan Gain
Node
1
Atribut
Cuaca
Sum
Sum
Sum
(Nilai)
(Ya)
(Tidak)
Berawan
4
4
0
0
Hujan
5
4
1
0,721928095
Cerah
5
2
3
0,970950594
Nilai
Entropy
Gain
0,258521037
Suhu
Dingin
4
4
0
0
Panas
4
2
2
1
Sejuk
6
4
2
0,918295834
0,183850925
Kelembapan
Tinggi
7
3
4
0,985228136
Normal
7
7
0
0
0,370506501
Berangin
Salah
8
6
2
0,811278124
Benar
6
2
4
0,918295834
0,005977711
Universitas Sumatera Utara
11
Pada Gambar 2.1 di bawah dapat dilihat kelembapan sebagai node akar karena
kelembapan adalah atribut dengan nilai gain paling tinggi. Berdasarkan pembentukan
pohon keputusan, node 1.1 akan dianalisis lebih lanjut.
1
Kelembapan
Tinggi
Normal
1.1
?
Ya
Gambar 2.1 Pohon Keputusan Node 1 (root node)
Untuk mempermudah, tabel awal difilter dengan mengambil data yang memiliki
kelembapan = tinggi sehingga didapat data pada Tabel 2.4.
Tabel 2.4 Data dengan Kelembapan = Tinggi
No
Cuaca
Suhu
Kelembapan
Berangin
Main
1
Cerah
Panas
Tinggi
Salah
Tidak
2
Cerah
Panas
Tinggi
Benar
Tidak
3
Berawan
Panas
Tinggi
Salah
Ya
4
Hujan
Sejuk
Tinggi
Salah
Ya
5
Cerah
Sejuk
Tinggi
Salah
Tidak
6
Berawan
Sejuk
Tinggi
Benar
Ya
7
Hujan
Sejuk
Tinggi
Benar
Tidak
Lalu data di Tabel 2.4 dianalisis dan dihitung lagi nilai entropy atribut Kelembapan
Tinggi seperti terlihat pada Tabel 2.5.
Tabel 2.5 Hasil Perhitungan Entropy Atribut Kelembapan Tinggi
Kelembapan
Tinggi
7
Sum (Ya)
Sum (Tidak)
Entropy
3
4
0,985228136
Universitas Sumatera Utara
12
Lakukan lagi analisis terhadap atribut yang tersisa dan hitung nilai entropynya
masing-masing. Hasil analisis dapat dilihat pada Tabel 2.6.Setelah itu, tentukan pilih
atribut yang memiliki gain tertinggi untuk dibuatkan node berikutnya (node 1.1)
Tabel 2.6 Analisis Atribut untuk Node 1.1
No-
Atribut
de
1.1
Cuaca
Sum
Sum
Sum
(Nilai)
(Ya)
(Tidak)
Berawan
2
2
0
0
Hujan
2
1
1
1
Cerah
3
0
3
0
Nilai
Entropy
Gain
0,69951385
Suhu
Dingin
0
0
0
0
Panas
3
1
2
0,918295834
Sejuk
4
2
2
1
0,020244207
Berangin
Salah
4
2
2
1
Benar
3
2
1
0,918295834
0,020244207
Dari Tabel 2.6, gain tertinggi ada pada atribut Cuaca, dan nilai yang dijadikan daun
adalah Berawan dan Cerah. Maka akan didapat pohon keputusan seperti pada Gambar
2.2.
1
Kelembapan
Tinggi
Normal
1.1
Cuaca
Berawan
Ya
Hujan
1.1.2
?
Ya
Cerah
Tidak
Gambar 2.2 Pohon Keputusan Analisis Node 1.1
Universitas Sumatera Utara
13
Untuk menganalisis node 1.1.2, lakukan lagi langkah yang sama seperti sebelumnya.
Hasilnya ditampilkan pada Tabel 2.7, Tabel 2.8, Tabel 2.9 dan terbentuklah pohon
keputusan seperti pada Gambar 2.3.
Tabel 2.7 Hasil Analisis Node 1.1.2
No
Cuaca
Suhu
Kelembapan
Berangin
Main
1.
Hujan
Sejuk
Tinggi
Salah
Ya
2.
Hujan
Sejuk
Tinggi
Benar
Tidak
Tabel 2.8 Hasil Perhitungan Entropy Atribut Kelembapan Tinggi dan Hujan
Kelembapan
Tinggi dan Hujan
Sum (Ya)
Sum (Tidak)
Entropy
1
1
1
2
Tabel 2.9 Analisis Atribut untuk Node 1.1.2
Node
Atribut
1.1.2 Suhu
Sum
Sum
Sum
(Nilai)
(Ya)
(Tidak)
Dingin
0
0
0
0
Panas
0
0
0
0
Sejuk
2
1
1
1
Nilai
Entropy
Gain
0
Berangin
Salah
1
1
0
0
Benar
1
0
1
0
1
Universitas Sumatera Utara
14
1
Kelembapan
Tinggi
Normal
1.1
Cuaca
Berawan
Ya
Cerah
Hujan
1.1.2
Berangin
Ya
Salah
Ya
Tidak
Benar
Tidak
Gambar 2.3 Pohon Keputusan Akhir
Dari Gambar 2.3 didapat pola keputusan (rules), yaitu :
IF Kelembapan = Normal THEN Main = Ya
IF Kelembapan = Tinggi ^ Cuaca = Berawan THEN Main = Ya
IF Kelembapan = Tinggi ^ Cuaca = Cerah THEN Main = Tidak
IF Kelembapan = Tinggi ^ Cuaca = Hujan ^ Berangin = Salah THEN Main = Ya
IF Kelembapan = Tinggi ^ Cuaca = Hujan ^ Berangin = Benar THEN Main = Tidak
Universitas Sumatera Utara