Tabel 4.8 Detail Jumlah Aturan Percobaan 2 Lanjutan
Jumlah Sampel
Aturan dengan
Konsekuen TARGET_B
Total Aturan dengan
Prediksi… No
Training Set
Test Set
YES NO Benar Salah
Total Aturan
4 310 20 68 78 14 6 146
5 310 25 68 78 19 6 146
6 310 30 68 78 22 8 146
7 310 35 68 78 26 9 146
8 310 40 68 78 31 9 146
Hasil percobaan di atas dapat dilihat pada grafik di bawah ini:
Gambar 4.34 Grafik Persentase Keberhasilan Percobaan 2
o Percobaan 3
Pada percobaan ini penulis hanya mengubah-ubah proporsi jumlah sampel data training set. Dimisalkan jumlah sampel
test set untuk setiap tahap percobaan sebanyak 50 records.
Hasil yang diperoleh sebagai berikut:
Tabel 4.9 Hasil Percobaan 3
Jumlah Sampel Percobaan Training
Set Test
Set Node Awal
Jumlah Aturan
Persentase Keberhasilan
1 30 50
WEALTH 24
74 2 40
50 WEALTH
22 68
3 155 50
RFA_2F 77
58 4 165
50 RFA_2F
73 66
5 175 50
RFA_2F 78
68 6 291
50 RFA_2F
136 60
7 295 50
RFA_2F 134
62 8 300
50 RFA_2F
141 62
Rerata Persentase Keberhasilan
64.75
Di bawah ini detail aturan untuk setiap tahap pengujian dari percobaan 3:
Tabel 4.10 Detail Jumlah Aturan Percobaan 3
Jumlah Sampel
Aturan dengan
Konsekuen TARGET_B
Total Aturan dengan
Prediksi… No
Training Set
Test Set
YES NO Benar Salah
Total Aturan
1 30 50 10 12 37 13 24
2 40 50 11 13 34 16 22
3 155 50 33 44 29 21 77
4 165 50 29 44 33 17 73
5 175 50 32 46 36 16 78
6 291 50 58 78 30 20 136
7 295 50 58 76 31 19 134
8 300 50 66 63 31 19 141
Hasil percobaan 3 dapat dilihat pada grafik di bawah ini:
Gambar 4.35 Grafik Persentase Keberhasilan Percobaan 3
Berdasarkan hasil percobaan di atas terlihat bahwa : 1.
Jika program diujikan pada data training set diperoleh tingkat persentase keberhasilan sebesar 0 berdasarkan percobaan 1.
2. Jumlah sampel data training set dapat mempengaruhi node awal
yang terbentuk. Hal ini disebabkan karena node awal diperoleh dari hasil perhitungan nilai gain yang terbesar berdasarkan
banyaknya record data pada training set berdasarkan percobaan 3.
3. Uji aturan pada percobaan dengan menetapkan 310 records data
sebagai data pada training set dan mengubah proporsi jumlah PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
sampel data pada test set menghasilkan nilai rerata persentase keberhasilan sebesar 66.1815 berdasarkan percobaan 2.
4. Uji aturan pada percobaan dengan mengubah-ubah proporsi
jumlah sampel data training set dan jumlah sampel test set untuk setiap tahap percobaan sebanyak 50 records menghasilkan nilai
rerata persentase keberhasilan sebesar 64.75 berdasarkan percobaan 3.
D. Kelebihan dan Kelemahan Program
Kelebihan program: Program menyediakan fasilitas dialog bagi pengguna dengan
menginputkan suatu sampel data sehingga dapat diprediksikan nilai responnya terhadap layanan NK.
Program dapat digunakan untuk melakukan klasifikasi pada data yang berbeda, dengan syarat-syarat sebagai berikut:
• Tabel data diharuskan berada pada direktori yang sama dengan
direktori basis data. •
Mempunyai tabel training set dan tabel test set. •
Field atribut keputusan diletakkan paling akhir pada tabel
training set . Field tambahan untuk menyimpan hasil prediksi
diletakkan paling akhir pada tabel test set. •
Mengatur nama atribut keputusan pada program sesuai dengan nama atribut keputusan dari tabel yang akan digunakan.
Kelemahan Program: Proses pengelompokan data masih dilakukan secara intuitif dan
manual. Program hanya dapat mengakses basisdata dalam format .db
Paradox. Struktur basisdata program menggunakan array yang memiliki
keterbatasan dalam menampung data. Jumlah sampel data yang digunakan untuk data training set sedikit
karena proses penginputan data dari format .TXT ke dalam basis data dengan format .DB masih dilakukan secara manual. Jumlah sampel
data training set yang sedikit tidak memungkinkan untuk melakukan uji independensi uji Chi-Square.
Program ini belum dapat menampilkan pohon keputusan dalam bentuk tree view
tetapi dalam bentuk string grid. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
BAB V KESIMPULAN DAN SARAN
A. KESIMPULAN
Algoritma ID3 dapat digunakan untuk mengidentifikasi profil anggota organisasi yang memberikan respon terhadap layanan pengiriman
surat kosong NK Berdasarkan hasil percobaan dapat disimpulkan beberapa hal sebagai
berikut: 1.
Jika program diujikan pada data training set diperoleh tingkat persentase keberhasilan sebesar 0 .
2. Uji aturan dengan menetapkan 310 records data sebagai data pada
training set dan mengubah jumlah sampel data pada test set
menghasilkan nilai rerata persentase keberhasilan sebesar 66.1815 .
3. Uji aturan dengan menetapkan 310 records data sebagai data
pada training set dan mengubah jumlah sampel data pada test set menghasilkan nilai rerata persentase keberhasilan sebesar
66.1815 . 4.
Uji aturan dengan hanya mengubah jumlah sampel data training set
dan jumlah sampel test set sebanyak 50 records menghasilkan nilai rerata persentase keberhasilan sebesar 64.75 .
118 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
B. SARAN
Saran yang diperlukan untuk pengembangan program lebih lanjut antara lain:
1. Program dapat menangani proses migrasi data dari format .TXT ke
format .DB. 2.
Pohon aturan yang terbentuk tidak ditampilkan dalam bentuk tabel tetapi dalam bentuk tree view sehingga pengguna lebih mudah untuk
memahami. 3.
Untuk pengembangan selanjutnya sebaiknya program dapat mengimplementasikan uji independensi Chi-Square untuk memangkas
aturan. Hal ini dimaksudkan agar proses pengujian aturan dapat lebih efisien.