Analisa Hasil Program IMPLEMENTASI SISTEM

Tabel 4.8 Detail Jumlah Aturan Percobaan 2 Lanjutan Jumlah Sampel Aturan dengan Konsekuen TARGET_B Total Aturan dengan Prediksi… No Training Set Test Set YES NO Benar Salah Total Aturan 4 310 20 68 78 14 6 146 5 310 25 68 78 19 6 146 6 310 30 68 78 22 8 146 7 310 35 68 78 26 9 146 8 310 40 68 78 31 9 146 Hasil percobaan di atas dapat dilihat pada grafik di bawah ini: Gambar 4.34 Grafik Persentase Keberhasilan Percobaan 2 o Percobaan 3 Pada percobaan ini penulis hanya mengubah-ubah proporsi jumlah sampel data training set. Dimisalkan jumlah sampel test set untuk setiap tahap percobaan sebanyak 50 records. Hasil yang diperoleh sebagai berikut: Tabel 4.9 Hasil Percobaan 3 Jumlah Sampel Percobaan Training Set Test Set Node Awal Jumlah Aturan Persentase Keberhasilan 1 30 50 WEALTH 24 74 2 40 50 WEALTH 22 68 3 155 50 RFA_2F 77 58 4 165 50 RFA_2F 73 66 5 175 50 RFA_2F 78 68 6 291 50 RFA_2F 136 60 7 295 50 RFA_2F 134 62 8 300 50 RFA_2F 141 62 Rerata Persentase Keberhasilan 64.75 Di bawah ini detail aturan untuk setiap tahap pengujian dari percobaan 3: Tabel 4.10 Detail Jumlah Aturan Percobaan 3 Jumlah Sampel Aturan dengan Konsekuen TARGET_B Total Aturan dengan Prediksi… No Training Set Test Set YES NO Benar Salah Total Aturan 1 30 50 10 12 37 13 24 2 40 50 11 13 34 16 22 3 155 50 33 44 29 21 77 4 165 50 29 44 33 17 73 5 175 50 32 46 36 16 78 6 291 50 58 78 30 20 136 7 295 50 58 76 31 19 134 8 300 50 66 63 31 19 141 Hasil percobaan 3 dapat dilihat pada grafik di bawah ini: Gambar 4.35 Grafik Persentase Keberhasilan Percobaan 3 Berdasarkan hasil percobaan di atas terlihat bahwa : 1. Jika program diujikan pada data training set diperoleh tingkat persentase keberhasilan sebesar 0 berdasarkan percobaan 1. 2. Jumlah sampel data training set dapat mempengaruhi node awal yang terbentuk. Hal ini disebabkan karena node awal diperoleh dari hasil perhitungan nilai gain yang terbesar berdasarkan banyaknya record data pada training set berdasarkan percobaan 3. 3. Uji aturan pada percobaan dengan menetapkan 310 records data sebagai data pada training set dan mengubah proporsi jumlah PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI sampel data pada test set menghasilkan nilai rerata persentase keberhasilan sebesar 66.1815 berdasarkan percobaan 2. 4. Uji aturan pada percobaan dengan mengubah-ubah proporsi jumlah sampel data training set dan jumlah sampel test set untuk setiap tahap percobaan sebanyak 50 records menghasilkan nilai rerata persentase keberhasilan sebesar 64.75 berdasarkan percobaan 3.

D. Kelebihan dan Kelemahan Program

Kelebihan program: Program menyediakan fasilitas dialog bagi pengguna dengan menginputkan suatu sampel data sehingga dapat diprediksikan nilai responnya terhadap layanan NK. Program dapat digunakan untuk melakukan klasifikasi pada data yang berbeda, dengan syarat-syarat sebagai berikut: • Tabel data diharuskan berada pada direktori yang sama dengan direktori basis data. • Mempunyai tabel training set dan tabel test set. • Field atribut keputusan diletakkan paling akhir pada tabel training set . Field tambahan untuk menyimpan hasil prediksi diletakkan paling akhir pada tabel test set. • Mengatur nama atribut keputusan pada program sesuai dengan nama atribut keputusan dari tabel yang akan digunakan. Kelemahan Program: Proses pengelompokan data masih dilakukan secara intuitif dan manual. Program hanya dapat mengakses basisdata dalam format .db Paradox. Struktur basisdata program menggunakan array yang memiliki keterbatasan dalam menampung data. Jumlah sampel data yang digunakan untuk data training set sedikit karena proses penginputan data dari format .TXT ke dalam basis data dengan format .DB masih dilakukan secara manual. Jumlah sampel data training set yang sedikit tidak memungkinkan untuk melakukan uji independensi uji Chi-Square. Program ini belum dapat menampilkan pohon keputusan dalam bentuk tree view tetapi dalam bentuk string grid. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

BAB V KESIMPULAN DAN SARAN

A. KESIMPULAN

Algoritma ID3 dapat digunakan untuk mengidentifikasi profil anggota organisasi yang memberikan respon terhadap layanan pengiriman surat kosong NK Berdasarkan hasil percobaan dapat disimpulkan beberapa hal sebagai berikut: 1. Jika program diujikan pada data training set diperoleh tingkat persentase keberhasilan sebesar 0 . 2. Uji aturan dengan menetapkan 310 records data sebagai data pada training set dan mengubah jumlah sampel data pada test set menghasilkan nilai rerata persentase keberhasilan sebesar 66.1815 . 3. Uji aturan dengan menetapkan 310 records data sebagai data pada training set dan mengubah jumlah sampel data pada test set menghasilkan nilai rerata persentase keberhasilan sebesar 66.1815 . 4. Uji aturan dengan hanya mengubah jumlah sampel data training set dan jumlah sampel test set sebanyak 50 records menghasilkan nilai rerata persentase keberhasilan sebesar 64.75 . 118 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI

B. SARAN

Saran yang diperlukan untuk pengembangan program lebih lanjut antara lain: 1. Program dapat menangani proses migrasi data dari format .TXT ke format .DB. 2. Pohon aturan yang terbentuk tidak ditampilkan dalam bentuk tabel tetapi dalam bentuk tree view sehingga pengguna lebih mudah untuk memahami. 3. Untuk pengembangan selanjutnya sebaiknya program dapat mengimplementasikan uji independensi Chi-Square untuk memangkas aturan. Hal ini dimaksudkan agar proses pengujian aturan dapat lebih efisien.