Menyederhanakan aturan dengan membuang aturan yang tidak

Dalam tugas akhir ini sampel data yang digunakan sebanyak 350 records dan 67 atribut. Sampel data tersebut diambil dari dataset donatur organisasi veteran Amerika yang disediakan oleh situs http:kdd.ics.uci.edu databases kddcup98 kddcup98.html .

B. Perancangan Sistem

1. Input

Data-data yang diperoleh dibagi dalam dua tabel secara random yaitu sebagai tabel training dan tabel tes. Data yang akan digunakan dalam proses penambangan data adalah data pada tabel training yang diberi nama tabel member.db. Model klasifikasi dari proses penambangan data yang diperoleh selanjutnya diimplementasikan ke dalam tabel tes untuk diuji tingkat keakuratannya. Atribut-atribut yang terdapat dalam tabel training sama dengan atribut-atribut yang terdapat dalam tabel tes, kecuali satu atribut tambahan dalam tabel tes yaitu atribut PREDIKSI. Atribut PREDIKSI digunakan untuk menghitung tingkat keakuratan model klasifikasi. Berikut ini atribut yang terdapat dalam tabel training : Tabel 3.1 Deskripsi Atribut Variable Tabel Training Variable Description CONTROLN Control number unique record identifier ODATE Origin Date. Date of donors first gift to PVA YYMM format YearMonth. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI Tabel 3.1 Deskripsi Atribut Variable Tabel Training Lanjutan Variable Description MAILCODE Mail Code PVASTATE Indicates whether the donor lives in a state served by the organizations EPVA chapter NOEXCH Do Not Exchange Flag For list rental RECINHSE In House File Flag RECP3 P3 File Flag RECPGVG Planned Giving File Flag RECSWEEP Sweepstakes file flag TCODE Donor title code MDMAUD The Major Donor Matrix code DOMAINX DOMAINCluster code. CLUSTER CLUSTER AGE Overlay Age AGEFLAG Age Flag HOMEOWNR Home Owner Flag NUMCHLD NUMBER OF CHILDREN INCOME HOUSEHOLD INCOME GENDER Gender WEALTH Wealth Rating MBCRAFT Buy Craft Hobby MBGARDEN Buy Gardening MBBOOKS Buy Books MBCOLECT Buy Collectables MAGFAML Buy General Family Mags MAGFEM Buy Female Mags MAGMALE Buy Sports Mags PUBGARDN Gardening Pubs PUBCULIN Culinary Pubs PUBHLTH Health Pubs PUBDOITY Do It Yourself Pubs PUBNEWFN News Finance Pubs PUBPHOTO Photography Pubs PUBOPP Opportunity Seekers Pubs DATASRCE Source of Overlay Data MALEMILI Males active in the Military VETS Vets GOV Employed by Gov SOLP3 SOLICIT LIMITATION CODE P3 SOLIH SOLICITATION LIMIT CODE IN HOUSE MAJOR Major Donor Flag COLLECT1 COLLECTABLE YESNO Tabel 3.1 Deskripsi Atribut Variable Tabel Training Lanjutan Variable Description VETERANS VETERANS YESNO BIBLE BIBLE READING YESNO CATLG SHOP BY CATALOG YESNO HOMEE WORK FROM HOME YESNO PETS HOUSEHOLD PETS YESNO CDPLAY CD PLAYER OWNERS YESNO STEREO STEREORECORDSTAPESCD YESNO PCOWNERS HOME PC OWNERSUSERS YESNO PHOTO PHOTOGRAPHY YESNO CRAFTS CRAFTS YESNO FISHER FISHING YESNO GARDENIN GARDENING YESNO BOATS POWER BOATING YESNO WALKER WALK FOR HEALTH YESNO KIDSTUFF BUYS CHILDRENS PRODUCTS YESNO CARDS STATIONARYCARDS BUYER YESNO PLATES PLATE COLLECTOR YESNO LIFESRC LIFE STYLE DATA SOURCE PEPSTRFL Indicates PEP Star RFA Status HPHONE_D Presence of a published home RFA_2R Recency code for RFA_2 RFA_2F Frequency code for RFA_2 RFA_2A Donation Amount code for RFA_2 MDMAUD_R Recency code for MDMAUD MDMAUD_F Frequecy code for MDMAUD MDMAUD_A Donation Amount code for MDMAUD CLUSTER2 Classic Cluster Code a nominal symbolic field GEOCODE2 County Size Code TARGET_B Indicator for Response to 97NK Mailing Nilai kejadian atribut-atribut di atas berada pada rentang nilai yang besar sehingga penulis melakukan pengelompokan nilai kejadian dengan rentang nilai yang lebih kecil untuk memudahkan proses pengambilan keputusan. Pengelompokan nilai kejadian dilakukan secara intuitif.