Dalam tugas akhir ini sampel data yang digunakan sebanyak 350 records
dan 67 atribut. Sampel data tersebut diambil dari dataset donatur organisasi veteran Amerika yang disediakan oleh situs
http:kdd.ics.uci.edu databases kddcup98 kddcup98.html .
B. Perancangan Sistem
1. Input
Data-data yang diperoleh dibagi dalam dua tabel secara random yaitu sebagai tabel training dan tabel tes. Data yang akan digunakan dalam
proses penambangan data adalah data pada tabel training yang diberi nama tabel member.db. Model klasifikasi dari proses penambangan data yang
diperoleh selanjutnya diimplementasikan ke dalam tabel tes untuk diuji tingkat keakuratannya.
Atribut-atribut yang terdapat dalam tabel training sama dengan atribut-atribut yang terdapat dalam tabel tes, kecuali satu atribut tambahan
dalam tabel tes yaitu atribut PREDIKSI. Atribut PREDIKSI digunakan untuk menghitung tingkat keakuratan model klasifikasi.
Berikut ini atribut yang terdapat dalam tabel training :
Tabel 3.1 Deskripsi Atribut Variable Tabel Training
Variable Description
CONTROLN Control number unique record identifier
ODATE Origin Date. Date of donors first gift to PVA YYMM
format YearMonth. PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Tabel 3.1 Deskripsi Atribut Variable Tabel Training Lanjutan
Variable Description
MAILCODE Mail Code
PVASTATE Indicates whether the donor lives in a state served by the
organizations EPVA chapter
NOEXCH Do Not Exchange Flag For list rental
RECINHSE In House File Flag
RECP3 P3 File Flag
RECPGVG Planned Giving File Flag
RECSWEEP Sweepstakes file flag
TCODE Donor title code
MDMAUD The Major Donor Matrix code
DOMAINX DOMAINCluster code.
CLUSTER CLUSTER AGE
Overlay Age AGEFLAG Age
Flag HOMEOWNR
Home Owner Flag NUMCHLD NUMBER
OF CHILDREN
INCOME HOUSEHOLD INCOME
GENDER Gender
WEALTH Wealth Rating
MBCRAFT Buy Craft Hobby
MBGARDEN Buy Gardening
MBBOOKS Buy Books
MBCOLECT Buy Collectables
MAGFAML Buy General Family Mags
MAGFEM Buy Female Mags
MAGMALE Buy Sports Mags
PUBGARDN Gardening Pubs
PUBCULIN Culinary Pubs
PUBHLTH Health Pubs
PUBDOITY Do It Yourself Pubs
PUBNEWFN News Finance Pubs
PUBPHOTO Photography Pubs
PUBOPP Opportunity Seekers Pubs
DATASRCE Source of Overlay Data
MALEMILI Males active in the Military
VETS Vets
GOV Employed by Gov
SOLP3 SOLICIT LIMITATION CODE P3
SOLIH SOLICITATION LIMIT CODE IN HOUSE
MAJOR Major Donor Flag
COLLECT1 COLLECTABLE YESNO
Tabel 3.1 Deskripsi Atribut Variable Tabel Training Lanjutan
Variable Description
VETERANS VETERANS YESNO
BIBLE BIBLE READING YESNO
CATLG SHOP BY CATALOG YESNO
HOMEE WORK FROM HOME YESNO
PETS HOUSEHOLD PETS YESNO
CDPLAY CD PLAYER OWNERS YESNO
STEREO STEREORECORDSTAPESCD YESNO
PCOWNERS HOME PC OWNERSUSERS YESNO
PHOTO PHOTOGRAPHY YESNO
CRAFTS CRAFTS YESNO
FISHER FISHING YESNO
GARDENIN GARDENING YESNO
BOATS POWER BOATING YESNO
WALKER WALK FOR HEALTH YESNO
KIDSTUFF BUYS CHILDRENS PRODUCTS YESNO
CARDS STATIONARYCARDS BUYER YESNO
PLATES PLATE COLLECTOR
YESNO LIFESRC
LIFE STYLE DATA SOURCE PEPSTRFL Indicates
PEP Star RFA Status HPHONE_D
Presence of a published home RFA_2R
Recency code for RFA_2 RFA_2F
Frequency code for RFA_2 RFA_2A Donation
Amount code for RFA_2
MDMAUD_R Recency code for MDMAUD
MDMAUD_F Frequecy code for MDMAUD
MDMAUD_A Donation Amount code for MDMAUD
CLUSTER2 Classic Cluster Code a nominal symbolic field
GEOCODE2 County Size Code
TARGET_B Indicator for Response to 97NK Mailing
Nilai kejadian atribut-atribut di atas berada pada rentang nilai yang besar sehingga penulis melakukan pengelompokan nilai kejadian dengan
rentang nilai yang lebih kecil untuk memudahkan proses pengambilan keputusan. Pengelompokan nilai kejadian dilakukan secara intuitif.