BAB III PERANCANGAN SISTEM
Dalam bab metodologi penelitian ini akan dikaji tiga hal, yaitu 1 sumber data, 2 analisis pengolahan data, 3 desain antarmuka sistem. Ketiga hal tersebut akan
dibahas satu per satu dalam subbab yang ada di bawah ini.
3.1 Sumber Data
Dalam penelitian ini, obyek yang digunakan adalah data Wisconsin Breast Cancer Database dari Dr.William H.Woldberg 1989-1991, University of Wisconsin
Hospitals, Madison, USA. Data berjumlah 699, dengan atribut sebanyak 11 termasuk atribut kelas. Didalam file tersebut berisi data satu pasien dengan rincian sebagai
berikut: Tabel 3.1 Data Atribut Wisconsin Diagnosis Breast Cancer
No Nama Atribut
Keterangan Nilai
1. ID
Nomor kode sampel Nomor Id
2. Ketebalan Clump
Atribut ini menentukan apakah sel berlayer atau tidak karena sel tumor
jinak benign celss cenderung hanya
mempunyai satu
layer monolayer sedangkan sel ganas
cenderung mempunyai
banyak layer multilayer.
1-10
3. Keseragaman ukuran
sel Atribut ini menentukan konsistensi
ukuran sel. 1-10
4. Keseragaman bentuk
sel Atribut ini menentukan kesamaan
bentuk sel. 1-10
5. Adhesi Marginal
Atribut ini menentukan apakah sel- sel bersama sama atau tidak karena
sel ganas cenderung kehilangan kemampuan ini.
1-10
6. Ukuran sel tunggal
epitel Atribut ini menentukan apakah
ephitelial cell cenderung membesar atau tidak.
1-10
7. Bare Nuclei
Atribut ini menentukan apakah sel dikelilingi sitoplasma sisa sel atau
tidak. 1-10
8. Bland Kromatin
Atribut ini menentukan tingkat tekstur dari sel kromatin.
1-10
9. Nukleous Normal
Atribut ini menentukan bentuk dari nucleoli.
1-10
10. Mitosis
Atribut ini menentukan seberapa banyak
sel kanker
membagi, membelah
atau memperbanyak
dirinya. 1-10
11. Kelas
Atribut ini menentukan kelas apakah tumor yang diderita
jinak atau parah. 2 untuk Benign
dan 4
untuk Malignant.
3.2 Analisis Pengolahan Data
Sebelum data diolah menggunakan sistem, dilakukan pemrosesan data awal terlebih dahulu sesuai dengan proses KDD. Ada empat langkah pemrosesan data yaitu
1 pembersihan data, 2 seleksi data, 3 transformasi data, dan 4 penambangan data.
3.2.1 Pembersihan Data
Pada tahap ini, dilakukan pembersihan terhadap data-data yang tidak lengkap, kosong atau null, data yang mengandung noise, dan data tidak konsisten. Pada tahap ini
data yang bernilai null atau kosong, akan dibersihkan dengan cara dihapus secara manual, dan akan dilakukan penghapusan attribut ID serta akan mengganti .
Pembersihan data dilakukan setelah proses integrasi dan seleksi data dilakukan. Proses integrasi akan memudahkan proses pencarian data, sementara seleksi data akan
mengurangi jumlah data yang akan dibersihkan. Berikut rincian data yang akan dibersihkan: