Tanda dan Gejala Klinis Diagnosis

BAB III PERANCANGAN SISTEM

Dalam bab metodologi penelitian ini akan dikaji tiga hal, yaitu 1 sumber data, 2 analisis pengolahan data, 3 desain antarmuka sistem. Ketiga hal tersebut akan dibahas satu per satu dalam subbab yang ada di bawah ini.

3.1 Sumber Data

Dalam penelitian ini, obyek yang digunakan adalah data Wisconsin Breast Cancer Database dari Dr.William H.Woldberg 1989-1991, University of Wisconsin Hospitals, Madison, USA. Data berjumlah 699, dengan atribut sebanyak 11 termasuk atribut kelas. Didalam file tersebut berisi data satu pasien dengan rincian sebagai berikut: Tabel 3.1 Data Atribut Wisconsin Diagnosis Breast Cancer No Nama Atribut Keterangan Nilai 1. ID Nomor kode sampel Nomor Id 2. Ketebalan Clump Atribut ini menentukan apakah sel berlayer atau tidak karena sel tumor jinak benign celss cenderung hanya mempunyai satu layer monolayer sedangkan sel ganas cenderung mempunyai banyak layer multilayer. 1-10 3. Keseragaman ukuran sel Atribut ini menentukan konsistensi ukuran sel. 1-10 4. Keseragaman bentuk sel Atribut ini menentukan kesamaan bentuk sel. 1-10 5. Adhesi Marginal Atribut ini menentukan apakah sel- sel bersama sama atau tidak karena sel ganas cenderung kehilangan kemampuan ini. 1-10 6. Ukuran sel tunggal epitel Atribut ini menentukan apakah ephitelial cell cenderung membesar atau tidak. 1-10 7. Bare Nuclei Atribut ini menentukan apakah sel dikelilingi sitoplasma sisa sel atau tidak. 1-10 8. Bland Kromatin Atribut ini menentukan tingkat tekstur dari sel kromatin. 1-10 9. Nukleous Normal Atribut ini menentukan bentuk dari nucleoli. 1-10 10. Mitosis Atribut ini menentukan seberapa banyak sel kanker membagi, membelah atau memperbanyak dirinya. 1-10 11. Kelas Atribut ini menentukan kelas apakah tumor yang diderita jinak atau parah. 2 untuk Benign dan 4 untuk Malignant.

3.2 Analisis Pengolahan Data

Sebelum data diolah menggunakan sistem, dilakukan pemrosesan data awal terlebih dahulu sesuai dengan proses KDD. Ada empat langkah pemrosesan data yaitu 1 pembersihan data, 2 seleksi data, 3 transformasi data, dan 4 penambangan data.

3.2.1 Pembersihan Data

Pada tahap ini, dilakukan pembersihan terhadap data-data yang tidak lengkap, kosong atau null, data yang mengandung noise, dan data tidak konsisten. Pada tahap ini data yang bernilai null atau kosong, akan dibersihkan dengan cara dihapus secara manual, dan akan dilakukan penghapusan attribut ID serta akan mengganti . Pembersihan data dilakukan setelah proses integrasi dan seleksi data dilakukan. Proses integrasi akan memudahkan proses pencarian data, sementara seleksi data akan mengurangi jumlah data yang akan dibersihkan. Berikut rincian data yang akan dibersihkan: