3.2.2 Transformasi Data
Pada tahap ini dilakukan pembuangan data yang tidak diperlukan seperti data-data yang kurang relevan dalam penelitian. Dari data mentah
yang diperoleh, akan dilakukan penghapusan atribut tahun dan nomor rekam medis karena dianggap tidak begitu berpengaruh sebagai variabel
penentu dalam melakukan klasifikasi. Maka atribut yang dihasilkan dari proses seleksi adalah sebagai berikut :
a. Usia ibu
b. Usia kandunagn
c. Berat badan
d. Tinggi badan
e. Hemoglobin
f. Hematokrit
g. Lekosit
h. Trombosit
i. Eritrosit
j. Glukosa
k. Protein
l. HbsAG
m. Pinggul sempit
n. Hamil primi
o. Tunggalganda
p. Letak
q. Presentasi
r. Riwayat partus
s. Riwayat abortuscurret
t. Diabetes
u. Ginjal
v. Hipertensi
w. Jantung
x. Kanker
y. Lain-lain
z. Kisaran berat bayi
aa. Ketuban pecah dini
bb. Partus
Pada tahap selanjutnya dilakukan peringkasan data atau proses pengubahan data mentah menjadi data yang mudah dikelola. Dari data
yang diperoleh, sebagian besar berupa angka yang beragam, sehingga perlu dilakukan pengelompokkan data berdasarkan jangkauan tertentu.
Atribut yang berisi data numerik akan dikelompokkan sesuai identifikasi dalam ilmu kesehatan. Dilakukan pengelompokan nilai atribut berdasar
sumber yang diperoleh dari beberapa website atau blog kesehatan sebagai berikut : www.alodokter.com, bidanku.com, www.babyfluffy.com,
healthy.detik.com, www.kompasiana.com, dan ririnprabandarisilalahi. blogspot.co.id.
Nilai atribut dari semua data yang digunakan, baik nilai atribut yang dikelompokkan dalam nilai tertentu atau tidak dikelompokkan akan
diubah menjadi nilai 1, 2, 3. Perubahan data numerik dan non numerik adalah sebagai berikut :
a. Usia ibu
i. 20 atau 35
beresiko = 1 ii.
20-35 normal = 2
b. Usia kandungan
i. 37 atau 42
beresiko = 1 ii.
37-42 normal = 2
c. Berat badan
i. 55 atau 80
beresiko = 1 ii.
55-80 normal = 2
d. Tinggi badan
i. 145
beresiko = 1 ii.
=145 normal = 2
e. Hemoglobin
i. 11.00 atau 15.00
beresiko = 1 ii.
11.00-15.00 normal = 2
f. Hematokrit
i. 30.00 atau 46.00
beresiko = 1 ii.
30.00-46.00 normal = 2
g. Lekosit
i. 10.00 atau 15.00
beresiko = 1 ii.
10.00-15.00 normal = 2
h. Trombosit
i. 200 atau 400
beresiko = 1 ii.
200-400 normal = 2
i. Eritrosit
i. 4.00 atau 5.50
beresiko = 1 ii.
4.00-5.50 normal = 2
j. Kisaran berat bayi
i. 2500
beresiko = 1 ii.
2500-4000 normal = 2
iii. 4000
obesitas = 3 k.
Glukosa, protein, HbsAG i.
Negatif = 1 ii.
Positif = 2 iii.
Trace = 3 l.
Pinggul sempit, hamil primi, riwayat abortus, diabetes, ginjal, hipertensi, jantung, kanker, lain-lain, ketuban pecah dini
i. Tidak = 1
ii. Ya = 2
m. Tunggalganda
i. Ganda = 1
ii. Tunggal = 2
n. Letak
i. Melintang = 1
ii. Memanjang = 2
o. Presentasi
i. Bokong = 1
ii. Kepala = 2
p. Riwayat partus
i. SC = 1
ii. Spontan = 2
iii. Tidak ada = 3
q. Partus
i. SC = 1
ii. Spontan = 2
Pada tahap ini juga dilakukan pengisian data yang tidak diketahui nilainya
missing value
. Untuk setiap data yang tidak diketahui nilainya akan diisi dengan nilai terbanyak dari setiap atribut. Contoh data yang
sudah melewati tahap transformasi ditampilkan pada tabel 3.3 berikut : Tabel 3. 3 Contoh Data Setelah Tahap Transformasi
3.2.3 Data