3.2.2 Transformasi Data
Pada tahap ini dilakukan pembuangan data yang tidak diperlukan seperti data-data yang kurang relevan dalam penelitian. Dari data mentah
yang diperoleh, akan dilakukan penghapusan atribut tahun dan nomor rekam medis karena dianggap tidak begitu berpengaruh sebagai variabel
penentu dalam melakukan klasifikasi. Maka atribut yang dihasilkan dari proses seleksi adalah sebagai berikut :
a. Usia ibu
b. Usia kandunagn
c. Berat badan
d. Tinggi badan
e. Hemoglobin
f. Hematokrit
g. Lekosit
h. Trombosit
i. Eritrosit
j. Glukosa
k. Protein
l. HbsAG
m. Pinggul sempit
n. Hamil primi
o. Tunggalganda
p. Letak
q. Presentasi
r. Riwayat partus
s. Riwayat abortuscurret
t. Diabetes
u. Ginjal
v. Hipertensi
w. Jantung
x. Kanker
y. Lain-lain
z. Kisaran berat bayi
aa. Ketuban pecah dini
bb. Partus
Pada tahap selanjutnya dilakukan peringkasan data atau proses pengubahan data mentah menjadi data yang mudah dikelola. Dari data
yang diperoleh, sebagian besar berupa angka yang beragam, sehingga perlu dilakukan pengelompokkan data berdasarkan jangkauan tertentu.
Atribut yang berisi data numerik akan dikelompokkan sesuai identifikasi dalam ilmu kesehatan. Dilakukan pengelompokan nilai atribut berdasar
sumber yang diperoleh dari beberapa website atau blog kesehatan sebagai berikut : www.alodokter.com, bidanku.com, www.babyfluffy.com,
healthy.detik.com, www.kompasiana.com, dan ririnprabandarisilalahi. blogspot.co.id.
Nilai atribut dari semua data yang digunakan, baik nilai atribut yang dikelompokkan dalam nilai tertentu atau tidak dikelompokkan akan
diubah menjadi nilai 1, 2, 3. Perubahan data numerik dan non numerik adalah sebagai berikut :
a. Usia ibu
i. 20 atau 35 beresiko = 1
ii. 20-35 normal = 2
b. Usia kandungan
i. 37 atau 42 beresiko = 1
ii. 37-42 normal = 2
c. Berat badan
i. 55 atau 80 beresiko = 1
ii. 55-80 normal = 2
d. Tinggi badan
i. 145 beresiko = 1
ii. =145 normal = 2
e. Hemoglobin
i. 11.00 atau 15.00 beresiko = 1
ii. 11.00-15.00 normal = 2
f. Hematokrit
i. 30.00 atau 46.00 beresiko = 1
ii. 30.00-46.00 normal = 2
g. Lekosit
i. 10.00 atau 15.00 beresiko = 1
ii. 10.00-15.00 normal = 2
h. Trombosit
i. 200 atau 400 beresiko = 1
ii. 200-400 normal = 2
i. Eritrosit
i. 4.00 atau 5.50 beresiko = 1
ii. 4.00-5.50 normal = 2
j. Kisaran berat bayi
i. 2500 beresiko = 1
ii. 2500-4000 normal = 2
iii. 4000 obesitas = 3
k. Glukosa, protein, HbsAG
i. Negatif = 1
ii. Positif = 2
iii. Trace = 3
l. Pinggul sempit, hamil primi, riwayat abortus, diabetes, ginjal,
hipertensi, jantung, kanker, lain-lain, ketuban pecah dini i.
Tidak = 1 ii.
Ya = 2 m.
Tunggalganda i.
Ganda = 1 ii.
Tunggal = 2 PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
n. Letak
i. Melintang = 1
ii. Memanjang = 2
o. Presentasi
i. Bokong = 1
ii. Kepala = 2
p. Riwayat partus
i. SC = 1
ii. Spontan = 2
iii. Tidak ada = 3
q. Partus
i. SC = 1
ii. Spontan = 2
Pada tahap ini juga dilakukan pengisian data yang tidak diketahui nilainya missing value. Untuk setiap data yang tidak diketahui nilainya
akan diisi dengan nilai terbanyak dari setiap atribut. Contoh data yang sudah melewati tahap transformasi ditampilkan pada tabel 3.3 berikut :
Tabel 3. 3 Contoh Data Setelah Tahap Transformasi PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3.2.3 Data Testing dan Data Training