yang berisi atribut-atribut penting yang sesuai dengan tuntutan informasi yang ingin digali seperti atribut yang dijelaskan pada poin a di atas.
d. Bentuk Standar
Bentuk standar adalah adalah bentuk data yang akan diakses oleh algoritma data mining. Data dalam penelitian ini dibuat dalam bentuk binary valued data.
Pengubahan data dalam bentuk binary valued data dilakukan dengan menggunakan software LUCS-KDD-DN yang dikembangkan oleh The University of Liverpool
3.1.2. Input Sche ma
Proses input schema diawali dengan menetapkan atribut-atribut yang akan dicari pola asosiasinya. Schema dibuat dalam tiga baris teks yang masing- masing berisi urutan dari
N literal yang dipisahkan dengan spasi, dimana N adalah jumlah atribut dalam kumpulan data yang akan dikonversi.
Baris pe rtama: digunakan untuk mendiskripsikan “type” dari setiap field dengan
pilihan : Unused, nominal, integer dan double
Baris kedua: digunakan untuk mendiskripsikan untuk pemberian nama fields hal ini
akan berfungsi untuk mencocokkan nomor kolom yang terkandung dalam Association Rules dan CAR untuk keluaran schema
Baris ke tiga: digunakan untuk mendiskripsikan legal value dari setiap dataitem.
Misalnya untuk tipe Unuseds, integer dan double digunakan literal Null sedangkan nilai nominal digunakan karakter dengan tanda “”
backslash Maka input schema data NUPTK adalah sebagai berikut:
Ga mbar 3. Input Schema Data NUPTK
3.1.3. List Input Schema
Dari hasil input schema sebagaimana dijelaskan pada poin 3.2.2 diperoleh schema yang berisi atribut-atribut yang akan dimining, sebagai berikut:
1 int: ID 2 int: NUPTK
3 int: TingkatPend 4 int: MapelSertfikasi
5 nominal: TingkatSekolah { RA TK MI SD MTS SMP MA SMA SMK } 6 int: usia
7 int: PLPG 8 int: MsKerjaGuru
9 nominal: Sertifikasi { 1 2 3 }
3.1.4.. Input Data
Data set NUPTK diubah dalam format Comma Separated yang disimpan dalam bentuk file notepad. Berikut ini adalah sebagian input data set NUPTK dalam format
Comma Separated
1,1,1,1,SM P,33,1,11,1 2,1,1,1,SM P,32,1,11,1
3,0,0,0,SM P,49,0,15,3 4,1,1,1,SMA,41,1,15,1
5,1,0,0,SD,51,0,25,3 6,1,1,1,SD,40,1,12,1
7,1,0,1,SD,46,0,13,2 8,1,0,1,SD,52,0,26,2
9,1,1,1,SD,54,1,27,1 10,1,1,1,SMA,32,1,12,1
…
3.2.4. List Input Data
Dari hasil input data sebagaimana dije laskan pada poin 3.2.4 diperoleh data
dalam format Comma Separated
. Berikut in i adalah sebagian data set NUPTK setelah me lalu i proses running menggunakan software
LUCS-KDD-DN
1.0 1.0 1.0 1.0 5.0 33.0 1.0 11.0 0.0 2.0 1.0 1.0 1.0 5.0 32.0 1.0 11.0 0.0
3.0 0.0 0.0 0.0 5.0 49.0 0.0 15.0 2.0 4.0 1.0 1.0 1.0 7.0 41.0 1.0 15.0 0.0
5.0 1.0 0.0 0.0 3.0 51.0 0.0 25.0 2.0 6.0 1.0 1.0 1.0 3.0 40.0 1.0 12.0 0.0
7.0 1.0 0.0 1.0 3.0 46.0 0.0 13.0 1.0 8.0 1.0 0.0 1.0 3.0 52.0 0.0 26.0 1.0
9.0 1.0 1.0 1.0 3.0 54.0 1.0 27.0 0.0 10.0 1.0 1.0 1.0 7.0 32.0 1.0 12.0 0.0
…
3.2.4. Normalisasi Data