1.8.2. Pemrosesan Data Testing
Data Testing:
Surat
4
Yang bertanda tangan dibawah ini : Nama
: Bambang Suprapto Umur
: 37 No. KTP SIM
: 243.115.25.98.78 Alamat
: Perumahan Cemara Indah Blok C No. 30 Pekerjaan
: Wiraswasta Untuk selanjutnya disebut sebagai Pemberi Kuasa
Dengan ini menerangkan dan memberi kuasa kepada : Nama
: Anton Herlambang Umur
: 32 No. KTP SIM
: 872.308.61.90.83 Alamat
: Puri Cendrawasih Blok Cb No. 33 Pekerjaan
: Manager Keuangan Untuk selanjutnya disebut sebagai Penerima Kuasa
-------------------------------------------------KUASA KHUSUS---------------------------------------- Untuk menghadap kepada Notaris di Bandung guna menyelesaikan pembuatan akta notaris
pembentukan Asosiasi Staf Akademik Seluruh Indonesia ASASI. Penerima kuasa dapat melakukan tindakan-tindakan lainnya yang penting dan berguna untuk
kepentingan pembuatan akta notaris ASASI dan melakukan hal-hal yang selayaknya dilakukan oleh seorang penerima kuasa sesuai dengan peraturan perundang-undangan.
Surat kuasa ini diberikan dengan hak substitusi baik sebagian maupun seluruhnya.
Bandung, 01 Oktober 2005 Penerima Kuasa
Pemberi Kuasa
1.8.2.1. Indexing data testing
Indexing terhadap data testing memiliki proses yang sama dengan indexing pada data training. Nilai term frequency tersebut akan digunakan untuk memangkatkan nilai
conditional probabilities dari model.
Karena memiliki proses yang sama dengan indexing terhadap data training, maka proses indexing pada data testing tidak akan dijelaskan secara mendetil. Urutan proses
indexing pada data testing adalah sebagai berikut: a.
Tokenization b.
Normalization c.
Stop word removal menggunakan stop list yang dilampirkan pada halaman d.
Stemming menggunakan Porter stemmer e.
Sorting grouping
Tabel 2.18 Contoh hasil sorting grouping dari data testing surat
4
.
terms tf
i
term frequency surat
4
akademik 1
akta 2
alamat 2
anton 1
asas 2
... ...
1.8.2.2. Testing
a. Matching:
Proses matching adalah proses untuk menemukan term yang sama – sama muncul pada model
Tabel 2.17
maupun pada data testing
Tabel 2.18
.
Tabel 2.19
merupakan hasil matching menggunakan data utuh. Yaitu hasil penghitungan menyeluruh terhadap data yang diproses.
Tabel 2.19 Hasil proses matching antara model dan data testing.
Terms tf
alamat 2
blok 2
herlambang 1
indah 1
kerja 2
ktp 2
kuasa 8
manajer 1
Hasil matching tersebut kemudian digabungkan dengan nilai conditional probabilities- nya.
Tabel 2.20 Hasil matching beserta dengan nilai conditional probabilities-nya.
Terms tf
term frequency
surat pengunduran
diri surat
lamaran kerja
surat kuasa
surat
1
surat
2
surat
3
alamat
2 0.003096
0.005305 0.009375
blok
2 0.003096
0.005305 0.009375
herlambang
1 0.003096
0.002653 0.00625
indah
1 0.003096
0.002653 0.00625
kerja
2 0.003096
0.013263 0.003125
ktp
2 0.003096
0.002653 0.009375
kuasa
8 0.003096
0.002653 0.015625
manajer
1 0.006192
0.005305 0.003125
nama
2 0.003096
0.005305 0.009375
nomor
4 0.006192
0.007958 0.01875
puri
1 0.003096
0.002653 0.00625
staf
1 0.003096
0.005305 0.003125
surat
1 0.006192
0.002653 0.00625
tanda
1 0.003096
0.002653 0.00625
tangan
1 0.003096
0.002653 0.00625
nama 2
nomor 4
puri 1
staf 1
surat 1
tanda 1
tangan 1
b. Hitung probabilitas:
Untuk memudahkan kalkulasi pada bagian ∏
��
�
| �
1 ≤�≤�
�
, maka persamaan tersebut akan dihitung terlebih dahulu dalam bentuk tabel seperti di bawah.
Untuk sebuah term yang kemunculannya lebih dari satu kali, pangkatkan nilai conditional probabilities-nya pada Tabel 2.20 dengan term frequency masing - masing.
Kemudian jumlahkan nilainya untuk masing-masing kelas.
Contoh, term ‘alamat’ memiliki term frequency sebanyak 2 kali. Pangkatkan nilainya untuk menyederhanakan penghitungan.
�������|surat lamaran kerja =
0.005305
2
= 2.8143E − 05
Tabel 2.21 Hasil perkalian nilai conditional probabilities dengan term frequency-nya.
Terms surat
pengunduran diri
surat lamaran
kerja surat kuasa
surat
1
surat
2
surat
3
alamat
9.58522E-06 2.8143E-05
8.78906E-05
blok
9.58522E-06 2.8143E-05
8.78906E-05
herlambang
0.003096 0.002653
0.00625
indah
0.003096 0.002653
0.00625
kerja
9.58522E-06 0.00017591
9.76563E-06
ktp
9.58522E-06 7.0384E-06
8.78906E-05
kuasa
8.44127E-21 2.4541E-21
3.55271E-15
manager
0.006192 0.005305
0.003125
nama
9.58522E-06 2.8143E-05
8.78906E-05
no
1.47002E-09 4.0107E-09
1.23596E-07
puri
0.003096 0.002653
0.00625
staf
0.003096 0.005305
0.003125
surat
0.006192 0.002653
0.00625
tanda
0.003096 0.002653
0.00625
tangan
0.003096 0.002653
0.00625
Total
3.39007E-74 2.6655E-72
1.48941E-61
Dapatkan nilai probabilitas dari surat
4
terhadap seluruh kelas dengan cara mengalikan nilai prior probabilities dengan total nilai conditional probabilities
Tabel 2.21
untuk masing – masing kelas.
Probabilitas dari surat
4
terhadap kelas surat pengunduran diri:
Psurat pengunduran diri|surat
4
= 13 3.39007E-74 = 1.12991E-74
Probabilitas dari surat
4
terhadap kelas surat lamaran kerja:
Psurat lamaran kerja|surat
4
= 13 2.6655E-72 = 8.8841E-73
Probabilitas dari surat
4
terhadap kelas surat kuasa:
Psurat kuasa|surat
4
= 13 1.48941E-61 = 4.96422E-62
Dari hasil perhitungan probabilitas di atas diketahui bahwa probabilitas surat
4
terhadap
kelas surat kuasa memiliki nilai yang paling tinggi, yaitu 4.96422E-62. Sehingga
�����
4
masuk ke dalam kelas surat kuasa.
1.8.3. Hitung Precision