Indexing data testing Testing

1.8.2. Pemrosesan Data Testing

Data Testing: Surat 4 Yang bertanda tangan dibawah ini : Nama : Bambang Suprapto Umur : 37 No. KTP SIM : 243.115.25.98.78 Alamat : Perumahan Cemara Indah Blok C No. 30 Pekerjaan : Wiraswasta Untuk selanjutnya disebut sebagai Pemberi Kuasa Dengan ini menerangkan dan memberi kuasa kepada : Nama : Anton Herlambang Umur : 32 No. KTP SIM : 872.308.61.90.83 Alamat : Puri Cendrawasih Blok Cb No. 33 Pekerjaan : Manager Keuangan Untuk selanjutnya disebut sebagai Penerima Kuasa -------------------------------------------------KUASA KHUSUS---------------------------------------- Untuk menghadap kepada Notaris di Bandung guna menyelesaikan pembuatan akta notaris pembentukan Asosiasi Staf Akademik Seluruh Indonesia ASASI. Penerima kuasa dapat melakukan tindakan-tindakan lainnya yang penting dan berguna untuk kepentingan pembuatan akta notaris ASASI dan melakukan hal-hal yang selayaknya dilakukan oleh seorang penerima kuasa sesuai dengan peraturan perundang-undangan. Surat kuasa ini diberikan dengan hak substitusi baik sebagian maupun seluruhnya. Bandung, 01 Oktober 2005 Penerima Kuasa Pemberi Kuasa

1.8.2.1. Indexing data testing

Indexing terhadap data testing memiliki proses yang sama dengan indexing pada data training. Nilai term frequency tersebut akan digunakan untuk memangkatkan nilai conditional probabilities dari model. Karena memiliki proses yang sama dengan indexing terhadap data training, maka proses indexing pada data testing tidak akan dijelaskan secara mendetil. Urutan proses indexing pada data testing adalah sebagai berikut: a. Tokenization b. Normalization c. Stop word removal menggunakan stop list yang dilampirkan pada halaman d. Stemming menggunakan Porter stemmer e. Sorting grouping Tabel 2.18 Contoh hasil sorting grouping dari data testing surat 4 . terms tf i term frequency surat 4 akademik 1 akta 2 alamat 2 anton 1 asas 2 ... ...

1.8.2.2. Testing

a. Matching: Proses matching adalah proses untuk menemukan term yang sama – sama muncul pada model Tabel 2.17 maupun pada data testing Tabel 2.18 . Tabel 2.19 merupakan hasil matching menggunakan data utuh. Yaitu hasil penghitungan menyeluruh terhadap data yang diproses. Tabel 2.19 Hasil proses matching antara model dan data testing. Terms tf alamat 2 blok 2 herlambang 1 indah 1 kerja 2 ktp 2 kuasa 8 manajer 1 Hasil matching tersebut kemudian digabungkan dengan nilai conditional probabilities- nya. Tabel 2.20 Hasil matching beserta dengan nilai conditional probabilities-nya. Terms tf term frequency surat pengunduran diri surat lamaran kerja surat kuasa surat 1 surat 2 surat 3 alamat 2 0.003096 0.005305 0.009375 blok 2 0.003096 0.005305 0.009375 herlambang 1 0.003096 0.002653 0.00625 indah 1 0.003096 0.002653 0.00625 kerja 2 0.003096 0.013263 0.003125 ktp 2 0.003096 0.002653 0.009375 kuasa 8 0.003096 0.002653 0.015625 manajer 1 0.006192 0.005305 0.003125 nama 2 0.003096 0.005305 0.009375 nomor 4 0.006192 0.007958 0.01875 puri 1 0.003096 0.002653 0.00625 staf 1 0.003096 0.005305 0.003125 surat 1 0.006192 0.002653 0.00625 tanda 1 0.003096 0.002653 0.00625 tangan 1 0.003096 0.002653 0.00625 nama 2 nomor 4 puri 1 staf 1 surat 1 tanda 1 tangan 1 b. Hitung probabilitas: Untuk memudahkan kalkulasi pada bagian ∏ �� � | � 1 ≤�≤� � , maka persamaan tersebut akan dihitung terlebih dahulu dalam bentuk tabel seperti di bawah. Untuk sebuah term yang kemunculannya lebih dari satu kali, pangkatkan nilai conditional probabilities-nya pada Tabel 2.20 dengan term frequency masing - masing. Kemudian jumlahkan nilainya untuk masing-masing kelas. Contoh, term ‘alamat’ memiliki term frequency sebanyak 2 kali. Pangkatkan nilainya untuk menyederhanakan penghitungan. �������|surat lamaran kerja = 0.005305 2 = 2.8143E − 05 Tabel 2.21 Hasil perkalian nilai conditional probabilities dengan term frequency-nya. Terms surat pengunduran diri surat lamaran kerja surat kuasa surat 1 surat 2 surat 3 alamat 9.58522E-06 2.8143E-05 8.78906E-05 blok 9.58522E-06 2.8143E-05 8.78906E-05 herlambang 0.003096 0.002653 0.00625 indah 0.003096 0.002653 0.00625 kerja 9.58522E-06 0.00017591 9.76563E-06 ktp 9.58522E-06 7.0384E-06 8.78906E-05 kuasa 8.44127E-21 2.4541E-21 3.55271E-15 manager 0.006192 0.005305 0.003125 nama 9.58522E-06 2.8143E-05 8.78906E-05 no 1.47002E-09 4.0107E-09 1.23596E-07 puri 0.003096 0.002653 0.00625 staf 0.003096 0.005305 0.003125 surat 0.006192 0.002653 0.00625 tanda 0.003096 0.002653 0.00625 tangan 0.003096 0.002653 0.00625 Total 3.39007E-74 2.6655E-72 1.48941E-61 Dapatkan nilai probabilitas dari surat 4 terhadap seluruh kelas dengan cara mengalikan nilai prior probabilities dengan total nilai conditional probabilities Tabel 2.21 untuk masing – masing kelas. Probabilitas dari surat 4 terhadap kelas surat pengunduran diri: Psurat pengunduran diri|surat 4 = 13 3.39007E-74 = 1.12991E-74 Probabilitas dari surat 4 terhadap kelas surat lamaran kerja: Psurat lamaran kerja|surat 4 = 13 2.6655E-72 = 8.8841E-73 Probabilitas dari surat 4 terhadap kelas surat kuasa: Psurat kuasa|surat 4 = 13 1.48941E-61 = 4.96422E-62 Dari hasil perhitungan probabilitas di atas diketahui bahwa probabilitas surat 4 terhadap kelas surat kuasa memiliki nilai yang paling tinggi, yaitu 4.96422E-62. Sehingga ����� 4 masuk ke dalam kelas surat kuasa.

1.8.3. Hitung Precision