Scanner Audio-Video Capture OCRICR

e. Peralatan Imaging

1. Scanner

Scanner merupakan hardware device yang dapat mengkonvert image analog ke dalam image digital. Dokumen kertas ditangkap oleh sumber cahaya secara refleks dan direkam secara refleks melalui charge coupled device CCDs. CCDs merupakan instrumen analog sinar yang sensitive yang secara terus menerus membaca sinar secara intensif. Scanner akan mengambil sinyal analog, mengkonversi analog ke digital, dan mengumpulkan bacaan tersebut untuk diletakan dalam dokumen. Informasi ini kemudian dikompres. Data digital ditampilkan dalam DPI. Apabila dokumen tidak dapat ditelusur menggunakan aplikasi berbasis isi dokumen, kemudian konversi image ke dalam mesin pembaca teks tidak diperlukan. Proses OCR diperlukan dan DPI yang rendah bisa didapat. Isu teknis dalam pemilihan scanner : 1. Kedalaman Pixed, Resolusi dan Ukuran File 2. Kecepatan 3. Flatbad Vs. Sheetfed Apabila kita akan menscan setumpuk kertas dengan cepat, maka gunakanlah sheetfed, tetapi apabila yang dibutuhkan adalah scanner untuk mencan halaman tunggal maka gunakanlah flatbed. 4. Duplex Vs Simplex Scanner Duplex dapat menscan halaman muka dan belakang dengan cepat dan mudah. Duplexing terdapat pada scanner sheetfed dan ADF dari flatbed. 5. Paper Handling 21

2. Audio-Video Capture

Teknologi ini harus dapat mengkonversi dokumen kertas ke dalam image digital dan indeks data. Image disimpan sebagai file TIFF pada sistem penyimpanan optikal dan diindeks serta disimpan di dalam database relational.

3. OCRICR

Bagian kunci dari dokumen scanning adalah optical character recognition OCR. OCR merupakan teknologi tambahan pada scanner dokumen. OCR berarti objek teks dalam dokumen dikonvert dari bit-mapped image ke dalam representasi teks seperti ASCII. Scanner memisahkan dokumen ke dalam elemen gambar yang disebut pixels. Kumpulan pixel dari karakter alphanumeric dibaca oleh software OCR, dan diterjemahkan ke dalam karakter ASCII dengan tepat atau ke dalam kode lainnya yang dapat dibaca oleh mesin. Ada dua metodologi atau pendekatan untuk menangkap karapter huruf, yaitu : template-matching dan topological analysis.

1. Template-Matching