a. Server
Server harus dipilih dari produk yang handal dari produsen yang baik dan berkualitas branded, karena akan dioperasikan selama 24 jam secara terus
menerus tanpa ‘down time’. Server yang dibutuhkan yaitu server dengan kapasitas besar Large Capacity Server. Selain itu untuk memudahkan migrasi dan
skalabiliti maka dipilih platform yang terbuka, yaitu yang berbasiskan prosesor Intel atau sejenisnya.
b. Workstation
PC workstation yang dibutuhkan dapat dipilih dari produk kelas menengah maupun lokal dari produsen yang baik dan berkualitas. Untuk memudahkan
skalabiliti maka dipilih platform yang berbasiskan teknologi Intel dan Microsoft Windows.
c. Printer
Printer yang dibutuhkan bergantung kepada aplikasi Sistem Informasi yang fungsinya dapat diklasifikasi sebagai berikut:
- Folio printer, registration printer dan cheque-slip printer menggunakan
jenis dot matriks 80 kolom. -
Report printer, dot matriks 132 kolom, 400 cps -
High speed printer, minimal 750 cps digunakan sebagai sistem atau shared printer
d. UPS Power Backup
UPS diutamakan untuk membackup server adalah jenis online sinus dengan kapasitas minimal 1 KVA. Pemakaian UPS dapat diperluas untuk
workstation-workstation yang berada pada lokasi tergolong kritis seperti distributor dan outlet. Kapasitas yang diperlukan tentunya disesuaikan dengan
besarnya beban.
20
e. Peralatan Imaging
1. Scanner
Scanner merupakan hardware device yang dapat mengkonvert image analog ke dalam image digital. Dokumen kertas ditangkap oleh sumber cahaya
secara refleks dan direkam secara refleks melalui charge coupled device CCDs. CCDs merupakan instrumen analog sinar yang sensitive yang
secara terus menerus membaca sinar secara intensif. Scanner akan mengambil sinyal analog, mengkonversi analog ke digital, dan
mengumpulkan bacaan tersebut untuk diletakan dalam dokumen. Informasi ini kemudian dikompres.
Data digital ditampilkan dalam DPI. Apabila dokumen tidak dapat ditelusur menggunakan aplikasi berbasis isi dokumen, kemudian konversi image ke
dalam mesin pembaca teks tidak diperlukan. Proses OCR diperlukan dan DPI yang rendah bisa didapat.
Isu teknis dalam pemilihan scanner : 1.
Kedalaman Pixed, Resolusi dan Ukuran File 2. Kecepatan
3. Flatbad Vs. Sheetfed Apabila kita akan menscan setumpuk kertas dengan cepat, maka
gunakanlah sheetfed, tetapi apabila yang dibutuhkan adalah scanner untuk mencan halaman tunggal maka gunakanlah flatbed.
4. Duplex Vs Simplex
Scanner Duplex dapat menscan halaman muka dan belakang dengan cepat dan mudah. Duplexing terdapat pada scanner sheetfed dan ADF
dari flatbed. 5.
Paper Handling
21
2. Audio-Video Capture
Teknologi ini harus dapat mengkonversi dokumen kertas ke dalam image digital dan indeks data. Image disimpan sebagai file TIFF pada sistem
penyimpanan optikal dan diindeks serta disimpan di dalam database relational.
3. OCRICR
Bagian kunci dari dokumen scanning adalah optical character recognition OCR. OCR merupakan teknologi tambahan pada scanner dokumen. OCR
berarti objek teks dalam dokumen dikonvert dari bit-mapped image ke dalam representasi teks seperti ASCII. Scanner memisahkan dokumen ke
dalam elemen gambar yang disebut pixels. Kumpulan pixel dari karakter alphanumeric dibaca oleh software OCR, dan diterjemahkan ke dalam
karakter ASCII dengan tepat atau ke dalam kode lainnya yang dapat dibaca oleh mesin.
Ada dua metodologi atau pendekatan untuk menangkap karapter huruf, yaitu : template-matching dan topological analysis.
1. Template-Matching
Template-matching dikenal sebagai pencocok huruf atau pencocok matriks, merupkan pendekatan yang sangat sederhana. Karakter teks secara individu
diproses dengan dicocokkan agar berada dalam sistem penyimpanan template karakter. Hal ini membuat huruf dikenali oleh sistem. Produksi
dengan pendekatan ini dapat enyimpannya dimana saja dari satu huruf monofont machines hinga beberapa huruf multifont machines.
Pencocokan huruf lebih cepat daripada topological berbasis OCR, tetapi lebih kaku.
2. Topological Analysis
Pattern Recognition atau Feature Extraction. Pattern recognition atau disebut juga extraction tidak menggunakan tamplete. Ini menggunakan
22
pendekatan OCR. Aturannya, konstruksi karakter berpasangan dengan image memproses alogaritma yang dapat mendeteksi tepi karakter yang
dicetak. Image yang discan pada teks menjadi elemen tersendiri. Bagian dari katakter dan antar bagiannya dibandingkan untuk membuat aturan yang
berhubungan dengan konstruksi karakter.
ICR. OCR seringkali dibingungkan dengan istilah intelligent character
recognition ICR. ICR mencakup handwriting recognition yang biasa disebut handwriting ICR.
Handwriting ICR tidak lagi dibingungkan oleh handwriting recognition dari pena, dengan menggunakan pensil berbasis komputer. Sistem berbasis pena
secara signifikan kurang sensitive dan mensyaratkan karakter secara individu dipelajari. Sistem berbasis kertas juga bersandar pada gerak,
kecepatan dan rangkaian tulisan tangan yang diciptakan.
Machine-Learned Fragment Analysis MLFA . MLFA merupakan
teknologi yang diciptakan oleh Exvervision, aslinya untuk mengenali karakter Kanji. MLFA menganalisis karakter sebagai kumpulan feagmen,
lebih dari sekedar unit tungal. Hasilnya lebih teliti dan lebih akurat dalam menganalisis karakter. OCR kemudia dapat digunakan untuk karakter Kanji
atau Cyrillic.
Fitur Tambahan OCR Lexical Tools. Keakuratan OCA meningkat dengan integrasi lexical tools
yang dapat memutuskan secara cerdas untuk berhubungan dengan karakter yang tidak dapat ditangkap secara cepat. Memungkinkan penterjemahan kata
yang tidak lengkap dalam penelusuran ke dalam kamus atau site lexicon.
Trainable OCR. Trainable OCR bekerja diantara pencocok huruf atau
pattern recognition sebagai metodologi pokok untuk OCR. Trainable OCR menyajukan mekanisme untuk sistem mempelajari huruf dan karakter baru
23
secara dinamis. Tidak seperti omnifont, trainable OCR membutuhkan intervensi operator. Sistem menyimpan arus template atau pattern lain
untuk karakter yang tidak dikenal dan mendesak operator untuk menterjemahkan karakter secara tepat. Sistem menjadi “pintar” dan kurang
membutuhkan input operator. Proses pelatihan biasanya lambat dan membosankan
Optical Mark Recognition OMR. OMR disebut juga mark sense
merupakan satu teknologi OCR tertua dan sangat sederhana, biasanya menggunakan scantron bubble-sheet yang dikenal. Memerlukan formulir
yang distandarisasi dan scanner resolusi rendah, OMR menjadi sangat ekonomis tetapi juga terbatas. Aplikasi menggunakan OMR untuk
mengenali check-box dari quesiner dan survey. Tidak seperti scantron tradisional, formulir diciptakan dengan produknya dapat sisusun secara
virtual, diletakan pada pensil dan tidak memerlukan bubble atau box untuk meletakannya secara lengkap. Kelemahan pada formulir dari scantron
adalah kecepatan rekognisi yang lambat dan keakuratan yang rendah. Aplikasi lain dari OMR adalah menggunakan hieroglyphics dengan beragam
intruksi untuk menerima menangkap komputer. Double-Sided Scanning. Kemampuan untuk menscan dan menyusun teks
dari dua sisi dokumen yang dicetak yang dapat disimpan lebih lama dalam situasi dimana formulir dari input teks merata. Sisi tungal halaman pada
tumpukan kertas discan dan diproses. Tumpukan kertas kemudian dibalik dan teks pada sisi lain discan dan diproses. Software secara automatis akan
menyusun teks ke dalam urutan yang tepat.
Support for Columnar Input. Biasanya, cetakan kertas diformat dalam
tampilan kolom sebagai contoh, surat kabar. OCR “membaca” teks dari kiri ke kanan, dari atas ke bawah. Tanpa dukungan untuk memformat kolom,
input dalam format kolom menghasilkan produk yang salah, dimana teks elektronik, melalui teknik yang benar disimpan dalam urutan semirandom,
24
tetapi semua ketidakteraturan itu dapat dibaca dan diperkecil. Sistem scanner OCR mendukung kolom teks yang akan dikenali dengan
memproses teks dari kiri ke kanan, dari atas ke bawah, sebelum kemudia halam pindah ke kanan, untuk kolom teks berikutnya. Dengan cara ini teks
disimpan dalam urutan yang siap untuk dibaca. Apabila dokumen memiliki kolom teks, tetapi kita tidak memiliki system scanner OCR yang dapat
mengenali dan mendukung input formulir ini secara automatis, tutupi kolom pada halaman dan scan dokumen per kolom, atau dokumen OCR dengan
satu per satu kemudian secara manual dibalik dan dikonfiguraikan lagi blok teks berdasarkan urutan yang tepat.
Automatic Page Decomposition. Software ini menangani secara cerdas
dokumen campuran, dokumen terdiri atas image dan grafik sebagaimana teks. Dukungan pada feture ini tersedia dalam beragam tingkatan. Beberapa
produk membutuhkan temlate untuk secara manual menggambar dan mengidentifikasi bagian teks dan non teks dalam dokumen secara terpisah.
Kemampuan membedakan image dan teks secara automatis dalam satu langkah didukung oleh produk OCR tingkat tinggi dalam jumlah yang besar.
Secara sederhana, sistem memproses dokumen dengan scanner dua kali : satu sebagai image dan satu lagi software OCR.
Automatic Conversion into Proprietary Format. Asalnya hasil teks OCR adalah karakter ASCII. Kini produk akan menyimpan teks secara langsung
kedalam format khusus. Penyimpanan ini menggunakan waktu dan usaha pengimporan teks ASCII ke dalam paket lain seperti word pecessor atau
database. Karakter asli seperti cetak tebal, paragraph dan garis bawah ditampilkan. Beberapa produk juga mendukung MS-Windows, Dynamic
Data Exchange DDE dimana teks disimpan secara langsung dalam aplikasi tertentu. Ada kemiripan beberapa produk “smart form” menyimpan data ke
dalam database, membutuhkan sedikit atau tanpa interaksi pengguna.
25
Neural Network technology. Dengan menggunakan alogaritma fuzzy yang
membantu software mempelajari karakter sebagaimana yang ditangkap, aplikasi “neural network” dapat menangani jenis dan ukuran faset yang
sangat beragam. Di luar standar teknologi omnifont, neural network memaparkan model pola manusia melalui penciptaan yang menghubungkan
ide dan konsep. Keuntungan utama dari neural network berbasis OCR adalah dapat dikenalinya dokumen secara luas, termasuk yang memiliki
kualitas yang buruk. Kompleksitas teknologi neural network membutuhkan penghitungan dalam jumlah besar : jadi aplikasi relatif lambat. Dengan
dapat dikenalinya dokumen dengan kualitas rendah, termasuk fax, neural network OCR memiliki standar lebih cepat daripada standar OCR, ia juga
dapat mengenali image, sementara produk lain tidak.
TWAIN. TWAIN merupakan standar API yang dapat memfasilitasi integrasi
semua peralatan, seperti scanner dan optical drive ke dalam sistem imaging. Kombinasi dengan aplikasi scanner, TWAIN menempatkan scanning untuk
secara langsung ditampilkan dalam program, seperti Aldus’Page Maker. Produk ini biasanya memiliki targer pada pengguna akhir level pemula atau
entri level OCR. Semuanya dintegrasikan dengan program berbasis teks dan OCR untuk ditampilkan secara langsung di dalam program.
Smart Form. Smart form merupakan jenis produk terbaru yang
menggunakan ICR atau OMR. Produk ini dapat mengentri dan menontrol data dalam PC yang jauh. Formulir difax kedalam komputer dengan
faxboard dan memerlukan software, yang merespon intruksi berdasarkan pada sejumlah hieroglyphics tulisan Mesir, bentuk yang dapat secara
terpisah atau lengkap masuk kedalam sejumlah perintah. Banyak platform produk yang sesuai dengan RDBMS dengan informasi yang difax dari
beberapa platform, termasuk teks tilisan tangan dalam beberapa kasus. Dengan integrasi mesin fax sebadai alat input utama, smart form
26
mengurangi kebutuhan untuk mengunci kembali prosentase data dalam jumlah besar.
4. COLD Computer Output to Laser Disk
Teknologi COLD mencakup pemrosesan, pengindeksan dan penyimpanan komputer secara umum, laporan diformat dalam media komputer. Output data
dapat dicetak dan atau pada microfiche. Dengan COLD, pengguna dapat menelusur, melihat, mencetak dan memproses informasi secara elektronik.
f. Peralatan Jaringan
Sistem Jaringan komputer meliputi jaringan komputer secara LAN local area network. Peralatan jaringan utama untuk LAN terdiri switching hub untuk
jaringan yang besar dan hub untuk mendukung hubungan pada jaringan yang kecil kurang dari 12 node.
Jaringan Local Area Network LAN diharapkan dapat mengatasi kebutuhan komunikasi data antara satu unit departemen dengan unit
departemen lainnya. Selain itu juga diharapkan jaringan menggunakan sistem operasi jaringan yang handal dalam mendukung komunikasi data, dengan
karakteristik: sistem otorisasi yang baik, tidak mudah terserang virus komputer. Sistem jaringan juga mempunyai kemudahan dalam pengoperasian, sistem
pengamanan data yang baik, pemusatan pengawasan jaringan serta memiliki kompatibilitas dengan aplikasi-aplikasi yang berkembang saat ini.
Sistem jaringan juga harus dilengkapi dengan sistem keamanan yang handal yaitu dengan tersedianya fasilitas firewall baik inbound maupun outbound.
Dengan adanya fasilitas tersebut transaksi yang dikirimkan melalui jaringan intranet akan terlindungi dari akses dari pihak yang tidak berhak. Disamping itu
27
pengaturan wewenang dan akses terhadap jaringan akan diatur sesuai dengan fungsinya masing-masing.
2.6. Kriteria Software yang Dibutuhkan
Dua syarat teknologi pada sistem imaging dokumen adalah : -
Ukuran dari arsip dokumen itu sendiri. Dibandingkan dengan word processing atau file taxt, image merupakan objek yang cukup besar, dan tipe
sistem imaging mencakup jutaan halaman. Database relational tidak baik digunakan untuk menyimpan objek yang besar secara langsung, total
kapasitas penyimpanan image dapat mencapai ratusan gigabyte hingga tetrabyte, biasanya membutuhkan penggunaan optical disk jokeboxe untuk
memperkecil biaya penyimpanan image. Untuk skala produksi sistem dokumen imaging menggunakan database SQL untuk mengindeks
dokumen, mengkombinasi kinerja sistem file yang tinggi dengan dukungan kombinasi magnetic dan optikal disk untuk menyimpan imagenya.
- Kebutuhan akan kecepatan. Walaupun repository berukuran besar, pengguna
membutuhkan untuk menemukan kembali dokumen image secara cepat agar produktif. Kemampuan untuk menampilkan kecepatan pada volume produks
puluhan dari ribuan kalaman yang di capture atau ditelusur perhari, memerlukan sistem imaging dokumen yang didesain untuk maksud ini.
Hasil dan respon waktu merupakan nilai ukur utama dalam membayar sistem imaging. Teknologi desktop imaging, didesain untuk capture atau
menemukan kembali puluhan hingga ratusan halaman per hari sangat murah harganya – software biasanya diberikan secara gratis oleh sistem operasi
windows – tetapi itu sangat sederhana dan tidak dapat mengukur volume produksi.
a. Relational Database Engine