Cara Penggunaan Tesseract Pada OCR Cara Kerja Tesseract

parameter disesuaikan setImage File file Menyediakan citra untuk dikenali oleh Tesseract. setImage Bitmap bmp Menyediakan citra untuk dikenali oleh Tesseract. Parameter bmp bitmap representasi dari citra setImage Pix image Menyediakan citra dengan format Leptonica pix untuk dikenali oleh Tesseract setImage byte[] imagedata, int width, int height, int bpp, int bpl Menyediakan citra untuk dikenali oleh Tesseract. getUTF8Text Karakter yang dikenali dari citra dikembalikan dalam bentuk string dengan pengkodean UTF8. getHtmlText Me-returnkan karakter yang dikenali dari citra dalam bentuk html yang dapat dipergunakan meanConfidence Me-returnkan mean confidence dari pengenalan teks wordConfidences Me-return seluruh kata confidences antara 0 dan 100 pada sebuah array. = getThresholdedImage Me-return sebuah copy dari internal citra thresholded dari Tesseract. getRegions Me-return hasil dari page layout analysis sebagai sebuah Pixa, getTextlines Me-return textlines sebagai Pixa. getStrips Me-return strips sebagai Pixa. getWords Me-return kata bounding boxes sebagai Pixa. getResultIterator Me-return load konten dengan Picasso getHOCRText int page Membuat sebuah HTML- formatted string dengan hOCR markup dari data internal. setInputName String name Mengatur nama dari input file. Hanya untuk training dan reading pada UNLV zone file. setOutputName String name Mengatur nama dari output file. Hanya untuk debugging. ReadConfigFile String filename Membaca sebuah config file berisi satu set variable, value pairs. getBoxText int page Me-returnkan karakter yang dikenali dari citra dalam bentuk kode yang sama dengan UTF8 onProgressValues final int percent, final int left, final int right, final int top, final int bottom, final int left2, final int right2, final int top2, final int bottom2 Memanggil dari native code untuk menampilkan progress value

2.6 Library Tess-Two

Tess-two adalah sebuah fork dari tools Tesseract untuk Android yang menyediakan kemampuan untuk memanfaatkan mesin OCR pada perangkat Android. Tools Tesseract untuk Android terdiri dari tiga fitur, yakni Android API, mesin Tesseract OCR, dan Leptonica Image Processing Library. Library ini dapat diunduh dan dikembangkan secara gratis di https:github.comrmtheistess-two . Tess-two memiliki alat-alat untuk mengkompilasi dan menjalankan Tesseract maupun Leptonica Image Processing Library di Android OS. Library tess-two menambahkan beberapa fungsi tambahan. Proyek ini bekerja dengan Tesseract 3.05.00 dev, Leptonica 1,73, libjpeg 9b, dan libpng 1.6.20. Kode asli dari library juga disertakan dalam folder tess-twojni. Dalam modul tess-two terdapat modul eyes-two yang berisi tambahan kode dari proyek eyes-free. Modul eyes-two tidak dibutuhkan untuk mengakses