Cara Penggunaan Tesseract Pada OCR Cara Kerja Tesseract
parameter disesuaikan setImage
File file Menyediakan citra untuk dikenali
oleh Tesseract. setImage
Bitmap bmp Menyediakan citra untuk dikenali
oleh Tesseract. Parameter bmp bitmap representasi dari citra
setImage Pix image
Menyediakan citra dengan format Leptonica pix untuk dikenali oleh
Tesseract setImage
byte[] imagedata, int width, int height, int bpp, int bpl
Menyediakan citra untuk dikenali oleh Tesseract.
getUTF8Text Karakter yang dikenali dari citra
dikembalikan dalam bentuk string dengan pengkodean UTF8.
getHtmlText Me-returnkan karakter yang
dikenali dari citra dalam bentuk html yang dapat dipergunakan
meanConfidence Me-returnkan mean confidence
dari pengenalan teks wordConfidences
Me-return seluruh kata confidences antara 0 dan 100
pada sebuah array. = getThresholdedImage
Me-return sebuah copy dari internal citra thresholded dari
Tesseract. getRegions
Me-return hasil dari page layout analysis sebagai sebuah Pixa,
getTextlines Me-return textlines sebagai Pixa.
getStrips Me-return strips sebagai Pixa.
getWords Me-return kata bounding boxes
sebagai Pixa. getResultIterator
Me-return load konten dengan
Picasso getHOCRText
int page Membuat sebuah HTML-
formatted string dengan hOCR markup dari data internal.
setInputName String name
Mengatur nama dari input file. Hanya untuk training dan reading
pada UNLV zone file. setOutputName
String name Mengatur nama dari output file.
Hanya untuk debugging. ReadConfigFile
String filename Membaca sebuah config file
berisi satu set variable, value pairs.
getBoxText int page
Me-returnkan karakter yang dikenali dari citra dalam bentuk
kode yang sama dengan UTF8 onProgressValues
final int percent, final int left, final int right, final int top,
final int bottom, final int left2, final int right2, final int
top2, final int bottom2 Memanggil dari native code
untuk menampilkan progress value