Pengenalan Karakter Pada Tesseract
membersihkan native data yang telah di set saat mengkonstruksi
objek init
String datapath, String language
Menginisialisasi Tesseract engine dengan sebuah specified language
model. Me-return true jika success.
init String datapath, String
language, int ocrEngineMode Menginisialisasi Tesseract engine
dengan sebuah specified language model. Me-return true jika
success. Parameter ocrEngineMode yakni OCR
engine mode untuk di set getInitLanguagesAsStri
ng Me-return languages string yang
digunakan pada last valid initialization.
clear Membebaskan hasil dari
recognition dan semua jenis data citra, tanpa harus membebaskan
data yang akan memakan waktu untuk di-reload.
end Menutup tesseract dan
membebaskan seluruh memori. setVariable
String var, String value Mengatur value dari sebuah
internal variable setPageSegMode
int mode Mengatur mode page
segmentation. Ini mengatur seberapa banyak processing OCR
engine yang akan dilakukan sebelum pengenalan karakter.
setDebug boolean enabled
Mengatur debug mode. setRectangle
Rect rect Menhindari recognition untuk
meng-sub-rectangle citra. setRectangle
int left, int top, int width, int height
Menhindari recognition untuk meng-sub-rectangle citra dengan
parameter disesuaikan setImage
File file Menyediakan citra untuk dikenali
oleh Tesseract. setImage
Bitmap bmp Menyediakan citra untuk dikenali
oleh Tesseract. Parameter bmp bitmap representasi dari citra
setImage Pix image
Menyediakan citra dengan format Leptonica pix untuk dikenali oleh
Tesseract setImage
byte[] imagedata, int width, int height, int bpp, int bpl
Menyediakan citra untuk dikenali oleh Tesseract.
getUTF8Text Karakter yang dikenali dari citra
dikembalikan dalam bentuk string dengan pengkodean UTF8.
getHtmlText Me-returnkan karakter yang
dikenali dari citra dalam bentuk html yang dapat dipergunakan
meanConfidence Me-returnkan mean confidence
dari pengenalan teks wordConfidences
Me-return seluruh kata confidences antara 0 dan 100
pada sebuah array. = getThresholdedImage
Me-return sebuah copy dari internal citra thresholded dari
Tesseract. getRegions
Me-return hasil dari page layout analysis sebagai sebuah Pixa,
getTextlines Me-return textlines sebagai Pixa.
getStrips Me-return strips sebagai Pixa.
getWords Me-return kata bounding boxes
sebagai Pixa. getResultIterator
Me-return load konten dengan