Pengenalan Karakter Pada Tesseract

membersihkan native data yang telah di set saat mengkonstruksi objek init String datapath, String language Menginisialisasi Tesseract engine dengan sebuah specified language model. Me-return true jika success. init String datapath, String language, int ocrEngineMode Menginisialisasi Tesseract engine dengan sebuah specified language model. Me-return true jika success. Parameter ocrEngineMode yakni OCR engine mode untuk di set getInitLanguagesAsStri ng Me-return languages string yang digunakan pada last valid initialization. clear Membebaskan hasil dari recognition dan semua jenis data citra, tanpa harus membebaskan data yang akan memakan waktu untuk di-reload. end Menutup tesseract dan membebaskan seluruh memori. setVariable String var, String value Mengatur value dari sebuah internal variable setPageSegMode int mode Mengatur mode page segmentation. Ini mengatur seberapa banyak processing OCR engine yang akan dilakukan sebelum pengenalan karakter. setDebug boolean enabled Mengatur debug mode. setRectangle Rect rect Menhindari recognition untuk meng-sub-rectangle citra. setRectangle int left, int top, int width, int height Menhindari recognition untuk meng-sub-rectangle citra dengan parameter disesuaikan setImage File file Menyediakan citra untuk dikenali oleh Tesseract. setImage Bitmap bmp Menyediakan citra untuk dikenali oleh Tesseract. Parameter bmp bitmap representasi dari citra setImage Pix image Menyediakan citra dengan format Leptonica pix untuk dikenali oleh Tesseract setImage byte[] imagedata, int width, int height, int bpp, int bpl Menyediakan citra untuk dikenali oleh Tesseract. getUTF8Text Karakter yang dikenali dari citra dikembalikan dalam bentuk string dengan pengkodean UTF8. getHtmlText Me-returnkan karakter yang dikenali dari citra dalam bentuk html yang dapat dipergunakan meanConfidence Me-returnkan mean confidence dari pengenalan teks wordConfidences Me-return seluruh kata confidences antara 0 dan 100 pada sebuah array. = getThresholdedImage Me-return sebuah copy dari internal citra thresholded dari Tesseract. getRegions Me-return hasil dari page layout analysis sebagai sebuah Pixa, getTextlines Me-return textlines sebagai Pixa. getStrips Me-return strips sebagai Pixa. getWords Me-return kata bounding boxes sebagai Pixa. getResultIterator Me-return load konten dengan