71
Tesseract.js یک کتابخانه جاوا اسکریپت است که تقریباً به هر زبانی از تصاویر کلمات دریافت می کند.موتور Tesseract OCR یکی از 3 موتور برتر در تست دقت UNLV 1995 بود.بین سالهای 1995 و 2006 کار کمی روی آن انجام شده است ، اما احتمالاً این یکی از دقیق ترین موتورهای منبع باز OCR است که در دسترس است.کد منبع تصویر باینری ، خاکستری یا رنگی و متن خروجی را می خواند.یک خواننده سفت و سخت ساخته شده است که در آن تصاویر TIFF فشرده نشده خوانده شده ، یا libtiff می تواند برای خواندن تصاویر فشرده شده اضافه شود.در بسیاری از زبانها فایلهای زبانی وجود دارد ، حتی برای متن تنظیم شده در شکلهای Fraktur و blackletter….
سایت اینترنتی:
https://github.com/tesseract-ocr/tesseractامکانات
دسته بندی ها
گزینه های دیگر برای Tesseract برای Linux
35
GImageReader
gImageReader جلویی ساده Gtk / Qt به Tesseract OCR Engine است. ویژگی ها: - وارد کردن اسناد و تصاویر PDF از دیسک ، دستگاه های اسکن ، کلیپ بورد و تصاویر
9
8
6
5
5
4
4
3