71
Tesseract.js یک کتابخانه جاوا اسکریپت است که تقریباً به هر زبانی از تصاویر کلمات دریافت می کند.موتور Tesseract OCR یکی از 3 موتور برتر در تست دقت UNLV 1995 بود.بین سالهای 1995 و 2006 کار کمی روی آن انجام شده است ، اما احتمالاً این یکی از دقیق ترین موتورهای منبع باز OCR است که در دسترس است.کد منبع تصویر باینری ، خاکستری یا رنگی و متن خروجی را می خواند.یک خواننده سفت و سخت ساخته شده است که در آن تصاویر TIFF فشرده نشده خوانده شده ، یا libtiff می تواند برای خواندن تصاویر فشرده شده اضافه شود.در بسیاری از زبانها فایلهای زبانی وجود دارد ، حتی برای متن تنظیم شده در شکلهای Fraktur و blackletter….