Tesseract.js aduce traducerea de imagini OCR la browsere

Traducerea OCR încă nu este perfectă, dar sa îmbunătățit dramatic în ultimii ani. Conducerea drumului este Tesseract motor de traducere deschise în prezent în C++.

În timp ce aceasta este o bibliotecă incredibilă, ea este însă limitată la software. Din fericire, cineva a făcut un port de Tesseract în JavaScript, numit Tesseract.js. Aceasta acceptă până la 60 de limbi și, desigur, nu este perfectă, face bine treaba.

Instalarea și configurarea sunt o briza unde puteți vizați orice element de imagine pe pagina și executați Tesseract.recognize () funcţie. Acest lucru poate lua orice tip de imagine și va fi automat comprimați și traduceți chiar în browser.

Puteți obține mult mai complicat, dar frumusețea este cum puteți rula OCR cu o singură linie de cod.

Consultați pagina de destinație Tesseract.js dacă doriți să vedeți o demonstrație live. Acest lucru funcționează exact în browser unde puteți drag & drop orice imagine scanată de text pentru a obține o traducere automată OCR.

De asemenea, puteți descărca acest exemplu local pe pagina GitHub sau puteți crea propria aplicație prin includerea scriptului Tesseract.js direct dintr-un CDN.

Cel mai simplu exemplu de cod arata ca in cazul urmator myImage este o referință directă la un element de imagine HTML:

 Tesseract.recognize (myImage) .then (funcție (rezultat) console.log (rezultat));

Oricum, această bibliotecă este atât de utilă pentru a vă deplasa cu OCR pe web. Este departe de a fi perfectă, dar este și ea cea mai bună resursă pentru dezvoltatorii web care doresc funcționalitate dinamică OCR în pagină.

Pentru a afla mai multe, accesați pagina GitHub Tesseract.js, unde puteți vedea o demonstrație live și puteți naviga prin documentația online.