OCR gratuit, bun şi pentru limba română? Da!


Programele OCR (de recunoaştere optică a scrisului) bune sunt scumpe. Iar cele gratuite de care ştiam nu dădeau rezultate strălucite cu limba română (unele sunt online şi poate merită revăzute). Dar lucrurile se schimbă pentru că există totuşi o soluţie foarte promiţătoare: Capture2Text. Ei bine, poate nu e cea mai prietenoasă aplicaţie şi nu arată aşa de bine ca Abbyy Fine Reader, dar e complet gratuită şi în testele mele a mers bine. Nu am avut o foaie scanată să văd cum merge aşa că admit: testele făcute după un text clar de pe monitor nu sunt cele mai concluzive teste…

imagine

Şi totuşi mă fac să fiu optimist (dacă viaţa reală aduce contra-argumente, rog scrieţi în comentarii). Din start programul nu se descurcă şi cu româna pentru că nu o are adăugată ca dicţionar. Mergeţi aici, descărcaţi fişierul pentru română, despachetaţi-l şi ron.traineddata puneţi-l în Capture2Text\Utils\tesseract\tessdata. După lansare veţi vedea că la OCR Language apare şi româna. Acum folosirea… puţin ciudată dar ne obişnuim. Se apelează Win+Q (combinaţiile sunt configurabile), apoi dăm un click stânga, mutăm mouse-ul trasând un dreptunghi peste textul ce îl vrem interpretat şi dăm click dreapta pentru finalizare (în timp ce marcăm se şi face “citirea”, ce apare într-o bandă sus pe ecran – vezi captura). Apoi… nimic de făcut: textul e citit! Implicit îl trimite în clipboard ca să fie gata de folosit. Dar puteţi opta pentru Show Popup Window şi atunci apare ceva ca mai jos.

imagine

Tare! E clar că cu documente scanate va merge ceva mai prost, dar direct proporţional cu claritatea documentului original. Oricum, merită reţinut (în testele mele s-a descurcat perfect şi cu diacritcele) şi chiar folosit – în special de cei care preferă această soluţie gratuită uneia comerciale, mai ales dacă e de folosit ilegal.

PS: Dat fiind că primul comentariu a fost foarte critic la adresa programului am căutat rapid un PDF care să nu fie text (selectabil) ci scanare după o carte. Am găsit ceva, de o calitate acceptabilă. Am folosit programul şi vedeţi ce mi-a ieşit. Nu perfect, dar cu diacritice şi mai rapid corectezi acel text decât să îl copiezi. În cazul meu nu este adevărată acuza „nu reuseste nimic pe care sa-l pot folosi cat de cat”.


Apreciază articolul:

1 stea2 stea3 stea4 stea5 stea (11 evaluări, media: 4,73 din 5)
Loading...Loading...

8 comentarii

  1. pety spune:

    Testat! In ceea ce ma priveste, cel mai prost soft din categoria lui. Nu se poate compara cu nimic din ceea ce am, pentru ca nu reuseste nimic pe care sa-l pot folosi cat de cat.

  2. radu.capan spune:

    :)
    „Din ceea ce am” înseamnă comerciale? Dacă nu, ce soft gratuit se descurcă mai bine?
    Şi nu în cele din urmă: ce a mers prost cu cel recomandat?
    Critica e dură şi cere câteva explicaţii ca să fie de folos.

    În apărarea articolului am făcut un test cu o carte scanată şi s-a descurcat bine. E deci, după mine, foarte bun. A se vedea completarea la articol.

  3. Andrei spune:

    Interesant. La texte valurite merge slab. La texte din majuscule nu merge de loc, si are prostul obicei sa „citeasca” marginile de tabel ca si caractere. dar… pe un text mai vechi, scanat curat dar cu contrast slab… a mers la fel de bine ca Abby.

    A, si nu retine ruperea randurilor, ceea ce este o mare tampenie… Sper sa corecteze.

  4. Andrei spune:

    [update] Retine si capatul de rand, dar implicit setarea aceasta e inactivata.

  5. pety spune:

    Capture2Text este cel mai varza soft din cate am testat (free, open source sau comerciale – nu este relevant ce softuri am testat eu, ci „performanta” softului varza).
    Nu este critica dura, ci constatare frustranta. E frustranta deoarece „la pomul laudat… ” Data viitoare o sa testez softul inainte sa acord stelutele.

    BTW: Abby Screenshot Reader am gratuit.

    Apropos!
    Faptul ca softul este varza nu afecteaza imaginea, caracterul, personalitatea autorului acestui articol.

  6. Claus spune:

    Abbyy Fine Reader e cel mai bun. Testat. Multumit. Recomand! :)

  7. Val S. spune:

    Abbyy Fine reader e incet. Pentru a putea tine pasul cu Nuance Omnipage, trebuie sa ma abtin la imagini alb negru.
    DAR e mai bun la recunoastere decat Nuance. Ajusteaza imaginea scanata si nu face nazuri privind parole sau texte cu „underline”: in urma unei copieri de text din fisierul origine sa iti aparca ceva de genu ½±°¸·¥ª ¨Æø²­°¥ø²¨ªº ¨± ¨¸ª ºªª° Õ±´¨
    chiar daca textul pare, la o prima analiza in pdf ca fiind formatat corect.

  8. Flaviu spune:

    Eu nu am testat multe astfel de softuri, dar sunt foarte mulțumit de Capture2Text. Mi se pare practic pentru că nu mai trebuie să salvez captura ca imagine ci o recunoaște direct. Mă bucur că am descoperit acest atricol.


Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile necesare sunt marcate *