Arhiva pentru tagul “OCR”

OCR gratuit, bun şi pentru limba română? Da!

Programele OCR (de recunoaştere optică a scrisului) bune sunt scumpe. Iar cele gratuite de care ştiam nu dădeau rezultate strălucite cu limba română (unele sunt online şi poate merită revăzute). Dar lucrurile se schimbă pentru că există totuşi o soluţie foarte promiţătoare: Capture2Text. Ei bine, poate nu e cea mai prietenoasă aplicaţie şi nu arată aşa de bine ca Abbyy Fine Reader, dar e complet gratuită şi în testele mele a mers bine. Nu am avut o foaie scanată să văd cum merge aşa că admit: testele făcute după un text clar de pe monitor nu sunt cele mai concluzive teste…

imagine

Şi totuşi mă fac să fiu optimist (dacă viaţa reală aduce contra-argumente, rog scrieţi în comentarii). …


Recunoaştere online a textelor (OCR – II)

Am mai abordat subiectul aici, acum câteva luni. De atunci Abbyy FineReader Online şi-a mai adăugat la limbi spaniola şi ucraineana, dar româna lipseşte încă. M-am bucurat să o regăsesc pe un alt sit: OnlineOCR.net. Veşti bune şi veşti proaste. Vestea bună este că că suportă multe limbi (vedeţi mai jos), multe formate de intrare (tot felul de imagini dar chiar şi PDF-uri), şi multe formate de ieşire (Word, HTML, RTF, PDF…). Vestea proastă este că fără cont nu poţi alege limba (dar poţi scana oricâte pagini, cu pauze de relaxare), iar dacă îţi deschizi cont – e gratuit – ai doar 5 recunoaşteri fără să plăteşti, cu posibilitatea alegerii limbii; după cele 5 se intră pe sistemul de credite (variază, de la 3usd pentru 30 de pagini, până la 10usd pentru 200 de pagini).


Scanarea şi recunoaşterea textelor româneşti

De-a lungul anilor am scanat numeroase cărţi (de exemplu pentru a le publica pe ProFamilia.ro, evident cu acordul editurilor). Aliatul de mare încredere mi-a fost întotdeauna ABBYY FineReader. Programul a ajuns la versiunea 9 (preţul: 140euro), dar eu am în continuare versiunea 8, de care mă voi folosi pentru acest articol. Premisa este deci: avem o carte cu text românesc (sau poate doar un formular la firmă) şi dorim să o transformăm în text electronic, editabil, publicabil ş.a.m.d. Diacriticele dau bătăi de cap ca întotdeauna, dar din fericire produsul de la ABBYY se descurcă mulţumitor de bine.

img54

Esenţial este ca după ce aţi instalat programul să vă descărcaţi şi dicţionarele (pentru versiunea 8.0 se găsesc aici). Dacă aţi instalat dicţionarul pentru limba română veţi putea selecta Romanian din lista derulantă marcată cu …