PDFTextOnline: Ia textul din PDF-uri


Dacă e bal, bal să fie! Rămânem tot la PDF-uri şi manipularea lor online, prin diverse webaplicaţii. Am văzut astăzi cum le putem "ameţi" paginile, cum putem include un fişier PDF într-o pagină web, iar acum vom vedea cum putem transforma un fişier PDF în unul text. PDFTextOnline.com permite aceasta din câţiva paşi. Mai întâi trebuie să asiguraţi situl că respectaţi termenii şi condiţiile impuse, după care pur şi simplu faceţi upload la un fişier şi programul va încerca să vi-l ofere ca text.

img12

Puteţi naviga de la o pagină la alta, schimba fontul la afişare, schimba modul de afişare, dar în cele din urmă ceea ce ne interesează este butonul Save All Text. Dacă vă întrebaţi de ce la început situl ne pune să bifăm cum că suntem de acord cu o listă de condiţii… răspunsul este simplu: această webaplicaţie permite extragerea textelor inclusiv din fişiere protejate!!! Hopa… evident aici se încalcă nişte reguli. Dacă vă amintiţi, am tratat tema – cu alte soluţii – în Copierea din PDF-uri protejate. Ei bine, PDFTextOnline.com este soluţia online pentru aşa ceva. Cât va mai rezista.

(Apropo: unii s-au plâns că metoda prezentată în articolul citat nu funcţionează. Şi probabil unii vor încerca cu PDFTextOnline.com şi tot nu va funcţiona. În toate cazurile există o explicaţiune 🙂 . Respectivul PDF conţine textul sub formă de imagini. Sunt unele fişiere PDF, cărţi de exemplu, în care textul nu e pus ca text, ci ca imagini, o pagină egal o imagine. Evident că nu se poate copia textul din aceste fişiere PDF prin metodele amintite.)

Întorcându-ne la PDFTextOnline.com să spunem că nu reuşeşte să se descurce prea bine cu diacriticele. Vedeţi şi în captura de mai jos că sare peste… ţ. În alte cazuri literele româneşti sunt înlocuite cu caractere ciudate, dar în acel caz măcar se poate apela la Replace. Pentru texte fără diacritice webaplicaţia merge însă foarte bine. Nu ştiu cum se descurcă cu PDF-uri cu formulare, dar ceva face (doar există un tab dedicat).

img13


Apreciază articolul:

1 stea2 stea3 stea4 stea5 stea (1 evaluări, media: 4,00 din 5)
Se încarcă...

2 comentarii

  1. Corneliu spune:

    „Cum le zici dumneata, nene Radule, mai rar!” mai ales in legatura cu cei care nu stiu sa deosebeasca un PDF text de unul foto (stiu eu de ce fac aceasta remarca).

  2. radu.capan spune:

    Daca paranteza din articol a ofensat pe cineva, imi cer scuze. Au fost vreo 3-4 persoane care (mi-au scris ca) nu au reusit sa scoata text din PDF-uri nu pentru ca erau protejate ci pentru ca erau cu textul inclus ca imagine. Pentru a preintampina aceasta situatie in cazul altora, am facut paranteza. Sper ca nu am ofensat pe nimeni.


Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *