Cum de a extrage și salva imagini dintr-un fișier PDF în Linux
Aveți posibilitatea să convertiți cu ușurință fișierele PDF în text editabil în Linux utilizând instrumentul de comandă "pdftotext". Cu toate acestea, dacă există imagini în fișierul PDF original, acestea nu sunt extrase. Pentru a extrage imagini dintr-un fișier PDF, puteți utiliza un alt instrument de linie de comandă numit "pdfimages".
NOTĂ: Când spunem să tastați ceva în acest articol și există citate în jurul textului, NU introduceți ghilimele, dacă nu specificăm altfel.
Instrumentul "pdfimages" face parte din pachetul poppler-utils. Puteți verifica dacă este instalat în sistemul dvs. și instalați-l, dacă este necesar, utilizând pașii descriși în acest articol.
Pentru a extrage imagini dintr-un fișier PDF folosind pdfimages, apăsați "Ctrl + Alt + T" pentru a deschide o fereastră Terminal. Tastați următoarea comandă la prompt.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: Pentru toate comenzile afișate în acest articol, înlocuiți prima cale din comandă și numele fișierului PDF cu calea și numele fișierului pentru fișierul PDF original. Cea de-a doua cale ar trebui să fie calea spre directorul rădăcină în care doriți să salvați imaginile extrase. Cuvântul "imagine" de la sfârșitul celei de-a doua căi reprezintă ceea ce doriți să faceți cu numele dvs. de fișier. Numele de fișiere ale imaginilor sunt numerotate automat (000, 001, 002, 003, etc.). Dacă doriți să adăugați text la începutul fiecărei imagini, introduceți textul respectiv la sfârșitul celei de-a doua căi. În exemplul nostru, fiecare fișier de imagine va începe cu "imagine", cum ar fi image-001.ppm, image-002.ppm etc. Se adaugă o linie între textul pe care îl specificați și numărul.
Formatul implicit de imagine este PPM (pixmap portabil) pentru imagini non-monocrome sau PBM (bitmap portabil) pentru imagini monocrome. Aceste formate sunt concepute pentru a fi ușor schimbate între platforme.
NOTĂ: Puteți obține două fișiere imagine pentru fiecare imagine din fișierul PDF. Cea de-a doua imagine pentru fiecare imagine este necompletată, astfel încât veți putea afla care imagini conțin imaginile din fișier prin miniatură din fișier din Managerul de fișiere.
Pentru a crea fișiere de imagine .jpg, adăugați opțiunea "-j" comenzii, după cum se arată mai jos.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: De asemenea, puteți modifica ieșirea implicită în PNG utilizând opțiunea "-png" sau TIFF utilizând opțiunea "-tiff".
Fișierul principal de imagine pentru fiecare imagine este salvat ca fișier .jpg. Cea de-a doua imagine albă este încă un fișier .ppm sau .pbm.
Dacă doriți doar să convertiți imagini pe și după o anumită pagină, utilizați opțiunea "-f" cu un număr pentru a indica prima pagină de conversie, așa cum se arată în exemplul de mai jos.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: Am combinat opțiunea "-j" cu opțiunea "-f", astfel încât să obținem imagini de tip .jpg și am făcut același lucru cu opțiunea "-l" menționată mai jos.
Pentru a converti toate imaginile înainte și pe o anumită pagină, utilizați opțiunea "-l" (o literă "L", nu numărătoarea "1") cu un număr pentru a indica ultima pagină de conversie, după cum se arată mai jos.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
NOTĂ: Puteți utiliza împreună opțiunile "-f" și "-l" pentru a converti imagini într-un anumit interval de pagini în mijlocul documentului.
Dacă există o parolă de proprietar în fișierul PDF, utilizați opțiunea "-opw" și parola în ghilimele simple, după cum se arată mai jos. Dacă parola din fișierul PDF este o parolă de utilizator, utilizați în schimb opțiunea "-upw" cu parola.
NOTĂ: Asigurați-vă că există citate simple în jurul parolei în comandă.
pdfimages -pw 'parola' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documente / ExtractedImages / imagine
Pentru mai multe informații despre utilizarea comenzii pdfimages, tastați "pdfimages" la solicitare într-o fereastră Terminal și apăsați "Enter". Se afișează utilizarea comenzii cu o listă de opțiuni disponibile pentru utilizare în comandă.