Lucrăm cu pdf în linux

Formatul PDF a devenit foarte popular cu dezvoltarea internetului și diseminarea documentației electronice, iar cei care se ocupă de texte trebuie să selecteze instrumentele pentru a deschide fișiere în acest format și pentru a lucra cu ele. Suporterii lui * nix au multe de ales.







Acum puteți urmări:

Un timp va trebui să aștepte până când imaginile vor fi generate.

În mod similar, o comandă extrage imagini.

Pentru a afla informații despre fonturile încorporate, rulați utilitarul pdffonts.
În acest context, vă puteți aminti SWFTools. care conține mai multe convertoare în formatul SWF (Small Web Format), inclusiv PDF2SWF. Singura dată când pachetul SWFTools din Ubuntu și alte distribuții nu include utilitarul pdf2swf, deci trebuie să îl instalați din surse:

Ca rezultat, a fost obținut un fișier SWF, care este deschis într-un browser web sau player pentru a vedea paginile care se modifică periodic din document. Puteți procesa numai o parte a documentului prin specificarea numerelor paginilor preferate cu opțiunea -pagini:

Dacă nu specificați numele fișierului de ieșire, rezultatul va ajunge în stdout. Opțiunea -C vă permite să generați un antet suplimentar HTTP, care este util atunci când plasați un fișier pe un server Web.

Un alt utilitar util distribuit sub licența artistică, - QPDF reprezintă Converter PDF, pentru a efectua diverse transformări: optimizare pentru web, criptare / decriptare, fișiere de verificare, precum și fuziunea și divizarea. Cu ajutorul ei, puteți crea, de asemenea, PDF-File programatică, QPDF ia toate reprezentarea sintactică a obiectelor, crearea unei tabele de referință, criptare, liniarizare și alte detalii ale sintaxei.

Când actualizați versiunea Adobe Extension Level care este utilizată pentru a crea fișiere PDF într-un cloud Adobe, este adesea imposibil să citiți la început aceste fișiere în alte programe decât Adobe Reader. Aici intră QPDF (și unele alte utilitare de revizuire), doar scoateți criptarea din fișier și întrebarea de citire este eliminată. Uităm la proprietățile documentului folosind pdfinfo din poppler:

Acum, cu citirea problemelor pur și simplu nu va fi. Dacă fișierul este protejat prin parolă, trebuie să îl specificați cu opțiunea -password.

Lucrăm cu pdf în linux
Obțineți informații despre fișier utilizând pdfinfo

Când se lucrează cu PDF, se întâmplă adesea sarcina de a asambla fișiere din părți ale documentelor individuale sau de a schimba parametrii individuali, cum ar fi dimensiunea foii sau orientarea (portret sau peisaj). Scripturile simple vă permit să faceți tot ce aveți nevoie literalmente cu o singură comandă, dar mai întâi trebuie să înțelegeți utilitățile de bază.

Funcțiile pdfseparate și pdfunite de la poppler vă permit să extrageți pagini individuale și să îmbinați documente. Și printre celelalte descrise mai jos, acestea sunt cele mai ușor de utilizat, deoarece nu au multe opțiuni și munca lor este ușor de înțeles. De exemplu, extragem paginile de la 10 la 20 și le stocăm într-un document separat:

În numele variabilei. este obligatorie, deoarece pdfseparate poate stoca paginile numai în fișiere separate. În loc de acesta, numărul paginii va fi înlocuit, adică în cazul nostru vom primi fișiere numite file-10.pdf ... file-20.pdf. Dacă încă mai aveți nevoie de un singur document, atunci pdfunite vine la salvare. Să colectăm paginile 10 și 11 într-un singur document:

QPDF are o mulțime de opțiuni și caracteristici, este aproape utilitate universală pentru procesarea fișierelor PDF și multe operații sunt efectuate de o singură comandă. De exemplu, putem salva paginile necesare dintr-una sau mai multe surse într-un fișier separat:

Uneori, trebuie doar să comparați două versiuni ale unui fișier PDF - text, imagini, atașamente. Aici veți ajuta două utilități excelente: diffpdf și comparepdf. În cel mai simplu caz:

Pe ieșire obținem diferența. Dacă fișierele sunt aceleași, atunci comanda nu va imprima nimic (opțiunea "-v 2" o va face mai puțin vorbită). Diffpdf este un program GUI care vă permite să realizați o reconciliere a documentului între pagini. Dacă nu există nicio discrepanță, câmpurile goale vor fi afișate după pornire.

Lucrăm cu pdf în linux






Compararea documentelor în diffpdf

Dacă este necesar, în diffpdf puteți specifica intervalele de verificare. Acest lucru este util dacă, de exemplu, o pagină este adăugată la document și, prin urmare, o verificare a paginii după ce va arăta cu exactitate discrepanța.

Nu toți utilizatorii doresc să înțeleagă mai mulți parametri și să experimenteze, unii preferă să selecteze pur și simplu operațiile necesare în GUI. Nici o problemă. PDF-Shuffler este o mică aplicație Python-GTK pentru pyPdf din biblioteca Python. care oferă toate funcțiile pentru lucrul cu PDF: extract, îmbinare, trunchiere, criptare / decriptare și așa mai departe. Programul se află în depozitul de distribuție:

Interfața nu este localizată, dar tot ce este necesar după lansarea - este de a arunca fișiere în fereastra de program, și după toate paginile documentului vor fi afișate utilizând meniul de ștergere, cultură, roti, export dorit. Dacă doriți să efectuați o operație cu mai multe pagini dintr-o dată, doar le marchează în timp ce apăsați tasta Ctrl, apoi stoca rezultatul într-un document nou. Rapid și foarte convenabil. Cu toate acestea, după cum vom vedea, PDF-amestecator folosește, nu toate biblioteca nu poate avea, de exemplu, optimizare, și de criptare / decriptare, este imposibil de a face alte modificări cum ar fi schimbarea dimensiunea colii. Prin urmare, nu înlocuiește complet utilitățile consolei. Prin modul în care, pyPdf, care se bazează pe PDF-amestecator, nu a dezvoltat astăzi în distribuțiile, se întâmplă, se înlocuiește cu o furcă PyPDF2. care este pe deplin compatibil cu versiunea originală plus conține mai multe metode noi.

Lucrăm cu pdf în linux
Formatul PDF Shuffler facilitează eliminarea tuturor documentelor suplimentare

Cross-platform utilitate PDFsam - PDF Split și Merge. scrisă în Java, poate combina, tăia și roti documente PDF. Și în modul burst, acesta generează fișiere separate din paginile PDF. În repozitoriu nu este cea mai recentă versiune foarte buggy. Noile versiuni nu au deja multe dezavantaje, așadar este mai bine să le punem de pe site-ul oficial, dar va trebui să le compilați puțin, pentru că fără dezvoltatori de plată oferă doar un ansamblu pentru Win și codul sursă.

Editare PDF

PDF-ul în sine este un format complex conceput pentru publicarea produselor, care necesită instrumente speciale pentru crearea și editarea. Și * nix-utilizatorii au multe de ales. Puteți crea un document PDF în Open / LibreOffice și, pentru a putea edita, trebuie să instalați Oracle PDF Import Extension. În plus, sunt disponibile aplicații speciale - PDFedit. Scribus și Master PDF Editor. Printre acestea, Scribus este o aplicație foarte puternică, cu multe funcții, care necesită timp să stăpânească.

Master PDF Editor este un instrument foarte simplu care este distribuit gratuit pentru uz non-comercial. PDFedit vă permite să efectuați orice operațiuni pentru a face corecții la documente PDF. Instrumentele încorporate vă permit să editați text și grafică, dar nu sunteți prieteni cu mese. Automatizarea este posibilă cu scripturile ECMAScript. Din păcate, PDFedit utilizând Qt 3 în versiunea curentă a Ubuntu este eliminat din cauza lipsei de sprijin pentru pachetul libqt3-mt, iar încercarea de instalare nu este întotdeauna de succes. Varianta Qt 4 este încă în curs de dezvoltare.

În contextul de lucru cu utilitate PDF PDFtk Sid Steward (Sid Steward) ar dori să sublinieze în special. Nu este nici o utilitate, și se combină „toate într-un singur“, vă permite să împartă sau fuziona mai multe documente într-o singură, decripta / cripta PDF-File, adăuga sau elimina atașamente, completați formulare, restaura documentele deteriorate și mai mult. În general, dezvoltatorii oferă mai multe soluții, baza tuturor - un utilitar de linie de comandă PDFtk Server, care este discutat în continuare. Pentru utilizatorii Win, dezvoltatorii oferă o interfață grafică. Plus alte două utilitati disponibile: coduri de bare GNU Plus PDF pentru a genera un cod de bare PDF-File și a plătit STAMPtk, generatoare de filigrane, anteturile și subsolurile într-un PDF-fișier. Pachetul PDFtk este deja în depozite de distribuție, astfel încât nici o problema cu instalarea. Împreună cu echipa ar trebui să specifice numele de intrare și fișierul de ieșire (susținută de masca), comanda si parametrii. Toate sprijinite 18 echipe, toate acestea sunt descrise în documentație. Pentru a da doar câteva exemple, suficiente pentru a înțelege cu PDFtk. De exemplu, comanda pisica vă permite să îmbinați mai multe fișiere într-o a treia - outfile.pdf:

Dacă există mai multe fișiere, este mai ușor să le compilați într-un singur director și să utilizați masca * .pdf. Paginile individuale sunt tăiate pur și simplu prin specificarea numerelor după pisică:

În plus, dacă există mai multe fișiere, fiecare are propriile pagini, dacă este necesar, schimbările de orientare.

În exemplul din documentul in1.pdf, prima pagină va fi extrasă, care va fi rotită la 90 de grade. Din cel de-al doilea document se extrag numai pagini din intervalul 2-20. Paritatea poate fi specificată drept (chiar) sau par (ciudat), rotația este indicată ca nord, sud, est, vest, stânga, dreapta sau în jos. Ultima pagină a documentului poate fi specificată cu sfârșitul cuvântului cheie. Intervalul este specificat fie direct, ca în exemplu, fie invers (de exemplu, sfârșitul-1). Pentru a decomprima paginile PDF, utilizați comanda burst.

Ca rezultat, primim mai multe documente ale formularului out001.pdf. Uneori trebuie să corectați metadatele rămase în PDF printr-un alt program. Cu PDFtk, acest lucru este ușor. Mai întâi extragem datele inițiale:

Decriptarea PDF-ului, pe care am menționat-o mai sus, este o problemă a unei echipe:

Lucrăm cu pdf în linux
PDFtk - un utilitar universal pentru lucrul cu PDF

Distribuiți acest articol cu ​​prietenii dvs.:

Scripturile pentru criptografie sunt ascunse în widgeturile LiveHelpNow și au lovit peste 1500 de site-uri

Extortioner qkG criptează numai documente Word și se distribuie automat folosind macrocomenzi

Firefox va avertiza utilizatorii despre vizitarea site-urilor hacked anterior

"Codul securității informațiilor" va avea loc în Astana pentru prima dată

Noile vulnerabilități din Intel ME sunt periculoase pentru dispozitivele Acer, Dell, Fujitsu, HP, Lenovo, Panasonic și așa mai departe







Articole similare

Trimiteți-le prietenilor: