Ghid rapid pentru Apache poi word

De multe ori, această aplicație software este necesară pentru a crea documente de ajutor în formatul de fișier Microsoft Word. Uneori, se așteaptă ca aplicația să primească fișierele Word ca intrare.







Orice programator Java care dorește să creeze fișiere MS-Office, iar ieșirea trebuie să utilizeze un API predefinit și read-only pentru a face acest lucru.

Ce este Apache POI?

Apache POI este un API popular care permite programatorilor să creeze, să modifice și să afișeze fișiere MS-Office folosind programe Java. Aceasta este o bibliotecă open source dezvoltată și distribuită de Apache Software Foundation pentru dezvoltarea și modificarea fișierelor MS-Office utilizând programul Java. Acesta conține clase și metode pentru decodarea datelor de intrare ale utilizatorilor sau a unui fișier în documente MS-Office.

Componente ale Apache POI

Apache POI conține clase și metode de lucru pentru toate documentele OLE2 Compuse MS-Office. Lista componentelor acestui API este după cum urmează:

POIFS (Implementarea sistemului de fișiere de rău obfuscare): Această componentă este factorul principal al tuturor celorlalte elemente de POI. Este folosit pentru a citi în mod explicit diverse fișiere.

HSSF (Format oribil de foaie de calcul): Este folosit pentru a citi și a scrie formatul .xls a fișierelor MS-Excel.

XSSF (formatul foilor de calcul XML): utilizat pentru formatul de fișier .xlsx al MS-Excel.

HPSF (Format oribil de setare a proprietății): utilizat pentru a prelua seturile de proprietăți ale fișierelor MS-Office.

HWPF (format de procesor de text oribil): Este folosit pentru a citi și a scrie fișierul .doc cu fișiere MS-Word.

XWPF (XML word processor Format): Este folosit pentru a citi și a scrie .docx extensia fișierului MS-Word.

HSLF (Format oribil al diapozitivelor): este folosit pentru a citi, a crea și a prezenta editarea PowerPoint.

HDGF (Format oribil): conține clase și metode pentru fișiere binare MS-Visio.

HPBF (Format oribil de editor): Este folosit pentru a citi și scrie fișiere MS-Publisher.

Acest tutorial vă ghidează prin procesul de lucru cu fișiere MS-Word folosind Java. Prin urmare, discuția este limitată la componentele HWPF și XWPF.

Acest capitol vă ghidează prin procesul de configurare a Apache POI pe sistemele Windows și bazate pe Linux. Apache POI poate fi ușor instalat și integrat cu mediul Java actual, după câțiva pași simpli, fără proceduri complicate de configurare. Administrarea utilizatorului este necesară în timpul instalării.

Cerințe de sistem

Java SE 2 JDK 1.5 sau mai mare

Aici termenul "document" se referă la un fișier MS-Word. După finalizarea acestui capitol, puteți crea documente noi și deschide documente existente utilizând programul Java.

Crearea unui document gol

Următorul program simplu este folosit pentru a crea un document gol MS-Word:

Salvați codul Java de mai sus ca CreateDocument.java, apoi compilați-l și executați-l din linia de comandă după cum urmează:

Dacă în mediul dvs. sistemul este configurat cu o bibliotecă POI, acesta va fi compilat și executat. pentru a crea un fișier gol numit Excelcreatedocument.docx în directorul curent și afișați următoarea ieșire pe linia de comandă:

În acest capitol, veți învăța cum să creați un element și cum îl adăugați într-un document utilizând Java. Elementul face parte din pagina din fișierul Word.

După finalizarea acestui capitol, puteți să creați un element și să efectuați operații de citire pe acesta.

Creați un element

Mai întâi, să creăm un paragraf folosind referințele de clasă discutate în capitolele anterioare. În urma capitolului anterior, creați un document și apoi creați un element.







Următorul fragment de cod este utilizat pentru a crea tabelul:

Rulați pe punct

Puteți introduce text sau orice obiect de obiect utilizând comanda Executare. Folosind o instanță de paragraf, puteți crea o execuție.

Următorul fragment de cod este utilizat pentru a crea rularea.

Scrieți în paragraf

Să încercăm să introducem un text în document. Luați în considerare următoarele date de text:

Următorul cod este utilizat pentru a scrie datele de mai sus în paragraf.

Salvați codul Java de mai sus ca CreateParagraph.java, apoi compilați-l și executați-l din linia de comandă după cum urmează:

Acesta va compila și executa. Pentru a crea un fișier numit Word, createparagraph.docx în directorul curent. și obțineți următoarea ieșire pe linia de comandă:

Fișierul createparagraph.docx arată astfel.

Ghid rapid pentru Apache poi word

În acest capitol, veți învăța cum să aplicați o margine unui element folosind programarea Java.

Aplicarea frontierei

Următorul cod este utilizat pentru a aplica margini într-un document:

Salvați codul de mai sus în fișierul ApplyingBorder.java, compilați-l și executați-l din linia de comandă după cum urmează:

Dacă sistemul dvs. este configurat cu o bibliotecă POI, acesta va fi compilat și executat. pentru a crea un document Word. cu numele "applyingborder.docx" în directorul curent și va afișa următoarea ieșire:

Fișierul applyingborder.docx arată astfel:

Ghid rapid pentru Apache poi word

În acest capitol, veți învăța cum să creați un tabel de date într-un document. Puteți crea date de tabel utilizând clasa XWPFTable. Când adăugați fiecare rând din tabel și adăugați fiecare celulă în linie, obțineți datele din tabel.

Creați tabel

Următorul cod este utilizat pentru a crea un tabel în document:

Salvați codul de mai sus în fișierul numit CreateTable.java compilați-l și executați-l din linia de comandă după cum urmează :.

Acest lucru creează un fișier numit Word, createtable.docx în directorul curent și afișează următoarea ieșire pe linia de comandă:

Filecreatetable.docx arată astfel:

Ghid rapid pentru Apache poi word

Acest capitol vă arată cum să aplicați diferite stiluri de fonturi și aliniere într-un document Word, utilizând Java. În mod obișnuit, stilul fontului conține: dimensiunea fontului, tipul, caracterele aldine, cursivele și sublinierea. Alinierea este împărțită în stânga, centru, drept și justifică.

Stilul fontului

Următorul cod este utilizat pentru a seta diferite stiluri de fonturi:

Salvați codul de mai sus. ca FontStyle.java. apoi compilați-l și executați-l din linia de comandă după cum urmează:

Acest lucru va crea un fișier numit Word, fontstyle.docx în directorul curent și va afișa următoarea ieșire pe linia de comandă:

Filefontstyle.docx arată astfel.

Ghid rapid pentru Apache poi word

Următorul cod este utilizat pentru a seta alinierea pentru textul paragrafului:

Salvați codul de mai sus. ca AlignParagraph.java. apoi compilați-l și executați-l din linia de comandă după cum urmează:

Acest lucru va crea un fișier numit Word, alignparagraph.docx în directorul curent și va afișa următoarea ieșire pe linia de comandă:

Filealignparagraph.docx arată astfel:

Ghid rapid pentru Apache poi word

Acest capitol descrie modul de extragere a datelor text dintr-un document Word utilizând Java. În cazul în care doriți să extrageți metadate dintr-un document Word, utilizați Apache Teak.

Pentru fișierele .docx, folosim clasa org.apache.poi.xwpf.extractor.XPFFWordExtractor, care prelucrează și returnează date simple dintr-un fișier Word. În același mod, avem diferite metodologii pentru extragerea titlurilor, notelor de subsol, datelor din tabele etc. din fișierul Word.

Următorul cod arată modul de extragere a unui text simplu dintr-un fișier Word:

Salvați codul de mai sus. ca WordExtractor.java compilați și executați-l din linia de comandă, după cum urmează:

Acesta va genera următoarea ieșire:







Articole similare

Trimiteți-le prietenilor: