Java >> Java Tutorial >  >> Java

Lesen Sie PDF in Java mit iText

In diesem Beitrag sehen wir ein Java-Programm zum Lesen von PDF-Dokumenten mit der iText-Bibliothek.

Um mehr über die iText-Bibliothek und PDF-Beispiele zu erfahren, lesen Sie diesen Beitrag – Generieren von PDFs in Java iText-Tutorial verwenden

PDFs mit iText lesen

Zum Lesen von PDF mit iText müssen Sie die folgenden Schritte ausführen.

  1. Erstellen Sie eine PDFReader-Instanz, packen Sie sie in ein PDFDocument ein.
  2. Erhalten Sie die Anzahl der Seiten im PDF, die gelesen werden müssen.
  3. Durchlaufen Sie Seiten und extrahieren Sie den Inhalt jeder Seite mit PdfTextExtractor.

Zum Lesen verwendetes PDF.

Java-Programm

import java.io.IOException;
import com.itextpdf.kernel.pdf.PdfDocument;
import com.itextpdf.kernel.pdf.PdfReader;
import com.itextpdf.kernel.pdf.canvas.parser.PdfTextExtractor;

public class ReadPDF {
  public static final String READ_PDF = "F://knpcode//result//List.pdf";
  public static void main(String[] args) {
  try {
    // PDFReader
    PdfReader reader = new PdfReader(READ_PDF);
    PdfDocument pdfDoc = new PdfDocument(reader);
    // get the number of pages in PDF
    int noOfPages = pdfDoc.getNumberOfPages();
    System.out.println("Extracted content of PDF---- ");
    for(int i = 1; i <= noOfPages; i++) {
      // Extract content of each page
      String contentOfPage = PdfTextExtractor.getTextFromPage(pdfDoc.getPage(i));
      System.out.println(contentOfPage );
    }
    pdfDoc.close();
    }catch (IOException e) {
      System.out.println("Exception occurred " + e.getMessage());
    }
  }
}
Ausgabe
Extracted content of PDF---- 
List with Roman symbols
i. Item1
ii. Item2
iii. Item3
List with English letter symbols
A. Item1
B. Item2
C. Item3
List with Greek letter symbols
a. Item1
ß. Item2
?. Item3

Das ist alles für das Thema PDF in Java mit iText lesen . Wenn etwas fehlt oder Sie etwas zum Thema mitteilen möchten, schreiben Sie bitte einen Kommentar.


Java-Tag