Seiten aus PDF extrahieren

Ich hatte das Problem dass ich Seiten aus PDF extrahieren wollte. Nun kann der Acrobat Reader zwar Seiten selektiv drucken, aber eben nur das ganze Dokument speichern.

Eine erste Idee wäre gewesen einfach die interessanten Seiten auf einen „PDF-Drucker“ zu drucken. Da hatte ich aber Bedenken dass die Abbildungen an Qualität verlieren.

Ich brauche also eine Software die das besser kann. Zusätzlich sollte die Software nichts kosten, am besten noch ein Open Source Projekt sein.
Eine Suche im Netz brachte das „pdftk the pdf toolkit“ zum Vorschein.
Dabei handelt es sich um ein Kommandozeilenwerkzeug um PDF Dateien zu manipulieren. Die Funktionen die ich bislang verwendet habe sind das Rotieren von Seiten und das Schneiden und neu Zusammenfügen von PDF Dateien. Das funktioniert wie gewünscht.

Mit dieser Zeile wird zum Beispiel ein neues PDF out.pdf erzeugt das die Seiten 12 bis 17 der Datei input.pdf enthält:

Mehr Infos über das Programm und weitere Anwendungsbeispiele finden sich auf der Projektseite. Den Quellcode des GPL Tools gibt es dort auch zum Download. Für Windows, MacOS und Linux gibt es schon fertige Binaries, alle anderen müssen selbst compilieren.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.