PDF-Dateien umfassend manipulieren

Letztens hatte ich ein Problem, ich wollte jemandem eine PDF-Datei zur Verfügung stellen. Die Datei war 20 MB groß und der Zielrechner etwas schwachbrünstig. In der Datei waren mehrere Bilder eingebunden, darunter ein JPG-Bild mit einer Größe von 6614 x 17148 Pixeln (5MB). Alles in allem war diese PDF-Datei der reinste Ressourcenfresser.

Vorübung – Bilder aus dem PDF ziehen

Als kleine Erwärmung galt es die eingebetteten Bilder aus dem PDF zu ziehen. Als einfach zu nutzende Anwendung hat sich der PDF Image Extraction Wizard (Windows only) entpuppt. In der unregistrierten Version bekommt man damit nur 3 Bilder pro Datei heraus, aber man kann ja die Seite angeben ab der man Bilder haben möchte. Mit etwas Geduld und Spucke fallen so nacheinander die verlustfrei und verlustbehafteten Bilder im jeweils gewünschten Format auf die Platte.

Das grösste eingebettete Bild war 6614 x 17148 Pixel groß und wog stattliche 5 MB. Daher war auch klar, warum mein PC arg ins Schleudern geriet.

Weiter zur Kür.

PDF verkleinern

Irgendwie gibt es einen ganz Sack voll Free- und Shareware, die behauptet PDFs hübsch klein zu machen. Aber wie das so ist, bekommt man mit sehr einfach gestrickten Werkzeugen keine ordentlichen Ergebnisse. So macht der Free PDF Compressor aus den 20 MB gerade mal 18 MB.

Eine einfache Anwendung die mittels Assistent den Anwender durch das heikle Minenfeld führt habe ich letztlich nicht gefunden. Dafür gibt es aber eine hervorragende Lösung für Fortgeschrittene Nutzer. Man nehme einfach die Kombination aus Ghostscript und Ghostview. Diese beiden Werkzeuge stammen aus der Unix-/Linuxwelt und gibt es auch für Windows.

Nach der Installation öffnet man das zu konvertierende PDF mittels Ghostview. Leider geht das nicht ganz so flott wie mit dem Acrobat Reader. Dann wählt man den Menupunkt „Datei“ -> „Konvertierung“ aus und gibt seine gewünschte Auflösung in dpi (dots per inch) an. Die angebotenen 72 dpi reichen für das Anschauen am Bildschirm. Als Gerät nutzt man den „pdfwriter“. Man kann z.B. auch Graustufen-JPG oder PNG-Dateien mit 256 Farben für jede Seite erzeugen. Die Möglichkeiten sind vielfältig. Nach kurzem Warten war die konvertierte PDF-Datei nur noch 9 MB groß.

Will man noch weiter komprimieren hilft nur noch manuelle Handarbeit. In den Einstellungen der Konvertierung gibt man dann für Farb-, Grau- und Schwarzweiß-bilder die Vorgaben einzeln vor. Hier die Vorgaben für die Farbbilder:

  • AutoFilterColorImages -> true
  • EncodeColorImages -> true
  • DownsampleColorImages -> true
  • ColorImageResolution -> 72
  • ColorImageDownsampleType -> Subsample

Zusammen mit dem CompatibilityLevel 1.5 war die Zieldatei am Ende etwas mehr als 3 MB groß. Das sind nurmehr 15 % der Originalgröße. Die Bilder im PDF blieben sogar erstaunlich gut erkennbar. Mit weiterem Optimieren kann man sicher die Qualitätsverluste zu Lasten der Zielgröße feiner abstimmen.

Die Kür war bestanden und der Zielrechner hat die Darstellung befriedigend erledigen können.

Tausend Dank an Open Source!

PS: Weitere tolle Sachen kann man mit PDFill (Windows) machen. PDFill kann Zusammenfügen, Umsortieren, Seiten entfernen, Wasserzeichen hinzufügen und viele weitere Dinge.

Dieser Beitrag wurde unter Internet, Umgebungsgedanken abgelegt und mit , , , , , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

336 Antworten zu PDF-Dateien umfassend manipulieren

  1. Jörg sagt:

    Interessanter Artikel!

    Ich glaube das wären ein paar gute Kandidaten:

    http://www.dresden-pieschen.de/Broschuere-kurz-einseitig.pdf
    (Hat ne geschlagene halbe Stunde gedauert, das hoch zu laden! Die gutste Frau Dr. Becker hat halt eher Ahnung von Architektur)

    und

    http://dresden-pieschen.de/cgi-bin/weblog_basic/index.php?p=126
    – das zweite PDF ist unvollständig, an der Umwandlung bzw. dem Hochladen der Original-.doc-Datei ist mein Rechenknecht gescheitert.

    Hab‘ aber eigentlich nicht wirklich Bock, mich damit rum zu schlagen. Hättest Du vielleicht Interesse?

    Besten Gruß,
    Jörg

Kommentare sind geschlossen.