Wie Sie eine PDF komprimieren, ohne sie hochzuladen
Moderne Browser können PDFs komprimieren, ohne etwas an einen Server zu senden. Hier erfahren Sie, was sich geändert hat, wie es funktioniert und wo es noch unvollkommen ist.
Jede Woche fragt mich jemand, wie man eine PDF verkleinert, ohne eine dieser Hochladen-und-Herunterladen-Seiten zu benutzen. Die ehrliche Antwort lautete früher: geht nicht, jedenfalls nicht wirklich, es sei denn, Sie installieren Adobe Acrobat oder lernen Ghostscript. Das hat sich vor einigen Jahren geändert, und die meisten haben es verpasst.
Moderne Browser können echte PDF-Arbeit leisten. Nicht nur "eine Datei anzeigen", sondern sie analysieren, neu rendern, Bilder neu komprimieren, Metadaten entfernen und eine ganz neue Datei schreiben. Alles im Tab, ohne dass etwas Ihren Rechner verlässt. Dieser Artikel zeigt, wie das funktioniert, wo es glänzt und wo nicht.
Was "Online-PDF-Kompressor" meistens bedeutet
Die meisten kostenlosen PDF-Tools im Netz folgen demselben Rezept. Sie ziehen eine Datei in ein Webformular. Die Datei wird auf den Server des Anbieters hochgeladen. Ein Hintergrundprozess startet Ghostscript oder eine ähnliche Engine und erzeugt eine kleinere PDF. Sie laden das Ergebnis herunter.
Die Komprimierung selbst ist in Ordnung. Was mich stört, ist die Datenschutzgeschichte. Lesen Sie die Nutzungsbedingungen einer beliebigen bekannten Seite in diesem Bereich, und Sie finden Klauseln über vorübergehende Speicherung, Aufbewahrungsfristen ("bis zu 60 Minuten" ist üblich) und Rechte, Inhalte zur "Serviceverbesserung" zu verarbeiten. Ein Kontoauszug, ein Vertrag oder ein gescannter Ausweis liegt jetzt auf dem Server eines anderen, und sei es nur für ein paar Minuten.
Bei den meisten Dateien ist das völlig in Ordnung. Bei manchen nicht, und in der Regel wissen Sie erst, was was ist, wenn etwas durchsickert.
Was sich in den Browsern geändert hat
Drei Dinge haben clientseitige PDF-Arbeit praktikabel gemacht:
- WebAssembly. C- und C++-Bibliotheken, die gut mit PDFs umgehen, wie PDFium und ein abgespecktes PDF.js, kompilieren jetzt in ein Binärformat, das Browser nahezu in nativer Geschwindigkeit ausführen.
- Web Workers. Aufwändige Arbeit wandert vom Haupt-Thread weg. Die Seite bleibt reaktionsfähig, während ein Dokument mit 200 Seiten im Hintergrund neu gerendert wird.
- OffscreenCanvas. Ein echter, GPU-fähiger Canvas, der innerhalb eines Workers funktioniert. Genau das erlaubt es uns, Seiten zu rastern, ohne den Tab einzufrieren.
Zusammengesetzt erledigen diese drei Bausteine dieselbe Aufgabe, die früher ein Server übernommen hat. Der Preis ist Bandbreite (die Engine selbst muss einmal geladen werden) und eine kleine Startverzögerung. Danach bleibt jede Datei, die Sie verarbeiten, im Arbeitsspeicher und wird verworfen, sobald Sie den Tab schließen.
Wie Browser-Komprimierung tatsächlich funktioniert
Eine PDF ist ein Container. Darin stecken Text, Vektorformen, eingebettete Schriften, Rasterbilder und ein Haufen Metadaten. Zwei grobe Strategien bringen die Dateigröße nach unten.
Verlustfreies Neupacken. Das PDF-Format erlaubt verschiedene Wege, denselben Inhalt zu speichern. Object Streams zum Beispiel packen viele kleine Objekte zusammen und lassen sie als einen Block komprimieren. Doppelte Schriften zu entfernen, ungenutzte XObjects zu verwerfen und Metadaten zu löschen kann bei vielen Dateien 10 bis 30 Prozent einsparen, ohne einen einzigen Pixel anzufassen. Text bleibt markierbar, Vektoren bleiben scharf.
Rasterung. Wenn Sie eine kleinere Datei brauchen und das Dokument ohnehin überwiegend aus Bildern besteht (denken Sie an gescannte Verträge oder Magazin-Layouts), ist der wirkungsvollste Schritt, jede Seite in einer gewählten Auflösung als Bild zu rendern, sie als JPEG zu kodieren und eine neue PDF zu schreiben, die diese Bilder umschließt. Sie verlieren durchsuchbaren Text. Außerdem verlieren Sie etwa die Hälfte der Bytes, manchmal mehr.
Gute Tools lassen Sie wählen. PDFShore bietet drei Voreinstellungen: Leicht (nur verlustfrei), Empfohlen (Rasterung bei 150 DPI mit JPEG-Qualität 0,75) und Extrem (100 DPI, Qualität 0,5). Die richtige hängt davon ab, wofür die Datei gedacht ist. E-Mail-Anhang? Empfohlen ist meist unsichtbar. Druckvorlage? Bleiben Sie bei Leicht oder verzichten Sie ganz auf Komprimierung.
Kompromisse, die Sie kennen sollten
Browserseitige Komprimierung ist kein kostenloser Gewinn. Ein paar Dinge zum Mitnehmen:
- Zeit. Server-Engines laufen auf kräftigen Maschinen. Ihr Laptop läuft, nun ja, auf Ihrem Laptop. Ein Dokument mit hundert Seiten kann auf älterer Hardware eine halbe Minute dauern.
- Arbeitsspeicher. Jede Seite zu rastern bedeutet, Bitmaps im RAM zu halten. Sehr große Dateien (300+ Seiten dichter Scans) stoßen in einem Tab an Speichergrenzen.
- Verschlüsselte PDFs. Dokumente mit Passwort müssen zuerst entsperrt werden. Die meisten Browser-Tools (PDFShore eingeschlossen) bitten Sie, das Passwort in Ihrem PDF-Reader zu entfernen und dann zurückzukommen.
- Browser-Unterstützung. Sie brauchen OffscreenCanvas, das Safari erst mit 16.4 ausgeliefert hat. Alles Ältere fällt anmutig zurück, wobei der Rasterungs-Pfad fehlschlägt.
Wann ein Desktop-Tool noch besser ist
Die Stapelverarbeitung von Hunderten Dateien, skriptgesteuerte Pipelines und sehr große Dokumente sind mit Ghostscript auf der Kommandozeile oder einer kostenpflichtigen Desktop-App noch immer glücklicher. Browser sind großartig im Fall "einmalig, jetzt, ohne Aufwand". Sie sind nicht großartig bei "komprimiere diesen Ordner mit 800 Rechnungen über Nacht".
Ein kurzer Durchlauf
Hier ist der ganze Ablauf mit PDFShore. Öffnen Sie die Seite PDF komprimieren. Ziehen Sie eine Datei in den gestrichelten Bereich oder klicken Sie, um eine auszuwählen. Die Oberfläche zeigt Dateiname und Größe und bietet dann drei Voreinstellungen. Wählen Sie eine, klicken Sie auf Komprimieren und beobachten Sie den Fortschrittsbalken. Wenn es fertig ist, sehen Sie den eingesparten Prozentsatz, die Größen vorher und nachher und eine Schaltfläche zum Herunterladen.
Wenn das Ergebnis zu weich ist, wechseln Sie zu einer leichteren Voreinstellung und versuchen Sie es erneut, ohne etwas neu hochzuladen. Die Datei liegt bereits im Arbeitsspeicher.
Der Aspekt des "kleinen Webs"
Man vergisst leicht, wie viel im Web schlicht aufhören könnte, Dateien an Server zu senden. Bildkomprimierung, Dateikonvertierung, Audioschnitt, sogar kleine Videobearbeitungen laufen problemlos auf einem aktuellen Laptop oder Telefon. Das Muster verlagert immer mehr Arbeit in den Browser, was gut für den Datenschutz ist, schlecht für risikokapitalfinanzierte Geschäfte nach dem Prinzip "kostenloses Tool, wir behalten Ihre Daten", und großartig für die Leute dazwischen.
Probieren Sie das Tool PDF komprimieren aus, schicken Sie Feedback, und wenn es sich jemals so anfühlt, als täte die Seite etwas hinter Ihrem Rücken, schauen Sie in den Netzwerk-Tab. Er sollte leer sein, nachdem die Engine geladen hat. Genau darum geht es.