Was sich in einer PDF verbergen kann, die Sie nicht erstellt haben
Eingebettete Dateien, JavaScript und versteckte Annotationen reisen in PDFs mit, ohne auf einer Seite zu erscheinen. Warum das wichtig ist, wenn Sie Dokumente teilen oder in KI-Werkzeuge hochladen.
Sie erhalten eine PDF von einem Lieferanten. Sie blättern durch die Seiten, alles sieht normal aus, und leiten die Datei an Ihr Team weiter. Später laden Sie sie in einen KI-Assistenten hoch, um eine schnelle Zusammenfassung zu erhalten.
Was Sie auf diesen Seiten nicht sehen konnten: zwei Dateien, die im Dokument eingebettet sind, und ein JavaScript-Fragment, das beim Öffnen der Datei ausgeführt wird.
Was PDFs neben den sichtbaren Seiten tragen können
Drei Kategorien nicht sichtbarer Inhalte tauchen häufig genug auf, um sie zu kennen:
Eingebettete Dateianhänge. Eine PDF kann andere Dateien enthalten, die darin gebündelt sind: Word-Dokumente, Tabellen, andere PDFs, sogar ausführbare Dateien. Dies ist eine legitime Funktion, die in juristischen Schriftsätzen und technischer Dokumentation verwendet wird. Das Problem ist, dass Sie möglicherweise nicht wissen, dass die Anhänge vorhanden sind, wenn Sie eine Datei von außerhalb Ihrer Organisation erhalten.
JavaScript. Die PDF-Spezifikation unterstützt ausführbare Skripte. Acrobat und Adobe Reader können JavaScript ausführen, wenn ein Dokument geöffnet wird, auf eine Schaltfläche geklickt oder eine bestimmte Seite angezeigt wird. Die meisten modernen PDF-Leseprogramme deaktivieren dies standardmäßig, aber der Code reist trotzdem mit der Datei mit.
Versteckte Annotationen. Annotationen mit gesetztem Hidden-Flag sind an Seiten angehängt, werden aber bei normaler Anzeige nicht angezeigt. Sie können Text, Markierungen oder zusätzliche Metadaten enthalten, die absichtlich oder versehentlich versteckt statt gelöscht wurden.
Warum das wichtiger wird, wenn KI-Werkzeuge Ihre PDFs lesen
Wenn Sie eine PDF in einen KI-Assistenten, Zusammenfasser oder ein Dokumentenanalyse-Werkzeug hochladen, übergeben Sie die vollständige Dateistruktur, nicht nur die gerenderten Seiten. Hat diese Datei eingebettete Anhänge, besitzt der KI-Dienst diese Dokumente ebenfalls. Enthält sie JavaScript, ist der Code im Payload, auch wenn die Plattform ihn nicht ausführt.
Für Dateien, die zwischen Organisationen zirkulieren, Verträge, Lieferantenvereinbarungen, behördliche Einreichungen, lohnt sich eine kurze Prüfung vor dem Upload. Sie kontrollieren nicht immer, was in einer PDF landet, die außerhalb Ihres Teams erstellt wurde.
Es gibt ein zweites Szenario, das häufiger vorkommt: ausgehende Weitergabe. Wenn Ihr Erstellungsprozess PDFs mit eingebetteten Anhängen als Teil einer Vorlage oder Exporteinstellung produziert, tragen Dateien, die Sie weitergeben, diese Anhänge, ohne dass Sie es merken.
Der Unterschied zwischen Inhalte verstecken und entfernen
Text mit einer weißen Form zu überdecken oder ein Element aus dem sichtbaren Seitenbereich zu verschieben, entfernt es nicht aus der PDF. Die Daten befinden sich weiterhin in der Dateistruktur und sind für jedes Werkzeug zugänglich, das das Dokument analysiert statt es nur zu rendern.
Dieselbe Unterscheidung gilt für Annotationen und Anhänge. Etwas im Betrachter als versteckt zu markieren ist nicht dasselbe wie es aus der Datei zu löschen. Echte Entfernung muss auf Strukturebene stattfinden, indem das Dokument ohne das betreffende Objekt neu geschrieben wird.
Eine PDF reinigen, bevor Sie sie teilen oder hochladen
Das Werkzeug zum Entfernen versteckter Inhalte von PDFShore scannt alle drei Kategorien und entfernt, was es findet: eingebettete Anhänge, JavaScript und versteckte Annotationen. Die sichtbaren Seiten bleiben exakt wie sie sind.
Es läuft in Ihrem Browser, sodass die Datei zum Reinigen nicht auf einen Server hochgeladen werden muss. Findet der Scan nichts, speichert das Werkzeug trotzdem eine bestätigt saubere Kopie, damit Sie einen Nachweis haben, dass das Dokument geprüft wurde.
Für Dateien, die von außerhalb Ihrer Organisation kommen und die Sie weitergeben oder an einen KI-Dienst übergeben möchten, ist dieser Schritt klein und beseitigt eine echte Klasse von Unbekannten.