Metadaten

Hat man für die anonyme Veröffentlichung von Informationen im Netz alle Vorkehrungen getroffen, muß man aufpassen, sich nicht durch eben diese Informationen zu verraten. Dabei geht es an dieser Stelle nicht um die Auswertung grammatikalischer Strukturen in Bekennerschreiben oder um die Analyse von Kamerablickwinkeln in kompromittierenden Photos. Viele Dateien tragen begleitende Beschreibungen mit sich, die über die Umstände von Erzeugung oder Änderung Auskunft geben können. Diese werden auch als Metadaten bezeichnet und finden sich in den meisten Dateisystemen als extern gespeichertes Attribut wieder, so zum Beispiel das Datum der letzten Änderung. Für einige Dateitypen ist jedoch vorgesehen, weitaus komplexere Metadaten im Inneren vorzuhalten. Das populäre Bildformat JPEG – heutzutage von fast allen digitalen Kameras erzeugt – erlaubt Applikationen, beliebige binäre Blöcke mit in der Bilddatei zu speichern. Digitalkameras nutzen den „APP1“-Bereich dazu, Einzelheiten über die Herkunft eines Photos – wie z. B. Hersteller, Typenbezeichner und Seriennummer der Kamera – in sog. Exif-Tags zu kodieren. Die Details Datum, Uhrzeit und GPS-Position der Aufnahme lassen sogar noch genauere Rückschlüsse auf den Photographen zu. Um diese Informationen sicher aus dem Bild zu entfernen, sollte man es kurzfristig in ein Format konvertieren, in dem es keine Möglichkeit zur Speicherung von Metadaten gibt. Unter Windows bietet sich hier das BMP-Format an. Benutzer von Gimp können das Bild im PPM-Format speichern und sich danach ineinem Texteditor davon überzeugen, daß nur rohe RGB-Werte für jeden Pixel, nichts jedoch über den Bildursprung wiedergefunden werden kann. Vorm Veröffentlichen im Netz sollte das Bild natürlich wieder in eins der klassischen Web- Formate PNG, JPEG oder GIF konvertiert werden. Bei der Wahl des Werkzeugs dafür sollte man jedoch darauf achten, daß dieses nicht wie der Metadaten – wie zum Beispiel die Seriennummer oder den Rechnernamen – einfügt.

Auch bestimmte Textdokumente enthalten viele zusätzliche Daten. Microsofts Textverarbeitung „Word“ erzeugt Dokumente, in denen von Haus aus die Namen der letzten Bearbeiter, der Käufer der benutzten Software und der Zeitpunkt des letzten Ausdrucks gespeichert sind. Bei vielen Benutzern ist es aus Zeitgründen inzwischen üblich, seine Änderungen mittels „Schnellspeichern“ zu sichern. In einem Word- Dokument bis zur Version 2007 sind die Daten binär und wie auf einer Diskette in Blöcken strukturiert. Beim schnellen Sichern werden nur Blöcke mit den Änderungen angehangen, die alte Version ist dabei schon für mittel mäßig begabte Hacker wiederherstellbar.

Ähnliche Probleme mit der Änderungsgeschichte hat das Dokumentenformat PDF. Aus Effizienzgründen werden auch hier bei Änderungen die alten
Objekte – wie zum Beispiel Textzeilen oder eingebettete Bilder – nur als freigegeben markiert und ein Objekt mit der neuen Version angehangen. Statt also Pamphlete als Word- Dokument oder PDF ins Netz zu stellen, sollte man überlegen, seinen Text in einem leichter zu überprüfenden Format wie RTF oder – falls es auf die Formatierung nicht ankommt – gar als TXT zu speichern. Für die ganz Paranoiden bleibt nur, die Dateien auszudrucken und wieder einzuscannen. Bleibt noch zu erwähnen, daß auch Audiodateien im MP3-Format Sektionen für Metadaten vorsehen, in denen Titel von Stück und Album und der Name des Interpreten zu finden sind. Von diesen Sektionen können sich beliebig viele im MP3 befinden.
Einige MP3-Rip-Programme speichern im Kommentarfeld ihren Namen und die Versionsnummer. Mit viel Phantasie lassen sich hierdurch zumindest einige der Aufnahme des Tondokuments Verdächtigte ausschließen.

Dieser Text wurde ebenfalls aus der aktuellen Datenschleuder geklaut. Ausgabe Nummer #092 sei also jedem Menschen ans Herz gelegt.

Einige Links:

http://de.wikipedia.org/wiki/EXIF
http://de.wikipedia.org/wiki/Meta_Tags
http://de.wikipedia.org/wiki/Mp3#Tagging
Datenschleuder #092