/
Author: Labudde D. Spranger M.
Tags: informationstechnologie informationssicherheit forensik digitale geräte digitale informationen
ISBN: 978-3-662-53801-2
Year: 2017
Text
Dirk Labudde
Michael Spranger Hrsg.
Forensik in der
digitalen Welt
Moderne Methoden der forensischen
Fallarbeit in der digitalen
und digitalisierten realen Welt
Forensik in der digitalen Welt
Dirk Labudde Michael Spranger
(Hrsg.)
Forensik in der digitalen
Welt
Moderne Methoden der forensischen
Fallarbeit in der digitalen
und digitalisierten realen Welt
Herausgeber
Dirk Labudde
University of Applied Sciences Mittweida
Mittweida, Deutschland
ISBN 978-3-662-53800-5
DOI 10.1007/978-3-662-53801-2
Michael Spranger
University of Applied Sciences Mittweida
Mittweida, Deutschland
ISBN 978-3-662-53801-2 (eBook)
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Springer Spektrum
© Springer-Verlag GmbH Deutschland 2017
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich
vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere
für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt
auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichenund Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften.
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem
Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch die Autoren oder
die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler
oder Äußerungen.
Planung: Sarah Koch
Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier.
Springer Spektrum ist Teil von Springer Nature
Die eingetragene Gesellschaft ist Springer-Verlag GmbH Germany
Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Im allgemeinen halte man aber an dem Satze fest,
daß Egoismus, Faulheit und Eitelkeit die einzigen
Triebfedern im Menschen sind, auf die man sich
stets und unbedingt verlassen kann.
Dr. jur. Hanns Gross (1847–1915)
Geleitwort
Die Erfahrungen der vergangenen Jahre bei der Bekämpfung des Kriminalitätsphänomens
Cybercrime haben gezeigt, dass der zeitgemäßen Forschung und Entwicklung, der Lehre
und praxisbezogenen Anwendung sowie der Aus- und Fortbildung im Bereich der polizeilichen Informationssicherheit auf hohem Niveau auch in Zukunft eine herausragende
Bedeutung zukommt. Moderne Technologien stellen Ermittlungsbehörden und Gesetzgeber vor immer neue Herausforderungen. Dieselben Technologien, die Straftäter bei der
Begehung von Straftaten nutzen, müssen Behörden zur Verfügung stehen und von diesen
beherrscht werden können, um auf Augenhöhe Kriminalität zu bekämpfen. Die Cyberkriminalität dabei als singuläres Problem neben anderen Kriminalitätsformen zu betrachten,
ist nicht zielführend. Es bedarf vielmehr einer ganzheitlichen Betrachtung, welche die
Cyberkriminalität als eingebettetes Phänomen der realen Welt begreift. Die richtungsweisende Entwicklung neuer Methoden zur Kriminalitätsbekämpfung kann deshalb nur in
enger Zusammenarbeit von Forschungsinstitutionen und Ermittlungsbehörden erfolgreich
sein.
Dresden, Juli 2016
Klaus Fleischmann
Generalstaatsanwalt
Freistaat Sachsen
VII
Geleitwort
Viele der klassischen Kriminalitätsfelder verlagern sich teilweise oder auch ganz ins Internet, viele Straftaten werden mit dem „Tatmittel Internet“ begangen. Straftäter aller
Couleur nutzen zur Begehung ihrer Taten die neuesten technischen Möglichkeiten, die
weltweite elektronische Vernetzung sowie verschiedenste Mittel und Methoden der AntiForensik – das alles länderübergreifend und arbeitsteilig. In diesen Deliktfeldern ist eine
kontinuierlich steigende Kriminalitätsentwicklung zu bilanzieren, ganz zu schweigen von
der sehr hohen Dunkelziffer. Dem gegenüber stehen die Mitarbeiterinnen und Mitarbeiter
der Strafverfolgungsbehörden, die u. a. mit den Mitteln und Methoden der Computerforensik Beweise sichern und bewerten, kausale Zusammenhänge zwischen Tätern und
Straftat erkennen und schlussendlich solche Straftaten aufklären müssen. Eine der großen
Herausforderungen ist bereits die reine Quantität der zu bearbeitenden Fälle und somit
der beschlagnahmten Asservate, ganz abgesehen von der zunehmenden Heterogenität der
im Zusammenhang stehenden Datenformate. Cloud-Forensik, Netzwerk-Forensik und Forensik der sozialen Netzwerke sind weitere große, bis dato in ihrem Umfang noch gar
nicht absehbare und zusätzliche Baustellen. Mit den bisherigen Mitteln, aber insbesondere auch den bisher genutzten Methoden der klassischen Datenträgerforensik, ist dem
nicht zu begegnen, neue Mittel und Methoden – manchmal auch außerhalb der klassischen Denkweise – sind gefragt. Und hier setzt dieses Buch an: Die Autoren, alle aus der
Wissenschaft stammend, haben durch ihre tägliche Zusammenarbeit mit verschiedensten
Strafverfolgungsbehörden eine „kriminalpolizeiliche Denkweise“ entwickeln können, die
sie in ihre originäre Forschungsarbeit auf dem Gebiet der Forensik einfließen lassen. „Bücher über Datenträgerforensik gibt es genügend.“ – könnte man meinen. Dass dies nicht
stimmt, beweist dieses Buch und macht neugierig auf eine wissenschaftlich untersetzte
kriminalpolizeiliche Denkweise im Bereich der modernen Forensik.
Berlin, September 2016
Ronald Schulze
Geschäftsführer IT-Expertenkreis
Bund Deutscher Kriminalbeamter (BDK)
IX
Vorwort
Wir leben in einer Welt, deren Technologien geprägt sind vom schnellen Wandel und
kurzen Lebenszyklen. Eine Innovation jagt die nächste und heute gelerntes ist morgen bereits veraltet. Genau dieser Umstand spielt Straftätern in die Hände. Sie nutzen kurzfristig
neue Technologien zum Planen, Verabreden und Begehen von Straftaten. Dabei sind sie
den Strafverfolgungsbehörden immer einen Schritt voraus. Auf der anderen Seite bieten
eben diese Technologien dem Forensiker neue Quellen und Methoden der Informationsgewinnung sowie neue Möglichkeiten Hintergründe aufzuklären und Zusammenhänge
aufzudecken. Der steigende Grad der Digitalisierung zwingt Ermittlungsbehörden umzudenken, Wege zu finden, in der virtuellen und realen Welt zu ermitteln. Da die virtuelle
Welt, der Cyberspace, nicht losgelöst von der realen Welt existiert, ist es notwendig, die
Informationen aus den Daten beider Welten zu verbinden, um ein vollständiges Bild einer Straftat zu erhalten. Die einschlägige Fachliteratur beschäftigt sich aber zumeist mit
Fragen der Auswertung klassischer oder digitaler Spuren. Diese Lücke soll mit dem vorliegenden Buch geschlossen werden.
Für wen ist dieses Buch
Es soll Ermittlungspersonen zeigen, welche Möglichkeiten der digitalen und digitalisierten Untersuchung von Straftaten aktuell existieren, welche Tendenzen sich in der Forschung abzeichnen und welchen rechtlichen Fragestellungen mit den aktuellen Entwicklungen einhergehen. Es ist ein Buch für forensische Praktiker, die ihren Blick nach vorn
richten müssen, um vor allem Fälle mit hoher gesellschaftlicher Brisanz schnell und mit
allen technologisch zur Verfügung stehenden Mitteln untersuchen zu können. Auf der
anderen Seite bietet es einen breiten Einstieg in Themenkomplexe der digitalen und computergestützten Forensik für Wissenschaftler, die bei der Weiterentwicklung dieser hochkomplexen Thematiken mitwirken wollen.
Über die Herausgeber
Die Herausgeber und ein Teil der Autoren beschäftigen sich als Leiter bzw. forschende
Mitglieder der Arbeitsgruppe FoSIL (Forensic Sciences Investigation Lab) an der Hochschule Mittweida, aus der Sicht der Informationstechnologien und der digitalen Forensik,
mit aktuellen Themen aus der sicherheitsrelevanten Forschung. Der Schwerpunkt liegt
XI
XII
Vorwort
dabei auf der Identifikation von, aus forensischer- bzw. Sicherheitssicht relevanten, innovativen Technologien und deren Verbindung mit agilem Wissensmanagement zu Werkzeugen für die forensische Praxis bzw. den Einsatz beim interdisziplinären Management
im Krisen- und Katastropheneinsatz. Einzellösungen werden darüber hinaus und im Sinne eines Resilienz-Engineering-Ansatzes zu einer Basis für eine grundlegende, technische
Infrastruktur für prozessbasiertes-und IKT-gestütztes Wissensmanagement zur Krisenprävention und -bewältigung weiterentwickelt. Getrieben von aktuellen Forschungsergebnissen werden im Studiengang „Allgemeine und digitale Forensik“ Methodenkompetenzen
in der forensischen Fallarbeit vermittelt. Das Studium ist angelehnt und in seinen Ausprägungen orientiert am Locard’schen Prinzip. Absolventen sind in der Lage in der Wirtschaft
und in Strafverfolgungsbehörden als Experten die Entwicklung innovativer Technologien
zur Kriminalitätsbekämpfung voranzutreiben.
Aufbau des Buches
Nach einer Einführung in die Welt der modernen Forensik und der daraus resultierenden
Verbindung zwischen virtueller und realer Welt in Kap. 1 richten wir in den Kap. 2–4
unseren Blick in Richtung der Anwendbarkeit moderner Technologien zur Untersuchung
klassischer Spuren und der Rekonstruktion von Tatorten und Tatabläufen. Anschließend
betrachten wir in den Kap. 5–8 das weite Feld der digitalen Spuren von ihrer Sicherung bis
hin zur inhaltlichen Analyse ausgewählter Spurenarten. Das Zusammenführen von digitalen und digitalisierten Spuren steigert die Heterogenität des Untersuchungsmaterials und
damit die Komplexität der Auswertung enorm. Kap. 9 zeigt aktuelle mathematische Ansätze zum Umgang mit dieser Problematik. Den Abschluss bildet Kap. 10, eine Darstellung
der Herausforderungen und aktuellen rechtlichen Lage im Spannungsfeld der Forensik im
digitalen Zeitalter.
Mittweida,
Juli 2016
Dirk Labudde
Michael Spranger
Danksagung
An dieser Stelle möchten wir uns ganz herzlich bei allen Autoren und Autorinnen bedanken, die durch ihre unermüdliche Forschungsarbeit die Forensik vorangetrieben und mit
ihrem Engagement die inhaltliche Ausgestaltung dieses Buches unterstützt haben.
Weiterhin gilt unser besonderer Dank der Staatsanwaltschaft Chemnitz für die Bereitstellung von forensischem Untersuchungsmaterial zum Zweck der forensischen Forschung
sowie dem Bund Deutscher Kriminalbeamter (BDK) für die Unterstützung beim Aufbau
eines deutschen forensischen Kooperationsnetzwerkes.
XIII
Abkürzungsverzeichnis
m. w. N.
StPO
StGB
BVerfG
BVerfGE
TK
TKG
TKÜ
TKÜV
GG
BGH
EMRK
BKAG
ATDG
UrhG
GVG
IMEI
IMSI
IPBPR
IRG
CSI
FAR
FRR
AFIS
CMOS
CCD
mit weiteren Nachweisen
Strafprozessordnung
Strafgesetzbuch
Bundesverfassungsgericht
Entscheidungen des Bundesverfassungsgerichts
Telekommunikation
Telekommunikationsgesetz
Telekommunikationsüberwachung
Telekommunikationsüberwachungsverordnung
Grundgesetz
Bundesgerichtshof
Europäische Menschenrechtskonvention
Gesetz über das Bundeskriminalamt und die Zusammenarbeit des Bundes und
der Länder in kriminalpolizeilichen Angelegenheiten (Bundeskriminalamtgesetz)
Gesetz zur Errichtung einer standardisierten zentralen Antiterrordatei von Polizeibehörden und Nachrichtendiensten von Bund und Ländern (Antiterrordateigesetz)
Urheberrechtsgesetz
Gerichtsverfassungsgesetz
International Mobile Station Equipment Identity
International Mobile Subscriber Identity
Internationaler Pakt über bürgerliche und politische Rechte
Gesetz über internationale Rechtshilfe
Crime Scene Investigation
False Acceptance Rate
False Rejection Rate
Automatisches Fingerabdruck-Identifizierungssystem
complementary metal-oxide-semiconductor
charge-coupled device
XV
XVI
FMR
FNMR
OBIE
Abkürzungsverzeichnis
false matching rate
false non-matching rate
ontology-based information extraction
Inhaltsverzeichnis
1
2
Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Dirk Labudde, Frank Czerner und Michael Spranger
1.1 Forensik – ein aktueller Ein- und Rückblick und der CSI-Effekt . . . .
1.2 Forensik im System der Wissenschaften . . . . . . . . . . . . . . . . . . .
1.3 Tatort in der modernen Forensik . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Der moderne Tatortbegriff . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Moderne Formen der Spurensicherung . . . . . . . . . . . . . .
1.3.3 Zusammenwachsen von virtueller und realer Welt . . . . . . .
1.4 Aufgaben und Ziele der forensischen Wissenschaft . . . . . . . . . . . .
1.5 Spuren als Beweismittel und deren Beweiswürdigung im Strafprozess
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Biometrie und die Analyse digitalisierter Spuren . . . . . . . . . . . . . .
Dirk Labudde
2.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Die Identifikation – Wer bin ich? . . . . . . . . . . . . . . . .
2.1.2 Die Verifikation – Bin ich der, für den ich mich ausgebe? .
2.2 Biometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Historischer Streifzug durch die Biometrie in der Forensik
2.2.2 Biometrie und das Locard’sche Prinzip . . . . . . . . . . . .
2.3 Biometrische Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Ausgewählte Analyseverfahren . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Der Fuß als biometrisches Merkmal im Prozess
der Digitalisierung . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.2 Iriserkennung . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Fingerabdruckanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Der Fingerabdruck als biometrisches Merkmal . . . . . . .
2.5.2 Technologien zur Aufnahme des Fingerabdrucks . . . . . .
2.5.3 Matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Ausgewählte Forensische Datenbanken . . . . . . . . . . . . . . . . .
2.6.1 DNA-Analysedatei (DAD) . . . . . . . . . . . . . . . . . . . .
.
1
.
.
.
.
.
.
.
.
.
1
5
7
7
12
14
16
20
22
...
25
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
26
26
26
27
28
30
33
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
33
36
39
39
40
49
52
52
XVII
XVIII
Inhaltsverzeichnis
2.6.2
2.6.3
2.6.4
2.6.5
2.6.6
2.6.7
2.6.8
Literatur . .
3
4
Violent Crime Linkage Analysis System (ViCLAS) . . . . .
Integrated Ballistic Identification System (IBIS) . . . . . . . .
Paint Data Query (PDQ) . . . . . . . . . . . . . . . . . . . . . .
SoleMate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
TreadMate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Automatisches Fingerabdruckidentifizierungssystem (AFIS)
Eurodac-System . . . . . . . . . . . . . . . . . . . . . . . . . . .
.......................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion . . . . . .
Sven Becker und Dirk Labudde
3.1 Computergestützte forensische 3D-Gesichtsweichteilrekonstruktion . . .
3.1.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 Historische Entwicklung . . . . . . . . . . . . . . . . . . . . . . . .
3.1.3 Voraussetzungen, Faktensammlung und Recherchen . . . . . . .
3.1.4 Klassische Methoden der Gesichtsweichteilrekonstruktion . . .
3.1.5 Computergestützte Methode der Gesichtsweichteilrekonstruktion mittels Open-Source-Software . . . . . . . . . . . . . . . . . . .
3.2 Studie am Beispiel eines Schädelfundes . . . . . . . . . . . . . . . . . . . .
3.2.1 Hintergründe zum ausgewählten Fall . . . . . . . . . . . . . . . . .
3.2.2 Prozessüberblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Digitalisierung des Schädels . . . . . . . . . . . . . . . . . . . . . .
3.2.4 Punktwolkenerzeugung und Oberflächenrekonstruktion
mittels VisualSfM und CMPMVS . . . . . . . . . . . . . . . . . .
3.2.5 Modellnachbearbeitung und Editierung mittels MeshLab . . . .
3.2.6 Positionierung anatomischer Weichteilmarker
und Rekonstruktion ausgewählter Gesichtsmerkmale . . . . . . .
3.3 Schlussfolgerung und Ausblick . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Computergestützte Rekonstruktion von Tatorten
und Großschadensereignissen . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.2 Studie einer Tatortrekonstruktion an einem historischen Mordfall
3.4.3 Unterstützung der Rekonstruktion durch Einsatz moderner
unbemannter Flugobjekte . . . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
DNA-Phänotypisierung . . . . . . . . . . . . . . . . . . . . . . . . . .
Anne-Marie Pflugbeil, Karlheinz Thiele und Dirk Labudde
4.1 DNA-Analytik im forensischen Alltag . . . . . . . . . . . . . .
4.2 Von der Spur zum DNA-Profil . . . . . . . . . . . . . . . . . . .
4.2.1 Workflow . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 DNA-Marker in der Forensischen Molekulargenetik
52
53
53
54
54
54
55
55
59
59
59
62
62
65
66
69
69
70
71
71
74
74
78
79
79
80
81
86
.......
89
.
.
.
.
89
90
90
92
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Inhaltsverzeichnis
4.3
Phänotypisierung – DNA als biometrisches Merkmal
4.3.1 Phänotyp . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Phänotypisierungssysteme . . . . . . . . . . .
4.4 Relevante Datenbanken . . . . . . . . . . . . . . . . . .
4.5 Rechtliche Aspekte . . . . . . . . . . . . . . . . . . . . .
4.6 Anwendung in der Gesichtsweichteilrekonstruktion .
4.7 Zusammenfassung und Ausblick . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
6
XIX
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren . . .
Dirk Pawlaszczyk
5.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Tatort, Digitale Spuren und Datenquellen . . . . . . . . . . . . .
5.3 Sicherung digitaler Spuren . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Live-Response-Akquise . . . . . . . . . . . . . . . . . . .
5.3.2 Post-mortem-Akquise . . . . . . . . . . . . . . . . . . . .
5.3.3 Datenrekonstruktion mittels Carving . . . . . . . . . . .
5.3.4 Kategorisierung und Filterung der Datenartefakte . . .
5.4 Verfolgung digitaler Spuren im Netz . . . . . . . . . . . . . . . .
5.4.1 Analyse und Rekonstruktion des Browsercaches . . .
5.4.2 Tatort Cloud . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.3 Der Messengerdienst WhatsApp . . . . . . . . . . . . .
5.4.4 Open Source Intelligence: Tatort soziale Netzwerke .
5.4.5 Verfolgung von Zahlungsströmen im Bitcoinnetzwerk
5.5 Fazit und Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
95
95
96
101
102
103
104
106
. . . . . . 113
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Textforensik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Michael Spranger und Dirk Labudde
6.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Analyse unstrukturierter digitaler Daten . . . . . . . . . . . . . . . .
6.3 Charakteristik forensischer Texte . . . . . . . . . . . . . . . . . . . .
6.4 Entwicklung einer Kriminalitätsontologie . . . . . . . . . . . . . . .
6.4.1 Ontologie-basierte Informationsextraktion . . . . . . . . .
6.4.2 Repräsentation von Wissensmodellen . . . . . . . . . . . .
6.4.3 Forensisches Ontologiemodell . . . . . . . . . . . . . . . . .
6.5 Ansätze der forensischen Textanalyse . . . . . . . . . . . . . . . . .
6.5.1 Pipeline zur ausführlichen Analyse . . . . . . . . . . . . . .
6.5.2 Identifikation forensischer Rollen . . . . . . . . . . . . . . .
6.5.3 Lösungsansatz für das Problem der versteckten Semantik
6.6 Kategorisierung forensischer Texte . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
113
114
118
119
125
137
140
142
143
147
150
153
156
164
165
. . . . 167
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
167
170
172
172
172
174
175
177
177
179
179
182
XX
Inhaltsverzeichnis
6.7
7
8
Forensische Kurznachrichtenanalyse . . . . . . . . . . .
6.7.1 Einleitung . . . . . . . . . . . . . . . . . . . . . .
6.7.2 Charakteristik inkriminierter Kurznachrichten
6.7.3 Eine neue Methode zur Klassifikation
forensischer Kurznachrichten . . . . . . . . . .
6.7.4 Detektion zusammenhängender Konversation
6.7.5 Bewertung von Konversationen . . . . . . . . .
6.7.6 Erzeugung eines Wörterbuches . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . 186
. . . . . . . . . . . 186
. . . . . . . . . . . 187
.
.
.
.
.
Malware Forensics . . . . . . . . . . . . . . . . .
Christian Hummert
7.1 Einleitung . . . . . . . . . . . . . . . . . . .
7.2 Charakteristik – Einteilung von Malware
7.2.1 Verbreitung und Wirkung . . . . .
7.2.2 Innere Systematik . . . . . . . . .
7.3 Forensische Untersuchung von Malware .
7.3.1 Belauschen von Malware . . . . .
7.3.2 Inhaltliche Analyse . . . . . . . .
7.4 Malware Antiforensics . . . . . . . . . . . .
7.4.1 Kompression von Executables . .
7.4.2 Verschlüsselung von Executables
7.4.3 Obfuskation . . . . . . . . . . . . .
7.4.4 Anti-Debugging Techniken . . . .
7.5 Malware Anatomie . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
188
190
193
195
196
. . . . . . . . . . . . . . . . . . . 199
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
199
201
201
203
203
203
205
206
207
207
208
209
210
212
Audioforensik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hartmut Luge
8.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Überblick zu den Teilgebieten der akustischen Forensik . . . . . . . . . .
8.2.1 Phonetische Stimmerkennung und Stimmenvergleich
(Voice Identification) . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2.2 Nebengeräusche und Geräuscherkennung (Sound Identification)
8.2.3 Geräuschsynthese und Beurteilung (Audibility Analysis) . . . .
8.2.4 Hör- und Sprachverständlichkeitsverbesserung und phonetische
Textanalyse (Intelligibility Enhancement) . . . . . . . . . . . . . .
8.2.5 Manipulations- und Echtheitsanalyse (Authenticity Analysis) .
8.2.6 Zeit-Ereignis-Analyse (Event Sequence Analysis) . . . . . . . .
8.3 Formate und Verfahren der technischen Audioforensik . . . . . . . . . . .
8.3.1 Audioformate und Übertragungskanal . . . . . . . . . . . . . . . .
8.3.2 Manipulation und Echtheit von Audioaufzeichnungen . . . . . .
215
215
216
216
217
217
217
218
218
219
219
222
Inhaltsverzeichnis
XXI
8.3.3 Formantanalyse und Spracherkennung . . . . . . . . . . . . . . . . 225
8.3.4 Sprachverschlüsselung . . . . . . . . . . . . . . . . . . . . . . . . . 231
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9
Methoden des maschinellen Lernens und der Computational Intelligence
zur Auswertung heterogener Daten in der digitalen Forensik . . . . . . . . . 239
Tina Geweniger, Marika Kaden und Thomas Villmann
9.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
9.2 Datenstrukturen und Datenähnlichkeit . . . . . . . . . . . . . . . . . . . . . 240
9.2.1 Daten und Datenstrukturen in der Forensik . . . . . . . . . . . . . 240
9.2.2 Datenähnlichkeit – mathematische Beschreibung . . . . . . . . . 241
9.3 Aufgabenstellungen in der Datenanalyse . . . . . . . . . . . . . . . . . . . . 243
9.4 Prototypbasierte Methoden der CI zum Clustern und Klassifizieren . . . 244
9.4.1 Prototypbasierte Clusteralgorithmen . . . . . . . . . . . . . . . . . 245
9.4.2 Prototypbasierte Klassifikation – Lernende Vektorquantisierer . 255
9.4.3 Andere Verfahren zum Clustern und Klassifizieren –
Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme
und Datenschutz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Frank Czerner
10.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Daten und Dateien als Gegenstände einer Durchsuchung
und Beschlagnahme? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3 Beschlagnahme und Durchsuchung bei E-Mails, SMS etc. . . . . . . . . .
10.4 Kopieren von Daten (Image) als eingriffsschwächeres Äquivalent
zur Beschlagnahme eines Rechners? . . . . . . . . . . . . . . . . . . . . . .
10.5 Problem der Begrenzung von Durchsuchung und Beschlagnahme auf
verfahrensrelevante Datenbestände versus Amtsermittlungsgrundsatz
im Strafprozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.6 Durchsuchung und Beschlagnahme von Daten und der „Kernbereich
privater Lebensgestaltung“ . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.7 Durchsuchung und Beschlagnahme auch bei Nichtbeschuldigten? . . . .
10.8 Formalia bei der Anordnung und Durchführung von Durchsuchung
und Beschlagnahme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.9 Telekommunikationsüberwachung gemäß § 100a StPO . . . . . . . . . . .
10.9.1 Rechtliche Qualifizierung einzelner Phasen im E-Mail-Verkehr
10.9.2 Voraussetzungen und Möglichkeiten der Telekommunikationsüberwachung gemäß § 100a StPO . . . . . . . . . . . . . . . . . .
10.9.3 Anordnung und Durchführung der Telekommunikationsüberwachung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
265
265
266
268
270
271
273
276
276
276
277
281
284
XXII
Inhaltsverzeichnis
10.10 Quellen-Telekommunikationsüberwachung . . . . . . . . . . . . . . . . . .
10.11 Speicherung von Verkehrsdaten für eine spätere Strafverfolgung . . . . .
10.12 Online-Durchsuchungen zugunsten effektiver Strafverfolgung? . . . . .
10.12.1 Online-Durchsuchung im geltenden Strafprozess . . . . . . . . .
10.12.2 Notwendigkeit einer Legitimierung von Online-Durchsuchungen im Strafverfahren . . . . . . . . . . . . . . . . . . . . . . . . . .
10.13 Online-Durchsuchung zur terroristischen Gefahrenabwehr:
Ermittlungsbefugnisse nach dem BKAG und dem ATDG . . . . . . . . .
10.14 Die rechnerexterne Datenspeicherung im World Wide Web:
Cloud Computing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.15 Daten auf Servern außerhalb des Hoheitsgebietes der Bundesrepublik
Deutschland . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
286
287
288
288
291
293
295
297
298
Ausgewählte Rechtsnormen (Auszug) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
Glossar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
Herausgeber und Mitarbeiter
Herausgeber
Prof. Dr. rer. nat. Dirk Labudde
Lehrstuhl für Bioinformatik und Forensik, Leiter Forensic Science Investigation Lab (FoSIL), University of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida,
Deutschland,
E-Mail: labudde@hs-mittweida.de
M. Sc. Inf. Michael Spranger
Wissenschaftlicher Mitarbeiter im Forensic Science Investigation Lab (FoSIL), University
of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: spranger@hs-mittweida.de
Mitarbeiter
M. Sc. Molekularbiologie Sven Becker
Wissenschaftlicher Mitarbeiter im Forensic Science Investigation Lab (FoSIL), University
of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: becker1@hs-mittweida.de
Prof. Dr. jur. Frank Czerner
Lehrstuhl Recht in der Sozialen Arbeit, University of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: czerner@hs-mittweida.de
XXIII
XXIV
Herausgeber und Mitarbeiter
Dr. Tina Geweniger
Mitglied der Computational Intelligence Group, University of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: tgewenig@hs-mittweida.de
Prof. Dr. rer. nat. Christian Hummert
Inhaber des Lehrstuhls für IT-Sicherheit/Digitale Forensik, University of Applied Sciences
Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: hummert@hs-mittweida.de
Dr. rer. nat. Marika Kaden
Mitglied der Computational Intelligence Group, University of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: kaden1@hs-mittweida.de
Prof. Dr. Dr.-Ing. Hartmut Luge
Lehrstuhl für Kommunikationstechnik, University of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: luge@hs-mittweida.de
Prof. Dr. rer. pol. Pawlaszczyk
Lehrstuhl Informatik/Objektorientierte Softwareentwicklung, University of Applied
Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: pawlaszc@hs-mittweida.de
M. Sc. Molekularbiologie Anne-Marie Pflugbeil
Wissenschaftliche Mitarbeiterin im Forensic Science Investigation Lab (FoSIL), University of Applied Sciences Mittweida, Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: pflugbei@hs-mittweida.de
OA Dr. med. Karlheinz Thiele
Gesundheitsamt – Landkreis Zwickau, Werdauer Straße 62, 08056 Zwickau, Deutschland,
E-Mail: karlheinz.thiele@landkreis-zwickau.de
Prof. Dr. rer. nat. habil. Thomas Villmann
Lehrstuhl für Computational Intelligence, University of Applied Sciences Mittweida,
Technikumplatz 17, 09648 Mittweida, Deutschland,
E-Mail: thomas.villmann@hs-mittweida.de
1
Einführung
Dirk Labudde, Frank Czerner und Michael Spranger
1.1 Forensik – ein aktueller Ein- und Rückblick und der CSI-Effekt
Ein Blick in die menschliche Natur zeigt, dass eine große Anziehungskraft in Bezug
auf Verbrechen und deren Aufklärung existiert. Diese Phänomene haben sich auch die
Medien zu eigen gemacht und benutzen diese Eigenschaft oder auch Schwäche. Das
Fernsehprogramm ist fest in der Hand von ausgefuchsten Polizeibeamten oder Privatdetektiven. Sie bewegen sich oft als Einzelkämpfer über den Bildschirm und lösen ihre
Fälle durch Intuition und logischen Spürsinn. Doch Persönlichkeiten, wie „Der Alte“,
„Derrick“, „Kommissar Schimanski“ und viele andere gehören der Vergangenheit an.
Analysiert man die neuen Serien, unter dem Akronym CSI1 , so rücken immer mehr clevere Wissenschaftler in den Mittelpunkt. Dieser Trend steht für den Begriff forensische
Wissenschaft. Das forensische Labor steht zunehmend im Mittelpunkt der Ermittlungen.
Wissenschaftler arbeiten in Teams und akribisch an den anfallenden Spuren. Sie sind die
1
Crime Scene Investigation.
D. Labudde ()
Lehrstuhl für Bioinformatik und Forensik, Leiter Forensic Science Investigation Lab (FoSIL),
University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: labudde@hs-mittweida.de
F. Czerner
Lehrstuhl Recht in der Sozialen Arbeit, University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: czerner@hs-mittweida.de
M. Spranger
Wissenschaftlicher Mitarbeiter im Forensic Science Investigation Lab (FoSIL), University of
Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: spranger@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_1
1
2
D. Labudde et al.
Beherrscher von forensischen Methoden und Instrumenten, seien es Massenspektrometer,
Bedampfungsanlagen oder Mikroskope. An dieser Stelle sei darauf hingewiesen, dass oft
tief in die Trickkisten der Filmemacher gegriffen wird. Die Abfolge und zeitliche Aufteilung der Analysen sind stark überzeichnet und oft wird das gesamte Expertenwissen in
einer Person vereint. Nicht zuletzt tauchen Begriffe wie Cybercrime, Profiling oder Predictive Policing in Serien auf.
Jedoch bleiben diese Serien nicht ohne Folge. In der Literatur wird über den „CSIEffekt“ diskutiert, welcher verschiedene Auswirkungen auf das Erscheinungsbild von
Ermittlungen in der Gesellschaft hat. So wird beispielsweise jeder Zuschauer zu einem
Experten und erwirbt so ein scheinbares Recht, an der allgemeinen Diskussion und Beurteilung von realen Verbrechen teilzunehmen. Die Veranschaulichung der Unfehlbarkeit der forensischen Wissenschaft durch den „CSI-Effekt“ setzt die Ermittlungsbehörden
stark unter Druck. Die Faszination, die von diesen Serien ausgeht, führt zu einer hohen
Nachfrage an Büchern und Materialien, die sich ernsthaft mit den forensischen Wissenschaften auseinandersetzen. In Deutschland ist dieses Interesse auch bei Jugendlichen
angekommen, und der Ruf nach einer Ausbildung in der Forensik steigt. Universitäten und
Hochschulen nehmen diesen Trend auf und schaffen Module mit forensischen Inhalten.
Sicher tun sie dies auch aus ganz persönlichen Gründen. Nichts ist für einen Hochschullehrer angenehmer, als ein Hörsaal voller Interessierter. Daneben lässt sich Motivation für
die naturwissenschaftlichen Fächer wecken.
Doch wo kommt eigentlich diese Faszination her? Ein kurzer Blick in die Geschichte
der klassischen Forensik gibt Aufschluss darüber. Geringe Mengen an Blut, ein latenter
Fingerabdruck oder Audiofiles stehen heute am Anfang der Spurenanalyse und können so
helfen, Täter zu überführen bzw. Beschuldigte zu entlasten. Man sollte den Fakt berücksichtigen, dass noch im 18. Jahrhundert ein Geständnis durch Folter erzwungen wurde.
Ein Pionier, der Beweise in den Mittelpunkt rückte, war der Österreicher Hans Gross2 .
In seinem von 1899 stammenden Handbuch für den Untersuchungsrichter, forderte er
objektive Befunde und Spuren neben den Aussagen von Beschuldigten und Zeugen als
die wichtigsten Beweismittel im Strafverfahren. Dies konnte als Übergang der Subjektivität in eine begründbare Objektivität angesehen werden. „Mit jedem Fortschritt in der
Kriminalistik fällt der Wert der Zeugenaussagen, und es steigt die Bedeutung der realen
Beweise“[6]. Der französische Mediziner Dr. Edmond Locard3 formulierte und bewies
das bis heute gültige Austauschprinzip. Jeder und alles an einem Tatort nimmt etwas mit
und lässt etwas dort zurück [10]. Allgemein definiert man den Tatort als Ort, an dem sich
kriminalistisch relevante oder gerichtlich strafbare Handlungen ereignet haben. Der Tatort beschränkt sich nicht auf den Ort des Geschehens oder der Ereignisse, sondern auch
auf jene Bereiche, in welchen vor oder nach der Tat relevante Handlungen stattgefunden
haben.
2
3
* 26. Dezember 1847 in Graz; † 9. Dezember 1915 ebenda.
* 13. Dezember 1877 in Saint-Chamond (Loire); † 4. April 1966 in Lyon.
1
Einführung
3
Der Berliner Polizist Ernst August Ferdinand Gennat4 gilt als Urvater der Strukturierung von Ermittlungsmethoden. Bis in die 1920er Jahre gab es in der Polizeiarbeit kein
Morddezernat, keine Verhörprotokolle und keine Obduktionsberichte. Erst Ernst Gennat
konzipierte und strukturierte die Ermittlungsmethoden und konnte so eine überdurchschnittliche Aufklärungsquote erreichen. Diese und viele andere Persönlichkeiten reformierten die Ermittlungsarbeit und ebneten den Weg für die heutige Spurenanalyse und
deren Einbindung in die Gerichtsbarkeit. Die moderne forensische Wissenschaft lebt von
den Methoden aus den Geistes- und Naturwissenschaften. Mit modernsten Methoden,
Techniken und Technologien, wie biologischen, geologischen, geotopologischen, ballistischen und digitalen Aufzeichnungen versuchen heute forensische Experten, Verbrechen
aufzuklären, Tatorte und Spuren zu analysieren und den gesamten Tathergang zu rekonstruieren. Im Prozess der Rekonstruktion sollte man auf erkenntnistheoretische Ansätze
zurückgreifen und mit der Falsifizierung von Hypothesen arbeiten. Gerade die Forensik
profitiert von den Entwicklungen in den angrenzenden Wissenschaften. Der Siegeszug
der Computertechnik hat auch Spuren in der Forensik hinterlassen. Dabei ist nicht nur
das neue Tatwerkzeug Computer gemeint. Vielmehr ist auch in der Analyse digitaler und
digitalisierter Spuren moderne Rechentechnik nicht mehr wegzudenken. Beispiele sind
Audio-, Video-, Fotoanalyse und die Möglichkeit der 3D-Rekonstruktion von Tatwerkzeugen und ganzer Tatorte. Auf der anderen Seite können Vergleiche von Spuren durch
den Einsatz von Datenbanken sicher und erfolgreich gestaltet werden. Jedoch gehört auch
hier eine gesunde Skepsis dazu. Wie in anderen Wissenschaften auch, müssen Ergebnisse
nachvollziehbar und verständlich sein.
Ob aus der Presse oder durch eigenes Erleben ist heute jeder mit den Begriffen Hacking,
Cybercrime, Cyberspace, Cybermobbing oder digitaler Identitätsklau in Berührung gekommen. Auch der Begriff Hackerattacke ist in unsere Alltagssprache eingezogen. Der
Begriff Hacker hat eine Metamorphose in seiner Begrifflichkeit durchlebt. Waren am
Anfang damit besondere Tüftler gemeint, so wird er heute im Zusammenhang mit Cyberverbrechen benutzt. In den 1960er Jahren tauchte der Begriff Hacker zum ersten Mal
in den USA am MIT (Massachusetts Institute of Technology) auf. Hier wurde ein Team
von Studenten als Hacker betitelt, die Maschinen auseinanderbauten, um sie im Anschluss
umzubauen. Ziel war neben dem haptischen Gefühl, eine deutliche Leistungssteigerung.
Es wurden keine umtriebigen Absichten mit diesen Arbeiten verfolgt. Das Jahr 1969 kann
als Geburtsstunde des Hackens gesehen werden. Wie so oft in der technischen Entwicklung wurde auch dieses Ereignis durch einen Zufall gefördert. Der Amateurfunker John
Thomas Draper5 , später als „Captain Crunch“ bezeichnet, entdeckte, dass eine Spielzeugpfeife, welche in Frühstücksflocken der Marke Captain Crunch als Werbegeschenk
enthalten war, benutzt werden kann um einen Ton (2600 H z) zu erzeugen, der Ferngespräche freischaltete. Dieser Tipp machte die Runde und schon konnten Freunde und
Bekannte kostenlos telefonieren. Von diesem zufälligen Ereignis beflügelt gründete sich
4
5
* 1. Januar 1880 in Plötzensee; † 21. August 1939 in Berlin.
* 1944.
4
D. Labudde et al.
einer der ersten Computer Clubs. In den 1980er Jahren sind die Hacker dann aus dem
Schatten getreten und wurden auch bald von der breiten Öffentlichkeit wahrgenommen.
Der damals erst 17-jährige Kevin Poulsen6 alias Dark Dante drang in das ARPANET (Vorläufer des heutigen Internets)7 ein. Jedoch war dies nur dem Militär und den führenden
Universitäten vorbehalten. 1983 lief in den Kinos der Streifen „Wargames – Kriegsspiele“
von John Badham, hier wurde die Geschichte eines jungen Hackers erzählt. Durch diesen filmischen Katalysator tauchten 1988 die ersten Computerviren auf. Von nun an war
der Begriff „Hacker“ eindeutig negative belegt. In den 1990er Jahren wurden das gesamte Ausmaß und die dunklen Seiten des Hackens deutlich. Durch das Internet wurden die
ersten Straftaten in Bezug auf Cyberkriminalität begangen. Die Gemeinde spaltete sich
nun in eine schwarze und weiße Community. Diese Aufspaltung gilt bis zum heutigen
Tage. Auf der einen Seite stehen die „Black-Hats“, die aus kriminellen Gründen hacken,
und auf der anderen die „White-Hats“, die vor allem auf Lücken in Sicherheitssystemen
hinweisen wollen. Der Umfang und die Schwere der Taten der Black-Hats nahmen bald
gewaltige Dimensionen an. Die ersten Fälle von Online-Banking-Missbräuchen gingen
durch die Presse. Dies setzte sich in das 21. Jahrhundert fort. Der Begriff „Cracking“,
das Überwinden von Sicherheitshindernissen, machte die Runde und ergänzte die Cyberkriminalität. Das Kopieren von DVDs und passende Plattformen zum Austausch wurden
erschaffen. Aber auch Webseiten wie „WikiLeaks“8 wurden geschaffen, um sensible und
geheime Dokumente der allgemeinen Bevölkerung zugänglich zu machen. Die heutigen
Ausprägungen der Hacker und deren Schwerpunktziele sind vielschichtiger geworden.
Nachfolgend der Versuch einer Systematisierung der „Hats“. Der „Black-Hat“ hackt Datensysteme mit der Absicht, Schaden anzurichten oder nimmt diesen zumindest billigend
in Kauf. Das Hauptziel eines „White-Hat“ ist es, Sicherheitslücken in Systemen aufzudecken mit der Absicht, diese den Verantwortlichen zu melden. Dabei wird mitunter ein
entstehenden Schaden in Kauf genommen. Zwischen beiden agiert der „Grey-Hat“, der
sowohl zur Verbesserung der Systemsicherheit beiträgt als auch Schäden anrichtet. Die
Gruppe der Wettstreiter (aus sportlicher Absicht oder zum Zeitvertreib) bekommt den Namen „Script Kiddies“. Sie haben kaum technische Kompetenzen und bedienen sich der
Tools anderer. Nach dem Motto: Wer will mal ein Hacker sein. Neu ist die Gruppe der
„Hacktivisten“. Diese setzen ihr technisches Wissen für einen politischen Zweck ein und
verändern zum Beispiel eine Homepage, um politische Botschaften zu verbreiten oder um
auf Missstände aufmerksam zu machen.
Zum Abschluss noch ein Rat für alle diejenigen, die jetzt überlegen, in welcher Gruppe
sie sich selbst wiederfinden: Hacking bringt nicht nur viele neue Freunde, sondern auch
genauso viele neue Feinde.
6
* 1965 in Pasadena, Kalifornien.
Advanced Research Projects Agency Network.
8
https://wikileaks.org/
7
1
Einführung
5
1.2 Forensik im System der Wissenschaften
Der Begriff Forensik stammt vom lateinischen Wort forēnsis ab und bedeutet so viel
wie „im oder vor dem Forum (Marktplatz)“. Historisch gesehen war der Marktplatz oder
Mittelpunkt einer urbanen Gemeinschaft oft der Schauplatz der Gerichtsbarkeit. Alle Wissenschaften oder Teildisziplinen einer Wissenschaft können das Adjektiv „forensisch“
tragen. Dies signalisiert den Bezug zum jeweiligen Rechtssystem.
Die Forensik umfasst alle Arbeitsgebiete, die strafrechtlich und zivilrechtlich relevante Handlungen identifizieren, ausschließen, analysieren und rekonstruieren.
In Deutschland wird dies vor allem durch die Zusammenarbeit von verschiedenen
Fachgruppen und Spezialisten erreicht. In den USA hingegen schließt der Begriff Forensic
Science (Forensics) eine spezielle Ausbildung ein, welche kriminalistisches und rechtsmedizinisches Wissen vereint. Beide Betrachtungsweisen deuten auf den Charakter einer
Querschnittswissenschaft innerhalb der Naturwissenschaften hin, welche ihren Rahmen
von den Rechtswissenschaften vorgegeben bekommt und sich in der Umsetzung auch Methodiken der Ingenieurswissenschaften bedient. Im deutschsprachigen Raum spricht man
auch vom System der Kriminalwissenschaften. In diesem ist die Forensik, neben weiteren
Wissenschaftszweigen wie Kriminalistik oder Kriminologie, als Teil der nichtjuristischen
Kriminalwissenschaften den Naturwissenschaften zugeordnet (Abb. 1.1).
Als empirische, nicht-juristische Kriminalwissenschaft, umfasst die Lehre der
Kriminalistik sämtliche präventiven und repressiven Maßnahmen sowie damit verknüpfte Techniken, die zur Bekämpfung von Straftaten und des Verbrechertums
notwendig sind [5].
Abzugrenzen ist die kriminalistische Lehre von dem Fach der Kriminologie. Letzteres
beschäftigt sich mit den Erscheinungsformen und Ursachen von Kriminalität. Ziel der
Kriminalistik ist die Ermittlung und Zusammenführung von straftatrelevanten Beweisen.
Darüber hinaus sollen Gefahren abgewehrt bzw. Straftaten abgewendet werden. Es können
verschiedene Teildisziplinen unterschieden werden [5]:
1. Maßnahmen, welche die Vorgehensplanung bei der Verbrechensbekämpfung implizieren, werden innerhalb von Kriminalstrategien erarbeitet. Dazu werden ebenfalls
Vorbeugungsmaßnahmen gezählt.
2. Innerhalb der Kriminaltaktik, als weitere Teildisziplin, werden zweckgebundene Vorgehensplanungen im Rahmen der Verbrechensbekämpfung erarbeitet (z. B. Vernehmungstaktik).
6
D. Labudde et al.
Abb. 1.1 System der Kriminalwissenschaften nach Berthel [1]
3. Die Kriminaltechnik umfasst sämtliche Erkenntnisse und Maßnahmen zur Anwendung wissenschaftlicher und empirischer Resultate in Bezug auf Spurensicherung und
-analyse.
4. Die Regelung des Dienstbetriebes sowie die innerhalb spezifischer Richtlinien und
Anordnungen geregelte Handhabung kriminalpolizeilicher Mittel fallen in den Bereich
der Kriminaldienstkunde.
5. Der Bereich der Kriminalprävention beschäftigt sich mit der Vorbeugung und Früherkennung von Risiken für kriminelles Verhalten.
Eng verknüpft mit der Kriminalistik, stellt die Kriminologie als ebenfalls nichtjuristische, empirische Kriminalwissenschaft das geordnete oder systematische Wissen
über Verbrechen, Verbrecher, die strafrechtliche Sozialkontrolle sowie das Verbrechensopfer dar. Im Allgemeinen ist darin eine Summierung vielfältiger wissenschaftlicher Beiträge bezüglich Kriminalität und ein in Verbindung damit stehendes
Verhalten zu sehen. Im speziellen bestehen Bezüge zum Opfer und zur Kriminalitätsprävention [8].
1
Einführung
7
Die Kriminologie ist eng verzahnt mit diversen Bezugswissenschaften, wie u. a. Psychiatrie, Psychologie, Soziologie, Rechtswissenschaft und Ökonomie.
1.3 Tatort in der modernen Forensik
1.3.1 Der moderne Tatortbegriff
Schauen wir uns das Wort „Tatort“ an, so ist dieser in unserer Gesellschaft mit einer negativen Assoziation verknüpft, obwohl beide Begriffe „Tat“ und „Ort“ mit einer positiven
Auffassung verbunden sind.
Seit Bestehen von Gesellschaften ist das Handeln eines jeden Einzelnen an ein definiertes Regelwerk der Gemeinschaft, die Gesetze, Verordnungen und Konventionen,
gekoppelt. Dem Staat, als Inhaber des Gewaltmonopols, obliegt es, diese Regelwerke
durchzusetzen, Verstöße zu verfolgen und ggf. zu ahnden. Dafür bedarf es jedoch eines
Beweises, im Sinne einer eindeutigen Zuordnung eines Tatverdächtigen oder Opfers zu
einer konkreten Tat. Dem Auffinden derartiger Beweise bzw. dem Nachweis einer Tat
dient, neben der Vernehmung von Beteiligten und Zeugen, vor allem die Untersuchung
von Spuren (Daten).
Unter einer Straftat wird gemeinhin ein schwerwiegender Verstoß gegen die Rechtsordnung einer Gesellschaft oder die Grundregeln menschlichen Zusammenlebens verstanden.
Allgemein gesprochen handelt es sich um eine von der Gemeinschaft als Unrecht angesehene und von ihrem Gesetzgeber als kriminell qualifizierte und mit Strafe bedrohte
Verletzung eines Rechtsgutes durch den von einem oder mehreren Tätern schuldhaft gesetzten, verbrecherischen Akt. Die Rechtswissenschaft versteht unter einem Vergehen/
Verbrechen in erster Linie eine strafbare Handlung (Straftat) an sich und als solche. Das
Strafgesetzbuch (§ 12 StGB) unterscheidet in Abhängigkeit der Schwere der Tat und der
damit verbundenen Strafandrohung Straftaten in Vergehen (Strafandrohung im Mindestmaß unter einem Jahr Freiheitsstrafe oder Geldstrafe) und Verbrechen (Strafandrohung im
Mindestmaß von einem Jahr Freiheitsstrafe oder darüber). Gesellschaftswissenschaftlich
befasst sich die Kriminologie mit dem Phänomen des Verbrechens und seinen Erscheinungsformen und Ursachen. Mit den Mitteln und Methoden der Verbrechensbekämpfung
und -aufklärung beschäftigt sich die Kriminalistik. In diesem Kontext wird der Ort der Tat,
also der Ort an dem eine Straftat verübt wurde, als Tatort bezeichnet. Was auf den ersten
Blick relativ trivial klingt, ist jedoch bei genauerer Betrachtung oft schwer zu beschreiben.
Allgemein definiert man den Tatort als Ort, an dem sich kriminalistisch relevante oder juristisch strafbare Handlungen ereignet haben. Der Tatort beschränkt sich nicht nur auf den
Ort des Ereignisses, sondern auch auf jene Bereiche, in welchen vor oder nach der Tat
relevante Handlungen stattgefunden haben. Man unterscheidet den unmittelbaren Tatort,
an dem die Tat ausgeführt wurde und an dem auch die meisten Spuren (Daten) erwartet
werden können sowie den Tatort im weiteren Sinne. Dieser bezieht sich auch auf die nähe-
8
D. Labudde et al.
re Umgebung. Es lassen sich in der klassischen Forensik folgende Abschnitte dem Tatort
zuordnen:
Vorbereitungsort,
Annährungsort,
Ereignisort.
Der Begriff Tatort im weiteren Sinn schließt auch den Fundort des Opfers, den Fluchtweg des Täters, das Fluchtfahrzeug, Aufbewahrungsorte von Beute oder Tatwerkzeugen
sowie den Wohnort des Tatverdächtigen mit ein. An einem Tatort ist die Wahrscheinlichkeit sehr hoch, fallrelevante Spuren zu finden und diese als grundlegende Beweise
aufzubereiten. Spuren im kriminaltechnischen Sinne sind sichtbare oder latente materielle
Veränderungen, die im Zusammenhang mit einem kriminalistisch relevanten Ereignis entstanden sind und zu dessen Aufklärung beitragen können. In der Literatur spricht man oft
vom Spurenlesen. Eine Annäherung an den Begriff „Lesen“ lässt einen Vorgang oder Prozess erkennen. Dieser Vorgang beschreibt den Transfer von der Ebene der Zeichen (Spur)
auf die Ebene der Bedeutung (Beweis). Das abschließende Wissen unterliegt der Kausalität (Ursache-Wirkung) [7]. Diese Ebenen spiegeln sich in der Wissenspyramide wider.
Objektive Befunde und Spuren sind neben den Aussagen von Beschuldigten und Zeugen
die wichtigsten Beweismittel im Strafverfahren.
Im Zusammenhang mit dem Tatort im klassischen Sinne sind drei Anmerkungen zu
Spuren von Bedeutung:
am Tatort sind Spuren oft noch nicht differenzierbar,
der Tatbezug kann noch nicht in allen Fällen abgeschätzt werden,
nicht unmittelbar gesicherte Spuren sind oft unwiderruflich verloren.
Eine koordinierte und gründliche Tatort- und Spurensicherung ist entscheidend für die
erfolgreiche und fachgerechte Aufklärung einer Straftat. Es ist dafür zu sorgen, dass der
Tatort so wenig wie möglich an Informationen verliert bzw. neue hinzukommen. Informationen ergeben sich aus der Analyse der Spuren (Daten), die in der Phase der Rekonstruktion des Tatortes und des Tatherganges abgeleitet werden. Veränderungen des Tatortes vor
dem Eintreffen der Forensikexperten (bewusst oder unbewusst) verursachen Rekonstruktionen, welche im Detail von der Realität abweichen.
Die virtuelle Welt, der Cyberspace, in dem wir uns täglich mehrere Stunden bewegen,
führt zwangsläufig zu einer notwendigen Erweiterung bzw. Neudefinition des Begriffs
Tatort. Um dies verständlich zu machen, werden nun physische und virtuelle (digitale)
Spuren verglichen.
Digitale Spuren (digital evidence) sind Spuren, die auf Daten basieren, welche in
Computersystemen gespeichert oder übertragen worden sind [2].
1
Einführung
9
Abb. 1.2 Die Eigenschaft
der Manipulierbarkeit ist
bei digitalen Spuren (Daten)
im Vergleich zu physischen
Spuren aus der klassischen
Forensik wesentlich größer.
Die Eigenschaft Freiheitsgrade
verhält sich jedoch umgekehrt
Zunächst sind dies analog zur klassischen Forensik physische Spuren, wie
Magnetisierung auf der Oberfläche einer Festplatte,
elektromagnetische Wellen auf einem Datenkabel,
Ladezustand von Speicherzellen im Hauptspeicher.
An dieser Stelle kann davon ausgegangen werden, dass die Prinzipien der klassischen
Forensik anwendbar sind. Die Form der diskreten Repräsentation („Null“ und „Eins“)
wird durch verschiedene Anwendungen in eine für den Menschen lesbare Form überführt.
Unterschiede zwischen digitalen und analogen (physischen) Spuren existieren gerade in
Bezug auf die Eigenschaften Manipulierbarkeit und Freiheitsgrade. Abb. 1.2 demonstriert das Verhältnis dieser Eigenschaften in Bezug auf physische und digitale Spuren. Die
Manipulierbarkeit und der Anzahl der Freiheitsgrade sind sich gegenseitig bedingende Eigenschaften. Digitale Spuren unterliegen einer hohen Manipulierbarkeit, was den Raum
der Analyse, also das Betrachten der Spuren, einschränkt (Anzahl der Freiheitsgrade in
der Analyse).
Digitale Spuren besitzen die folgenden elementaren Eigenschaften:
Flüchtigkeit
– persistente, gespeicherte Daten,
– semipersistente Daten im Arbeitsspeicher,
– flüchtige Spuren, nur temporär vorhanden,
technische Vermeidbarkeit (Systemdaten),
Manipulierbarkeit,
Kopierbarkeit.
Detaillierte Ausführungen zum Vergleich von digitalen und realen Spuren finden Sie im
Buch Forensische Informatik [4]. Digitale Spuren haben im Gegensatz zu physischen Spuren einen komplexeren geografischen Aufbau und Entstehungsmechanismus. Dieser setzt
sich aus drei ineinandergreifenden Ebenen zusammen: Internet, LAN bzw. WLAN und
dem Kerngerät (PC, Smartphone, Tablet). Ein virtueller Tatort oder digitaler Tatort kann
somit nur schwer bzw. gar nicht definiert werden. Möglichkeiten einer Definition ergeben sich durch Einbeziehung der geografischen Ebenen. Wenn „Von einem unbekannten
10
D. Labudde et al.
Tatort aus begangenen Cybercrimedelikt“ [3] gesprochen wird, muss sich der unbekannte
Tatort auf auf IP-Adressen bzw. MAC-Adressen von verwendeten Geräten einschließlich
Servern beziehen. Somit erfolgt eine Zuordnung zu Geräten in einem gesonderten Schritt.
Digitale Ermittlungen unterscheiden sich von herkömmlichen Ermittlungen in der
Wahl der verwendeten Werkzeuge. Die allgemeine Vorgehensweise, welche aus drei Phasen besteht und durchgängig von Experten akzeptiert ist, kann direkt auf Ermittlungen
in der virtuellen Welt (Cyberspace) übertragen werden. Diese Phasen sind: Sicherung,
Analyse und Präsentation (SAP).
Securephase:
Analysephase:
beinhaltet die sorgfältige Erfassung aller Daten,
sorgfältige Überprüfung und objektive Bewertung der gesicherten
Spuren und Beweise,
Präsentationsphase: nachvollziehbare Darlegung des Ermittlungsprozesses.
In der Literatur existiert eine Reihe von weiteren Vorgehensmodellen, die sinnvolle Präzisierungen vornehmen. Abb. 1.3 zeigt verschiedene Vorgehensmodelle in ihren unterschiedlichen Präzisierungen.
An dieser Stelle sei nocheinmal auf eine Abgrenzung der Begriffe Modell, Prozess und
Methode im Zusammenhang mit Vorgehensweisen hingewiesen.
Modell:
Ablauf einer Untersuchung (vereinfachte Weise),
einzelne Arbeitsschritte,
gibt keinen Aufschluss über die Schritte innerhalb eines Abschnitts.
Prozess:
Ablauf in detaillierter Form,
Abschnitte aus dem Modell in kleine Phasen,
Reihenfolge des Ablaufs einer Untersuchung.
Methode:
im Arbeitsschritt eingesetzten Werkzeuge und Verfahren.
Die spezifische, auf eine konkrete Ermittlung ausgerichtete Umsetzung eines Vorgehensmodells muss im Einklang mit den aufgestellten forensischen Hypothesen stehen. In Ermittlungsverfahren, sowohl in der virtuellen als auch in der physischen Welt, sind an
den Prozess der Hypothesenentwicklung analoge Bedingungen geknüpft. Aus der Menge
der Spuren (Daten, Fakten, Zahlen) werden durch wissenschaftliche Methoden Informationen generiert. Als wissenschaftliche Methoden gelten Verfahren, Algorithmen und
1
Einführung
11
Abb. 1.3 Vorgehensmodelle SAP, Kent et al. [9], BSI (Bundesamt für Sicherheit in der Informationstechnik) und Casey [2] im Vergleich
Systeme, die evaluiert wurden und einem wohldefinierten Standard entsprechen. Informationen werden zu fallspezifischen Thesen und Erläuterungen zusammengefasst und führen
zur eigentlichen Hypothese, welche im Laufe eines iterativen Prozesses überprüft wird. In
Abb. 1.4 wird ein Hypothesenzyklus für die Rekonstruktion eines Tatherganges aufgezeigt. Dieser Zyklus ist auf beide Ermittlungsbereiche anwendbar.
Informationen und daraus entstandenes Wissen liefern die Grundlage für den Verifizierungs- bzw. Falsifizierungsprozess von forensischen Hypothesen. Auf die Gewinnung
12
D. Labudde et al.
Abb. 1.4 Darstellung des
Hypotheses Cycle für die klassische und digitale Forensik
von Information aus Daten, im Sinne von Spuren, wird zu einem späteren Zeitpunkt noch
einmal eingegangen.
1.3.2 Moderne Formen der Spurensicherung
Mit dem Voranschreiten der Entwicklung neuer Technologien müssen Werkzeuge und
Vorgehensweisen ständig evaluiert und im Einzelfall angepasst werden. Das Beispiel
„Fahrzeughacks“ zeigt dies sehr eindrucksvoll. Ein regelmäßiges Screening aufkommender Technologien anhand der veröffentlichten Hype-Cycles kann sehr hilfreich sein, um
einerseits neue Werkzeuge abzuleiten und andererseits das Bedrohungspotential neuer
Technologien abzuschätzen. Ein solches Beispiel stellen die UAV (unmanned aerial vehicle) dar. Solche Flugobjekte, auch Drohnen genannt, stellen auf der einen Seite eine
Bedrohung dar, auf der anderen Seite können sie sich zu Werkzeugen in der Ermittlung
und Hypothesenüberprüfung entwickeln. Ein Einsatz bei der Rekonstruktion von Tatorten
und Katastrophengebieten bietet sich in diesem Kontext an.
Die Spurensicherung in der klassischen bzw. virtuellen (digitalen) Welt unterscheidet
sich in den verwendeten Methoden und Werkzeugen. Dies liegt nicht zuletzt am Charakter der spezifischen Spuren. Auf klassische Spurensicherungsmethoden und biometrische
Verfahren wird im Kap. 2 detaillierter und gesondert eingegangen. Die Entstehung der
sogenannten digitalen Spuren ist so vielfältig wie deren Eigenschaften. Die Vielfalt und
Menge der digitalen Daten und Spuren stellt eine große Herausforderung in der täglichen
Ermittlungsarbeit dar. Dieses Phänomen wird mit dem Begriff „Big Data“ in Zusammenhang gebracht. Die Menge an digitalen Daten stellt einen Datenpool für Methoden aus
1
Einführung
13
Abb. 1.5 Vorkommen digitaler Daten, die zur Auswertung in Bezug auf Straftaten verwendet werden können. Durch die Zusammenführung der Daten ist es möglich, einen sogenannten digitalen
Fußabdruck eines Nutzers zu erzeugen
dem Gebiet der Big Data bereit und ermöglicht die Entwicklung und Anwendung von Vorhersagealgorithmen (Predictive Policing). Bei der Analyse und Aufklärung von Straftaten,
die im Zusammenhang mit oder unter Nutzung des Internets bzw. mithilfe modernster
Computertechnik begangen wurden, können heute verschiedenste digitale Daten herangezogen werden. Abb. 1.5 gibt einen Überblick der möglichen digitalen Daten und Spuren.
In erster Linie gehen in die Analyse beispielsweise Texte, Kurznachrichten, Bilder,
Videos, Browserinhalte (Surfverhalten) und persönliche Informationen aus sozialen Netzwerken ein. Durch die bereitgestellte Technik können aus diesen Daten auch die korrespondierenden Metadaten für die Analyse herangezogen werden. Die Information und
das abgeleitete Wissen aus digitalen Daten und Spuren werden in komplexen Verfahren
mit den Informationen aus physischen Spuren korreliert.
Die Sicherung digitaler Spuren ist, aufgrund der Eigenschaften dieser, von besonderer
Wichtigkeit. Durch die hohe Manipulierbarkeit müssen Analysen auf Sicherheitskopien, sogenannten Images, durchgeführt werden. Diese sind durch Hash-Verfahren so zu
sichern, dass eine lückenlose Dokumentation möglich wird. Dem digitalen Forensiker
stehen eine Vielzahl kommerzieller und frei zugänglicher Werkzeuge (sogenannter OpenSource-Software) zur Verfügung. Die Virtualisierung (im Sinne der Wiederherstellung)
14
D. Labudde et al.
stellt darüber hinaus auch Möglichkeiten bereit, bereits gelöschte Daten in die Analyse
einzubeziehen.
1.3.3 Zusammenwachsen von virtueller und realer Welt
Die bisherigen Analyse und Annahmen weisen darauf hin, dass Ermittlungen in der virtuellen Welt und der physischen Welt viele Parallelen aufzeigen, es aber im Hinblick auf die
Definitionen von Spuren und Tatort Unterschiede gibt. Digitale Spuren sind in erster Linie
anonym, sind also ohne einen direkten Hinweis keiner juristischen Person zuordenbar. An
dieser Stelle bedarf es, auch im juristischen Sinne, eines Zusammenwachsens der digitalen
und physischen Spuren sowie deren Analyse. Auf dem Gebiet der Tatort- und Tathergangsrekonstruktion ist ein Verschmelzen der virtuellen und der realen Welt zu verzeichnen. Die
Zeit der Erstellung von Handzeichnungen oder Aufrissen sollte eigentlich der Vergangenheit angehören. Neben der klassischen digitalen forensischen Fotografie halten weitere
Techniken Einzug in die Dokumentation und Rekonstruktion. Die Tatrekonstruktion und
die Plausibilitätsprüfungen von Zeugenaussagen lassen sich durch qualitativ hochwertige
computergestützte Rekonstruktionen des Tatortes und des Tatherganges nachvollziehen
bzw. überprüfen. Beide Arten der Rekonstruktion sollten zwar getrennt definiert werden,
jedoch in einem hypothesengetriebenen Ermittlungsansatz parallel verwendet werden.
Bei einer Tatrekonstruktion wird überprüft und dokumentiert, ob das vor- oder angegebene Verhalten von Personen, die im Zusammenhang mit einer Straftat stehen, mit realen
Gegebenheiten und anderen Beweismitteln in Einklang stehen oder gebracht werden können. Eine weitere wichtige Komponente in der Rekonstruktion stellt die Zeugenbefragung
dar. Eine Zeugenaussage, sollte in einer Rekonstruktion als sogenannte Nullhypothese gesehen werden, diese gilt es, zu überprüfen und zu bewerten.
Das Nachvollziehen des Geschehens, basierend auf einer Tatrekonstruktion, kann mit
der Vernehmung eines Tatverdächtigen bzw. weiterer Personen (Zeugen) einhergehen.
Einen großen Nutzen kann man für die Hauptverhandlung ableiten. Das Gericht kann so
der Staatsanwaltschaft, dem Opfer, dem Beschuldigten und deren Vertretern Gelegenheit
zur virtuellen Teilnahme am Tathergang und Betrachtung des Tatortes geben. Die Standardisierung für die Darstellung und Durchführung einer virtuellen Tatrekonstruktion wird in
den nächsten Jahren ein wichtiges Entwicklungsfeld darstellen. Die Rekonstruktion der
Tat ist im Gegensatz zum Augenschein, eine vom Gericht durchzuführendes Nachstellen
des wahrscheinlichen Verlaufs der Tat am Tatort oder an einem anderen mit der Straftat
im Zusammenhang stehende Orte im Zuge der Vernehmung involvierter Personen und
Zeugen sowie die Ton- oder Bildaufnahme dieser Vorgänge. Weil sie praktisch im Beisein
aller Prozessbeteiligten stattfindet, ist sie an besondere Vorschriften gebunden. Technisch
gesehen spricht man dann von einer Simulation der Geschehnisse unter Verwendung von
Informationen (basierend auf Spuren, Daten). Um den Bezug zum forensischen Umfeld
einzubeziehen, schlagen wir den Begriff „Tatablaufsimulation“ vor, welche zeitliche und
räumliche Sequenzen einer Tat beinhaltet.
1
Einführung
15
Abb. 1.6 Rekonstruierter Tatort
Die Tatrekonstruktion und Tatablaufsimulation dient der Analyse von forensisch relevanten Sachverhalten, wie vermeintliche Unfälle, Körperverletzungen und Mord sowie
der Überprüfung von Zeugenaussagen. Durch neue moderne Methoden und Software können zusätzliche Informationen und Wissen gewonnen und komplexe Wechselwirkungen
dargestellt werden. Dazu können zum einen professionelle und kostenintensive Techniken, zum anderen aber auch preisgünstigere Alternativen eingesetzt werden. Zu diesen
zählen unter anderem die Open-Source-Software Blender und der Xbox-Kinect-Sensor.
Im Folgenden wird der Prozess einer Tatortrekonstruktion mittels Blender sowie die Möglichkeiten einer Tatablaufsimulation vorgestellt.
Die Open-Source-Software Blender ermöglicht die Rekonstruktion von Tatorten durch
die Modellierung und das Rendern von 3D-Szenen und Objekten. Dabei basiert die Raumgeometrie auf Messdaten der Tatortdokumentation. Der Nutzer hat die Möglichkeit, vollständige Räume mit darin enthaltenen Personen, möglichen Tatwerkzeugen und -waffen,
Möbeln, Lampen und weiteren Gegenständen zu erstellen. Zudem können Licht- und
Schatteneffekte, Objekttexturen und Distanzmessungen in die jeweiligen Szenarien integriert werden. Abb. 1.6 zeigt beispielhaft einen solchen rekonstruierten Tatort, in dem Personen und Gegenstände platziert und Wechselwirkungsbeziehungen dargestellt wurden.
Blender ermöglicht, Modelle mit physikalischen Eigenschaften zu versehen und somit
einen möglichen Tatablauf zu simulieren. Dadurch ist es beispielsweise möglich, Stichoder Schussrichtungen zu bestimmen und die Position des Schützen zu ermitteln.
16
D. Labudde et al.
Neben der Verwendung von professionellen Laserscannern zur 3D-Aufnahme von Tatorten besteht die Möglichkeit, preiswertere Technik, wie den Xbox-Kinect-Sensor, zu
nutzen. Dieser eignet sich besonders wegen des Anschaffungspreis, der Handhabung und
des Detailgrades der 3D-Modelle als günstige Alternative. Aufgenommene Szenarien können direkt mit der frei verfügbaren Download-Software von Microsoft ausgewertet und
in Blender importiert werden. Abb. 1.6 zeigt eine Rekonstruktion einer auf dem Boden
liegenden Person, die mithilfe des Xbox-Kinect-Sensors aufgenommen wurde, und das
berechnete 3D-Modell in Blender. Dieses kann in weiteren Bearbeitungsschritten mit Texturen versehen und gegebenenfalls in eine andere Szene importiert werden.
Da in einigen Fällen an Tatorten stark fäulnisveränderte oder vollständig skelettierte
Leichname aufgefunden werden, kann die Tatortrekonstruktion in engem Zusammenhang
mit der forensischen Gesichtsweichteilrekonstruktion stehen. Für gewöhnlich kommen
zur Identifizierung einer unbekannten Person etablierte und herkömmliche Identifizierungsverfahren, wie Daktyloskopie, Odontostomatologie und der genetischer Fingerabdruck zum Einsatz, welche das Vorhandensein von Vergleichsmaterial voraussetzen. Ist
dieses jedoch nicht vorhanden bzw. ausreichend besteht nur noch die Möglichkeit einer
forensischen Gesichtsweichteilrekonstruktion. Die Methode basiert auf dem hohen Wiedererkennungswert des Gesichtes auf Grundlage der knöchernen Strukturen des Schädels
und deren Merkmale. Im Weiteren wird eine Open-Source-Software vorgestellt, mit deren
Hilfe Daten aus Fotogrammetrieverfahren zur Rekonstruktion genutzt werden können.
Die Tatrekonstruktion und Tatablaufsimulation mit modernen Methoden kann als TopDown-Prozess verstanden werden. Im ersten Schritt kann die globale Umgebung rekonstruiert werden, in den nächsten Schritten können Detailrekonstruktionen in die bestehende Szene gesetzt werden. Somit können Einzelheiten aus verschiedenen Aufnahmen am
Ende in einem zoombaren Raum zusammengefügt und Informationen auf verschiedenen
Ebenen dem Betrachter und Analysten zur Verfügungen gestellt werden.
Die Grundlage der modernen Rekonstruktion stellen Verfahren der Fotogrammetrie
dar. Unter Fotogrammetrie versteht man eine Gruppe von Messmethoden und Auswerteverfahren, um aus Fotografien eines beliebigen Objektes seine räumliche Lage bzw. dreidimensionale Form zu bestimmen. Photogrammetrische Verfahren haben in den letzten
Jahren nicht zuletzt aufgrund neuartiger Bildaufnahmegeräte und der gestiegenen Möglichkeiten der digitalen Bildverarbeitung an Bedeutung gewonnen. Auch in der Forensik
ist das Kernanwendungsgebiet der Fotogrammetrie die Wiederherstellung der räumlichen
Lage von Objekten zueinander, in der sie sich zum Zeitpunkt der Aufnahme befunden
haben (Tatort- und Verkehrsunfalldokumentation sowie forensisch und archäologische
Anwendungen).
1.4 Aufgaben und Ziele der forensischen Wissenschaft
Forensische Wissenschaft beinhaltet alle Wissenschaftsdisziplinen, die unmittelbar bzw.
mittelbar mit der Aufklärung von Straftaten zu tun haben. In diesem Buch soll sich auf den
1
Einführung
17
nichtjuristischen Teil der Kriminalwissenschaften bezogen werden. Der Bezug zu den juristischen Wissenschaften ist nicht zuletzt durch das Verhältnis von Staatsanwaltschaft und
Polizei im weitesten Sinne verankert. Die Staatsanwaltschaft hat ab der Übermittlung des
ersten Berichts bis zur Anklageerhebung den Ermittlungsakt zu führen. Die Ziele und Aufgaben der juristischen und nichtjuristischen Kriminalwissenschaften unterscheiden sich
deutlich, jedoch bedingen sie sich. Die forensische Wissenschaft wäre nicht existent ohne die juristischen Kriminalwissenschaften. Ziel der juristischen Kriminalwissenschaft ist
die Beantwortung von rechtlichen Fragen auf der Grundlage des geltenden Rechtssystems.
Zur Beantwortung der rechtlichen Fragen werden oft Ergebnisse (im Sinne von Gutachten)
aus den nichtjuristischen Kriminalwissenschaften herangezogen. Dabei muss ein Transfer
erfolgen, d. h. eine juristische Frage, i. S. eines Untersuchungsauftrages, muss in den Kontext einer wissenschaftlichen Frage bzw. Hypothese überführt werden. Während dieses
Transfers geht der Bezug zu Schuld bzw. Unschuld verloren.
Dabei muss der Begriff „Wissenschaft“ oder „wissenschaftlich“ von elementarer Bedeutung sein. Im allgemeinen Sprachgebrauch geht dieser Begriff mit Exaktheit, Überzeugungskraft und Beweisbarkeit einher. Als Wissenschaft bezeichnet man die Tätigkeit,
bei der ein Sachverhalt mit objektiven und nachvollziehbaren Methoden systematisch beschrieben und untersucht wird. Dasselbe gilt für einen bestimmten Bereich, in dem mit
wissenschaftlichen Methoden gearbeitet wird. Beispielsweise ist die Biologie die „Wissenschaft von der belebten Materie“. Zur Kennzeichnung gehören aber auch die Gesamtheit der Einrichtungen und Personen, die wissenschaftlich arbeiten. Schauen wir uns
die Definition von Wissenschaft nach Aristoteles an: „Zum Unterschied von ungeordneten (Erfahrungs-)Wissen (Empirie) achtet Wissenschaft nicht bloß auf das Das, sondern
auch auf das Warum, die Gründe, Ursachen der Dinge. “Der wissenschaftlichen Methode
kommt dabei eine gesonderte Schlüsselstellung zu. Nach Schischkoff (1991) besteht die
wissenschaftliche Methode [. . . ]„ in dem immer weiteren systematischen Vordringen in
die Breite und Tiefe der Wirklichkeit, zu den Elementen des Seins und Geschehens und
zur Erkenntnis des Zusammenhanges der Wirklichkeit überhaupt, die wir Welt nennen“.
Mit wissenschaftlichen Methoden sind nicht die Techniken oder Technologien gemeint,
sondern die wissenschaftlichen Vorgehensweisen.
Eine mögliche Übertragung auf den Ermittlungsprozess kann wie folgt beschrieben
werden. Ziel im wissenschaftlichen Sinne ist die komplette und optimale Rekonstruktion
der Tat, um die Wahrheit herauszufinden. Der Begriff Wahrheit sollte hier mit dem Begriff Wahrscheinlichkeit assoziiert werden. In Abhängigkeit von der Menge, Qualität und
Objektivität der Daten (Spuren – Beweise) sind oft nur Wahrscheinlichkeitsaussagen über
einen Tathergang möglich.
Ziel jeder forensischen Wissenschaft ist die Suche nach den Verbindungen zwischen
den Objekten (Spur – Spurenverursacher, Spur – Spur). Hier sollte man eine eindeutige wissenschaftliche Vorgehensweise bevorzugen. Bedienen wir uns an dieser Stelle der
Theorie des Wissenserwerbs nach Popper. In seinem Sinne gilt folgende Modellauffassung (Repräsentation des Wissens), welche durch drei Sachverhalte gekennzeichnet ist:
18
D. Labudde et al.
Abb. 1.7 Prozess des Wissenserwerbs. (Inhaltlich adaptiert
von [11])
Repräsentation von Begriffen und Konzepten (Knoten),
Beziehungen zwischen den Knoten (Kanten),
Begriffskonstellationen (Schemata).
Dies führt uns direkt zum Begriff Netzwerk. Ein solches Netzwerk ist auf seine Objektivität und Vollständigkeit hin zu analysieren. Das Transferprinzip von Locard ist ein solches
vereinfachtes Netzwerk. Das Vorgehen für die Erstellung solcher Wissensnetzwerke und
deren Analyse sollte hypothesengetrieben erfolgen. Der österreichisch-britische Philosoph
Karl Popper9 empfiehlt folgenden Prozess, der auf die unterschiedlichen Mengen und Arten der zur Analyse zur Verfügung stehenden Daten eingeht. Wir unterscheiden einen
sogenannten aufsteigenden Prozess und einen absteigenden Prozess [11] (Abb. 1.7).
Der Prozess des Wissenserwerbes wird genutzt, um das bereits erwähnte Netzwerk, mit
den nachfolgenden Zielen, zu füllen und zu überprüfen:
Besetzung von Schemavariablen mit spezifischer Information,
Grundlage für Modifikation bestehender Schemata,
Grundlage für die Schaffung neuer Schemata.
Durch diese Vorgehensweise kann eine Grundobjektivität erreicht werden und „Erfahrungsfallen“ können vermieden werden. Somit kann man das forensische Vorgehen durch
die nachfolgenden grundlegenden Fragestellungen beschreiben:
Wie ist die grundsätzliche Herangehensweise an forensische Fragestellungen i. S. einer
Hypothese?
Welche Grundregeln müssen beachtet werden?
Wie funktioniert wissenschaftliche Arbeit?
9
* 28. Juli 1902 in Wien; † 17. September 1994 in London.
1
Einführung
19
Abb. 1.8 Wissenspyramide. (Inhaltlich adaptiert von [12])
Das Zitat von Sir Arthur Conan Doyle10 kann auch als organisationstheoretischer Ansatz gedeutet werden:
„Es ist in der Kriminalistik von größter Wichtigkeit, dass man aus einer großen Zahl von
Tatsachen diejenigen erkennt, welche zufällig sind, und diejenigen, die relevant sind.“
Sehen wir die Überführung von Spuren in einen Beweis, der Teil einer logischen Beweiskette ist, dann sollte der Beweis einen vorläufigen wahren Zustand erhalten. Das
verwendete Wissensmanagement ist eine Form der Anreicherung von Wissen auf der
Grundlage von Daten, in unserem Kontext Spuren. Diese Daten wurden beobachtet. Der
zugrunde liegende Prozess kann als Analyse angesehen werden. Wissen ist mit einem
Erfahrungskontext angereicherte Information. Die Information kann als Bestandteil der
Daten angesehen werden [12]. Die Extraktion der Information aus den Daten erfolgt mit
wissenschaftlichen Methoden und Analyseverfahren. Wobei diese Verfahren aus allen naturwissenschaftlichen Disziplinen stammen können.
Wissen kann in einer aufsteigenden Pyramide dargestellt werden (Abb. 1.8) und führt
zu Organisationssystemen. Die Daten stellen die Basis der Pyramide da. Aus den unstrukturierten Daten werden mit Analysemethoden strukturierte Daten, die Informationen
enthalten. Durch die Verknüpfung der verschiedenen Informationen kann Wissen generiert werden, welches dem Nutzer zur Verfügung gestellt werden kann. Dieses System hat
das Ziel eine zeitliche und örtliche Verteilung von Information zu organisieren. So kann
das generierte Wissen in einem zeitlichen und örtlichen Kontext, der von Personen abhängig ist, mit der eigentlichen Nutzung verlinkt werden. Nachgestellte Handlungen, i. S. d.
Tatablaufsimulation, basieren auf dem bereitgestellten Wissen.
10
Sir Arthur Ignatius Conan Doyle M.D. (* 22. Mai 1859 in Edinburgh; † 7. Juli 1930 in Crowborough, Sussex.
20
D. Labudde et al.
1.5 Spuren als Beweismittel und deren Beweiswürdigung
im Strafprozess
Jedes Strafverfahren hat zum Ziel, die Schuld bzw. die Unschuld eines Tatverdächtigen
möglichst zweifelsfrei herauszufinden. Davon muss das Gericht, sei es der Einzelrichter an einem Amtsgericht, die drei Berufsrichter mit den beiden Schöffen als ebenfalls
gesetzliche Richter beim Landgericht oder die fünf Berufsrichter am Bundesgerichtshof in Strafsachen, überzeugt sein. Über den Grad dieser richterlichen Überzeugung sagt
das Gesetz in § 261 StPO allerdings nichts aus und die Überzeugung ist nicht quantifizierbar, nicht in Prozentwerten ausdrückbar. Entscheidend ist lediglich, dass das Gericht
von der Schuld des Angeklagten überzeugt ist, also eindeutig mehr für als gegen seine
Täterschaft spricht. Dieser subjektive Akt der Überzeugungsbildung ist rein persönlich
und grundsätzlich nicht ersetzbar. Versuche, mithilfe von mathematischen Modellen die
Beweiswürdigung zu objektivieren, sind durchweg erfolglos geblieben. Grundlage jeder
strafgerichtlichen Entscheidung sind Beweise, welche die Täterschaft des Beschuldigten
möglichst eindeutig belegen (sollen). Zwar kann eine Verurteilung auch lediglich aufgrund von Indizien, also von mehr oder weniger aussagekräftigen Anzeichen für eine
denkbare Täterschaft, erfolgen. Doch je höher die Strafandrohung ist, im extremsten Fall
also eine lebenslange Freiheitsstrafe, z. B. wegen Mordes, desto höher werden auch die
Anforderungen an die zugrunde liegenden Beweise bzw. Indizien sein, wobei immer der
Grundsatz in dubio pro reo, im Zweifel für den Angeklagten, zu gelten hat. Der verurteilende Staat, vertreten durch die Staatsanwaltschaft, die bisweilen als „objektivste Behörde
der Welt“ bezeichnet wird, weil sie sowohl die belastenden als auch die entlastenden Umstände in einem Strafprozess zu ermitteln hat (vgl. § 160 II StPO), muss die Tatbegehung
durch den Beschuldigten nachweisen, nicht umgekehrt der Beschuldigte seine Unschuld.
Eine menschenrechtliche Absicherung findet dieses Prinzip, die sogenannte Unschuldsvermutung, in Art. 6 II EMRK, wonach jeder Beschuldigte bis zum gesetzlichen Nachweis
seiner Schuld als unschuldig zu gelten hat. Die EMRK arbeitet demnach mit rechtlichen Fiktionen, indem sie, unabhängig von der realen Tatbegehung des Beschuldigten,
erst in einem sehr späten Zeitpunkt die Täterschaft des Beschuldigten unwiderruflich annimmt – namentlich dann, wenn gegen die gerichtliche Verurteilung keine Rechtsmittel
in Gestalt einer Berufung oder einer Revision mehr eingelegt werden können, die Entscheidung damit rechtskräftig ist und somit (erst ab diesem Zeitpunkt) vollstreckbar ist
(vgl. § 449 StPO), beispielsweise durch die Vollstreckung einer Freiheitsstrafe in einer
Justizvollzugsanstalt. Aufgrund dieser eindeutigen Beweislastverteilung im Strafverfahren benötigen Staatsanwaltschaft und Gericht möglichst aussagekräftige Beweise bzw.
Beweismittel, auf die sie ihre Entscheidung stützen können. Beweismittel müssen das
Gericht von einer bestimmten Tatsache überzeugen, wobei nicht lediglich Tatsachen als
solche, sondern zumeist deren Zusammenspiel mit anderen Tatsachen oder auch Indizien
ein (mehr oder minder) stimmiges Gesamtbild geben sollten, um letztlich die Überzeugung des Gerichts herbeiführen zu können. Diese Beweise bzw. Beweismittel, welche in
1
Einführung
21
einem Strafverfahren vom jeweiligen Gericht u. a. im Hinblick auf die Frage nach der Täterschaft zu würdigen sind, bestehen häufig aus Spuren, die vom Täter entweder am Tatort
oder am Auffindeort einer Leiche oder eines Schwerverletzten hinterlassen worden sind.
Steht hierbei primär eine kriminaltechnische Untersuchung mit rechtsmedizinischem bzw.
molekulargenetischem oder auch toxikologischem Schwerpunkt (siehe hierzu die Kap. 2
und 4 sowie partiell auch 3) im Fokus des Strafverfahrens, wird sich die kriminaltechnische Untersuchung im Falle von Computerkriminalität mit der Erhebung, Auswertung
und Würdigung digitaler Informationen befassen müssen. Neben diesen technischen Fragen wird insbesondere zu klären sein, in welchen rechtlichen Rahmenbedingungen sich
die Nutzung inklusive Interpretation dieser Beweismittel bewegt. In einem Strafverfahren
gilt es auch, eine spätere Verurteilung so „wasserdicht“ zu machen, dass die getroffene
Entscheidung nicht mit den Rechtsmitteln der Berufung oder der Revision wegen tatsächlicher oder rechtlicher Fehler angegriffen und aufgehoben werden kann. Vor diesem
Hintergrund drohender Rechtsmittel wird entweder schon die Staatsanwaltschaft oder
später das erstinstanzliche Gericht bemüht sein, eine entsprechend fundierte und tragfähige Beweislage zu schaffen – andernfalls kann das Gericht das Verfahren in jedem
Prozessstadium mangels genügendem Tatverdachts einstellen oder spätestens am Ende
der Hauptverhandlung den Angeklagten freisprechen, wenn die Beweise für den erforderlichen Grad der richterlichen Überzeugung nicht ausreichen, also die Zweifel an der
Täterschaft größer (bzw. jene nicht genügend nachweisbar ist) sind als die Überzeugung,
dass der Angeklagte die ihm in der Anklageschrift vorgeworfene Tat auch wirklich begangen hat. Die Beweise, unabhängig davon, ob es sich dabei um einzelne Tatwerkzeuge,
Fingerabdrücke, Blutspuren oder auch um digitalisierte Beweismittel handelt, welche von
Polizei und Staatsanwaltschaft auf einem beschlagnahmten Rechner sichergestellt worden
sind oder die im Rahmen einer Online-Durchsuchung bei einem Tatverdächtigen festgestellt wurden, stellen in einem Strafverfahren deshalb den alles entscheidenden Drehund Angelpunkt dar, an welchem die Weichenstellung für den Ausgang des Prozesses –
Verurteilung oder Freispruch – erfolgt. Für das Strafverfahren gilt, anders als in einem Zivilprozess, der weitgehend von den beteiligten Parteien (Kläger/Beklagter) gesteuert wird,
dass alle möglicherweise entscheidungserheblichen Tatsachen nach den Regelungen über
den Umfang der Beweisaufnahme gemäß § 244 II StPO bewiesen werden müssen. So
kann der Zeugenbeweis bereits dann als erbracht gelten, wenn der Zeuge den Täter bei
einem Diebstahl auf frischer Tat ertappt hat. Zu den beweisbedürftigen Tatsachen gehören allerdings auch Indizien: Der Zeuge hat gesehen, wie der Tatverdächtige mit einem
blutigen Messer schnell den Tatort verlassen hat und geflohen ist – diese schnelle Flucht
kann (muss aber nicht zwingend) ein Indiz für die mögliche Täterschaft des Flüchtenden sein. Entscheidend ist vor diesem Hintergrund der primär kriminaltechnische Aspekt,
dass die Beweismittel geeignet sein müssen, zumindest weiterführende Informationen hinsichtlich der zu untersuchenden Tat und Täterschaft zu geben. In rechtlicher Perspektive
ist zur Wahrung des Rechtsstaatsprinzips zudem von fundamentaler Bedeutung, dass die
Beweismittel in rechtlich zulässiger Weise erhoben wurden und dass gesetzliche Beweis-
22
D. Labudde et al.
erhebungsverbote beachtet werden, andernfalls sind die Beweise – und seien sie noch so
aussagekräftig und möglicherweise die einzig tragfähigen in einem Strafprozess – nicht
verwertbar. Besondere Beachtung ist daher den verbotenen Vernehmungsmethoden gemäß
§ 136a StPO geschuldet, nach welchem der Beschuldigte, welcher auch als Beweismittel
in Betracht kommt, nicht misshandelt, gefoltert, gequält oder hypnotisiert werden darf,
um von ihm (wahrheitsgemäße) Aussagen zu erhalten. Jegliche, auf solche Weise erlangten Aussagen sind prinzipiell, d. h. ausnahmslos, unzulässig und dürfen niemals in
einem Strafverfahren verwertet werden – selbst wenn der Beschuldigte damit (aus welchen
Gründen auch immer) einverstanden sein sollte: § 136a III StPO erklärt eine solche Zustimmung des Beschuldigten für unbeachtlich, um die vollumfängliche und keinesfalls zu
durchbrechende absolute Geltung dieses Beweiserhebungs- und Beweisverwertungsverbotes zu garantieren. Ein Verstoß gegen dieses Verbot macht die gerichtliche Verurteilung
mit dem Mittel der Revision (§ 337 StPO) rechtlich angreifbar und das Gericht (bzw.
eine andere Strafkammer) muss aufgrund dieses Fehlers über diesen Fall erneut entscheiden. Nicht beweisbedürftig sind sogenannte offenkundige Tatsachen, z. B. wann Vollmond
bzw. Neumond war/ist, wann eine Springtide an der Nordseeküste war, von wann bis wann
der Dreißigjährige Krieg dauerte und wodurch er beendet wurde – zur Klärung dieser Fragen genügt regulär entweder das erworbene Allgemeinwissen oder, falls nicht oder nur
rudimentär vorhanden, ein Blick in ein handelsübliches Lexikon oder in Wikipedia. Eine Beweisaufnahme zu derartigen bzw. strukturell vergleichbaren Fragen ist im Rahmen
eines Strafverfahrens somit nicht erforderlich und demgemäß auch keine „Würdigung“
dieser Fakten.
Literatur
1. Berthel, R.: Grundlagen der Kriminalistik/Kriminologie. No. 1 in Lehr- und Studienbriefe Kriminalistik/Kriminologie. Verlag Deutsche Polizeiliteratur (2008)
2. Casey, E.: Digital Evidence and Computer Crime, 3. Aufl.: Forensic Science, Computers, and
the Internet, 3. Aufl. Academic Press (2011)
3. Cybercrime – Bundeslagebild 2014. http://www.bka.de/nn_224082/SharedDocs/Downloads/
DE/Publikationen/JahresberichteUndLagebilder/Cybercrime/cybercrimeBundeslagebild2014,
templateId=raw,property=publicationFile.pdf/cybercrimeBundeslagebild2014.pdf
4. Dewald, A., Freiling, F.C.: Forensische Informatik, 3. Aufl. Books on Demand (2015)
5. Gabler Wirtschaftslexikon, Stichwort: Kriminalistik. http://wirtschaftslexikon.gabler.de/
Definition/kriminalistik.html
6. Groß, H.: Handbuch für Untersuchungsrichter, Polizeibeamte,Gendarmen u. s. w. Verlag von
Leuschner und Lubensky, Graz (1893)
7. Herrmann, B., Saternus, K.S.: Biologische Spurenkunde: Band 1: Kriminalbiologie, vol. 1.
Springer (2007)
8. Kaiser, G.: Kriminologie. Ein Lehrbuch. Müller, Juristischer Verlag Heidelberg (1988)
Literatur
23
9. Kent, K., Chevalier, S., Grance, T., Dang, H.: Guide to integrating forensic techniques into
incident response. NIST Special Publication S. 800–86 (2006)
10. Locard, E.: Die Kriminaluntersuchung und ihre wissenschaftlichen Methoden. Berlin (1930)
11. Popper, K.R.: Logik der Forschung. Verlag Julius Springer, Wien (1934)
12. Schmitz, C., Zucker, B.: Wissensmanagement – Schnelleres Lernen im Unternehmen. Metropolitan (2003)
2
Biometrie und die Analyse digitalisierter Spuren
Dirk Labudde
2.1
Einleitung
Die moderne Tatortarbeit hat sich in den letzten Jahren deutlich verändert. Dabei sollte man nicht die in der Presse und Bevölkerung entstandene Erwartungshaltung durch
den „CSI-Effekt“ aus dem Blick verlieren. Der Begriff ist von den CSI-Serien abgeleitet und vermittelt die Technikaffinität der Forensik. Im Kontext der Technikentwicklung
und der Effektivität sollte der Einsatz von neuen Technologien zur Analyse von Spuren
(digitalisierten Daten) behutsam diskutiert werden. Natürlich lassen neue Technologien
auch neue Analysemethoden zu, jedoch sollten Aspekte der Machbarkeit im Alltag ebenfalls berücksichtigt werden. Neue Technologien sind die Grundlage für eine moderne
forensische Fallarbeit. In diesem Kontext wollen wir von digitalisierten Spuren sprechen, also physische Spuren, die durch geeignete Technologien digitalisiert, analysiert
und visualisiert werden können. Seit Jahrhunderten möchten Menschen andere erkennen
bzw. wiedererkennen, sei es aus Gründen der Freundschaft oder Feindschaft. Hier bedient sich der Mensch erkennbarer biologischer Merkmale. Diese können physiologische
Merkmale oder Verhaltenscharakteristika sein. Heute werden durch geeignete Methoden
(Scanning, Capturing) aus diesen biologischen Merkmalen biometrische Merkmale. Eine
weitere Abstraktionsebene wäre die biometrische Signatur (Hashfunktion). Wir unterscheiden zwei Aufgaben, Identifizierung bzw. Authentifizierung/Verifizierung einer Person, welche durch verschiedene Methoden abgedeckt werden [42].
D. Labudde ()
Lehrstuhl für Bioinformatik und Forensik, Leiter Forensic Science Investigation Lab (FoSIL),
University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: labudde@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_2
25
26
D. Labudde
2.1.1 Die Identifikation – Wer bin ich?
Aus einem Referenzdatensatz, in dem Daten mehrerer Personen gespeichert sind, wird die
zu identifizierende Person herausgesucht. Die aktuellen Daten müssen von dem biometrischen System mit dem gesamten Datenbestand verglichen werden bis in den Referenzdaten Übereinstimmungen gefunden sind. Die Genauigkeit des Verfahrens hängt von den
zuvor festgelegten Toleranzschwellen ab. Es kann aber keine hundertprozentige Übereinstimmung erreicht werden, sondern nur eine hinreichende Deckung der Daten. Zur
Identifizierung einer Person muss der Schwellwert bezüglich eines Referenzdatensatzes
überschritten werden. Mithilfe eines 1 W n-Vergleichs aus dem Referenzdatensatz ist dem
System die gesuchte Person bekannt und es weiß, um welche Person es sich handelt [42].
2.1.2
Die Verifikation – Bin ich der, für den ich mich ausgebe?
Damit das Verfahren herausfindet, ob eine Person die ist, für die sie sich ausgibt, müssen
die Daten innerhalb von festgelegten Toleranzschranken übereinstimmen. Diese Schranken sind im Programm festgelegt. Das bedeutet, dass die gewonnenen Daten mit einem
einzigen Datensatz in einem 1 W 1-Vergleich gegenübergestellt werden. Der Vorteil beim
Abgleich der aktuellen Daten mit nur einem Referenztemplate ist der Faktor Zeit, da eine
Identifikation mithilfe eines 1 W n-Vergleichs mit zunehmender Größe immer langsamer
wird [42].
In der modernen forensischen Fallarbeit gewinnt die Biometrie (biometrische Verfahren und Systeme) immer mehr an Bedeutung. Der technologische Fortschritt erlaubt in
zunehmendem Maße rasche Messungen von biologischen Charakteristika und deren Auswertung mit vertretbarem Aufwand und hoher Qualität. Der Einsatz von Biometrie ist
ein vielversprechender Ansatz, das Locard’sche Prinzip auf eine neue qualitative und
quantitative Ebene zu heben. Wie verbindet man die Spuren mit der Identität einer oder
mehrerer Personen? Dies gilt nur, unter der Annahme, dass biometrische Systeme kreiert werden, die eine Speicherung, Analyse, Kombination und Vergleich biometrischer
Daten ermöglichen. In der heutigen globalisierten Informations- und Wissensgesellschaft
kommt der Lösung dieses Problems eine immense Wichtigkeit und Bedeutung zu. Analog
zum menschlichen Verhalten können diese Systeme trainiert werden und so eine höhere
Erkennungsrate erzielen [42].
2.2 Biometrie
Der Begriff Biometrie stammt aus dem Griechischen und bildet sich aus den altgriechischen Wörtern bios (ˇKo&) für Leben und metron ("Ko) für Maß. Danach ist die
Biometrie die Wissenschaft der Körpermessung an Lebewesen, speziell am Menschen.
Die klassische Begriffsdefinition der Biometrie beschreibt die Anwendung statistischer
2
Biometrie und die Analyse digitalisierter Spuren
27
Methoden in Human- und Veterinärmedizin, in Land- und Forstwirtschaft, in der Biologie
sowie in verwandten Wissenschaftsgebieten. Dieser Begriff schließt das Wissen um die
Merkmale von Menschen mit ein. Aus einzelnen oder einer Kombination von biometrischen Daten, welche auf diesen Merkmalen basieren, wird eine Person authentifiziert oder
identifiziert.
2.2.1
Historischer Streifzug durch die Biometrie in der Forensik
Die Vermessung des Menschen zu Identifikationszwecken ist eine alte wissenschaftliche
Idee. Bereits mehr als zweitausend Jahre vor Christus wurden Fingerabdrücke verwendet,
um auf Tontafeln, welche zu dieser Zeit als Urkunden dienten, den Aussteller der Urkunde
zu markieren. Auch zu Zeiten der Han-Dynastie, ca. 100 nach Christus, verwendete man
den Fingerabdruck als Unterschrift. In Strafverfolgungsprozessen wurde der Identifizierungswert des menschlichen Fingerabdruckes vermutlich schon im zwölften Jahrhundert
eingesetzt. Darauf weist ein 40-bändiger Kriminalroman des chinesischen Schriftstellers
Shi nai-ngan hin, welcher beschreibt, wie man zwei Mörderinnen die „Finger einschwärzen und abdrücken“ ließ. Unter dem Titel: „Über das äußere Gefühlsorgan“ wurde im
Jahre 1686 durch Marcellus Malphigius erstmals eine Schrift veröffentlicht, welche sich
den Furchen und Mustern der Handflächen widmete. Der tschechische Professor Johann
Evangelista Purkinje legte 1823 durch seine Definition der neun Grundmuster die Basis
für die heutige Klassifizierung von Fingerabdrücken. Etwa 20 Jahre später erbrachte der
deutsche Anthropologe Hermann Welker den empirischen Beweis der Unveränderlichkeit des Fingerabdrucks im Laufe eines Lebens. Ende des 19. Jahrhunderts wird durch
die systematische Aufnahme verschiedener Körpermaße, wie beispielsweise der Länge
und Breite des Kopfes, der Begriff der „Anthropometrie“ geprägt. Alphonse Bertillon publiziert 1885 die Farbe der Iris als Erkennungsmerkmal des Menschen. 1892 postulierte
Sir Francis Galton, dass der menschliche Fingerabdruck einzigartig für jedes Individuum
ist und im Laufe des Lebens weitgehend unverändert bleibt. Damit wurde der wissenschaftliche Grundstein für die Verwendung der Daktyloskopie in der Personenerkennung
gelegt. Bereits fünf Jahre später wurden die ersten Straftäter durch New Scotland Yard mithilfe von Fingerabdrücken überführt. Seit 1952 erkennt der deutsche Bundesgerichtshof
den Beweiswert der Daktyloskopie uneingeschränkt an. Die Einzigartigkeit der Irismusterung und deren Eignung zu Identifizierungszwecken wurden erstmals 1936 erwähnt.
In den 1980er Jahren wurden dann Verfahren zur Retina- und Iriserkennung entwickelt.
Im Jahr 1994 wurde der erste einsatzfähige biometrische Algorithmus von John Daugman entwickelt und zum Patent angemeldet. In den Jahren 1994 bis 1996 wurde von dem
US-amerikanischen Verteidigungsministerium der erste Wettbewerb von Gesichtserkennungssystemen ausgetragen [23].
28
2.2.2
D. Labudde
Biometrie und das Locard’sche Prinzip
Das Locard’sche Austauschprinzip macht die Rolle der Spur (physisch und digital) auf
eine einprägsame Art deutlich. Wir werden uns hier lediglich auf die „biometrischen“
Spuren konzentrieren. Jedoch gilt das Prinzip der Ähnlichkeit auch für Werkzeugspuren
oder Abdrücke von Autoreifen. Im Wesentlichen unterscheidet man vier Spurenkategorien:
Materialspuren. Basieren auf den stofflichen Eigenschaften und deren Zuordnung
(z. B. Spermaspuren, Blutspuren, Speichelspuren, Haare).
Formspuren. Forensische Schlussfolgerungen basieren auf der Form der Spuren (z. B.
Blutspritzmuster, Werkzeugabdruck auf Haut oder Knochen).
Situationsspuren. Sammlung von Informationen aus der besonderen Lage von Spuren
oder Gegenständen zueinander oder zur Umgebung (Stellung von Fenstern und Türen,
Lage der Kleidung).
Gegenstandsspuren sind beweiserhebliche Gegenstände, die vom Täter oder Opfer
am Tatort (Tatortbegriff im erweiterten Sinne) zurückgelassen worden.
Opfer, Täter, Tatmittel und Tatort stehen über die Veränderungen (physische Spur) in einem nachvollziehbaren Zusammenhang (Abb. 2.1). Kein Täter kann eine Tat begehen oder
einen Tatort verlassen, ohne eine Vielzahl von Spuren zu hinterlassen. Locard formulierte
das so:
Abb. 2.1 Darstellung der
Beziehungen zwischen Täter, Opfer, Tatmittel und dem
Ort des Geschehens. Der Zusammenhang wird durch die
physischen Spuren vermittelt
2
Biometrie und die Analyse digitalisierter Spuren
29
Tab. 2.1 Zusammenhang Spurenverursacher und Spurenträger. Dargestellt sind mögliche Übertragungen zwischen Täter, Opfer, Tatmittel und dem Ort des Geschehens [19]
Spurenverursacher Spurenträger Beispiel
Täter
Opfer
Würgemale
Tatmittel
Fingerabdrücke auf Hammerstiel
Tatort
Fußabdruckspuren im Garten
Opfer
Täter
Blutspuren auf Hemd
Tatmittel
Hautzellen des Opfers
Tatort
Blutspuren des Opfers
Tatmittel
Täter
Fingerabdrücke an der Waffe
Opfer
Schussverletzungen
Tatort
Reifenspuren
Tatort
Täter
Bodenspuren an den Schuhen
Opfer
Botanische Spuren
Tatmittel
Mechanische Spuren an der Tür
„Überall dort, wo er geht, was er berührt, was er hinterlässt, auch unbewusst, all das dient
als stummer Zeuge gegen ihn. Nicht nur seine Fingerabdrücke oder seine Fußabdrücke, auch
seine Haare, die Fasern aus seiner Kleidung, das Glas, das er bricht, die Abdrücke der Werkzeuge, die er hinterlässt, die Kratzer, die er in die Farbe macht, das Blut oder Sperma, das er
hinterlässt oder an sich trägt. All dies und mehr sind stumme Zeugen gegen ihn. Dies ist der
Beweis, der niemals vergisst. Er ist nicht verwirrt durch die Spannung des Augenblicks. Er
ist nicht unkonzentriert, wie es die menschlichen Zeugen sind. Er ist ein sachlicher Beweis.
Physikalische Beweismittel können nicht falsch sein, sie können sich selbst nicht verstellen,
sie können nicht vollständig verschwinden. Nur menschliches Versagen, diese zu finden, zu
studieren und zu verstehen, kann ihren Wert zunichtemachen.“[31]
Die Auswirkung oder auch Wirkung ist in den Veränderungen an den Objekten messbar. Ausgehend vom Locard’schen Prinzip sind Spurenübertragungen von Form- und Materialspuren zwischen Täter, Opfer, Tatmittel und Tatort möglich. Tab. 2.1 beinhaltet einen
Überblick zu möglichen Übertragungen und Zusammenhängen zwischen Spurenverursachern und Spurenträgern [19]. So kann ein Täter seinen individuellen Fingerabdruck
auf einem Tatwerkzeug hinterlassen. Durch biometrische Methoden und Systeme kann
dieser Abdruck analysiert und zugeordnet werden. Das Verständnis und die Zuordnung
der Spuren ermöglicht eine Rekonstruktion des Tatherganges und die Identifizierung bzw.
Verifizierung des Täters und/oder des Opfers. Der Prozess der Zuordnung (Identifikation bzw. Verifikation) lässt über die Bestimmung der Ähnlichkeit zweier Merkmale bzw.
deren Veränderungen am Tatort bestimmen. Biometrische Verfahren erlauben ebenso Gegenstände die mit einem möglichen Täter oder Opfer in Verbindung stehen zu analysieren
und diese einer Person zu zuordnen.
Der Raum der möglichen Spuren hat sich durch das Informationszeitalter, in dem wir
leben, deutlich vergrößert. Neben den von Menschen erkennbaren Merkmalen wie dem
Gesicht, der Stimme, dem Gang oder der Handschrift können speziell entwickelte Ver-
30
D. Labudde
fahren Parameter, die dem menschlichen Auge verborgen sind, erfassen und analysieren.
Dazu gehört der sogenannte chemische Fingerabdruck [25], die Zusammensetzung der
Atemluft und der Individualgeruch des Menschen [27] oder die komplexe Struktur der
Iris [5]. So ist es heute denkbar, das Verhalten eines Menschen bei der Bedienung von
mobilen Devices durch sein Tippverhalten zu charakterisieren. Analog dazu wurden Algorithmen entwickelt, die eine Identifizierung oder Verifizierung von Personen über die
Benutzung eines Bio-Pens [49] ermöglicht. Dabei ist die Vorgehensweise mit dem Verfahren der Analyse der klassischen Handschrift vergleichbar. Die Authentifizierung von
Personen über deren Handschrift ist in den letzten Jahren ein wichtiges Einsatz- und Forschungsgebiet des Sicherheitssektors geworden
Dabei wird das individuelle Schriftbild einer Person mithilfe eines Passwortes aufgenommen und anschließend mit biometrischen Algorithmen ausgewertet, um Identität
festzustellen oder auszuschließen. Jüngste Untersuchungen [2] zeigten, dass dieses Verfahren auch in der Forensik genutzt werden kann. Der BiSP (Biometric Smart Pen) zum
Beispiel erkennt Bewegungen in der Luft und kann die gewonnenen Daten dank vieler
Nachbearbeitungsschritte besser und schneller miteinander vergleichen. Die durchweg
sehr hohen Wiedererkennungsraten der einzelnen Schriftbilder (99,9 %) sprechen ganz
klar für den forensischen Einsatz dieser Technik. Die aufwendigen Bearbeitungsschritte
benötigen jedoch einen enormen Rechenaufwand, wodurch einzelne Berechnungen bis zu
15 Sekunden dauern können, was im Vergleich zu anderen biometrischen Untersuchungen
(Fingerabdruck, Irisscan) langsam ist. Diese Problematik sollte, neben der Verbesserung
der Usability der Geräte, Inhalt weiterer Forschungen auf diesem Gebiet sein.
2.3
Biometrische Merkmale
Die Biometrie beschäftigt sich mit dem Vermessen von Lebewesen nach quantitativen
Merkmalen. Es handelt sich um die automatisierte Vermessung eines individuellen – physiologischen oder verhaltenstypischen – Merkmals einer Person, um eine Identifikation
bzw. Verifizierung von Personen zu ermöglichen. Das Ziel der Biometrie ist die Zuordnung einer Identität und entsprechender Rechte zu einer physischen Person. Unterschieden werden biometrische Verfahren und Systeme. Ein biometrisches Verfahren ist
ein auf biometrischer Erkennung basierender Mechanismus zur Authentisierung eines
Menschen aufgrund seiner persönlichen, biologischen Eigenschaften mittels entsprechender Erkennungsgeräte. Unter einem biometrischen System ist eine Hard- und SoftwareKombination zur biometrischen Identifikation oder biometrischen Verifikation zu verstehen, das unter Verwendung biometrischer Verfahren arbeitet. Die Grundlage aller biometrischer Verfahren basiert darauf, dass verschiedene Körper- oder Verhaltensmerkmale
einem bestimmten Menschen zuzuordnen sind. Viele der für eine biometrische Erkennung
verwendeten körperlichen Merkmale wie Gesicht und Finger sind offen erkennbar. Biometrische Merkmale können schließlich nicht auf anderen Menschen übertragen werden.
Erkannt wird der Nutzer hier anhand seiner Individualität. Im Gegensatz zu lediglich auf
2
Biometrie und die Analyse digitalisierter Spuren
31
Tab. 2.2 Biometrie, Wissen und Besitz in Bezug auf Kopierbarkeit, Verlust, Diebstahl, Änderbarkeit und Weitergabe
Biometrisches Merkmal
Verlust
Änderbarkeit
Dublizierbarkeit
Diebstahl
Weitergabe
Beispiel
Sehr schwer bis unmöglich
Schwer bis unmöglich
Einfach bis sehr schwierig
Schwierig
Einfach bis schwierig
Iris, Papillarleisten, Gesicht,
Ohr
Persönlichen Besitz
(Prinzip des Besitzes)
Einfach
Einfach
Einfach bis schwer
Möglich
Einfach
Pass, Ausweise, Mitgliedskarten, Schlüssel
Geheimes Wissen
(Prinzip des Wissens)
Möglich
Einfach
Möglich
Möglich
Möglich
PIN, Logindaten,
Schließcode
die Person bezogenen Merkmalen sind diese also direkt und nicht nur abgeleitet unmittelbar an die Person gebunden. An ein körperliches Merkmal muss sich der Merkmalsträger
nicht erinnern, er trägt es untrennbar stets bei sich. Es kann im Allgemeinen auch nicht
geheim gehalten werden. Im Gegensatz dazu stehen Merkmale die auf persönlichen Besitz und geheimes Wissen zurückgehen. Beispiele dafür sind der Besitz eines Ausweises
und die Vergabe von Passworten. Derartige Merkmale können leichter verloren gehen,
ausspioniert bzw. weitergegeben und verändert werden. In naher Zukunft ist von einer
Durchmischung dieser Prinzipien (Biometrie, Wissen und Besitz) bzw. Kombination auszugehen. Ein Beispiel dafür ist die Einführung des ePass in Deutschland im November
2005. In der ersten Generation ist hier das Passfoto als biometrisches Merkmal im Chip
gespeichert. Seit dem 1. November 2007 werden in elektronischen Pässen der zweiten
Generation zusätzlich zwei Fingerabdrücke gespeichert.
Die Tab. 2.2 stellt die drei Prinzipien (Biometrie, Wissen und Besitz) in Bezug auf
Kopierbarkeit, Verlust, Diebstahl, Änderbarkeit und Weitergabe.
Biometrische Merkmale sind aus biologischer Sicht schwer in Kategorien einteilbar.
Zum einen enthalten sie genotypische Anteile und sind somit auch vererbbar. Zum anderen
entstehen viele der biometrischen Merkmale, welche in der forensischen Fallarbeit genutzt werden, durch einen zufälligen Prozess während der Embryonalentwicklung. Andere
Merkmale sind verhaltensgesteuert und damit konditioniert und anerzogen bzw. können
geändert werden. Nach der Entstehung biometrischer Merkmale könnten somit drei Kategorien genutzt werden:
genotypisch,
randotypisch,
konditioniert.
Oft enthält jedes einzelne biometrische Merkmal alle drei Entstehungskategorien, die mit
einer unterschiedlichen Gewichtung, im Sinne einer Bewertung, eingehen. Die Stimme
eines Menschen ist durch die individuelle Anatomie geprägt, jedoch unterliegt die Klangfarbe der Stimme im Prozess von Wachstum und Alterung starken Schwankungen. Dieses
32
D. Labudde
Abb. 2.2 Darstellung einer möglichen Einteilung biometrischer Merkmale auf der Grundlage ihrer
Entstehung und Veränderbarkeit. Es werden die Gruppen der physiologischen bzw. verhaltensbezogene Merkmale unterteilt
Merkmal wird durch den momentanen Zustand der Person (Stress, Freude, Trauer) in einer
konkreten Situation moduliert. Im Allgemeinen stellt man im Prozess der Authentifizierung und Identifizierung folgende Eigenschaften an biometrische Merkmale:
Einzigartigkeit: Merkmal muss hinreichend verschiedene Ausprägungen besitzen
Konstanz: Merkmal soll sich im Laufe der Lebenszeit möglichst wenig verändern
Verbreitung: Merkmal soll möglichst häufig in der Population vorhanden sein.
Leider sind diese Kriterien nicht immer hinreichend wissenschaftlich untersucht und
dokumentiert. Biometrische Merkmale werden in der Praxis in zwei Kategorien, nach
Entstehung und Veränderbarkeit, eingeteilt: physiologische (passive Merkmale) und verhaltensbezogene (aktive Merkmale). Abb. 2.2 zeigt eine Reihe biometrischer Merkmale,
welche gegenwärtig in der forensischen Fallarbeit Verwendung finden. In der Literatur erfolgt oft eine andere Einteilung auf der Grundlage der angewandten Methode zur Messung
der korrespondierenden Merkmale.
Die Merkmale aus Abb. 2.2 erfüllen die Anforderungen an biometrische Merkmale,
jedoch besteht eine Variation in einzelnen Eigenschaften in Bezug auf Konstanz und Einzigartigkeit.
2
Biometrie und die Analyse digitalisierter Spuren
33
2.4 Ausgewählte Analyseverfahren
Die biometrische Erkennung basiert auf einem einheitlichen System. Trotz der hohen
Individualität der verschiedenen biometrischen Systeme kann man von einem gemeinsamen Grundaufbau ausgehen. Die drei grundlegenden Phasen sind: Erfassung der biometrischen relevanten Eigenschaft, Gegenüberstellung mit einem Template-Datensatz oder
Vergleichsmaterial und dem Abgleich, dem sogenannten Matching. Für den Prozess des
Matchings sind sogenannte Ähnlichkeitsfunktionen erforderlich, diese ermöglichen eine
genaue Abschätzung der gefundenen Ähnlichkeit bzw. Identität. Damit wird eine nummerische Bestimmung im Vergleich zwischen dem Template bzw. der Vergleichsprobe und
dem Original erst möglich.
2.4.1
Der Fuß als biometrisches Merkmal im Prozess der Digitalisierung
Fußabdrücke (im Gegensatz zu Schuhabdrücken), die beispielsweise an einem Tatort hinterlassen wurde, weisen neben der Fußgröße weitere spezifische Merkmale wie z. B. Länge, Breite, Ansatzfläche oder pathologische Erscheinungen, die für eine Tätersuche genutzt werden können, auf. Exemplarisch besitzen etwa 70–80 % der Erwachsenen Fußdeformitäten, die gemeinsam mit den geometrischen Fußparametern und dem Gewicht zur
Eingrenzung möglicher Tätergruppen genutzt werden können. Damit stellen die Podologie und entsprechende wissenschaftliche Ansätze zur Auswertung von Fußabdrücken an
einem Geschehensort ein adäquates Hilfsmittel dar.
Ähnlich wie bei der Erfassung des Fingerabdruckes sollten die messbaren Parameter
eines Fußabdruckes (z. B. Clarke-Winkel, Stritzer-Guadonov-Index, Fersenwinkel) durch
technische Gegebenheiten oder äußere Bedingungen so unverändert wie möglich vorliegen. Für die digitale Erfassung der Physiognomie werden Podoskope aus dem medizinischen Bereich eingesetzt. In der Medizin wird diese Form der Bildaufnahme vorwiegend
zur Feststellung von Fußschwächen und Haltungsanomalien eingesetzt. Mit der Erfassung von Druckpunkten der Füße mittels polarisierten Lichts, im statischen und aktiven
Zustand, stellt diese z. T. digitalisierte Aufnahmetechnik eine moderne Form, gegenüber
den klassischen Tintenabdrücken in der Forensik, dar. Zur Verarbeitung der Daten können
eine Reihe von Algorithmen genutzt werden [48].
Der Canny-Algorithmus wird vorzugsweise zur Kantendetektion in einem erzeugten
Graustufenbild ausgehend vom Originalbild genutzt. Zur Erhaltung des Inhaltes aus dem
Originalbild gliedert sich der Algorithmus in verschiedene Faltungsoperationen. An die
Umwandlung in ein Schwarz-Weiß-Bild schließt die Bewertung der Pixel und deren Nachbarschaft für die Kantenfestlegung an. Problematisch bei diesem Algorithmus ist, dass
durch das Bildrauschen Helligkeitsunterschiede entstehen können, wodurch die Genauigkeit des Verfahrens beeinträchtigt wird. Um diese Schwachstelle zu umgehen, wird häufig
eine normalverteilte Maske angewendet. Jedoch kann es dadurch passieren, dass feinere
34
D. Labudde
Abb. 2.3 Schritte der Fußtyperkennung
Elemente bzw. Kanten nicht als solche erkannt und folglich nicht berücksichtigt werden.
Dadurch kann wiederum ein Informationsverlust im Bild entstehen [9, 21].
Mit dem Spearman-Korrelationskoeffizient wird der Grad einer linearen Abhängigkeit
zwischen zwei Merkmalen bestimmt. Im Falle einer nichtlinearen Abhängigkeit würde
der Wert Null resultieren. Allerdings kann zwischen den Parametern ein nichtlinearer
Zusammenhang bestehen, wodurch gezeigt wird, dass der Korrelationskoeffizient kein
hinreichend geeignetes Maß für die Darstellung der Merkmalsabhängigkeit ist [50].
In einer kürzlich erschienen Arbeit von Pauk et al. [37] erfolgt die Darstellung eines Systems zur allgemeingültigen computergestützten Charakterisierung diverser Fußtypen [38]. Das betreffende Verfahren teilt sich in drei grundlegende Schritte, die im
Folgenden zusammenfassend erläutert werden. Im ersten Schritt werden relevante Fußparameter sowohl fotografisch als auch über ein Podoskop festgehalten. Dabei sollten die
Testpersonen versuchen, eine entspannte Haltung anzunehmen. Dies hat den Zweck, dass
eine annähernd regelmäßige Druckverteilung über das gesamte Fußskelett erfolgt. Des
Weiteren muss in diesem Schritt eine Festlegung der Parameter im Versuchsaufbau zur
Nachvollziehbarkeit und Standardisierung des Verfahrens erfolgen. Darunter eine gleichbleibende Messdistanz, homogene Kameraeinstellungen, eine horizontale Ausrichtung
der Kamera, eine gleichmäßige Beleuchtung, eine voreingestellte Kameralinse und die
konsistente Nutzung einer Software zur Datenakquisition und Auswertung. Der Algorithmus zur Fußtypbestimmung nach Pauk et al. (2015) (in Abb. 2.3 dargestellt) umfasst die
folgenden vier Schritte:
1. Bild einlesen und rotieren
2. Kantenerkennung und Bildinvertierung
2
Biometrie und die Analyse digitalisierter Spuren
35
3. Detektion relevanter Messpunkte und Tangenten
4. Detektion der Liniensegmente und Clarke-Linie.
In den Schritten drei und vier werden Clarke-Winkel, Strizer-Gudonov: KY-Index, Fersenwinkel und Weysflog-Index berechnet. Die Basis hierfür bilden durch die Software
erkannte signifikante parametergestützte Fußpunkte.
Zur Verifikation des Verfahrens wurden 24 männliche und weibliche Studenten ohne
Verletzungen der unteren Extremität ausgewählt. Zugehörige Fußabdrücke wurden jeweils manuell sowie computergestützt erfasst und miteinander verglichen. Aus der Ergebnisgegenüberstellung wurde ersichtlich, dass keine signifikanten (Signifikanzlevel: 0,05)
Unterschiede zwischen beiden Verfahren (manuell und computergestützt) zu erkennen
waren. Die Studie zeigt, dass die computergestützte Analyse eine im Vergleich zu klassischen Fußabdruckverfahren nichtinvasive, schnelle und kostengünstige Alternative darstellt. Darüber hinaus zeigte sich, dass die Auswahl der Parameter ausreichend für die
Analyse war. Durch den Einsatz von Algorithmen im computergestützten Verfahren wird
der subjektive Einfluss des Testleiters und in Zusammenhang stehende Störvariablen minimiert. Die Autoren postulierten in der Arbeit zudem dass durch den Einsatz digitaler
fotografischer Aufnahmen und einer folgenden digitalen Bildbearbeitung die Genauigkeit
des Verfahrens erhöht wird [37].
Ein Fallbeispiel aus dem Jahr 1985 zeigt, dass Methoden für die Analyse von Fußabdrücken im forensischen Kontext bisher ungenügend sind und auf wissenschaftlicher,
objektiver Ebene verbessert werden sollten. Mit der Schlagzeile „Spurensuche – Der ungeklärte Dreifach-Mord von Volkartshain“ beschreibt der hessische Rundfunk ein grausames
Verbrechen im Jahr 1985, welches bisher noch nicht aufgeklärt ist.1 Besonders auffällig
in diesem Fall waren der unerwartete Ermittlungsablauf und die frühzeitige Präsentation
von Beweisen. Die Ermittler bezogen sich in der Beweisführung auf einen blutigen Fußabdruck (Schuhgröße 44), der am Tatort gesichert wurde. Im Laufe der Untersuchungen
wurden alle Männer mit der Schuhgröße 44 gebeten, einen Fußabdruck für den Zweck
einer orthopädischen Analyse anfertigen zu lassen. Mit Eröffnung des Verfahrens, das
überwiegend auf dem Fußabdruckvergleich der am Tatort gesicherten Spuren mit dem des
Angeklagten beruhte, wurden schnell eklatante Ermittlungsfehler bemerkt. Unter anderem wurde verschleiert, dass z. B. beim Abgleich der Fußabdrücke vom Tatort mit denen
vom Täter rechte und linke Abdrücke verwechselt wurden und sich laut Ergebnisstatistik eine 100 % Übereinstimmung ergab. Das Beispiel zeigt den Bedarf an objektivierten
Analysemethoden in der kriminaltechnischen Arbeit und Spurenanalyse, die u. a. eine
Nachvollziehbarkeit und Reproduzierbarkeit der Ergebnisse bedingen. Nur wenn eine
regionalunabhängige Verfügbarkeit von Analysemethoden und technischer Ausstattung
besteht, lässt sich eine objektivierte fallgebundene Darstellung der Ermittlungsresultate
1
Quelle: www.hr-online.de/website/fernsehen/sendungen/index.jsp?rubrik=85159&key=standard_
document_51337857
36
D. Labudde
ermöglichen. Dennoch müssen die jeweiligen computergestützten Verfahrensansätze für
die Analyse des biometrischen Merkmals Fuß weiter verbessert und optimiert werden.
2.4.2
Iriserkennung
Die Iris (Regenbogenhaut) wird anatomisch der Gefäßhaut des Auges zugeordnet und ist
mit dem Ziliarkörper verbunden. Sie bildet eine kreisrunde pigmentierte Schicht in deren
Mitte eine Öffnung – die Pupille – zu erkennen ist. Die Augenfarbe wird durch eingelagertes Melanin in der Regenbogenhaut bestimmt. In den ersten Lebensmonaten besitzen
alle Menschen die gleiche Augenfarbe. Danach ändert sich diese in den meisten Fällen.
Die Ausprägung des Irismusters ist ein zufälliger Prozess und ist von Ausgangsbedingungen während der embryonalen Entwicklung abhängig. Damit ist das Irismuster, entgegen
der Augenfarbe, nicht genetisch kodiert. Mit einer durchschnittlichen Anzahl von über
200 Einzelmerkmalen bildet der farbige Ring um die Pupille bei jedem Menschen ein
einzigartiges Muster ab. Diese Merkmale bleiben, Erkrankungen oder invasive Eingriffe
ausgeschlossen, annähernd ein Leben lang erhalten. Aus den genannten Gründen ist die
Iris ein sehr verlässliches biometrisches Merkmal. Selbst bei eineiigen Zwillingen ist die
Irismusterung unterschiedlich ausgeprägt [14].
Für die Iriserkennung sind nicht die Augenfarbe, sondern die äußerlich erkennbaren
Merkmale der Iris relevant. Neben dem Pupillarsaum gibt es weitere wichtige Strukturen.
Zum einen wird durch den Circulus arteriosus iridis minor die sogenannte „Iriskrause“
gebildet, welche die Iris in zwei Bereiche einteilt. Dem Ziliarteil, welcher aus „radial
gestellten Trabekeln“ [22] besteht, und dem Pupillarteil der den Sphinctermuskel enthält.
Zum anderen gibt es Buchten, auch Lakunen oder Krypten genannt, welche zwischen den
Trabekeln angeordnet sind. In Abb. 2.4 sind diese Strukturen dargestellt [22].
Ablauf der Iriserkennung
Der dargestellte Ablauf der Iriserkennung in Abb. 2.5 ist dem patentierten Algorithmus
von John Daugman nachempfunden [15]. Die Iriserkennung gliedert sich in zwei Abschnitte. Zunächst erfolgt die Aufnahme des Irisbildes während des Enrollments und die
Überführung in ein Template. Daraufhin folgt der paarweise Abgleich der Templates untereinander. Während der Aufnahme wird das Auge einer Person grundsätzlich in dessen
Gesamtheit aufgenommen. Um den Hintergrund in Form der Augenfarbe auszuschließen, werden die Aufnahmen im Infrarotbereich bei nahezu unsichtbarem Licht (850 nm)
angefertigt, wodurch die Melaninabsorption verhindert werden soll. Bei besonders hellen Hintergründen treten oftmals Umgebungsreflexionen durch die Hornhaut auf. Dieser
Effekt sollte vermieden werden, indem das Licht mit schmalen Wellenlängenbereichen bestrahlt wird. Dadurch wird lediglich das von der Kamera ausgehende Licht berücksichtigt,
und ein nichtreflektierendes Bild der Iris entsteht [13].
Nachdem das Bild der Iris störungsfrei aufgenommen wurde, folgt die Segmentierung
der Iris. Häufig wird hierfür die Methode einer Kreiskantenerkennung angewendet. In
2
Biometrie und die Analyse digitalisierter Spuren
37
Abb. 2.4 Strukturen der Iris.
Äußerlich sind mehrere grobe Strukturen auf der Iris zu
erkennen. Der Pupillarsaum
(gelber Pfeil), welcher vom
Pigmentepithel gebildet wird,
die Iriskrause (grüner Pfeil),
welche durch den Verlauf von
Blutgefäßen entsteht und verschiedene Trabekel, die von
Krypten (blauer Pfeil) unterbrochen werden. Der innere
Teil der Iris wird auch als
Pupillarteil, der äußere als
Ziliarteil beschrieben
den meisten Fällen liegt jedoch, beeinflusst durch Wimpern und Augenlider, keine exakte Kreisform vor. John Daugman verwendet zur Lösung dieses Problems sogenannte
Integrodifferentialgleichungen [15] (s. Gl. 2.1). Dabei wird zunächst der Irismittelpunkt
bestimmt. Dies kann bereits im Schritt der Aufnahme erfolgen. Für die eigentliche Segmentierung werden im Speziellen verschiedene Übergänge, bedingt durch Helligkeitsunterschiede im Übergang von Pupille zu Iris, berücksichtigt (Abb. 2.5).
ˇ
ˇ
I
ˇ
@
max ˇˇG .r/
r;x0 ;y0 ˇ
@r
r;x0 ;y0
ˇ
ˇ
I.x; y/ ˇˇ
ds ˇ :
2 r
ˇ
(2.1)
Der Irismittelpunkt wird durch die Variablen X0 und y0 bestimmt. I.x; y/ beschreibt
das Augenbild in Abhängigkeit der Helligkeitsintensität und wird über die Kreisfläche
ds.r/ integriert. Mithilfe der partiellen Ableitung nach dem Radius r wir die größte Helligkeitsänderung ermittelt. Ein zu bewertender Übergang wird somit durch die maximale
Änderung beschrieben. Die Rauschreduktion wird durch eine Gaußkurve G beschrieben.
Mit der Bestimmung eines neuen Startpunktes wird dann eine neue Iteration ausgeführt.
Der Prozess einer Übergangsbestimmung endet, sobald die Änderung des Maximums
unter einen definierten Schwellwert fällt. Aus der Segmentierung resultiert dann der aktuelle Irismittelpunkt und die Radien. Bei der Lid-Kanten-Erkennung werden parabolische
Integrodifferentialgleichungen verwendet. Trotz der Komplexität überzeugen diese Operationen gerade durch deren Effizienz und Schnelligkeit [13].
Einflussfaktoren wie unterschiedlich scharfe Übergänge zwischen Sklera und Iris,
nichtzirkuläre Iriskanten sowie unterschiedlich große Pupillen und Sehwinkel können
eine Identifikation beeinträchtigen. Aus diesem Grund werden zur Repräsentation der
38
D. Labudde
Abb. 2.5 Ablauf der Iriserkennung modifiziert nach [15]
realen Konturen der Iris sogenannte „Active Contours“ genutzt. Im Algorithmus von
John Daugman wird dazu eine Fourier-Reihenentwicklung, anstelle einer Transformation, verwendet. Damit wird ein schnelles Vorgehen und eine Art Flexibilität der „Active
Contours“ erreicht:
N
1
X
2i k
r e N :
(2.2)
Ck D
D0
Aus M diskreten Fourier-Koeffizienten (Gl. 2.2 ) ergibt sich die Fourierreihe (Gl. 2.3) als
Approximation der inneren oder äußeren Iriskanten:
M 1
1 X
2i k
Ck e N :
R D
N
(2.3)
kD0
Zur Bestimmung der Iriskanten werden im Daugman-Algorithmus 16–17 Fourier
Koeffizienten für die inneren Kanten und 4–5 für die äußeren Kanten angewandt. Für
die Wimperndetektion wird eine Verteilung der Irispixel mithilfe eines Histogramms
erstellt. Sehr helle Pixel werden hierbei der Iris und dunkle Pixel den Wimpern zugeordnet. Durch einen spezifischen Schwellwert können Wimpern-zugehörige Pixel eliminiert
werden [15]. Für den anschließenden Schritt der Iris-Code-Erzeugung wird das zuvor
bearbeitete Bild in eine Polarkoordinatendarstellung überführt (s. Gl. 2.4) [15]:
I.x.r; /; y.r; // ! I.r; /
x.r; / D .1 r/xp . / C rxs . /
y.r; / D .1 r/yp . / C rys . /:
(2.4)
2
Biometrie und die Analyse digitalisierter Spuren
39
Nach der Transformation folgt eine Projektion der Irisregionen auf zweidimensionale
Quadratur-Gabor-Wellenpakete für die Extraktion von Phaseninformationen:
Z Z
hfRe;I mg D sgn
fRe;I mg
ei !.
0
/ .r0 /2 =˛2
e
e.
0
/2 =ˇ 2
dd :
(2.5)
Die Bestimmung des Phasors hfRe;I mg erfolgt nach der Gl. 2.5. Die Parameter ˛ und ˇ
geben die Größenparameter der 2D-Wavelets (0,15–1,2 mm) an. Die Wavelet-Frequenz
wird mit ! angegeben [15, 41]. Für jeden Phasor werden mithilfe von Quadranten komplexe Bits bestimmt. Dabei wird die Lage des Phasors ermittelt und Phasenkoordinaten
(real, imaginär) als Paar von Nullen und Einsen ausgegeben. Aus der Iristransformation
resultiert schließlich ein Iris-Code, bestehend aus 2048 Phasor-Bits bzw. 256 Bytes [15].
Den letzten Schritt der Iriserkennung bildet der bitweise Vergleich erzeugter Templates
über die Bestimmung der Hammingdistanz beider Iris-Codes (Gl. 2.6 [15]). Der XOROperator gibt bei nicht identischen Bits eine Eins und bei Übereinstimmung eine Null aus.
Störungen, die z. B. durch Reflexionen, Augenbrauen oder Augenlieder entstehen werden mit einer Und-Verknüpfung zwischen zwei Bitmustern ermittelt. Große Unterschiede
zwischen zwei Iris-Codes werden mit dem Wert 1 der Hamming-Distanz beschrieben.
Umgekehrt kennzeichnet ein Wert 0 eine Übereinstimmung zweier Codes. Im Allgemeinen würde das biometrische System ab 70 % Identität, d. h. einer Hamming-Distanz von
0,3, ein positives Ergebnis beim Abgleich von zwei Irismustern erbringen:
HD D
T
T
k .codeA ˝ codeB/ maskA maskB k
T
:
k maskA maskB k
(2.6)
Die Iriserkennung bietet zusammengefasst zahlreiche Vorteile, die sie als biometrisches
Merkmal auszeichnet. Ähnlich wie der Fingerabdruck besitzt das Irismuster ein ähnlich hohes Maß an Variabilität und Zufälligkeit der Textur. Ein großer Vorteil gegenüber
Fingerabdrucksystemen ist die berührungsfreie Aufnahmemethode der Iriserkennungssysteme. Es ist sogar möglich, aus einigen Metern Entfernung ein Augenbild aufzunehmen
und die Iris zu segmentieren. Somit kann eine Personenidentifizierung völlig unbemerkt
und ohne das Zutun einer Person erfolgen. Im Vergleich zu anderen biometrischen Systemen zeigt sich, dass bei der Iriserkennung die geringsten Fehlerraten vorliegen. Mit einer
FRR von 0,45 % und einer FAR von 0,0001 wird nur ein geringer Teil falsch identifiziert.
2.5 Fingerabdruckanalyse
2.5.1
Der Fingerabdruck als biometrisches Merkmal
Nach wie vor gilt ein gesicherter Fingerabdruck vor Gericht und im Ermittlungsverfahren als eines der anerkanntesten biometrischen Merkmale zur Personenidentifizierung.
40
D. Labudde
Zusammen mit der DNA-Analyse besitzt der Fingerabdruck vor Gericht ein hohen Beweiswert. Die Musterentstehung der Fingerabdruckmorphologie ist ein genetisch unabhängiger Prozess, d. h., notwendige Informationen sind genetisch nicht kodiert und werden nicht auf Nachfolgegenerationen weitervererbt. Das Hautleistenmuster ist bereits im
vierten Embryonalmonat vollständig ausgebildet und bleibt bis zum Tode erhalten. Der
Bereich, der sich mit der Charakterisierung von morphologischen Besonderheiten eines
Fingerabdruckes beschäftigt, wird als „Daktyloskopie“ bezeichnet. Egal ob klassische
Daktyloskopie oder digitale Auswertung der Spuren, die komplexe Wissenschaft trägt
eine ganz eigene Entwicklungsgeschichte, ein einzigartiges Klassifizierungssystem und
eine situationsungebundene Anwendung [23].
Bis zur Rechtsprechung im Jahr 1952, durch die der uneingeschränkte Beweiswert
der Daktyloskopie im Strafverfahren anerkannt wurde, erfolgte die Datenverarbeitung
und -sicherung eher über eine mittlerweile überholte Variante. Fingerabdrücke wurden
mit Tinte abgenommen, auf ein Zehnfingerblatt aufgebracht und die Ablage der Blätter
bzw. Recherche erfolgte in großen Karteischränken. In den 60er und 70er Jahren entwickelte sich das Verfahren in Richtung einer effizienten, datenbankgestützten Speicherung
der Fingerabdrücke, um den stetig wachsenden Datenbeständen gerecht zu werden. Einer
der wohl bedeutendsten Qualitätssprünge wurde mit der Einführung des automatisierten
Fingerabdruckidentifizierungssystems (AFIS), das im Jahr 1992 in Betrieb genommen
wurde, erzielt. Dadurch ergaben sich ganz neue Perspektiven der Datenspeicherung. Mit
der Implementierung der Software MetaMorpho vor wenigen Jahren können mittlerweile
auch Handflächenspuren digitalisiert und ausgewertet werden. Nach aktuellen Zahlen des
BKA werden monatlich mehr als 40.000 neue Fingerabdruckblätter erfasst. Die AFISDatenerfassung erfolgt teilautomatisiert. Jedes Grundmuster wird auch heutzutage noch
über das Expertenwissen eines Daktyloskopiespezialisten ausgewertet und über die Tastatur kodiert [12, 36].
Den höchsten Identifizierungswert bei der Fingerabdruckanalyse besitzen die auf der
Leistenhaut befindlichen Papillarlinien des Menschen. Jeder Mensch trägt auf der Leistenhaut individuelle Muster (Schleife, Bogen, Wirbel) und zahlreiche Besonderheiten bzw.
Linienunterbrechungen (Minutien), die sich von Finger zu Finger unterscheiden.
2.5.2
Technologien zur Aufnahme des Fingerabdrucks
In der IT-gestützten, automatisierten Form ist das digitale Fingerabdruckverfahren ein
biometrisches Konzept mit hoher Erkennungsleistung. Für den Vorgang der Fingerabdruckanalyse sind vier grundlegende Schritte notwendig.
1.
2.
3.
4.
Abtastung des Fingerabdrucks,
Bildgenerierung,
Merkmalsextraktion,
Matching.
2
Biometrie und die Analyse digitalisierter Spuren
41
Abtastung des Fingerabdrucks
Bei der Erfassung des Fingerabdrucks wird zwischen Online- und Offline-Systemen unterschieden. Mittels der Abdruckvariante auf Papier wird ein Abbild durch gleichmäßiges
Abrollen des Fingers mithilfe von Tinte gewonnen (Offline-System). Der Finger wird von
einer Lageseite zur anderen abgerollt, um die vollständige Linienform zu erfassen. Anschließend kann der Abdruck fotografiert oder gescannt werden. Nachteile der Methode
sind auftretende Verzerrungen des Bildes, die beim Auf- und Abdrücken des Fingers entstehen, und ein langsamer Verfahrensablauf. Für ein teilautomatisiertes Kontrollsystem
zur Überprüfung von Zutrittsberechtigungen ist die Aufnahme auf Papier aus diesen Gründen nicht geeignet. Für die Erfassung von Lebendabdrücken wird der Finger selbst durch
leichtes Auflegen auf einen Sensor abgetastet und mit dem Datenverarbeitungssystem verbunden (Online-System). Dadurch ist der Ausschnitt des Fingerabdruckes kleiner als bei
der Erfassung auf Papier. Damit können die besonderen Gegebenheiten der Finger wie die
verschiedenen Hauttypen, Beschädigungen, Trockenheit oder Feuchtigkeit toleriert werden.
Mit der Einführung neuartiger sensorbasierter Verfahren zur Abtastung und Aufnahme
von Fingerabdrücken vor über 30 Jahren entwickelte sich ein breites Feld an zugrundeliegenden Technologien für den Einsatz in der forensischen Praxis. Die zur Abtastung
üblicherweise angewandten Technologien lassen sich in die Kategorien optische Sensoren, Siliziumsensoren und Ultraschallwellensensoren einordnen.
Optische Sensoren
Häufig kommen optische Sensoren, bei denen der Finger über einen Scanner oder eine
Kamera aufgenommen wird, zum Einsatz. Ein Beispiel für einen optischen Sensor ist in
Abb. 2.6 dargestellt. Zunächst wird der Finger auf eine Ebene bzw. eine Glasfläche (z. B.
Glasprisma, Fiberglas) aufgebracht und das ausgehende Licht beim Auflegen des Fingers
zu einem CCD-Sensor geleitet. Damit eine gute Qualität des Abbildes gewährleistet ist,
sollten die Oberflächen regelmäßig von zurückgebliebenen Schweiß- oder Dreckspuren
gereinigt werden. Im Allgemeinen sind hier Aufnahmen mit bis zu 500 dpi möglich. Ein
gravierender Nachteil dieser Technologie ist, dass sie durch Fingerprothesen oder andere
Imitate relativ einfach „auszutricksen“ ist [34].
Siliziumsensoren
Die Abtastung mittels Siliziumsensoren beruht auf der Messung physikalischer Größen,
wie z. B. Wärme, elektrische Feldstärke oder Kapazität. Der Finger wird nicht wie bei
den optischen Sensoren auf eine Glasprismafläche aufgebracht, sondern auf eine dünne
Schicht, über welche die entsprechende physikalische Größe gemessen wird. Im Aufbau
des Sensors werden mehrere Sensoruntereinheiten, in Form zweidimensionaler Arrays,
unterschieden. Im resultierenden Bild entspricht jede Sensoruntereinheit einem Pixel. Von
Vorteil sind die geringe Sensorgröße und die niedrigen Anschaffungskosten. Allerdings ist
die Schutzschicht sehr empfindlich gegenüber äußeren Einflüssen. Eine elektrostatische
Entladung des Fingers reicht schon aus, um den Sensor außer Betrieb zu setzen. Mit einer
42
D. Labudde
air
ridges and valleys
contact
gass prism
B
lens
A
light
optical path
CCD or CMOS
Abb. 2.6 Beispiel für einen optischen Sensor. Bestandteile des FTIR-Sensors (Frustrated Total
Internal Reflection) sind: eine Lichtquelle, ein Glasprisma, eine Linse und ein CMOS- oder CCDSensor. Durch das direkte Aufbringen des Fingers auf das Glasprisma haben die Grate direkten
Kontakt mit dem Prisma. Zwischen den Tälern und dem Prisma ist hingegen Luft. Das auf das
Prisma einseitig gesendete Licht wird an den Tälern reflektiert und an den Graten absorbiert bzw.
zufällig gestreut. Reflektierte Strahlen werden auf der anderen Seite durch eine Linse auf ein CMOSoder CCD-Sensor zur Aufnahme gebündelt [34]
robusteren Schutzschicht könnte dieser Effekt umgangen werden. Jedoch würde somit die
Erkennungssensitivität des Fingerabdruckes herabgesetzt werden [34].
Ultraschallwellensensoren
Vergleichsweise neuartig im Feld der Fingerabdruckerkennung ist der Einsatz von Ultraschallwellsensoren. Gemessen wird hierbei die Distanz zur Fingeroberfläche mithilfe
von akustischen Ultraschallwellen, die vom Finger reflektiert werden ohne einen direkten
Kontakt von Finger und Sensor. Durch Reflexion bzw. Absorption kann somit eine epidermale Mustererkennung im Abdruck erfolgen. Von Vorteil gegenüber den anderen beiden
vorgestellten Technologien ist, dass die ausgesendeten Wellen unbeeindruckt von anhaftenden Schmutzpartikeln am Finger sind. Damit ist der Sensor stabil gegenüber äußeren
Einflüssen. Allerdings ist die Praxistauglichkeit durch die Größe der Geräte und einen
hohen Kostenfaktor gegenwärtig noch nicht ausgereift [43].
Bildgenerierung
Infolge einer sensorbasierten Aufnahme eines Fingerabdruckes resultiert ein Graustufenbild des individuellen Papillarlinienmusters. Dunkle Linien repräsentieren Grate und helle
Täler. Wie gut das Endresultat der Aufnahme ist, hängt sowohl von technischen Details
(z. B. Bildauflösung, mind. 500 dpi), von personenabhängigen Einflussfaktoren (z. B. ausgeübter Druck oder Platzierung des Fingers) als auch von hautabhängigen Gegebenheiten
(z. B. sehr trockene oder sehr feucht Haut) ab (Abb. 2.7). Die Erstellung eines Graustufenbildes kann über zwei Aufnahmemodi erfolgen. Im Livescan-Modus wird, wie oben
beschrieben, der Abdruck über ein sensorbasiertes Verfahren detektiert. Hingegen wird
2
Biometrie und die Analyse digitalisierter Spuren
43
Abb. 2.7 Einfluss der Hautbeschaffenheit auf die Qualität des Bildes. a Fingerabdruck guter Qualität; b trockene Haut; c sehr feuchter Hautabdruck; d i. A. schlechter Fingerabdruck [34]
Abb. 2.8 Singularitäten und
Kern [34]
loop
whorl
delta
core
beim Offline-Modus ein latenter Fingerabdruck unabhängig von einem Sensor, z. B. über
fotografische Aufnahmen, erzeugt, welche dann später über einen Scanner digitalisiert
werden können [34].
Merkmalsextraktion
Die Klassifikation von Eigenschaften der Gratbestandteile (engl. ridges) eines Fingerabdruckes erfolgt hierarchisch über drei Ebenen. In der ersten Ebene werden topologische Singularitäten (Delta, Schleife, Wirbel) (Abb. 2.8) extrahiert [34]. Diese Singularitäten werden wiederum zur Klassifikation des Abdruckes in das zugehörige Grundmuster
(Abb. 2.9) genutzt. Die Extraktion von Singularitäten und dem Kern dient der Indexierung und Klassifizierung des Fingerbildes während der algorithmischen Verarbeitung des
Bildes [34].
Auf der zweiten Ebene werden weitere Eigenschaften, sogenannte Minutien (lat. minutus = „Kleinigkeit“), im individuellen Muster zur Templategenerierung gesucht. Diese
kleinen Besonderheiten im Papillarlininenverlauf entstehen durch diverse Formen von Un-
44
D. Labudde
Left loop
Right loop
Whorl
Arch
Tented Arch
Abb. 2.9 Grundmusterklassen nach Henry (1990) [34]
Ridge
ending
Bifurcation
Lake
Independent
ridge
Point or
Island
Spur
Crossover
Abb. 2.10 Häufig vorkommende Minutienarten [34]
Abb. 2.11 Minutienkoordination. Eine Gratendung mit deren
Koordinaten Œx0 ; y0 . ist der
Winkel, der durch die Minutientangente mit der x-Achse
gebildet wird [34]
terbrechungen der Grate (Abb. 2.10). Zu Ehren von Francis Galton, der 1892 erstmals eine
Klassifikationsschema für Minutien präsentierte, werden die Merkmale häufig auch „Galton details“ genannt [16, 34]. Häufig werden zur Lokalisation und näheren Beschreibung
der Minutie im Graustufenbild die Position sowie ein ungefährer Tangentenwinkel im Bild
angegeben (Abb. 2.11) [34].
Weitere Informationen zu den Graten, wie Breite, Form und Kontur, aber auch die
Anordnung der Poren können auf der dritten Ebene der Merkmalsextraktion erhalten werden [34].
Orientierungsbilderzeugung
Grundlage der später durchzuführenden Minutienbestimmung ist die Generierung eines
Orientierungsbildes aus dem originalen Fingerbild. Bei diesem Vorgehen wird zunächst
2
Biometrie und die Analyse digitalisierter Spuren
45
j
rij
i
θij
0 ≤ θij < 180°
Abb. 2.12 Koordinatenvergabe und Blockorientierung zur Erzeugung eines Orientierungsbildes.
Der Block Œi; j aus einer 16 16-Matrix besitzt die lokale Orientierung qij und den Zuverlässigkeitswert rij . Jedes Element bezeichnet die lokale Ausrichtung der Papillarlininen. Die lokale
Orientierung ist durch die Auslenkung der Strecke zur x-Achse dargestellt und die Größe des Zuverlässigkeitswertes durch die Länge dieser Strecke [34]
das aufgenommene Muster (Fingerabdruck) in regelmäßige Blöcke unterteilt. Dabei ist
es möglich, dass ein Block aus einem einzigen Pixel besteht. Anschließend erfolgt die
Beschreibung jedes Blockes der Matrix über die Orientierung eines Grates, indem eine lokale Orientierungsangabe durch den Winkel zwischen Grattangente und der horizontalen
x-Achse im Muster abgebildet wird [20]. Für die Berechnung eines Orientierungsbildes
aus dem Fingerabdruck können verschiedene mathematische Verfahren, wie der projektionsbasierte Ansatz nach Stock und Swonger (1969) oder die Berechnung der Gratgradienten [39, 40, 45] verwendet werden.
Durch mögliche Bildungenauigkeiten, beispielsweise ein Bildrauschen, muss die jeweilig bestimmte Blockorientierung auf Zuverlässigkeit geprüft werden. Hierzu wird das
Phänomen der „Glattheit“ des Fingerabdruckes bewertet, d. h., bei geringem Bildrauschen
verändert sich die lokale Orientierung direkt benachbarter Blöcke kaum. Verallgemeinert
beschreibt das Zuverlässigkeitsmaß die Übereinstimmung benachbarter Orientierungen
(Abb. 2.12) [34].
Aus der Gesamtheit aller Orientierungen der Teilblöcke ergibt sich dann das Orientierungsbild, wie in Abb. 2.13 zu erkennen [34].
Frequenzbilderzeugung
Nach der Erzeugung des Orientierungsbildes folgt die Erstellung eines Frequenzbildes,
über welches die lokale Dichte der Grate bestimmt wird. Auf Grundlage der Dichteinformationen können sowohl eine Menge an Fingerabdrücken als auch Fingerabdruckregionen
voneinander unterschieden werden. Für jeden bereits existierenden Block im Orientierungsbild Œxi ; yi wird ein weiteres Segment gewählt, welches orthogonal zum lokalen
Orientierungsmittelpunkt des Blocks zentriert ist. Daraufhin wird die Anzahl der segment-
46
D. Labudde
Abb. 2.13 Orientierungsbild. Von dem Fingerbild (a) wurde das Orientierungsbild (b) erzeugt [34]
Abb. 2.14 Frequenzbild von zwei Fingerabdrücken. Helle Bereiche bzw. Blöcke lassen hohe Frequenzwerte erkennen. Hingegen kennzeichnen dunkle Blöcke niedrige Frequenzbereiche [33, 34]
schneidenden Grate ausgezählt. Im Bild wird ein Grat als Graustufenspitze angenommenen. Nach der Berechnung der Frequenzwerte werden die unterschiedlichen Gratdichten
übergreifend in Form von Grauabstufungen dargestellt (Abb. 2.14).
Segmentierung
Der Schritt der Segmentierung beschreibt verallgemeinert die Trennung des Fingerabdruckmusters (Vordergrund) vom Bildhintergrund, um die Extraktion von Hintergundinformationen (z. B. Bildrauschen) zu vermeiden. Eine Variante der Segmentierung stellt
die Erzeugung des Orientierungsbildes dar, wobei von einer sog. „Unorientiertheit“ des
2
Biometrie und die Analyse digitalisierter Spuren
47
Abb. 2.15 Methoden der Segmentierung nach Ratha et al. [40]. a Originalbild; b Varianzfeld; c aus
b abgeleitetes qualitatives Bild: ein Wert („gut“, „mittel“, „schlecht“ oder „Hintergrund“) für die
Qualität wird in Abhängigkeit der Varianz jedem Block zugeordnet; d segmentiertes Bild [34]
Hintergrundes ausgegangen wird. Der Abdruck an sich ist hierbei stark orientiert (siehe
Abb. 2.15). Mit problembasierten Lernmethoden für die Segmentation z. B. nach Bazen
and Gerez [3], Chen et al. [10] und Zhu et al. [51] kann eine detailliertere Segmentierung
im Vergleich zu z. B. Schwellwert-basierten Methoden erfolgen [3, 10, 51].
Bestimmung von Singularitäten und dem Kern
Wie bereits in der Einleitung zum Schritt der Merkmalsextraktion beschrieben, werden
sowohl der Kern als auch die Singularitäten zur Indexierung und Klassifizierung des Fingerabdruckes benötigt. Ein Verfahren zur Bestimmung dieser beiden Variablen ist das
Poincaré-Indexierungsverfahren nach Kawagoe und Tojo [28]. Der Poincaré Index wird
wie in Gl. 2.7 dargestellt berechnet, wobei dk , k D 0; : : : ; 7, die acht umliegenden Blöcke
von Œi; j sind und jeweils die Blöcke dk , d.k1/ mod 8 benachbart sind.
P .i; j / D
X
kD0;:::;7
angle.dk ; d.k1/ mod 8 /
(2.7)
48
D. Labudde
Abb. 2.16 Beispielhafte Berechnung des Poincaré-Index in der 8er-Nachbarschaft von Punkten die
zu (v. l. n. r.) einer Wirbel-, Schleife-, und Delta-Singularität gehören [34]
Mit der Funktion angle wird der Unterschied zwischen den Winkeln beider Blockorientierungen beschrieben. Bei der Erzeugung gerichteter Orientierungen wird beim ersten
Block eine der beiden möglichen Richtungen gewählt. Die direkte Nachbarschaft wird
dann immer mithilfe des kleinsten Winkelunterschiedes bestimmt. Der Index wird dann
gemäß Gl. 2.8 interpretiert (vgl. Abb. 2.16) [34].
8
ˆ
0ı
ˆ
ˆ
ˆ
ˆ
<360ı
PG;C .i; j / D
ˆ
ˆ180ı
ˆ
ˆ
:̂
180ı
if [i,j] does not belong to any singular region
if [i,j] belongs to a whorl type singular region
(2.8)
if [i,j] belongs to a loop type singular region
if [i,j] belongs to a delta type singular region
Minutienbestimmung
Die Bestimmung von Minutien kann über zwei Methoden erfolgen. Zum einen kann dies
über das erzeugte Graustufenbild, zum anderen über ein Binärbild geschehen. Beim Einsatz des Graustufenbildes wird, ausgehend von einem lokalen Punkt, über die Grate iteriert
und ein neues Bild aufgezeichnet. Vom lokalen Punkt wird in Richtung der lokalen Orientierung eines Zwischenpunktes gegangen. Daraufhin wird eine orthogonal zur Orientierung
gelegene Strecke mit dem Zwischenpunkt als Ursprung betrachtet. Auf dieser Strecke wird
der höchstgelegene Punkt, welcher einen neuen Punkt darstellt, gesucht. Die Schritte werden bis zu einer bereits bekannten Gratmündung oder dem Gratende wiederholt [34].
Zunächst muss das Graustufenbild in ein Schwarzweißbild, durch Umwandlung der Pixel entsprechend eines Grau-Schwellwertes, transformiert werden. Im Ergebnis wird ein
Binärbild erzeugt. Die Gratdicke wird im Binärbild auf die Breite eines Pixels normiert.
Mögliche Artefakte, die hierbei entstehen und zu einer fälschlichen Identifikation führen können, werden aus dem Bild gefiltert, um die tatsächlichen Minutien bestimmen zu
können. (Abb. 2.17) [32].
2
Biometrie und die Analyse digitalisierter Spuren
49
Abb. 2.17 Minutiendetektion nach Maio und Maltoni [34]
Die Minutien können z. B. anhand der „crossing number“ cn.p/ eines Pixels p bestimmt werden (Gl. 2.9).
cn.p/ D
1 X
jval.pi
2 i D1;:::;8
mod 8 /
val.pi 1 /j
(2.9)
Wobei pi , die acht Nachbarpixel von p und jeweils pi mod 8 , pi 1 benachbart sind. Der
Farbwert des Pixels wird über die Funktion val angegeben (0 D weiß und 1 D schwarz).
Generalisiert beschreibt cn.p/ die in p mündende Anzahl der Grate. Unechte Minutien,
die in ihrer Struktur von tatsächlichen abweichen, werden in einem zusätzlichen Nachverarbeitungsschritt über die Glattheit des Fingers herausgefiltert.
2.5.3
Matching
Für den Vergleich zweier Fingerabdrücke (Input vs. Template) existieren drei Verfahren.
Korrelationsverfahren: Bei diesem Verfahren werden die Abdrücke über einen Vergleich der Pixel miteinander korreliert. Die Bilder werden hierbei in unterschiedlichen
Positionen miteinander verglichen, um Fehlplatzierungen zu umgehen.
Minutienbasierte Verfahren: Das minutienbasierte Verfahren ist eines der etabliertesten
Matching-Verfahren. Die Fingerabdrücke werden hier anhand der Minutienlage und
Orientierung miteinander verglichen.
Nichtminutienbasierte Verfahren: Zum Abgleich zweier Fingerabdrücke werden hierbei Gratdichte, Orientierung und Gratform gegenübergestellt. Das Verfahren ist besonders für die Auswertung qualitativ geringer Abdrücke geeignet.
Im Folgenden wird beispielhaft die Funktionsweise minutienbasierter Verfahren im Überblick dargestellt. Beide Abdrücke – Template- und Inputfingerabdrücke – lassen sich
50
D. Labudde
Abb. 2.18 Matchende Minutien sind von grau ausgefüllten
Kreisen umgeben. Hier liegen
räumliche und Richtungsdifferenz unter den Toleranzwerten.
Für alle übrigen Inputminutien gibt es keine matchende
Templateminutie [34]
vektoriell als T D .m1 ; m2 ; : : : ; mm / und I D .m01 ; m02 ; : : : ; m0n / beschreiben. Ein zugehöriger Vektor besitzt demzufolge eine beliebige Anzahl Minutien mi , bzw. mi Minutien
werden als Tripel der beiden Ortskoordinaten x und y sowie ihrer Ausrichtung (mi D
.xi ; yi ; i /; i D 1::mI mj0 D .xj0 ; yj0 ; j0 /; j D 1::n) beschrieben. Die räumliche Differenz sd (spatial difference) und die Richtungsdifferenz dd (direction difference) zweier
Minutien werden gemäß Gl. 2.10 definiert.
sd.mj0 ; mi / D
q
.xj0 xi /2 C .yj0 yi /2 r0
dd.mj0 ; mi / D min.j
0
j
i j; 360
ı
j
0
j
i j/
(2.10)
0
r0 und 0 sind die jeweiligen Toleranzwerte. Liegen räumliche und Richtungsdifferenz
unter diesem Schwellwert bzw. den Toleranzwertgrenzen, kann von matchenden Minutien
ausgegangen werden. In Abb. 2.18 ist der Richtungsabgleich von Minutien eines Inputfingerabdruckes mit den Minutien eines Templatefingerabdruckes dargestellt. Hier sind
Minutien des Inputabdruckes mit x und die des Templates mit o bezeichnet. Die Kreise
entsprechen der maximalen Entfernung, also dem Toleranzwert r0 . Die Pfeile stellen die
Ausrichtung der Minutien dar.
Damit die Anzahl an matchenden Minutien zwischen Input- und Template eruiert werden kann, müssen auf die Orts- und Richtungsparameter des Inputs verschiedene geometrische Transformationen durchgeführt werden, die eine maximale Anzahl matchender
Minutien erlaubt. Dies ist zwingend, aufgrund von verschiedenen Einflussfaktoren, notwendig. So spielt z. B. die Variationsbreite bei Positionierung und Rotation, im Schritt
der Fingerabdruckaufnahme, eine große Rolle. Es ist fast unmöglich, den Finger bei jeder Aufnahme identisch auf dem Sensorsystem zu positionieren, wodurch der eigentliche
Erfassungsbereich des Abdruckes stark variiert. Des Weiteren kann es durch einen unterschiedlich ausgeübten Druck zu nichtlinearen Verzerrungen in der Aufnahme kommen.
Ebenfalls können die im Schritt der Merkmalsextraktion entstandenen und möglicherweise nicht erkannten Artefakte zu einer Fehlinterpretation führen. Daher ist eine Qualitätsprüfung des Abdruckes während des Enrollments unerlässlich, wodurch bereit im Voraus
2
Biometrie und die Analyse digitalisierter Spuren
51
die genannten Einflussfaktoren beseitigt werden können. Für die geometrische Transformation existieren mehrere Möglichkeiten:
Deplatzierung der Koordinaten x und y,
Skalierung,
verzerrungstolerante Transformation,
Rotation der Ausrichtung ,
jede beliebige affine Transformation.
Die Frage nach dem „besten“ Matchingalgorithmus kann nur schwer beantwortet werden. Die Perfomance hängt von vielen Faktoren, wie Genauigkeit (z. B. FMR, FNMR),
Effizienz (Enrollment-, Verifikationszeit), Skalierbarkeit zur 1 W N -Identifikation und
Templategröße, ab. Des Weiteren spielt für die Entscheidung und damit auch für die
Gewichtung der einzelnen Performanzmaße, natürlich das jeweilige Einsatzgebiet eine
herausragende Rolle.
Am Beispiel des individuellen Papillarleistenmusters, welches sich nach der Digitalisierung als Papillarlinien-Muster darstellt, kann das Prinzip der Abhängigkeit des Informationsgehaltes eines biometrischen Merkmals von der Verwendung von Daten aus
unterschiedlichen Ebenen sehr gut nachvollzogen werden. Die erste Ebene der Information stellen die Grundmuster (Schleife, Bogen, Wirbel) im Papillarlinienmuster dar. Der
Informationsgehalt wird deutlich durch die Hinzunahme der anatomischen Merkmale auf
der zweiten Ebene (Minutien: eingelagerte Linie, Gabelungen, Auge oder Insel) sowie
durch die Lage und Form derer zueinander erhöht. Eine dritte Ebene bilden die sogenannten Erscheinungen, Zwischenlinien, Poren, Kantenverläufe und Feinstrukturen von Falten,
Furchen oder Narben. Durch die Verbesserung der Aufnahmetechniken im Prozess der
Digitalisierung ist der Informationsgehalt dieser Daten in der Kombination deutlich gestiegen. Eine vierte Ebene können chemische Komponenten darstellen, welche sich im
Papillarleistenmuster angereichert haben. Ein solcher „chemischer Fingerabdruck“ verrät den Ermittlern nicht nur die Identität des Täters (aus der Analyse der ersten drei
Ebenen), sondern auch, was er zuletzt in den Fingern hatte. Durch ein Analyseverfahren lassen sich Spuren von Drogen, Sprengstoff oder bestimmten Stoffwechselprodukten
des Täters direkt nachweisen. Das Analyseverfahren ist die Desorptions-ElektrosprayIonisations-Massenspektrometrie (Desi-MR). Aus den Daten wird dann der „chemische
Fingerabdruck“ erzeugt und liefert zusätzlich ein klassisches Fingerabdruckbild, welches
mit herkömmlich gespeicherten Dateien verglichen werden kann. Durch neuartige Methoden kann auch das feuchte Medium der Fingerbeeren analysiert werden. Beispiele dafür
sind:
Zusammensetzung [18],
Altersbestimmung [17],
Visualisierung [46],
Geschlechtsbestimmung [1].
52
D. Labudde
2.6 Ausgewählte Forensische Datenbanken
Der Übergang von einem biometrischen Verfahren zu einem funktionsfähigen und den
Anforderungen entsprechenden biometrischen System wird durch die Suche und den Vergleich mit in Datenbanken abgelegten Datensätzen erst möglich. Nachfolgend wird eine
Auswahl an gebräuchlichen Datenbanken gezeigt. In der Regel besitzen Strafverfolgungsbehörden interne, der Öffentlichkeit unzugängliche Datenbanken. Das beim Bundeskriminalamt (BKA) betriebene elektronische Informationssystem der Polizei (INPOL) dient als
informationstechnisches Verbundsystem von Bund und Ländern. Zugriffsberechtigt sind
neben dem Bundeskriminalamt selbst die Landespolizeidienststellen, die Bundespolizei
und die Zollbehörden. INPOL besteht zum einen aus Personen- und Sachfahndungsdateien2 , zum anderen ist es in zahlreiche Teildatenbanken aufgeteilt, die jeweils eigene Errichtungsanordnungen, d. h. Verfahrensverzeichnisse, die u. a. die Erhebung und Weiterverwendung personenbezogener Daten regeln, besitzen. Beispiele solcher Teildatenbanken
sind die DNA-Analysedatei (DAD) und das Analysesystem zur Serienzusammenführung
bei Gewaltverbrechen (ViCLAS).
2.6.1 DNA-Analysedatei (DAD)
Die DNA-Analysedatei [24] ist eine zur Speicherung von DNA-Profilen eingerichtete Datenbank, die seit dem 17. April 1998 vom Bundeskriminalamt (BKA) betrieben wird. In
der DAD werden durch die DNA-Analyse ermittelte genetische Fingerabdrücke von bekannten Personen (sogenannte Personendatensätze), sowie Tatortspuren von unbekannten
Personen (sogenannte Spurendatensätze) eingestellt und abgeglichen. Durch die Vernetzung und den automatisierten Abgleich der DNA-Datenbanken vieler europäischer Staaten können zudem wertvolle Ermittlungshinweise bei grenzüberschreitender Kriminalität
erhalten werden. Die DAD umfasste mit Ablauf des II. Quartals 2015 insgesamt 1.111.833
Datensätze, die sich aus 839.875 Personendatensätzen und 271.958 Spurendatensätzen zusammensetzen. Seit Errichtung der Datei wurden 198.644 Treffer erzielt.3
2.6.2
Violent Crime Linkage Analysis System (ViCLAS)
ViCLAS [26, 35] ist ein Analysesystem zur Serienzusammenführung bei Gewaltverbrechen. Es handelt sich also insbesondere um eine Falldatenbank, die speziell für den
Bereich der besonders schwerwiegenden Gewaltkriminalität entwickelt wurde und bei
Tötungs- und Sexualdelikten zum Einsatz kommt, bei denen keine familiären oder sons2
Stand 2014: 382.597 Festnahmeersuchen, 181.794 Ausschreibungen zur Aufenthaltsermittlung
und 10,6 Mio. gelistete Gegenstände.
3
nähere Informationen: http://www.bka.de/DE/ThemenABisZ/DnaAnalyse/Statistik/dnaStatistik__
node.html?__nnn=true
2
Biometrie und die Analyse digitalisierter Spuren
53
tigen bekanntschaftlichen Vorbeziehungen zwischen Opfer und Täter bestanden. Die
ViCLAS-Datenbank basiert auf der, in den 1980er Jahren durch das FBI entwickelten,
Falldatei „Violent Criminal Apprehension Program (ViCAP)“ und wird durch die „Royal Canadian Mounted Police (RCMP)“ verwaltet. ViCLAS wird neben Kanada in zehn
weiteren Staaten, wie Deutschland, Dänemark und Großbritannien, weltweit eingesetzt.
Die Datenbank ist dazu geeignet Rückfall-, Wiederholungs- und Serientäter anhand ihrer
Taten (Begehungsmuster) zu erkennen sowie Einzeltaten schnellstmöglich zusammenzuführen und bezüglich Übereinstimmungen zu anderen Fällen zu prüfen. In ViCLAS
werden ausführliche Fallinformationen zu Tötungsdelikten, sexuellen Gewaltdelikten,
Vermisstenfällen und verdächtigem Ansprechen von Kindern und Jugendlichen erfasst.4
Gerade mit dem Blick auf den CSI-Effekt ist es vorstellbar, dass alle besprochenen biometrischen Merkmale und die daraus extrahierten biometrischen Daten gespeichert und
verglichen werden können. Geeignete Datenbanktechnologien stehen Entwicklern und
Nutzern im ausreichenden Maße zur Verfügung.
2.6.3 Integrated Ballistic Identification System (IBIS)
Die IBIS-Datenbank [6, 47] beinhaltet Informationen über Geschoss- und Patronenhülsen
sowie Schusswaffen, die an Tatorten und von Tatverdächtigen sichergestellt werden konnten. Das Ziel dieser forensischen Datenbank liegt in der Beschleunigung des herkömmlichen labor- und zeitintensiven Vergleichsvorganges von ballistischen Informationen in
polizeilichen Ermittlungen. Ein wesentlicher Vorteil des IBIS liegt darin, dass Beweismittel einer laufenden Untersuchung mit ballistischen Informationen aus vorangegangenen
Ermittlungen verglichen werden können, um dadurch beispielsweise Schusswaffen zu
identifizieren, die bei mehreren Straftaten verwendet wurden. Um dies zu realisieren werden beispielsweise Aufnahmen von an einem Tatort asservierten Patronenhülsen in die
Datenbank importiert und mit enthaltenen Daten abgeglichen. Im Falle eines Matches erfolgt dann eine zusätzliche manuelle mikroskopische Überprüfung und Auswertung der
Daten durch einen Ballistik-Experten.5
2.6.4
Paint Data Query (PDQ)
Bei der PDQ-Datenbank [4, 8, 11] handelt es sich um eine Ansammlung chemischer
Zusammensetzungen von Farben und Lacken in- und ausländischer Automobilhersteller.
Die PDQ ist mit über 74.000 gespeicherten individuellen Farbschichten von Fahrzeugen
die größte internationale Datenbank, die Informationen dieser Art beinhaltet und Rück4
nähere
Informationen:
http://www.bka.de/DE/ThemenABisZ/OperativeFallanalyse/Viclas/
viclas__node.html?__nnn=true
5
nähere Informationen: https://www.atf.gov/
54
D. Labudde
schlüsse auf die Marke, das Model und Fabrikationsjahr eines Fahrzeugs ermöglicht. Die
Datenbank wird von forensischen Wissenschaftler aus einer Vielzahl von Ländern, wie
Kanada, USA, Australien, Afrika und Deutschland verwendet. Verwaltet wird die PDQ
von der „Royal Canadian Mounted Police“, der nationalen Polizei Kanadas. Die Informationen über die gespeicherten Lacke und Farben werden zum einen direkt von den
Herstellern der Fahrzeuge bezogen, zum anderen aber auch von Fahrzeugen von Schrottplätzen und Karosseriewerkstätten. Typische kriminalistisch relevante Sachverhalte, in
denen die PDQ Anwendung findet, sind Fahrerfluchten mit Personen- bzw. Sachschäden.
Eine zur PDQ ähnliche Datenbank ist die „National Automotive Paint File“ Datenbank
des FBIs.6
2.6.5 SoleMate
„SoleMate“ ist eine kommerzielle Datenbank, die Informationen über den Hersteller, das
Produktionsjahr und teilweise Fotoaufnahmen von mehr als 30.000 Sport-, Freizeit- und
Arbeitsschuhen enthält. Die Datenbank findet Anwendung, um Schuhabdrücke an Tatorten hinsichtlich einer bestimmten Marke zu identifizieren und somit möglichen Tatverdächtigen oder Personen, die sich am Tatort befundenen haben, zuordnen zu können.
„SoleMate“ kann als Stand-Alone oder mit SICAR, dem „Shoe Print Identification and
Casework Management System“, verwendet werden. Um einen asservierten Schuhabdruck mit in der Datenbank abgelegten Daten vergleichen zu können, werden typische
Features, wie Kreise, Rauten und Kurven, aus dem Schuhabdruck extrahiert. Die erhaltenen Muster werden als Grundlage für einen Vergleich verwendet.7
2.6.6 TreadMate
Bei „TreadMate“ handelt es sich um eine ähnliche Datenbank wie SoleMate mit dem Unterschied, dass Informationen zu Fahrzeugreifen gespeichert sind. Die Datenbank enthält
mehr als 5.000 Sommer-, Winter- und Allwetterreifen. Der Vergleich erfolgt ebenfalls
über extrahierte Features und Matchingalgorithmen.8
2.6.7 Automatisches Fingerabdruckidentifizierungssystem (AFIS)
Bei AFIS [29, 30] handelt es sich um eine in Deutschland seit dem Jahr 1993 genutzte
Datenbank über Fingerabdrücke. Die Datenbank basiert auf der Kodierung sogenannter
6
nähere Informationen: http://www.rcmp-grc.gc.ca/index.shtm
nähere Informationen: http://www.fosterfreeman.com/index.php/trace-evidence/357-sicar-6solemate-2
8
nähere Informationen: http://www.fosterfreeman.com/index.php/component/content/article/20products/shoe-print-identification/119-treadmate
7
Literatur
55
Minutien, wie die Gabelung einer Papillarleiste oder der Beginn bzw. das Ende einer Papillarleiste. Nach dem Einscannen und der Digitalisierung der Fingerabdrücke ermöglicht
AFIS eine automatische Featureberechnung basierend auf den Minuzien und den Abgleich
mit in der Datenbank bereits hinterlegten Fingerabdrücken. Zurzeit umfasst AFIS ca.
2.800.000 Fingerabruckblätter, ca. 1.900.000 Handflächenabdrücke und ca. 400.000 offene (ungelöste) Spuren. Durchschnittlich werden pro Jahr etwa 350.000 Fingerabdruckblätter, ca. 200.000 handflächenpaare und ca. 180.000 Spuren bearbeitet. Die Zahl der
Identifizierungen pro Jahr liegt bei ca. 20.000 Personen- und ca. 24.000 Spurenidentifizierungen.
2.6.8 Eurodac-System
Das Eurodac-System [7, 44] dient Mitgliedstaaten der Europäischen Union seit dem Jahr
2000 zur Identifizierung von Asylbewerbern und Personen, die beim illegalen Überschreiten einer EU-Außengrenze aufgegriffen wurden. Die Grundlage bilden unter anderem
wie bei AFIS Fingerabdrücke der jeweiligen Personen. Bei Aufgreifen eines Verdächtigen kann überprüft werden, ob dieser in einem anderen EU-Mitgliedsstaat Asyl beantragt
hat oder womöglich bereits zum wiederholten Male illegal eingereist ist, d. h., es soll
verhindert werden, dass Asylbewerber in mehreren Mitgliedsstaaten zeitgleich mehrere
Asylverfahren betreiben können. Neben Fingerabdrücken werden in der Datenbank zusätzliche Informationen, wie Geschlecht der Person, Herkunftsland und der Zeitpunkt der
Abnahme der Fingerabdrücke, gespeichert.
Literatur
1. Badawi, A.M., Mahfouz, M., Tadross, R., Jantz, R.: Fingerprint-based gender classification. In:
IPCV, S. 41–46. Citeseer (2006)
2. Bashir, M., Scharfenberg, G., Kempf, J.: Person authentication by handwriting in air using a
biometric smart pen device. BIOSIG 191, 219–226 (2011)
3. Bazen, A.M., Gerez, S.H.: Segmentation of fingerprint images. In: Proc. Workshop on Circuits
Systems and Signal Processing (ProRISC 2001), Bd. 276280. Citeseer (2001)
4. Bowen, R., Schneider, J.: Forensic databases: paint, shoe prints, and beyond. NIJ Journal 258,
34–38 (2007)
5. Bowyer, K.W., Hollingsworth, K.P., Flynn, P.J.: A survey of iris biometrics research: 2008–
2010. In: Handbook of iris recognition, S. 15–54. Springer (2013)
6. Brinck, T.B.: Comparing the Performance of IBIS and BulletTRAX-3D Technology Using
Bullets Fired Through 10 Consecutively Rifled Barrels. Journal of Forensic Sciences 53(3),
677–682 (2008)
7. Brouwer, E.: Eurodac: Its limitations and temptations. European Journal of Migration and Law
4(2), 231–247 (2002)
56
D. Labudde
8. Buckle, J., MacDougall, D., Grant, R.: PDQ – Paint Data Queries: The History and Technology
Behind the Development of the Royal Canadian Mounted Police Forensic Laboratory Services
Automotive Paint Database. Canadian Society of Forensic Science Journal 30(4), 199–212
(1997)
9. Canny, J.: A computational approach to edge detection. IEEE Transactions on Pattern Analysis
and Machine Intelligence PAMI-8(6), 679–698 (1986)
10. Chen, X., Tian, J., Cheng, J., Yang, X.: Segmentation of fingerprint images using linear classifier. EURASIP Journal on Advances in Signal Processing 2004(4), 1–15 (2004)
11. Christy, B.B.: The use of the PDQ (Paint Data Query) database along with other resources to
provide vehicle information for hit and run fatalities within Virginia. In: Proceedings of the
Trace Evidence Symposium, August, S. 13–16 (2007)
12. Cole, S.A., et al.: Suspect identities: A history of fingerprinting and criminal identification.
Harvard University Press (2009)
13. Daugman, J.: Iriserkennung. In: Biometrische Identifikation, S. 129–158. Springer (2001)
14. Daugman, J.: The importance of being random: statistical principles of iris recognition. Pattern
recognition 36(2), 279–291 (2003)
15. Daugman, J.: How iris recognition works. Circuits and Systems for Video Technology, IEEE
Transactions on 14(1), 21–30 (2004)
16. Galton, F.: Finger prints. Macmillan and Company (1892)
17. Girod, A., Ramotowski, R., Lambrechts, S., Misrielal, P., Aalders, M., Weyermann, C.:
Fingermark age determinations: Legal considerations, review of the literature and practical propositions. Forensic science international 262, 212–226 (2016)
18. Girod, A., Ramotowski, R., Weyermann, C.: Composition of fingermark residue: a qualitative
and quantitative review. Forensic science international 223(1), 10–24 (2012)
19. Grassberger, M., Schmid, H.: Todesermittlung. Befundaufnahme & Spurensicherung: Ein praktischer Leitfaden für Polizei, Juristen und Ärzte. Springer Wien (2009)
20. Grasselli, A.: On the automatic classification of fingerprints. Methodologies of Pattern Recognition S. 253–273 (1969)
21. Green, B.: Canny edge detection tutorial (2002)
22. Grehn, F.: Augenheilkunde. Springer (2006)
23. Herrmann, B., Saternus, K.S.: Biologische Spurenkunde: Bd. 1: Kriminalbiologie, Bd. 1. Springer (2007)
24. Hohoff, C., Brinkmann, B.: Trends in der forensischen Molekulargenetik. Rechtsmedizin 13(4),
183–189 (2003)
25. Ifa, D.R., Manicke, N.E., Dill, A.L., Cooks, R.G.: Latent fingerprint chemical imaging by mass
spectrometry. Science 321(5890), 805–805 (2008)
26. Johnson, G.: VICLAS: Violent crime linkage analysis system. RCMP Gazette 56(10), 9–13
(1994)
27. Kanakam, P., Rao, K., Hussain, S.M.: Olfactory biometric technique: An emerging technology.
Journal of Advancement in Robotics 1(1), 1–11 (2015)
28. Kawagoe, M., Tojo, A.: Fingerprint pattern classification. Pattern Recognition 17(3), 295–303
(1984)
Literatur
57
29. Khanna, R., Shen, W.: Automated fingerprint identification system (AFIS) benchmarking using
the National Institute of Standards and Technology (NIST) Special Database 4. In: Security
Technology, 1994. Proceedings. Institute of Electrical and Electronics Engineers 28th Annual
1994 International Carnahan Conference on, S. 188–194. IEEE (1994)
30. Komarinski, P.: Automated fingerprint identification systems (AFIS). Academic Press (2005)
31. Locard, E.: Die Kriminaluntersuchung und ihre wissenschaftlichen Methoden. Berlin (1930)
32. Maio, D., Maltoni, D.: A structural approach to fingerprint classification. In: Pattern Recognition, 1996., Proceedings of the 13th International Conference on, Bd. 3, S. 578–585. IEEE
(1996)
33. Maio, D., Maltoni, D.: Ridge-line density estimation in digital images. In: Pattern Recognition,
1998. Proceedings. Fourteenth International Conference on, Bd. 1, S. 534–538 (1998)
34. Maltoni, D., Maio, D., Jain, A., Prabhakar, S.: Handbook of fingerprint recognition. Springer
Science & Business Media (2009)
35. Martineau, M.M., Corey, S.: Investigating the Reliability of the Violent Crime Linkage Analysis
System (ViCLAS) Crime Report. Journal of Police and Criminal Psychology 23(2), 51–60
(2008)
36. Nogala, D., Mittendorf, V.: Fingerabdrucksysteme. In: Wörterbuch zur Inneren Sicherheit, S.
87–92. Springer (2006)
37. Pauk J. Kuzmierowski, T.T.S.J., Ostaszewski, M.: Computer-aided system for foot type assessment based on photos taken by the podoscope (2015)
38. Pauk J. Kuzmierowski, T.T.S.J., Ostaszewski, M.: Computer-aided system for foot type assessment based on photos taken by the podoscope (2015)
39. Rao, C.K.: On fingerprint pattern recognition. Pattern Recognition 10(1), 15–18 (1978)
40. Ratha, N.K., Chen, S., Jain, A.K.: Adaptive flow orientation-based feature extraction in fingerprint images. Pattern Recognition 28(11), 1657–1672 (1995)
41. Reimer, H.: Biometrische Identifikation – eine aussichtsreiche Innovation. In: Biometrische
Identifikation, S. 1–7. Springer (2001)
42. Samir Nanavati Michael Thieme, R.N.: Biometrics: Identity Verification in a Networked World,
1st edn. Wiley (2002)
43. Schneider, J.K.: Ultrasonic fingerprint sensors. In: Advances in Biometrics, S. 63–74. Springer
(2008)
44. Schröder, B.: Das Fingerabdruckvergleichssystem EURODAC. ZAR (2), 71–75 (2001)
45. Stock, R., Swonger, C.: Development and evaluation of a reader of fingerprint minutiae. Cornell
Aeronautical Laboratory, Technical Report CAL no. XM-2478-X-1 S. 13–17 (1969)
46. Su, B.: Recent progress on fingerprint visualization and analysis by imaging ridge residue components. Analytical and bioanalytical chemistry 408(11), 2781–2791 (2016)
47. Thompson, R.M.: Automated firearms evidence comparison using the Integrated Ballistic Identification System (IBIS) (1999)
48. Urry, S.R., Wearing, S.C.: A comparison of footprint indexes calculated from ink and electronic
footprints. J Am Podiatr Med Assoc 91(4), 203–209 (2001)
49. Wickramaarachchi, W., Vasanthapriyan, S.: Multi-layer framed offline signature recognition algorithm. Journal of Image and Graphics 3(1) (2015)
58
D. Labudde
50. Zar, J.H.: Significance testing of the Spearman rank correlation coefficient. Journal of the American Statistical Association 67(339), 578–580 (1972)
51. Zhu, E., Yin, J., Hu, C., Zhang, G.: A systematic method for fingerprint ridge orientation estimation and image segmentation. Pattern Recognition 39(8), 1452–1472 (2006)
3
Computergestützte Gesichtsweichteilund Tatortrekonstruktion
Sven Becker und Dirk Labudde
3.1 Computergestützte forensische
3D-Gesichtsweichteilrekonstruktion
3.1.1 Einleitung
Die forensische Gesichtsweichteilrekonstruktion, als Teilgebiet der forensischen Osteologie, ist eine Variante der Auswertung von vorgefundenen biologischen Spuren und dem
daraus abgeleiteten Versuch, das äußere Erscheinungsbild eines unbekannten Toten in
einem möglichst realen und lebensnahen Modell nachzubilden. Die Gesichtsweichteilrekonstruktion stellt in Fällen stark fäulnisveränderter und skelettierter Leichname oft die
letzte Möglichkeit einer Personenidentifizierung dar, wenn eine Identitätssicherung über
die üblichen Methoden, wie DNA, Fingerabdrücke und Recherchen in Vermisstendatenbanken nicht möglich ist. Für eine Anfertigung einer Rekonstruktion werden vorliegende
Schädelteile, Daten aus bildgebenden Verfahren, wie die der Computertomographie (CT),
Informationen aus forensisch-anthropologischer und medizinischer Methoden, aber vor
allem Video- und Fotoaufzeichnungen der Person in Verbindung mit der Anatomie des
Schädels verwendet. Die forensische Gesichtsweichteilrekonstruktion wird primär im kriminalistischen Sinne zur Identifizierung unbekannter Leichen eingesetzt, aber auch zur
S. Becker ()
Wissenschaftlicher Mitarbeiter im Forensic Science Investigation Lab (FoSIL), University of
Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: becker1@hs-mittweida.de
D. Labudde
Lehrstuhl für Bioinformatik und Forensik, Leiter Forensic Science Investigation Lab (FoSIL),
University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: labudde@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_3
59
60
S. Becker und D. Labudde
realen Darstellung eines Lebensbildes einer historischen Person. [25] Des Weiteren dienen
die Rekonstruktionen bei Naturkatastrophen, wie dem Tsunami im Jahr 2004 in Südostasien und dem Hurrikane Katrina im August 2005, zur Personenidentifikation. Sobald
menschliche Überreste aufgefunden werden, erfolgt der Versuch, diese einer bestimmten Person zuzuordnen. Zu den etablierten Methoden der Identitätssicherung zählen die
DNA-Analyse, Daktyloskopie, Röntgenvergleichsanalyse und Odontostomatologie [18].
Ganz gleich, welche Methoden verwendet werden, sind antemortale Vergleichsdaten beziehungsweise Vergleichsmaterial von einer möglichen infrage kommenden Person notwendig [19]. Für Ergebnisse aus einer DNA-Analyse oder daktyloskopischen Untersuchung liegen Datenbanken vor, mit denen erhobene Daten abgeglichen werden können.
Odontostomatologische Daten oder am Leichnam dokumentierte Knochenfrakturen können mit Patientendaten von vermissten Personen abgeglichen werden. Trotz der vorhandenen Möglichkeiten ist die Zuordnung der menschlichen Überreste zu einer bestimmten
Person stark eingeschränkt, sobald dessen Daten in keiner polizeilichen oder medizinischen Datenbank vorhanden sind. In diesen Fällen ist es notwendig, durch gerichtliche
Obduktionen und forensisch-osteologische Untersuchungen der Skelett- und Knochenfunde neue Informationen, unter anderem hinsichtlich des Geschlechtes, biologischen Alters
und ethnischer Herkunft der unbekannten Person zu erhalten [6, 17, 18]. Hierfür finden forensisch anthropologische Verfahren wie die Morphognostik und Osteometrie Einsatz [6,
17]. In Fällen stark fäulnisveränderter Leichen bieten zudem die forensische Entomologie
und Mykologie die Möglichkeit einer Leichenliegezeitbestimmung. Da bei zahlreichen
unbekannten Leichen das Gesicht durch Fäulnisprozesse, Tierfraß oder vollständige Skelettierung bis zur Unkenntlichkeit verändert worden ist, besteht trotz der vorhandenen
Methoden nicht immer die Möglichkeit einer zweifelsfreien Identifizierung. Falls zudem
keine Vergleichsdaten des unbekannten Leichnams vorliegen, findet in diesen Fällen oftmals eine Gesichtsweichteilrekonstruktion, als zusätzliche und vor allem wertvolle Hilfe
für die Personenidentifizierung, Anwendung. Diese Methode basiert auf dem hohen Wiedererkennungswert des Gesichtes, auf Grundlage der knöchernen Strukturen des Schädels
und deren Merkmale. Neben den knöchernen Ausprägungen sind weitere Informationen
für eine angestrebte erfolgreiche Identifizierung des unbekannten Toten notwendig. Zu
einigen Informationsquellen zählen die bereits erwähnten anthropologischen Verfahren
Morphognostik und Osteometrie sowie Recherchen in Datenbanken, die Porträtfotos von
Personen unterschiedlichen Geschlechts, Alters und ethnischer Herkunft enthalten. Diese
dienen dem Rekonstrukteur, sich einen Überblick über variante morphologische Ausprägungsformen der Gesichtsmerkmale zu verschaffen. Vor allem der Hauttyp in Verbindung
mit dem Alter und den altersbedingten Veränderungen der Hautstruktur sind essentielle Faktoren für eine angestrebte erfolgreiche Identifizierung. Besonders der Aufbau der
einzelnen Hautschichten gewinnt immer mehr an Bedeutung, wenn es darum geht, den
Alterungsprozess und die altersbedingten Veränderungen in der Hautstruktur zu verstehen. Zahlreiche Forscher, wie Harman (1954), Hayflick (1961) und Bürger (Anfang 20.
Jh.), beschäftigten sich mit Faktoren, die das menschliche Alter bedingen. Jedoch bezogen sich die gewonnen Erkenntnisse nicht auf die morphologischen Veränderungen der
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
61
Hautstruktur. Mit diesem Thema setzten sich Takema et al. (1994), Neerken et al. (2004)
und Longo et al. (2011) auseinander, die die altersbedingten Veränderungen der Haut und
der einzelnen Hautschichten Epidermis und Dermis mittels Ultraschall, Laserscan- oder
Konfokalmikroskops untersuchten. Erst mit dem Sammeln und Generieren der erwähnten
Informationen rund um den unbekannten Toten lassen sich Methoden der Gesichtsweichteilrekonstruktion sinnvoll anwenden. Dabei werden klassische und computergestützte
Methoden unterschieden. Experte auf dem Gebiet der klassischen manuellen Rekonstruktion ist, neben einer Vielzahl weiterer, beispielsweise die deutsche Rechtsmedizinerin Dr.
med. Constanze Niess, die sich seit mehreren Jahren auf die diese Methode spezialisiert
hat. Trotz der jahrzehntelangen Anwendung der klassischen Rekonstruktionsmethoden
und den erzielten Erfolgen weisen diese nicht vernachlässigbare Nachteile im Vergleich
zu computergestützten Methoden auf. Sobald eine Rekonstruktion veranlasst wird, ist
es notwendig, den Schädel aus ethischen Gründen manuell mittels Ton oder Gips abzuformen. Ebenso müssen Verletzungen und Zerstörungen zeitaufwendig rekonstruiert
werden [8, 16]. Im Anschluss werden die anatomischen Weichteilmarker auf dem Schädel
angebracht. Ausgehend von diesen werden die durchschnittlichen Weichteildicken modelliert. Sobald diese erreicht sind, besteht keinerlei Bezug mehr zu den anatomischen
Weichteilmarkern, wodurch eine Individualisierung des zu rekonstruierenden Gesichtes
erschwert wird [8, 16]. Eine weitere Problematik wurde durch Lewis und Johnson (1997)
analysiert. Die Forscher untersuchten das Wiedererkennen von Personen anhand unterschiedlicher Gesichtsausdrücke [9]. Ein klassisches manuell rekonstruiertes Gesicht weist
eine bedingte Flexibilität gegenüber nachträglichen Veränderungen, beispielsweise des
eben erwähnten Gesichtsausdrucks, auf. Weiterhin besteht das Problem im Falle zusätzlich
erhaltenen Informationen, diese mit wenigen Mitteln in das klassische manuell rekonstruierte 3D-Modell zu integrieren. Demzufolge ist es nicht möglich, unter anderem einzelne
Gesichtsmerkmale oder Frisuren aus einer zuvor erstellten Modellbibliothek in dem erstellten Modell auszutauschen und dadurch eine Zeitersparnis im Rekonstruktionsprozess
zu erzielen. Der gesamte Prozess einer klassischen Rekonstruktion benötigt zudem selbst
bei erfahrenen Rekonstrukteuren ein Zeitpensum von bis zu 40 Stunden [8].
Ausgehend von den zuvor beschriebenen Problematiken bestand das Ziel darin,
einen neuartigen, kostengünstigen und flexiblen Prozess zur computergestützten 3DGesichtsweichteilrekonstruktion basierend auf Open-Source-Software zu entwickeln und
anzuwenden. Grundlage hierfür bildeten digitale Fotoaufnahmen von einem Schädel
eines ausgewählten Falles. Durch die Verwendung von unterschiedlichen Fotoaufnahmemedien sollte die Tauglichkeit von jedem einzelnen Medium, Fotoaufnahmen zur
Erstellung eines hinreichenden 3D-Modells zu liefern, überprüft und durch qualitative
sowie quantitative Vergleiche das Bestmögliche gefunden werden. Zusätzlich sollte durch
die Identifizierung zeitaufwendiger Prozessschritte herkömmlicher Methoden eine Performanceoptimierung der computergestützten Gesichtsweichteilrekonstruktion erfolgen.
Aufgrund der Individualität einzelner Gesichtsmerkmale bestand ein wesentliches Ziel
darin, Vorhersagemethoden für diese zu finden, die Methoden auf das Fallbeispiel anzuwenden und deren Genauigkeit zu überprüfen. Abschließend sollte zur Optimierung des
62
S. Becker und D. Labudde
Prozessablaufs hinsichtlich der Flexibilität sowie der Zeitersparnis eine Modellbibliothek
mit varianten morphologischen Gesichtsmerkmalen erstellt werden.
3.1.2 Historische Entwicklung
Vor der Identifizierung eines unbekannten Toten mittels einer Gesichtsweichteilrekonstruktion stand der Vergleich zwischen dessen Schädel und einem Porträtbild. Bereits
Anfang des 19. Jahrhunderts wurden unter Zuhilfenahme von Umrisszeichnungen Schädel sehr unsystematisch mit Porträtaufnahmen verglichen. Das heute bekannte Superprojektionsverfahren war die erste rein fotografische Methode. Bei dieser wurden ein mit
anatomischen Weichteilmarken versehener Schädel auf ein Porträtfoto einer infrage kommenden Person projiziert [8]. Die ersten zu forensischen Zwecken eingesetzten Weichteilrekonstruktionen wurden von dem russischen Archäologen und Anthropologen Michail
Michailowitch Gerassimow angefertigt. Dieser wurde von den Behörden gebeten, bis zur
Unkenntlichkeit veränderte Leichname zu identifizieren. Gerassimow verwendete damals
Ton, um seine Gesichter zu formen [8]. Die Erkenntnisse, welche Gerassimow erlangte,
finden sich als Grundlage in wahrscheinlich allen heutzutage angewandten Rekonstruktionsmethoden wieder. Heutzutage bekannte Spezialisten auf dem Gebiet der forensischen
Gesichtsweichteilrekonstruktion sind unter anderem Richard Helmer (Deutschland), Richard Neave und Caroline M. Wilkinson(England) sowie K.T. Taylor (USA) [1].
3.1.3 Voraussetzungen, Faktensammlung und Recherchen
Vor der eigentlichen Rekonstruktion bedarf es, hinsichtlich der notwendigen Informationen zum äußeren Erscheinungsbild des unbekannten Toten, der Erfüllung einiger Voraussetzungen sowie einer umfangreichen Recherche und Faktensammlung. Die Basis einer Rekonstruktion und zugleich eine essentielle Voraussetzung stellen die anatomischen
Weichteilmarker dar. Diese sind auch bekannt als Landmarken und repräsentieren definierbare durchschnittliche Weichteildicken an wesentlichen anatomischen Punkten des
Schädels (Abb. 3.1). Zu früheren Zeiten wurden diese mithilfe von Nadeln an Leichen
gemessen und aufgenommen. Dabei wurden verschiedene Methoden eingesetzt. His und
Welcker nutzten beispielsweise Messerklingen, Kollman und Büchly hingegen rußgeschwärzte Nadeln zur Bestimmung der Weichteildicken [24]. Die erste größere Testreihe
zur Erhebung von Daten bezüglich der Weichteildicke an lebenden Personen führte Helmer im Jahr 1977 mittels Ultraschall-Impuls-Echo-Verfahren durch. Messungen mittels
Magnetresonanztomographie (MRT) wurden erstmals von Kass et al. (1987) vorgestellt
und deren Verfahren durch Mang et al. (2007) weiterentwickelt. Philipps et al. hingegen
erhoben 1996 computertomografisch basierte Daten. Durch den Einsatz von bildgebenden
Verfahren bestand die Möglichkeit, die Weichteildicken in einer aufrechten oder sitzenden Position des Probanden aufzunehmen, die einer natürlichen Kopfhaltung am ehesten
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
63
Abb. 3.1 Anatomische Weichteilmarker
entsprechen. Einen Vergleich von Weichteilverschiebungen im Gesicht zwischen einer
stehenden und liegenden Position des Probanden zog Werner (2009) [24]. Eine besondere
Bedeutung für den Rekonstruktionsprozess liegt darin, festzustellen inwieweit tatsächliche Werte, die für eine optimale Rekonstruktion des Gesichtes eines unbekannten Toten
notwendig sind, von den durchschnittlichen Weichteildicken an den jeweiligen anatomischen Punkten abweichen. Es existieren wichtige Einflussgrößen, welche einen enormen
Stellenwert hinsichtlich dieser Abweichungen besitzen. Zu diesen zählen unter anderem
der Alterungsprozess sowie daraus resultierende morphologische und anatomische Änderungen des Gesichtes sowie individuelle Einflussfaktoren wie der Ernährungszustand und
Lebensstil der zu identifizierenden Person. Aufgrund des Einflusses der beschriebenen
Faktoren wird die Notwendigkeit, so viele Informationen wie möglich über das äußere Erscheinungsbild des unbekannten Toten zu erhalten, deutlich [3]. Diese können in
Informationen von Ermittlungsbehörden, Informationen aus der Rechtsmedizin und Datenbankrecherchen eingeteilt werden [1]. Vonseiten der Ermittlungsbehörden, d. h. der
Polizei und Staatsanwaltschaft, sollten so viele Hinweise wie möglich in Form von Fo-
64
S. Becker und D. Labudde
toaufnahmen des unbekannten Toten sowie Protokollen und Asservatenlisten gesammelt
und dem Rekonstrukteur zur Verfügung gestellt werden. Die Protokolle beinhalten Angaben zum Auffindeort, der Auffindesituation, zu bisherigen Ermittlungsergebnissen und
Gegenständen die am und in der Umgebung des unbekannten Toten gefunden worden
sind. Fotoaufnahmen des Leichnams dienen der Sicherung von Informationen, da diese
im Falle des Vorhandenseins, Weichteilreste mit Haaranhaftungen oder mögliche Nasenund Ohrenformen festhalten, die am mazerierten Schädel im späteren Verlauf nicht mehr
erkennbar sind [1]. Asservatenlisten geben wertvolle Hinweise auf die Lebensumstände
der unbekannten Person. Bekleidungsteile ermöglichen beispielsweise über die Konfektionsgröße das Ziehen von Rückschlüssen auf die wahrscheinlichen Weichteildicken der
unbekannten Person. Die von der Rechtsmedizin aufgenommenen Daten in Form von
Fotoaufnahmen und Obduktionsberichten sind ebenfalls essentielle Informationsquellen.
Da eine Gesichtsweichteilrekonstruktion meist erst mehrere Tage oder Wochen, nachdem der unbekannte Leichnam aufgefunden wurde, in Auftrag gegeben wird, stehen dem
Rekonstrukteur lediglich Fotoaufnahmen zur Verfügung, die die Auffindesituation beschreiben. Im Obduktionsbericht müssen unter anderem Angaben zum Geschlecht, Alter,
zur Größe und ethnischen Herkunft des unbekannten Toten enthalten sein [1]. Diese Informationen können mithilfe anthropologischer Methoden (Morphognostik und Osteometrie)
gewonnen werden. Um prinzipiell eine Gesichtsweichteilrekonstruktion eines unbekannten Toten zu ermöglichen, stellt die wichtigste Voraussetzung ein weitgehend intakter
Schädel, bestenfalls zusätzlich mit vorhandenem Unterkiefer, dar. Je nach angewandter
Rekonstruktionsmethode empfiehlt es sich aus ethischen Gründen, den Originalschädel
1:1 zu replizieren [20]. Im Falle von Verletzungen oder Frakturen am Schädel müssen diese zuvor ebenfalls rekonstruiert werden [20]. Dabei sowie bei allen anderen Handlungen
ist jedoch stets darauf zu achten, keine knöchernen Strukturen des Schädels zu zerstören.
Dazu zählt beispielsweise der vordere Nasenstachel (Spina nasalis anterior), der bei der
Rekonstruktion der Nasenform von enormer Bedeutung ist. Ohne diesen Knochenfortsatz
können kaum Aussagen über eine mögliche Nasenform getroffen werden. Die dritte Möglichkeit der Informationsgewinnung stellen Recherchen in Datenbanken mit Lichtbildern
von Personen unterschiedlichen Geschlechts, Alters und Nationalität dar. Diese dienen
dem Rekonstrukteur dazu, ein Gefühl für die zu rekonstruierenden äußeren Merkmale, wie
Nasenformen und altersbedingte Veränderungen, zu entwickeln. Bei einer längeren Leichenliegezeit von mehreren Jahren werden zudem Recherchen zum sogenannten Zeitgeist
durchgeführt. Diese zielen darauf ab, für die damalige Zeit, in der die unbekannte Person
gelebt hat, typische Haartrachten zu finden und in das rekonstruierte Modell zu integrieren [1]. Neben der Informationsgewinnung aus Polizeiprotokollen, rechtsmedizinischen
Gutachten und Datenbanken sind zudem methodische Ansätze für die Rekonstruktion
essentiell. Zu diesen zählen beispielsweise Vorhersagemethoden für Nasen- und Mundformen. Forscher wie Stephan und Murphy beschäftigen sich mit diesem Sachverhalt und
liefern Vergleiche von verschiedenen Vorhersagemethoden für Gesichtsmerkmale, die in
den Rekonstruktionsprozess mit einbezogen werden [14, 16].
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
65
3.1.4 Klassische Methoden der Gesichtsweichteilrekonstruktion
Zu den klassischen manuellen Rekonstruktionsmethoden zählt unter anderem die plastische Methode. Grundsätzlich besteht bei dieser die Möglichkeit, verschiedene Materialien, wie Kunststoff, Ton oder Wachs, für die Modellierung der zu rekonstruierenden
Gesichtsweichteile zu verwenden [8]. Aus ethischen Gründen sollte jedoch der Schädel
vor dem Rekonstruktionsprozess mithilfe von Silikon abgeformt werden [8]. Hinsichtlich
des Vorgehens bei der Rekonstruktion werden drei verschiedene Methoden unterschieden.
Bei der ersten und zugleich den anderen zugrundeliegenden Methode handelt es sich um
die sogenannte russische Methode von Gerassimow. Dieser ging von dem Ansatz aus, dass
trotz individueller Unterschiede in der Muskulatur, die Ansätze von dieser und die daraus resultierenden anatomischen Merkmale eine ausreichende Grundlage für eine exakte
Rekonstruktion der Weichteildicken darstellen [21]. Die notwendigen Gesichtsmerkmale wurden von einzelnen Knochen abgeleitet, die Einzelheiten der Nase beispielsweise
direkt von dem Nasenstachel, die Stirn von dem Schädel, der Mund von den Zähnen
und Kieferknochen sowie die Ohren von dem Warzenfortsatz [21]. Den wichtigsten Faktor stellt jedoch das Rekonstruieren ohne definierte Weichteildicken an anatomischen
Punkten dar. Gerassimow bezog sich lediglich auf die genannten Ausprägungen. Dennoch berichtete dieser, in 150 forensischen Fällen erfolgreich gewesen zu sein. Bei der
zweiten, der amerikanischen Methode finden die sogenannten Landmarken Einsatz [8].
Die Methode basiert auf Mc-Gregor, Wilder (1912) und Krogman (1946) [21]. Vor dem
Rekonstruktionsprozess werden die Landmarken auf den Schädel aufgebracht. Anschließend wird der Zwischenraum zwischen diesen bandartig gefüllt. Die Methode ist flexibel
hinsichtlich des individuellen Ernährungszustandes der zu identifizierenden Person, jedoch werden die Einflüsse der Gesichtsmuskulatur und resultierende Ausprägungen wie
bei der Manchester-Methode nicht berücksichtigt [8]. Bei dieser handelt es sich um eine Kombination aus den beiden vorangegangenen. Die Manchester-Methode wurde von
Richard Neave 1997 entwickelt und basiert ebenfalls auf den anatomischen Weichteilmarken [25]. Zusätzlich wird jedoch das Gesicht ausgehend von der Muskulatur Schritt
für Schritt rekonstruiert. Die Ausprägungen der Muskelansätze bestimmen, wie stark oder
schwach Muskeln modelliert werden. Im Anschluss erfolgt das Aufbringen der Schichtdicke der Unterhaut, den Drüsen sowie der oberflächlichen Haut, welche maßgeblich von
dem biologischen Alter und Ernährungszustand der Person abhängt. Der Rekonstrukteur weicht an dieser Stelle bewusst von den durchschnittlichen Weichteildicken ab und
unter- beziehungsweise überschreitet diese [8]. Ganz gleich, ob die amerikanische oder
Manchester-Methode Anwendung finden, muss das entstandene Rohmodell im Anschluss
mit Kopfhaaren, einer Hautfarbe und gegebenenfalls einem Bart versehen werden, um ein
für die Fahndung einsetzbares Porträtfoto zu erhalten [8].
66
S. Becker und D. Labudde
3.1.5 Computergestützte Methode der Gesichtsweichteilrekonstruktion
mittels Open-Source-Software
Wie von Wilkinson im Jahr 2010 beschrieben, existieren verschiedene computergestützte
Methoden zur Rekonstruktion von Gesichtsweichteilen, wie beispielsweise die zweidimensionale Superimposition. Neben dieser finden ebenfalls dreidimensionale Methoden
basierend auf Laserscan- und CT-Daten mit anschließender Modelling- und Animationssoftware Anwendung [25]. Dabei werden vermehrt lizensierte und kostenintensive
Techniken und Software-Tools verwendet. Auf der anderen Seite existieren Ansätze von
Rekonstruktionen basierend auf Low-Cost- und, wie im Folgenden vorgestellt, OpenSource-Systemen [2, 4].
VisualSfM und CMPMVS
Die Basis einer computergestützten Gesichtsweichteilrekonstruktion mittels Open-Source-Software stellt Visual Structure from Motion (VisualSfM) dar. Bei diesem Tool handelt
es sich um ein Open-Source-Softwarepaket, mit dem aus Mehrbildfotoaufnahmen eines
Objektes eine 3D-Punktwolke berechnet und aus diesem ein 3D-Modell erstellt werden
kann [27]. Die Bezeichnung „Visual“ ist auf die verfügbare grafische Oberfläche zurückzuführen, „Structure from Motion“ hingegen bezeichnet den automatischen Prozess, der
die räumliche Struktur der Objekte aufgrund von korrespondierenden Merkmalen in den
Aufnahmen erkennt [27]. VisualSfM wurde von Changchang Wu entwickelt, welcher eigene Tools, wie SiftGPU mit denen anderer Programmierer wie CMVS/PMVS (Clustering
Views for Multi-view Stereo/Patch-based Multi-view Stereo software) von Yasutaka Furukawa kombiniert hat [26]. Bei SiftGPU handelt es sich um den Scale-invariant feature
transform-Algorithmus zur Extraktion der Merkmale aus den Fotoaufnahmen, welcher
speziell unter Verwendung der GPU, dem Prozessor der Grafikkarte, arbeitet [26]. Mittels CMVS/PMVS werden die zu berechnenden 3D-Punktwolken der Objekte in einzelne
Cluster zerlegt und anschließend verdichtet [5]. Die Vorteile von VisualSfM liegen in
den grafikkartenoptimierten Algorithmen, wodurch die Rechenzeit um einen nicht unerheblichen Faktor reduziert wird. Des Weiteren ist eine Kamera-kalibrierung, wie sie
beispielsweise beim kommerziellen Programm PhotoModeler Anwendung findet, nicht
nötig [27]. Die an VisualSfM nachgeschaltete Software ist CMPMVS. Diese wurde von
Michal Jamcosek im Jahr 2012 entwickelt und dient der detaillierten texturierten Oberflächenrekonstruktion von in VisualSfM erstellten Punktwolken. CMPMVS verarbeitet
kommandozeilenbasiert direkt die Ausgaben von VisualSfM innerhalb weniger Minuten
je nach Anzahl und Auflösung der eingegebenen Video- und Fotoaufnahmen.
MeshLab
Je nach Bedarf und Aufwand besteht die Möglichkeit, weitere Open-Source-Software in
den Rekonstruktionsprozess zu integrieren. Ein Beispiel wäre MeshLab, welches von Cignoni beginnend im Jahr 2005 entwickelt wurde. Bei diesem handelt es sich um eine portable und erweiterbare Software für die Verarbeitung und Editierung von zum einen unstruk-
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
67
turierten 3D-Punktwolken und zum anderen von hochaufgelösten und texturierten 3DModellen [7]. Mittels MeshLab besteht ebenfalls die Möglichkeit, Oberflächen von 3DPunktwolken wie in CMPMVS zu rekonstruieren. Hierfür stehen dem Nutzer verschiedene Algorithmen wie der Poisson-Surface-Algorithmus oder Ball-Pivoting-Algorithmus
zur Verfügung [11]. Im vorgestellten Prozess findet MeshLab Anwendung, um die erstellten 3D-Modelle nachzubearbeiten und zu editieren.
Blender
Für die weitere Bearbeitung von 3D-Modellen, in diesem Fall für die eigentliche Modellierung von Weichteilen und Gesichtsmerkmalen, besteht die Möglichkeit, Blender zu nutzen. Bei diesem handelt es sich um 3D-Grafiksoftware, die den gesamten Workflow vom
Modellieren über das Texturieren bis hin zur Animation und zum Rendering abdeckt [2].
Blender wurde im Jahr 1994 von der Blender Foundation entwickelt und erscheint in
immer wieder neuen Versionen für verschiedene Betriebssysteme wie Windows, Linux
oder OS X. Der Schwerpunkt bei Blender liegt in der Bearbeitung von Polygonnetzen
durch verschiedene Tools wie das Unterteilen von Flächen oder das virtuelle Verformen
(Sculpting). Des Weiteren besteht die Möglichkeit der Physik- und Materialsimulation,
mit denen Objekte realistisch auf Kollisionen reagieren sowie Flüssigkeiten, Gras, Haare
und Kleider realistisch imitiert werden. Die Software kann zudem mittels der Skriptsprache Python erweitert werden. In Blender erstellte Modelle können beispielsweise im STLoder OBJ-Format exportiert und anschließend in 3D-Druckersoftware importiert werden.
Ausgewählte Methoden zur Vorhersage von Gesichtsmerkmalen
Zahlreiche Forscher, wie Stephan (2003) und Wilkinson (2010), geben Überblicke über
Methoden zur Vorhersage einzelner Gesichtsmerkmale. Die Bestimmung der Form der
Nase oder Lage der Augen im Schädel wird durch die Bewertung von auf den Knochen bezogenen Details erzielt [16, 25]. Im Folgenden werden einige Gesichtsmerkmale
und Vorhersagemethoden für diese vorgestellt, insbesondere für die Nase, da diese ein
zentraler Bestandteil für eine akkurate Gesichtsapproximation ist [16]. Die Nase ist ein
Gesichtsmerkmal welches bei einer Rekonstruktion eine hohe Fehlerrate und geringe Präzision aufweisen kann. Aus diesem Grund beschäftigen sich zahlreiche Forscher, wie
Gerassimow (1955), George (1987), Prokopec und Ubelaker (2002) sowie Stephan et
al. (2003), seit Jahrzehnten mit den Relationen zwischen dem Weichgewebe der Nase
und den knöchernen Ausprägungen der Nasenöffnung und des Nasenstachels [25]. Es
ist anatomisch vorhersehbar, dass die allgemeine Form der Nase breiter als die knöcherne Nasenöffnung ist, da das Weichgewebe einer schmaleren Nase sonst keine tragenden
knöchernen Strukturen besitzen würde. Auf der anderen Seite kann aus anatomischer
Sicht davon ausgegangen werden, dass die Nase in ihrer Breite nicht allzu sehr von den
knöchernen Ausprägungen abweicht, da sonst eine Obstruktion der Luft in den Atemwegen auftreten würde. Gerassimow behauptete auf Grundlage seiner Forschungen, dass
die knöcherne Nasenöffnung an der breitesten Stelle drei Fünftel der Gesamtnasenbreite
entspricht. Diese Aussage wurde mithilfe von CT-Studien lebender Personen durch Rynn
68
S. Becker und D. Labudde
Abb. 3.2 Nasenformvorhersage nach Gerassimow (a) und
Krogman (b)
im Jahr 2006 bestätigt. Gerassimow erklärte weiterhin, dass die Position der Nasenspitze
durch zwei Geraden und deren Schnittpunkt vorhergesagt werden kann. Die erste Gerade
setzt dabei am letzten Ende des Nasenknochens, speziell an dem anatomischen Punkt Rhinion an, die zweite Gerade folgt der Richtung des Nasenstachels (Abb. 3.2). Gerassimow
validierte diese Methode durch eine Blindstudie an 50 Leichnamen [25].
Krogman stellte 1962 eine weitere Methode zur Vorhersage der Nase vor, die ebenfalls
auf der Ausprägung des Nasenstachels basiert (Abb. 3.2). Der Unterschied zu der Methode
von Gerassimow besteht jedoch darin, dass Krogman einen anatomischen Weichteilmarker mit einbezog, speziell den Punkt Midphiltrum. Dieser befindet sich laut Definition von
Taylor (2001) an der höchstmöglichen Position vor der Krümmung des Nasenstachels.
Krogman behauptete, dass die dreifache Länge des Nasenstachels zu den durchschnittlichen Weichteildicken des anatomischen Punktes Midphiltrum addiert werden muss, um
die Position der Nasenspitze zu erhalten. Jedoch wurden keinerlei Studien hinsichtlich
der Präzision und Zuverlässigkeit der Methode veröffentlicht [16]. Im Jahr 2002 publizierten Prokopec und Ubelaker eine Methode zur Vorhersage der Nasenspitze und des
Verlaufs der Nase, die ursprünglich auf einer Methode von Gerassimow basiert (Abb. 3.3).
Grundlage für die Vorhersage bildet die Nasenöffnung. Diese wird in sieben gleichgroße
Segmente aufgeteilt und durch Einbezug weitere anatomischer Weichteilmarker die Position der Nasenspitze sowie der Verlauf der Nase bestimmt [16]. George stellte 1987
eine Methode vor, die sich von den bisher genannten vollkommen unterschied (Abb. 3.3).
Unter Einbezug der Frankfurter Horizontalen, einer Ebene, die durch den tiefsten Punkt
der Augenhöhle und durch den höchsten Punkt des äußeren knöchernen Gehörgangs verläuft, lässt sich die Position der Nasenspitze ermitteln [16]. Neben zahlreichen Methoden
zur Vorhersage der Nase, Nasenform und -spitze existieren ebenso verschiedene Ansätze zur Vorhersage der Morphologie des Mundes. Ausgehend von odontostomatologischer
und anatomischer Literatur wird die Form der Mundhöhle unter anderem von der Okklusion der Zähne, dem Zahnmuster und der Gesichtsmorphologie bestimmt. Forscher die
sich mit diesem Thema beschäftigen, sind unter anderem Gerassimow (1955), Krogman
(1986) und Stephan und Henneberg (2003). Stephan gibt einen Überblick und eine Aus-
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
69
Abb. 3.3 Nasenformvorhersage nach Prokopec und
Ubelaker (a) und George (b)
wertung über verschiedene Methoden zur Vorhersage der Mundform. Die untersuchten
Methoden sind: 1) die Breite des Mundes entspricht dem Abstand der Pupillen, 2) die
Breite des Mundes ist gleich dem Abstand zwischen den medialen Grenzen der Iris und 3)
die Breite des Mundes ist gleich der Distanz zwischen den Eckzähnen und dem ersten Backenzahn. Stephan führte eine Studie an Australiern mit europäischen Vorfahren mittels
fotogrammetrischer Methoden durch. Er fand heraus, dass die Methoden 1 und 3 sehr unpräzise sind, da die Breite des Mundes im Durchschnitt 11 mm (SD, 4 mm) bei Methode 1
überschätzt und 13 mm (SD, 3 mm) bei Methode 3 unterschätzt wurde. Lediglich Methode 2 lieferte zufriedenstellende Ergebnisse, obwohl bei dieser ebenfalls Abweichungen
von 2 mm vorlagen. Stephan entwickelte eine neue Richtlinie zur Vorhersage der Breite des Mundes. Diese basiert auf der Distanz zwischen den Eckzähnen plus 57 % der
Distanz zwischen der lateralen Grenze der Eckzähne zum Mittelpunkt der Pupille. Die
vorhergesagten Mundbreiten wiesen keine statistisch signifikanten Unterschiede zu den
tatsächlichen auf [15].
3.2 Studie am Beispiel eines Schädelfundes
3.2.1 Hintergründe zum ausgewählten Fall
Der neuartige Prozess der computergestützten Gesichtsweichteilrekonstruktion mittels
Open-Source-Software wurde anhand eines Fallbeispiels durchgeführt. Bei diesem handelt es sich um einen Leichnam, der am 29.06.2014 im Freien aufgefunden wurde. Dieser
war nahezu vollständig skelettiert und wies vereinzelte Weichteilreste mit Haaren auf.
Medizinisch-anthropologische Untersuchungen ergaben, dass es sich um eine männliche
Person im Alter von maximal 83 Jahren handelt. Die Identität des damals unbekannten
Mannes wurde molekulargenetisch gesichert. Von der Person lag zudem Bildmaterial in
Form von Porträtaufnahmen vor, das für den Vergleich mit den Rekonstruktionsergebnissen verwendet werden sollte.
70
S. Becker und D. Labudde
Abb. 3.4 Prozessablauf einer computergestützten Gesichtsweichteilrekonstruktion
3.2.2 Prozessüberblick
Der Rekonstruktionsprozess (Abb. 3.4) mittels Open-Source-Software lässt sich in das
Erstellen eines 3D-Schädelmodells mit anatomischen Weichteilmarkern, die Modellierung des Schädelgewebes und der Gesichtsmerkmale sowie die Individualisierung des
3D-Modells unterteilen. Als Grundlage für den Rekonstruktionsprozess dienen digitale
Foto- oder CT-Aufnahmen. Einen weiteren wesentlichen Punkt stellen Informationen über
die unbekannte Person und deren Auffindeort dar. Diese können, wie bereits beschrieben,
durch verschiedene anthropologische und molekulargenetische Verfahren sowie Berichte und Datenbanken herausgefunden werden. Nach der Modellierung des notwendigen
Weichteilgewebes erfolgt die Individualisierung des 3D-Modells in Form spezifischer Gesichtsmerkmale und, falls möglich, der Haare, Frisuren und Accessoires. Der letzte Schritt
der Prozesskette umfasst eine Plausibilitätsprüfung sowie einen Abgleich des erstellten
Modells mit Datenbankeinträgen von vermissten Personen.
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
71
Abb. 3.5 Versuchsaufbau zur
Fotografie
3.2.3 Digitalisierung des Schädels
Die Grundlage für das Erstellen des computergestützten 3D-Schädelmodells des hier vorgestellten Fallbeispiels bildeten Fotoaufnahmen. Dabei war die Fotoqualität von entscheidender Bedeutung, d. h., eine höhere Auflösung und Fotoanzahl ermöglichte eine detailliertere Rekonstruktion der Gesichtsweichteile und Steigerung der Effektivität der Modellierung. Jedoch erforderte dies eine hohe Rechenleistung. Eine Qualitätssteigerung
des 3D-Schädelmodells wurde zudem durch Fotografieren aus unterschiedlichen Blickhöhen erreicht. Für das Erstellen der einzelnen Aufnahmen fand eine Spiegelreflexkamera
des Modells Nikon D7100 Anwendung. Für die Fotoaufnahmen wurden ein schwarzer
Hinter- und Untergrund verwendet. Der Schädel wurde auf einem Drehteller positioniert, um lückenlose Aufnahmen mit wohldefinierten Winkeln 360ı um das Objekt zu
erzielen (Abb. 3.5). Nach Abschluss der Fotoaufnahmen wurden diese auf die Workstation übertragen (Abb. 3.6). Bei dieser handelt es sich um eine eigens für die 3DGesichtsweichteilrekonstruktion eingerichtete Hardware, welche über folgende Spezifikationen verfügt: Betriebssystem: Windows 7 Enterprise Service Pack 1, Prozessor: Intel
Core i7-5930K CPU 3,50GHz, Arbeitsspeicher: 32,0 GB, Grafikkarte: NVIDIA GeForce
GTX 750 Ti. Für den Rekonstruktionsprozess eignen sich jedoch ebenfalls getestete leistungsschwächere Rechnersysteme.
3.2.4 Punktwolkenerzeugung und Oberflächenrekonstruktion mittels
VisualSfM und CMPMVS
Nach Übertragung der Fotoaufnahmen wurde mittels VisualSfM eine 3D-Punktwolke von
dem Schädelmodell erzeugt. VisualSfM bietet dem Nutzer alle notwendigen Operationen
für das Erstellen von Punktwolken über eine grafische Oberfläche an. Nach dem erstmaligen Ausführen der Software wurde eine Konfigurationsdatei (nv.ini-Datei) angelegt,
die alle notwendigen Parameter für Algorithmen und Prozessabläufe beinhaltet. Alle Einstellungen wurden auf den Standardwerten belassen, können aber bei Bedarf angepasst
72
S. Becker und D. Labudde
Abb. 3.6 Fotoaufnahme Spiegelreflexkamera
werden. Der erste Prozessschritt der Rekonstruktion beinhaltete den Import aller Fotoaufnahmen. Diese wurden auf einem Miniaturraster dargestellt, von dem aus zusätzliche
Aufnahmen hinzugefügt oder qualitativ unbrauchbare sowie Duplikate entfernt werden
konnten (Abb. 3.7). Das vorhandene Logfenster gab Auskunft über die Eigenschaften der
Fotoaufnahmen, wie Auflösung und Bezeichnung sowie Fortschritte des Arbeitsprozesses. Der nächste Prozessschritt beinhaltete die Berechnung der SIFT-Feature (Abb. 3.8). Je
nach Anzahl der zu verarbeitenden Fotoaufnahmen stieg die Verarbeitungszeit exponentiell an. Angaben über die individuelle und Gesamtverarbeitungsdauer der Aufnahmen
und der Anzahl der berechneten Features wurden über das Logfenster ausgegeben. Abschließend wurde die 3D-Punktwolke (Abb. 3.9) erstellt und, für die Weiterverarbeitung
und Oberflächenrekonstruktion in CMPMVS, exportiert. Die Rekonstruktion der Oberfläche der in VisualSfM erzeugten 3D-Punktwolke sowie die Texturierung erfolgten in
einem Prozessschritt. Hierfür wurde die Ausgabe aus VisualSfM kommandozeilenbasiert
in CMPMVS importiert und der Rekonstruktionsprozess gestartet. Die Verarbeitungsdauer war zum einen von der Anzahl der Aufnahmen, zum anderen von deren Auflösung
abhängig.
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
Abb. 3.7 Import der Fotoaufnahmen
Abb. 3.8 Beispiel der SIFT-Features des SIFT-Algorithmus von zwei Fotoaufnahmen
73
74
S. Becker und D. Labudde
Abb. 3.9 Verdichtete Punktwolke
3.2.5 Modellnachbearbeitung und Editierung mittels MeshLab
Nach dem Erzeugen des 3D-Modells des Schädels wurde dieses zur weiteren Nachbearbeitung in MeshLab importiert. Dieser Prozessschritt war notwendig, um unbrauchbare
Artefakte nachträglich zu entfernen. Ein Beispiel für ein solches Artefakt war der Drehteller, auf welchem der Schädel für die Erzeugung der Fotoaufnahmen positioniert wurde.
Nach Bearbeitung des Modells wurde dieses im .obj-Format exportiert (Abb. 3.10). Äquivalente Output-Formate sind: .ply, .stl oder .x3d.
3.2.6 Positionierung anatomischer Weichteilmarker und
Rekonstruktion ausgewählter Gesichtsmerkmale
Die nach der Oberflächenrekonstruktion stattfindende Modellierung der Gesichtsmerkmale wurde mittels Blender realisiert. Nach dem Importieren des zu bearbeitenden 3DModells wurde dieses entsprechend der zur Verfügung stehenden osteometrischen Maße
im Maßstab 1:1 skaliert. Im Anschluss erfolgte die Modellierung und Positionierung der
anatomischen Weichteilmarker entsprechend den Vorgaben von Stephan et al. (2008). Ba-
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
75
Abb. 3.10 Importiertes texturiertes 3D-Modell in Meshlab
sis für die anatomischen Weichteilmarker waren Pfeilobjekte, die entsprechend der realen
durchschnittlichen Weichteildicken angepasst und bezeichnet wurden. Um den Zeitaufwand für den Prozessschritt des Erstellens und Positionierens der anatomischen Weichteilmarker zu optimieren wurde hierfür ein Pythonskript angelegt (Abb. 3.11). Dieses wurde
im Scripting Layout in Blender erstellt. Nach Ausführen des Skriptes waren geringfügige manuelle Korrekturen an den anatomischen Weichteilmarkern notwendig. Nach der
Positionierung der anatomischen Weichteilmarker wurden die beschriebenen Methoden
zur Vorhersage der Nasenform und der Position der Nasenspitze angewandt. Ziel war es,
die bestmöglichste Methode zur Nasenrekonstruktion für das Fallbeispiel herauszufinden.
Zuerst erfolgte die Rekonstruktion der Nase basierend auf der Vorhersagemethode von
Gerassimow. Blender bietet dem Nutzer hierfür eine Vielzahl von Hilfsobjekten, Tools
und Modi, die entsprechend ihrer Notwendigkeit Anwendung fanden. Zu Beginn wurden die zwei von Gerassimov empfohlenen Geraden, eine dem Nasenstachel und eine
dem knöchernen Bereich des Rhinion folgend, erstellt und auf dem computergestützten
3D-Modell positioniert. Im Anschluss wurden die notwendigen anatomischen Weichteilmarker (in diesem Fall: Nasion, Midnasion, Rhinion und Subnasale) ebenfalls auf dem
Schädel aufgebracht. Zur Kontrolle des korrekten anatomischen Verlaufs beispielsweise
des Nasenrückens oder der Nasenlöcher wurden Porträtaufnahmen von Personen ähnlichen Alters aus Gesichtsdatenbanken, wie der FaceBase der Dallas Universität von Texas
76
S. Becker und D. Labudde
Abb. 3.11 3D-Modell mit
exemplarischen anatomischen
Weichteilmarkern
genutzt. Gleichzeitig wurde permanenter Bezug zu den Vorgaben von Gerassimow sowie zu den anatomischen Weichteilmarker gehalten. Dies wurde durch einen speziellen
Modus, den Wireframe Modus, erleichtert, der es ermöglicht, Modelle in einer Art Gitterstruktur zu betrachten. Abschließend wurden verschiedene Modifier auf das 3D-Modell
angewandt, um dieses unter anderem hinsichtlich von altersbedingten morphologischen
Veränderungen zu individualisieren.
Die zweite angewandte Rekonstruktionsmethode erfolgte entsprechend den Vorgaben
von Krogman. Hierfür wurde die Länge des Nasenstachels gemäß seiner Vorgaben gemessen und zu der durchschnittlichen Weichteildicke des anatomischen Punktes Midphiltrum
addiert. Es wurde eine Gerade mit dem entsprechenden Maß erstellt und entsprechend
der Richtung des Nasenstachels durch diesen gelegt. Eine eingefügte Orthogonale und der
daraus resultierende Schnittpunkt entsprachen der Position der Nasenspitze. Durch Einbeziehen zusätzlicher notwendiger anatomischer Weichteilmarker wurde die Nase, analog
zur vorherigen Methode, modelliert. Die dritte Rekonstruktion nach Prokopec und Ubelaker ermöglichte neben der Vorhersage der Position der Nasenspitze zudem die Vorhersage
des Verlaufs der Nase. Zu Beginn wurde eine Gerade durch die anatomischen Punkte Nasion und Prosthion gelegt. Ausgehend von dieser wurde eine Parallele durch den Punkt
des knöchernen Endes der Nasenöffnung gezogen und diese in sieben gleichgroße Bereiche eingeteilt. Die Größe eines jeden Bereiches wurde mithilfe des Tools Ruler/Protractor
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
77
Abb. 3.12 Rekonstruierte Nasen nach den Methoden von Gerassimow, Krogman, Prokopec und
Ubelaker sowie George im Profil
ermittelt. Im Anschluss wurde die Distanz zwischen den einzelnen Schnittpunkten, den
Parallelen und den bereichsbegrenzenden Geraden sowie den knöchernen Bereichen der
Nasenöffnung ermittelt und diese anterior gespiegelt. Anschließend wurden zwei Millimeter zu jeder Distanz addiert und alle notwendigen anatomischen Weichteilmarker
hinzugefügt. Ausgehend davon wurde die Nase entsprechend mittels der bereits beschriebenen Tools modelliert und angepasst. Die vierte Nasenformvorhersage wurde nach der
Methode von George durchgeführt. Hierfür wurde eine Gerade zwischen dem anatomischen Punkt Nasion und dem Punkt der größten Krümmung der Maxilla gezogen (hier:
Gerade A) und deren Distanz gemessen. Anschließend wurde die Frankfurter Horizontale in das 3D-Modell eingetragen. Ausgehend von dieser wurde eine Parallele durch den
Punkt, der sich mittig auf der Krümmung unterhalb des Nasenstachels befindet, gelegt
(hier: Gerade B). Dadurch entstand ein Schnittpunkt S zwischen den Geraden A und B,
von dem aus 60,5 % der Länge der Gerade A abgetragen wurden. Dadurch wurde die
Position der Nasenspitze bestimmt und unter Einbezug weiterer anatomischer Weichteilmarker die Nase rekonstruiert. Zur realistischeren Darstellung wurden die erstellten
Nasenmodelle abschließend mit einer Hauttextur versehen und mit Porträtaufnahmen des
ausgewählten Falles verglichen. Dabei wurde das Modell nach George als bestmögliches empfunden.(Abb. 3.12 und 3.13). Aufgrund der Vielfalt der Ausprägungsformen
von Gesichtsmerkmalen sowie zur Optimierung des Rekonstruktionsprozesses hinsichtlich der Zeit und Flexibilität wurde zudem eine Modellbibliothek in Blender erstellt. Diese
beinhaltet neben verschiedenen Augenfarben, Nasen- und Ohrformen, exemplarische Alterserscheinungen und Frisuren (Abb. 3.14).
78
S. Becker und D. Labudde
Abb. 3.13 Originalporträtaufnahmen der Nase der verstorbenen Person und das als bestmöglich
empfundene Modell
Abb. 3.14 Exemplarische Frisuren: blonde lange Haartracht (a), kurze braune Haartracht (b)
3.3 Schlussfolgerung und Ausblick
Der vorgestellte Rekonstruktionsprozess für Gesichtsweichteile von unbekannten Personen stellt durch die Verwendung von Open-Source-Software eine kostengünstige Alternative gegenüber kostenintensiven Verfahren dar. Es konnte gezeigt werden, dass der
Einsatz von lizenzfreier Software eine hohe Flexibilität bietet und Fotoaufnahmen ei-
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
79
ner Spiegelreflexkamera geeignet sind, um hinreichende computergestützte 3D-Modelle
zu erzeugen. Der hier beschriebene Prozess der Gesichtsweichteilrekonstruktion trägt zu
einer Kostenersparnis gegenüber klassischen Verfahren bei und ermöglicht eine schnelle
Identifizierung. Trotz der Eignung von Fotoaufnahmen wäre eine Optimierung des Rekonstruktionsprozesses und der rekonstruierten 3D-Modelle durch Einsatz von CT-Daten
denkbar. Mithilfe des Open-Source-Softwarepaketes InVesalius konnten DICOM-Daten
eines Schädels eines Testversuches in ein 3D-Modell überführt und dann in Blender importiert werden. Durch die Erstellung von Pythonskripten sowie einer Modellbibliothek
in Blender wurde eine weitere Optimierung hinsichtlich der Zeitersparnis des Rekonstruktionsprozess erreicht. Die Modellbibliothek könnte hinsichtlich sogenannter facial
expressions erweitert werden, da diese, wie bereits durch Landau et al. (1989) beschrieben, einen hohen Stellenwert hinsichtlich des Wiedererkennens einer unbekannten Person
einnehmen [25]. Die ermittelten Ergebnisse zeigen, dass die Rekonstruktion einzelner Gesichtsmerkmale insbesondere der Nase mittels Fotoaufnahmen einer Spiegelreflexkamera
und Open-Source-Software möglich sind.
Die klassischen und die hier vorgestellte moderne Methode der Gesichtsweichteilrekonstruktion bedingen das Vorhandensein eines unbekannten Leichnams. Dieser bildet
die Grundlage einer Rekonstruktion und einer sich anschließenden Identifizierung. Doch
selbst, wenn kein Leichnam aufgefunden wird, besteht die Möglichkeit einer Rekonstruktion der Weichteile. Bei dem Verfahren, welches in solchen Fällen Anwendung findet,
handelt es sich um das sogenannte DNA-Phänotyping. Die Grundlagen hierfür wurden
in den Jahren 2011 und 2013 von K. Ballantyne und M. Kayser welche Positionen in
der DNA beschrieben, die Auskunft über die Haar- und Augenfarbe eines Menschen geben können, gelegt [22, 23]. Das von ihnen entwickelte System nennt sich Irisplex und
ermöglicht durch die Typisierung von 24 Single Nucleotide Polymorphisms (SNP) die
gleichzeitige Vorhersage von Augen- und Haarfarbe. Neben dieser Vorhersage besteht
jedoch die Möglichkeit, SNPs zu finden, die Informationen über die Ausprägung von definierbaren Gesichtsmerkmalen enthalten. Mit diesen Forschungen setzen sich seit 2012
F. Liu und P. Claes sowie deren Forschergruppen auseinander [10]. Bislang reichen die
erzielten Ergebnisse jedoch nicht aus, um auf Grundlage der DNA eine zweifelsfreie Rekonstruktion des Aussehens eines unbekannten Toten zu erzielen. Nichtsdestotrotz stellen
die bisherigen Methoden zur Gesichtsweichteilrekonstruktion eine wertvolle Hilfe bei der
Identifizierung von unbekannten Toter dar und geben diesen ihr Gesicht zurück.
3.4 Computergestützte Rekonstruktion von Tatorten
und Großschadensereignissen
3.4.1 Einleitung
Die vorgestellte Prozesskette zur computergestützten Gesichtsweichteilrekonstruktion von
unbekannten Leichnamen lässt sich ebenfalls auf Bereiche, wie Tatorte, Flugzeugabstürze,
80
S. Becker und D. Labudde
Demonstrationen, Massenkatastrophen und viele weitere, erweitern und anwenden. Ganz
gleich, ob es sich um die Rekonstruktion von Tatorten oder Großschadensereignissen handelt, ist es notwendig, innerhalb kürzester Zeit hinreichend viele Informationen über mögliche Abläufe zu erhalten [13]. Die Tatortrekonstruktion an sich ist die Beobachtung und
anschließende Analyse von Ergebnissen aus einer Handlung, um Rückschlüsse auf mögliche Abläufe und Geschehnisse an relevanten Ereignisorten ziehen zu können [12]. Um
dies zu realisieren, existieren verschiedene Methoden, wie das klassische Handaufmaß
und manuelle Skizzieren. Bei dieser Technik werden alle relevanten Distanzen, Abstände
und Maße unter anderem per Maßband erfasst. Trotz zusätzlicher Verwendung von modernen Messmethoden, wie Tachymetern, werden nicht selten mehrere Stunden Erfassungsarbeit benötigt. Eine schnellere Möglichkeit der Tatortvermessung und -rekonstruktion
liegt im Einsatz von photogrammetrischen und laserscanbasierten Methoden in Verbindung mit kommerzieller oder Open-Source-Software zur Auswertung der Daten. Diese
Techniken erlauben es innerhalb kürzester Zeit, alle notwendigen Informationen an einem
Tatort zu digitalisieren und im Falle des Einsatzes eines 3D-Laserscanners sogar direkt
als 3D-Daten abzulegen. Für die anschließende Auswertung und Aufbereitung der erfassten Informationen existieren verschiedene Softwarepakete. Einige Vertreter, die bereits im
alltäglichen Polizeidienst Anwendung finden, wären aus kommerzieller Sicht AutoCAD
(Firma Autodesk), PhotoToPlan oder Scene (Firma FARO). Ein wesentlicher Nachteil
dieser und weiterer kommerzieller Beispiele liegt im jedoch teils hohen Anschaffungsund Wartungspreis. Aus diesem Grund findet vermehrt Open-Source-Software für die
Auswertung und Analyse von rekonstruierten Tatorten Verwendung. Je nachdem, ob Fotoaufnahmen oder Laserscandaten erhoben wurden, stehen für den Rekonstruktionsprozess
verschiedene Softwarepakete zur Verfügung, die ebenfalls in Kombination eingesetzt werden können. Im Falle einer Rekonstruktion basierend auf Fotoaufnahmen des Tatortes ist
die primäre Anwendung von VisualSfM in Verbindung mit CMPMVS und im Nachhinein von Blender möglich. Bei Laserscandaten kann die Auswertung und Analyse direkt in
Blender erfolgen. Dieses Softwarepaket ist ebenfalls bei einer manuellen digitalen Rekonstruktion bestens geeignet, vor allem wenn beispielsweise mehrere Jahre zurückliegende
Kriminalfälle erneut aufgerollt und lediglich basierend auf Tatortskizzen rekonstruiert
werden müssen, mit dem Ziel, zusätzliche Informationen durch Einsatz moderner Methoden generieren zu können.
3.4.2 Studie einer Tatortrekonstruktion an einem historischen Mordfall
Ein solcher historischer Fall war die Grundlage der hier vorgestellten Studie zur computergestützten Tatortrekonstruktion. Die Basis für den Rekonstruktionsprozess bildeten
Fotoaufnahmen und Tatortskizzen, aus denen mittels der Open-Source-Software Blender
ein 3D-Modell erstellt wurde.
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
81
Hintergründe zum ausgewählten Fall
Bei dem ausgewählten Fallbeispiel handelt es sich um einen Tötungsdelikt. Das Opfer
war ein junges Mädchen. Bei dem Täter handelte es sich um einen jungen Mann mittleren
Alters, welcher bereits im Kindesalter vermehrt durch Straftaten auffällig geworden ist.
Zudem verbrachte er mehrere Monate in psychologischer Betreuung wegen Übergriffen
auf Prostituierte. Das junge Mädchen sammelte Altpapier und betrat aus diesem Grund
die Wohnung des Täters. Dieser hatte krankheitsbedingt immer wieder sogenannte Aussetzer und begann, das Mädchen zu Tode zu würgen. Die Leiche versteckte er in seiner
Wohnung in einer selbst ausgehoben Grube, welche er mit Dielenbretter abdeckte. Aufgrund seiner kriminellen Vorgeschichte rückte der Täter immer näher ins Visier der in
dem Fall ermittelnden Polizeibeamten. Diese betraten einige Tage nach Verschwinden des
Mädchens dessen Wohnung und konnten auf Grundlage von sich ausbreitendem Leichengeruch die Ablagestelle der Kindesleiche mithilfe eines Spürhundes ermitteln. Der Tatort
wurde damals fotografisch und in Form von Skizzen dokumentiert.
Digitalisierung des Tatortes auf Basis terrestrischer Fotoaufnahmen
Auf Grundlage der übermittelten Fotoaufnahmen und Skizzen des Tatortes und der Umgebung erfolgte eine manuelle Rekonstruktion von diesen in Blender, da das entscheidende
Gebäude bereits vor Jahren abgerissen wurde. Nach Abschluss des Grundrisses wurden
entsprechend den dokumentierten Einzelheiten Mobiliar und Besonderheiten, wie Balken,
in die Szenerie eingearbeitet. Für eine realistischere Darstellung wurden zudem Texturen für Wände, Dielenböden sowie Licht- und Schatteneffekte integriert (Abb. 3.15
und 3.16). Die Besonderheit der computergestützten Rekonstruktion lag darin, dass je
nach zu analysierenden Tatbereichen verschiedene Kameraeinstellungen und -fahrten sowie Simulationen durchgeführt werden konnten.
Zusammenfassung
Der vorgestellte manuell rekonstruierte Tatort in Blender stellt eine kostengünstige und
flexible Alternative gegenüber klassischen Rekonstruktionsverfahren dar. Insbesondere
bei der Aufarbeitung von historischen Fällen, bei denen unter Umständen Tatortbereiche nicht mehr vorhanden sind, können diese innerhalb kürzester Zeit digital rekonstruiert
werden. Auf der anderen Seite besteht jederzeit die Möglichkeit, 3D-Modelle, welche mit
modernen Aufnahmeverfahren wie Laserscanning erzeugt wurden, in die Open-SourceSoftware zu importieren. Diese können im Nachhinein ebenfalls editiert werden. Auch
Simulationen sind durchführbar.
3.4.3 Unterstützung der Rekonstruktion durch Einsatz moderner
unbemannter Flugobjekte
Eine weitere Möglichkeit und Unterstützung der Datengewinnung eines schwer zugänglichen Tatortes, im kriminalistischen Sinn und in Form von Großschadensereignissen, liegt
82
S. Becker und D. Labudde
Abb. 3.15 Außenaufnahme des rekonstruierten Tatortes
Abb. 3.16 Innenaufnahme des rekonstruierten Tatortes
in dem zielgerichteten Einsatz von unbemannten Flugobjekten. Diese werden umgangssprachlich auch als Dronen bezeichnet und finden vermehrt Einsatz, wenn notwendige
Informationen nicht mittels terrestrischer Aufnahmen erlangt werden können. Zum einen
dienen Dronen demzufolge zur Informationsgewinnung, zum anderen als sicheres Ein-
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
83
Abb. 3.17 Prozesskette zur 3D-Rekonstruktion der Absturzstelle
Abb. 3.18 3D-Modell der Absturzstelle bei Le Vernet, Département Alpes-de-Haute-Provence,
Frankreich, (44ı 160 4700 N; 6ı 260 19; 100 O)
84
S. Becker und D. Labudde
Abb. 3.19 Zirkuläre Aufnahme eines virtuellen Großschadensereignisses und exemplarische programmierte Flugrouten im MikroKopter-Tool
satzmittel für Rettungskräfte, welche sich je nach Situation in Lebensgefahr begeben.
Ein Beispiel eines dramatischen Großschadensereignisses ist der Flugzeugabsturz des
Germanwings-Fluges 4U9525 im März 2015. Dieser wurde durch einen Co-Piloten bewusst herbeigeführt, und alle 150 Insassen kamen dabei ums Leben. Die Absturzstelle
befand sich in den französischen Alpen, sodass sie lediglich mit einem Helikopter erreicht
werden konnten. Dieser Umstand führt zu einer logistischen Problematik innerhalb kürzester Zeit nach dem Absturz gezielt Rettungskräfte und Ermittlungsgruppen gefahrlos
einzusetzen. Aus diesem Grund besteht die Möglichkeit, gezielt Dronen bei derart schwe-
3
Computergestützte Gesichtsweichteil- und Tatortrekonstruktion
85
Abb. 3.20 3D-Modell des
Wasserturms in frontaler Sicht
ren und vor allem unzugänglichen Schadensereignissen einzusetzen. Handelsübliche Dronensysteme sind standardmäßig mit RGB-Kameras für Luftbildaufnahmen ausgestattet
und können mit sogenannten Payloads (Thermalkameras, 3D-Scanner etc.) aufgerüstet
werden. Basierend auf Studien von unter anderem Püschel et al., welche terrestrische
und Luftbildaufnahmen für die 3D-Rekonstruktion von Sehenswürdigkeiten verwendet
haben, erfolgte der Einsatz eines Dronensystems in Kombination mit der vorgestellten
Open-Source-Prozesskette zur 3D-Rekonstruktion von Großschadensereignissen. Bei der
eingesetzten Drone handelt es sich um einen MikroKopter MK-ARF OktoXL 6S12. Dieser besitzt eine maximale Reichweite von 4000 m und eine maximal erreichbare Höhe von
5000 m. Bei vollständig aufgeladenen Akkus beträgt die mögliche Flugzeit etwa 45 Minuten, durch zusätzliche Payloads kann sie aber reduziert werden. Mithilfe der zugehörigen
Software MirkoKopter-Tool V2.12a ist es möglich, vorab geplante Wegpunkte zu definieren, die automatisch von der Drone angesteuert werden. Zusätzlich besteht die Möglichkeit, Auslösesequenzen für Kameraaufnahmen sowie Haltezeiten an den Wegpunkten
einzustellen. Als primärer Test für die Rekonstruktion eines Großschadensereignisses, in
diesem Fall des Flugzeugabsturzes, dienten Pseudoluftbildaufnahmen von Google-Earth.
Die Aufnahmen wurden mittels eines virtuellen zirkulären Fluges um die Absturzstelle
herum aufgenommen, und mittels der Prozesskette wurde ein 3D-Modell aus diesen generiert (Abb. 3.17 und 3.18) [13].
86
S. Becker und D. Labudde
Für den Fall, dass sich ein Ereignisraum über mehrere Kilometer hin erstreckt, können
sich überlappende zirkuläre Flugrouten mittels der Drohnensoftware programmiert und
abgeflogen werden (Abb. 3.19a, b und e). Diese Aufnahmebereiche werden zuerst separat
und im Anschluss auf Basis der Überlappungen in ein geschlossenes 3D-Modell überführt
(Abb. 3.19 c und d).
Als proof of concept für die Generierung von 3D-Modellen aus realen Luftbildaufnahmen diente der Wasserturm in Mittweida. Von diesem wurde, aufgrund ungünstiger
Wetterbedingungen, ein linear verlaufender Videofeed aufgenommen, aus welchem wiederum mehrere Fotoaufnahmen extrahiert wurden. Mithilfe der Open-Source-Prozesskette
konnte letztendlich ein 3D-Modell erstellt werden (Abb. 3.20). In weiterführenden Arbeiten erfolgen zudem zirkuläre Aufnahmen mit anschließender 3D-Rekonstruktion.
Literatur
1. Burrath, S.: Visuelle Personenidentifizierung und polizeiliche Personenbeschreibung: Praxishandbuch. Verlag für Polizeiwiss. Lorei (2009)
2. da Costa Moraes, C.A., Dias, P.E.M., Melani, R.F.H.: Demonstration of protocol for computeraided forensic facial reconstruction with free software and photogrammetry. Journal of Research
in Dentistry 2(1), S. –77 (2014)
3. Daniela, B.: Computergestützte Weichteildickenmessung an CT-Aufnahmen des Schädels von
verstorbenen Personen. Luchterhand Verlag (2007)
4. Eugene, L.: Open Source Tools for 3D Forensic Reconstructions – Part 3. AI-3D, 3D Forensic
Measurement Company (2011)
5. Furukawa, Y., Ponce, J.: Accurate, dense, and robust multiview stereopsis. Pattern Analysis and
Machine Intelligence, IEEE Transactions on 32(8), 1362–1376 (2010)
6. Gottschaldt, U.: Anthropologische Untersuchungen zur Geschlechtsbestimmung adulter Individuen sowie zur Altersschaetzung subadulter Individuen (2003)
7. Kersten, T.P., Lindstaedt, M., für Photogrammetrie, L., Hebebrandstrasse, L.: Generierung von
3D-Punktwolken durch kamera-basierte low-cost Systeme–Workflow und praktische Beispiele
(2012)
8. Kreutz, K., Verhoff, M.A.: Forensische Gesichtsrekonstruktion–Identifizierung bei Skelettfunden. Dtsch Arztebl 104(17), 1160–5 (2007)
9. Lewis, M.B.: Familiarity, target set and false positives in face recognition. European Journal of
Cognitive Psychology 9(4), 437–459 (1997)
10. Liu, F., van der Lijn, F., Schurmann, C., Zhu, G., Chakravarty, M.M., Hysi, P.G., Wollstein, A.,
Lao, O., de Bruijne, M., Ikram, M.A., et al.: A genome-wide association study identifies five
loci influencing facial morphology in europeans (2012)
11. Resig, M.R.: Rapid 3d scene reconstruction from kite-based aerial imagery using open source
structure from motion. Ph.D. thesis (2015)
12. Se, S., Jasiobedzki, P.: Instant scene modeler for crime scene reconstruction S. 123–123 (2005)
13. Spranger, M., Heinke, F., Becker, S., Labudde, D.: Towards drone-assisted large-scale disaster
response and recovery. ACCSE 16 – unpublished (2015)
Literatur
87
14. Stephan, C., Murphy, S.: Mouth width prediction in craniofacial identification: cadaver tests of
four recent methods, including two techniques for edentulous skulls. J Forensic Odontostomatol
27(1), 2–7 (2008)
15. Stephan, C.N.: Facial approximation: An evaluation of mouth-width determination. American
journal of physical anthropology 121(1), 48–57 (2003)
16. Stephan, C.N., Henneberg, M., Sampson, W.: Predicting nose projection and pronasale position
in facial approximation: a test of published methods and proposal of new guidelines. American
journal of physical anthropology 122(3), 240–250 (2003)
17. Uerlings, H.: Zur Geschlechtsbestimmung von menschlichen Skelett-teilen. Disseration, Institut
für Anthropologie und Humangenetik, Friedrich-Schiller-Universität Jena (1991)
18. Verdier-Sévrain, S., Bonté, F., Gilchrest, B.: Biology of estrogens in skin: implications for skin
aging. Experimental dermatology 15(2), 83–94 (2006)
19. Verhoff, M., Kreutz, K., Jopp, E., Kettner, M.: Forensische Anthropologie im 21. Jahrhundert.
Rechtsmedizin 23(2), 79–84 (2013)
20. Verhoff, M.A.: Forensische Osteologie: problematische Fragestellungen. Lehmanns Media
(2008)
21. Verzé, L.: History of facial reconstruction. Acta Bio Medica Atenei Parmensis 80(1), 5–12
(2009)
22. Walsh, S., Lindenbergh, A., Zuniga, S.B., Sijen, T., de Knijff, P., Kayser, M., Ballantyne, K.N.:
Developmental validation of the irisplex system: determination of blue and brown iris colour
for forensic intelligence. Forensic Science International: Genetics 5(5), 464–471 (2011)
23. Walsh, S., Liu, F., Wollstein, A., Kovatsi, L., Ralf, A., Kosiniak-Kamysz, A., Branicki, W.,
Kayser, M.: The hirisplex system for simultaneous prediction of hair and eye colour from dna.
Forensic Science International: Genetics 7(1), 98–115 (2013)
24. Werner, G.: Weichteilverschiebung im Gesicht bei Personen in ste-hender und liegender Position. Ph.D. thesis, Medizinische Fakultät der Uni-versität des Saarlandes (2009)
25. Wilkinson, C.: Facial reconstruction–anatomical art or artistic anatomy? Journal of anatomy
216(2), 235–250 (2010)
26. Wu, C.: Siftgpu: A gpu implementation of scale invariant feature transform (sift) (2007)
27. Ziegler, M.: 3D-Rekonstruktion von Objekten mittels „Structure-from-Motion“ aus einer photogrammetrischen Aufnahme mit den Program-men VisualSfM und CMPMVS. Gemeinsame
Tagung 2014 der DGfK, der DGPF, der GfGI und des GiN (2014)
4
DNA-Phänotypisierung
Anne-Marie Pflugbeil, Karlheinz Thiele und Dirk Labudde
4.1
DNA-Analytik im forensischen Alltag
Mit der Entwicklung der Polymerasekettenreaktion (engl. polymerase chain reaction
(PCR)) im Jahre 1987 durch K. Mullis hat die Analyse von Biomolekülen wie DNA oder
RNA und deren molekularen Besonderheiten einen enormen Aufschwung erlebt [44].
Dieser Fortschritt eröffnete gerade im Bereich der forensischen DNA-Analytik ungeahnte
Möglichkeiten. Durch Steigerung der Sensitivität und Spezifität der Verfahren gelingt es
immer mehr, Informationen auf DNA-Ebene, auch im Hinblick auf Mikrospuren oder
stark zerstörte Proben, zu extrahieren. Zurückgelassene DNA am Tatort stellt ein zunehmend wichtiges Indiz in der Kette der Ermittlungen zur Aufklärung eines Verbrechens
oder zur Entlastung verdächtiger Personen dar [55].
Die Hauptaufgabe des Faches liegt in der Analyse von DNA aus zellkernhaltigen Zellen
von z. B. am Tatort gesichertem biologischem Spurenmaterial unterschiedlicher Herkunft
(z. B. Blutspuren, Speichel, Hautabriebspuren, Spermaspuren, Vaginalepithelzellen, HaaA.-M. Pflugbeil ()
Wissenschaftliche Mitarbeiterin im Forensic Science Investigation Lab (FoSIL), University of
Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: pflugbei@hs-mittweida.de
K. Thiele
Gesundheitsamt – Landkreis Zwickau
Werdauer Straße 62, 08056 Zwickau, Deutschland
E-Mail: karlheinz.thiele@landkreis-zwickau.de
D. Labudde
Lehrstuhl für Bioinformatik und Forensik, Leiter Forensic Science Investigation Lab (FoSIL),
University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: labudde@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_4
89
90
A.-M. Pflugbeil et al.
re, Knochen, Zähne) zur Beantwortung diverser Fragestellungen. Daneben können bei
spezifischen Anforderungen an die Analytik auch aus weiteren Zellkompartimenten, wie
den Mitochondrien (mtDNA), individuenspezifische Informationen erlangt werden. In den
meisten Fällen geht es darum, der entsprechenden Spur eine Identität zuzuordnen, um z. B.
Gewaltverbrechen aufzuklären. Eine besondere Herausforderung entsteht bei komplexen
Spurenfällen. Hier bleibt das Aufschlüsseln von sogenannten Spurenmischungen, welche
die DNA-Profile mehrerer Personen beinhalten, nicht aus. Im Rahmen der Abstammungsbegutachtung werden Untersuchungen zur Klärung verschiedener verwandtschaftlicher
Konstellationen im Auftrag einer gerichtlichen Anordnung durchgeführt. Stehen für eine
Abstammungsbegutachtung nicht alle Beteiligten zur Verfügung, spricht man von einem
Defizienzfall, wobei die Abstammungsfrage durch Heranziehen naher Verwandter geklärt
werden kann. In Sonderfällen werden an das forensische Aufgabenspektrum Fälle aus der
klinischen Diagnostik herangetragen [39]. Zu nennen sind hier die Chimärismusanalyse1
nach Knochenmarkstransplantationen oder die Zwillingsdiagnostik bei genetischen Defekten [31, 42].
Eine in der forensischen Routine nicht alltägliche Untersuchungsstrategie, mit der Anhaltspunkte zum Aussehen einer Person (Tatverdächtiger, vermisste Personen) auf Grundlage des individuell gespeicherten DNA-Codes erhalten werden können, zeigt das Potential etwaiger Untersuchungen im Rahmen polizeilicher Ermittlungen. Diese wird im
Abschn. 4.3 thematisiert.
4.2 Von der Spur zum DNA-Profil
4.2.1
Workflow
Bis zur Erstellung eines DNA-Profils aus dem Zellmaterial einer relevanten Tatortspur
sind mehrere Arbeitsschritte notwendig (Abb. 4.1). Der Erfolg jedes einzelnen Arbeitsschrittes, von der Spurensicherung bis hin zur Genotypisierung, ist dabei zum einen abhängig vom eingesetzten Nachweissystem sowie von dessen Sensitivität und Spezifität. Zum
anderen beeinflussen die Qualität und Quantität des biologischen Templates, der Anteil
potentieller Inhibitoren (z. B. Huminsäure, Melanin, Hämoglobin, Proteine, Kollagen) sowie mögliche DNA-Verluste durch das Extraktionsverfahren, die Auswahl des jeweiligen
Nachweis- bzw. Analyseverfahrens [1, 38, 43, 49]. Die Spurenanalytik beginnt mit einer
geeigneten Sicherung der Spur am Tatort. Die Art der Sicherung richtet sich dabei nach
der Beschaffenheit des Untersuchungsmaterials. Wie in Abschn. 4.1 bereits erwähnt, sind
gesicherte Körperflüssigkeiten, wie Blut, Speichel oder Hautkontaktspuren die häufigsten zu analysierenden Untersuchungsmaterialien. In der Spurenkunde wird zusätzlich für
DNA-Analysen geeignetes Vergleichsmaterial benötigt. Seltener und zudem aufwendiger
1
Als Chimärismusanalyse wird die quantitative Messung des Anteils an Spender- und Empfängerhämatopoese nach einer allogenen Stammzell- oder Knochenmarktransplantation bezeichnet.
4
DNA-Phänotypisierung
91
ist die Genotypisierung von Knochen- oder Zahnmaterial. Bei teilweise oder vollständig
skelettierten Leichen stellt dies jedoch meist die einzige Möglichkeit zur DNA-Extraktion
dar. Eine Reihe von Autoren verfolgen daher stetig eine Methodenoptimierung ausgehend von der Probenpräparation bis hin zur DNA-Aufreinigung und Genotypisierung von
Knochen- bzw. Zahnmaterial [2, 16, 18, 28, 38]. Nachdem eine Spur abgenommen und
durch ein geeignetes Extraktionsverfahren DNA isoliert wurde, muss der Anteil extrahierter DNA in der Lösung bestimmt werden. Um sich Zugang zu relevanten Faktoren,
wie DNA-Konzentration, PCR-Inhibitoren oder den DNA-Degradationsgrad, welche den
weiteren Analysegang im Labor maßgeblich bestimmen, zu verschaffen, werden in der
Praxis verschiedene Quantifizierungstechniken angewandt. Die eingesetzten Systeme basieren heutzutage hauptsächlich auf dem Prinzip der quantitativen real-time PCR (qPCR).
Hierbei wird es möglich, den Verlauf der PCR in Echtzeit zu verfolgen und die amplifizierten Genfragmente zu quantifizieren [9, 24, 45]. Mit der ermittelten DNA-Konzentration
kann anschließend der DNA-Input in die PCR zur Vervielfältigung spezifischer Marker,
entsprechend der Kit spezifischen Nachweisgrenzen und Reaktionsoptima, besser geplant
werden. Der nächste logische Schritt besteht in der Untersuchung mehrerer Marker zur
Typisierung in einem Reaktionsansatz. Zur Erhöhung der Diskriminationkraft bei der genetischen Individualisierung werden in der Praxis mehrere molekulare Marker simultan
durch die Verwendung von kommerziellen und validierten Multiplex-PCR Kits in einem
Reaktionsansatz amplifiziert. Je nach Fragestellung steht ein großes Repertoire an sehr
unterschiedlichen DNA-Templates und Markern für die Typisierung zur Verfügung (vgl.
Abschn. 4.2.2). Folgende hinreichend evaluierte Analyseverfahren werden für die Begutachtung genutzt [22]:
autosomale Mikrosatellitenpolymorphismen,
gonosomale Mikrosatelliten oder Polymorphismen (X-, Y-STR),
diallele Einzelbasen- oder Insertions-/Deletionspolymorphismen (SNP / InDel),
Sequenzpolymorphismen der hypervariablen Regionen des D-Loops der mitochondrialen DNA (mtDNA HV 1–3).
Zusätzlich wird mindestens ein STR oder SNP-unabhängiger Lokus zur genotypischen
Bestimmung des Geschlechts untersucht (z. B. Amelogenin). Im Anschluss an die Vervielfältigung entsprechender Systeme erfolgt die Sequenzierung, welche heutzutage häufig
nach dem Sanger-Prinzip abläuft, und die PCR-Produktanalyse. In der Routine gegenwärtig noch weit verbreitet, kommt hierzu oftmals eine fragment- und fluoreszenzbasierte
Technologie (Kapillarelektrophorese) zur präzisen und reproduzierbaren Trennung der
amplifizierten Fragmente zum Einsatz. Im Ergebnis erfolgt die Darstellung des personenbzw. spurenbezogenen DNA-Profils als Elektropherogramm. Neue sensitive Technologien
wie Next Generation Sequencing (NGS), das in der medizinischen Genomanalyse bereits
weit verbreitet ist, sollen zukünftig o. g. Verfahren auch in der forensischen Molekulargenetik ablösen. Sogenannte massive parallele Sequenzierungen überzeugen an dieser Stelle
durch einen hohen Informationsgewinn, da eine Vielzahl verschiedener Marker gleichzei-
92
A.-M. Pflugbeil et al.
Abb. 4.1 Workflow in der forensischen Molekulargenetik. Die abgebildete Prozesskette zeigt die
beschriebenen Hauptschritte von der Spurensicherung bis hin zur PCR-Produktanalyse und Gutachtenerstellung
tig analysiert werden können. Daneben ermöglicht diese Technologie einen hohen Probendurchsatz und einen tieferen Einblick in spezifische DNA-Varianten [4, 54]. Dies könnte
zukünftig auch zu einem methodischen Vorteil bei geringen DNA-Mengen oder stark fragmentierter DNA führen. Gleichzeitig kann in diesem Zusammenhang eine Steigerung der
biostatistischen Aussagekraft erhaltener DNA-Profile erreicht werden. Eine Vielzahl von
Produktanbietern auf dem forensischen Sektor spezialisieren sich gegenwärtig auf die methodische Weiterentwicklung von NGS-basierter Chemie für den Einsatz in der Forensik.
Nach Abschluss der Arbeiten zur Individualdiagnostik im Labor wird ein spurenkundliches Gutachten erstellt. Die Form des Gutachtens ist prinzipiell an keine Form gebunden,
sollte sich aber an den allgemein üblichen Inhaltsvorgaben (Sachverhalt, Material, Methoden, Ergebnisse, Beurteilung) orientieren. Innerhalb der Beurteilung sind die Ergebnisse
zu werten und zu gewichten. Abweichungen von der Erwartung sind zu erklären, biostatistische Berechnungen vorzunehmen und deren Grundlage zu benennen [39].
4.2.2
DNA-Marker in der Forensischen Molekulargenetik
Aus naturwissenschaftlicher Sicht beruht eine Individualisierung von Personen auf der
Grundlage der Heterogenität des genetischen Code. Sowohl kodierende als auch nichtkodierenden Abschnitte auf der DNA bedingen diese Heterogenität. Bei kodierenden Bereichen beschränkt sich die Analyse derzeit noch auf das Genprodukt [39]. In Abhängigkeit von der zugrunde liegenden Fragestellung, der Beschaffenheit des biologischen
Templates oder der biologischen Spur, können im Rahmen der molekularen Analyse unterschiedliche heterogene regions of interest, sog. DNA-Marker, untersucht werden, um
die genetische Information von zwei Personen mit hinreichend hoher Wahrscheinlichkeit
zu unterscheiden.
4
DNA-Phänotypisierung
93
Short Tandem Repeats (STRs)
Für die Erstellung eines DNA-Profils im Rahmen von Teilaufgaben des Faches, orientiert
sich die forensische Molekulargenetik fast ausschließlich an spezifischen Strukturmerkmalen der nukleären DNA, welche sich vorrangig in Intronbereichen (nicht-kodierend)
befinden. Somit werden diese als Unterbrechungen der kodierenden Gensequenz (Exon)
unabhängig von der Translation des primären RNA-Transkripts betrachtet [39] und die
Heterogenität wird ausschließlich durch Mutation und Rekombination erreicht. Voraussetzung für alle auf dem humanen Kerngenom beruhenden Analysen, STRs eingeschlossen,
ist das Vorliegen von mindestens einem intakten Zellkern einer Körperzelle. STRs zählen ihrem Ursprung nach zu den verstreut im Genom vorkommenden Mikrosatelliten.
Die Kategorisierung des molekularen Markers beruht auf der geringen Länge von 2–7
Basenpaaren des spezifisch zu einem STR gehörigen Sequenzmotives, das eine maximale Repeathäufigkeit von ca. 100 aufweist. Letzteres beschreibt die Merkmalsausprägung
(Allel) eines amplifizierten STR-Systems in einem diploiden humanen Chromosomensatz. Spezifische PCR-Produkte besitzen in der Regel eine Länge bis zu ca. 500 bp [11].
Bei Proben, welche z. B. durch eine lange Lagerungszeit oder durch Umweltfaktoren
wie Hitze und Feuchtigkeit beeinflusst sind, kann dieser Längenbereich nachteilig sein.
Statistisch betrachtet sind längere DNA-Fragmente häufiger von Degradationsprozessen,
welche den DNA-Strangbruch und eine chemische Modifikation einzelner Nukleotide
impliziert, beeinträchtigt, weshalb das entsprechende Merkmal möglicherweise nicht vervielfältigt und beurteilt werden kann [11]. Aus diesem Grund optimieren die Anbieter spezifische Fragmentlängenbereiche, sodass selbst bei potentiell stark fragmentierter DNA
ein aussagekräftiges Ergebnis erreicht werden kann. Nach gegenwärtigen Empfehlungen
werden für Abstammungs- und spurenkundliche Untersuchungen mindestens 15 STRSysteme analysiert [22, 46]. Für die Anwendbarkeit in der forensischen Praxis müssen
die STR-Systeme verschiedene Kriterien erfüllen [12]. Beispielsweise müssen die verwendeten STRs hochpolymorph sein und dürfen nicht mit Genen oder anderen in die
Untersuchung einbezogenen STRs gelinkt sein. Ihre Merkmalsausprägung muss unabhängig von der anderer Systeme sein, auf die z. B. gerichtete Selektionsdrücke wirken.
Um diese Eigenschaften zu überprüfen, werden in der Validierungsphase eines solchen
Systems umfangreiche Daten gesammelt und statistischen Tests unterzogen. Wichtige
Eckdaten zur abschließenden Auswahl eines Systems für forensische Zwecke sind dessen
chromosomale Verortung und seine theoretische sowie beobachtete Heterozygotenrate.
Diese setzt sich aus der Anzahl der realisierten Allele und der Frequenz ihres Auftretens
zusammen. Wirken keine Selektionsdrücke spezifisch gegen eines oder mehrere Allele, und ist die untersuchte Population hinreichend groß, entsteht näherungsweise eine
Gauß-Verteilung [17]. Dies wiederum ist die Voraussetzung für ein verlässliches Unterscheidungspotential des betreffenden STR-Systems sowohl innerhalb einer Bevölkerung
als auch populationsübergreifend [55].
94
A.-M. Pflugbeil et al.
Single Nucleotide Polymorphisms (SNPs)
Neben den bereits beschriebenen STRs, welche durch ihre Struktur zu den Längenpolymorphismen zählen, stellen SNPs eine weitere Form der genetischen Heterogentität
zwischen humanen Genomen dar. Im Vergleich zur STRs wird die Variation durch den
Austausch eines einzelnen Nukleotids im Genom erklärt. Daher werden SNPs zu den
binären Sequenzpolymorphismen gezählt. Im Gegensatz zu anderen Polymorphismen,
wie den Satelliten-DNAs, handelt es sich bei forensisch relevanten SNPs überwiegend
um biallelische Marker [5, 10], d. h., sie weisen zwei Merkmalszustände, ein ursprüngliches (anzestrales) und ein mutiertes Allel, auf. Im Hinblick auf die Verteilung dieser
Sequenzpolymorphismen ist davon auszugehen, dass diese mit einer mittleren Dichte von
ca. 1 SNP/300 bp verteilt in kodierenden sowie in nichtkodierenden Teilen des Genoms
vorkommen [39]. Derzeit sind 97.535.033 validierte SNP-Cluster und 85.591.044 SNPs
des humanen Genoms in der Datenbank Datenbank!dbSNP des National Center for Biotechnology Information (NCBI) gespeichert2 [57]. Der methodische Vorteil gegenüber
STRs liegt in der Gestalt der Polymorphismen in Form von Einzelbasenaustauschen,
sodass während der Analyse lediglich kurze Sequenzbereiche amplifiziert werden müssen
(<100 bp). Dadurch eignen sich diese Polymorphismen insbesondere gut für die Analyse von stark degradierter DNA, wie sie oft bei Skelettfunden mit langen postmortalen
Intervallen (PMI) vorliegt. Die größte Herausforderung bei der SNP-Analyse besteht zudem in der Weiterentwicklung von anwendbaren, robusten Multiplexkits zur simultanen
Amplifikation von möglichst vielen Loci, welche für die forensische Praxis eingesetzt
werden können. Ein einzelner biallelischer SNP würde wenig bis gar keine hilfreichen
Informationen liefern. Jedoch wird es möglich, mit einer angemessen großen Anzahl und
einer intelligenten Kombination von SNPs die Diskriminationskraft für den Identifikationsfall zu erhöhen [6, 53]. Die in der Forensik relevanten SNPs werden in vier Kategorien
unterteilt [8]:
Typ 1 IISNPs: Individual Identification SNPs sind zur Individualdifferenzierung eingesetzte Polymorphismen. Eine hohe Diskriminationkraft wird durch eine hohe
Anzahl von SNPs erreicht. Innerhalb des SNPforID Projektes wurde beispielhaft
ein Analyseset von 52 autosomalen SNPs zur humanen Identifizierung veröffentlicht [53].
Typ 2 LISNPs: Lineage Informative SNPs umfassen gekoppelte SNPs, die aus der Kombination der Sequenzinformation einen sogenannten Haplotypen bilden. LISNPs
werden für evolutionäre Untersuchungen und für die Abstammungsanalyse als multiallelische Marker eingesetzt. Hierzu werden SNPs des Y-Chromosoms und mitochondrialen Genoms genutzt.
Typ 3 AISNPs: SNPs, die Rückschlüsse auf die geografische Herkunft eines Individuums
zulassen, werden als Ancestry Informative SNPs bezeichnet. Zu dieser Kategorie werden sowohl autosomale SNPs, die z. B. selektionsbedingt populationsspe2
Version 144, Release vom 8. Juni 2015.
4
DNA-Phänotypisierung
95
zifische Mutationsmuster aufweisen, als auch selektionsneutrale Y-chromosomale
SNPs, gezählt [20].
Typ 4 PISNPs: Als Phenotype Informative SNPs werden Polymorphismen bezeichnet,
welche Aussagen bzgl. des Phänotyps eines Individuums, über biogeografische
Rückschlüsse hinaus, zulassen (Hautfarbe, Haarfarbe oder Augenfarbe). Anders als
mit AISNPs können mit diesen Markern direkte Informationen zur physischen Konstitution erlangt werden, mit denen eine Personenidentifikation unterstützt werden
kann. Für die Phänotypisierung werden überwiegend gengekoppelte SNPs verwendet, welche mit Pigmentierungsinformationen assozieren und keinen Einfluss auf
die Genexpression besitzen [53].
4.3
Phänotypisierung – DNA als biometrisches Merkmal
Mit der Möglichkeit anhand von DNA-Polymorphismen (PISNPs, vgl. Abschn. 4.2.2) äußerliche Merkmale von Personen aus einer biologischen Spur, die am Tatort gesichert
wurde, vorherzusagen, entwickelte sich eine neue Ära im Bereich der DNA-Intelligenz.
In Fällen, in denen es kaum bis keine Augenzeugenaussagen innerhalb eines Strafverfahrens gibt, können polizeiliche Ermittlungen durch das Einbeziehen derartiger Analysen
unterstützt werden. Auch für Fälle, in denen die Suche nach dem ermittelten STR-Profil
in der Datenbank erfolglos bleibt oder sich die Spur im Ergebnis der Analyse aufgrund
von qualitativen und quantitativen Aspekten nicht für die Personenidentifizierung eignet,
können so weitere ermittlungsunterstützende Informationen erlangt werden.
4.3.1 Phänotyp
Im Allgemeinen beschreibt der Phänotyp eines Individuums die Gesamtheit aller äußerlichen Merkmale [23], wie Körperhöhe [3, 35, 71], Robustizität [34, 40], Augenfarbe [21, 67, 69] und Haarfarbe [25, 59, 68]. Häufig werden die bestimmbaren äußerlichen
Merkmale in der Literatur als External Visible Characteristics (EVCs) bezeichnet [32].
Auf der Grundlage solcher zusätzlicher molekularer Informationen kann eine Art genetisches Phantombild von einer Person erstellt werden (Abb. 4.2). Mit Hilfe von bereits
etablierten Analyse-Assays ist es gegenwärtig möglich eine gesicherte statistische Aussage über die entsprechende phänotypische Ausprägung zu treffen. Darüber hinaus sehen
Experten ein hohes Anwendungspotential für die forensische Praxis. Der Einsatz phänotypischer Merkmale kann nicht nur bei der Suche nach Tatverdächtigen innerhalb eines
Strafverfahrens hilfreich sein, sondern auch bei der Rekonstruktion von Skelettfunden in
der anthropologischen Praxis oder vermissten Personen. Auch im Falle der computergestützten Gesichtsweichteilrekonstruktion können entsprechende Informationen, wie die
Augenfarbe, einbezogen werden. Innerhalb der nächsten Dekade soll die Vorhersage eines
96
A.-M. Pflugbeil et al.
Abb. 4.2 DNA-Phänotypisierung mittels SNPs
Gesichts ausschließlich auf Basis genetischer Merkmale möglich sein. Für die Etablierung
derartiger phänotypischer Assays in der forensischen oder auch anthropologischen Praxis
bedarf es in den nächsten Jahren eines tieferen Einblick in genetische Varianten, welche
mit Phänotyp relevanten Genen gekoppelt sind, sowie weiterer Studien an heterogenen
Populationsgruppen, um die gewonnenen Ergebnisse statistisch abzusichern [32].
4.3.2 Phänotypisierungssysteme
Die Weiterentwicklung und Validierung von Systemen zur Vorhersage phänotypischer
Merkmale für die forensische Praxis wurde in den letzten Jahren durch verschiedene
Arbeitsgruppen auf dem Gebiet der forensischen Molekularbiologie vorangetrieben. In
diesem Abschnitt werden Systeme zur Detektion phänotypischer Merkmale, die im Rahmen von wissenschaftlichen Arbeiten entwickelt wurden, vorgestellt und der aktuelle
Stand der Forschung aufgegriffen und diskutiert.
Augenfarbe
Die Arbeitsgruppe um Manfred Kayser von der Abteilung für forensische Molekularbiologie der Erasmus-Universität in Rotterdam setzte 2011 einen ersten Meilenstein mit
der Veröffentlichung eines sensitiven SNP-Systems zur Vorhersage der Augenfarbe, das
bereits 2009 evaluiert wurde. Das als IrisPlex bezeichnete Multiplexsystem erlaubt die
Typisierung von sechs informativen SNPs zur Diskriminierung von blauer und brauner
Augenfarbe bei Personen mit einer Genauigkeit von über 90 % aus eine Probe [65, 67]. Die
entsprechende Information über relevante Genkandidaten und assozierende SNPs wurde durch weltweite Genomstudien bereits exzessiv untersucht. Entsprechende, im Hochdurchsatz erzeugte Sequenzierungsdaten bildeten die Grundlage für die Auswahl von
Phänotyp relevanten SNPs [26, 50, 60]. Um die Diskriminationskraft solcher Vorhersagen
zu erhöhen, wurden in dieser Studie mehrere informative Gene, die mit der Augenfar-
4
DNA-Phänotypisierung
97
be korrelieren, betrachtet und sechs finale SNPs (HERC2, OCA2, SLC24A4, SLC45A2,
TYR, IRF4) ausgewählt. Für die Studie wurden zunächst 6168 Holländer mit europäischer
Abstammung typisiert. Das SNP-Multiplexsystem überzeugt gerade bei geringen Mengen
an DNA (<31 pg) durch eine hohe Sensitivität, sodass auch hier noch ein hoher Informationsgehalt aus dem Profil erhalten werden konnte. Diese Eigenschaft macht das System
besonders interessant für qualitativ minderwertige Tatortspuren. Für die Klassifizierung
der Augenfarbe wurde ein probabilistisches Modell verwendet [37]. Zur Bestimmung
der Vorhersagegenauigkeit wurden weitere Probanden verschiedener geografischer Abstammung mit dem System typisiert. Auf Grundlage von DNA-Daten des HGDP-CEPH
Panels3 konnte darüber hinaus ein Einblick über die Verteilung der SNP-Varianten in 51
Populationen erhalten werden, wodurch die Verlässlichkeit der Genotypisierung unabhängig von Informationen über die geografische Abstammung gezeigt werden konnte. Zur
Validierung der Ergebnisse wurde 2012 eine weitere Studie mit einem Umfang von 3840
europäischen Individuen veröffentlicht. Die Augenfarbe konnte hier für alle Personen mit
einer mittleren Genauigkeit von 94 % (91–98 %) bestimmt werden [69]. Diese Ergebnisse
unterstreichen das Vorhersagepotential von Irisplex und die Möglichkeit der Anwendung
und Weiterentwicklung solcher DNA-Werkzeuge in der forensischen Fallarbeit. Das System wurde in den Niederlanden bereits vom Gesetzgeber angenommen und wird dort in
der Strafverfolgung eingesetzt.
Haarfarbe
Eine Weiterentwicklung des o. g. Irisplex-Systems ist das von der Arbeitsgruppe um Kayser entwickelte und 2013 vorgestellte HIrisplex, mit dem es möglich ist, simultan Augenund Haarfarbe aus einer biologischen Spur vorherzusagen. Andere Arbeiten, wie die von
Sulem et al. und Valenzuale, stellten schon vorher die Grundlagen und Möglichkeiten für
eine Unterscheidung der Haarfarbe auf genetischer Ebene vor, jedoch mit geringer Praktikabilität und Einschränkungen im Detaillierungsgrad der spezifischen Farbausprägungen [60, 62]. Das Multiplexassay nutzt dabei phänotypkorrelierte Informationen auf Basis
von insgesamt 24 SNPs aus 11 Genen (MC1R, HERC2, OCA2, SLC24A4, SLC45A2,
IRF4, EXOC2, TRYP1, TYR, KITLG, PIGU/ASIP), inklusive der bereits im IrisPlex
vorgestellten sechs Augenfarben assoziierenden Varianten [7]. Für die Bestimmung werden zwei Vorhersagemodelle spezifisch für die Haar- und Augenfarbe genutzt, wobei
die möglichen Kombinationen von SNP-Ausprägungen, die mit definierten Häufigkeiten bestimmter Phänotypkombinationen zusammen auftreten, betrachtet werden. Dabei
assoziieren 22 SNPs für folgende Haarfarbenkategorien: blond, dunkelblond/hellbraun,
dunkelbraun, braunrot/rostbraun, rotblond, rot und schwarz. Das System ist sowohl für
low-Template-DNA (63 pg) als auch für degradierte DNA geeignet. Im Rahmen einer Studie an 1551 Individuen aus drei europäischen Nationen (Polen, Irland und Griechenland)
3
Das HGDP-CEPH Human Genome Diversity Cell Line Panel ist eine Sammlung bestehend aus
1063 kultivierten Lymphozytenzelllinien von 1050 Personen aus 52 Populationen der gesamten
Weltbevölkerung (Sitz in Paris).
98
A.-M. Pflugbeil et al.
wurde das Phänotypisierungssystem auf dessen Reliabilität untersucht. Hierbei erreichte das System eine durchschnittliche Genauigkeit für die Klassifikation der Haarfarbe in
die genannten Kategorien von > 70 %. Für die Reproduzierbarkeit der Resultate wurden weitere DNA-Proben weltweit analysiert (HGDP-CEPH Panel), wodurch die Aussage getroffen werden konnte, dass auch hier das Ergebnis für die individuelle Haarfarbe
unabhängig von der biogeografischen Herkunft, d. h. ohne gekoppelte Ancestry Informationen, analog zum IrisPlex-System, bestimmt wird. Weiterhin werden Assoziationen
zwischen möglichen Ausprägungen untersuchter Einzelmerkmale (Haar- und Augenfarbe) und die Verteilung der Kombination innerhalb der Populationsgruppen aufgestellt.
Eine bisher noch weitgehend ungeklärte Tatsache ist die altersabhängige Veränderung
der Haarfarbe im Laufe des Lebens. Ein möglicher Erklärungsansatz könnten hormonelle Änderungen, insbesondere während der Pubertät, sein [14, 51]. Allerdings sind
die genauen Mechanismen für dieses Phänomen auf molekularer Basis noch weitgehend
unbekannt und bedürfen weiterführender Studien an möglichen Varianten, die mit dem Alterungsmechanismus korrelieren. Als Weiterentwicklung des IrisPlex-Systems stellt diese
DNA-Phänotypisierungsmethode ein in der forensischen Fallarbeit akzeptiertes Vorhersagewerkzeug zur erstmaligen simultanen Bestimmung von Haar- und Augenfarbe einer
Person dar. Die praktische Anwendbarkeit sehen Experten vor allem in der Ergänzung von
lückenhaften, fallrelevanten Daten.
Hautfarbe
Neben Merkmalen wie der Augen- oder Haarfarbe besteht ein wachsendes forensisches
Interesse an der Vorhersage der Hautfarbe als phänotypisches Merkmal. Jedoch existieren gegenwärtig nur wenige Konsensusansätze, die eine Abhängigkeit der phänotypischen Ausprägung von epistatischen Effekten und Umwelteinflüssen wie Sonnenstrahlung
einbeziehen bzw. das Zusammenspiel dieser Faktoren beschreiben [47]. Ebenfalls sind
hier bisher im Vergleich zur Augen- oder Haarfarbe nur wenige verantwortliche SNPVarianten bekannt. In früheren Studien wurden bereits Divergenzen in der Verteilung für
Farbvariationen in Bevölkerungsgruppen mit einem eindeutigen Ursprung untersucht [27,
58]. Die größte Herausforderung liegt gegenwärtig noch in der Klassifikation von Populationen, bei denen durch den Einfluss der Co-Abstammung keine eindeutige Ausprägung
der Hautfarbe ermittelt werden kann. In einer 2014 publizierten Studie von Maroñas et
al. wurden genetische Unterschiede zwischen Bevölkerungsgruppen aus Afrika, Europa
und zusätzlich einer gemischten biogeografischen Bevölkerungsgruppe mit afrikanischen
und europäischen Vorfahren auf genetischer Ebene untersucht und entsprechende Allelfrequenzen der SNP-Variationen verglichen [41]. Die Phänotypisierung der spezifischen
Hautfarbe erfolgte unabhängig von DNA-Informationen durch spektrometrische Messungen und Fotoaufnahmen [58]. Grundsätzlich kann die Bestimmung der Hautfarbe durch
subjektive oder objektive Herangehensweisen durchgeführt werden. Mithilfe von subjektiven Methoden, wie Fotografien oder visuellen Bewertungen durch einen Dermatologen,
werden diskrete Farbklassen gebildet, in welche die individuellen Hautfarbinformation
eingeordnet werden können [19]. Mittels objektiver Methoden erfolgt eine Art Quan-
4
DNA-Phänotypisierung
99
tifizierung der Farbinformation, beispielsweise durch spektrometrische Anwendungen.
Durch Einbindung spezifischer Farbraummodelle (CIEL*ab und HSB)4 , welche die Dimensionen der Helligkeit, Sättigung und Reflexionsverhalten beschreiben, kann folgend
die Klassifizierung des Phänotyps in definierte Klassen vorgenommen werden [64, 70]. In
dieser Studie wurden aus einem Set von anfänglich 59 SNPs, die auf DNA-Ebene mit der
Hautfarbe in Beziehung stehen, zehn stark mit dem Merkmal korrelierende SNPs aus acht
Pigmentierungsgenen identifiziert und für eine Klassifikation von 285 Probanden europäischer und nichteuropäischer Herkunft eingesetzt. Assoziierende SNP-Varianten wurden
zu Beginn durch ein Screening an 1000 Genomen identifiziert. Die Diskriminationskraft
des Panels im forensischen Sinne wurde durch den Einsatz eines Online-Klassifikators,
basierend auf einem Naive-Bayes-Modell, beschrieben [30, 52].
Körpergröße
Die Einbindung der Körperhöhe als quantifizierbares Merkmal wird gerade im forensischen Bereich kontrovers diskutiert. Begründet ist diese Kontroverse in der hohen genetischen Komplexität des Merkmals im Vergleich zur Vorhersage von Haar- oder Augenfarbe. Beide zuletzt genannten phänotypischen Informationen sind weniger komplex und
intensiv erforscht. In den Jahren 2008 und 2009 erschienen drei Pionierarbeiten zur Bestimmung der Körperhöhe mittels identifizierter SNP-Kandidaten unter Berücksichtigung
von Vererbungsmechanismen in den Nachfolgegenerationen und einer Geschlechterabhängigkeit [3, 35, 71]. In Studien konnte gezeigt werden, dass die Erblichkeit des Merkmals ca. 80 % beträgt [35]. Einen weiteren limitierenden Faktor stellt die populationsabhängige Varianz bei Erwachsenen dar. Im Falle einer hohen genetischen Abhängigkeit
des Merkmals müssen folglich genomweite Assoziationsstudien (GWA-Studien), die eine
Typisierung von mehreren tausend Probanden umfassen, durchgeführt werden, um signifikante Markerkandidaten zu identifizieren und reproduzierbare Ergebnisse zu erlangen.
Nach aktuellem Stand ist man jedoch noch weit von einer ausreichenden verwertbaren
Datengrundlage zu korrelierenden Informationen entfernt. Im Rahmen von den bereits publizierten Studien an ca. 63.000 Individuen konnten 54 genetische Marker, die statistisch
signifikant mit der Körperhöhe assoziieren, identifiziert werden. Allerdings tragen diese
nur zu einem geringen Anteil zur bereits existierenden Wissensbasis über die Varianz der
Körperhöhe bei. Anhand einer Studie aus dem Jahr 2009 konnte die Körperhöhe lediglich
mit einer Vorhersagegenauigkeit von ca. 65 % bestimmt werden, was im Vergleich zur
Performanz der anderen vorgestellten SNP-Systeme relativ unzuverlässig ist [3]. Obwohl
davon ausgegangen wird, dass in naher Zukunft mehr genetische Varianten zur Vorhersage der Körperhöhe identifiziert werden (GIANT Consortium), ist im Moment noch nicht
4
CIEL*ab ist ein sogenanntes Tristimulusmodell, wobei in diesem Fall folgende Dimensionen einbezogen werden: Helligkeit (L*), Rot (a*), Gelb (b*). Das Farbmodell HSB nutzt zur Beschreibung
von Farbnuancen drei Eigenschaften: Farbton (Hue), Sättigung (Saturation) und Helligkeit (Brightness).
100
A.-M. Pflugbeil et al.
klar, ob diese Faktoren für eine DNA-basierte Vorhersage zuverlässig genug sind und den
forensischen Ansprüchen genügen.
Gesichtsmorphologie
Deutlich unverwechselbarer lässt sich ein Mensch durch seine Gesichtsmorphologie beschreiben. Problematisch für eine DNA-basierte Merkmalsvorhersage ist, ähnlich wie bei
der Körperhöhenschätzung, die genetische Komplexität der Gesichtsform. Einige Merkmale, wie die Gesichtshöhe oder die Position des Unterkiefers, werden stärker erblich
bestimmt als andere, und auch die generelle Morphologie des Gesichtsschädels ist stark
vererblich und nur zum Teil von Umwelteinflüssen abhängig [13]. Bisher existiert nur
ein unzureichendes Verständnis über die verantwortlichen genregulatorischen Prozesse
und korrelierende Genvarianten, die für die Vorhersage der Gesichtsmorphologie rein
auf DNA-Ebene genutzt werden können. Nur wenige Studien beziehen sich direkt auf
die Variabilität der Gesichtsmorphologie. Fan Liu et al. veröffentlichten 2012 eine der
wenigen Arbeiten auf dem Gebiet der Vorhersage der Gesichtsmorphologie auf DNAEbene [36]. Im Rahmen einer genomweiten Studie wurden fünf relevante Gene und assozierende Loci identifiziert, welche die Gesichtsform bedingen. Individuelle Ausprägungen
einzelner Gesichtsregionen wurden hierin unter Zuhilfenahme von anatomischen Landmarken zur Bestimmung von Weichteildicken aus MRI-Daten5 und Porträtfotos kartiert.
Die Landmarken können als definierte Messpunkte zueinander betrachtet werden und
dienen als objektive Parameter zur Beschreibung eines Gesichtes. Drei dieser fünf verantwortlichen Gene konnte eine übergeordnete Bedeutung bei der craniellen Entwicklung
des Gesichtes zugeordnet werden. Die anderen beiden Gene repräsentieren Schlüsselrollen im verantwortlichen molekularen Netzwerk. Eine weitere Studie, aufbauend auf dem
fundamentalen Wissen von Liu et al., wurde 2014 von Claes et al. präsentiert [13]. Das
Vorgehen der Wissenschaftler gestaltete sich hier etwas komplexer. Von jedem Probanden wurde zunächst ein 3D-Abbild des Gesichtes mit mehr als 7000 Einzelpunkten, zur
Generierung einer detaillierten Oberflächenstruktur, erstellt. Anders als bei Liu et al. sollten Parameter wie Geschlecht, Morphotyp und genetischer Einfluss auf die Morphologie
untersucht werden [13]. Auf DNA-Ebene untersuchten die Wissenschaftler insgesamt 76
SNPs, welche bereits in früheren Arbeiten als genetische Schalter für Gesichtsanomalien identifiziert wurden unter der Annahme, dass eine genbedingte Variation Einfluss
auf die Gesichtsform haben könnte. Um mögliche Auswirkungen o. g. Parameter auf
die Gesichtsmorphologie in Verbindung mit der genetischen Komponente identifizierter
Genvarianten zu beschreiben, wurde nachfolgend ein statistisches Modell genutzt. Resultierend konnten 24 SNP-Varianten in 20 verschiedenen Genen, die sich als hilfreich bei
der Vorhersage der Gesichtsform erwiesen, identifiziert werden.
Gerade im Bereich der digitalen Forensik könnte in Zukunft die rein DNA-basierte
Vorhersage der Gesichtsmorphologie eines der informativsten Werkzeuge bei der Rekonstruktion von Tatverdächtigen oder vermissten Personen sein. Aufbauend auf den Er5
MRI=Magnetic Resonance Imaging.
4
DNA-Phänotypisierung
101
kenntnissen aus beiden Studien müssen in Zukunft weitere weltweite Analysen zur Generalisierung der erlangten Ergebnisse und zur Wissenserweiterung über verantwortliche
Genvarianten erfolgen, sodass eine wissenschaftliche Basis für die Nutzung im forensischen Sektor entsteht.
4.4 Relevante Datenbanken
Das Aufkommen von Hochdurchsatzdaten aus genomweiten Studien bedingt die Weiterentwicklung von Datenbanken auch für den forensisch-molekulargenetischen Anwenderkreis. Für die Verarbeitung und den Informationsgewinn aus den Sequenzdaten
stehen der forensischen Community eine Reihe von öffentlich zugänglichen Datenbanken zur Verfügung. Gerade populationsspezifische Datenressourcen haben in den
letzten Jahren einen Entwicklungsaufschwung erlebt, begleitet durch den Bedarf an einer
übersichtlichen, schnellen Datenverarbeitung und dem öffentlichen Interesse an Populationsstudien. Die Hauptaufgaben der Datenbanken sind breit gefächert. Eine mittlerweile
unverzichtbare Datenbank in der Forensik, zur Auswertung von phylogeografischen Ychromosomalen Daten, ist die Referenzdatenbank Y-Chromosome Haplotype Reference
Database (YHRD)6 , die seit 2000 am Institut für Rechtsmedizin der Berliner Charité kuratiert wird [72]. Als Repositorium für Daten aus Y-chromosomalen Populationsstudien
geprüfter forensischer Qualität beinhaltet die Datenbank aktuell 365.578 Haplotypen7 .
Die YHRD bietet dem Nutzer die Möglichkeit, einen aus einer forensischen Probe ermittelten Haplotypen8 mit oder ohne Haplogruppe9 in den hinterlegten Populationsdaten
zu suchen, um dessen Frequenz und geografische Verbreitung zu ermitteln. Entscheidend
für forensische Fragestellungen ist neben dem eigentlichen Vorkommen des Haplotypen
in einer Bevölerungsgruppe die Haplotypfrequenz für die Aussage, ob dieser häufig oder
eher selten in einer Population oder Metapopulation beobachtet wurde. Die Zuordnung
zu einer ethnischen Großgruppe durch die Haplotypbestimmung stellt zunächst keine
phänotypische Klassifizierung im eigentlichen Sinn dar, kann jedoch bezüglich der Vorfahreninformation eine Grundlage dafür bilden. Die Bestimmung des Y-chromosomalen
Haplotypen ist schon lange Bestandteil forensisch-molekulargenetischer Analysen.
Bisher existiert kein direktes Repositorium, das einen Zugriff auf forensisch relevante
und bereits publizierte Phänotypisierungssysteme erlaubt. Jedoch bietet die Abteilung für
forensische Molekularbiologie des medizinischen Zentrums der Erasmus-Universität in
Rotterdam ein interaktives Webtool mit der Möglichkeit der Phänotypisierung von Haarund Augenfarbe basierend auf den publizierten Systemem IrisPlex und HIrisplex an [66].
6
www.yhrd.org
Stand: Release Juli 2015.
8
Motiv des untersuchten molekularen Templates (Y-Chromosom, mtDNA), bestehend aus einer
definierten Anzahl spezifischer STRs oder SNPs.
9
Haplotypen, die den gleichen genetischen Vorfahren vorweisen, werden einer Haplogruppe zugeordnet.
7
102
A.-M. Pflugbeil et al.
Eine weitere Datenbank zur Verwaltung von Genotyp- und Phänotypdaten ist die dbGaP des NCBI . Diese wurde mit dem Ziel entwickelt, Ergebnisse aus GWA-Studien von
Genotyp/Phänotyp-Interaktionen auf dem klinischen Sektor zu verwalten und dem Nutzer zur Verfügung zu stellen. Der Zugriff auf entsprechende Daten wird in der Datenbank
über zwei Wege möglich. Nicht sensible Daten sind für die Öffentlichkeit frei zugänglich.
Wohingegen sensible Daten mit personalisiertem Hintergrund beschränkt zugänglich sind.
Auch der Zugang zu phänotypischen Individualdaten erfordert verschiedene Ebenen der
Autorisierung. Derzeit beinhaltet die dbGap 584 Studien [61].
Einen Einblick in komplexe Genomassoziationsstudien bietet die Datenbank GWAS
Central, voher auch bekannt als Human Genome Variation Database of Genotype-toPhenotype Information. Hier werden alle bisher bekannten SNP-Loci aus anderen öffentlichen Datenbanken wie der dbSNP oder DBGV gespeichert. Zu dem bisher bekannten
Variantenfundus wurden zusätzlich Frequenzdaten und Assoziationsinformationen hinzugefügt. Allerdings werden hier bisher keine komplexen Phänotyppanels, die für die
Forensik von Interesse wären, repräsentiert [29].
4.5
Rechtliche Aspekte
Dem Wunsch nach einem genetischen Phantombild auf Grundlage der Analyse phänotypischer DNA-Merkmale steht in Deutschland die aktuelle Rechtslage, die eine Verwertung
von entsprechenden Informationen aus kodierenden DNA-Regionen aktuell nicht zulässt,
konträr gegenüber. Nach § 81e StPO dürfen an dem nach §§ 81a Abs. 1, 81c StPO erlangten Material auch molekulargenetische Analysen durchgeführt werden, soweit sie zur
Abstammungsfeststellung oder der Tatsache, ob aufgefundenes Spurenmaterial von dem
Beschuldigten oder dem Verletzten (= Opfer bzw. Opferzeuge) stammt, erforderlich sind,
wobei auch das Geschlecht der Person bestimmt werden darf. Nach § 81g StPO dürfen
andere Feststellungen als diejenigen, die zur Ermittlung des DNA-Identifizierungsmusters
sowie des Geschlechts erforderlich sind, nicht getroffen werden [39]. Gegen diese strengen Vorgaben spricht allerdings die weitverbreitete Analyse von SNPs des Y-Chromosoms
oder mtDNA zur Feststellung der Zugehörigkeit zu einer ethnischen Großgruppe, die
durchaus Bestandteil von molekulargenetischen Analysen forensischer und rechtsmedizinischer Institute in Deutschland ist und eine indirekte Phänotypisierung darstellt.
In anderen Ländern, wie in den Niederlanden, ist die DNA-Phänotypisierung seit 2003
im Rahmen der forensischen DNA-Analytik erlaubt und erbrachte in Einzelfällen fahndungsrelevante Informationen zum Täteraussehen. Voraussetzung für die Verwertbarkeit
der Ergebnisse in den Niederlanden ist eine eindeutige Beschreibung der Sensitivität und
Spezifität der Ergebnisse. Hier ist es ebenfalls erlaubt, die ethnische Eingliederung einer
Person vorzunehmen und das Geschlecht zu genotypisieren [32, 33].
In den USA oder Großbritannien existieren keine expliziten Handlungsweisungen oder
genaue Rechtsvorschriften, die ein Verbot der DNA-Phänotypisierung implizieren, sodass hier in Einzelfällen kodierende DNA-Abschnitte durchaus untersucht werden [33].
4
DNA-Phänotypisierung
103
In Texas beispielsweise werden sogar ausdrücklich Informationen aus der Phänotypisierung in Fahndungen einbezogen. Die Firma Parabon NanoLabs (Virgina) entwickelt
sowohl für therapeutische als auch für forensische Fragestellungen neue Technologien auf
dem Sektor der DNA-Analyse und bietet darüber hinaus die DNA-Phänotypisierung als
Dienstleistung aus der forensischen Produktpalette an. Mit dem als Snapshot bezeichneten
DNA-Tool wird ein physisches Profil aus dem zu analysierenden DNA-Template mittels
annotierter SNP-Kandidaten, inklusive Geschlecht der Person, ethnische Zugehörigkeit,
Vorhersage von Pigmentierungsinformationen (Hautfarbe, Haarfarbe, Augenfarbe, Sommersprossen) und der Gesichtsmorphologie, erstellt. Im Rahmen des Validierungsprozesses wurde die Genauigkeit von Snapshot an tausenden Datenbankstichproben getestet.
Das Produkt wird auch gegenwärtig von staatlichen und lokalen Polizeidienststellen in
den USA zum Zwecke der Strafverfolgung eingesetzt.
4.6 Anwendung in der Gesichtsweichteilrekonstruktion
Wie bereits erwähnt, kann die Einbeziehung von EVCs in den Vorgang der Gesichtsweichteilrekonstruktion, gerade in Fällen ohne weitere Anhaltspunkte, ein unverzichtbares Mittel zur Ergänzung der Informationsbasis darstellen. Dabei kann die Tragweite
in der Verwendung von typisierbaren äußerlichen Merkmalen an dieser Stelle hinsichtlich des beabsichtigten Verfahrenszieles unterschiedlich gewichtet werden. Zum einen
können EVCs ein ergänzendes Mittel in der Durchführung einer computergestützten Gesichtsweichteilrekonstruktion auf der Grundelage aufgefundener Schädel sein. Zum anderen kann das Ziel einer rein DNA-basierten Bestimmung von Gesichtsmorphologie oder
von Augen- oder Hautfarbe verfolgt werden. Bezüglich des erstgenannten Anwendungsfalles stellt die forensische Gesichtsweichteilrekonstruktion als Teilgebiet der forensischen Osteologie in Fällen stark fäulnisveränderter und skelettierter Leichen oft die letzte
Möglichkeit einer Personenidentifizierung dar. Klassische Identifizierungsmaßnahmen,
wie die DNA-Analyse, Daktyloskopie, Röntgenvergleichsanalyse und Odontostomatologie, verlangen in den meisten Fällen Vergleichsmaterial für eine Identitätsbestimmung
oder Authentifizierung [48]. Trotz der vorhandenen Möglichkeiten ist die Zuordnung von
menschlichen Überresten zu einer bestimmten Person stark eingeschränkt, solange keine Daten zum Abgleich mit einer polizeilichen oder medizinischen Datenbank vorliegen.
Aktuelle Methoden der 3D-Gesichtsweichteilrekonstruktion zielen auf einen schnelleren,
kostengünstigeren und vor allem variablen Rekonstruktionsprozess ab [56, 63], beziehen
jedoch kaum phänotypische Merkmale auf DNA-Ebene in den Modellierungsprozess ein.
Zur Erhöhung der Plausibilität und Einzigartigkeit des Rekonstruktionsresultates sollten grundsätzlich ausreichend viele personenspezifische Informationen zum Aussehen
vorliegen. Abb. 4.3 zeigt schematisch die Möglichkeit einer schnellen, kostengünstigen
computergestützten Weichteilrekonstruktion mittels Open-Source-Software und die möglichen Ebenen des Informationsgewinns für den Rekonstruktionsprozess [15].
104
A.-M. Pflugbeil et al.
Abb. 4.3 Einbezug von EVC in den Prozess der 3D-Gesichtsweichteilrekonstruktion. Dargestellt
ist ein Schema zur Gesichtsweichteilrekonstruktion unter Zuhilfenahme von Phänotypisierungsinformationen, die auf DNA-Ebene extrahiert werden (a). Der dargestellte Informationspool in (a)
kann in Verbindung mit ergänzenden Metainformationen (b) in den Prozess einer computergestützten Weichteilmodellierung (c) einbezogen werden und wesentlich zur Rekonstruktion beitragen
4.7 Zusammenfassung und Ausblick
Der Fortschritt im Feld der modernen DNA-Analysetechniken verspricht in den nächsten
10 Jahren einen enormem Aufschwung für das Auffinden weiterer relevanter Genvarianten, die für eine DNA-basierte Vorhersage phänotypischer Merkmale eingesetzt werden
können. Die Diskussion im Umgang mit entsprechenden Informationen beruht gerade in
Deutschland auf vielen fachübergreifenden Aspekten. Der Schlüssel für eine ausgewogene
Sichtweise liegt sicher in dem Versuch der Gegenüberstellungen von Vorteilen der Verwendung dieser noch neuen DNA-Marker mit möglichen ethischen Risiken, wie der Angst
vor einer Diskriminierung von Personengruppen und dem damit einhergehenden Verlust
der Privatsphäre oder Autonomie [32]. Jedoch muss diese Form eines Meinungsbildungsprozesses in den meisten Ländern, durch die Präsentation objektiver wissenschaftlicher
Fakten, noch initiiert werden.
Eine große Diskussionsplattform bildet dazu die Verwendung von kodierenden vs.
nichtkodierenden DNA-Markern für forensische Zwecke. Diese scheinbar klare Definition soll eine Grenze symbolisieren, inwieweit das menschliche Genom für forensische
Analysen zur Verfügung steht. Jedoch ist das Genom in dieser Art und Weise keinesfalls
4
DNA-Phänotypisierung
105
statisch organisiert. Ferner werden sogenannte DNA-Blöcke während des Vererbungsmechanismus intakt weitergegeben, wie durch das Internationale HapMap-Projekt gezeigt
werden konnte. Daher kann ein bezeichneter nichtkodierender Marker, der sich in der
physischen Nähe zu einem kodierenden phänotypischen Lokus befindet, aufgrund des
Kopplungsungleichgewichtes die gleichen Informationen offenbaren wie der kodierende
Marker selbst. Mit der nötigen wissenschaftlichen Kenntnis wird an dieser Stelle deutlich, dass die bereits veröffentlichten EVCs selbst nichtkodierend sind, mit einem spezifischen äußerlichen Merkmal assoziieren und an einen funktionellen Lokus gekoppelt
sind. Folglich wäre es kein formeller Verstoß gegen die Definition der Legislative, die eine ausschließliche Verwendung nichtkodierender Informationen vorgibt, etwaige Marker
zu verwenden. Denn tatsächlich werden somit kodierende Informationen durch nichtkodierende Marker innerhalb eines starken Kopplungsgleichgewichtes bzw. durch eine
starke Assoziation inferiert [32]. Die genetischen Informationen einer Person verändern
sich im Laufe eines Lebens nicht. Lediglich Genaktivitäten und verantwortliche Regulatoren müssen durch weitere GWA-Studien identifiziert werden. In diesem Zusammenhang
müssen für komplexe phänotypische Merkmale weitere korrelierende Informationen extrahiert und der sekundäre Einfluss von Umweltfaktoren geklärt werden. Darüber hinaus
sind EVCs für jeden erkenntlich und unterliegen somit nach Definition keinem Schutz
der Privatsphäre, wie durch den Gesetzgeber befürchtet. Streng genommen befindet sich
Deutschland nicht so weit weg von einer angewandten DNA-Phänotypisierung wie angenommen, denn mit der Zustimmung zur Genotypisierung des individuellen Geschlechts
werden erste Hinweise auf phänotypische Ausprägungen generiert (s. Abschn. 4.5). Auch
die Bestimmung der ethnischen Zugehörigkeit, was mittlerweile zum Standardrepertoire
in rechtsmedizinischen Instituten gehört, lässt die Frage zu, was gegen die Beantwortung
von Fragestellungen zur erweiterten Phänotypisierung mit gesicherten und etablierten probabilistischen Methoden und Vorhersagegenauigkeiten bis zu 99 %, spricht.
Sicher kann oder wird eine DNA-basierte Vorhersage phänotypischer Personenmerkmale kein Standardprofiling ersetzen. Tatverdächtige, die durch Übereinstimmung auf Basis einer DNA-abgeleiteten Gesichtsvorhersage identifiziert wurden, werden sicher nicht
allein auf Grundlage dieser Übereinstimmung verurteilt werden. Jedoch kann dieses Vorgehen unverzichtbare Anhaltspunkte in Ermittlungsverfahren, wie bei den sogenannten
cold cases oder bei der Identifikation von geborgenen teilweise oder vollständig skelettierten Leichen, liefern. Zusammen mit dem Verfahren des NGS werden sich in den
nächsten Jahren neue Möglichkeiten eröffnen. Nur wenn ein breiter Konsens über die Ziele und Grenzen dieser neuen molekularen Untersuchungswerkzeuge entsteht, kann der
Gesetzgeber dazu bewegt werden, notwendige Schritte für eine Erweiterung der derzeitigen Gesetzesgrundlage vorzunehmen.
106
A.-M. Pflugbeil et al.
Literatur
1. Alaeddini, R.: Forensic implications of pcr inhibition–a review. Forensic Sci Int Genet 6(3),
297–305 (2012). doi: 10.1016/j.fsigen.2011.08.006. http://dx.doi.org/10.1016/j.fsigen.2011.08.
006
2. Alaeddini, R., Walsh, S.J., Abbas, A.: Forensic implications of genetic analyses from degraded dna–a review. Forensic Science International Genetics 4(3), 148–157 (2010). doi:
10.1016/j.fsigen.2009.09.007. http://dx.doi.org/10.1016/j.fsigen.2009.09.007
3. Aulchenko, Y.S., Struchalin, M.V., Belonogova, N.M., Axenovich, T.I., Weedon, M.N., Hofman,
A., Uitterlinden, A.G., Kayser, M., Oostra, B.A., van Duijn, C.M., Janssens, A.C.J.W., Borodin,
P.M.: Predicting human height by victorian and genomic methods. Eur J Hum Genet 17(8),
1070–1075 (2009). doi: 10.1038/ejhg.2009.5. http://dx.doi.org/10.1038/ejhg.2009.5
4. Berglund, E.C., Kiialainen, A., Syvänen, A.C.: Next-generation sequencing technologies and
applications for human genetic history and forensics. Investig Genet 2, 23 (2011). doi:
10.1186/2041-2223-2-23. http://dx.doi.org/10.1186/2041-2223-2-23
5. Børsting, C., Sanchez, J.J., Morling, N.: Application of snps in forensic casework. Molecular
Forensics p. 91 (2007)
6. Børsting, C., Rockenbauer, E., Morling, N.: Validation of a single nucleotide polymorphism
(snp) typing assay with 49 snps for forensic genetic testing in a laboratory accredited according
to the iso 17025 standard. Forensic Science International Genetics 4(1), 34–42 (2009). doi:
10.1016/j.fsigen.2009.04.004. http://dx.doi.org/10.1016/j.fsigen.2009.04.004
7. Branicki, W., Liu, F., van Duijn, K., Draus-Barini, J., Pośpiech, E., Walsh, S., Kupiec, T.,
Wojas-Pelc, A., Kayser, M.: Model-based prediction of human hair color using dna variants.
Hum Genet 129(4), 443–454 (2011). doi: 10.1007/s00439-010-0939-8. http://dx.doi.org/10.
1007/s00439-010-0939-8
8. Budowle, B., van Daal, A.: Forensically relevant snp classes. Biotechniques 44(5), 603–8, 610
(2008). doi: 10.2144/000112806. http://dx.doi.org/10.2144/000112806
9. Bustin, S., Benes, V., Nolan, T., Pfaffl, M.: Quantitative real-time rt-pcr–a perspective. Journal
of molecular endocrinology 34(3), 597–601 (2005)
10. Butler, J., Coble, M., Vallone, P.: Strs vs snps: Thoughts on the future of forensic dna testing.
Forensic Science, Medicine and Pathology 3 (2007)
11. Butler, J.M.: Advanced Topics in Forensic DNA Typing: Methodology: Methodology, Bd. Short
Tandem Repeat (STR) Loci and Kits. Academic Press (2011)
12. Carracedo, A., Lareu, M.: Development of new strs for forensic casework: criteria for selection,
sequencing & population data and forensic validation. In: Proceedings—the Ninth International
Symposium on Human Identification, S. 89–107 (1998)
13. Claes, P., Liberton, D.K., Daniels, K., Rosana, K.M., Quillen, E.E., Pearson, L.N., McEvoy, B.,
Bauchet, M., Zaidi, A.A., Yao, W., Tang, H., Barsh, G.S., Absher, D.M., Puts, D.A., Rocha,
J., Beleza, S., Pereira, R.W., Baynam, G., Suetens, P., Vandermeulen, D., Wagner, J.K., Boster,
J.S., Shriver, M.D.: Modeling 3d facial shape from dna. PLoS Genet 10(3), e1004,224 (2014).
doi: 10.1371/journal.pgen.1004224. http://dx.doi.org/10.1371/journal.pgen.1004224
14. Commo, S., Wakamatsu, K., Lozano, I., Panhard, S., Loussouarn, G., Bernard, B.A., Ito, S.:
Age-dependent changes in eumelanin composition in hairs of various ethnic origins. Int J Cosmet Sci 34(1), 102–107 (2012). doi: 10.1111/j.1468-2494.2011.00691.x. http://dx.doi.org/10.
1111/j.1468-2494.2011.00691.x
Literatur
107
15. da Costa Moraes, C.A., Dias, P.E.M., Melani, R.F.H.: Demonstration of protocol for computeraided forensic facial reconstruction with free software and photogrammetry. Journal of Research
in Dentistry 2(1), p–77 (2014)
16. Davoren, J., Vanek, D., Konjhodzić, R., Crews, J., Huffine, E., Parsons, T.J.: Highly effective
dna extraction method for nuclear short tandem repeat testing of skeletal remains from mass
graves. Croat Med J 48(4), 478–485 (2007)
17. Deka, R., Shriver, M.D., Yu, L.M., Ferrell, R.E., Chakraborty, R.: Intra- and inter-population
diversity at short tandem repeat loci in diverse populations of the world.q Electrophoresis 16(9),
1659–1664 (1995)
18. Dukes, M.J., Williams, A.L., Massey, C.M., Wojtkiewicz, P.W.: Technical note: Bone dna extraction and purification using silica-coated paramagnetic beads. Am J Phys Anthropol 148(3),
473–482 (2012). doi: 10.1002/ajpa.22057. http://dx.doi.org/10.1002/ajpa.22057
19. Fitzpatrick, T.B.: The validity and practicality of sun-reactive skin types i through vi. Arch
Dermatol 124(6), 869–871 (1988)
20. Fondevila, M., Phillips, C., Santos, C., Freire Aradas, A., Vallone, P.M., Butler, J.M., Lareu,
M.V., Carracedo, A.: Revision of the snpforid 34-plex forensic ancestry test: Assay enhancements, standard reference sample genotypes and extended population studies. Forensic Science
International Genetics 7(1), 63–74 (2013). doi: 10.1016/j.fsigen.2012.06.007. http://dx.doi.org/
10.1016/j.fsigen.2012.06.007
21. Frudakis, T., Thomas, M., Gaskin, Z., Venkateswarlu, K., Chandra, K.S., Ginjupalli, S., Gunturi,
S., Natrajan, S., Ponnuswamy, V.K., Ponnuswamy, K.N.: Sequences associated with human iris
pigmentation. Genetics 165(4), 2071–2083 (2003)
22. Gendiagnostik-Kommission: Richtlinie der gendiagnostik-kommission (geko) für die anforderungen an die durchführung genetischer analysen zur klärung der abstammung und an die
qualifikation von ärztlichen und nichtärztlichen sachverständigen gemäß § 23 abs. 2 nr. 4 und nr.
2b gendg. Richtlinie. doi: DOI 10.1007/s00103-012-1575-3. Springer-Verlag Berlin Heidelberg
2013
23. Gettings, K.B., Lai, R., Johnson, J.L., Peck, M.A., Hart, J.A., Gordish-Dressman, H., Schanfield, M.S., Podini, D.S.: A 50-snp assay for biogeographic ancestry and phenotype prediction
in the u.s. population. Forensic Science International Genetics 8(1), 101–108 (2014). doi:
10.1016/j.fsigen.2013.07.010. http://dx.doi.org/10.1016/j.fsigen.2013.07.010
24. Green, R.L., Roinestad, I.C., Boland, C., Hennessy, L.K.: Developmental validation of the
quantifilertm real-time pcr kits for the quantification of human nuclear dna samples. Journal
of Forensic Sciences 50(4), 809–825 (2005)
25. Grimes, E.A., Noake, P.J., Dixon, L., Urquhart, A.: Sequence polymorphism in the human melanocortin 1 receptor gene as an indicator of the red hair phenotype. Forensic Science International
122(2-3), 124–129 (2001)
26. Han, J., Kraft, P., Nan, H., Guo, Q., Chen, C., Qureshi, A., Hankinson, S.E., Hu, F.B., Duffy,
D.L., Zhao, Z.Z., Martin, N.G., Montgomery, G.W., Hayward, N.K., Thomas, G., Hoover, R.N.,
Chanock, S., Hunter, D.J.: A genome-wide association study identifies novel alleles associated
with hair color and skin pigmentation. PLoS Genet 4(5), e1000,074 (2008). doi: 10.1371/journal.pgen.1000074. http://dx.doi.org/10.1371/journal.pgen.1000074
27. Jacobs, L.C., Wollstein, A., Lao, O., Hofman, A., Klaver, C.C., Uitterlinden, A.G., Nijsten, T.,
Kayser, M., Liu, F.: Comprehensive candidate gene study highlights ugt1a and bnc2 as new
genes determining continuous skin color variation in europeans. Hum Genet 132(2), 147–158
(2013). doi: 10.1007/s00439-012-1232-9. http://dx.doi.org/10.1007/s00439-012-1232-9
108
A.-M. Pflugbeil et al.
28. Jakubowska, J., Maciejewska, A., Pawlowski, R.: Comparison of three methods of dna extraction from human bones with different degrees of degradation. Int J Legal Med 126(1), 173–178
(2012). doi: 10.1007/s00414-011-0590-5. http://dx.doi.org/10.1007/s00414-011-0590-5
29. Johnson, A.D., O’Donnell, C.J.: An open access database of genome-wide association results.
BMC Med Genet 10, 6 (2009). doi: 10.1186/1471-2350-10-6. http://dx.doi.org/10.1186/14712350-10-6
30. Jombart, T., Devillard, S., Balloux, F.: Discriminant analysis of principal components: a new
method for the analysis of genetically structured populations. BMC Genet 11, 94 (2010). doi:
10.1186/1471-2156-11-94. http://dx.doi.org/10.1186/1471-2156-11-94
31. Kader, F., Ghai, M.: Dna methylation and application in forensic sciences. Forensic Science
International 249, 255–265 (2015). doi: 10.1016/j.forsciint.2015.01.037. http://dx.doi.org/10.
1016/j.forsciint.2015.01.037
32. Kayser, M., Schneider, P.M.: Dna-based prediction of human externally visible characteristics
in forensics: motivations, scientific challenges, and ethical considerations. Forensic Science International Genetics 3(3), 154–161 (2009). doi: 10.1016/j.fsigen.2009.01.012. http://dx.doi.org/
10.1016/j.fsigen.2009.01.012
33. Koops, B.J., Schellekens, M.: Forensic dna phenotyping: regulatory issues. Colum. Sci. & Tech.
L. Rev. 9, 158–160 (2008)
34. Lei, S.F., Deng, F.Y., Xiao, S.M., Chen, X.D., Deng, H.W.: Association and haplotype analyses of the col1a2 and er-alpha gene polymorphisms with bone size and height in chinese.
Bone 36(3), 533–541 (2005). doi: 10.1016/j.bone.2004.11.002. http://dx.doi.org/10.1016/j.
bone.2004.11.002
35. Lettre, G., Jackson, A.U., Gieger, C., Schumacher, F.R., Berndt, S.I., Sanna, S., Eyheramendy,
S., Voight, B.F., Butler, J.L., Guiducci, C., Illig, T., Hackett, R., Heid, I.M., Jacobs, K.B., Lyssenko, V., Uda, M., D.G.I., F.U.S.I.O.N., K.O.R.A., Prostate, L.C., Trial, O.C.S., N.H.S., S.I.A.,
Boehnke, M., Chanock, S.J., Groop, L.C., Hu, F.B., Isomaa, B., Kraft, P., Peltonen, L., Salomaa,
V., Schlessinger, D., Hunter, D.J., Hayes, R.B., Abecasis, G.R., Wichmann, H.E., Mohlke, K.L.,
Hirschhorn, J.N.: Identification of ten loci associated with height highlights new biological pathways in human growth. Nat Genet 40(5), 584–591 (2008). doi: 10.1038/ng.125. http://dx.doi.
org/10.1038/ng.125
36. Liu, F., van der Lijn, F., Schurmann, C., Zhu, G., Chakravarty, M.M., Hysi, P.G., Wollstein,
A., Lao, O., de Bruijne, M., Ikram, M.A., van der Lugt, A., Rivadeneira, F., Uitterlinden, A.G.,
Hofman, A., Niessen, W.J., Homuth, G., de Zubicaray, G., McMahon, K.L., Thompson, P.M.,
Daboul, A., Puls, R., Hegenscheid, K., Bevan, L., Pausova, Z., Medland, S.E., Montgomery,
G.W., Wright, M.J., Wicking, C., Boehringer, S., Spector, T.D., Paus, T., Martin, N.G., Biffar, R.,
Kayser, M.: A genome-wide association study identifies five loci influencing facial morphology
in europeans. PLoS Genet 8(9), e1002,932 (2012). doi: 10.1371/journal.pgen.1002932. http://
dx.doi.org/10.1371/journal.pgen.1002932
37. Liu, F., van Duijn, K., Vingerling, J.R., Hofman, A., Uitterlinden, A.G., Janssens, A.C.J.W.,
Kayser, M.: Eye color and the prediction of complex phenotypes from genotypes. Curr Biol 19(5), R192–R193 (2009). doi: 10.1016/j.cub.2009.01.027. http://dx.doi.org/10.1016/j.cub.
2009.01.027
38. Loreille, O.M., Diegoli, T.M., Irwin, J.A., Coble, M.D., Parsons, T.J.: High efficiency dna
extraction from bone by total demineralization. Forensic Science International Genetics 1(2),
191–195 (2007). doi: 10.1016/j.fsigen.2007.02.006. http://dx.doi.org/10.1016/j.fsigen.2007.02.
006
Literatur
109
39. Madea, B. (ed.): Praxis Rechtsmedizin: Befunderhebung, Rekonstruktion, Begutachtung, Bd. 2.
Springer (2006)
40. Malkin, I., Ermakov, S., Kobyliansky, E., Livshits, G.: Strong association between polymorphisms in ankh locus and skeletal size traits. Hum Genet 120(1), 42–51 (2006). doi:
10.1007/s00439-006-0173-6. http://dx.doi.org/10.1007/s00439-006-0173-6
41. Maroñas, O., Phillips, C., Söchtig, J., Gomez-Tato, A., Cruz, R., Alvarez-Dios, J., de Cal,
M.C., Ruiz, Y., Fondevila, M., Carracedo, n., Lareu, M.V.: Development of a forensic
skin colour predictive test. Forensic Science International Genetics 13, 34–44 (2014). doi:
10.1016/j.fsigen.2014.06.017. http://dx.doi.org/10.1016/j.fsigen.2014.06.017
42. Mattsson, J., Uzunel, J., Tammik, L., Aschan, J., Ringde, O.: Leukemia lineage specific chimerism analysis is a sensitive predictor of relapse in patients with acute myeloid leukemia and
myelodysplastic syndrome after allogeneic stem cell transplantation. Leukemia 15(12), 1976–
1985 (2001)
43. Meyer, E., Wiese, M., Bruchhaus, H., Claussen, M., Klein, A.: Extraction and amplification
of authentic dna from ancient human remains. Forensic Science International 113(1-3), 87–90
(2000)
44. Mullis, K.B., et al.: The unusual origin of the polymerase chain reaction. Scientific American
262(4), 56–61 (1990)
45. Niederstätter, H., Köchl, S., Grubwieser, P., Pavlic, M., Steinlechner, M., Parson, W.: A modular
real-time pcr concept for determining the quantity and quality of human nuclear and mitochondrial dna. Forensic Science International Genetics 1(1), 29–34 (2007)
46. Phillips, C., Fernandez-Formoso, L., Garcia-Magariños, M., Porras, L., Tvedebrink, T., Amigo,
J., Fondevila, M., Gomez-Tato, A., Alvarez-Dios, J., Freire-Aradas, A., Gomez-Carballa, A.,
Mosquera-Miguel, A., Carracedo, A., Lareu, M.V.: Analysis of global variability in 15 established and 5 new european standard set (ess) strs using the ceph human genome diversity panel. Forensic Science International Genetics 5(3), 155–169 (2011). doi: 10.1016/j.fsigen.2010.02.003.
http://dx.doi.org/10.1016/j.fsigen.2010.02.003
47. Pośpiech, E., Wojas-Pelc, A., Walsh, S., Liu, F., Maeda, H., Ishikawa, T., Skowron, M., Kayser,
M., Branicki, W.: The common occurrence of epistasis in the determination of human pigmentation and its impact on dna-based pigmentation phenotype prediction. Forensic Science
International Genetics 11, 64–72 (2014). doi: 10.1016/j.fsigen.2014.01.012. http://dx.doi.org/
10.1016/j.fsigen.2014.01.012
48. Prinz, M., Carracedo, A., Mayr, W.R., Morling, N., Parsons, T.J., Sajantila, A., Scheithauer, R.,
Schmitter, H., Schneider, P.M., , I.S.f.F.G.: Dna commission of the international society for
forensic genetics (isfg): recommendations regarding the role of forensic genetics for disaster
victim identification (dvi). Forensic Science International Genetics 1(1), 3–12 (2007)
49. Putkonen, M.T., Palo, J.U., Cano, J.M., Hedman, M., Sajantila, A.: Factors affecting the str
amplification success in poorly preserved bone samples. Investig Genet 1(1), 9 (2010). doi:
10.1186/2041-2223-1-9. http://dx.doi.org/10.1186/2041-2223-1-9
50. Rebbeck, T.R., Kanetsky, P.A., Walker, A.H., Holmes, R., Halpern, A.C., Schuchter, L.M., Elder, D.E., Guerry, D.: P gene as an inherited biomarker of human eye color. Cancer Epidemiol
Biomarkers Prev 11(8), 782–784 (2002)
51. Rees, J.L.: Genetics of hair and skin color. Annu Rev Genet 37, 67–90 (2003). doi:
10.1146/annurev.genet.37.110801.143233. http://dx.doi.org/10.1146/annurev.genet.37.110801.
143233
110
A.-M. Pflugbeil et al.
52. Ruiz, Y., Phillips, C., Gomez-Tato, A., Alvarez-Dios, J., Casares de Cal, M., Cruz, R., Maroñas, O., Söchtig, J., Fondevila, M., Rodriguez-Cid, M.J., Carracedo, A., Lareu, M.V.: Further
development of forensic eye color predictive tests. Forensic Science International Genetics
7(1), 28–40 (2013). doi: 10.1016/j.fsigen.2012.05.009. http://dx.doi.org/10.1016/j.fsigen.2012.
05.009
53. Sanchez, J., Phillips, C., Børsting, C., Balogh, K., Bogus, M., Fondevila, M., Harrison, C.,
Musgrave-Brown, E., Salas, A., Syndercombe-Court, D., Schneider, P., Carracedo, A., Morling, N.: A multiplex assay with 52 single nucleotide polymorphisms for human identification.
Electrophoresis 27 (2006)
54. Scheible, M., Loreille, O., Just, R., Irwin, J.: Short tandem repeat typing on the 454 platform:
strategies and considerations for targeted sequencing of common forensic markers. Forensic
Science International Genetics 12, 107–119 (2014)
55. Schmidt, D., Hummel, S.: Biologische Spurenkunde, Bd. 1 Kriminalbiologie. Springer-Verlag
Berlin Heidelberg (2007)
56. Shahrom, A.W., Vanezis, P., Chapman, R.C., Gonzales, A., Blenkinsop, C., Rossi, M.L.: Techniques in facial identification: computer-aided facial reconstruction using a laser scanner and
video superimposition. Int J Legal Med 108(4), 194–200 (1996)
57. Sherry, S., Ward, M., Kholodov, M., Baker, J., Phan, L., Smigielski, E., Sirotkin, K.: dbsnp: the
ncbi database of genetic variation. Nucleic Acids Res 1 (2001)
58. Stokowski, R.P., Pant, P.K., Dadd, T., Fereday, A., Hinds, D.A., Jarman, C., Filsell, W., Ginger, R.S., Green, M.R., van der Ouderaa, F.J., et al.: A genomewide association study of skin
pigmentation in a south asian population. The American Journal of Human Genetics 81(6),
1119–1132 (2007)
59. Sturm, R.A., Duffy, D.L., Box, N.F., Newton, R.A., Shepherd, A.G., Chen, W., Marks, L.H.,
Leonard, J.H., Martin, N.G.: Genetic association and cellular function of mc1r variant alleles in
human pigmentation. Ann N Y Acad Sci 994, 348–358 (2003)
60. Sulem, P., Gudbjartsson, D.F., Stacey, S.N., Helgason, A., Rafnar, T., Magnusson, K.P., Manolescu, A., Karason, A., Palsson, A., Thorleifsson, G., Jakobsdottir, M., Steinberg, S., Pálsson, S.,
Jonasson, F., Sigurgeirsson, B., Thorisdottir, K., Ragnarsson, R., Benediktsdottir, K.R., Aben,
K.K., Kiemeney, L.A., Olafsson, J.H., Gulcher, J., Kong, A., Thorsteinsdottir, U., Stefansson,
K.: Genetic determinants of hair, eye and skin pigmentation in europeans. Nat Genet 39(12),
1443–1452 (2007). doi: 10.1038/ng.2007.13. http://dx.doi.org/10.1038/ng.2007.13
61. Tryka, K.A., Hao, L., Sturcke, A., Jin, Y., Wang, Z.Y., Ziyabari, L., Lee, M., Popova, N., Sharopova, N., Kimura, M., Feolo, M.: Ncbi’s database of genotypes and phenotypes: dbgap. Nucleic
Acids Res 42(Database issue), D975–D979 (2014). doi: 10.1093/nar/gkt1211. http://dx.doi.org/
10.1093/nar/gkt1211
62. Valenzuela, R.K., Henderson, M.S., Walsh, M.H., Garrison, N.A., Kelch, J.T., Cohen-Barak, O.,
Erickson, D.T., John Meaney, F., Bruce Walsh, J., Cheng, K.C., Ito, S., Wakamatsu, K., Frudakis, T., Thomas, M., Brilliant, M.H.: Predicting phenotype from genotype: normal pigmentation.
Journal of Forensic Sciences 55(2), 315–322 (2010). doi: 10.1111/j.1556-4029.2009.01317.x.
http://dx.doi.org/10.1111/j.1556-4029.2009.01317.x
63. Vanezis, P., Blowes, R.W., Linney, A.D., Tan, A.C., Richards, R., Neave, R.: Application of 3-d
computer graphics for facial reconstruction and comparison with sculpting techniques. Forensic
Science International 42(1-2), 69–84 (1989)
Literatur
111
64. Wagner, J.K., Jovel, C., Norton, H.L., Parra, E.J., Shriver, M.D.: Comparing quantitative measures of erythema, pigmentation and skin response using reflectometry. Pigment Cell Res 15(5),
379–384 (2002)
65. Walsh, S.: test. Forensic Science International Genetics 5, 170–180 (2011)
66. Walsh, S., Chaitanya, L., Clarisse, L., Wirken, L., Draus-Barini, J., Kovatsi, L., Maeda,
H., Ishikawa, T., Sijen, T., de Knijff, P., Branicki, W., Liu, F., Kayser, M.: Developmental validation of the hirisplex system: Dna-based eye and hair colour prediction for forensic
and anthropological usage. Forensic Science International Genetics 9, 150–161 (2014). doi:
10.1016/j.fsigen.2013.12.006. http://dx.doi.org/10.1016/j.fsigen.2013.12.006
67. Walsh, S., Liu, F., Ballantyne, K.N., van Oven, M., Lao, O., Kayser, M.: Irisplex: a sensitive dna
tool for accurate prediction of blue and brown eye colour in the absence of ancestry information.
Forensic Science International Genetics 5(3), 170–180 (2011)
68. Walsh, S., Liu, F., Wollstein, A., Kovatsi, L., Ralf, A., Kosiniak-Kamysz, A., Branicki, W., Kayser, M.: The hirisplex system for simultaneous prediction of hair and eye colour from dna. Forensic Science International Genetics 7(1), 98–115 (2013). doi: 10.1016/j.fsigen.2012.07.005.
http://dx.doi.org/10.1016/j.fsigen.2012.07.005
69. Walsh, S., Wollstein, A., Liu, F., Chakravarthy, U., Rahu, M., Seland, J.H., Soubrane, G., Tomazzoli, L., Topouzis, F., Vingerling, J.R., Vioque, J., Fletcher, A.E., Ballantyne, K.N., Kayser,
M.: Dna-based eye colour prediction across europe with the irisplex system. Forensic Sci Int Genet 6(3), 330–340 (2012). doi: 10.1016/j.fsigen.2011.07.009. http://dx.doi.org/10.1016/j.fsigen.
2011.07.009
70. Weatherall, I.L., Coombs, B.D.: Skin color measurements in terms of cielab color space values.
J Invest Dermatol 99(4), 468–473 (1992)
71. Weedon, M.N., Lango, H., Lindgren, C.M., Wallace, C., Evans, D.M., Mangino, M., Freathy,
R.M., Perry, J.R.B., Stevens, S., Hall, A.S., andere: Genome-wide association analysis identifies
20 loci that influence adult height. Nat Genet 40(5), 575–583 (2008). doi: 10.1038/ng.121. http://
dx.doi.org/10.1038/ng.121
72. Willuweit, S., Roewer, L.: The new y chromosome haplotype reference database. Forensic
Science International Genetics 15, 43–48 (2015). doi: 10.1016/j.fsigen.2014.11.024. http://dx.
doi.org/10.1016/j.fsigen.2014.11.024
5
Digitaler Tatort, Sicherung und Verfolgung
digitaler Spuren
Dirk Pawlaszczyk
5.1
Einleitung
Ausgangspunkt für jede forensische Untersuchung bildet der Tatort. Dort beginnt die Ermittlung. Im Gegensatz zur klassischen Forensik ist der Tatort bei Delikten im Bereich
der Cyberkriminalität häufig nicht so leicht zu benennen. Aufgrund der Vielfalt digitaler
Tatorte gestaltet sich die Spurensicherung mitunter sehr mühsam und gleicht einem Puzzel. Längst sind die zu sichernden Spuren nicht mehr nur auf die Festplatte eines Rechners
beschränkt. In der modernen Fallarbeit müssen vielmehr immer häufiger auch Spuren im
Internet, in der sprichwörtlichen Datenwolke oder in sozialen Netzen, verfolgt, gesichert
und analysiert werden. Demgegenüber steht die klassische Computerforensik, die, bezogen auf die Spurensicherung, primär auf einzelne IT-Systeme bzw. Datenträger abzielt.
Beide Formen der digitalen Spurensuche, online wie auch offline, werden im vorliegenden Kapitel gleichermaßen beleuchtet. Der Fokus liegt dabei auf der Sicherung digitaler
Spuren als Voraussetzung für weitere Untersuchungsschritte im Rahmen des forensischen
Prozesses. Für alle zu sichernden digitalen Spuren, gleich welcher Herkunft, gilt: Sie sind
virtuell und sehr häufig flüchtig. Diesem Umstand ist es geschuldet, dass sie leicht manipuliert und dadurch unbrauchbar werden können. Daraus resultieren wiederum spezielle
Anforderungen an den Prozess der Beweismittelsicherung.
Gemäß dem forensischen Paradigma der Unversehrtheit von Spuren muss die Sicherung mit großer Sorgfalt vorgenommen werden [17, 22]. Die dafür verwendeten Techniken
und Werkzeuge sind ebenfalls Gegenstand dieses Kapitels. Zunächst aber wird das prinzipielle Vorgehen bei der Sicherung digitaler Spuren beschrieben. In Abschn. 5.2 wird
der Tatort als Ausgangspunkt für die forensische Untersuchung vorgestellt. Gleichzeitig
D. Pawlaszczyk ()
Lehrstuhl Informatik/Objektorientierte Softwareentwicklung, University of Applied Sciences
Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: pawlaszc@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_5
113
114
D. Pawlaszczyk
wird der Begriff digitale Spur besprochen. Ausgehend von unterschiedlichen digitalen
Tatorten, werden in Abschn. 5.3 die wesentlichen Schritte bei der Spurensicherung und
Verfolgung eines Computereinbruchs erörtert. Hierbei wird insbesondere auf die durchzuführenden Tätigkeiten zur sachgemäßen Sicherung von Beweismitteln eingegangen.
Es wird diskutiert, was zu tun ist, wenn der zu sichernde Rechner noch arbeitet (LiveSicherung) und welche speziellen Untersuchungsschritte und Methoden an Datenträgern
(Post-Mortem-Akquise) durchzuführen sind. Dabei werden gängige Werkzeuge zur Duplizierung, Untersuchung und Wiederherstellung (Carving) von Speichermedien und den
darauf gespeicherten Daten vorgestellt.
Die forensische Analyse von Datenträgern ist meist nicht mehr ausreichend, um weiterentwickelte Angriffe oder kriminelles Verhalten eines Anwenders nachzuweisen. In
diesem Zusammenhang spielt insbesondere das Internet eine zentrale Rolle. Im zweiten
Teil des Kapitels wird deshalb speziell auf die Verfolgung und Sicherstellung von Spuren
im Netz eingegangen. Dies ist ein Bereich, der für die forensische Fallarbeit zunehmend
an Bedeutung gewinnt. Es handelt sich hierbei um ein noch relativ junges Forschungsfeld,
das im Augenblick noch unzureichend methodisch untersucht ist.
In Abschn. 5.4.1 wird zunächst die Erfassung, Auswertung und Wiederherstellung von
Spuren im Browser thematisiert. Das Thema Verfolgung von Spuren in der Cloud wird
ebenfalls besprochen. Es wird herausgestellt, welche Werkzeuge und Lösungen derzeit
in diesem Bereich existieren und inwieweit diese für die Sicherung digitaler Spuren von
Bedeutung sind. Ein separater Abschnitt widmet sich speziell dem Thema Verfolgung von
Zahlungsströmen im Netz am Beispiel der Kryptowährung Bitcoins. Ebenfalls besprochen
wird der Punkt Open Source Intelligence, ein Bereich, der immer mehr an Bedeutung
gewinnt.
Für die im Verlauf des Kapitels besprochenen forensischen Methoden finden überwiegend Open-Source-Lösungen Anwendung. Die Handhabung und Funktionsweise dieser
Werkzeuge ist in weiten Teilen äquivalent zu kommerziellen Forensikprodukten. Darüber
hinaus sind die Werkzeuge frei verwendbar und können jederzeit nachvollzogen werden.
Bei jeder forensischen Analyse müssen auch immer Persönlichkeitsrechte sowie datenschutzrechtliche Aspekte Beachtung finden. Diese beiden Problembereiche werden
ebenfalls mehrfach im Text angeschnitten. Das Kapitel endet mit einem kurzen Fazit.
5.2 Tatort, Digitale Spuren und Datenquellen
Im Rahmen der IT-Forensik geht es darum, strafbare oder anderweitig rechtswidrige
Handlungen festzustellen und aufzuklären [5]. Hierfür müssen digitale Spuren in einem
ersten Schritt gerichtsverwertbar gesichert und ausgewertet werden. Unter einer digitalen
Spur (engl. digital evidence) werden Spuren verstanden, die auf Daten beruhen, welche
wiederum in IT-Systemen gespeichert oder zwischen diesen übertragen wurden [10].
Wo aber können digitale Spuren überhaupt entstehen? Mit der Beantwortung dieser
Frage in unmittelbarem Zusammenhang stehen wiederum weitere Fragen, wie etwa diese
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
115
Spuren zu finden, zu erkennen und zu bewerten sind. Jede digitale Spur basiert letztlich
auf Daten, die in IT-Systemen gespeichert sind oder zwischen IT-Systemen übertragen
werden. Wie auch in der klassischen Forensik beginnt die Spurensuche zunächst immer
am Tatort. Der Tatort befindet sich kurz gefasst dort, wo die Tat ausgeführt wurde.
Bei Delikten im Bereich der Cyberkriminalität ist der Tatort häufig nicht so leicht zu
benennen oder mitunter sogar unbekannt. Im Darkweb beispielsweise ist es häufig gar
nicht möglich, die Herkunft einer Webseite oder die Identität der Urheber zu ermitteln.
Im Bereich der Cyberkriminalität sind die Ermittler immer öfter mit einem globalisierten Tatort konfrontiert, der täglich größer wird und schon lange nicht mehr an nationalen
Grenzen endet bzw. auf diese Rücksicht nimmt [3, 6, 19]. Die Systeme, mit denen in
Deutschland Straftaten begangen werden, stehen nicht selten in China oder Russland [28].
Entsprechend schwierig ist eine Strafverfolgung. Für gewöhnlich findet bei einer digitalen
Straftat keine physische Interaktion zwischen Täter und Opfer statt. Der Tatort ist virtuell. Aus diesem Grund wird häufig ein sogenannter Hilfstatort angenommen. Damit ist in
der Regel der Ort gemeint, an dem der Schaden eintritt. Über ihn bestimmt sich, welche
Behörde bzw. welches Ermittlungsorgan für den Fall zuständig ist und diesen gegebenenfalls strafrechtlich verfolgt. Neben rechtlichen Aspekten bildet der Tatort aber auch den
Ausgangspunkt jeder forensischen Untersuchung. Jede Ermittlung beginnt hier. Wie jede konventionelle so hinterlässt auch eine rein digitale Straftat zwangsläufig Spuren am
Tatort. In jedem hinreichend komplexen digitalen System entstehen bei der Datenverarbeitung notwendigerweise digitale Spuren (digitales Austauschprinzip). Insofern gilt auch
für Delikte aus dem Bereich der Computerkriminalität das Locard’sche Prinzip. Baut der
Täter beispielsweise eine Kommunikationsverbindung zwischen seinem Rechner und einem möglichen Opfer-PC auf, so erzeugt dies unvermeidlich Spuren. Spätestens wenn der
Angreifer auf den Rechner Daten kopiert oder verändert, entstehen Spuren auf der Festplatte des Opfers. Das können beispielsweise Einträge in Log-Dateien sein. Zusätzlich
werden zumeist Verbindungsdaten durch den Internetserviceprovider (temporär) gespeichert.1 Sofern der Täter nicht direkten physischen Zugang zu dem Opfersystem besitzt,
werden also in der Regel digitale Spuren zu finden sein, die aufgrund technischer Gegebenheiten unvermeidbar sind. Digitale Spuren sind zudem schwer zu vernichten. Selbst
gelöschte Dateien einer Festplatte sind oft noch lange Zeit rekonstruierbar. Zum Teil existieren viele Duplikate einer Datei auf verschiedenen Datenträgern oder auch verteilt in
Netzwerken. Es ist praktisch nicht möglich, alle digitalen Spuren einer Computerstraftat
zu beseitigen.
Oft kann darüber hinaus vom aktuellen Zustand auf vergangene Zustände eines ITSystems geschlossen werden. Für den IT-Forensiker gilt es, diese Spuren zu erkennen und
zu bewerten. Dabei ist zu beachten, dass die Menge der hinterlassenen digitalen Spuren
mit wachsender Entfernung zum Tatort stetig abnimmt. Datenspuren findet man zunächst
lokal auf einem sichergestellten PC, einem Smartphone, einer Digitalkamera oder einem
1
Gemäß dem Gesetz zur Einführung einer Speicherpflicht und einer Höchstspeicherfrist für Verkehrsdaten vom 10.12.2015 (BGBl. I S. 2210).
116
D. Pawlaszczyk
Abb. 5.1 Zusammenhang
zwischen Tatort, digitaler Spur
und Daten
USB-Stick. Häufig muss man digitale Spuren aber ebenso auf Web- oder Mailservern, in
sozialen Netzwerken oder Clouddiensten verfolgen.
Unabhängig davon, ob die Datenspur nun lokal oder remote vorliegt: In beiden Fällen
müssen die gefundenen potentiellen Beweise fachgerecht gesichert werden. In der Regel
wird im Rahmen der Sicherungsphase hierfür ein Duplikat d. h. eine bitgenaue Kopie der
gefundenen Artefakte erstellt. Damit werden im Wesentlichen zwei Ziele verfolgt: (1) es
sollen alle potentiellen Datenquellen mit Bezug zum aktuellen Fall identifiziert und (2)
korrekt gesichert werden. Die Sicherung der potentiellen Beweismittel muss außerordentlich sorgfältig erfolgen, um die Integrität der Daten nicht zu gefährden.
Der Zusammenhang zwischen den Begriffen Tatort, digitale Spur und Daten ist in
Abb. 5.1 nochmals dargestellt. Bei der Sicherung digitaler Spuren erweist sich die Identifikation von forensisch irrelevanten Daten häufig als schwierig. So müssen beispielsweise
Systemdateien oder nicht strafbare Fotos von den für den Fall relevanten Daten separiert
werden. Erschwerend kommt häufig hinzu, dass die Datenmenge sehr groß sein kann. In
beiden Fällen ist also eine Filterung bzw. Reduktion der sichergestellten Daten erforderlich, ohne dabei für den Fall wesentliche Indizien auszublenden. Besondere Beachtung
bei der Spurensicherung muss zudem die Verfügbarkeit der digitalen Spur finden. Es wird
grundsätzlich zwischen persistenten, semipersistenten und flüchtigen digitale Spuren unterschieden (siehe hierzu auch RFC32272). Persistente Spuren sind in der Regel lange
vorhanden, da es sich um Daten handelt, die z. B. auf einer Festplatte oder einer DVD
dauerhaft gespeichert sind.
Unter einer semipersistenten digitale Spur werden beispielsweise Daten verstanden,
die im Hauptspeicher eines Rechners liegen und mit dem Wegfall der Stromversorgung
verloren gehen. Die echt flüchtigen Dateninhalte sind aufgrund ihrer Natur nur temporär
vorhanden. Hierzu zählt beispielsweise der Inhalt der Prozessorregister oder Datenpakete,
2
http://www.ietf.org/rfc/rfc3227.txt?number=3227
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
117
Tab. 5.1 Kategorien für die Flüchtigkeit (Volatilität) von Spuren und Datenquellen
Persistent
Semipersistent
Flüchtig
Solid-State-Speicher Hauptspeicher/RAM Netzwerkdaten,
(CF/SD-Karten)
Cachespeicher
Prozessorregister
die über eine Netzwerkverbindung empfangen bzw. versendet und nach der Übertragung
unverzüglich verworfen werden. Bei der Wahl einer konkreten Sicherungsstrategie muss
dieser Umstand bedacht werden. Folglich sollten immer zunächst die flüchtigen Daten
gesichert werden. Die Beachtung der entsprechenden Reihenfolge wird auch als Order of
Volatility bezeichnet (Tab. 5.1) [16].
Digitale Spuren können im Gegensatz zu physikalischen Spuren verlustfrei dupliziert
werden. Alle Untersuchungen werden in der Regel an der Kopie durchgeführt. Bei der Untersuchung physischer Spuren wie etwa Blut oder DNA-Spuren, werde diese zumindest
teilweise zerstört, etwa durch die verwendeten Chemikalien. In der modernen IT-Forensik
untersucht man längst nicht nur klassische IT-Systeme. Neben Computern rücken mobile Endgeräte wie Tabletcomputer oder Smartphones immer stärker in den Fokus von
Ermittlungstätigkeit. Dies liegt nicht zuletzt daran, das mittlerweile mehr persönliche
Informationen auf dem Mobiltelefon eines Verdächtigen zu finden sind als auf irgendeinem anderen Gerät. Aber auch weitere technische Geräte wie Kameras, DVD-Player,
Navigationsgeräte oder Fernseher müssen im Rahmen der digitalen Spurensicherung berücksichtigt und gegebenenfalls untersucht werden. Jedes komplexere technische Gerät
Abb. 5.2 Übersicht Online- und Offline- Daten und Datenquellen
118
D. Pawlaszczyk
ist mittlerweile mit eigenen internen Datenspeichern ausgestattet und verfügt nicht selten
über eine LAN-Anbindung. Das Internet der Dinge, in dem jedes Gerät Daten über seine
Nutzung aufzeichnet und mit anderen vernetzt ist, stellt die moderne Fallarbeit vor besondere Herausforderungen [28]. Mitunter können aber gerade diese Daten für die Lösung
eines Falles entscheidende Hinweise liefern.
Die Spurensuche beschränkt sich längst nicht mehr nur darauf, die am Tatort gefundenen Datenträger zu sichern und auszuwerten. Wie selbstverständlich legen viele ihre
Daten in Cloudspeichern ab, nutzen soziale Netzwerke, tauschen Dateien über OnlineTauschbörsen aus, kommunizieren über Messenagerdienste, nutzen ein Webmailkonto
und bezahlen Waren und Dienstleistungen mit Kryptowährungen wie Bitcoins. An diesen
Beispielen wird deutlich, dass die Daten viel stärker verteilt sind als noch vor wenigen
Jahren. Die Zahl und Art der zu untersuchenden Datenquellen, offline wie online, nimmt
somit stetig zu (vgl. Abb. 5.2). Moderne Ermittlungsmethoden müssen diesem Umstand
entsprechend Rechnung tragen. Im Folgenden wird zunächst der Frage nachgegangen,
wie man digitale Spuren sichern muss, sodass diese gerichtsverwertbar, man sagt auch
forensically sound sind [27].
5.3
Sicherung digitaler Spuren
Jede digital-forensische Analyse beginnt mit der Datensicherung. Sie ist in der Regel mit
der Erstellung eines korrekten forensischen Abbilds der elektronisch gespeicherten Daten
verbunden und wird auch als forensic sound imaging bezeichnet. Diese Tätigkeit ist nicht
unproblematisch. Nachlässigkeiten oder Fehler in dieser frühen Phase des Ermittlungsprozesses können später zumeist nicht rückgängig gemacht werden. Was nicht korrekt
gesichert wird, ist auch nicht gerichtsverwertbar. Wird beispielsweise der zu untersuchende Datenträger unbeabsichtigt überschrieben oder verändert, so ist dies ein häufig nicht
mehr umkehrbarer Fehler. Die erstellte Kopie wird deshalb in der Regel durch kryptografische Verfahren geschützt, die eine nachträgliche Manipulation am Beweismittel sicher
erkennbar machen. Entsprechend muss die Sicherung sorgfältig geplant und durchgeführt
werden. Hierfür sind zunächst die relevanten Datenquellen mit Bezug zum aktuellen Fall
zu identifizieren. Das betrifft in erster Linie die am Tatort gefundenen Speichermedien
wie Festplatten, Speicherkarten, USB-Sicks. Von diesen Datenträgern muss zuallererst eine bitgenaue Kopie erzeugt werden, und zwar unabhängig vom logischen Dateisystem.
Eventuell auftretende Lesefehler müssen erkannt und nachvollziehbar behandelt werden.
Die Quelle darf keinesfalls verändert werden. Viele digitale Spuren sind aufgrund ihrer
Flüchtigkeit bereits nach kurzer Zeit unbrauchbar oder verloren. Ist etwa ein Rechner
zum Zeitpunkt der Beweisaufnahme noch eingeschaltet, so muss abgewogen werden, ob
zusätzlich eine Kopie vom Inhalt des Arbeitsspeichers (engl. Random Access Memory, RAM) anzufertigen ist. In einem Speicherabbild lassen sich mitunter Passwörter von
Anwendungsprogrammen oder der Schlüssel für Datenverschlüsselung finden. In beiden
Fällen gilt, das die Sicherung der Daten mit großer Sorgfalt und Sachkunde erfolgen muss.
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
119
Da es sich um potentielle Beweismittel handelt, sind geeignete Maßnahmen zu ergreifen,
die eine nachträgliche Manipulation der Daten verhindern.
Der Datensicherungsprozess muss darüber hinaus einer Überprüfung durch Sachverständige standhalten und reproduzierbar gleiche, durch Dritte verifizierbare Ergebnisse
liefern. Der IT-Forensiker spricht in diesem Zusammenhang auch von tamper-proof [16].
Zumindest aber müssen Veränderungen des Beweismittels zweifelsfrei erkennbar sein,
was auch als tamper-evident bezeichnet wird. In der IT-Forensik unterscheidet man grundsätzlich zwei Formen der Untersuchung in Bezug auf eine IT-System: Live-Response und
Post-mortem. Beide Verfahren sollen im Folgenden näher erläutert werden [5].
5.3.1 Live-Response-Akquise
Die erste Form der Datensicherung ist auch bekannt als Online-Forensik. Unter diesem
Begriff wird die Suche nach Spuren am noch laufendem System verstanden. Hier wird
vordringlich versucht, flüchtige Daten zu gewinnen. Diese Untersuchungsform ist beispielsweise dann sinnvoll, wenn auf dem Rechner für den Betriebsablauf kritische Anwendungen oder Dienste laufen. Bei einem Einbruch auf dem zentralen Datenverarbeitungssystem eines Unternehmens kann dieses nicht in jedem Fall einfach vom Netz genommen
und heruntergefahren werden. Mitunter befindet sich der Angreifer womöglich noch auf
dem System. Die Analyse am laufenden System hat darüber hinaus den Vorteil, dass auch
flüchtige Daten wie der RAM-Inhalt, Prozesstabellen oder Cachespeicher gesichert werden können. Des Weiteren lassen sich im Arbeitsspeicher möglicherweise entschlüsselte
Chiffretexte oder zugehörige Entschlüsselungspasswörter finden (beispielsweise von einer Festplattenverschlüsselung). Im Hauptspeicher des Rechners finden sich nicht selten
Daten, die der Anwender eigentlich nicht speichern wollte. Dazu zählen beispielsweise
IRC-Nachrichten oder Browserinhalte. Auch für die Erkennung von Schadsoftware ist
eine Analyse des Arbeitsspeichers häufig unumgänglich, da nur so zuverlässig bestimmt
werden kann, welche Prozesse beispielsweise durch einen Trojaner verändert wurden. Die
Analyse des Arbeitsspeichers kann somit von großer Bedeutung sein und bietet dem Ermittler eine Fülle von Informationen, die wichtige Spuren und Beweise für eine Ermittlung
liefern können.
Im Gegensatz zu persistenten Speichermedien wie Festplatten oder Flashlaufwerken
handelt es sich beim RAM um einen flüchtigen bzw. volatilen Speicher. Das bedeutet,
dass die Daten nur solange zugreifbar sind, wie eine Spannungsversorgung vorhanden
ist. Ein Wegfall der Betriebsspannung führt innerhalb kürzester Zeit zum Datenverlust.
Gleichzeitig unterliegen die im Hauptspeicher abgelegten Daten einer sehr starken Fluktuation. Ist das System eingeschaltet, bewirkt jeder Eingriff automatisch eine Änderungen
des Systemzustands. Durch das Laden eines Programms ändert sich beispielsweise der
Inhalt des Arbeitsspeichers. Gleichzeitig können durch Schreibzugriffe möglicherweise
zuvor gelöschte Bereiche überschrieben werden. Auch durch im Hintergrund laufende
Dienste und Prozesse werden womöglich unbemerkt die Zeitstempel von Dateien ver-
120
D. Pawlaszczyk
ändert. Aus diesem Grund sind die Informationen im Arbeitsspeicher lediglich für eine
Analyse der jüngeren Vergangenheit sinnvoll.
Bei der Erstellung eines Speicherabbilds werden neben dem Hauptspeicherinhalt insbesondere der Status offener Netzwerkverbindungen, die Zustände aller laufenden Prozesse
sowie eine Liste der aktuell angemeldeten Benutzer erfasst. In jedem Fall sollte der Ermittler es vermeiden, Befehle des Betriebssystems oder Anwendungen aufzurufen bzw. zu
verwenden. Diese könnten von einem Angreifer beispielsweise durch die Installation eines Rootkits manipuliert worden sein. Auch das nachträgliche Aufspielen oder Entfernen
von Programmen sollte vermieden werden, da dadurch wiederum Speicherseiten überschrieben werden können [5, 14, 16].
Anforderungen an Sicherungsprozess und Speicherabbild
Bevor der Arbeitsspeicher analysiert werden kann, muss sein Zustand zunächst in einer
Abbilddatei gesichert werden. Das dafür verwendete Verfahren muss ebenso wie das Abbild selbst bestimmte Anforderungen erfüllen, um als forensically sound zu gelten [5, 14].
Die im Rahmen der Datenakquise erstellte Speicherkopie sollte korrekt sein, d. h., so weit
wie möglich mit seinem physischen Original übereinstimmen. Wenngleich das, wie bereits zuvor ausgeführt, aufgrund technischer Gegebenheiten, in der Regel nie zu hundert
Prozent erfüllt werden kann. Der eigentliche Sicherungsvorgang sollte unterbrechungsfrei
in einer einzigen Leseoperation, man sagt auch atomar, durchgeführt werden. Schließlich
ist die Integrität der Daten sicherzustellen, d. h. es sollten möglichst viele Speicherseiten
korrekt kopiert werden. Die Forderung nach Korrektheit und Integrität des Speicherabbilds ist dabei immer auf einen festen Zeitpunkt bezogen. In der Regel fällt dieser zeitlich
mit der Übergabe des zu untersuchenden Systems an den ermittelten Forensiker zusammen.
Auf jeden Fall müssen alle am System vorgenommen Eingriffe genau protokolliert
werden. Hierbei gilt wiederum, dass die Protokolldatei nicht auf die zu untersuchenden
Datenträger geschrieben werden dürfen und stattdessen externe Speichermedien verwendet werden sollten. Prüfen im Rahmen eines späteren Gerichtsverfahrens weitere Sachverständige das Beweismaterial, sind die Daten methodisch bedingt zumindest teilweise
verfälscht. Eine Kontrolle durch einen anderen Sachverständigen kann daher nur dann erfolgen, wenn eine detaillierte Dokumentation der Live-Response-Analyse durch den die
Beweise sichernden IT-Forensiker erfolgt. Grundsätzlich gilt hier wie in vielen anderen
Phasen des forensischen Untersuchungsprozesses das Vier-Augen-Prinzip.
Sicherungsstrategien
Bei der Sicherung von Spuren an einem noch laufenden System sollten aus den genannten
Gründen möglichst nur solche Werkzeuge eingesetzt werden, die wenig Systemressourcen beanspruchen und keine Originaldaten beschreiben oder ändern. In den meisten Fällen
hat der Ermittler nur einen Versuch, bevor die Daten unwiderruflich verändert, zerstört
bzw. gelöscht werden. In einem Szenario, in dem der Verdächtige beim Eintreffen der
Ermittler die Stromzufuhr unterbricht, um seine Spuren zu verwischen, ist schnelles Han-
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
121
deln gefragt, damit mögliche Speicherinhalte gesichert werden können. Die zur Sicherung
des Hauptspeichers verwendeten Verfahren werden grob in Hardware- sowie Softwarebasierte Varianten unterteilt. Einige der wichtigsten Verfahren sollen an dieser Stelle kurz
vorgestellt werden:
Zugriff über Hardware-Bus. Bei dieser Form der Sicherung wird, wie der Name
schon sagt, direkt auf die Hardware zugegriffen. Das Betriebssystem wird somit umgangen. Änderungen am Speicher sind minimalinvasiv, d. h., sie können so gering
wie möglich gehalten werden. Verfügt das zu sichernde System über einen FirewireAnschluss (IEEE 1394-Schnittstelle), so ist es häufig möglich, den Direct Memory
Access (DMA) des Bussystems zu nutzen, um so den Speicher zu kopieren. Hierfür
werden die Daten direkt über den DMA-Controller aus dem Arbeitsspeicher gelesen [7, 29].
Sicherung über Kernelmodus. Dieses softwarebasierte Verfahren nutzt das Betriebssystem des Hosts im Kernelmodus, um ein Speicherabbild zu erstellen. Für Anwendungen, die in diesem Modus arbeiten, gilt, dass ihr Zugriff auf Hardware und Speicherbereiche nicht eingeschränkt wird wie bei Programmen, die im Userlevelmodus arbeiten.
Die Sicherungssoftware kann im Kernelmodus somit alle verfügbaren Speicherseiten
referenzieren.
Suspend-to-Disk. Aktuelle Betriebssysteme schreiben den Speicherinhalt in eine oder
mehrere Dateien, bevor sie in den Ruhezustand übergehen. Unter dem Betriebssystem
Windows beispielsweise wird der RAM-Inhalt in der Datei hiberfil.sys abgelegt. Standardmäßig wird die Datei im Wurzelverzeichnis der Systempartition gespeichert. Unter
Linux wird ein Speicherabbild des gesamten Arbeitsspeichers auf die Swap-Partition
geschrieben.
Virtualisierung. Nicht selten greifen Unternehmen heutzutage auf Virtualisierungslösungen im Server-, Netzwerk- oder Storagebereich zurück. Diese Technik kommt
beispielsweise bei Internet-Hostern oder Anbietern von Cloudlösungen verstärkt zum
Einsatz. Gängige Virtualisierungslösungen bieten i. d. R. eine Snapshotfunktion, um
das gesamte Gastsystem inklusive Speicher auf dem aktuellen Stand einzufrieren und
zu sichern. Darüber hinaus wird häufig der direkte Export des Speicherinhalts der virtuellen Maschine (VM) unterstützt [1].
Cold-Booting. Bei dieser Sicherungsstrategie wird wiederum das Betriebssystem des
Hostrechners umgangen, um den Speicherinhalt zu retten. Das an der Universität Princeton entwickelte Verfahren nutzt den Umstand aus, dass die Daten in den Speicherzellen der RAM-Bausteine nach dem Trennen der Stromzufuhr für einige Sekunde
bis hin zu mehreren Minuten weiterhin verfügbar sind, da die eingesetzten Schaltkreise sich nur langsam entladen. Dieses Phänomen wird auch als Datenremanenz
bezeichnet [15, 16]. Indem man die betroffenen Speicherriegel mit einem Kältespray
behandelt, kann dieser Effekt häufig noch verlängert werden. Schaltet also der Verdächtige beim Eintreffen der Ermittlungsbeamten den Rechner aus, so kann, schnelles
Handeln vorausgesetzt, der Speicherinhalt unter Umständen noch ausgelesen werden.
122
D. Pawlaszczyk
Nicht immer kann jedes der zuvor besprochenen Verfahren eingesetzt werden. Der Zugriff über den Hardware-Bus beispielsweise setzt das Vorhandensein einer entsprechenden
Firewireschnittstelle voraus, um an die Informationen im Arbeitsspeicher zu gelangen.
Das Cold-Booting-Verfahren ist eher akademischer Natur, da bei der praktischen Umsetzung viele technische Unwägbarkeiten existieren können, die eine zeitnahe Datensicherung verhindern. Eine softwaregestützte Sicherung des RAM-Inhalts kommt hingegen in
der Praxis sehr häufig zum Einsatz. Vorausgesetzt, das Betriebssystem ist nicht gesperrt,
kann man die dafür notwendige Software einfach von einem vorbereiteten USB-Stick aus
einspielen. Allerdings wird dadurch wiederum ein Teil des Speicherabbildes verfälscht.
Werkzeuge zur RAM-Sicherung
Für die Sicherung des Arbeitsspeichers existiert eine Vielzahl an Programmen. Die konkrete Auswahl wird in erster Linie durch das zu sichernde Betriebssystem vorgegeben.
Natürlich spielen auch immer die persönlichen Vorlieben des Untersuchenden eine wichtige Rolle. Für eine Sicherung des RAM-Inhalts unter Linux kann beispielsweise der
Linux-Memory-Extractor LiME3 verwendet werden. LiME wird auch zur Sicherung des
Arbeitsspeichers unter dem Betriebssystem Android genutzt werden. Über das Kommando insmod kann unter Linux ein Kernelmodul geladen werden. Um den Binärcode zur
Ausführung zu bringen, wird das folgende Kommando verwendet:
$ sudo insmod lime.ko "path=/home/user/mod.lime"
In diesem Beispiel wird das mittels insmod-Kommando zuvor erzeugte Kernelmodul
lime.ko in den Kernelmodus des Zielrechners geladen und ausgeführt. Das Speicherabbild
wird unter den in path angegebenen Dateipfad abgelegt. Bei einem älteren Linux-Kernel
bis zu Version 2.6 kann alternativ über die Geräte-Datei /dev/mem und dem Kommando
dd eine Sicherung des Arbeitsspeichers vorgenommen werden:
$ dd if=/dev/mem of=ram.dd
Für die Erzeugung eines Speicherabbildes unter Windows bietet sich das Programm
DumpIt der Firma MoonSols4 an, das hier kurz vorgestellt werden soll. Das von Matthieu Suiche entwickelte Werkzeug kann kostenlos von der Webseite der Firma bezogen
werden. Es handelt sich bei dem Programm ebenfalls um eine Anwendung, die auf Kernelebene ausgeführt wird. Mit gerade einmal 200 KByte ist das Programm recht kompakt.
Die Nutzung von DumpIt ist sehr einfach und erfolgt dialoggesteuert. Das kleine Tool
schreibt den aktuellen Inhalt des physischen Hauptspeichers in eine Datei, bei Bedarf
auch über eine Netzwerkverbindung auf ein Analysesystem.
In Abb. 5.3 ist zu sehen, dass die Anwendung DumpIt.exe gestartet wurde. Der insgesamt rund 1 GB große Hauptspeicher des zu sichernden Systems wird in die Datei
WinPC7xxx.raw gespeichert. Im Dateinamen ist gleichzeitig der Zeitpunkt, an dem die Sicherung durchgeführt wurde, vermerkt. Die Sicherung des Arbeitsspeichers unter Mac OS
3
4
http://code.google.com/p/lime-forensics
http://www.moonsols.com/2011/07/18/moonsols-dumpit-goes-mainstream
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
123
Abb. 5.3 Das Werkzeug DumpIt bei der Arbeit
X kann beispielsweise unter Verwendung des Werkzeugs Mac Memory Reader5 durchgeführt werden. Für die Ausführung des Programms sind Administratorrechte erforderlich:
$ sudo ./MacMemoryReader /Volumes/STORAGE/ram_kopie.raw
Speicheranalyse mit dem Volatility-Framework
Mit den im letzten Abschnitt vorgestellten Werkzeugen kann der RAM eines Rechners
kopiert und in eine Datei gesichert werden. Diese muss natürlich anschließend forensisch
untersucht werden. Hierfür steht wiederum eine Vielzahl unterschiedlicher Werkzeuge
zur Verfügung. Ein sehr verbreitetes und zugleich mächtiges Werkzeug zur Analyse des
Arbeitsspeichers bietet das Volatility Framework.6 Das Programm ist in seiner aktuellen
Version 2.4 erhältlich und wird unter GNU General Public License für Linux, Windows
und MAC angeboten. Das komplett in Python geschriebene Framework extrahiert nützliche Informationen aus den zuvor erstellen Speicherabbilddateien. Das Programm ist
standardmäßig mit einer Reihe von Default Plugins ausgestattet, die dem Ermittler vielfältige Analysemöglichkeiten bieten. Weitere Plugins können je nach Bedarf manuell
nachinstalliert werden. Bevor mit der gezielten Spurensuche begonnen werden kann, muss
zunächst einmal das Profil aus dem Image bestimmt extrahiert werden. Das Profil liefert
dem Ermittler Details zum vorliegenden Betriebssystem, ebenso wie Informationen zur
Hardware. Dazu analysiert Volatility zunächst den Kernel Debugger Block (KDBG). Für
diesen Arbeitsschritt bietet sich das Volatility Plugin imageinfo an:
$ volatility imageinfo -f image.raw
Volatility Foundation Volatility Framework 2.4
5
6
http://cybermarshal.atc-nycorp.com/index.php/cyber-marshal-utilities/mac-memory-reader
https://code.google.com/p/volatility/
124
D. Pawlaszczyk
Determining profile based on KDBG search...
Suggested Profile(s)
AS Layer1
AS Layer2
PAE type
DTB
KDBG
Number of Processors
Service Pack
KPCR for CPU 0
KUSER_SHARED_DATA
Image date and time
:
:
:
:
:
:
:
:
:
:
:
Win7SP0x86, Win7SP1x86
IA32PagedMemoryPae (Kernel AS)
FileAddressSpace (/img/image.raw)
PAE
0x185000L
0x8273bc28
1
1
0x8273cc00
0xffdf0000
2015-12-02 04:38:59 UTC+0000
Volatility hat einige Profile hinterlegt und sucht nach typischen Signaturen, um das konkrete System zu bestimmen. Dies ist wichtig, da die Struktur des Hauptspeichers natürlich
vom Betriebssystems und der konkreten Rechnerarchitektur abhängig ist. Von hier aus
kann das Programm unter anderem eine Liste der zum Zeitpunkt der Sicherung aktiven
Prozesse erstellen. Im nächsten Schritt kann man sich eine Übersicht über die zum Zeitpunkt der Sicherung laufenden Prozesse geben lassen. Das entsprechende Kommando in
Volatility würde wie folgt aussehen:
$ volatility pslist -f image.raw --profile=Win7SP1x86
Volatility Foundation Volatility Framework 2.4
Offset(V) Name
PID PPID Thds Hnds Sess
Start
---------- --------- --- ---- ---- ---- ---- ------------------0x83d33980 System
4
0
84 665
2015-12-02 04:36:14
0x843fcc48 smss.exe 252
4
2
29
2015-12-02 04:36:14
0x84ea3d40 smss.exe 316 252
0
0
2015-12-02 04:36:15
0x84f1b578 csrss.exe 328 316
8 519
0 2015-12-02 04:36:15
0x84f22d40 smss.exe 356 252
0
1 2015-12-02 04:36:15
...
Das in diesem Fall verwendete Plugin pslist gibt u. a. alle Prozesse mit dem aufrufenden Programmnamen, ihrer Prozess-ID (PID), der Elternprozess-ID (Parent Process ID,
PPID), der Anzahl der Threads (Thds), dem zugehörigen virtuellen Offset im Arbeitsspeicher sowie weitere Informationen aus.
Zur Ausgabe der aktiven Netzwerkverbindungen gibt es wiederum spezielle Plugins.
Für Windows-Vista, Windows-2008-Server sowie Windows-7 Speicherabbilder kann beispielsweise das Plugin netscan verwendet werden:
volatility netscan -f image.raw --profile=Win7SP1x86
Volatility Foundation Volatility Framework 2.4
Offset(P) Proto Local
Foreign
State
Owner
0x3e64513 TCPv4 0.0.0.0:35 0.0.0.0:0
LISTEN
vchost.exe
0x3edce37 TCPv4 0.0.0.0:491 0.0.0.0:0
LISTEN
services.exe
0x3e6c63d TCPv4 10.0.3.7:72 54.192.1.2:443 ESTABLSH Dropbox.exe
...
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
125
Aus dem Beispiel ist ersichtlich, dass die Anwendung Dropbox.exe eine aktive Verbindung
vom untersuchten System zu der externen IP-Adresse 54.192.1.2 aufgebaut hat. Verfolgt
man diese Adresse beispielsweise mithilfe des Kommandos whois, so zeigt sich, dass es
sich in diesem Fall um einen Server aus der Storage-Cloud von Amazon handelt. Tatsächlich nutzt Dropbox das Amazon-S3- (Simple Storage Service) Speichersystem zur Ablage
seiner Dateien.
Neben den hier gezeigten Funktionen existiert noch eine Vielzahl weiterer Plugins. So
unterstützt Volatility den Anwender beispielsweise bei der Suche nach Malware innerhalb
des Arbeitsspeichers. Darüber hinaus werden auch Teile der Registrierungsdatenbank von
Windows im Speicher gehalten, die ebenfalls mithilfe spezieller Plugins ausgewertet werden können.
Vor- und Nachteile
Der größte Vorteil der Live-Response-Analyse besteht darin, dass nahezu alle Aktivitäten
des laufenden Systems für eine weitergehende digitalforensische Untersuchung zur Verfügung stehen. Demgegenüber bestehen aber der Nachteil, dass eine Veränderung der zu
sichernden Daten fast immer unvermeidbar ist. Da es sich um flüchtige Daten handelt und
diese somit einer hohen Fluktuation unterliegen, sind die Daten nicht selten fragmentiert
oder wurden schlimmer noch bereits überschrieben. Bei der Frage, ob eine Sicherung des
Arbeitsspeichers durchzuführen ist, müssen Für und Wider genau gegeneinander abgewägt werden. Vor allem sollte man sich die Frage stellen, welche Spuren eine Analyse des
Arbeitsspeichers prinzipiell liefern kann und ob sich der Aufwand überhaupt lohnt.
5.3.2
Post-mortem-Akquise
Eines der Hauptprobleme bei der Live-Response-Analyse ist, dass die Reihenfolge der
Sicherung von flüchtigen Daten nicht immer zweifelsfrei festgelegt werden kann. Tatsächlich verändert jede Tätigkeit am zu untersuchenden System auch das System selbst, wenn
auch in der Regel nur minimal. Aus diesem Grund wird einer Post-mortem-Analyse im
Bereich strafrechtlicher Ermittlungsverfahren zumeist der Vorzug gegenüber einer LiveSicherung gegeben. Da im Rahmen dieser Analyseform häufig persistente Spuren, vornehmlich Speichermedien, gesichert und analysiert werden, wird auch häufig von Totanalyse (dead analysis) gesprochen. Hierfür muss zunächst eine forensische Datensicherung
durchgeführt werden, wobei der Ist-Zustand des Datenträgers unverfälscht und unveränderbar festgehalten wird. Dieser Arbeitsschritt beeinflusst entscheidend die Auswertbarkeit und die Beweiskraft der Daten. Ein besonderes Augenmerk sollte darauf gelegt
werden, dass durch die Sicherung keine Veränderungen am System entstehen, da die Datensicherung der Ausgangspunkt für die anschließenden forensische Untersuchung ist.
Bei einer Post-mortem-Analyse wird also zunächst immer eine Kopie der zu untersuchenden Datenträger (Festplatten, Speicherkarten, USB-Sticks etc.) erzeugt. Das System muss
sich dafür im ausgeschalteten Zustand befinden. Anschließend können die Datenträger
126
D. Pawlaszczyk
ausgebaut und gesichert werden. Ist ein Ausbau des Speichermediums nicht möglich, so
kann alternativ der zu sichernde Rechner mit einem speziell vorbereiteten Bootmedium
gestartet werden, das nur lesend auf das System zugreift und keine Veränderungen durchführt, um die Datensicherung durchzuführen. Die eigentliche forensische Untersuchung
fokussiert auf die Analyse der so erzeugten Abbilddateien. Durch das Erzeugen eines
Images wird eine bitgenaue Kopie des Originaldatenträgers erstellt. Somit ist die Phase der Beweisaufnahme nicht mehr zeitkritisch. Wann die Daten ausgewertet werden, ist
zweitrangig. Auf die erzeugten Kopien kann jederzeit zugegriffen werden.
Die Datenanalyse kann zudem in vielen Fällen effizienter durchgeführt werden als im
Fall der Live-Response-Analyse. Mehrere Ermittler können voneinander unabhängig forensische Auswertungen durchführen. Hierfür muss lediglich ein weiteres Duplikat der
Speichermedien aus den Imagedateien erzeugt werden. Ein zusätzlicher Vorteil der Postmortem-Analyse ist, dass das betroffene System schon nach dem Anfertigen der Kopien
sofort wieder in Betrieb genommen werden kann. Des Weiteren besteht nicht die Gefahr,
dass Daten beschädigt oder verändert werden und dadurch die Beweiskraft der Daten
verloren geht. Wie bereits ausgeführt, müssen Veränderungen an den erstellten Kopien
zweifelsfrei erkennbar, somit tamper-evident, sein.
Kryptografische Hashfunktionen
Die Möglichkeit, nachträgliche Manipulationen an digitalen Beweismitteln erkennen zu
können, besteht darin, die zu sichernden Daten durch Berechnung eines Hashwerts inhaltlich überprüfbar zu machen. Die dafür verwendeten Hashfunktionen spielen eine zentrale
Rolle im Datensicherungsprozess. Der Hashwert ist wie ein digitaler Fingerabdruck für
eine Datenquelle.Technisch gesehen handelt es sich um mathematische Funktionen, die
als Eingabe eine Zeichenfolge nahezu beliebiger Länge Z entgegennehmen und daraus
einen Ausgabewert fester Länge, den Hashwert H(Z), berechnen. Für den erzeugten Wert
gilt, dass es nicht effizient möglich sein sollte, von H(Z) auf den ursprünglichen Wert von
Z zu schließen (Einwegeigenschaft).
Außerdem sollte es nicht effizient möglich sein, ein Paar Z; Z 0 mit ZŠ D Z 0 zu
erzeugen, bei dem H D .Z/; H D .Z 0 / gilt. Diese zweite Eigenschaft wird als Kollisionsresistenz bezeichnet. Dadurch ist sichergestellt, dass eine Zeichenfolge nicht einfach
durch eine zweite ersetzt werden kann, der zufällig der gleiche Hashwert zuordenbar ist.
Vielmehr sollte bereits die Änderung eines einzigen Bits im Eingabestrom erkannt und zu
einem komplett anderen Hashwert führen. Jede Manipulation wird somit leicht nachweisbar. Aktuell verwendete Hashingsverfahren im forensischen Umfeld sind MD5, SHA1 und
SHA2 (Tab. 5.2). Im Jahr 2004 wurden mehrere erfolgreiche Angriffe (praktische Kollisionen) gegen das weit verbreitete MD5 gemeldet. Im Jahr 2013 wurde ein besonders
schnelles Verfahren entwickelt, mit dem eine MD5-Kollsion mit einem handelsüblichen
PC in weniger als einer Sekunde erzeugt werden kann [30]. Obwohl viele forensische
Werkzeuge noch immer MD5-Unterstützung anbieten, sollte darauf verzichtet werden, da
Manipulationen nicht mehr auszuschließen sind. Für SHA-1 ist bislang nur theoretisch
eine Kollision mit großem Aufwand zu erzeugen. Um ganz sicher eine Manipulation auf-
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
127
Tab. 5.2 Wichtige kryptografische Hashingverfahren
Name
SHA-1a
SHA-2
SHA-3
MD5b
MD6
a
b
Ausgabegröße
160 Bit
512/384 Bit
512/384 Bit
128 Bit
bis 512 Bit
Nachrichtengröße
264 1
2128 1
2128 1
264 1
264 1
Kollisionen
keine (252 Angriff)
keine bekannt
keine bekannt
ja (218 Angriff)
keine bekannt
SHA – Secure Hash Algorithm
MD5 – Message Digest Algorithm 5; unsicher, sollte nicht mehr verwendet werden
decken zu können, werden in der Praxis zumeist mehrere Hashwerte für den gleichen
Datenträger mit unterschiedlichen Verfahren erzeugt (Tab. 5.2).
Unter Linux können Hashwerte für Datenträger mit den Programmen sha1sum und
md5sum bestimmt werden. Sind die Ausgaben sowohl für das Quelllaufwerk sowie die
Kopie gleich, so war die Duplizierung fehlerfrei:
$ sudo sha1sum /dev/sda1
0d6b34851f9ddae1da3956fdc151c89129df640b
/dev/sda1
$ sudo sha1sum image.dd
0d6b34851f9ddae1da3956fdc151c89129df640b
image.dd
Ablauf der Datenträgersicherung
Zu Beginn einer Datensicherung, noch bevor die entsprechenden Hashwerte erstellt und
verifiziert wurden, sind grundsätzlich noch Manipulationen am Beweismittel möglich.
Deshalb muss gerade in dieser Phase ein Vier-Augen-Prinzip gelten. Zusätzlich ist der
gesamte Vorgang ausführlich zu dokumentieren. Bei der Sicherung der Beweise gilt zunächst der Grundsatz: Alles sichern - nichts verändern! Schon bei der Bewertung der
möglichen Relevanz der Daten für die Ermittlung können viele Fehler passieren, die
es zu vermeiden gilt. Übersieht der mit der Sicherung betraute Ermittler eine wichtige Datenquelle, so kann die Aufklärung des gesamtes Tatbestandes gefährdet oder ganz
unmöglich gemacht werden. Stellt der Forensiker auf der anderen Seite zu großzügig Daten sicher, kann auch dies durchaus negative Folgen haben, beispielsweise wenn dadurch
Datenschutzbestimmungen verletzt wurden. Um etwaige ungewollte Manipulationen zu
verhindern, wird der Ermittler für das Anfertigen der Kopie nach Möglichkeit immer einen
sogenannten Writeblocker verwenden. Diese spezielle Hardware wird zwischen das zu
duplizierende Speichermedium und das Computersystem, mit dem das Duplikat erzeugt
werden soll, zwischengeschaltet. Seine Aufgabe besteht darin, Schreibzugriffe auf den
Original-Datenträger zu unterbinden und seine Integrität abzusichern. Der Sicherungsprozess beginnt in der Regel mit der Bildung entsprechender Hashwerte für das betreffende
Quelllaufwerk. Daran schließt sich dann die eigentliche Imageerstellung an. Hierfür existiert eine Vielzahl an Werkzeugen. Natürlich muss auch von der erzeugten Abbilddatei
128
D. Pawlaszczyk
Abb. 5.4 Schritte bei der Sicherung von Datenträgern
wiederum der Hashwert bestimmt werden. Nur dann, wenn die Prüfsummen von Quelllaufwerk und Imagedatei übereinstimmen, liegt wirklich eine bitgenaue Kopie vor. Diese
ist auch gerichtsfest. Die einzelnen Schritte zur Sicherung von Datenträgern sind nochmal
in Abb. 5.4 zusammengefasst.
Forensische Dateiformate
Für die Erzeugung einer Imagedatei kommen grundsätzlich verschiedene Formate infrage.
Zumeist greift man dabei aber auf Formate zurück, die von allen gängigen forensischen
Werkzeugen erkannt und bearbeitet werden können. Die wichtigsten werden an dieser
Stelle kurz besprochen:
RAW-Format. Bei diesem Dateiformat werden die zu sichernden Daten tatsächlich
bitweise kopiert, sonst aber nicht verändert oder ergänzt. Zumeist trägt die Imagedatei
eine der Endungen raw, dd, img oder dmg. Speziell unter dem Betriebssystem Linux
ist die Erstellung einer Imagedatei im RAW-Format kinderleicht. Da Linux Datenträger
und Speicher über Gerätedateien verwaltet, kann durch das Kommando dd der Inhalt
einer Eingabedatei direkt in eine Ausgabedatei kopiert werden. Die Eingabequelle ist in
diesem Fall einfach ein Datenträger und nicht eine Datei. Das Format wird von nahezu
jedem forensischen Werkzeug unterstützt.
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
129
Exper-Whitness-Format. Das zweite, sehr weit verbreitete Format für forensische Datenträgersicherung ist das Expert-Whitness-Format (EWF), das von der Firma EnCase
im Jahr 1998 eingeführt wurde. Es hat sich zwischenzeitlich als Quasistandard für die
Speicherung von forensischen Images etabliert. Das Format wird von vielen forensischen Werkzeugen und quelloffenen Anwendungen unterstützt. Die meisten Tools
können aktuell die Version 1 von EWF verarbeiten. Diese Version ist allerdings etwas
limitiert. So war bis zur Version 5 der Encase-Suite die maximale Dateigröße auf 2 GB
beschränkt aufgrund der intern verwendeten Datei-Offset-Größe von lediglich 31 Bit.
Mit Encase 7 wurde das neue EnCase-Evidence-File-Format Version 2 eingeführt. Als
zusätzliche Features unterstützt dieses Format eine verbesserte Komprimierung und eine Verschlüsselung der gesicherten Daten mit AES-256. Der große Vorteil von EWF
besteht darin, dass zusätzlich zu den eigentlichen Rohdaten auch Metadaten zum Fall
abgelegt werden können. Es ist beispielsweise möglich, Informationen wie das Aktenzeichen des Falls, die Asservatennummer und den Namen des ausführenden Ermittlers
direkt in der Imagedatei zu speichern.
Advanced-Forensics-Format. Das dritte, sehr weit verbreitete Format ist das Advanced Forensics Format (AFF). Es wurde ursprünglich von Simson Garfinkel entwickelt
und ist zwischenzeitlich in der Version 4 verfügbar. Im Unterschied zu EWF wurde
AFF von Beginn an als offener und erweiterbarer Standard geplant. In den aktuellen Versionen werden zudem Kompression und Verschlüsselung unterstützt. Auch bei
diesem Format können Metadaten erfasst und zusammen mit der Kopie innerhalb einer -DDatei abgelegt werden. Wenngleich AFF sich in gegenüber EWF bislang nicht
durchsetzen konnte, wird es dennoch von vielen auch kommerziellen Programmen unterstützt.
Software für die Datenträgersicherung
Die Erstellung einer forensischen Kopie von Datenträgern oder Dateien wird durch eine
Vielzahl an Programmen unterstützt. Unter dem Betriebssystem Linux kann ein Image der
Festplatte beispielsweise mit dem Kommando dd erstellt werden:
$ dd if=/dev/sda of=kopie.img
Ein forensisches Abbild kann somit sehr leicht erzeugt werden. Im Beispiel wird eine bitweise Kopie der ersten Festplatte am ersten IDE-Port/SATA-Platte (Gerätedatei: /dev/sda)
durchgeführt. Die Daten werden in die unter dem Parameter of angegebene Imagedatei
kopie.img abgelegt. Das dd-Kommando wird ohne weitere Rückfragen oder Sicherheitsabfragen ausgeführt. Das ist nicht ganz unproblematisch, da bei unachtsamem Gebrauch
eventuell vorhandene Daten überschrieben werden können.
Mit dem vorgestellten dd-Kommando lässt sich ein Datenträger sehr leicht duplizieren.
Tritt allerdings beim Kopieren ein Lesefehler auf, so bricht der Kopiervorgang ab. Selbst
wenn sich das Programm nicht beendet, werden die Lesefehler nicht forensisch korrekt dokumentiert, da dd keine Fehlerbehandlung anbietet. Jeder Lesefehler führt zwangsläufig
dazu, dass das Original von der Kopie abweicht. Quelle und Ziel könnten sich im Extrem-
130
D. Pawlaszczyk
fall unterscheiden, ohne dass wir einfach feststellen könnten, wo genau die Unterschiede
liegen und wie sie entstanden sind.
Das geschilderte Verhalten, das speziell im Hinblick auf forensische Anwendungen
nicht ganz unproblematisch ist, kann aber durch andere Kommandos unter Linux gelöst
werden. So existieren gleich mehrere Programme, die sich kaum funktionell unterscheiden
und die die notwendige Fehlertoleranz besitzen. Exemplarisch sollen an dieser Stelle zwei
Alternativen besprochen werden: ddrescue und ddrescue.
ddrescue. Entspricht im Wesentlichen dd mit dem Unterschied, dass das Tool daraufhin
optimiert ist, fehlerhafte Sektoren trotz eines Fehlers zu kopieren. Dazu kann beispielsweise über einen Parameter die Anzahl an maximalen Wiederholungsversuchen definiert
werden:
$ ddrescue -direct -retrim -max-retries=5 /dev/hda img.dd log.txt
Zusätzlich wird in einer Logdatei (der letzte Parameter im Beispiel) in Textform festgehalten, welche Bereiche trotz mehrfacher Versuche nicht lesbar waren. Somit wird
nachvollziehbar, in welchen Bereichen sich Original und Kopie unterscheiden, ohne das
gesamte Kopierergebnis infrage stellen zu müssen. Dem forensischen Dokumentationsanspruch wird dadurch Genüge getan. Abweichungen zwischen Kopie und Original sind
klar begründet und nachvollziehbar.
dd_rescue. Bei dem Werkzeug dd_rescue handelt es nicht, wie der Name vermuten lassen würde, um eine Variante des zuvor besprochenen ddresuce, sondern um eine eigenständige Entwicklung. Auch dieses Tool ermöglicht die Datenrettung und erweitert das
dd-Kommando um für die forensische Datensicherung notwendige Funktionen. Im Unterschied zu ddrescue kann dd_rescue allerdings nicht nur mit Blockgeräten umgehen.
Es können auch normale Dateien verarbeitet und kopiert werden. Die Daten können bei
Bedarf zusätzlich komprimiert werden. Eine Fernsicherung über eine verschlüsselte Netzwerkverbindungen wird ebenfalls unterstützt.
dd_rescue /dev/sda1 - | ssh benutzer@sicherungsrechner
cat - > /verzeich/datei.img
In diesem Beispiel wird wiederum die erste Festplatte am IDE-Bus gesichert, wobei das
Image über eine ssh-Verbindung in ein Zielverzeichnis auf dem Remote-System abgelegt
wird.
Die vorgestellten Werkzeuge zur Imageerstellung haben den Vorteil, dass sie mittlerweile in den gängigen Linux-Distributionen enthalten sind oder problemlos nachinstalliert
werden können. Daneben existieren aber auch noch viele andere Anwendungen, mit denen
Datenträger forensisch korrekt gesichert werden können. Für die Imageerstellung unter
Windows bietet sich beispielsweise das Programm FKTImager der Firma AccessData
an.7 Das kostenlos erhältliche Programm lässt sich sehr komfortabel über eine grafische
7
http://accessdata.com/product-download/digital-forensics/ftk-imager-version-3.2.0
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
131
Abb. 5.5 Das Programm FTK-Imager bei der Arbeit
Oberfläche bedienen und kann Abbilddateien nicht nur erstellen, sondern auch in das Betriebssystem einbinden (Abb. 5.5). Images einzelner Partitionen lassen sich als logisches
Laufwerk mounten. Das Programm unterstützt dabei alle gängigen forensischen Formate.
Mittlerweile ist man beim FTKImager nicht mehr auf Windows als Betriebssystem angewiesen. Seit Version 2.9 steht dem Anwender eine Kommandozeilenversion für Mac
OSX, Windows und Linux zur Verfügung.
Abschließend sei an dieser Stelle noch das Programm guymager von Guy Voncken
erwähnt, mit dem es ebenfalls möglich ist, forensische Images von Festplatten zu erstellen. Es verfügt über eine grafische Oberfläche und ist ähnlich leicht wie der FTKImager
zu bedienen. Guymager ist unter Linux verfügbar und greift für seine Arbeit auf die
Toolsammlung libewf zurück. Aus dieser Distribution besonders hervorzuheben ist das
Programm ewfquire. Dieses unterstützt unzählige verschiedene Parameter und bietet – im
Unterschied zu den vorher beschriebenen Tools – zusätzlich einen interaktiven Modus.
$ ewfaquire /dev/hda1
Nach dem Start des interaktiven Modus werden die weiteren möglichen Konfigurationsparameter zur Sicherung von /dev/hda1 interaktiv abgefragt.
Untersuchung des Datenträgerabbilds
Mit der Sicherung der Datenträger ist der erste Schritt der Beweisaufnahme abgeschlossen. Wurde, wie im letzten Abschnitt beschrieben, eine bitgenaue Kopie des Datenträgers
erzeugt, so spricht man von einer vollständigen Sicherung. Ein großer Vorteil dieser Si-
132
D. Pawlaszczyk
Abb. 5.6 Schritte der Datenanalyse
cherungsform besteht darin, dass dadurch auch möglicherweise zuvor gelöschte Daten
sichtbar gemacht bzw. wiederhergestellt werden können. Nachdem alle relevanten Datenträger erfasst und auf entsprechenden Sicherungsmedien untergebracht sind, kann der
eigentliche Analyseprozess beginnen. Dieser Vorgang wiederum lässt sich in verschiedene
(Teil-)Schritte zerlegen. Zunächst muss bestimmt werden, welche Daten sich auf den sichergestellten Speichermedien befinden, ob Partitionen und Dateisysteme vorhanden sind
oder diese möglicherweise formatiert wurden. Begonnen wird in der Regel zunächst mit
einer physischen Analyse des Mediums. Daran schließt sich im nächsten Schritt die Suche nach logischen Laufwerken (Partitionen), die auf dem Datenträger abgelegt sind, an.
Sind Laufwerke und Partitionen bekannt, wird in der nächsten Phase das Dateisystem eingehend analysiert, um die auf dem Datenträger gespeicherten Dateien zu identifizieren.
Im letzten Schritt schließlich müssen die gefundenen Daten gesichtet, gefiltert und mit
Blick auf ihre Relevanz hin bewertet werden. In diesem Aggregationsschritt ist zu klären, um welche Arten von Daten es sich konkret handelt. Im Rahmen der Datenerhebung
wird zudem versucht, möglicherweise gelöschte und versteckte Daten zu rekonstruieren.
Die angesprochenen Schritte sind in Abb. 5.6 nochmals dargestellt. Jeder Schritt wird im
Folgenden nochmals genauer vorgestellt.
Physische Medienanalyse
Mit diesem Schritt beginnt i. d. R. die Spurensuche. Hierbei wird zunächst die physische
Struktur des Datenträgers näher untersucht und die Datensektoren des Speichermediums
analysiert. In diesem Zusammenhang sind speziell die nicht belegten Bereiche von Bedeutung. Für die forensische Arbeit sind speziell die sogenannten Slack-Bereiche auf dem
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
133
Abb. 5.7 Zusammensetzung des File-Slacks innerhalb eines Clusters
Datenträger interessant. Hier können nicht selten wichtige Informationen versteckt sein.
Ein Speichermedium ist normalerweise in Sektoren unterteilt. Ein Datenträger ist für das
Betriebssystem eine Folge aufeinanderfolgender Sektoren. Die typische Größe für einen
Sektor beträgt 512 Byte. Mehrere Sektoren werden wiederum logisch zu einem Cluster
zusammengefasst. Bei blockorientierten Geräten wie Festplatten wird jeweils ein Cluster gelesen bzw. geschrieben. Ein Sektor kann somit als die kleinste vom Betriebssystem
adressierbare logische Datenspeichereinheit angesehen werden.
Die Daten werden in Cluster gespeichert, wobei jedes Datencluster eine festgelegte
Größe besitzt. Diese variiert je nach verwendetem Dateisystem. Wird nun eine Datei gespeichert, so deckt sich diese in der Regel nie exakt mit der Größe des Clusters. Speichert
man beispielsweise ein 1000 Byte große Datei in ein Datencluster, dessen Standardgröße
4096 Bytes beträgt, so entsteht eine Lücke von 3096 Byte. Diese Lücken werden von den
einzelnen Betriebssystemen unterschiedlich behandelt. Häufig werden diese Bereiche mit
Nullbytes, zum Teil mit zufälligen Werten oder aber mit Daten aus dem Hauptspeicher
beschrieben. Der Grund für das offenbar willkürliche Beschreiben nicht genutzter Datenbereiche ist ganz einfach: Da Festplatten blockorientierte Speichergeräte sind, können sie
jeweils nur ganze Cluster lesen bzw. schreiben. Beim Schreiben muss das Betriebssystem
deshalb den Leerraum entsprechend füllen. Die so entstehenden nicht genutzten Datenbereiche auf dem Datenträger werden als File-Slack bezeichnet.
Unter dem Betriebssystemen DOS und älteren Versionen von Windows wurden zum
Füllen der Leerbereiche beispielsweise RAM-Inhalte verwendet, weshalb man auch heute noch vom sogenannten RAM-Slack spricht. Dieser erstreckt sich in der Regel bis zur
Sektorgrenze. Die verbleibenden nicht beschriebenen Bereiche des Clusters werden im
Unterschied dazu als Drive-Slack bezeichnet (Abb. 5.7).
In allen genannten Slackbereichen können sich wiederum Fragmente alter Daten befinden. Mit dem Wissen über existierende File-Slack-Varianten ist es mitunter möglich,
wichtige Informationen wiederherzustellen. So können nicht nur sensible Daten wie Benutzernamen und Passwörter gefunden werden. Sehr häufig lässt eine Analyse der Datensektoren sowie der darin enthaltenen Cluster Rückschlüsse darauf zu, für welche Zwecke
ein Rechner in der jüngeren Vergangenheit verwendet wurde.
134
D. Pawlaszczyk
Laufwerksanalyse
Innerhalb dieses Analyseschrittes wird in der Regel zunächst der logische Aufbau des
Datenträgers untersucht. Datenträger sind in logische Abschnitte, die sogenannten Partitionen, unterteilt. Die Information, welche Partitionen sich konkret auf einem Datenträger
befinden, sind wiederum in einer Partitionstabelle abgelegt. Diese Datenstruktur befindet
sich in den ersten Sektoren des Datenträgers. Alle notwendigen Informationen, wie Länge
sowie Anfang und Ende der jeweiligen Datenbereiche, lassen sich hier finden. Normalerweise speichert die Partitionstabelle auch Informationen über den Inhalt der Partition. So
kann beispielsweise ermittelt werden, ob es sich um eine bootbare Partition mit Betriebssystem handelt bzw. welches Dateisystem innerhalb der Partition zum Einsatz kommt. Mit
dem Kommando mmls aus der Sleuth Kit Distribution8 können unter Linux die Partitionstabelle gelesen und die darin enthaltenen Dateisysteme sichtbar gemacht werden:
$ sudo mmls /dev/sda
DOS Partition Table
Offset Sector: 0
Units are in 512-byte sectors
Slot
00:
01:
02:
03:
04:
05:
06:
07:
08:
09:
Meta
----Meta
Meta
01:00
----Meta
Meta
02:00
-----
Start
000000000
000000000
000002048
000002048
000004096
470816768
470816955
470816955
470818816
488396800
End
000000000
000004095
488396799
000002048
470816767
470818815
488396799
470816955
488396799
488397167
Length
000000001
000004096
488394752
000000001
470812672
000002048
017579845
000000001
017577984
000000368
Description
Primary Table(#0)
Unallocated
DOS Extended(0x05)
Extended Table(#1)
Linux (0x83)
Unallocated
DOS Extended(0x05)
Extended Table(#2)
Linux Swap
Unallocated
Wie in der Beispielausgabe des Programms zu sehen ist, befindet sich die Partitionstabelle im ersten Sektor der Festplatte. Darüber hinaus lassen sich noch zusätzliche erweiterte
Partitionstabellen finden (Slots 02 und 07). Auch die eigentlichen Datenpartitionen, im
Beispiel eine Linux-Partition sowie ein Swapbereich, sind zu erkennen. Zusätzlich befinden sich auch noch mehrere nicht belegte bzw. nichtallozierte Bereiche (unallocated) auf
dem Datenträger. Dieser Versatz wird auch als Partition-Slack bezeichnet.
Partition-Slack
An diesem Beispiel wird auch ersichtlich, wie wichtig es ist, dass nach Möglichkeit (und
abhängig vom Untersuchungsziel) immer der komplette Datenträger gesichert wird. Dies
hat zum einen den Grund, dass es einerseits versteckte Partitionen geben könnte, die einen
nicht erkennbaren Dateisystemtyp beinhalten. Diese Technik wird üblicherweise von diversen Schadprogrammen verwendet, um sich vor den Blicken neugieriger Virenscanner
zu verbergen. Oftmals entstehen im Verlauf einer Neupartitionierung des Datenträgers un8
http://www.sleuthkit.org/
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
135
Abb. 5.8 Kategorien für Datenartefakte auf Datenträgern. (In Anlehnung an B.Carrier [8])
gewollt oder zum Teil auch gewollt (durch bewusste Manipulation), die bereits erwähnten
Slack-Spaces. Speziell in diesen Bereichen können sich wiederum Daten befinden, die für
eine forensische Untersuchung interessant sind. Slackbereiche können somit auch dann
zu finden sein, wenn das Ende einer Partition und der Anfang der nächsten nicht direkt
aufeinander folgen.
Dateisystemanalyse
An die Laufwerksanalyse schließt sich normalerweise die Untersuchung der gefundenen Dateisysteme, soweit vorhanden, an. Eine genaue Kenntnis über das Dateisystem
erlaubt den Zugriff auf Struktur- und Nutzerdaten sowie die Rekonstruktion von Vorgängen auf dem Dateisystem, ohne über das eigentliche Betriebssystem zugreifen zu müssen.
In Carrier [8] wird ein Referenzmodell für Dateisysteme vorgestellt. Demnach lassen sich
grob fünf Kategorien von Datenartefakten unterscheiden, die normalerweise auf einem
Datenträger gefunden werden können (vgl. Abb. 5.8): Dateisystemdaten (Filesystem Data), Inhaltsdaten (Content Data), Metadaten (Meta Data), Dateinamen (File Names) sowie
Anwendungsdaten (Application Data). Die Dateisystemdaten liefern allgemeine Informationen über das Dateisystem, wie Größe der Datenblöcke, welche Datenblöcke belegt bzw.
frei sind. Den typischerweise größten Anteil an Daten bilden die Inhaltsdaten. Sie werden
136
D. Pawlaszczyk
auch als Data Units oder Cluster (unter Windows) bzw. Block (unter Linux) bezeichnet
und beinhalten die eigentlichen Programm- und Anwendungsdaten. Sie sind nicht zu verwechseln mit den Clustern des Speichermediums.
Zusätzlich werden in der Regel Metadaten, wie Speicherort, Größe, Zeitstempel
der letzten Änderung zu den Inhaltsdaten erfasst. Diese Informationen sind unter dem
Linux-spezifischen Dateisystem EXT beispielsweise in den sogenannten INodes abgelegt. Für das Dateisystem FAT32 werden die Metadaten über entsprechende FATVerzeichniseinträge abgebildet. Die Dateinamen wiederum repräsentieren den externen
die Benutzer sichtbaren Namen der Datei. Dabei ist der Dateiname mit dem zuvor erwähnten Deskriptoren (INodes, FAT-Einträge) verknüpft. Schließlich können häufig noch
sogenannte Anwendungsdaten auf dem Datenträger gefunden werden. Diese Datenkategorien enthalten nützliche Zusatzinformationen wie Journaleinträge des Dateisystems
oder beispielsweise Quotastatistiken. In der Regel sind die Anwendungsdaten nicht zwingend für die Verwaltung des Datenträgers erforderlich. Die eigentliche Interpretation der
Dateiinhalte schließlich wird im Rahmen der Anwendungsanalyse durchgeführt (Abschn. 5.3.4).
Datenträgeranalyse mit dem Sleuth Kit
Die zuvor beschriebenen Analyse des Dateisystems wird unter anderem durch die Toolsammlung The Sleuth Kit9 unterstützt. Diese Distribution stellt eine Reihe von Werkzeugen bereit, die von der Kommandozeile aus gestartet werden und mit denen umfangreiche
forensische Untersuchungen an Festplatten und Festplattenimages durchgeführt werden
können. Mit dem Befehl ffstat lassen sich beispielsweise Details des zu analysierenden
Dateisystems ausmachen. Mit dem Kommando ffind kann der Forensiker Dateistrukturen
und allozierte bzw. nichtzugewiesene Dateinamen, die auf Metadatenstrukturen verweisen, identifizieren; wohingegen das Kommando fls allozierte und gelöschte Dateinamen
im angegebenen Verzeichnis anzeigt. Tools zur Analyse der Metadatenebene sind durch
ein vorangestelltes i zu erkennen. So listet etwa ils die bereits besprochenen Metadatenstrukturen und den zugehörigen Inhalt auf. Mittels icat können Dateneinheiten einer Datei
anhand ihrer Metadatenadressen extrahiert werden. Mit ifind ist es wiederum möglich, zu
einem gegebenen Dateinamen die passenden Metadaten zu finden, ebenso wie Metadaten,
die auf eine bestimmte Dateneinheit verweisen. Statistiken und Details zu Anwendungsdaten lassen sich mit dem Kommando istat ermitteln. Im folgenden Beispiel wird der
Datenblock mit der Nummer 200 aus der Abbilddatei image.dd eines Datenträgers untersucht:
$ istat image.dd 200
inode: 200
Not Allocated
uid / gid: 1000 / 1000
mode: rw------size: 92
9
http://www.sleuthkit.org/
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
num of links: 1
Modified:
Accessed:
Changed:
Direct Blocks:
01.11.2015 17:09:49
01.11.2015 17:09:58
01.11.2015 17:09:49
68382
137
(GMT+0)
(GMT+0)
(GMT+0)
So lässt sich beispielsweise feststellen, dass der Datenblock momentan nicht alloziert ist
und wann er zuletzt geändert oder auf ihn zugriffen wurde. Auf diese Weise kann beispielsweise eine detaillierte Zeitreihenanalyse über Schreib- bzw. Lesevorgänge auf den
zu untersuchenden Datenträger erstellt werden.
5.3.3 Datenrekonstruktion mittels Carving
Nicht selten trifft der IT-Forensiker auf einen Datenträger, dessen Dateisystem beschädigt ist oder formatiert wurde. Teilweise wurden Dateien vom Tatverdächtigen kurz zuvor einfach gelöscht. Auch solche scheinbar verlorenen Dateninhalte können nicht selten
wieder sichtbar gemacht werden. Beim Löschen einer Datei beispielsweise entfernt das
Betriebssystem in der Regel lediglich den Verweis auf die Datei aus den Tabellen des
Dateisystems. Der dadurch nicht länger allozierte Speicherbereich kann zu einem späteren Zeitpunkt gegebenenfalls mit neuen Daten überschrieben werden. In der Zwischenzeit
sind die alten Daten aber nach wie vor vorhanden. Ähnlich verhält es sich, wenn der Datenträger formatiert wird.
Die Möglichkeit, an verschiedenen Stellen des Dateisystems oder der Festplatte Datenfragmente zu finden, auch dann, wenn keine Dateieinträge mehr vorhanden sind, kann sich
der Ermittler zu eigen machen. Oft lassen sich diese einzelnen Fragmente mit einem als
File Carving bekannten Verfahren wieder zu einer Datei zusammensetzen. Das Carving
wird unter Verzicht auf Metadaten durchgeführt. Die Suche nach Dateifragmenten bezieht
sich primär auf die nicht-allozierten Bereiche innerhalb und außerhalb des Dateisystems
(File-System-Slack) sowie innerhalb und außerhalb der Partition (Partition-Slack). Im besten Fall sind die wiederherzustellenden Dateien nicht fragmentiert, d. h., alle zu der Datei
gehörenden Daten befinden sich in aufeinanderfolgenden Datenblöcken auf dem Datenträger. In diesem Fall kann zunächst der Kopf (engl. header) und anschließend das Ende
(engl. footer) der Datei lokalisiert werden. Anschließend sind alle Datenblöcke die zwischen Header und Footer stehen auszulesen, um die Datei wiederherstellen zu können. Für
die beschriebene Suche nach Dateifragmenten werden zumeist signaturbasierte Verfahren
eingesetzt. Dabei wird der Umstand genutzt, dass jede Dateiart, gleich ob es sich um eine Bildatei, ein PDF-Dokument oder eine Word-File handelt, fast immer ein bestimmtes
Dateiformat bzw. einen bestimmten Aufbau hat. Eine JPEG-Bilddatei beispielsweise beginnt immer mit der charakteristischen hexadezimalen Bytefolge 0xFFD8FF (Abb. 5.9).
Das Ende der Bilddatei wird wiederum durch Bytefolge 0xFFD900 markiert. Für fast
jedes Dateiformat lassen sich in der Regel charakteristische Bytefolgen (Signaturen) bestimmen. In Tab. 5.3 sind einige Datenformate und die ihnen zuordenbaren Header- bzw.
138
D. Pawlaszczyk
Abb. 5.9 Signatur (Header) einer JPEG-Datei im Hex-Editor
Tab. 5.3 Signaturen für verschiedene Dateiformate
Format
Dateiendung Header
Portable Graphic
.jpg
0xFFD8FF
Graphic Interchange Formata .gif
0x474946383761
0x474946383961
Portable Document Format
.pdf
0x25504446
ZIPb
.zip
0x504B0304
MS-Doc-Format(97/98-2003) .doc
0xD0CF11E0A1B1
a
b
Footer
0xFFD900
0x003B
0x0A2525454F460A
0x504B0506??????
k. A.
Der Header ist länger und kann enthält zusätzlich EXIF-Informationen
? = Wildcard-Byte, 18 Bytes insgesamt
Footerinformationen exemplarisch dargestellt. Für einige Dateiformate lässt sich mitunter
kein eindeutiger Footer bestimmen. Das gilt beispielsweise für Word-Dokumente. Diese
verfügen über keine spezifische Endesequenz. Entsprechend muss in diesem Fall versucht werden, die Dateigröße anderweitig zu bestimmen. Mitunter ist die Gesamtgröße
der Datei bereits in den Kopfdaten des Dokuments hinterlegt.Zum Teil lassen sich auch
sogenannte Landmarks identifizieren, über die auf den Beginn oder das Ende einer Datei gefolgert werden kann. Diese treten immer an einer bestimmen Stelle im Datenformat
auf. Eine weitere Möglichkeit bietet eine Entropieanalyse. In diesem Fall wird der mittlere
Informationsgehalt bzw. die Informationsdichte für die auf dem Speichermedium befindlichen Datenblöcke bestimmt. In Abb. 5.10 sind beispielhaft die Entropiewerte für einzelne
Datenblöcke auf einem Datenträger berechnet worden. Ab Block 1200 steigt die Entropie plötzlich an. Ändert sich der Informationsgehalt des zuletzt gelesenen Blockes im
Vergleich zum Durchschnitt plötzlich sprunghaft, so deutet das auf das Ende der Datei
hin. Schwierig hingegen wird es, wenn die Datei aufgrund ihrer Größe in unterschiedlichen Bereichen das Datenträgers verteilt gespeichert wurde. Eine starke Fragmentierung
erschwert die programmgestützte Suche erheblich. In diesem Fall bleibt häufig nur eine manuelle Analyse mit dem Hex-Editor. Bei der Extraktion der Daten gilt, wie schon
mehrfach erwähnt, dass die Wiederherstellung unbedingt an einem forensischen Duplikat vorgenommen werden sollte. Muss hingegen am laufenden System gearbeitet werden,
sollten die wiederhergestellten Daten dann auf einem separaten Dateisystem gespeichert
werden, da sonst ja der unallozierte Bereich (den man eigentlich extrahieren will) wie-
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
139
Abb. 5.10 Berechnete Entropiewerte für Datenblöcke eines Speichermediums
der überschrieben würde. Dies ist selbstverständlich zu unterbinden. Alternativ kann in
diesem Fall auch eine RAM-Disk eingerichtet werden.
Nicht unerwähnt bleiben sollte die Möglichkeit über Antiforensikmethoden, die Extraktion von vermeintlich gelöschten Dateien zu verhindern. Eine wirksame Methode
besteht beispielsweise darin, die betroffenen Datenbereiche mehrfach zu überschreiben
und mit echten zufälligen Bitmustern oder auch Nullen zu füllen. Dieses Verfahren wird
auch als Wiping bezeichnet.
Carving mit Scalpel
Es gibt verschiedene kommerzielle als auch quelloffene Tools, mit denen gelöschte Datei und Datenfragmente extrahiert werden können. An dieser Stelle soll kurz auf das
Tool Scalpel10 eingegangen werden. Es ist für alle gängigen Betriebssysteme verfügbar
und kann zur Auswertung von Header- und Footer-Informationen eingesetzt werden. Es
arbeitet mit einem signaturbasierten Ansatz und erlaubt das Finden und die Extraktion gelöschter Daten von physischen Datenträgern oder Imagedateien. Bevor Scalpel verwendet
werden kann, muss das Programm konfiguriert werden, da standardmäßig alle Dateitypen deaktiviert sind. Hierfür muss unter Linux die Datei /etc/scalpel/scalpel.conf editiert
werden. Um beispielsweise GIF- oder JPEG-Dateien wiederherstellen zu können, sind die
Signaturen für das Dateiformat z zu aktivieren:
$ vi /etc/scalpel/scalpel.conf
#case
size
header footer
# GIF and JPG files (very common)
10
www.digitalforensicssolutions.com/Scalpel
140
D. Pawlaszczyk
gif y 5000000
\x47\x49\x46\x38\x37\x61
\x00\x3b
gif y 5000000
\x47\x49\x46\x38\x39\x61
\x00\x3b
jpg y 200000000 \xff\xd8\xff\xe0\x00\x10
\xff\xd9
# Outlook files
# pst
y
500000000 \x21\x42\x4e\xa5\x6f\xb5\xa6
# ost
y
500000000 \x21\x42\x44\x4e
Anschließend können Dateien aus einer Datei oder Laufwerk extrahiert werden:
$ scalpel /dev/sda1 -o output
In diesem Beispiel wird die erste Partition nach Dateisignaturen durchsucht. Mit dem
Parameter o wird das Ausgabeverzeichnis festgelegt. Alle wiederhergestellten Dateien
werden in dieses Verzeichnis gespeichert. Zusätzlich wird eine Auditdatei im Zielordner
angelegt, welche u. a. den vollständigen Kommandozeilenaufruf, den Beginn und das Ende des Programmlaufs und die extrahierten Dateien enthält.
5.3.4 Kategorisierung und Filterung der Datenartefakte
Nachdem, wie im letzten Abschnitt beschrieben, alle Daten gesichert und erfasst wurden,
müssen im nächsten Schritt der Ermittlungen die gefundenen Daten überprüft werden.
Dieser Vorgang ist im Vergleich zur physischen Analyse des Speichermediums auf einer
höheren Abstraktionsstufe angesiedelt, da er auf die Inhalte der Daten abstellt.
Nicht selten muss der IT-Forensiker riesige Datenmengen untersuchen und bewerten.
Die Herausforderung besteht in diesem Fall darin, eine sinnvolle Strukturierung, Filterung
und Aggregation der Daten vorzunehmen. Ziel sollte es sein, die Menge an vorliegenden
Daten möglichst effektiv auf die Artefakte einzugrenzen, die für den aktuellen Fall von
Relevanz sind, ohne dabei wichtige Spuren zu übersehen.
Forensisch bedeutsame Datenkategorien
Hierfür erweist es sich als sinnvoll, die Daten zunächst zu kategorisieren. Durch die Zuordnung der gefundenen Daten zu einer konkreten Datenkategorie verringert sich die
Komplexität des Problems, getreu dem Motto: Teile ein Problem, und du hast es zur Hälfte
gelöst. Für den forensischen Untersuchungsprozess lassen sich grob die folgenden Datenkategorien unterscheiden:
Programmdaten. In diese Kategorie fallen alle ausführbaren Programmdateien sowie
Funktionsbibliotheken. Der Inhalt dieser Daten bleibt zumeist unverändert. Sie werden
zur Ausführung der Anwendungen auf dem Rechner benötigt. Diese Kategorie kann
insbesondere dann von Interesse sein, wenn es um die Erkennung von Schadsoftware
geht, da sich diese bevorzugt in Binärdateien des Betriebssystem bzw. in ausführbare
Anwendungen einhängt. Nicht selten verschafft sich ein Angreifer so Zugriff auf ein
System.
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
141
Systemdaten. Das System erzeugt darüber hinaus im Hintergrund weitere Daten, die
zur besseren und effizienteren Verarbeitung der Anwendungsdaten genutzt werden.
Beispiele für diese Datenkategorie sind Indizes, Journaleinträge oder Cachedaten.
Auch diese Artefakte können mitunter sehr viel über die Aktivitäten eines Nutzers auf
dem System verraten und werden häufig bei einer Bereinigung des Systems von den
Verdächtigen übersehen.
Anwendungsdaten. Hierunter werden im Folgenden jene Daten verstanden, welche
die Anwendung (Textverarbeitungsprogramm, Mail-Client, Browser) primär verarbeitet und die durch die Nutzung von Programmen erzeugt, verändert oder gelesen werden. Es handelt sich um die im eigentlichen Sinne vom Anwender erzeugten Daten. Der
Fokus der Ermittlungen liegt in vielen Fällen auf dieser Datenkategorie, um beispielsweise einem Tatverdächtigen den Besitz illegaler Dateninhalte nachweisen zu können.
Sonstige Nutzerdaten. Jeder Benutzer eines IT-Systems erzeugt darüber hinaus Daten, die für den Betrieb einer Anwendung nicht zwingend notwendig, aber häufig sehr
hilfreich sein können. Dazu zählen beispielsweise Kontaktlisten, Lesezeichen in Webbrowsern, Historiendaten mit den zuletzt verwendeten Anweisungen, Daten über den
letzten Aufruf eines Programms oder eine Auflistung der zuletzt geöffneten Dokumente. Diese Datenartefakte sind zumeist in speziellen Dateien im Nutzerverzeichnis
abgelegt.
Konfigurations- und Logdaten. Anwendungen werden über entsprechende Konfigurationsdateien verwaltet. Sie sind durch das Betriebssystem oder Programme veränderbare Daten, die das Systemverhalten und nicht das Kommunikationsverhalten
beeinflussen. Im Systembetrieb werden darüber hinaus Ereignisse, Fehlermeldungen
und Aktivitäten der Benutzer protokolliert und entsprechende Logdaten erzeugt. Gerade diese Daten liefern in vielen Fällen wertvolle Informationen über durchgeführte
Aktivitäten am zu untersuchenden System. Sie sind daher für eine forensischen Untersuchung von besonderer Bedeutung.
Die vorgenommene Aufteilung in unterschiedliche Datenkategorien dient als Voraussetzung, um forensische Datenquellen leichter identifizieren und erfassen zu können. Dieses
Vorgehen ist unabhängig von einem konkreten forensischen Programm zu empfehlen. Im
Rahmen der Spurensuche gilt es, die gefundenen Datei- und Datenfragmente einer der genannten Kategorien zuzuordnen. Dazu gehört gegebenenfalls auch die Umwandlung und
Extraktion von Daten in andere Formate. Häufig ist es beispielsweise notwendig, Archive zu entpacken, oder es muss versucht werden, verschlüsselte Ordner und Dateninhalte
zunächst zu entschlüsseln.
Datenreduktion
Um das zu untersuchende Datenvolumen im Bereich der Programm- und Anwendungsdaten weiter einzugrenzen, bieten einschlägige forensische Werkzeuge zwei Möglichkeiten
an: Whitelisting und Blacklisting. Beim Whitelist-Ansatz werden Programmdaten auf Veränderungen ihres binären Aufbaus hin untersucht. Dazu werden zumeist die Hashwerte
142
D. Pawlaszczyk
bekannter Systemdateien mit den auf den Datenträger gefundenen Dateien abgeglichen.
Erkannte Abweichungen der Hashwerte deuten wiederum auf eine Manipulation dieser
Dateien hin. Beim Blacklisting wird umgekehrt nach Signaturen von bekannten Schadprogrammen wie Trojanern oder Rootkits gesucht. In beiden Fällen müssen die gefunden
Anomalien eingehend untersucht werden. Auf den Webseiten der National Software Reference Library (NSRL)11 werden regelmäßig Datasets mit Hashwerten von Systemdateien
sowie Anwendungsprogrammen veröffentlicht. Diese kann man mit den berechneten Hashwerten der Systemdateien auf dem untersuchten System abgleichen, um Abweichungen
zu bestimmen. Mithilfe des Programms md5deep12 ist es beispielsweise möglich, Hashwerte für einzelne Dateien, aber auch Ordner, berechnen und in eine Datei ausgeben zu
lassen:
$ md5deep.exe -z -r -l -o e -s "%SystemDrive%\*" > hashes.txt
Vielfach müssen die gefundenen Logdateien nicht komplett untersucht werden. Ist beispielsweise genau bestimmbar, in welchen Zeitraum ein Computereinbruch stattgefunden
hat, ist es zumeist ausreichend, sich bei der Analyse auf diesen Zeitraum zu beschränken.
Die genannten Maßnahmen arbeiten somit nach einer Art Ausschlussprinzip. In jedem
Fall können sie dazu beitragen, den Ermittlungsprozess deutlich zu beschleunigen.
Gesucht werden zunächst primär lokal digitale Spuren. Das können beispielsweise
Inhaltsdaten einer Datei (z. B. docx-Dokument, sqlite-Datenbankdatei) sein. Vielfach werden auch Daten aus dem Dateisystem wie Zeitstempel, Journal oder Dateinamen untersucht. Daneben existieren anwendungsspezifische Fragmente wie z. B. Browser-History,
Browser-Cache-Inhalte ebenso wie Einträge aus der Konfigurationsdateien und Einstellungsverwaltung (beispielsweise Einträge in der Windows-Registry) sowie Logdateien
(von lokalen Diensten), die als Spuren dienen können. Die so gefundenen lokalen Spuren von Datenträgern oder Speicherdumps können wiederum Anhaltspunkte für eine sich
anschließende oder gegebenenfalls parallel durchgeführte Spurensuche im Internet sein.
Dabei von Interesse sind beispielsweise lokale Daten von Messagingdiensten, Daten aus
sozialen Netzwerken oder von Cloudanwendungen.
5.4
Verfolgung digitaler Spuren im Netz
Der Verfolgung von Datenspuren im Internet kommt in der Ermittlungsarbeit eine große
Bedeutung zu. Immer häufiger verwenden Kriminelle das Internet und seine Dienste zur
Verabredung, Besprechung sowie Durchführung von Straftaten und Rechtsverstößen [3,
6]. Somit ist gerade in diesem Bereich eine Spurensuche unumgänglich. Dieser Trend
gilt nicht nur für das World Wide Web. Auch Unternehmen und öffentliche Institutionen
digitalisieren immer häufiger ihre Prozesse und erzeugen so eine wahre Datenflut. Nicht
selten werden diese Daten dann in Cloudspeichern abgelegt. Es entstehen somit immer
11
12
http://www.nsrl.nist.gov/
http://md5deep.sourceforge.net/
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
143
neue Datenquellen, die als Ursprung für mögliche digitale Spuren in die Fallarbeit einbezogen werden müssen. Die Verarbeitung unstrukturierter und strukturierter Dateninhalte,
deren Integration und Analyse trotz stetig steigender Datenmenge stellt die zentrale Herausforderung für die moderne IT-Forensik dar. Aber auch aus datenschutzrechtlicher Sicht
ist diese Entwicklung nicht ganz unproblematisch. So müssen die Ermittler bedingt durch
die Komplexität, Menge und Heterogenität der Daten sicherstellen, selbst keine Rechtsverstöße zu begehen, indem sie beispielsweise die Daten Unbeteiligter auswerten und auf die
Weise Persönlichkeitsrechte verletzten. Viele dieser Fragestellungen sind bisher wissenschaftlich nur unzureichend durchdrungen. Einige wichtige Aspekte sollen im Folgenden
näher beleuchtet werden.
In den nächsten Abschnitten werden exemplarisch verschiedene, höchst aktuelle und
forensisch sehr spannende Themenfelder vorgestellt: Die Analyse und Rekonstruktion
von Browser-Cache-Inhalten, die Spurensuche in der Cloud, die Sicherung und Auswertung von Messengerdaten sowie die forensische Analyse von Zahlungsströmen im
Bitcoin-Netzwerk. Auch der Problembereich der Spurensuche in sozialen Netzwerken
wird angeschnitten. Jedes Thema wird inhaltlich kurz vorgestellt und aus forensischer
Sicht beleuchtet.
5.4.1
Analyse und Rekonstruktion des Browsercaches
Einer der wichtigsten Anlaufpunkte für den Ermittler ist neben den Systemdateien zunächst der Webbrowser eines Rechners. Ziel ist es dabei in erster Linie, zu rekonstruieren,
welche Webseiten und Webinhalte vom Benutzer eines Computers in der Vergangenheit
aufgerufen wurden. Um für den Anwender das Surfen im Netz so einfach, schnell und
komfortabel wie möglich zu gestalten, legen Browser wie Firefox, Safari, Google Chrome, Internet Explorer und Co. benutzerspezifische Daten auf der lokalen Festplatte ab.
Jeder Browser führt beispielsweise eine Historie über besuchte Seiten, Nutzereingaben
in Formularfeldern, Passwörter, Cookies, Downloads und Lesezeichen. Eine Analyse dieser Cachedaten erlaubt es dem Ermittler sehr häufig, eine Verbindung zwischen einem
bestimmten Computer und einer konkreten Webseite herzustellen.
Der Internetbrowser Mozilla Firefox ist das derzeit in Deutschland meistgenutzte Programm, um auf Internet-Seiten zuzugreifen.13 An dieser Anwendung sollen im Folgenden
beispielhaft die Schritte einer forensische Analyse besprochen werden.
Technischer Hintergrund
Für eine Analyse des Webbrowsers ist es zunächst erforderlich, herauszufinden, wie dieser
seine Daten verwaltet. Im Fall von Mozilla Firefox werden wichtige Informationen in eine
Datenbank geschrieben.
Das Datenbanksystem SQLite14 wird derzeit von einer Vielzahl von Anwendungsprogrammen verwendet, um Datenbestände zu verwalten. Die Internetbrowser Mozilla
13
14
Quelle: https://www.browser-statistik.de/, Stand: Oktober 2015
www.sqlite.org
144
D. Pawlaszczyk
Firefox und Google Chrome sowie die Messenger ICQ und WhatsApp, die Cloudlösung
von Dropbox und der Bildtelefoniedienst Skype sind nur einige Beispiele für Programme,
die auf das quelloffene SQLite zugreifen, um ihre Anwendungs- und Konfigurationsdaten zu verwalten. Aufgrund seines hohen Verbreitungsgrades stellt es damit die weltweit
meistgenutzte Datenbank dar. SQLite ist eine sehr kompakt gehaltene, lokale Datenbank,
die ohne Server betrieben und über die weit verbreitete Abfragesprache SQL angesteuert
werden kann.
Um auf die Datenbank Zugriff zu erhalten, kann man entweder mit der eingebauten
Kommandoshell von SQLite arbeiten oder installiert alternativ einen speziellen Betrachter, von denen zahlreiche sehr gute und zumeist freie Lösungen im Internet bereitstehen.
Ein Beispiel ist der SQLite-Browser15 , für den auf der offiziellen Projektseite Installationsdateien für alle gängigen Betriebssysteme verfügbar sind.
Forensische Analyse
Alle wichtigen Daten wie Lesezeichen, Chroniken, besuchte Seiten, Passwörter etc. werden bei Mozilla- Firefox genauso wie bei anderen Browsern in einem speziellen Profilunterordner im Homebereich des jeweiligen Nutzers abgelegt. Je nach Betriebssystem ist
diese Datei in einem speziellen Unterordner innerhalb des Nutzerverzeichnisses zu finden:
Windows 7:
C:\Documents and Settings\<username>\ApplicationData
\Mozilla\Firefox\Profiles\<profile folder>\
Linux/Unix:
/home/<user>/.mozilla/firefox/<profile folder>/
Mac OS X:
/Users/<user>/Library/Application Support/Firefox/Profiles/
default.lov/
Das wohl wichtigste Artefakt für eine forensische Untersuchung von Firefox bildet die
Datei places.sqlite. In dem angegebenen Ordner sind aber noch weitere forensisch interessante Dateien zu finden. Die wichtigsten Profildateien sind in Tab. 5.4 aufgeführt. Die
aus forensischer Sicht interessantesten Daten sind, wie bereits gesagt, in der der Datei
places.sqlite zu finden. Hier werden die vom Nutzer in der Vergangenheit besuchten Webseiten (places) von Firefox verwaltet. Um eine Auflistung aller vom Nutzer besuchten
Seiten zu erhalten, kann das folgende SQL-Statement verwendet werden:
SELECT id, url, title, last_visit_date FROM moz_places;
15
www.sqlitebrowswer.org
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
145
Tab. 5.4 Wichtige Profildateien für den Mozilla-Firefox-Browser
Dateiname
key3.db
Inhalt
Diese Datei enthält die Schlüsseldatenbank mit den gespeicherten Passwörtern
permissions.sqlite Seitenspezifische Einstellungen, Voreinstellungen für jede besuchte Webseite
formhistory.sqlite Über die Firefox-Suchleiste eingegebene Suchbegriffe und Eingaben in Formularen von Webseiten
cookies.sqlite
Cookie-Informationen von Webseiten, z. B. für die Anmeldung auf einer
Webseite, personalisierte Darstellung für Seiten, persönliche Identifikation
places.sqlite
In der Vergangenheit besuchte Webseiten, mit Statistiken zur Anzahl der
Besuche und Datum des letzten Seitenabrufs
downloads.sqlite Detailinformationen zu den vom Nutzer durchgeführten Dateidownloads
Dieses Kommando kann direkt über die Kommandoshell von SQLite oder über die bereits
erwähnten Betrachter eingegeben werden. Um zusätzlich einen Blick auf die gespeicherten Cookies von Firefox zu werfen, muss die Datei cookies.sqlite in den SQLiteBrowser
geladen werden. Eine Abfrage nach allen gespeicherten Cookies sieht wie folgt aus:
SELECT name, host, creationTime FROM moz_cookies;
Ebenfalls sehr interessante Informationen sind in der Datei downloads.sqlite gespeichert.
Hier legt Firefox Daten zu allen Downloads eines Benutzers ab. Um abzufragen, welche
Dateien wann und vor allem wohin gespeichert wurden, bietet sich das folgende SQLStatement an:
SELECT name, source, target, startTime FROM moz_downloads;
Wiederherstellung gelöschter Browser-Caches
Mitunter hat ein Tatverdächtiger vorsorglich seinen Browser-Cache gelöscht, um mögliche Hinweise auf seine Aktivitäten im Internet zu verwischen. Selbst dann sind häufig
noch Spuren zu finden. Die von Mozilla Firefox, Safari und Google Chrome eingesetzte
Datenbank SQLite speichert Einträge ähnlich einem Dateisystem in Blöcken, die auch als
Pages bezeichnet werden (vergleiche Abschn. 5.3.2). Jede dieser Speicherseiten hat eine
variable Größe. Die Standardgröße einer Page beträgt 4096 Byte. Wird der Cachespeicher
geleert, so werden, ähnlich wie beim Löschen einer Datei vom Datenträger, die betroffenen Seiten lediglich als gelöscht markiert. Erst durch das Einfügen neuer Inhalte in den
Browser- Cache werden die freigegebenen Bereiche tatsächlich überschrieben. Auch in einer Datenbank lassen sich somit Slackbereiche finden, die für eine Ermittlung interessant
sein können. Um zunächst einmal festzustellen, ob die zu untersuchende Datenbank gelöschte Records enthält, die für eine Wiederherstellung infrage kommen, muss zunächst
nach der sogenannten Free-Page-List gesucht werden. Dabei handelt es sich technisch gesehen um eine einfach verkettete Liste, in der alle freien Speicherseiten der Datenbank
abgelegt sind. Wie bereits erwähnt, können in manchen dieser Seiten alte, eigentlich ge-
146
D. Pawlaszczyk
Abb. 5.11 Offset 32: Markiert den Beginn der Free-Page-List
Abb. 5.12 Gelöschter Datenrecord aus der Tabelle moz_places
löschte Datensätze abgelegt sein. Gemessen vom Beginn des Datenbankfiles ist in Offset
32 die erste Sprungadresse der Free-Page-List hinterlegt. Hat man die Start-Adresse für
die Liste wie in Abb. 5.11 dargestellt ermittelt, so kann anschließend die Sprungadresse
über die folgende Formel berechnet werden:
Sprungadresse = (4 Byte BE in Offset 32 - 1) * Pagesize.
Im obigen Beispiel ergibt sich somit als Beginn der Liste:
Sprungadresse hex = ( 0x0709 - 1 ) * 0x1000 = 0x708000
Sprungadresse dec = ( 1801 - 1 ) * 4096 = 7372899
Der so berechnete Offsetwert führt direkt zum ersten Eintrag der Free-Page-Liste in der
Datenbank. Von diesem aus kann man sich anschließend zu den Folge-Einträgen hangeln.
Abb. 5.12 zeigt beispielhaft einen gelöschten Datensatz, der auf diese Weise wieder sichtbar gemacht werden konnte. In diesem Fall handelt es sich um einen Cacheeintrag aus
der Tabelle moz_places. Wem der beschriebene Weg zu aufwendig ist, der kann auch in
diesem Fall auf Werkzeugunterstützung vertrauen. So sind mit epilog16 und Eyewitness
Forensic Software – SQLite recover deleted records17 kommerzielle Lösungen verfügbar.
Wen die nicht zu unterschätzenden Lizenzkosten abschrecken, dem sei an dieser Stelle
das vom Autor selbst entwickelte quelloffene MOZ Places Retrieval Tool (MOZRT) empfohlen.18 Abb. 5.13 zeigt das Programm bei der Arbeit.
16
www.ccl-forensics.com
http://sandersonforensics.com/forum/content.php?190-SQLite-Recovery
18
https://github.com/pawlaszczyk/MOZRT-Sqlite
17
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
147
Abb. 5.13 Mit dem MOZ Places Retrieval Tool wiederhergestellte Cacheinhalte
5.4.2
Tatort Cloud
Die Verwendung von Cloudspeichern ist ein Technologie, die innerhalb weniger Jahre
eine hohen Verbreitungsgrad gefunden hat. Clouddienste erlauben es ihren Nutzern, mit
vergleichsweise geringem technischen Wissen, Daten kostengünstig zu speichern und zu
verwalten und die Inhalte mit anderen zu teilen. Einer der meistgenutzten Datendienste
weltweit wird derzeit von der Firma Dropbox19 angeboten. Dabei handelt es sich um eine
typische Cloud-Storage-Lösung. Gerade Clouddienste wie Dropbox stellen zunehmend
ein Problem für die Strafverfolgung dar. So werden beispielsweise illegale Dateninhalte, kinderpornografische Fotos und Videos sowie Raubkopien über die Cloud verbreitet.
Durch ein Auskunftsersuchen an den Cloudanbieter kann sehr häufig einiges erreicht werden, wenngleich sich dies in der Praxis nicht selten ein langwieriges Unterfangen erweist.
Dafür muss aber zumindest die Nutzerkennung des Verdächtigen bekannt sein.
Oftmals sind die Benutzernamen oder Passwörter der Accounts von Beschuldigten
nicht bekannt. Für den ermittelnden Forensiker ist es somit schwierig, an Daten zu gelangen, die in solchen Internetdiensten gespeichert werden. Entsprechende richterliche
Beschlüsse für den Zugriff auf die Daten bieten den rechtlichen Rahmen, um diese be19
www.dropbox.com
148
D. Pawlaszczyk
schlagnahmen zu können.20 Bei der Suche nach beweiserheblichen Daten kann gemäß
§ 102 StPO auch auf Daten aus der Cloud zugegriffen werden [26]. Dies gilt im Übrigen
nicht nur für Zugriffe über den Account des verdächtigen Cloudnutzers, sondern genauso
beim Datenzugriff mithilfe des Cloudanbieters.
Der Zugriff auf Cloudinhalte und andere Internetdienste erweist sich aber noch aus
einem weiteren Grund häufig als schwierig. Mitunter befinden sich die Daten außerhalb
des Zugriffs der europäischen oder deutschen Justiz, beispielsweise dann, wenn die Daten
auf Servern im außereuropäischen Ausland vorgehalten werden. In diesem Fall läuft das
erwähnte Auskunftsersuchen ins Leere bzw. ist je nach Standort des Cloudspeichers das
Recht dieses Staates anzuwenden. Hinzu kommt ein weiteres technisches Moment. Die
Nutzung von Clouddiensten stellt die IT-Forensik auch hier vor neue Herausforderungen.
Die meisten klassischen Verfahren zum Aufspüren und verfolgen digitaler Spuren stellen
primär auf physische Speichergeräte ab. Bei Clouddaten sind diese Werkzeuge deshalb nur
zum Teil hilfreich. Denn dort sind die betroffenen Daten in Memory- oder Livesystemen
abgelegt, die nicht einfach ausgebaut und in ein Labor gebracht werden können. Besonders
schlechte Karten haben die Ermittler dann, wenn die Daten verschlüsselt abgelegt sind
und der Cloudanbieter selbst die Daten nicht lesen kann, was im Übrigen auch für lokal
verschlüsselte Daten gilt. Man spricht in diesem Zusammenhang auch von einem Zero
Kowledge System.21
Ein zunehmendes Problem bildet darüber hinaus die zu sichtende Datenmenge, die immer mehr ansteigt. Im Jahr 2011 wurden bereits mehr als 329 Exabytes an Daten weltweit
in der Cloud abgelegt. Bis 2016 sollen es bereits mehr als 4,1 Zettabytes22 sein. Damit
würden dann circa 40 Prozent aller weltweit gespeicherten Datenbestände über die Cloud
verwaltet.23 Im Folgenden werden einige grundlegende Ermittlungstechniken in diesem
Bereich am Beispiel des Clouddienstes Dropbox besprochen.
Technischer Hintergrund
Dropbox nutzt das Amazon S3 (Simple Storage Service) Speichersystem zur Verwaltung
von Dateien. Dateitransfers und die Synchronisation von Daten erfolgen unter Verwendung einer SSL-Verbindung. Der Kommunikationsweg ist somit verschlüsselt. Durch eine
AES-256-Verschlüsselung sind zusätzlich die Daten auf dem Cloudsystem geschützt. Auf
diese Weise versucht man, die Privatsphäre der Nutzerdaten sicherzustellen. Dropbox verwaltet die Schlüssel allerdings selbst und hat somit im Zweifel immer noch Zugriff auf
die Daten seiner Nutzer. Dropbox erlaubt es jedem Anwender, seine Dateien oder Ordner
in seine persönliche Dropbox zu platzieren. Diese kann auf jedem Endgerät geöffnet und
angezeigt werden, solange man einen entsprechenden Client installiert hat und über eine
gültige Benutzerkennung/Passwort verfügt. Andere Dropboxbenutzer müssen eingeladen
20
Cloud-Daten sind unkörperliche Gegenstände im Sinne § 94 StPO.
https://spideroak.com/features/zero-knowledge
22
1 Zettabyte entspricht 1 Trillionen Gigabyte oder 10007 Byte.
23
http://www.welt.de/wirtschaft/webwelt/Datenvolumen-verdoppelt-sich-alle-zwei-Jahre.html
21
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
149
werden, um Zugriff auf die Dateien eines Nutzers zu erhalten. Standardmäßig speichert
Dropbox gelöschte und frühere Versionen von Dateien für bis zu 30 Tage. Bei dem kostenpflichtigen monatlichen Abonnement bietet Dropbox zusätzlich ein Add-On namens
Packrat an, womit es möglich wird, alle Dateien (auch gelöschte und alte Versionen) auf
unbestimmte Zeit vorzuhalten und bei Bedarf wiederherstellen zu können.
Forensische Analyse
Im Folgenden sollen einige forensische Aspekte in Zusammenhang mit dem Clouddienst
Dropbox näher beleuchtet werden. Greift ein Nutzer beispielsweise auf seine in der Dropbox abgelegten Daten unter Verwendung eines Webbrowsers zu, so hinterlässt dies Spuren
in den History- und Cachedateien des Browsers. Diese können mit den in Abschn. 5.4.1
besprochenen Werkzeugen forensisch analysiert werden. Die meisten Anwender benutzen
für die tägliche Arbeit aber den Dropbox-Client. Diese Software muss hierfür auf dem jeweiligen Gerät (PC, Laptop, Mobiltelefon) installiert werden. Alle aktuell in der Dropbox
des Nutzers befindlichen Dateien werden bei Verwendung des Clientprogramms auf den
betreffenden Rechner gespiegelt. Somit wird auf dem lokalen System immer eine Kopie
des Dropboxinhalts abgelegt. Beim Start des Rechners synchronisiert sich der Client mit
dem Cloudspeicher, um Veränderungen abzugleichen.
Wiederherstellung gelöschter Dropbox-Daten
Der Dropboxcache zum Zwischenspeichern von Informationen befindet sich unter dem
Betriebssystem Windows standardmäßig im Ordner:
C:\Users\username\Dropbox\.dropbox.cache
Wenn eine Datei aus der Dropbox gelöscht wurde, so wird auf allen angeschlossenen Clients ein Ordner mit dem Datum des betreffenden Tages angelegt. Weitere an diesem Tag
gelöschte Dateien werden ebenfalls in diesen Ordner gespeichert. Somit sind gelöschte
Dateien zeitlich begrenzt weiter zugreifbar. Der lokale Ordner wird standardmäßig alle
3 Tage gelöscht. Eine als gelöscht markierte Datei erhält automatisch eine Erweiterung.
Diese besteht aus einer Folge von drei Zahlen. Bei der ersten Angabe handelt es sich um
die UNIX-Zeit, die in hexadezimaler Schreibweise angehangen wird. Die zweite Zahl ist
die Dateigröße in Byte, ebenfalls als Hexzahl repräsentiert. Die dritte Zahl fungiert offenbar als Hashwert, obwohl nicht bekannt ist, welcher Algorithmus zu Erstellung der
Prüfsumme eingesetzt wird. Im folgenden Beispiel wurde eine Datei namens bild01.jpg
zuvor aus der Dropbox entfernt. Die gelöschte Version erhält den Namen
bild01 (deleted 4fe09d20-5f5e100-c6ce2398).jpg
Die erste Zahl in Dezimalschreibweise lautet 1340120352.24 Daraus ergibt sich das
Datum Dienstag, 19. Juni 2012 11:39:12. Die zweite Zahl in Dezimalschreibweise ist
100.000.000. Durch 1024 geteilt erhält man schließlich die Dateigröße von 97.656 Byte.
24
Zeitangabe in Millisekunden, die seit dem 01. Januar 1970 verstrichen sind.
150
D. Pawlaszczyk
RAM-Analyse des Dropbox-Client
Wenn es dem Ermittler möglich ist, den RAM-Inhalt zu sichern (Abschn. 5.3.1) bzw.
er Zugriff auf die Auslagerungsdateien oder Swapbereiche des Betriebssystems hat, so
kann er zusätzlich versuchen, den Accountnamen der Dropbox zu ermitteln. Für aktuelle
Versionen des Dropbox-Clients befindet sich dieser in der Nähe einer bestimmten Zeichenkette, die aus dem RAM ausgelesen werden kann. Die Zeichenfolge lautet wie folgt:
’u’email’: ’
Potentielle Benutzernamen für Dropboxkonten als Voraussetzung für ein Auskunftsverfahren können unter Umständen auf diesem Wege ermittelt werden. Wenn andererseits
ein Webbrowser beim Zugriff verwendet wird, findet sich der Text Login email vor dem
Benutzernamen im Speicher. Mitunter lässt sich sogar das Passwort (abhängig von der
Dropboxversion) für das Dropboxkonto im Klartext im Speicher in der Nähe der extrahierten Texte bestimmen. Folgende Daten konnten beispielsweise aus der Imagedatei eines
Arbeitsspeichers ermittelt werden:
"... $0.00 "... name free 2 GB name periods
u’displayname’: ’WIN-B1EGO14DEDEF’,
u’email’: ’username@hotmail.com’,
u’excserver’:u’dl-debug1.Dropbox.com’,
Das Beispiel enthält neben dem Accountnamen zusätzlich Angaben über den angesprochenen Cloud-Server sowie die Kennung des Clientrechners, die sogenannte HostID.25
Alternativ kann man auch versuchen, auf die Konfigurationsdateien des DropboxClients zuzugreifen. Hierbei sind insbesondere zwei Dateien interessant: filecache.dbx und
config.dbx. Erstere enthält eine Liste der in der Dropbox abgelegten Dateien einschließlich vieler Metadaten. Noch interessanter ist allerdings die zweite Datei config.dbx. In
dieser sind unter anderem die E-Mail-Adresse des Dropboxnutzers, eine Liste der zuletzt
geänderten Dateien, die Host-ID sowie der lokale Pfad zum Dropboxordner des Benutzers hinterlegt. Bei beiden Dateien handelt es sich um SQLite-Datenbanken. Allerdings
sind die beide Dateien verschlüsselt. Aber auch dieses Problem ist i. d. R. lösbar. Von der
Firma Magnet Forensics wird beispielsweise das kostenlose Tool Dropbox Decryptor26
angeboten. Mit diesem Programm können die beiden Datenbankfiles entschlüsselt und
anschließend wie gewohnt mit SQLite geöffnet und analysiert werden.
5.4.3 Der Messengerdienst WhatsApp
Instant-Messagingdienste erfreuen sich zunehmender Beliebtheit. Aus forensischer Sicht
sind dabei insbesondere Kontakte und Nachrichten von Interesse, die häufig wertvolle
Informationen zur Lösung eines Falles liefern können. Das gilt für das Gerät eines Opfer
25
26
Jedes Gerät, mit dem auf die Dropbox zugegriffen wird, erhält eine solche eindeutige Kennung.
https://www.magnetforensics.com/free-tool-dropbox-decryptor/
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
151
ebenso wie für das eines Verdächtigen. In beiden Fällen kann die Analyse der Chatdaten
vorteilhaft sein.
Einer der wohl meistgenutzten Messengerdienste weltweit ist WhatsApp. Im Jahr 2015
haben bereits mehr als 800 Millionen Menschen diesen Dienst genutzt.27 Die Anwender
können über WhatsApp einfache Nachrichten, aber auch Bild- und Videodateien untereinander tauschen. Ebenfalls interessant ist die Möglichkeit, seinen eigenen Standort anderen
Chat-Partnern mitzuteilen. Zwischenzeitlich ist es sogar möglich, über die eingebaute
Voice-over-IP-Funktion zu telefonieren. Der WhatsApp-Client soll im Folgenden aus forensischer Sicht näher untersucht werden.
Technischer Hintergrund
Das Versenden von Textnachrichten erfolgt im Pushverfahren, sodass die Nachrichten unmittelbar beim Empfänger ankommen. Sie werden entsprechend zwischengespeichert, bis
der Empfänger online ist. Damit Nachrichten übertragen werden können, müssen die Teilnehmer mit einem Client über das Internet direkt oder über einen Server miteinander
verbunden sein. Der WhatsApp-Client verwendet das Extensible Messaging and Presence Protocol zum versenden von Nachrichten. Die Clientsoftware ist für alle gängigen
Betriebssysteme erhältlich. WhatsApp ist speziell auf mobile Endgeräte und die Kommunikationsgewohnheiten dieser Nutzer zugeschnitten. Eine Besonderheit der App besteht
darin, dass diese im Gegensatz zu anderen Messengerdiensten lediglich die Telefonnummer zur Identifizierung des Benutzers und seiner Kontakte verwendet.
Forensische Analyse
WhatsApp verwaltet seine Daten wie der Webbrowser Firefox über eine SQLite-Datenbank.
Waren die Dateien bis vor wenigen Jahren noch direkt einsehbar, so sind diese in den aktuellen Programmversionen verschlüsselt. Man erkennt die Dateien an Dateiendungen
wie .crypt5, .crypt7, .crypt8. Um nunmehr Zugriff auf die Kontaktdaten zu erhalten, muss
man die Dateien zunächst entschlüsseln. Die dafür notwendige Schlüsseldatei befindet
sich unter dem Betriebssystem Android standardmäßig im Verzeichnis:
/data/data/com.whatsapp/files/key
Der Zugriff auf diese Datei ist normalerweise nur mit Rootberechtigung möglich. Der
Rootzugriff kann programmgesteuert erfolgen. Die dafür benötigten Skripte müssen hierfür zunächst im Downloadmodus von Android installiert und anschließend ausgeführt
werden. Zumeist nutzen diese Programme eine Sicherheitslücke im Betriebssystemkern
um eine sogenannte Privilege Escalation zu bewirken. Alternativ ist es ab Android 4.0
möglich, das Gerät über eine Android Debug Bridge zu betreiben. Diese Funktion wurde
speziell für App-Entwickler eingeführt. Man kann Sie innerhalb der Systemeinstellung
des Mobiltelefons ganz leicht aktivieren. Zusätzlich muss i. d. R. das Gerät für den USBDebugging-Modus freigeben sein. Auf diese Weise ist es beispielsweise möglich, ein
27
http://www.nzz.ch/wirtschaft/newsticker/whatsapp-mit-mehr-als-800-millionen-nutzern
152
D. Pawlaszczyk
vollständiges Backup des Androidgerätes, ganz ohne Rootberechtigung zu erstellen. Hat
man das Smartphone über USB mit dem PC verbunden, kann man sich über die ADBTool-Sammlung28 zunächst alle angeschlossenen Geräte auflisten lassen:
$ adb devices
List of devices attached
sony xeperia
device
Nunmehr ist es möglich, die angesprochene Keydatei sowie die eigentlichen WhatsAppDateien auf den Forensikarbeitsplatz zu sichern:
$ adb pull /data/data/com.whatsapp/files/key /key
Die Kontakt-Daten befinden sich verteilt auf zwei Dateien standardmäßig in den folgenden
Verzeichnissen:
/Device Storage/WhatsApp/Databases/msgstore.db.crypt8
/Device Storage/WhatsApp/Databases/wa.db.crypt8
Bei der Datei msgstore.db handelt es sich um eine SQLite-Datenbank mit lediglich zwei
Tabellen: Der Chatliste und den eigentlichen Nachrichten. Die Tabelle Meldungen enthält
eine Liste aller Nachrichten, die ein Benutzer gesendet oder empfangen hat. Die zweite
Datei wa.db enthält eine vollständige Auflistung der Kontakte eines WhatsApp-Nutzers
einschließlich Telefonnummer, Anzeigenamen sowie Zeitstempel. Die in den beiden Datenbankfiles abgelegten Tabellen enthalten Artefakte die aus forensischer Sicht sehr interessant sind. Dort findet man neben den bereits erwähnten Informationen zu Nachrichten
insbesondere Geo-IDs (für Entfernungsangaben) sowie Pfad und Speicherorte von Mediendateien, die zwischen zwei Kontakten ausgetauscht oder mit diesen geteilt wurden.
Sie können auf die gleiche Art und Weise wie zuvor die Schlüsseldateien dupliziert werden. Die so gesicherten Kontaktdaten und Schlüsseldateien können dann beispielsweise
über das von Andreas Mausch entwickelte Werkzeug WhatsApp-Viewer29 eingelesen und
sichtbar gemacht werden (Abb. 5.14). Somit erhält man alle Telefonnummern, mit denen
der Benutzer kommuniziert; Dies ist jedoch nicht alles. Dateianhänge, die über WhatsApp verschickt bzw. empfangen wurden, sind ebenfalls über separate Tabelleneinträge
innerhalb der gleichen Tabelle zugreifbar. Zusätzlich können häufig ebenfalls die Ortskoordinaten bestimmt werden. Somit ist es möglich zu rekonstruieren, von wo aus eine
Nachricht verschickt bzw. auf diese zugegriffen wurde. Durch eine Kartierung der erwähnten Geolocationdetails lassen sich wiederum mögliche Bewegungsprofile ableiten.
Systemlog sichern
Über die angesprochenen Entwicklerwerkzeuge ist es zudem möglich, die Logdateien des
Mobiltelefons zu sichern. Hierfür kann das folgende Kommando verwendet werden:
$ adb logcat > logcat.log
28
29
developer.android.com/tools/help/adb.html
https://github.com/andreas-mausch/whatsapp-viewer/releases/tag/v1.8
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
153
Abb. 5.14 Analyse der WhatsApp-Kontakte mit dem Programm WhatsApp-Viewer
5.4.4
Open Source Intelligence: Tatort soziale Netzwerke
Gerade soziale Netzwerke wie Youtube, Twitter, Instagram oder Facebook befinden sich
immer häufiger im Fokus von Ermittlungen. Viele Menschen geben persönliche Informationen über sich und ihr Privatleben auf diesen Plattformen preis. Die frei verfügbaren
und für jedermann einsehbaren Daten liefern nicht selten wertvolle Hinweise für ein Ermittlungsverfahren. Zum Teil werden die virtuellen Treffpunkte aber auch zur Absprache
von Straftaten genutzt. Ein weiteres Problem sind Anfeindungen oder Hetze in sozialen
Netzwerken, die nicht selten strafrechtlichen Charakter haben. Aber auch Betrugsdelikte
können mitunter aufgeklärt werden, weil die Beteiligten unverhohlen mit ihren Taten im
Internet prahlen. Die vermeintlich wertvollen neuen Datenquellen haben aber auch eine
Kehrseite: Bei der digitalen Spurensuche sehen sich die Ermittler mit immer mehr Daten
aus immer neuen Quellen konfrontiert.
Um so wichtiger ist es, die Recherchearbeit möglichst effizient zu gestalteten. Hierbei
können insbesondere sogenannte Open-Source-Intelligence (OSINT)-Werkzeuge wertvolle Unterstützung leisten [13]. Diese Programme sammeln und analysieren Daten zu einem
bestimmten Sachverhalt aus frei verfügbaren Quellen [25]. Ziel ist es, daraus neue Erkenntnisse abzuleiten. Der Begriff OSINT wurde maßgeblich vom Department of Defence
(dem amerikanischen Verteidigungsministerium) und von amerikanischen Geheimdiensten geprägt, wobei diese vorrangig das Interesse verfolgen, den Informationsbedarf ihrer
154
D. Pawlaszczyk
Regierung mit Blick auf die nationale Sicherheit zu decken. OSINT-Anwendungen können aber allgemein zu besseren und effektiveren Untersuchung verschiedenster Straftatbestände eingesetzt werd [18].
Technischer Hintergrund
Im Bereich OSINT existiert eine ganze Reihe vor allem freier Programme und Werkzeuge. Eine der wenigen kommerziellen Lösungen in diesem Bereich stammt von der
südafrikanischen Firma Paterva30 und trägt den Namen Maltego. Diese Anwendung unterstützt den Ermittelnden bei der Erhebung frei zugänglicher Daten im Netz. Dazu zapft
das Programm neben den bekannten öffentlichen Suchmaschinen insbesondere frei zugängliche Datenbanken von Online-Diensten wie Facebook, Twitter oder Linked an. Neben der Suche in sozialen Netzwerken kann der Anwender aber auch Informationen auf
PGP-Schlüsselservern, Webseiten, DNS-Servern, Foren, GeoIP-Datenbanken und Suchmaschinen wie Google in das Suchergebnis einfließen lassen. Innerhalb der Anwendung
werden alle gefundenen Beziehungen als Graph repräsentiert. Die Entitäten innerhalb dieses Graphen sind beispielsweise Personen, Domänennamen, Telefonnummern, Webseiten
oder E-Mail-Adressen. Die einzelnen Objekte werden von Maltego automatisch verknüpft
und dem Benutzer in Form eines Netzgraphen präsentiert. Somit wird es möglich, strukturelle Informationen über die gefundenen Daten offenzulegen sowie Beziehungen zwischen
verschiedenen Arten von Informationen zu einem gemeinsamen Bild zusammenzusetzen.
Auf diese Weise wird deutlich, wie unterschiedliche Informationsquellen miteinander
verbunden sind. Nicht selten können dadurch auch neue bislang unbekannte Beziehung
identifiziert werden. Das Programm verwendet hierfür Algorithmen der Graphensuche.
Maltego stellt mehr eine Plattform dar als eine geschlossene Anwendung. Über eine
einfach zu programmierende Schnittstelle können sogenannte Transforms erstellt und in
die Oberfläche integriert werden. Hierbei handelt es sich im Grunde um kleine Skripte, die
von Maltego aus aufgerufen werden können und deren Ergebnisse wiederum in Maltego
dargestellt werden. Die eigentlichen für die Suche verwendeten Algorithmen befinden sich
dabei in der Regel nicht auf dem Rechner des Ermittelnden. Vielmehr werden die Skripte
remote ausgeführt. Hierfür baut der Maltego-Client zunächst eine HTTPS-Verbindung zu
einem speziellen Anfrageserver (in Maltego als TAS-Server bezeichnet) auf. Hierbei handelt es sich im Grunde um eine Art Gelbeseiten-Dienst. Der TAS-Server leitet die Anfrage
dann an den entsprechenden Diensterbringer weiter. Wenn dieser seine Arbeit beendet
hat, werden die Ergebnisse zurück an den Client gegeben, der diese dann graphisch präsentiert. Der Vorteil dieses Vorgehens besteht darin, dass die eigentliche Sucharbeit von
dedizierten Servern erbracht wird. Der Client muss nicht besonders leistungsfähig sein. Er
wird lediglich zur Präsentation verwendet. Gleichzeitig wird die Privatsphäre des Ermittelnden gewahrt, da die eigentlichen Suchanfragen vom Server ausführt werden. Derzeit
unterstützt Maltego zwei Arten von Servermodulen: professionell und einfach. Der Hauptunterschied zwischen den beiden Servern liegt in der Anzahl verfügbarer Module.
30
http://www.paterva.com
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
155
Abb. 5.15 Analyse von Personen in Maltego (Beispiel)
Wie bereits erwähnt, handelt es sich bei Maltego um ein kostenpflichtiges Produkt.
Zusätzlich wird aber auch eine freie sogenannte Community-Edition angeboten. Letztere
ist vorrangig in Bezug auf die Anzahl der gleichzeitig im Graphen darstellbaren Entitäten beschränkt. Zum Teil sind die Antwortzeiten für Anfragen länger. Die Qualität der
Suchergebnisse hingegen ist davon in der Regel nicht betroffen.
Forensische Analyse
Maltego macht es dem Benutzer sehr einfach, Informationen über Personen zu sammeln
und zu verknüpfen. Es werden dabei viele unterschiedliche Informationsquellen aus dem
Internet verbunden. So kann man beispielsweise Personen innerhalb einer Organisation
oder Beziehungsnetze in Facebook mit Mail-Adressen verknüpfen (s. Abb. 5.15), um deren Aktivitäten in diesen Netzwerken sichtbar zu machen. Je bereitwilliger Menschen
156
D. Pawlaszczyk
mit ihren persönlichen Daten umgehen, umso detailliertere Profile lassen sich erstellen.
Darüber hinaus können nicht selten sehr viele Informationen über Kontakte und deren
Verbindungen bestimmt werden. Natürlich enthalten die Suchergebnisse nicht selten auch
sogenannte False Positives. Diese fälschlicherweise im Suchergebnis erscheinenden Daten müssen vom Ermittler erkannt und aus dem Graphen entfernt werden.
5.4.5 Verfolgung von Zahlungsströmen im Bitcoinnetzwerk
Im November 2008 veröffentlichte ein bis dahin vollkommen unbekannter Entwickler
ein Konzept, das er als verteiltes Zeitstempelsystem für Verträge bezeichnete [21]. Dies
war die Geburtsstunde des ersten digitalen, freien, nichtmanipulierbaren Zahlungssystems, genannt Bitcoin. Es ist der Versuch, elektronisches Geld ohne Bindung an eine
analoge Währung bereitzustellen. Die Steuerung der Zahlungsströme erfolgt vollkommen
dezentral und wird einzig durch einen Algorithmus überwacht. Wegen der Verwendung
kryptografischer Algorithmen zur Absicherung des System bezeichnet man Bitcoin auch
als kryptografische Währung.
In der jüngeren Vergangenheit erfuhr Bitcoin eine erhöhte Aufmerksamkeit. Seit der
Schließung des Online-Drogenportals Silkroad 2.031 im Sommer des Jahres 2011 wurde
das Bitcoinnetz wiederholt mit Drogengeschäften in Verbindung gebracht. Der Vorwurf
der Begünstigung von Geldwäsche und Steuerhinterziehung steht ebenfalls im Raum. Die
vermeintlich anonymen Coins sind im Darkweb zwischenzeitlich das Standardzahlungsmittel und dadurch immer häufiger ein wichtiges Beweismittel im Rahmen von Ermittlungsverfahren.
Technischer Hintergrund
Bitcoins werden ausschließlich über das Bitcoinnetzwerk transferiert, die Infrastruktur
für den Handel mit der Kryptowährung. Hierbei handelt sich um ein reines Peer-to-PeerNetzwerk (P2P), d. h., es gibt anders als bei einem zentralistischen Ansatz keine Instanz
oder keinen Server, über welche die angeschlossenen Clients kommunizieren. In einem
P2P-Netz können alle angebundenen Rechner gleichzeitig als Client oder Server fungieren. Es ist wichtig zu verstehen, dass jeder Bitcointransfer direkt zwischen den jeweiligen
Transaktionspartnern ohne Umweg über einen Vermittler abgewickelt wird. Jeder Knoten
im Bitcoinnetz darf prinzipiell mit jedem anderen Knoten Coins tauschen.
Um am Netzwerk teilnehmen und Geld empfangen bzw. versenden zu können, benötigt
man einen Bitcoin-Client. Dabei handelt es sich um eine Software, mit der ein Nutzer
seine Bitcoinguthaben verwalten und Zahlungen tätigen kann. Der Client muss für jeden
Transfer zunächst am Bitcoinnetzwerk angemeldet, also online sein. Alternativ kann aber
auch eine der einschlägigen Internettauschbörsen zum Handeln genutzt werden.
31
http://silkroaddrugs.org/tag/silkroad-2-0/
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
157
Jeder Bitcoinnutzer verfügt über eine oder mehrere Wallets, die mithilfe des Clients verwaltet werden. Eine Wallet ist eine Art elektronische Brieftasche, in der Bitcoinadressen
abgelegt sind, mit denen wiederum im Netzwerk bestimmte Bitcoinguthaben verknüpft
sind. Eine Bitcoinadresse stellt somit eine Art Kontonummer dar, die zwischen 26 und
35 Zeichen lang ist. Die Adressen sind Base58 kodiert, d. h., sie bestehen aus zufälligen
Zahlen sowie Groß- und Kleinbuchstaben mit der Ausnahme, dass der große Buchstabe
O, das große I, das kleine l und die Ziffer 0 wegen der besseren Lesbarkeit nicht benutzt
werden:
Beispiel-Adresse: 1539m63tXNFUa9fKmmg7WB1BAsDFa7XnSa
Durch Weitergabe einer Adresse an Dritte können diese Coins an den Eigentümer der
Adresse übertragen.32 Weitere Informationen wie dessen Name oder seine Mail-Adresse
sind nicht erforderlich. Aus diesem Grund wird häufig auch von einem anonymen Zahlungssystem gesprochen. Es gibt keine Beschränkungen, wie viele Bitcoinadressen eine
Person verwenden darf. Zumeist wird für jede Transaktion eine neue Adresse erzeugt. Das
ist unproblematisch, da der Adressraum insgesamt 1; 46 1048 mögliche Bitcoinadressen
umfasst. Jede dieser Adressen ist mit einem Schlüsselpaar bestehend aus einem öffentlichen und einem privaten Schlüssel assoziiert (Abb. 5.16). Der öffentliche Schlüssel kann
an andere Transaktionspartner weitergegeben werden. Er wird für die Erzeugung neuer
Bitcoinadressen genutzt. Zu diesem existiert ein korrespondierender privater Schlüssel,
den nach Möglichkeit niemand außer der Besitzer der Bitcoinadresse kennen sollte. Beide
Schlüssel, öffentlicher und privater, sind über eine mathematische Funktion miteinander verknüpft (1); genauer gesagt wird der öffentliche Schlüssel mithilfe des privaten
Schlüssels berechnet. Umgekehrt ist dies aber nur mit unverhältnismäßig hohem Aufwand
möglich. Innerhalb des Bitcoinnetzes wird ein Elliptic Curve Algorithm33 eingesetzt, um
einen 512 Bit langen privaten Schlüssel zu erzeugen. Aus diesem wird wiederum ein öffentlicher Schlüssel berechnet.
Um Bitcoins zwischen Sender und Empfänger zu transferieren, muss zunächst eine
Transaktion erzeugt werden, die anschließend mit dem privaten Schlüssel des Senders
signiert wird (2). Die Transaktion zusammen mit dem öffentlichen Schlüssel und der erzeugten Signatur werden über das Bitcoinnetzwerk an den Empfänger übertragen (3). Mit
dem privaten Schlüssel kann eine Partei zweifelsfrei ihr aktuelles Besitzrecht nachweisen
und Bitcoins an andere Teilnehmer des Bitcoinnetzes übertragen. Der Empfänger einer
Transaktion kann mithilfe des öffentlichen Schlüssels seinerseits verifizieren (4), dass ein
anderer Nutzer hinsichtlich eines bestimmten Bitcoinbetrags verfügungsberechtigt ist (5).
In einer Wallet werden somit keine Bitcoins oder Guthaben, sondern lediglich Schlüsselpaare und Adressen gespeichert.
32
33
Die Beispieladresse gehört dem Autor.
http://andrea.corbellini.name/2015/05/17/elliptic-curve-cryptography-a-gentle-introduction/
158
D. Pawlaszczyk
Abb. 5.16 Prinzip der Signierung und Verfizierung von Transaktionen im Bitcoinnetzwerk
Transaktionen
Im Bitcoinnetzwerk besteht der verfügbare Wert einer Bitcoinadresse aus der Historie aller
zugrunde liegenden Transaktionen. Eine Transaktion dokumentiert einen Zahlungsvorgang, der in den Blöcken der sogenannten Blockchain gespeichert wird. Jede Transaktion
ist durch Eingänge (Inputs) und Ausgänge (Outputs) gekennzeichnet.
Beispiel: Sender A möchte an Empfänger B Bitcoins übertragen. A muss hierfür nachweisen, dass er bereits Transaktionen in mindestens der gleichen Höhe bekommen hat.
Dafür gibt er B gegenüber alle Transaktionen an, die er schon erhalten hat und zum Bezahlen verwenden möchte. Diese Coins bilden die für B verfügbaren Inputs. Durch die
Blockchain kann B in der gesamten Transaktionshistorie von A nachsehen, welchen Wert
dessen Inputs haben, woher sie stammen und ob er diese schon ausgegeben hat. Für A ist
diese Transaktion ein Output und für B ein Input (vgl. Abb. 5.17).
Für eine Transaktion können mehrere Ziele angegeben werden. In jedem Fall müssen
immer alle Eingänge betragsmäßig auf die Ausgänge verteilt werden. Die Outputs in einer
Transaktion können maximal den Betrag aller Inputs einer Transaktion betragen. Es ist
nicht möglich, nur einen Teil seines Bitcoinguthabens auszugeben. Will ein Nutzer nur
einen Teilbetrag transferieren und den Rest behalten, dann muss er sich den Restbetrag an
einen Output senden, der ihm selbst gehört.
Die Blockchain
Der Bitcoin-Client kann jeden Transfer sofort auf seine Gültigkeit hin überprüfen, indem
er die Transaktionshistorie bis zur Ausgabe des Bitcoins zurückverfolgt. Durch die Si-
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
159
Abb. 5.17 Beispiel für eine Transaktion mit Ein- und Ausgängen
gnierung jeder Transaktion ist zudem sichergestellt, dass keine gefälschten Bitcoins in
Umlauf gebracht werden können oder jemand diese mehrfach ausgibt34 [21]. Technisch
wird dies dadurch möglich, da alle Clients auf die gleiche Informationsquelle die sogenannte Blockchain zugreifen. Hierbei handelt es sich um eine Datenbank, in der alle
jemals im Netzwerk getätigten Zahlungen verzeichnet sind. Jede Transaktion wird in
diesem ewigen Logfile erfasst und protokolliert. Da jeder Vollclient eine Kopie dieser
Datenbank besitzt, kann er auch jederzeit verifizieren, wem ein bestimmter Bicoinbetrag
aktuell gehört. Insbesondere kann überprüft werden, ob ein Transaktionspartner, der Bitcoins transferieren möchte, diese auch tatsächlich besitzt. Die Blockchain stellt eine Art
öffentliches Buchungssystem dar, in dem jede Zahlungsbewegung vermerkt ist. Im Durchschnitt alle 10 Minuten wird ein neuer Block mit den zuletzt durchgeführten Transaktionen
an die Blockchain angehangen. Diesem Umstand verdankt die Blockchain auch ihren Namen. Durch ein spezielles Kommunikationsprotokoll werden alle Kopien der Blockchain
auf den angeschlossenen Rechnern des Bitcoinnetzes über die letzten Zahlungsbewegungen informiert und aktuell gehalten. Hat ein Client sich längere Zeit nicht mit dem
Bitcoinnetz verbunden, so muss er sich beim Start zunächst synchronisieren, d. h., er wird
die letzten Blöcke abfragen und in seine Datenbank einfügen. Eine Transaktion gilt als
bestätigt, wenn sie in einem Block gespeichert wurde [20].
34
In der Literatur wird dies auch unter dem Begriff des Double-Spending-Problems diskutiert.
160
D. Pawlaszczyk
Forensische Analyse
Um Zahlungsbewegungen im Bitcoinnetz nachverfolgen zu können, muss nicht erst ein
Auskunftsersuchen an ein Geldinstitut gestellt werden. Durch die Weiterleitung jeder
Transaktion an die übrigen Knoten des Bitcoinnetzes und deren Festschreibung innerhalb
der Blockchain kann jede Zahlung direkt zurückverfolgt werden. Dies ist in anderen Zahlungssystemen nur schwer oder gar nicht möglich und eine Besonderheit. Alle zu einer
Bitcoinadresse jemals durchgeführten Zahlungen sind für jeden einsehbar in der Blockchain fälschungssicher hinterlegt; für den Ermittler ein auf den ersten Blick paradiesischer
Zustand. Die eigentliche Herausforderung besteht darin herauszufinden, welche Person
sich hinter welcher Bitcoinadresse verbirgt. Diese Information wird nicht in der Blockchain gespeichert.
Analyse der Walletdatei
Der schnellste Weg, um zu bestimmen, ob und, wenn ja, welche Bitcoins mit einem Rechner gehandelt wurden besteht darin, die Walletdatei zu finden. Als Gegenstück zu einer
echten Geldbörse enthält diese die privaten Schlüssel ihres Besitzers. In der Datei sind
neben den aktuellen Schlüsselpaaren zusätzlich die mit ihr verwalteten Bitcoinadressen,
Transaktionen, Benutzereinstellungen sowie die Versionsnummer des verwendeten Bitcoinclients gespeichert. Für den Standardclient befindet sich die Datei normalerweise in
einem Unterordner des Nutzerverzeichnisses:
Windows XP:
Windows 7:
Linux Ubuntu:
%HOMEPATH%Application Data/Bitcoin/wallet.dat
%HOMEPATH%AppData/Roaming/Bitcoin/wallet.dat
~/.bitcoin/wallet.dat
Mitunter liegt die Datei aber in einem abweichenden Verzeichnis oder wurde umbenannt.
Wird zudem die Existenz weiterer Kopien bzw. Backups von Walletdateien auf dem Rechner vermutet, so muss nach diesen gesucht werden. Jede Walletdatei des Standardclients
besitzt eine charakteristische Anfangssignatur. Am Beginn der Datei an Offset 12 befindet
sich der feste Wert 0x3162. Diese Charakteristik vereinfacht die Suche nach Bitcoinkonten auf einem Datenträger erheblich. Das folgende Beispiellisting zeigt die Ausgabe des
Programms hexdump unter Linux, wobei die ersten 32 Byte einer Walletdatei ausgeben
werden:
$hexdump -n 32 wallet.dat
00000 0000 0000 0001 0000 0000 0000 3162 0005 | ............b1..
00010 0009 0000 1000 0000 0900 0000 0000 0000 | ................
00020 0020 0000 0000 0000 0000 0000 0000 0000 |
..............
In der Walletdatei sind alle mit ihr verknüpften Bitcoinadressen abgelegt. Durch eine Extraktion der Adressen lassen sich auch alle Zahlungsbewegungen rekonstruieren, die über
die Wallet abgewickelt wurden. Die Adressen sind regelmäßig konstruiert, wodurch eine
Suche stark vereinfacht wird. Wie schon weiter oben ausgeführt, ist jede Adresse Base58
kodiert. Die Adresse beginnt in der Regel mit den Ziffern 1 oder 3. Mithilfe dieser In-
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
161
formationen kann wiederum sehr schnell ein regulärer Ausdruck für eine Suchanfrage
formuliert werden:
ANSI: 1[a-km-zA-HJ-NP-Z1-9]{24,34}
Unicode: 1\x00([a-km-zA-HJ-NP-Z1-9]\x00){24,34}
Die Anfrage lässt sich wie folgt übersetzen: Finde eine Zeichenkette, die mit einer 1 beginnt und nur alphanumerische Zeichen (ausgenommen die Buchstaben ’l’ und ’I’ bzw.
die Zeichen ’O’ und ’0’) enthält und zwischen 25 und 34 Zeichen lang ist. Bei Unicodekodierung wird jedes Zeichen durch ein oder mehrere Byte repräsentiert. Bei der
ANSI-Kodierung hingegen wird genau 1 Byte verwendet. Für beide Kodierungen ist jeweils ein Beispiel angegeben. Unter Linux kann beispielsweise mit dem grep-Kommando
in einer Datei nach diesen Mustern gesucht werden:
$ strings wallet.dat | grep -E "1[a-km-zA-HJ-NP-Z1-9]{24,34}"
name"1DKJtsJeYmgDrLg2TFJ9hb1v66iX5BJ1fR
name"1E8ir4z5xD3nB7D7LEzf5UpzycWyTWD7Sf
name"1AraVQH94p7pcUP3dYRCUk4sxuv5PAs71XG
name"1JCQaLdjaNvnfhu1pHVuKUCJLqXS3TtTii
name"16C8xucyygqHusdBXQ8GQ5asZfa97WHShM
...
Zur Erläuterung: Das erste Kommando extrahiert Zeichenketten (Strings) aus der Binärdatei wallet.dat. Der zweite Teil der Anweisung sucht mithilfe des bereits ausführlich
besprochenen regulären Ausdrucks nach dem Muster. Somit wird es möglich, gezielt nach
Bitcoinadressen in den Dateien des Systems zu suchen und diese zu extrahieren. Wenn
auch nur eine Transaktion mit der Identität einer Person in Verbindung gebracht werden kann, dann sind auch alle vorhergehenden Transaktionen des Betroffenen zuordenbar.
Hierfür muss lediglich innerhalb der Blockchain nach der gefundenen Adresse und den
mit dieser verknüpften Transaktionen gesucht werden.
Nachdem nun klar ist, dass es sich um ein Base58-Codierung handelt, werden im
nächsten Schritt der Untersuchung, speziell die letzten vier Bytes des gefundenen Strings
überprüft. Bei jeder Bitcoinadresse wird am Ende ein Doppel SHA-256-Diget der vorangegangenen Adressdaten als eine Art Prüfsumme abgelegt. Für eine Verifizierung des
Suchtreffers muss für die Bytes 0 bis zum Byte n-4 ebenfalls der Hashwert bestimmt und
mit dem Ergebnis der letzten 4 Byte verglichen werden. Durch Überprüfung der Gültigkeit der Base58-Kodierung für die zuvor extrahierten Zeichenfolgen, lässt sich bestimmen,
welche Werte falschpositiv sind (keine gültigen Adressen darstellen) und, was noch wichtiger ist, welche es nicht sind.
Verfolgung von Zahlungen in der Blockchain
Wurden die Bitcoinadressen wie zuvor beschrieben extrahiert oder sind anderweitig bekannt, so ist eine gezielte Suche über die Blockchain möglich. Alle Transaktionen sind in
dieser protokolliert. Somit kann recherchiert werden, von welchen Adressen aus Coins
162
D. Pawlaszczyk
Abb. 5.18 Beispiel: Verfolgung von Bitcoinzahlungen mit dem Programm BCTrace
übertragen wurden und ob diese zwischenzeitlich weiter transferiert worden sind. Für
eine forensische Untersuchung des Transaktionsgraphen existieren verschiedene Recherchemöglichkeiten. Über diverse Online-Portale wie blockchain.info35 kann gezielt nach
Transaktionen und Adressen gesucht werden. Diese Form der Recherche gestaltet sich
aber mitunter sehr mühsam, da man jeweils nur einzelne Transaktionen respektive Bitcoinadresse einsehen kann. Die Verfolgung der Coins im Graphen über verschiedene Stufen
hinweg muss zumeist manuell durchgeführt werden.
Eine Alternative bietet das vom Autor mitentwickelte Tool BCTrace (Abb. 5.18).
Das in Java geschriebene Programm unterstützt den Anwender bei der Verfolgung von
Zahlungsströmen im Bitcoinnetzwerk. Hierfür fragt die Anwendung über eine JSONSchnittstelle36 die Online-Portale blockcypher.com und blockchain.info an. Beide Webseiten bieten jeweils eine eigene API für Recherchezwecke an. Die Ergebnisse dieser
Fernabfrage werden innerhalb des Tools in einer Baumstruktur präsentiert. Die Informationen werden auf diese Weise übersichtlich dargestellt. Der Baum kann beliebig entfaltet
werden. Eine Verfolgung von Zahlungsbewegungen über mehrere Transaktionen hinweg ist möglich. Darüber hinaus werden auch Zusatzinformationen angezeigt, die in der
Blockchain nicht protokolliert sind. Beispielsweise erfassen die Online-Portale zusätzlich,
von welcher IP-Adresse eine Transaktion gemeldet bzw. bestätigt wurde. Diese Information liefert nicht selten einen Hinweis auf die Identität der Sender bzw. Empfänger einer
Zahlung, da der Client, der eine Transaktion als erster meldet, in der Regel auch an dieser
unmittelbar beteiligt ist [11].
35
36
http://www.blockchain.info
JSON: JavaScript Object Notation
5
Digitaler Tatort, Sicherung und Verfolgung digitaler Spuren
163
Anonymität in der Blockchain
Häufig wird behauptet, Bitcoin wäre ein absolut anonymes Zahlungsmittel [2]. Dies
stimmt nur bedingt. Nach Meinung vieler Autoren ist die Anonymität von Bitcoin geringer als beispielsweise bei einer normalen Banküberweisung [11, 23, 24]. Tatsächlich wird
der Name oder die Identität einer Person lediglich durch ein anderes Merkmal (die Bitcoinadresse) ersetzt, um die Identifizierung der Nutzer zu erschweren. Dieses Vorgehen
wird auch als Pseudonymisierung bezeichnet [12]. Eine vollständige Anonymisierung ist
mit dem Bitcoinnetzwerk hingegen nicht möglich bzw. war niemals beabsichtigt. In der
Literatur werden Faktoren diskutiert, die zu einer Deanonymisierung einzelner Nutzer des
Bitcoinnetzwerkes führen können. Die Ansätze basieren letztlich auf einer Analyse des
Transaktionsgraphen. Die drei wesentlichen Aspekte dabei sind [11, 23, 24]:
1. Wiederverwendung von Adressen. Wird für die Abwicklung von Transaktionen immer wieder die selbe Adresse verwendet, dann ist dies vergleichbar mit einem Bankkonto mit fester Kontonummer. Bitcoinadressen sind eigentlich für diese Form der
Verwendung nicht vorgesehen. Das zeigt schon die Tatsache, dass die Adressen normalerweise zufällig erzeugt werden. Gelingt es, eine einzelne Transaktion mit einer
konkreten Identität in Verbindung zu bringen, so können automatisch auch die übrigen
Zahlungen zugeordnet werden.
2. Adresswechsel. Bitcoins werden durch Transaktionen zwischen Adressen übertragen.
Ein Überweisung an mehrere Adressen innerhalb einer einzigen Transaktion ist ebenfalls möglich. Nicht selten kommt es vor, dass ein zu zahlender Betrag kleiner ist als
das zur Verfügung stehende Guthaben. Dennoch muss zwingend immer der gesamte Betrag an Coins ausgegeben werden, selbst wenn der Nutzer eigentlich nur einen
Teilbetrag transferieren möchte. Folglich besitzt die Transaktion in diesem Fall mindestens zwei Ausgänge: einen für den Empfänger der eigentlichen Zahlung und einen
zweiten für das Restgeld, das der Absender natürlich behalten möchte. Dies wird auch
als Adressänderung (address change) bezeichnet. Es kann in vielen Fällen davon ausgegangen werden, dass zumindest eine mit dem Ausgang einer Transaktion verknüpfte
Bitcoinadresse dem Ersteller der Transaktion wiederum selbst gehört.
3. Zusammenführung von Ein- und Ausgängen. Werden mehrere Eingänge in einer
Transaktion zusammengeführt, um einen Gesamtbetrag zu bilden, kann man davon
ausgehen, dass alle diese Adressen, die verschmolzen wurden, auch mit der Person
assoziiert sind und dieser gehören.
In vielen Fällen kann man eine Verbindung zwischen einer Adresse und einer konkreten
Person durch eine gezielte Suche in Foren, auf Webseiten oder in sozialen Netzwerken herstellen. Die Adressen werden durch gängige Suchmaschinen indiziert und können leicht
gefunden werden. Außerdem ist dem Transaktionspartner sehr häufig die Identität des Gegenübers bekannt. Kauft jemand bei einem Händler online Waren und bezahlt diese mit
Bitcoins, so kennt Ersterer zwangsläufig auch dessen Identität. Anders wäre ein Versand
kaum möglich.
164
D. Pawlaszczyk
Auf der anderen Seite können Betroffene Maßnahmen ergreifen, um einer Verfolgung
ihrer Zahlungsströme entgegenzuwirken. Durch den Einsatz sogenannter Mixerdienste
(auch laundries bzw. tumbler genannt), können Bitcoins, die möglicherweise rückverfolgbar sind, gegen andere, vermutlich nicht zuordenbare Coins eingetauscht werden. Häufig
wird dafür eine kleine Gebühr erhoben. Analysen werden somit erschwert. Wenn das
Mischen wie geplant verläuft, dann stehen die Bitcoins, die ein Benutzer anschließend
besitzt, in keinerlei Zusammenhang zu den ursprünglichen Coins. Der Betroffene muss allerdings in der Regel darauf vertrauen, dass (1) der Dienst über genügend Kunden verfügt,
um effektiv seine Menge an Bitcoins mit anderen zu mixen und, (2) dass keine Protokolldateien über diesen Vorgang angelegt werden. Es hat sich aber gezeigt, dass zumindest
in einigen Fällen, diese Mixerdienstleistungen möglicherweise nicht so sicher sind, wie
behauptet [23, 24].
Jeder Transfer und jede Teilung von Bitcoins stellt letztlich ein potenztielles Problem
für die Ermittlungsarbeit dar. Nicht selten erweist es sich als äußert schwierig wenn nicht
gar unmöglich zu bestimmen, was genau mit dem Geld passiert ist. Werkzeuge und Techniken zur Analyse der Blockchain und zur Verbesserung der Nachverfolgbarkeit von Zahlungen im Bitcoinnetz stellen nach wie vor ein wichtiges Forschungsfeld dar.
5.5
Fazit und Ausblick
Wie sich zeigt, sind die Prinzipien der klassischen Forensik auch auf digitale Tatorte anwendbar und behalten im Cyberspace ihre Gültigkeit. Zur Sicherung, Verfolgung und
Auswertung digitaler Spuren müssen ebenso wie bei der Beweismittelsicherung am physischen Tatort bestimmte Grundsätze beachtet werden. Eine digitale Spur ist immer eine
Datenspur, die mit einem virtuellen Tatort verknüpft ist. Sie ist in vielen Fällen flüchtig.
Manipulierbarkeit und Integrität spielen eine zentrale Rolle bei der Sicherung und Analyse
digitaler Spuren. Das Kapitel trägt diesem Umstand Rechnung. So wurde insbesondere auf
den Umgang mit digitalen Beweismitteln, deren gerichtsfester Speicherung, Anfertigung
von Datenträgerabbildern sowie die Wiederherstellung gelöschter Daten eingegangen. Dabei wurde systematisch aufgezeigt und beschrieben, welche Tätigkeiten im Einzelnen
bei der Sicherung digitaler Beweismittel durchzuführen sind. In diesem Zusammenhang
wurden exemplarisch forensische Werkzeuge und deren Arbeitsweise besprochen. Gleichzeitig wurde aufgezeigt, wie sich diese Programme in den forensischen Prozess einreihen.
Gerade das Internet und seine Dienste verändern in vielfacher Weise die Anforderungen an die Spurensicherung. Der Tatort der Zukunft ist global. Der zweite Teil des Kapitales trägt diesem Umstand Rechnung, indem verschiedene digitale Tatorte im Internet und
die mit diesen in Zusammenhang stehenden forensischen Methoden besprochen wurden.
Am Beispiel von Cloud-Storage-Lösungen, Messengerdiensten und sozialen Netzwerken
wird exemplarisch gezeigt, welche Verfahren in der modernen IT-Forensik zum Einsatz
kommen. Die sicherlich größte Herausforderung stellt heute wie auch zukünftig die Flut
an Daten dar. So stehen den Ermittlern nicht zuletzt aufgrund der Qualität moderner Inter-
Literatur
165
netsuchmaschinen sowie bedingt durch die zunehmende Digitalisierung der Gesellschaft
immer mehr Daten zur Verfügung. Eine sinnvolle Filterung und Reduktion ist somit unumgänglich. Werkzeuge aus dem Bereich Open Source Intelligence können hier einen
wichtigen Beitrag leisten. Wie gezeigt wurde, besteht insbesondere bei der Verfolgung von
Zahlungsströmen im Bitcoinnetzwerk noch großer Forschungsbedarf. In diesem Bereich
sind die Möglichkeiten einer effizienten Analyse und Spurensuche derzeit nur unzureichend ausgeprägt.
Wie der Betrag belegt, unterliegt das Wissenschaftsgebiet der IT-Forensik einem permanenten Wandel durch neu hinzukommende Datenquellen und Technologien. Eine Verstetigung der Methoden und Verfahren wie beispielsweise im Bereich der Daktyloskopie
ist vorerst nicht absehbar. Andererseits hat gerade die Sicherung und Analyse digitaler
Spuren eine immer wichtigere Bedeutung für die moderne Strafverfolgung und nimmt
zweifelsohne eine zentrale Stellung innerhalb der Kriminalistik ein.
Literatur
1. Barrett D., Kipper G.: Investigating Dead Virtual Environments. In: Liles, S. (Hrsg.) Virtualization and Forensics A Digital Forensic Investigator’s Guide to Virtual Environments, S. 83–107.
Elsevier Inc (2010)
2. Biryukov A., Khovratovich D., Pustogarov, I.: Deanonymisation of Clients in Bitcoin P2P Network. University of Luxembourg: s.n. (2014)
3. Bundeskriminalamt: Cybercrime – Bundeslagebild 2014. Wiesbaden BKA (2014)
4. Breitinger F., Baier H.: Performance Issues about Context Triggered Piecewise Hashing. In:
3rd International ICST Conference on Digital Forensics & Cyber Crime (ICDF2C), Dublin
(Ireland), October (2011)
5. Bundesamt für Sicherheit in der Informationstechnik (BSI): Leitfaden IT-Forensik. Bonn
(2010), 358 Seiten
6. Bundesamt für Sicherheit in der Informationstechnik (BSI): Die Lage der IT-Sicherheit in
Deutschland 2015. Bonn (2015)
7. Carrier B.D., Grand J.: A hardware-based memory acquisition procedure for digital investigations. Digital Investigations, 1(1), ISSN 1742-2876. http://www.digital-evidence.org/papers/
tribble-preprint.pdf (2004)
8. Carrier B.D.: FileSystem Forensic Analysis. Adision-Wesley Perason Education (2005)
9. Carvey H.: Windows Forensik Analysis DVD Toolkit. Syngress-Verlag, Burlington (2009)
10. Casey E.: Digital Evidence and Computer Crime: Forensic Science, Computers, and the Internet, 3. Aufl. Academic Press (2011)
11. Fleder M, Kester M.S., Pillai S.: Bitcoin Transaction Graph Analysis. In: Cryptography and
Security (cs.CR), http://arxiv.org/pdf/1502.01657v1.pdf (2015)
12. Galt J.S.: The Good the Bad and the Ugly of Bitcoin’s Pseudoymity. http://www.hongkiat.com/
blog/bitcoin-security/. Zugegriffen: 15. Okt. 2015
13. Glassman M., Kang M.J.: Intelligence in the information age: the emergence and evolution of
Open Source Intelligence (OSINT). Computers in Human Behavior, 28(2), 673–682 (2012)
166
D. Pawlaszczyk
14. Haase N., ComputerForensics: Introduction to Incident Response and Investigation of WindowsNT/2000“, 4.Dezember 2001. SANS Institute (2001)
15. Halderman A., Schoen S.D., Heninger N. et al.: Lest We Remember: Cold Boot Attacks on
Encryption Keys. In: Proc. 2008 USENIX Security Symposium, February 21, 16 Seiten (2008)
16. Ligh M.H., Case A., Levy J., Walters A.: The Art of Memory Forensics: Detecting Malware
and Threats in Windows, Linux, and Mac Memory. John Wiley & Sons, Inc (2014)
17. James S.H. (Hrsg.), Nordby, J.J. (Hrsg.): Forensic Science: An Introduction to Scientific and
Investigative Techniques. Third. CRC Press (2009)
18. Mercado, S.C.: Sailing the sea of osint in the information age: a venerable source in a new era.
Studies in Intelligence, 48(3), Central Intelligence Agency Washington D.C. (2007)
19. Microsoft Coperation: Microsoft Security Intelligence Report. Volume 19, Januar through June
2015. www.mircosoft.com/sir. (2015)
20. Miers I., Garman C., Green M., Rubin A.D.: Zerocoin: Anonymous Distributed E-Cash from
Bitcoin. In: Miers, Ian, et al. s.l.: IEEExplore, 2013. In: SP ’13 Proceedings of the 2013 IEEE
Symposium on Security and Privacy, S. 397–411 (2013)
21. Nakamoto S.: Bitcoin: A Peer to Peer Electronic Cash System. https://bitcoin.org/bitcoin.pdf
(2008)
22. Pfefferli P.: Die Spur: Ratgeber für die spurenkundliche Praxis, 6. Aufl. Kriminalistik Verlag,
München (2011)
23. Reid F., Harrigan M.: An Analysis of Anonymity in the Bitcoin System. In: Security and Privacy in Social Networks, S. 197–223, 13. Juli (2012)
24. Ron D., Shamir A.: Quantitative Analysis of the Full Bitcoin Transaction Graph Cryptology
ePrint Archive: Report 2012/584. http://eprint.iacr.org/ (2012)
25. Ströger J., Schaurer F.: OSINT Report 3/2010: The Evolution of Open Source Intelligence. ISN
ETH Zürich (2010)
26. Wicker M.: Ermittlungsmöglichkeiten in der Cloud – Vereitelt das Speichern in der Cloud die
Zuständigkeit deutscher Ermittlungsbehörden? In: Taeger, J. (Hrsg.) Law as a Service – Recht
im Internet- und Cloud-Zeitalter, Tagungsband der Herbstakademie 2013, Bd. 2, Edewecht
2013, S. 981–1000. (2013)
27. US-CERT–United States Computer Emergency Readiness Team: ComputerForensics. https://
www.us-cert.gov/sites/default/files/publications/forensics.pdf (2008)
28. Verizon Enterprise Solutions: 2015 Data Breach Investigations Report. http://www.
verizonenterprise.com/de/DBIR/2015/ (2015)
29. Witherden F.: Memory Forensics over the IEEE 1394 Interface, September 2010, 29 Seiten.
https://freddie.witherden.org/pages/ieee-1394-forensics.pdf (2010)
30. Xie T., Liu F., Feng D.: Fast Collision Attack on MD5. Cryptology ePrint Archive, Report
2013/170 (2013)
6
Textforensik
Michael Spranger und Dirk Labudde
6.1
Einleitung
Die Analyse digitaler forensischer Texte ist regelmäßig eine Aufgabe in vielen Bereichen kriminalistischer Ermittlungen. Als digitale forensische Texte werden in diesem
Zusammenhang alle Texte bezeichnet, welche auf digitalen Speichermedien sichergestellt wurden, weil sie entweder selbst inkriminiert oder anderweitig geeignet sind, eine
begangene strafbare Handlungen, i. S. d. materiellen Strafrechts, auch teilweise, zu rekonstruieren oder zu beweisen, und somit Gegenstand kriminalistischer Ermittlungen mit
dem Ziel der Beweissicherung geworden sind. Untersuchungen dieser Art sind ein Teilgebiet der forensischen Informatik und immer abhängig von der vorher durchzuführenden
physikalischen Datensicherung. Die kriminalistische Relevanz reicht dabei von Computerstraftaten, wie Computerbetrug oder Computerspionage, bis hin zu klassischen Delikten
aus den Bereichen der Betrug, Wirtschafts- oder Rauschgiftkriminalität, die mit Unterstützung von Computern, mobilen Endgeräten oder des Internets begangen worden sind.
Die große Bedeutung wird klar, betrachtet man die polizeiliche Kriminalstatistik (PKS),
z. B. des Jahres 2012. Hiernach wurde in allen genannten Deliktbereichen Anstiege der
Fallzahlen bis zu 3,4 % gegenüber dem Vorjahr verzeichnet. Im Vergleich dazu lagen die
Aufklärungsquoten zwischen 29,9 und 94,4 % (vgl. Tab. 6.1).
M. Spranger ()
Wissenschaftlicher Mitarbeiter im Forensic Science Investigation Lab (FoSIL), University of
Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: spranger@hs-mittweida.de
D. Labudde
Lehrstuhl für Bioinformatik und Forensik, Leiter Forensic Science Investigation Lab (FoSIL),
University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: labudde@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_6
167
168
M. Spranger und D. Labudde
Tab. 6.1 Deliktische Entwicklung 2012 in ausgewählten Bereichen [2]
Deliktgruppe
Anzahl Fälle
Betrug
958.515 (16,0 %)
Rauschgift
237.150 (4,0 %)
Computerkriminalität
87.871 (1,5 %)
Wirtschaftskriminalität
81.793 (1,4 %)
Gesamt
5.997.040 (100 %)
Vorjahr
+2,5 %
+0,3 %
+3,4 %
+2,9 %
+0,1 %
Tatmittel Internet
16,9 %
–
57,5 %
12,4 %
3,8 %
Aufklärung
77,4 %
94,4 %
29,9 %
91,1 %
54,4 %
Die betrachteten Deliktgruppen umfassen zusammen nur knapp 25 % aller begangenen
Straftaten. Abb. 6.1 macht jedoch klar, dass durch diese mehr als drei Viertel des wirtschaftlichen Gesamtschadens verursacht werden. Bemerkenswert ist auch, dass im Jahr
2012 allein 229.408 Fälle, das sind 3,8 % aller registrierten Straftaten, unter Nutzung des
Internets begangen wurden [2]. Hier ist insbesondere von einem erhöhten Aufkommen
textueller Daten auszugehen, deren Analyse einen nicht unerheblicher Teil der Ermittlungszeit in Anspruch nimmt. Im Bereich der organisierten Kriminalität ist in Zeiten
von Smartphones und globaler Vernetzung die Verabredung und Anbahnung krimineller
Handlungen, selbst über Ländergrenzen hinweg, durch die Verwendung von Kurzmitteilungsdiensten, Messengern und sozialen Netzwerken so einfach geworden wie nie zuvor.
Die Nutzung jedes dieser Medien hinterlässt jedoch unweigerlich Spuren, welche, analysiert und ausgewertet, aufschlussreiche Details liefern können, mit deren Hilfe beispielsweise Tathergänge rekonstruiert werden können. Nicht zuletzt erlaubt die Analyse der
textbasierten Inhalte öffentlich zugänglicher sozialer Netzwerke, Hinweise auf mögliche
Abb. 6.1 Schadensaufteilung 2012 [2]
6
Textforensik
169
Tatverdächtige, Opfer oder Zeugen von Straftaten zu gewinnen oder sogar deren geplante
Ausführung ganz oder teilweise zu verhindern.
Vor allem der Preisverfall elektronischer Geräte und insbesondere digitaler Speichermedien lässt die Menge an verfügbaren textuellen Daten und damit an potentiellen forensischen Texten schnell ansteigen. Heutige Festplatten haben eine Größe von einigen
hundert Gigabyte bis hin zu mehreren Terabyte, selbst Smartphones besitzen üblicherweise eine Speicherkapazität im zweistelligen Gigabytebereich. Diese Entwicklung, getrieben
von der Angst, Daten und damit Informationen nicht ständig verfügbar zu haben, führt
zu vielfältigen Duplikaten und dem Phänomen, dass kaum noch Historien, Caches etc.
gelöscht werden. Einerseits sichert dies gute Chancen, den größten Teil des beweiserheblichen Materials auf den sichergestellten Datenträgern zu finden, andererseits lässt
es die zu untersuchende Datenmenge ständig weiter anwachsen. Es wird somit immer
schwieriger, die gesuchten Informationen in der Masse an Daten auszumachen, vor allem
wenn man berücksichtigt, dass nur ein Bruchteil davon möglicherweise verfahrensrelevant ist. So können neben E-Mails, Chatprotokollen, Kontaktlisten, Briefen und Notizen
vor allem im Bereich der Wirtschaftskriminalität oder des banden- oder gewerbsmäßigen (Computer-)Betruges auch Rechnungen, Kontoauszüge, Verträge und Tabellen von
kriminalistischem Interesse sein. Die manuelle Suche nach Hinweisen, direkten oder indirekten Beweisen führt schnell zu einem hohen zeitlichen und personellen Aufwand. In
einem durchschnittlichen Fall im Bereich der Wirtschaftskriminalität kann die Untersuchung leicht 6 Monate oder mehr in Anspruch nehmen. So ist es nicht verwunderlich, dass
detaillierte Auswertungen nur durchgeführt werden können, wenn das verletzte Rechtsgut, der Schadensumfang und die Beweislage diesen Aufwand rechtfertigen. Anderenfalls
wird die Untersuchung bestenfalls stichprobenartig durchgeführt oder ganz darauf verzichtet. Hinzu kommt das Erinnerungsvermögen von Zeugen, welches als Funktion der
Zeit sukzessive abnimmt. Ebbinghaus hat bereits 1885 im Rahmen seiner gedächtnispsychologischen Untersuchungen im Selbstversuch bedeutungslose Silben und spanische
Vokabeln gelernt, um die Vergessensrate in Abhängigkeit der vergangenen Zeit festzuhalten. Beides verglich er mit seinem Erinnerungsvermögen an autobiografische Ereignisse
und erzielte die in Abb. 6.2 dargestellten Ergebnisse. Greuel et al. gehen davon aus, dass
die Kurve für das Behalten inzidenteller Ereignisse noch unterhalb der Ebbinghaus’schen
Kurve für das Vergessen von spanischen Vokabeln liegt [14]. Das kann im Einzelfall bedeuten, dass ein Zeuge, vorausgesetzt eine Gerichtsverhandlung findet etwa ein Jahr nach
dem zugehörigen Ereignis statt, sich nur noch an 30–70 % der ursprünglichen Informationsmenge erinnern kann. Gleichwohl ist das Erinnerungsvermögen bei autobiografischen
Ereignissen, auch über einen längeren Zeitraum, wesentlich höher. Auf der anderen Seite können nachträglich aufgenommene Informationen die Aussagegenauigkeit in hohem
Maße negativ beeinflussen. Die Gefahr des Einflusses dieses als Falschinformationseffekt
bezeichneten Phänomens wächst natürlich mit der Länge des Zeitraumes bis zum ersten
Abruf der Informationen vom Zeugen. Deshalb muss es ein Ziel sein, die Dauer der Erhebung von Sachbeweisen im Allgemeinen und des Auswerteprozesses sichergestellter
Daten im Besonderen massiv zu verkürzen.
170
M. Spranger und D. Labudde
Abb. 6.2 Vergessenskurve basierend auf Ebbinghaus 1885 [11]
6.2 Analyse unstrukturierter digitaler Daten
Die Analyse digitaler Medien und insbesondere digitaler oder digitalisierter Texte unterschiedlichster Herkunft, welche im Kontext einer polizeilichen Sicherstellung oder Beschlagnahme in den Fokus der Ermittlungen gerückt sind, ist aktuell ein sehr zeitaufwendiger, fehleranfälliger und vor allem weitgehend manueller Prozess. Derartige Texte
werden in der forensischen Linguistik auch als inkriminierte Texte bezeichnet.
Definition
„Ein Text gilt als inkriminiert, wenn er Gegenstand oder Bestandteil eines ziviloder strafrechtlichen Verfahrens ist und im letzteren Fall bereits im Vorfeld Ermittlungen durch Strafverfolgungsbehörden durchgeführt wurden“ [13, S. 41].
Inkriminierte Texte befinden sich beispielsweise auf digitalen Speichermedien, Computern oder mobilen Endgeräten, aber auch in sozialen Netzwerken oder anderen Quellen
aus den Tiefen des Internets. Die Analyse dieser Daten ist einerseits eine der Hauptaufgaben in den Beweissicherungsverfahren in Fällen von Cyberkriminalität und klassischer
Kriminalität, andererseits unerlässliche Maßnahme zur Ergreifung präventiver Maßnahmen im Bereich von Terrorismus und organisierter Kriminalität. Die zeitliche Nähe des
Vorliegens der Auswertungsergebnisse zur vollendeten oder geplanten Tat ist oft von entscheidender Bedeutung für den Erfolg präventiver oder strafprozessualer Maßnahmen.
Trotzdem können derartige Untersuchungen von großer Bedeutung für das Auffinden beweiserheblicher Informationen im Straf- oder Zivilprozess sein. Die Heterogenität der
untersuchten Daten und der schnelle Wechsel von Kommunikationsformen erschweren die
6
Textforensik
171
Automatisierung dieser Prozesse. Aktuell in Deutschland verfügbare und durch Ermittlungsorgane genutzte Software, wie beispielsweise X-Ways Forensics1 , Forensic Toolkit
(FTK)2 , XRY Office3 oder Cellebrite UFED Physical Analyzer4 , bilden insbesondere den
semantischen Aspekt des Analyseprozesses nur ungenügend und nicht abgestimmt auf die
Besonderheiten inkriminierter Texte ab. Sie fokussieren vor allem Aspekte der Sicherung
und Wiederherstellung von Daten sowie das schlagwort- oder musterbasierte Suchen in
großen Datenbeständen. Versuche, semantische Komponenten basierend auf Erkenntnissen aus dem Bereich des Text Mining zu integrieren, scheitern regelmäßig im Praxistest
bei der Konfrontation mit Daten aus laufenden Ermittlungsverfahren. Die Ursache hierfür liegt vor allem in der fehlenden Verfügbarkeit von entsprechenden Trainings- und
Evaluationsdatensätzen (sogenannten Gold-Standards) für die Forschung aufgrund datenschutzrechtlicher Bestimmungen. Deshalb entwickelt der Autor als forschendes Mitglied
im Forensic Sciences Investigation Lab Mittweida gemeinsam mit Ermittlungsbehörden
und Staatsanwaltschaften Lösungen auf Basis realer, fallbezogener Daten. Einige dieser
Lösungsansätze werden in diesem Kapitel vorgestellt. Konsequenterweise ist es erklärtes
Ziel, diese Einzellösungen zu einem forensischen Werkzeug in Form eines erweiterbaren
IE/EE/QA-Domain-Frameworks5 zur Anwendung computerlinguistischer Methoden und
Technologien auf forensische Texte weiterzuentwickeln. In diesem Zusammenhang umfasst der Begriff forensische Texte, über den Begriff des inkriminierten Textes hinaus, auch
all jene textuellen Informationen, die geeignet sind, das Beweissicherungsverfahren oder
die Ergreifung präventiver Maßnahmen in einem konkreten Fall zu unterstützen. Im Allgemeinen sind die folgenden abstrakten Aufgaben durch eine computergestützte Lösung
zu realisieren:
Erkennung und Klassifizierung von Texten mit einer fallbasierten kriminalistischen Relevanz,
Erkennung von Entitäten und Relationen als Basis zur Aufdeckung von Täter- OpferNetzwerken,
Entdeckung geplanter Aktivitäten,
semantische Erschließung fragmentierter Texte,
Erkennung versteckter Semantik.
Jede dieser Aufgaben kann durch ein Netzwerk hochspezialisierter Services bearbeitet
werden, welche jeweils einen Problemlöser, basierend auf einer speziellen Text-MiningTechnologie, kapseln. Die Heterogenität der Daten erfordert ein polymorphes Verhalten,
welches durch intelligente Kombination dieser Problemlöser in Abhängigkeit von Textart
und Fragestellung erzielt werden kann.
1
http://www.x-ways.net/forensics/index-d.html
http://accessdata.com/solutions/digital-forensics/forensic-toolkit-ftk
3
https://www.msab.com/products/office/
4
http://www.cellebrite.com/de/Mobile-Forensics/Applications/ufed-physical-analyzer
5
Information Extraction/Event Extraction/Question Answering
2
172
6.3
M. Spranger und D. Labudde
Charakteristik forensischer Texte
Inkriminierte Texte (i. w. S. forensische Texte) sind wie bereits angedeutet beweiserhebliche textuelle Daten, die im Zuge des Beweissicherungsverfahrens durch Beamte der
Polizeien der Länder sichergestellt oder beschlagnahmt worden sind. Durch die Staatsanwaltschaft Chemnitz wurden, für die Entwicklung ermittlungsunterstützender Software,
historische Daten eines Strafverfahrens aus dem Bereich der Wirtschaftskriminalität für
Untersuchungszwecke zur Verfügung gestellt. Eine erste manuelle Analyse dieser Daten
ermöglichte, die nachfolgenden Aussagen über den Untersuchungsgegenstand zu treffen:
das Datenmaterial ist von erheblicher Heterogenität bezüglich seiner Struktur und Domäne,
wichtige Informationen können in nicht textbasierten Daten stecken (z. B. Fotokopien
von Rechnungen),
es gibt völlig irrelevante Texte, welche durch ihre Fülle relevante Informationen verdecken können (Vordrucke, Formulare, Templates, . . . ),
Informationen können absichtlich verschleiert worden sein, um sie vor Entdeckung zu
schützen,
Texte können von starken syntaktischen Schwächen geprägt sein,
Texte können durch Löschen/Rekonstruktion stark fragmentiert sein.
Im betrachteten Kontext wird der Begriff versteckte Semantik als eine Art der linguistischen Steganografie verstanden, ist aber nicht beschränkt auf diese. Vielmehr lässt auch
die Verwendung von slangbehafteter Sprache bekannte Text-Mining-Algorithmen scheitern. Das Verstehen versteckter Semantik ist eine der schwersten Aufgaben, für Maschinen
und sogar Linguisten mit jahrelanger Erfahrung, bei der Analyse forensischer Texte.
Die aufgeführten Spezifika unterscheiden den untersuchten Textkorpus von anderen
üblicherweise in der Forschung verwendeten und evaluierten. Ferner ergab eine Umfrage,
welche durch die Autoren unter Kriminalisten der kooperierenden Ermittlungsbehörden
durchgeführt wurde, dass das Auffinden und Separieren relevanter Dokumente der aufwendigste und schwierigste Teil der Auswertung ist.
6.4 Entwicklung einer Kriminalitätsontologie
6.4.1 Ontologie-basierte Informationsextraktion
Aus Sicht der Autoren ist die Einbeziehung des Wissens von Ermittlern Voraussetzung
für die erfolgreiche und nutzbare Entwicklung automatisierter Lösungen im Rahmen der
Textforensik. Ein Ermittler, der Delikte eines bestimmten Bereiches, beispielsweise Drogendelikte, bearbeitet, besitzt Wissen, welches er aktiv bei der Aufklärung eines Falles,
i. e. S. für die Suche nach Beweisen, einsetzt:
6
Textforensik
Wissen über die objektive und subjektive Strafbarkeit von Handlungen,
Wissen, welche Voraussetzungen (Tatbestandsmerkmale) erfüllt sein müssen,
Wissen über regionale sprachliche Besonderheiten,
Wissen über delikt- und regionalspezifische Termini.
173
Dieses Wissen bleibt üblicherweise Anwendungen vorenthalten, ist aber gleichzeitig Voraussetzung für die erfolgreiche Suche nach Beweisen. Die Entwicklung einer sogenannten
Ontologie für forensische Zwecke ist deshalb Voraussetzung für die Annotation von forensischen Texten und das Stellen von Fragen an ein System in dieser speziellen Domäne. Der
Begriff Ontologie wird im Allgemeinen als eine formale und explizite Spezifikation gemeinsamer Konzepte verstanden. Insbesondere werden gemeinsam klassifizierte Begriffe
und Symbole bezogen auf eine Syntax und ein Netzwerk von Relationen definiert [10, 15].
Der Begriff Taxonomie, als Teil einer Ontologie, wird für die Klassifikation von Begriffen
(Konzepten) in Ontologien und Dokumenten verwendet. Eine Besonderheit forensischer
Ontologien ist deren fallbasierte polymorphe Struktur und die Verwendung von Termini
aus dem Bereich des Strafverfahrens. Dieser Aspekt muss bei der Definition eines Repräsentationsmodells für eine derartige Ontologie zwingend Berücksichtigung finden, wie
in Abschn. 6.4.3 gezeigt werden wird. In Abhängigkeit des Abstraktionsgrades können
zwei Typen von Ontologien unterschieden werden. Eine Domänenontologie modelliert
umfassend und tiefgründig das Wissen einer meist hochspezialisierten Domäne als Teil
der realen Welt. Eine Oberontologie beschreibt allgemeine Objekte, die sich auf einen
großen Bereich von Domänenontologien anwenden lassen. Außerdem erzeugen sie einen
Glossar grundlegender Begrifflichkeiten und Objektbeschreibungen, die in verschiedenen
relevanten Domänen Anwendung finden [10].
Cowie und Wilks [8] beschreiben Informationsextraktion (IE) als einen Prozess zur
selektiven Strukturierung und Kombination von Daten, die sich in verschiedenen Texten
befinden, explizit erwähnt oder impliziert werden. Eine etwas formalere Beschreibung
stellen Russell und Norvig vor. Sie verstehen IE als Sammlung von Wissen durch die
Suche nach Vorkommen von Objekten spezifischer Klassen und deren Relationen untereinander in natürlichsprachlichen Texten [25].
Der Prozess der IE kann durch den Einsatz von Ontologien auf verschiedene Weise
unterstützt werden. Die Nutzung als Extraktionsontologie ist eine Möglichkeit, von den
Vorteilen einer Ontologie zu partizipieren. In diesem Fall wird der Informationsextraktionsprozess durch die Verwendung der Ontologie als eine Art Template geführt. Derartige
Templates repräsentieren formales Wissen über grammatikalische Zusammenhängen und
werden oft von Extraktionsalgorithmen genutzt [10, 31]. Eine weitere Möglichkeit besteht
in der strukturierten Darstellung des Ergebnisses des Informationsextraktionsprozesses.
Kombiniert man beide Ansätze, erhält man ein IE-System, welches maximal durch
den Einsatz von Ontologien unterstützt wird. Solche Systeme werden ontologiebasierte
IE-Systeme (OBIE-Systeme) genannt [31].
174
6.4.2
M. Spranger und D. Labudde
Repräsentation von Wissensmodellen
Die Repräsentation von Ontologien kann mit verschiedenen Modellen von unterschiedlicher Ausdrucksstärke realisiert werden. Taxonomien und Thesauri, welche hier nicht
weiter erörtert werden, können als einfache Ontologien unter Verzicht auf bestimmte
Konventionen verstanden werden.6 Stattdessen sollen in diesem Abschnitt einige ausdrucksstärkere Modelle beschrieben werden.
Die Intention von Concept Maps, wie sie durch Josef Novak an der Cornell University entwickelt wurden [23], ist es, Beziehungen zwischen Konzepten zu repräsentieren.
Bezugnehmend darauf ist eine Concept Map eine abstrakte Beschreibung von bestimmten Ideen oder einer spezifischen Wissensdomäne. Sie visualisiert semantische Einheiten
(Präpositionen) für eine bestimmte Domäne, wobei semantische Einheiten aus zwei Begriffen (Konzepten), verbunden durch eine benannte Relation, bestehen. Das Benennen
einer Relation ermöglicht einen höheren Grad des Verständnisses durch höhere semantische Informationen. Es ist explizit nicht verboten, Kreuzrelationen zwischen verschiedenen Konzepten zu erzeugen [10, 23]. Topic Map ist das ausdrucksstärkste Modell und
wohl definiert aufgrund seiner ISO-Standardisierung. Es existieren eine Vielzahl von Implementierungen, z. B. XML-Topic Maps (XTM), welche die grundlegende Konzepte
des Standards implementieren, obwohl sie auf einzelne Aspekte desselben verzichten
oder diese modifizieren. Der Standard ISO/IEC 13250 beschreibt die Nutzung von Topic Maps für die Bereiche des Informationsaustausches, der Informationsorganisation und
-repräsentation. Grundlegend erlauben die strukturellen Informationen, die durch Topic
Maps bereitgestellt werden, Relationen zwischen Topics (abstrakte Gegenstände) zu beschreiben und adressierbare Informationsobjekte (Occurrences) anzuhängen. Die Natur
aller konstituierenden Teile kann detailliert durch die Verwendung von Eigenschaften
(Facets) beschrieben werden. Ein anderer signifikanter Punkt ist, dass die Informationsobjekte einer Topic Map einem Scope zugeordnet werden können (s. Abschn. 6.4.3). Es ist
wichtig zu wissen, dass verschiedene Topic Maps strukturelle Informationen bereitstellen
können, die sich auf dieselbe Ressource beziehen. Auf diese Weise ermöglicht die Architektur die Kombination von Topic Maps und damit die Kopplung von Informationen aus
verschiedenen Bereichen. Aufgrund ihres intrinsischen Charakters können sie als Overlay
von Informationsobjekten betrachtet werden. Zusammenfassend kann gesagt werden, dass
Topic Maps vielseitige und simultane Sichten auf Informationsobjekte, deren strukturelle
Natur prinzipiell unbeschränkt ist, bereitstellen. Deshalb ist es möglich, einen objektorientierten, hierarchischen, sortierten oder unsortierten Ansatz oder jede dieser Kombination
zu verwenden. Außerdem ist es möglich, eine prinzipiell unbeschränkte Anzahl an Topic
Maps auf einer gegebenen Menge von Informationsressourcen zu überlagern [1].
6
Vertiefende Informationen können bei [10] gefunden werden.
6
Textforensik
175
Tab. 6.2 Elemente des forensischen Topic-Map-Modells (vgl. Abb. 6.3)
Element
Subject (Topic)
Instance (Topic)
Descriptor (Topic)
Association
Association Role
Occurrence
Topic Name
Name Item
Facet
Facet Value
Scope
Beschreibung
Abstrakte oder konkrete Entität in der zu analysierenden Domäne
Konkrete Manifestation eines Subjekts (roter Kreis)
Typifiziert jedes andere syntaktische Element (oranger Kreis); i. e., fügt weitere Details hinzu
Eine Relation zwischen zwei Topics (Subject, Instance)(hellblauer Rhomboid)
Spezifiziert die Rolle eines Topics in einer Association (blaues Quadrat)
Verweist auf die konkrete Manifestation eines Topics in einer Ressource,
bezogen auf eine Instance.
Der Name der Repräsentation eines Topics (grünes abgerundetes Rechteck)
Bezeichnet den Namen eines spezifischen Topics bezogen auf einen Scope
(weißes Rechteck innerhalb des Topic Name )
Benennt eine Klasse von Attributen eines Topics und kann verschiedene
Facet Values beinhalten
Wert eines bestimmten Attributes; kann ein Topic oder eine weitere Facet
sein
Definiert semantische Layer
6.4.3 Forensisches Ontologiemodell
Die Autoren verwenden eine modifizierte Variante des Topic-Map-Standards zur Modellierung einer Ontologie, wobei das erzeugte Modell auf den Inhalten und Gedanken des
Standards beruht ohne alle Teile vollständig zu implementieren. Im Allgemeinen wurden
die wichtigsten semantischen Elemente berücksichtigt, während die meisten syntaktischen
Elemente durch Elemente ersetzt wurden, die den Erfordernissen der modellgetriebenen
Softwareentwicklung entsprechen.
Insbesondere die Verwendung von Scopes innerhalb der Topic Maps ist ein signifikanter Vorteil zur Modellierung von Multilingualismus und verbessert die Bestimmung
von Bedeutungen. Im Bereich der Kriminalwissenschaften und forensischen Linguistik
ist Multilingualismus nicht nur auf Mutter- und Fremdsprachen beschränkt, sondern umfasst auch Slang, Dialekte und verschiedene sprachliche Ausdrucksfähigkeiten. Darüber
hinaus bieten Scopes eine Möglichkeit das Problem der versteckten Semantik aus Abschn. 6.3 zu lösen, indem eine oder mehrere unterschiedliche Bedeutungen direkt an ein
bestimmtes Topic annotiert werden. Die Topic-Map-Elemente, die für die Modellierung
von forensischen Ontologien verwendet werden, sind in Tab. 6.2 beschrieben.
Abb. 6.3 demonstriert die Anwendung eines Topic-Map-Derivates zur Modellierung
einer forensischen Ontologie – die Aufdeckung der Aktivitäten einer Bande, die mit gestohlenen Gegenständen handelt. Der gezeigte Auszug beinhaltet nicht alle Elemente des
implementierten Topic-Map-Modells. Die Kernobjekte in diesem Beispielnetzwerk sind
durch die Ziffer 1 gekennzeichnet – die Personen Vince, Tom, Finn und Brian sowie der
176
M. Spranger und D. Labudde
Abb. 6.3 Auszug einer Ontologie, die zur Beschreibung von Eigentumsdelikten verwendet wird.
Sie demonstriert typische Interaktionen zwischen den verschiedenen Topic-Map-Elementen
Gegenstand „Watch“. Assoziationen spezifiziert durch beschreibende Topics zwischen
diesen Objekten sind mit der Ziffer 2 gekennzeichnet. Eine bestimmte Rolle, die durch
ein Objekt in einer Assoziation eingenommen wird, ist mit der Ziffer 3 gekennzeichnet.
Schaut man sich das Beispiel in Abb. 6.3 genauer an, kann man sich vorstellen, dass das
Netzwerk auf folgende Weise entstanden sein könnte: Brian sucht nach einer neuen Uhr,
weil seine Alte defekt ist. Er fragt in verschiedenen Läden nach einem Modell, das seine
Bedürfnisse erfüllt, bis er einen Verkäufer (Finn) findet, der ihm anbietet, eine entsprechende Uhr mit der nächsten Lieferung zu bekommen. Ein paar Tage später ruft Finn
Brian an und teilt ihm mit, dass er eine Uhr für ihn habe. Brian zögert nicht und kauft
sie. Nach genauerer Betrachtung zu Hause findet er eine kaum sichtbare Gravur auf der
Rückseite der Uhr und zeigt sie einem Freund, einem Polizisten. Einige Tage früher wurde
dieser von Vince gerufen, einer Person, die ihr Eigentum, eine Uhr mit eben einer solchen
Inschrift, am Strand verloren hatte. Brian und der Polizist gehen gemeinsam zurück zu
dem Laden, wo Finn durch den Polizisten mit den Beschwerden verschiedener Kunden
konfrontiert wird. Nach kurzer Bedenkzeit beschlagnahmt der Polizist Finns Computer.
Die Analyse des konfiszierten Materials liefert den folgenden Ausschnitt eines InstantMessenger-Protokolls:
6
Textforensik
177
Tom: „I bought granny’s gift, which pops demanded.“
Finn: „Alright, bring it over.“
Tom ist der Polizei ebenfalls gut bekannt. Weitere Ermittlungen decken das gesamte
Potential dieser Beziehungen auf und komplettieren das Netzwerk. Überdenkt man alle
Fakten, kann Finn als Hehler bezeichnet werden, der gestohlene Gegenstände verkauft,
die durch Tom beschafft wurden. Dieser hielt Ausschau nach einer Uhr, wie sie von Brian
beschrieben wurde, und fand schließlich ein passendes Modell, das einfach zu entwenden war, Vinces Uhr – glücklicher Zufall in diesem gestellten Beispiel zur Demonstration
der Kooperation der verschiedenen Elemente der forensischen Topic Map zum Aufdecken
eines Hehlernetzwerkes.
6.5
Ansätze der forensischen Textanalyse
In diesem Abschnitt werden verschiedene Strategien im Umgang mit forensischen Texten,
unter besonderer Berücksichtigung der Erkenntnisse aus Abschn. 6.3, vorgestellt.
6.5.1
Pipeline zur ausführlichen Analyse
Die ausführliche Analyse von forensischen Texten muss deren besondere Charakteristik
berücksichtigen. Sie beinhaltet insbesondere Aufgaben der Informations-/ Ereignisextraktion mit dem Ziel der Instanziierung einer forensischen Ontologie als zentrales Element
des durch die Autoren entwickelten Frameworks. Insbesondere die Arbeiten von Wimalasuriya und Dou [31], Embley [12] und Maedche [20] zeigen, dass die Verwendung von
Ontologien geeignet ist, die Extraktion semantischer Einheiten und deren Visualisierung
zu unterstützen und derartige Prozesse besonders gut zu strukturieren. Der gesamte Prozess ist in drei Teilprozesse untergliedert:
1. Erzeugung der forensischen Ontologie und des Analysekorpus,
2. Grundlegende Textvorverarbeitung und Detektion von sekundären Kontexten,
3. Instanziierung der Ontologie und iterative Detaillierung.
Um einerseits die Extraktionsaufgaben zu bestimmen und andererseits fallbasiertes
Wissen einzuführen, muss als Erstes die forensische Ontologie in ihrer spezialisierten
Form als Topic Map, welche durch die Autoren in einer früheren Arbeit [29] entwickelt
wurde, erzeugt werden. Dieser Schritt wird durch die Verwendung bereits existierender Ontologien (ähnliche Domänen) unterstützt. Bei der anschließenden Erzeugung des
Analysekorpus müssen insbesondere textuelle Daten von anderen Dateien separiert und
der Rohtext extrahiert werden. Das beinhaltet auch die Optical Character Recognition
178
M. Spranger und D. Labudde
Abb. 6.4 Die Werkzeugpipeline zur ausführlichen Textanalyse. Der gesamte Prozess wurde in drei
Teilprozesse untergliedert: 1) Erzeugen des Analysekorpus, 2) Textvorverarbeitung, 3) Informationsextraktion
(OCR) für den Fall, dass es sich um digitale Bilder, z. B. Fotokopien handelt. Diese Daten werden in einer Datenbank, gemeinsam mit den Metadaten, gespeichert und zum
schnelleren Zugriff indexiert. Im zweiten Schritt werden einige Textverarbeitungsschritte,
wie Part-of-Speech-Tagging (POS-Tagging), Spracherkennung sowie spezielle Operationen zur Verarbeitung von strukturierten Inhalten durchgeführt. Insbesondere werden sogenannte ereignisbeschreibende (event-narrative) Dokumente detektiert. Diese Aufgabe
wurde durch Huang und Riloff [16] zur Suche nach sogenannten sekundären Kontexten (secondary contexts) eingeführt. Sie definieren diese als Sätze, welche nicht explizit
Teil der hauptsächlichen Ereignisbeschreibung sind. Diese sekundären Kontexte können
beweiserhebliche Informationen beinhalten oder Hinweise auf den Verbleib der Beute,
weiterer Opfer oder Komplizen liefern. Der letzte Schritt innerhalb des Hauptprozesses
besteht in der tatsächlichen Informationsextraktion. Hier werden Ereignissätze gesucht,
die geeignet sind, zumindest einen Teil der Ontologie zu instantiieren. Bei Bedarf werden
diese Informationen gemeinsam mit den Informationen aus den sekundären Kontexten
extrahiert. Anschließend, nach initialer Instantiierung der Ontologie, kann das Modell
iterativ beispielsweise durch Identifikation forensischer Rollen, wie in Abschn. 6.5.2 beschrieben, detailliert werden. Abb. 6.4 illustriert den gesamten Prozess schematisch.
6
Textforensik
6.5.2
179
Identifikation forensischer Rollen
Die Erkennung von benannten Entitäten (Named Entity Recognition) ist ein gut erforschter Bereich des Text Mining und eine übliche Aufgabe in jeder Informations-/ Extraktionslösung. Die generelle Aufgabe ist, alle Instanzen i 2 I eines jeden Konzeptes c 2 C
unter Berücksichtigung ihrer hyperonymen und hyponymen Beziehungen zu identifizieren. Diese Aufgabe kann praktisch unter Verwendung gazetteerbasierter Lösungen [22],
mithilfe von überwachten [33] bis hin zu semi-/ unüberwachten [19] Lernmethoden gelöst werden. Trotzdem konnte keine existierende Lösung den Nachweis erbringen, in der
Lage zu sein, forensische Rollen korrekt zuzuweisen. Die Zuweisung einer solchen Rolle
hängt oft von mehr als einem Dokument und von der Bereitstellung fallbasierten Wissens
durch den Kriminalisten ab. Deshalb basiert die durch die Autoren entwickelte Lösung
auf einer Ontologie, die als Extraktions- und Visualisierungstemplate fungiert und in der
Lage ist, solches Wissen bereitzustellen. Wie bereits festgestellt wurde, kann jedes Topic
eine Menge von Facets beinhalten. Dieses Facets werden neben anderen Elementen zur
Modellierung von Regeln verwendet, die eine Inferenzmaschine verwenden kann, um auf
die passende Rolle einer Entität innerhalb eines Post-Prozesses zu schließen. Auf diese
Weise lässt sich der Detaillierungsgrad während der computerbasierten Erkennung von
Entitäten erhöhen. Abb. 6.5 zeigt einen Ausschnitt einer fiktiven forensischen Topic Map,
die durch einen Kriminalisten erzeugt worden sein könnte. Hier wurde eine forensische
Rolle accomplice (Mittäter) modelliert. Ein Mittäter wurde in Anlehnung an § 25 StGB
als eine Person, die folgende Regeln erfüllt, beschrieben:
Die Person hat genau dann ein gemeinsames Tatinteresse, wenn eine Assoziation zu
einer Instanz eines Topics besteht, welchem die forensische Rolle booty (Beute) zugewiesen wurde.
Die Person hat genau dann einen Tatbeitrag geleistet, wenn eine Assoziation zu einer Instanz des Topics car (Fahrzeug) besteht, welchem die Rolle eines Fluchtmittels
zugewiesen wurde. Die Anzahl der Regeln, die erfüllt sein müssen, hängt vom Gewicht einer Regel ab, welches als Indikator für die Bedeutung einer Regel fungiert. Die
konkrete Instanz definiert dieselben Facets mit binären Werten in Abhängigkeit des
Matchingverhaltens einer jeden Regel.
6.5.3 Lösungsansatz für das Problem der versteckten Semantik
Wie in Abschn. 6.3 bereits erwähnt, ist das Erkennen versteckter Semantik eine der
schwersten Aufgaben währen der forensischen Textanalyse. Deshalb kann dieses Problem nur unter Einbeziehung des gesamten Kontextes und des Wissens von Experten
gelöst werden. Ein System, das in der Lage sein soll, dieses Problem automatisch zu
erkennen oder sogar zu lösen, muss die komplette Analysepipeline, wie in Abschn. 6.5.1
180
M. Spranger und D. Labudde
Abb. 6.5 Graduelles Detaillieren benannter Entitäten. Die Entität Paul als Instanz (gelber Kreis)
des abstrakten Topics (roter Kreis) person kann graduell ihrer konkreten Manifestation accomplice
zugewiesen werden. Die Zuweisung erfolgt durch iterativen Vergleich ihrer Facets, welche in Form
von Regeln implementiert sind
beschrieben, durchlaufen haben. Weil sowohl Wissen aus automatisch extrahierten Informationen als auch eingeführtes Expertenwissen durch eine forensische Topic Map
(vgl. Abschn. 6.4.3) repräsentiert wird, kann versucht werden, versteckte Semantik durch
Ausnutzung ihrer speziellen Eigenschaften zu erkennen. Maicher stellte einen Ansatz
zum aufeinander Abbilden unterschiedlicher Topics mit derselben Bedeutung, modelliert
durch unterschiedliche Autoren in einer verteilten Umgebung, vor [21]. Dieser Gedanke
führt zu einem ähnlichen Ansatz des hier diskutierten Problems. Jede Instanz, die ein System finden könnte, ist klar definiert durch die Position des zugehörigen Topics innerhalb
der Taxonomie, ihre Facets und die Gesamtheit an instantiierten Assoziationen, in denen
sie eine hochspezifische Rolle spielt. Wir nehmen an, dass der semantische Kontext etwa
konstant bleibt, wenn ein Text in ein stenografischen Code überführt wird, da sich nur
die verwendeten Wörter ändern (Abb. 6.6a). Formal ausgedrückt, sei jede Instance i 2 I
wohl definiert durch ein Tupel T; FT ; RA ; AT , wobei T die zugehörige Taxonomie des
zugehörigen Topics und FT die Menge an Facets jedes dieser Topics, welche die Instance
von ähnlichen anderen unterscheiden, bezeichnet. Ferner ist RA die Menge an Rollen, die
ein Topic in der Menge der Assoziationen AT einnimmt. Dieses Tupel konstituiert den
Kontext C.i/ einer spezifischen Instance i. Jeder Kontext muss mit dem anderer Topics,
unter Verwendung einer Distanzfunktion dist, verglichen werden, um den Grad der Ähn-
6
Textforensik
181
a
b
Abb. 6.6 Erkennung versteckter Semantik: a Topiczentrierter Ansatz – Angenommen die zwei Instances Finn and Dickie bezeichnen dieselbe Entität. Jede von diesen definiert einen Kontext, der
Facets, Associations und Roles beinhaltet und vom zugehörigen Topic abgeleitet ist. Der Grad der
Ähnlichkeit dieser zwei Kontexte bestimmt auch die Ähnlichkeit der Instances; b Assoziationszentrierter Ansatz – Angenommen die zwei Instances Finn and Dickie bezeichnen dieselbe Entität.
Dann kann die Ähnlichkeit der beiden Instances durch ein paarweises Alignment aller möglichen
Sätze und Berechnung einer semantischen Distanz bestimmt werden. Weil die Associations own
und sell sich in einer Kausalkette befinden steigt die Wahrscheinlichkeit der Synonymität
lichkeit zu bestimmen. Die Definition eines Schwellwertes unterstützt die Entscheidung,
ob zwei Instances möglicherweise die gleiche Entität bezeichnen oder nicht (vgl. Gl. 6.1
und 6.2):
D min fdist.C.i/; C.j //g;
j 2I ni
8
<1; C.j / has
min .C.i// <
SY N.C.i/; C.j / D
:0; else:
min .C.i//
(6.1)
(6.2)
Um die Distanz zwischen zwei Kontexten Ci und Cj zu bestimmen, muss die Semantik
in der Ontologie in ein nummerisches Format codiert werden. Für Topics kann die Methode von Wang et al. adaptiert werden [30]. Dabei hat ein Topic umso geringere Ähnlichkeit
(bestimmt durch eine Konstante k) zu einem anderen, je weiter sie in der Taxonomie von-
182
M. Spranger und D. Labudde
einander entfernt sind (vgl. Gl. 6.3). Die Konstante muss empirisch bestimmt werden:
8
<1;
t DT
(6.3)
ST .t/ D
:maxfk S .t 0 / j t 0 2 children.t/g; else:
T
Ein anderer Ansatz ist mehr assoziationszentriert. Dabei betrachtet man Alignments
aller Associations innerhalb derselben Kausalkette und berechnet eine Editierdistanz. Das
Distanzmaß bezieht sich auf Distanzen im Ontologiegraph (vgl. Abb. 6.6b). Formal ausgedrückt, sei A die Menge der Associations und K die Menge der Kausalketten, die von
A abgeleitet werden können. Eine Kausalkette besteht aus allen Associations a1 ; : : : ; an ,
wobei a1 ! a2 ! : : : ! an gilt. Ferner sei AT die Menge an Associations bezogen auf
ein spezifisches Topic. Die Kausalketten, die hier von Interesse sind, können wie in Gl. 6.4
beschrieben werden. Sei S die Menge an Sätzen, die gebildet werden kann, unter Verwendung einer Association in einer Kausalkette k. Für jedes Alignment f.a; b/ j a; b 2 Sg
kann nun ein Score berechnet werden. Je höher der Score, desto höher ist die Wahrscheinlichkeit, dass die involvierten Topics dieselbe Bedeutung haben:
Krelevant D fk 2 K j 9a; b 2 k ^ a 2 AT 1 ^ b 2 AT 2 g:
(6.4)
6.6 Kategorisierung forensischer Texte
Die Filterung und Kategorisierung der Untersuchungsdaten gehört zu den wichtigsten und
frühesten Aufgaben bei der Auswertung forensischer Texte und stellt eine typische Aufgabe des Information Retrieval (IR) dar. Die Kategorisierung als Spezialfall der Klassifikation versucht ein Dokument in ein eng begrenztes Set von Kategorien unter Verwendung
von maschinellen Lerntechniken einzuordnen. Formal beschrieben, sei D D d1 ; : : : ; dm
ein Set von zu kategorisierenden Dokumenten und ferner C D c1 ; : : : ; cn ein Set von
Kategorien, dann kann die Aufgabe der Kategorisierung nunmehr als surjektive Abb.
f W C ! D beschrieben werden. Ikonomakis et al. geben in [17] einen Überblick
über Ansätze zur Lösung dieser Aufgabe mithilfe verschiedener maschineller Lernmethoden. In ihrer vergleichenden Studie kommen sie zu dem Ergebnis, dass die Performanz
signifikant von einem Korpus ausreichender Größe und Qualität abhängt. Genau diese
beiden Voraussetzungen werden allerdings in der Forensik so gut wie nie erfüllt sein.
Das liegt zum einen daran, dass Daten nicht ohne Weiteres von einem Fall auf einen
anderen übertragen werden dürfen, es demnach prinzipiell keinen großen Testdatensatz
geben kann. Andererseits wird auch der Forderung nach ausreichender Qualität kaum
Rechnung getragen werden können, da forensische Texte inhaltlich und formal eine hohe
Varianz aufweisen und auch strukturell von hoher Heterogenität sind. Ausnahmen bilden
hier ggf. Texte aus dem Bereich der Wirtschaftskriminalität. Riloff and Lehnert stellen
6
Textforensik
183
in [24] einen Ansatz zur hochpräzisen Textklassifikation vor. Ihr Augmented-RelevancySignature-Algorithmus erreichte bis zu 100 % Präzision bei über 60 % Sensitivität, ermittelt unter Zugrundelegung des MUC-4-Korpus [3]. In der betrachteten Domäne der
forensischen Texte sind diese Ergebnisse jedoch nicht immer ausreichend. Insbesondere
berücksichtigen die zugrundeliegenden Algorithmen nicht die spezifischen Eigenschaften
forensischer Texte. Zu betonen ist, dass jedes falsch-negativ klassifizierte Dokument (nicht
identifiziert, fallrelevant) bedeutende Beweise oder Hinweise liefern könnte. Das betont
die Notwendigkeit einer Methode, welche bestenfalls Dokumente mit einer Sensitivität
von 100 % klassifiziert, bei gleichzeitig akzeptabler Präzision. Zum Umgang mit dem
aus diesem Sensitivität-Präzisions-Trade-off entstehenden Informationsüberfluss stellen
Beebe und Clark [6] einen Ansatz vor. In ihrer Arbeit betrachten sie ein vergleichbares
Problem und schlagen vor, die Ergebnisse in thematischen Clustern zusammenzufassen.
Trotzdem bleiben Design und Training eines geeigneten Klassifikators ein herausforderndes Problem.
Durch die Tatsache, dass das Wissen der Ermittlungsperson, sowohl generell (Erfahrungswissen) als auch fallbasiert, bezüglich eines konkreten richterlichen Untersuchungsauftrages verfügbar ist, können Regeln die Performanz in vielen Fällen verbessern. Der
Autor stellt in [28] einen Ansatz vor, der ein Regelwerk mit statistischen maschinellen
Lernansätzen verbindet. Dabei wird auf die Modellierung der Kategorien als Taxonomie abgestellt, wodurch es möglich wird, jeder einzelnen Kategorie ein hierarchisches
Regelwerk beizustellen. Die Regeln können dabei beispielsweise in Form von regulären Ausdrücken, welche auf den Dokumentenkörper oder Metadaten angewendet werden,
formuliert werden. Innerhalb einer Kategorie werden die so definierten Regeln durch Disjunktion und zwischen verschiedenen Kategorien zusammenhängender Pfade von ElternKind-Beziehungen per Konjunktion verknüpft (Abb. 6.7a).
Jede Regel des Regelwerkes muss ihr Ziel, auf das sie angewandt wird, definieren (z. B.
Dateiname, Inhalt etc.). Weiterhin muss neben der eigentlichen Regel der Regeltyp angegeben werden, um den korrekten Algorithmus zur Verarbeitung dieser Regel auszuwählen.
Auf diese Weise wird die hochpräzise Auswahl einer gewissen Menge von repräsentativen Seeddokumenten ermöglicht. Wichtig ist hierbei, dass das Regelwerk so formuliert
wird, dass die so klassifizierten Dokumente die entsprechende Kategorie möglichst gut
in der Breite repräsentieren. Mithilfe dieser Dokumente kann anschließend ein passender
maschineller Lernalgorithmus im Bootstrappingverfahren die verbleibenden Dokumente
klassifizieren (Abb. 6.8).
Der gesamte Prozess für das Auffinden von Seeddokumenten ist in Abb. 6.7 dargestellt.
Anzumerken ist, dass die Performanz des Maschinenlernalgorithmus für bestimmte Kategorien durch Umformulierung ihrer korrespondierenden Regeln signifikant beeinflusst
werden kann, weil die Performanz eines Bootstrappingalgorithmus insbesondere von der
Wahl der Seedelemente, genauer gesagt deren Repräsentativität, abhängt. Deshalb führen streng und präzise formulierte Regeln im Allgemeinen zu einer hohen Präzision bei
relativ niedriger Sensitivität, wohingegen die Anwendung schwach bzw. unscharf for-
184
a
M. Spranger und D. Labudde
b
Abb. 6.7 Auffinden von Seeddokumenten. Die Metadaten der zu kategorisieren- den Dokumente, sowie deren extrahierter Rohtext werden rekursiv gegen ein Set von Kategorieregeln geprüft.
Beginnend mit der Wurzelkategorie muss mindestens eine Regel zutreffen bis bei der rekursiven
Prüfung der Unterkategorien keine Regel mehr zutrifft. Auf diese Weise werden nur die Label der
spezifischsten Kategorie beginnend bei jedem existierenden Wurzelelement zugewiesen
mulierter Regeln zu einer Verbesserung der Sensitivität, üblicherweise verbunden mit
einer Abnahme der Präzision, führen (Precision-Sensitivity-Trade-off). Erste Messungen
der Performance unter Verwendung eines wahrscheinlichkeitsbasierten Klassifikators, wie
Naive Bayes, und eines ähnlichkeitsbasierten Klassifikators, wie k-Nearest Neighbour
oder TF-IDF, zeigen, dass die Performance bis zu 100 % Präzision bei bis zu 93,58 % Sensitivität, bei der Anwendung auf einen durch die örtliche Staatsanwaltschaft zur Verfügung
gestellten Korpus aus einem Fall von Wirtschaftskriminalität, erreicht. Die überraschend
hohe Güte des implementierten Algorithmus hängt von der konkret betrachteten Kategorie
ab und könnten die Folge einer Überanpassung des Klassifikators (Overfitting), verursacht durch einen zu homogenen zugrunde liegenden Korpus, sein. Es konnte beobachtet
6
Textforensik
185
Abb. 6.8 Bootstrappingalgorithmus zur Kategorisierung forensischer Texte. Von den Texten Tnew
wird ein Set von Seeddokumenten für jede Kategorie unter Verwendung der in der Taxonomie
festgelegten Regeln zusammengestellt. Dieses Set Tcat wird zum Training eines ersten schwachen
binären Klassifikators für jede Kategorie verwendet. Anschließend wird dieser Klassifikator genutzt, um die verbleibenden Texte Tremain zu klassifizieren und die neu gelabelten Dokumente Tmore
den vorher klassifizierten Tcat hinzuzufügen. Abschließend wird der Klassifikator weiter verbessert,
indem er wiederholt auf dem klassifizierten Datenbestand Tcat trainiert wird. Dieser Zyklus wird
solange fortgesetzt, bis keine weiteren Dokumente zum klassifizieren übrig sind oder keine weitere
Verbesserung möglich ist
werden, dass die Dokumente im betrachteten Korpus von beträchtlicher Homogenität bezüglich ihres Inhalts und ihrer Struktur sind. Das überrascht wenig, da es in der Natur der
Dokumente aus Wirtschaftsdelikten (z. B. Rechnungen) liegt, strukturell und inhaltlich
sehr ähnlich aufgebaut zu sein. Deshalb ist die Erarbeitung eines geeigneteren Korpus
unter Einbeziehung der zuständigen Staatsanwaltschaften und bestenfalls die Definition eines Goldstandards notwendig. In Ermangelung eines zusätzlichen Real-Life-Corpus
wurde eine Crossvalidierung der Ergebnisse auf einer Teilmenge des 20-NewsgroupsCorpus [3], bestehend aus den Kategorien med und space, durchgeführt. In Abhängigkeit
von den gewählten Startregeln konnte in Tests eine Sensitivität zwischen 87,6 und 92,4 %
bei einer Präzision zwischen 52,3 und 100 % .F1 D 66;79 % 93;39 %/ erreicht werden.
Dieses Ergebnis bestätigt die starke Abhängigkeit von den verwendeten Regeln. Einer
der größten Stärken dieses kombinierten Ansatzes liegt in der „einstellbaren“ Präzision
in Abhängigkeit einer intelligenten Kombination von Regeln und Maschinenlernalgorithmen.
186
M. Spranger und D. Labudde
6.7 Forensische Kurznachrichtenanalyse
6.7.1
Einleitung
Im Vergleich zu Texten aus Wissenschaft, Industrie oder Medizin gibt es nur relativ wenige Arbeiten, die sich mit der Analyse von Kurznachrichten befassen. Die meisten von
ihnen befassen sich mit der Spamdetektion. Diese Aufgabenstellung ähnelt in vielerlei Hinsicht der hier untersuchten Aufgabe, handelt es sich doch in beiden Fällen um
Probleme der binären Klassifikation. Bereits 2011 stellen Patel et al. [9] hierfür einen
theoretischen Ansatz basierend auf künstlichen neuronalen Netzen vor. Xu et al. [32] präsentierten 2012 einen Ansatz, der auf die Extraktion und Klassifikation von Spam auf
Basis von Metadaten abstellt. Obwohl diese Methode gute Ergebnisse erzielt, scheint die
Übertragbarkeit dieser Methodik in den Bereich der Forensik nur sehr eingeschränkt möglich zu sein, da in den meisten Fällen eher der Inhalt einer Nachricht von Interesse sein
dürfte und Metadaten eher zu deren Einordnung in den Gesamtzusammenhang dienen.
Skudlark [26] untersuchte 2014 in einer großangelegten Studie verschiedene Ansätze der
Spamklassifikation, verlässt sich dabei jedoch auf das Vorhandensein von URLs, was, aus
Sicht des Autors, den Anwendungsbereich im Kontext der Forensik auf wenige Fälle von
Betrug, Computersabotage oder ähnliche Delikte beschränkt. Ahmed et al. [4] stellten
2014 einen weiteren Ansatz vor, der den Beschränkungen der vorher genannten abhilft.
Dieser basiert auf einer Kombination aus Naive Bayes und Apriori-Algorithmus und nutzt
Worthäufigkeiten als Features. Besonders häufig gemeinsam in Spam auftretende Wörter
werden dabei als ein Wort betrachtet. Dieser Ansatz zeigt sehr gute Ergebnisse, berücksichtigt aber die speziellen Charakteristiken von inkriminierten Kurznachrichten nicht.
Im Bereich der Mehrklassenklassifikation präsentieren Al-Talib et al. [5] 2013 eine
Technik auf Grundlage einer verbesserten TF-IDF-Gewichtung. Auch dieser Ansatz stellt
auf die Verwendung „wohlgeformter“ SMS ab und berücksichtigt die Eigenschaften forensischer Kurznachrichten nicht.
Einen weiteren interessanten Ansatz zeigt Ishihara [18] bereits 2011. In seiner Arbeit stellt er einen n-gram-basierten Ansatz vor, um Kurznachrichten nach ihrem Autor
mithilfe der Likelihood-Ratio zu klassifizieren. Das Modell wurde anhand des englischsprachigen NUS SMS-Korpus [7] trainiert und evaluiert. Ein vergleichbarer Korpus für
die deutsche Sprache existiert leider bis heute nicht. Es ist generell ein Problem, einen
solchen Korpus im Bereich forensischer Texte zu etablieren. Die hierfür benötigten Datensätze sind aufgrund datenschutzrechtlicher Bestimmungen selten verfügbar. Insbesondere
müsste jeder Datensatz explizit von der jeweiligen hoheitlichen Instanz für Forschungszwecke zur Verfügung gestellt werden. Das ist auch der Grund, warum Ishihara trotz der
Forschung an einem forensischen Anwendungsfall mit neutralen Daten arbeiten muss. Die
Anwendbarkeit eines solchen Klassifikators im Kontext realer forensischer Arbeit bleibt
aus diesen Gründen zumindest fragwürdig.
6
Textforensik
6.7.2
187
Charakteristik inkriminierter Kurznachrichten
Bevor man sich näher mit der Analyse inkriminierter Kurznachrichten beschäftigt, müssen
die strukturellen und inhaltlichen Besonderheiten dieser Art der Kommunikation herausgearbeitet werden. Gegenstand der durch die Autoren an der Hochschule Mittweida
durchgeführten Studien war ein Korpus, der zwei abgeschlossenen Fällen von Drogenkriminalität entstammte. Diese wurden im Rahmen einer Kooperationsvereinbarung mit den
örtlichen Strafverfolgungsbehörden für Studienzwecke zur Verfügung gestellt. Wie bei
anderen forensischen Texten existiert auch hier kein sogenannter Goldstandard7 für die
Evaluierung von Werkzeugen zur Analyse deutscher Texte. Die Gründe hierfür sind vielfältig, dürften aber vor allem in den starken datenschutzrechtlichen Bedenken zu finden
sein. Einer Veröffentlichung der im Rahmen dieser Studie aufbereiteten Daten, selbst in
anonymisierter Form, als Grundlage zur Erarbeitung eines Goldstandards, wurde bislang
nicht zugestimmt.
Inkriminierte Kurznachrichten besitzen eine Reihe von Eigenschaften, die sie von den
üblicherweise in der Wissenschaft untersuchten Texten unterscheiden und die Anwendung etablierter Werkzeuge der automatisierten Textanalyse scheitern lassen. So fehlen
forensischen Kurznachrichten in der Regel korrekte grammatikalische Strukturen, und sie
weisen, neben unregelmäßig fehlendem Kontext, einen hohen Grad an Tippfehlern und
syntaktischen Fehlern auf. Das verwendete Vokabular orientiert sich kaum an Sprachkonventionen und ist geprägt durch Deliktart sowie Bildungsstand und das soziale Umfeld
des Schreibers. Weitere Problemfelder in diesem Zusammenhang stellen Fehler durch die
Autokorrekturfunktion und die Verwendung atypischer Emoticons und Abkürzungen dar.
Hinzu kommen emotional intendiert zusätzlich eingefügte Zeichen. So werden oft gezielt
nichtdeterminierte Anzahlen zusätzlicher Vokale in Wörter eingefügt, um bestimmte Gefühlslagen auszudrücken (z. B. „Haaaallo“, „seeehr“). Geschriebene Effekte sprachökonomisch bedingter Erosionseffekte (z. B. Apokope) verursachen weitere Schwierigkeiten
bei der automatischen Analyse derartiger Texte, vor allem im Zusammenhang mit der Nutzung von digitalen Wörterbüchern. Die nachfolgend aufgeführten Beispiele verdeutlichen
die diskutierte Problematik:
„aber was ich mein[e] is[t] wir müss[e]n wenn wir weihnacht[e]n gefeiert hab[e]n
übelst money hab[e]n“
„Beruhig[e] dich ich zieh[e] denn das nächste ma[l] rich[tig] fette ab! :))))))“
„Ich schreib jetzt wegen dir hab ich mein 12g nicht bekommen Weil Du ne aus[
de]m knick gekommen bist XD“
7
Der Begriff „Goldstandard“ bezeichnet hier einen standardisierten Echtdatenkorpus, von Experten
manuell annotiert, als Basis für eine einheitliche Evaluationsgrundlage für neue forensische Werkzeuge zur Kurznachrichtenanalyse.
188
M. Spranger und D. Labudde
Fehlende Zeichen wurden in eckige Klammern gesetzt, zusätzlich eingefügte Zeichen
mittels Durchstreichung und Slang mittels Fettdruck gekennzeichnet. Eine besondere Herausforderung stellen daneben nichtstandardisierte Sprachen dar. Als Beispiel wären hier
vor allem geschriebene Formen von Dialekten und die Verwendung von gruppenspezifischem Vokabular zu nennen. Sehr häufig anzutreffen ist diese Form der Kommunikation,
im Zusammenhang mit der Verwendung sogenannter versteckter Semantik, vor allem im
Drogenmilieu. Der Begriff „versteckte Semantik“ verweist dabei auf eine Art steganografischer Codes. Derartige Begriffe werden üblicherweise in ihrer unverdächtigen Form
genutzt, um den tatsächlichen semantischen Hintergrund, der nur einem engen Kreis von
Eingeweihten bekannt ist, zu verschleiern. Zum Beispiel erscheint die Frage „Bringst du
ein Wernesgrüner mit?“ unverdächtig, da der Begriff “Wernesgrüner“ als Biermarke bekannt ist. Im eigentlichen Kontext eines Drogendeliktes bedeutet dieser Begriff jedoch
Marihuana. Zu beachten wäre, dass in diesem Beispiel absichtlich kein Dialekt verwendet
wurde, um Missverständnisse zu vermeiden. Üblicherweise sind jedoch Begriffe aus Dialekten in derartige Kommunikation eingeflochten. Die hier dargestellten Charakteristiken
machen es selbst für Kriminalisten oder Linguisten mit jahrelanger Erfahrung schwierig,
die tatsächliche Bedeutung forensischer Kurznachrichten zu entschlüsseln. Wenn man sich
klarmacht, dass jede Information, die nicht gefunden wird, von großer Bedeutung für den
Beweis der Schuld oder Unschuld eines Verdächtigen sein kann, folgt zwingend, dass
Entscheidungen zum Wert einer Kurznachricht nicht allein durch eine Maschine getroffen
werden können.
6.7.3 Eine neue Methode zur Klassifikation forensischer
Kurznachrichten
Aus den vorgestellten Charakteristiken folgt aus Sicht der Autoren, dass eine vollautomatisierte Lösung mit aktuell verfügbaren Werkzeugen nur schwer oder gar nicht realisierbar
ist. In [27, 28] wurde mit MoNA (Mobile Network Analyzer) ein alternativer Lösungsansatz vorstellt, der den Aufwand für die manuelle Analyse und Entscheidung über die
Beweiserheblichkeit einzelner Textpassagen erheblich verringert, indem der Suchraum
drastisch eingeschränkt wird.
Der traditionelle Weg der Analyse forensischer Textnachrichten ist beispielhaft in
Abb. 6.9 dargestellt und umfasst die folgenden Schritte:
1. Physikalische Datensicherung, beispielsweise unter Nutzung des „UFED – Physical
Analyzer“ der amerikanischen Firma Cellebrite.
2. Lesen und Bewerten der gesamten textuellen Inhalte durch einen Ermittlungsbeamten
unter Einbeziehung aller extrahierten Metadaten:
(a) vollständig,
(b) partiell, unter Verwendung einer Volltextsuche.
6
Textforensik
189
Abb. 6.9 Traditioneller Weg der Analyse von forensischen Kurznachrichten
Abb. 6.10 Schematischer Ablauf des Vorgehens von MoNA bei der Analyse forensischer Kurznachrichten
Das durch die Autoren entwickelte forensische Analysewerkzeug für Kurznachrichten
MoNA (Mobile Network Analyzer) fügt diesem Prozess weitere Schritte hinzu:
1.
2.
3.
4.
5.
Physikalische Datensicherung und Export als Excel-Workbook oder XML-Datei,
Einlesen der exportierten Datei in MoNA,
Zusammenfassung einzelner Nachrichten zu zusammenhängenden Gesprächen,
Bewertung jedes Gesprächs hinsichtlich seiner Fallrelevanz,
Visualisierung des Kontaktnetzwerkes unter Markierung von Kontakten, die verfahrensrelevante Nachrichten ausgetauscht haben,
6. Lesen und Bewerten des reduzierten Suchraums (der Nachrichteninhalte der markierten Gespräche einzelner Kontakte in Abhängigkeit ihrer Relevanz).
Abb. 6.10 zeigt beispielhaft den aus Abb. 6.9 bekannten Ablauf der forensischen Kurznachrichtenanalyse unter Einsatz des von den Autoren entwickelten Werkzeugs. Ziel dieser Entwicklung ist es, den manuellen Aufwand so stark zu verkürzen, dass diese Art der
Analyse zum Standardvorgehen in geeigneten Fällen wird und die monotone manuelle Tätigkeit ablöst. Natürlich werden nicht in jedem Fall Reduzierungen des Leseaufwands um
den Faktor 80 erreicht, wie in diesem illustrativen Beispiel. Die Effektivität der verwendeten Algorithmen hängt stark von der Qualität der verwendeten Fachwörterbücher ab,
wie noch gezeigt werden wird. Eine Reduzierung des Suchraumes ist aber in jedem Fall
gewährleistet und führt zwangsläufig zu einer drastischen Zeitersparnis bei der Analyse.
190
6.7.4
M. Spranger und D. Labudde
Detektion zusammenhängender Konversation
Aufgrund der bereits in Abschn. 6.7.2 diskutierten Charakteristiken forensischer Kurznachrichten können wir nicht sicherstellen, dass ein menschlicher Gutachter und erst recht
ein Algorithmus alle verfahrensrelevanten Nachrichten korrekt klassifiziert. Die Wahrscheinlichkeit einer korrekten Klassifikation kann jedoch erhöht werden, indem nicht
Einzelnachrichten, sondern ganze zusammenhängende Konversationen klassifiziert werden. Als positiver Nebeneffekt bleibt dabei der Kontext der Nachricht nach der Filterung
erhalten, was das Verständnis bei der zwingend durchzuführenden manuellen Prüfung der
Klassifikationsergebnisse erleichtert. Folglich ist eine automatisierte Methode zur Identifikation einzelner Konversationen in Nachrichtenverläufen erstrebenswert. In diesem
Abschnitt soll ein statistischer Ansatz zur Lösung dieses Problems vorgeschlagen werden. Als Konversation bezeichnen wir eine beliebige Menge an zeitlich und semantisch
kohärenten Nachrichten zwischen mindestens zwei Personen. Formal ausgedrückt sei M
die Menge aller Nachrichten, wobei m 2 M einer beliebigen Nachricht in M entspricht.
Weiterhin sei M D fm0 ; : : : ; mn g chronologisch geordnet, wodurch ein temporaler Zusammenhang zwischen den protokollierten Nachrichten existiert. So kann der zeitliche
Verlauf des Austausches zwischen den Konversationsteilnehmern nachvollzogen werden.
Außerdem können Antwortzeiten (die vergangene Zeit zwischen zwei aufeinanderfolgenden Nachrichten mi und mi C1 , abgeleitet werden. Die hier präsentierte Strategie basiert
ausschließlich auf abgeleiteten Antwortzeiten und folgt der einfachen Hypothese: Je länger die Antwortzeit zwischen zwei Nachrichten mi und mi C1 ist, desto geringer ist die
Wahrscheinlichkeit, dass beide Nachrichten zur gleichen Konversation gehören. Ausgehend von dieser Hypothese führen folgende Denkansätze schrittweise zu einer Problemlösung:
1. Antwortzeiten folgen einer statistischen Verteilung (Häufigkeitsverteilung). Dabei sind
kurze Antwortzeiten häufiger beobachtbar als lange Antwortzeiten.
2. Da der vorliegende Datensatz und somit die Menge an Antwortzeiten hinreichend groß
ist, kann, ausgehend von der beobachteten Häufigkeitsverteilung, eine Wahrscheinlichkeitsverteilung und folglich eine Wahrscheinlichkeitsdichtefunktion empirisch geschätzt werden.
3. Ist eine beliebige Antwortzeit t gegeben, kann mithilfe der Dichtefunktion die relative
Anzahl der Antwortzeiten t geschätzt werden.
4. Für die Problemlösung ist allerdings die Umkehrung des Sachverhalts interessant. Die
nun lösbare, umgekehrte Fragestellung lautet demnach: Für welches t sind p Antwortzeiten t beobachtbar?
5. Wird p hinreichend klein gewählt (p D 0;05 ist eine in der Statistik übliche Vernachlässigbarkeitsschwelle), kann nun eine kritische Antwortzeit t bestimmt werden, ab der
zu erwarten ist, dass 95 % (1 p) aller Nachrichten zu diesem Zeitpunkt beantwortet
sind. Der übrige Anteil von 5 % sei gemäß p vernachlässigbar.
6
Textforensik
191
Abb. 6.11 Histogramm der Antwortzeiten des untersuchten Datensatzes
6. Überschreitet die Antwortzeit zwischen zwei Nachrichten mi und mi C1 die abgeleitete kritische Antwortzeit, ist die Wahrscheinlichkeit, dass beide Nachrichten zu einer
Konversation gehören, als gering anzunehmen. Es ist folglich davon auszugehen, dass
beide Nachrichten nicht zur gleichen Konversation gehören.
7. M kann nun anhand einzelner Antwortzeiten in unterschiedliche Konversationen zerlegt werden.
Zur näheren Erläuterung der aufgeführten Schritte sind weitere Formalismen nötig. Sei
dt D tmi C1 tmi die Antwortzeit zwischen zwei aufeinanderfolgenden Nachrichten zweier
Gesprächsteilnehmer. Dann ist T die Menge aller Antwortzeiten, die in einem Intervall
.t1 ; t2 liegen. Es gilt T D fıtjt1 < ıt t2 g. Die Auftragung aller Häufigkeiten hi D
k Ti k über die Zeit entspricht einer Häufigkeitsverteilung. Diese ist als Histogramm in
Abb. 6.11 dargestellt. Häufigkeiten wurden hierbei anhand des betrachteten Datensatzes
berechnet. Die Intervallbreite betrug hier 5 Sekunden. In Abb. 6.11 ist zu erkennen, dass
die Häufigkeitsverteilung dem exponentiellen Zerfall e t folgt.
Kurze Antwortzeiten sind somit häufiger beobachtbar. Ein kausaler Zusammenhang
zwischen beobachteter Verteilung und Antwortzeit lässt sich durch die Antwortbereit-
192
M. Spranger und D. Labudde
schaft zweier Gesprächsteilnehmer erklären. Diese Antwortbereitschaft ist allerdings nicht
konstant, sondern verändert sich über die Zeit kontinuierlich. Das folgende Gedankenexperiment illustriert das zeitliche Verhalten der Antwortbereitschaft. Sei t die Zeit, die seit
Empfang der letzten Nachricht vergangen ist. Der Empfänger der letzten Nachricht hat auf
diese noch nicht geantwortet. Er besitzt eine Antwortbereitschaft B t . Dabei ist zu beachten, dass B t einer Summe etlicher menschlicher Faktoren entspricht, z. B. spielen für diese
Bereitschaft die Dauer des Gesprächs und bereits besprochene Inhalte eine Rolle. Wie verändert sich nun die Antwortbereitschaft über die Zeit? Man stelle sich hierfür die Frage:
Wenn der Empfänger bis zum Zeitpunkt t keinen Grund gesehen hat, auf die letzte Nachricht zu antworten, wieso sollte zu einem späteren Zeitpunkt t C dt seine Bereitschaft,
die Konversation fortzuführen, steigen? Diese Bereitschaft sei B t Cdt . Auch wenn zahlreiche menschliche Faktoren eine exakte Beantwortung dieser Frage unmöglich machen, so
ist die tendenzielle Aussage B t > B t Cdt plausibel. Die Antwortbereitschaft sinkt somit
tendenziell. Hier kann postuliert werden, dass eine konstante Reduktionsrate r die Verringerung von B in Abhängigkeit der vergangenen Zeit seit Empfang der letzten Nachricht
beschreibt (Gl. 6.5):
dB
D rB:
(6.5)
dt
Das heißt, je mehr Zeit seit dem Erhalt einer Nachricht vergangen ist, desto geringer ist
die Wahrscheinlichkeit, dass noch eine Antwort gesendet werden wird. Die Lösung dieser
Differentialgleichung ist durch Gl. 6.6 gegeben:
B t D B0 ert :
(6.6)
Aus diesen Betrachtungen ergibt sich somit die Antwortbereitschaft zu einem bestimmten
Zeitpunkt B t in Abhängigkeit der Anfangsbereitschaft B0 und konstanter Reduktionsrate
r. Dieser Aspekt beschreibt den in Abb. 6.11 erkennbaren exponentiellen Zusammenhang. Zudem kann die letzte Gleichung als Wahrscheinlichkeitsdichtefunktion verstanden
werden. Hierfür gilt, dass sich die Antwortbereitschaft anhand der Antwortzeithäufigkeit
schätzen lässt, wodurch B T D h T gilt. Eine Anpassung der Parameter B0 und r an
beobachtete Werte führt zu einer spezifischen Dichtefunktion. Optimale Parameter lassen
sich anhand des Regressionsfehlers bestimmen (Gl. 6.7):
fropt ; Bopt g D argmin
r;B0
X
jB tcalc B tobs j:
(6.7)
t
Anhand der somit genäherten Wahrscheinlichkeitsdichtefunktion kann die Zeit tp berechnet werden, ab der die Wahrscheinlichkeit, auf eine Nachricht eine Antwort zur erhalten,
hinreichend gering ist. Ist diese Zeit tp überschritten, gilt die Konversation als beendet.
Diese Wahrscheinlichkeit ist als hinreichend klein anzunehmen und sei im Folgenden p
genannt. In dieser Untersuchung ist p D 0;05. Der Zeitpunkt tp lässt sich durch einfach
Integration der genäherten Wahrscheinlichkeitsdichtefunktion und entsprechendes Umfor-
6
Textforensik
193
men, wie in Gl. 6.8 gezeigt, lösen:
Ztp
F .B/ D
B0 ert dt D 1 p:
(6.8)
0
Abb. 6.12a zeigt das Ergebnis der durchgeführten Regression. Die rote Linie zeigt die
Regressionskurve (äquivalent zur Wahrscheinlichkeitsdichtefunktion), die blaue Linie illustriert den Zeitpunkt tp , ab dem die Wahrscheinlichkeit, auf eine versendete Nachricht
eine Antwort zu erhalten, kleiner p ist (hier ist p D 0;05). Zeiten größer tp sind durch
den grauen Bereich hervorgehoben. Um sicherzustellen, dass durch diesen Ansatz keine
Zusammenhänge in verfahrensrelevanten Bereichen zerstört werden, wurden die Antwortzeiten der manuell als relevant markierten Nachrichten des Datensatzes in einem Histogramm (Abb. 6.12b) dargestellt. Wie deutlich zu erkennen ist, überschreitet die gefundene
Antwortzeitgrenze nur eine Nachricht. Bei dieser Nachricht handelt es sich jedoch um
einen Solitär, d. h. eine einzelne unbeantwortete Nachricht ohne kontextuelle Bezüge.
6.7.5 Bewertung von Konversationen
Hat man die Menge von Konversationen C D c1 ; : : : ; cn bestimmt, besteht der nächste Schritt darin, herauszufinden, welche dieser Konversationen deliktbezogen relevante
Nachrichten hinsichtlich des Untersuchungsauftrages beinhalten. Unter Berücksichtigung
der Erkenntnis, dass diese Entscheidung im Wesentlichen auf Erfahrungswissen beruht,
wurde bei der Entwicklung von MoNA ein wissensbasierter Ansatz zugrunde gelegt.
Im Wesentlichen wird, mithilfe eines sogenanntes Bag-of-Words-Modells, kombiniert
mit einem domänenspezifischen Wörterbuch d , jeder Konversation ein Wert für deren
deliktbezogene Relevanz zugeordnet. Dieser Relevanzwert S wird – im einfachsten Fall
in Abhängigkeit von der Frequenz der auftauchenden domänenspezifischen Begriffe –,
wie in Gl. 6.9 dargestellt, berechnet:
Si D bag.ci ; d /; 8c 2 C:
(6.9)
Die berechneten Relevanzwerte bilden die Basis für das Einfärben des extrahierten Personennetzwerkes, das vorher aus dem Datensatz extrahiert wurde. Abb. 6.13 zeigt schematisch den gesamten Workflow zur Analyse der forensischen Kurznachrichten. Es ist leicht
einzusehen, dass der limitierende Faktor ein adäquates Wörterbuch ist. Ein Wörterbuch,
welches insbesondere lokale und fachspezifische Sprachbesonderheiten berücksichtigt.
Derartige Wörterbücher sind derzeit zumindest für den deutschsprachigen Raum nicht
verfügbar. Deshalb muss ein geeignetes Wörterbuch für jeden Deliktbereich und jeden
lokalen kulturellen Kreis erzeugt werden, bevor wir beginnen können, die Relevanzwerte
einer Konversation zu berechnen. Dieser Schritt entspricht dem Aufbau einer auf Erfahrung basierenden Wissensbasis und ist nach Auffassung der Autoren unverzichtbar. Auch
194
M. Spranger und D. Labudde
Abb. 6.12 a Histogramm der Antwortzeiten mit für den betrachteten Datensatz optimierter Reduktionsrate und anfänglicher Antwortbereitschaft. b Histogramm der Antwortzeiten der deliktbezogen
relevanten Nachrichten
6
Textforensik
195
Abb. 6.13 Workflow der Kurznachrichtenanalyse. Aus den Rohdaten r, exportiert aus dem Physical
Analyzer, werden alle Nachrichten zu Konversationen C zusammengefasst. Diesen Konversationen wird dann mithilfe eines Bag-of-Words-Modells und eines auf Ermittlererfahrung beruhenden
Wörterbuchs d ein Relevanzwert S zugeordnet. Dieser bildet die Grundlage für die Einfärbung
fallrelevanter Kontakte im aus r extrahierten Kontaktnetzwerk
wenn diese Datenbasis nur einmal grundlegend erzeugt werden muss, ist die Pflege und
Weiterentwicklung korrespondierend zur Entwicklung der lokalen Sprachgegebenheiten
und der aktuellen Entwicklungen im jeweiligen Deliktsbereich ausschlaggebend für den
erfolgreichen Einsatz der Software.
6.7.6
Erzeugung eines Wörterbuches
Für die Erzeugung eines geeigneten Wörterbuchs wurden deliktbezogen relevante Kurznachrichten (Untersuchungsdatensatz) unverdächtigen Kurznachrichten (Referenzdatensatz) gegenübergestellt. Im Ergebnis dieser sogenannten Diskriminanzanalyse kann jedes
Wort einer von vier Kategorien zugeordnet werden:
1. Kommt ein Wort nur im Untersuchungsdatensatz vor, handelt es sich um ein Fachwort.
2. Kommt ein Wort relativ häufiger im Untersuchungsdatensatz vor, handelt es sich mit
hoher Wahrscheinlichkeit um ein Fachwort.
3. Kommt ein Wort relativ häufiger im Referenzdatensatz vor, handelt es sich mit hoher
Wahrscheinlichkeit um kein Fachwort.
4. Kommt ein Wort nur im Referenzdatensatz vor, handelt es sich um kein Fachwort.
196
M. Spranger und D. Labudde
Angewendet auf unseren Untersuchungsdatensatz fanden wir 882 „verdächtige Begriffe“,
mit denen wir 98,5 % der als verfahrensrelevant markierten Nachrichten finden konnten.
Bei näherer Begutachtung der Trefferverteilung musste jedoch festgestellt werden, dass
die meisten Treffer einzigartig waren und damit für die Generalisierung ungeeignet. Der
Grund hierfür ist in den einzigartigen Schreibweisen, geprägt von den beschriebenen Charakteristika forensischer Kurznachrichten, zu finden. Trotzdem bildeten diese Begriffe die
Basis der weiteren Arbeit an einem geeigneten Wörterbuch. Die Ergebnisse wurden manuell aussortiert, bereinigt und mit Erfahrungswissen von Fachermittlern angereichert. Ein
spezieller Algorithmus formt dann aus diesem Rohwörterbuch allgemeinere Muster, um
einen großen Bereich von Schreibvarianten abzudecken.
Literatur
1. Topic maps, information technology, document description and processing languages (2002)
2. Polizeiliche
Kriminalstatistik
2012:
Bundesrepublik
Deutschland.
bka.de/SharedDocs/Downloads/DE/Publikationen/PolizeilicheKriminalstatistik/
2012/pks2012ImkKurzbericht,templateId=raw,property=publicationFile.pdf//
pks2012ImkKurzbericht.pdf (2013)
http://www.
3. 20 Newsgroups: http://qwone.com/~jason/20Newsgroups/ (2014). Zugegriffen: 6.1.2014
4. Ahmed, I., Guan, D., Chung, T.C.: SMS Classification Based on Naïve Bayes Classifier and
Apriori Algorithm Frequent Itemset. International Journal of Machine Learning and Computing
4(2), 183–187 (2014)
5. Al-Talib, D.G.A., Hassan, H.S.: A Study on Analysis of SMS Classification Using TF-IDF
Weighting. International Journal of Computer Networks and Communications Security 1(5),
189–194 (2013)
6. Beebe, N.L., Clark, J.G.: Digital forensic text string searching: Improving information retrieval
effectiveness by thematically clustering search results. Digital Investigation 4 (2007)
7. Chen, T., Kan, M.Y.: Creating a live, public short message service corpus: the NUS SMS corpus.
Language Resources and Evaluation 47(2), 299–335 (2013)
8. Cowie, J., Wilks, Y.: Information extraction. In: Dale, H.M.R., Somers, H. (Hrgs.) Handbook of
Natural Language Processing. New York: Marcel Dekker (2000)
9. Deepshikha Patel, M.B.: Mobile SMS Classification: An Application of Text Classification.
International Journal of Soft Computing and Engineering 1(1), 47–49 (2011)
10. Dengel, A. (Hrsg.): Semantische Technologien, 1. Aufl. Spektrum Akademischer Verlag (2012)
11. Ebbinghaus, H.: Über das Gedächtnis: Untersuchungen zur experimentellen Psychologie. Wiss.
Buchges. Darmstadt (1992)
12. Embley, D.W.: Toward semantic understanding: an approach based on information extraction
ontologies. In: Proceedings of the 15th Australasian database conference – Volume 27, ADC
’04, S. 3–12. Australian Computer Society, Inc., Darlinghurst, Australia, Australia (2004)
13. Fobbe, E.: Forensische Linguistik. Narr Francke Attempto Verlag Tübingen (2011)
14. Greuel, L., Offe, S., Fabian, A., P.Wetzels, Fabian, T., Offe, H., M.Stadler: Glaubhaftigkeit
der Zeugenaussage: Theorie und Praxis der forensisch-psychologischen Begutachtung. Beltz,
Psychologie Verlags Union (1998)
Literatur
197
15. Gruber, T.R.: Toward principles for the design of ontologies used for knowledge sharing. In:
Guarino, N., Poli, R. (Hrsg.) Formal Ontology in Conceptual Analysis and Knowledge Representation, Kluwer Academic Publishers (1993)
16. Huang, R., Riloff, E.: Peeling back the layers: detecting event role fillers in secondary contexts.
In: Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics:
Human Language Technologies – Volume 1, HLT ’11, S. 1137–1147. Association for Computational Linguistics, Stroudsburg, PA, USA (2011)
17. Ikonomakis, M., Kotsiantis, S., Tampakas, V.: Text Classification Using Machine Learning
Techniques. WSEAS Transactions on Computers 4(8), 966–974 (2005)
18. Ishihara, S.: A Forensic Authorship Classification in SMS Messages: A Likelihood Ratio Based
Approach Using N-gram. In: Proceedings of the Australasian Language Technology Association Workshop 2011, S. 47–56. Canberra, Australia (2011) http://www.aclweb.org/anthology/U/
U11/U11-1008
19. Kozareva, Z.: Bootstrapping named entity recognition with automatically generated gazetteer
lists. In: Proceedings of the Eleventh Conference of the European Chapter of the Association
for Computational Linguistics: Student Research Workshop, EACL ’06, S. 15–21. Association
for Computational Linguistics, Stroudsburg, PA, USA (2006)
20. Maedche, A., Neumann, G., Staab, S.: Bootstrapping an ontology-based information extraction
system. Studies In Fuzziness And Soft Computing 111, 345–362 (2003)
21. Maicher, L.: The impact of semantic handshakes. In: Proceedings of the 2nd international conference on Topic maps research and applications, TMRA ’06, S. 140–151. Springer-Verlag,
Berlin, Heidelberg (2007)
22. Mikheev, A., Moens, M., Grover, C.: Named entity recognition without gazetteers. In: Proceedings of the ninth conference on European chapter of the Association for Computational
Linguistics, EACL ’99, S. 1–8. Association for Computational Linguistics, Stroudsburg, PA,
USA (1999)
23. Novak, J.D., Gowin, D.B.: Learning how to learn. Cambridge University Press (1984)
24. Riloff, E., Lehnert, W.: Information Extraction as a Basis for High-Precision Text Classification.
Transactions on Information Systems 12(3), 296–333 (1994)
25. Russell, S., Norvig, P.: Künstliche Intelligenz: Ein moderner Ansatz, 3. Aufl. Paearson Deutschland (2012)
26. Skudlark, A.: Characterizing SMS Spam in a Large Cellular Network via Mining Victim
Spam Reports. Tech. rep., International Telecommunications Society (ITS) Biennial Conference
(2014)
27. Spranger, M., Heinke, F., Appelt, L., Puders, M., Labudde, D.: MoNA: Automated Identification
of Evidence in Forensic Short Messages. International Journal On Advances in Security (2016)
28. Spranger, M., Labudde, D.: Semantic Tools for Forensics: Towards Finding Evidence in Short
Messages. In: The Fourth International Conference on Advances in Information Mining and
Management, S. 1–4. IARIA (2014)
29. Spranger, M., Schildbach, S., Heinke, F., Grunert, S., Labudde, D.: Semantic tools for forensics: A highly adaptable framework. In: Proc. 2nd. International Conference on Advances in
Information Management and Mining (IMMM), S. 27–31. IARIA, ThinkMind Library (2012)
30. Wang, J.Z., Du, Z., Payattakool, R., Philip, S.Y., Chen, C.: A new method to measure the semantic similarity of GO terms. Bioinformatics 23(10), S. 1274–1281 (2007)
198
M. Spranger und D. Labudde
31. Wimalasuriya, D.C., Dou, D.: Ontology-based information extraction: An introduction and a
survey of current approaches. Journal of Information Science 36(3), 306–323 (2010)
32. Xu, Q., Xiang, E.W., Yang, Q., Du, J., Zhong, J.: SMS Spam Detection Using Noncontent
Features. IEEE Intelligent Systems, S. 44–51 (2012)
33. Zhou, G., Su, J.: Named entity recognition using an hmm-based chunk tagger. In: Proceedings of
the 40th Annual Meeting on Association for Computational Linguistics, ACL ’02, S. 473–480.
Association for Computational Linguistics, Stroudsburg, PA, USA (2002)
7
Malware Forensics
Christian Hummert
7.1
Einleitung
Der Begriff des Computervirus taucht erstmals in der Kurzgeschichte „The Scarred Man“
von Gregory Benford aus dem Jahr 1970 auf. Die Geschichte erschien in dem Science
Fiction Magazin Venture Science Fiction [4]. Benford arbeitete von 1967 bis 1971 im
Lawrence Livermore Radiation Laboratory und soll dort 1969 die ersten gutartigen Computerviren für das Arpanet programmiert haben [5].
Weitere sehr frühe Computerviren waren 1983 der Fred Cohens Virus [14], im Jahr
1982 Rich Skrentas Elk Cloner [17] und zwischen 1981 und 1983 die Joe Dellingers Virii [2]. Erste Computerwürmer tauchten 1971 mit Creeper von Bob Thomas [11] und um
1980 mit den Xerox Worms von John F. Shoch und Jon A. Hupp auf [44]. Tatsächlich
war Malware in den 1980ern eher von akademischem Interesse. In den 1990ern hingegen entwickelte sich Malware zum Ausdruck einer Subkultur, auch wenn durch Malware
teilweise bereits erhebliche Schäden verursacht wurden. Schon durch den, vom späteren
MIT-Professor Robert Tappan Morris veröffentlichten, ersten Computerwurm, der sich
über das Internet verbreitete, den Morris-Wurm aus dem Jahr 1988, entstanden Kosten, die
von der US-Regierung später auf 96 Millionen US-Dollar geschätzt wurden [21]. Dennoch
bestand die Motivation, Malware zu programmieren, eher in dem vermeintlichen Gewinn
an Renommee innerhalb der Subkultur als im wirtschaftlichen Interesse.
Zwischen den Jahren 2000 und 2006 ergab sich ein großer Bruch. Die organisierte Kriminalität entdeckte die Computerkriminalität als neues Geschäftsfeld. Im Bundeslagebild
„Organisierte Kriminalität“ des deutschen Bundeskriminalamts aus dem Jahr 2005 taucht
der Begriff Computer noch garnicht auf. Im Jahr 2006 beschreibt das Bundeslagebild dann
C. Hummert ()
Inhaber des Lehrstuhls für IT-Sicherheit/Digitale Forensik, University of Applied Sciences
Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: hummert@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_7
199
200
C. Hummert
Abb. 7.1 Entwicklung des Verhältnisses zwischen Computerviren, Computerwürmern und Trojanern am Anteil der erkannten Malware insgesamt zwischen 2000 und 2006. (Quelle: [37])
bereits drei kriminelle Organisationen, die in Deutschland tätig sind und sich ausschließlich mit Computerkriminalität befassen.
Seit dem Jahr 2007 veröffentlicht das Bundeskriminalamt ein eigenes Bundeslagebild
Cybercrime. Die Schäden durch Computerkriminalität werden für das Jahr 2007 bereits
auf 31 Millionen Euro geschätzt. Eine Dunkelfelduntersuchung des Landeskriminalamts
Niedersachsen aus dem Jahr 2013 kommt zu dem Ergebnis, dass lediglich 9 % aller Delikte im Bereich Cybercrime angezeigt werden [8].
Im Zuge dieser Entwicklung sinkt der Anteil der technisch anspruchsvolleren Computerviren und Computerwürmer auf ein nahezu vernachlässigbares Niveau. Des Weiteren
gilt, dass Malware ohne eine ernsthafte Schadwirkung, also beispielsweise Viren, die sich
verbreiten und lediglich Nachrichten anzeigen, ebenso weit weniger häufig auftritt. An
ihre Stelle treten die deutlich einfacher zu entwickelnden Tojaner, die in der Regel einen
Payload mit einer Gewinnerziehlungsabsicht tragen (Abb. 7.1).
Aktuell tritt Malware praktisch nur für zwei Betriebssysteme auf. Im Bereich Personalcomputer betreffen 99,9 % der Bedrohungen Microsoft Windows [32]. Im Bereich
der mobilen Endgeräte ist die Verteilung ähnlich eindeutig. Im Jahr 2014 richteten sich
99,05 % aller Malware für mobile Devices gegen das Betriebssystem Android [29].
Hinter der Malware stecken fortan klare wirtschaftliche Interessen. Der verbreitetste
Typ Payload ist von nun an Spyware, für das Phishing von TANs für das Online-Banking.
Aber auch Ransomware und Bots mit der Möglichkeit Geld abzuschöpfen sind häufig.
7
Malware Forensics
201
7.2 Charakteristik – Einteilung von Malware
Die Einteilung von Malware in Klassen ist uneinheitlich und Gegenstand der wissenschaftlichen Auseinandersetzung. Nichtsdestotrotz wurde eine Reihe von Klassifikationsschemata vorgeschlagen. Aycock beispielweise nimmt eine Abgrenzung nach den Kategorien Self Replicating, also der Fähigkeit, sich selbst zu reproduzieren, Population Growth,
der Verbreitungsgeschwindigkeit, und Parasitic, also dem Parasitismus der Programme,
vor [2]. Der Autor nimmt hier eine eigene zweistufige Einordnung vor.
7.2.1
Verbreitung und Wirkung
Zunächst wird nach der Art und Weise der Verbreitung der Software eingeteilt. Hier sind
vier Arten zu unterscheiden:
Der Virus ist ein Computerprogramm, das sich selbsttätig reproduziert, indem es fremde Programme infiziert, diese werden dann Wirte genannt.Verbreitete Subtypen sind Linkviren, die andere Executables infizieren; Bootsektorviren, die den Bootsektor infizieren
sowie Skript- und Makroviren, die erst zur Laufzeit übersetzt werden.
Der Wurm ist ein Computerprogramm, das sich nach Ausführung selbsttätig verbreitet.
In Abgrenzung zum Virus verändert der Wurm keine fremden Dateien oder Bootsektoren.
Der Trojaner ist ein Computerprogramm, das als nützliche Anwendung getarnt ist, im
Hintergrund aber ohne Wissen des Anwenders eine andere Funktion erfüllt. In Abgrenzung zum Virus und zum Wurm verbreitet sich der Trojaner nicht selbsttätig.
Der Rabbit ist ein Spezialfall des Wurms. Es handelt sich um einen Wurm, der immer
nur eine Kopie weiterschickt und sich dann an der alten Position löscht. Eine einzige
Kopie des Rabbits „hüpft“ also durch das Netz. Rabbits sind sehr selten, und bislang rein
akademischer Natur.
In einem zweiten Schritt wird nun nach dem Payload, also nach der Wirkung des Programms, unterschieden, wobei auch Malware ohne einen bösartigen Payload denkbar ist.
Zum Beispiel haben viele frühere Computerviren einfach nur eine Nachricht ausgegeben.
Bei der Unterteilung nach der Wirkung sind deutlich mehr Klassen angebracht und auch
noch weitere Klassen denkbar:
Die Logic Bomb ist ein Computerprogramm, das bei Erfüllung einer bestimmten Bedingung zur Ausführung kommt und bis dahin funktionslos ist.
Die Backdoor ist ein Computerprogramm, das Benutzern ermöglicht, unter Umgehung der normalen Zugriffssicherung, Zugang zum Computer oder einer sonst geschützten
Funktion eines Computerprogramms zu erlangen. Insbesondere eine Rolle spielen Rootkits, die unberechtigt administrative Rechte gewähren, als Spezialfall der Backdoor. In der
Fachsprache wird auch der Terminus Rat für Remote Access Trojan verwendet.
Die Bacteria ist ein Computerprogramm, das extrem viele Kopien beziehungsweise
Instanzen von sich selbst startet, um Systemressourcen zu verbrauchen, wie Plattenplatz,
202
C. Hummert
Hauptspeicher oder Prozessorlast. Bacteria werden mitunter auch Rabbits genannt (nicht
eindeutig gegenüber dem Spezialfall des Wurms) oder in der Unix-Welt auch Fork-Bombs.
Die Spyware ist ein Computerprogramm, das die Daten eines Computernutzers ohne dessen Wissen oder Zustimmung an Dritte übermittelt. Insbesondere fallen BankingTrojaner, Password-Grabber und Keylogger in diese Kategorie. Da durch Spyware häufig
finanzielle Verluste entstehen und die Strafverfolgungsbehören eingeschaltet werden, bildet sie die häufigste Kategorie in der Malwareforensik.
Die Adware ist ein Computerprogramm, das die Daten eines Computernutzers ohne
dessen Wissen auswertet und dazu passende (oder unpassende) Werbung einblendet.
Die Ransomware ist ein Computerprogramm, das eine unerwünschte Zugriffs- oder
Nutzungsverhinderung von Daten oder des gesamten Computersystems erwirkt. Moderne
Ransomware setzt zu diesem Zweck häufig kryptografische Verfahren ein. Wegen des hohen Schadens wird Ransomware ebenfalls häufig angezeigt und bildet die zweithäufigste
Kategorie in der Malwareforensik.
Der Bot ist ein Computerprogramm, das den Computer zum Teil eines Netzwerks, dem
Botnet, macht und diesem unbemerkt Ressourcen zur Verfügung stellt. Botnetze dienen regelmäßig: als Proxys, zum Spamversand, zu DDoS-Attacken und DRDoS-Attacken, zum
Clickbaiting (Klickbetrug), zum Bitcoin Mining oder als Cloud.
Bei Hardware Damaging Malware handelt es sich um Computerprogramme, die die
Hardware von Computersystemen beschädigen. Solche sind sehr selten. Beispiele sind
das Löschen des BIOS, das Flashen von Firmwares oder Beschädigungen von Festplatten.
Aber zum Beispiel auch der bekannt gewordene Stuxnet-Wurm, der mehrere Zentrifugen
zur Urananreicherung im Iran beschädigt hat, fällt in diese Kategorie [19].
Ein Dropper ist ein Computerprogramm, das weitere Malware nachlädt und ausführt.
Weitere Malware Kategorien nach Payload sind denkbar und wahrscheinlich auch sinnvoll. Auf Smartphones wurde zuletzt beispielsweise vermehrt Malware festgestellt, die
SMS-Nachrichten an teure Premium-SMS-Dienste verschickt. Dieser Payload lässt sich
keiner der eben genannten Kategorien passgenau zuordnen. Auch bei Malware, die Bitcoins stiehlt [41] oder virtuelle Währungen aus Online-Spielen entwendet, bzw. gleich
ganze Spielaccounts übernimmt [13], lässt sich diskutieren, ob es sich hier noch um klassische Spyware handelt.
Eine Einteilung wird weiterhin durch die zunehmende Anzahl von Hybriden und Chimären erschwert, also Malware, die die verschiedenen Typen vermischt. Zum Beispiel
präsentierte Ken Thompson bereits im Jahr 1984 in seiner Dankesrede für den Turing
Award einen Compiler, der neben der Fähigkeit, C-Code zu compilieren: 1) In jedes übersetzte Projekt eine Backdoor integrierte, und 2) wenn er sich selbst übersetzte, einen
Compiler mit den gleichen Eigenschaften erzeugte [47]. Die Software ist also ein Trojaner, der sich wie ein Virus vermehrte und Backdoors integriert.
Bei der vorgeschlagenen Einteilung in zwei Schritten nach Verbreitungsweg und Payload ergeben sich so automatisch Hybriden es sei denn, es handelt sich um Malware ohne
Payload.
7
Malware Forensics
7.2.2
203
Innere Systematik
Wie bereits beschrieben, ergab sich zwischen den Jahren 2000 und 2006 ein Bruch im Bereich Malware. Es hatte ein Paradigmenwechsel hin zu einer großen Menge sehr ähnlicher
Malware Releases stattgefunden [22]. Dies erlaubte die Einteilung von Malware in Malwarefamilien und damit den Schluss von bekannter Malware auf unbekannte Malware.
Eine Entwicklung, die insbesondere die Tendenz zu Malwarefamilien stärkt, ist das
Aufkommen von Malware Buildern oder Malware-Generatoren [43]. Beispielsweise ist
der Zeus Trojaner eine Familie von Banking TANs stehlenden Trojanern, die im Jahr
2007 auftauchten. Zu Zeus wurden sogenannte Builder Kits im Untergrund vertrieben,
die es ermöglichten, ohne große Erfahrungen eigene Trojaner Varianten zu erzeugen [1].
Dies führte dazu, dass beständig neue Zeus-Varianten auftauchten. Laut dem Antivirenhersteller Kaspersky wuchs die Zahl neuer Varianten zwischen 2007 und 2009 beständig.
Der Höhepunkt wurde im Mai 2009 erreicht, als allein in diesem einen Monat über 5000
neue Varianten auftauchten [46].
7.3
Forensische Untersuchung von Malware
Im Strafverfahren ist es häufig notwendig, Malware zu analysieren. Ein Grund ist es
bei Malware, die Daten über Netzwerke übermittelt, den Empfänger der Daten festzustellen. Dies ist zum Beispiel bei Spyware relevant, die die gestohlenen Daten in einer
sogenannten Dropzone ablegt. Auch bei Botnetzen ist der Standort des Command-andControl-Servers von Interesse für die Strafverfolgung. Der Code von Malware wird häufig
untersucht, um Hinweise auf die Programmierer und damit auf die Urheber der Malware
zu erhalten.
Im Bereich der Antivirenhersteller ist Malwareanalyse vor allem deshalb von Interesse,
um Infection Vector und Payload der Malware zu verstehen und mit diesen Erkenntnissen
wirksame Gegenmaßnahmen zu entwickeln.
7.3.1 Belauschen von Malware
Einführend ein Exkurs über die erforderliche Geschwindingkeit, um durch das Belauschen
von Malware noch Informationen abgreifen zu können. Sogenannte Dropzones, in denen
Spyware die erbeuteten Daten ablegt, sind häufig sehr kurzlebig und werden nach wenigen
Tagen oder Stunden abgeschaltet. Command-and-Control-Server hingegen, die Botnetze
kontrollieren, sind häufig deutlich länger aktiv, oft sogar über Jahre.
Dropzones liegen häufig im entfernten Ausland, weil die Sicherheit vor Strafverfolgung
im Vordergrund steht. Command-and-Control-Server sind andererseits auf eine schnelle
Netzanbindung angewiesen und befinden sich häufig in Industrienationen.
204
C. Hummert
Abb. 7.2 Transparentes Belauschen eines infizierten PCs
mit einem Laptop mit zwei
Netzwerkadaptern als Brücke.
(Bildquellen: Icon PC: Autor: Edward Boatman, Lizenz:
CC BY 3.0 US, Icon Laptop:
Public Domain)
Der intuitive Gedanke zum Belauschen von Malware ist es sicherlich, einen Protocol
Analyzer wie Wireshark (Ethereal) auf den infizierten PC zu bringen und den Netzverkehr auf diese Art und Weise mitzuschneiden [36]. Dieses Verfahren bietet den Vorteil,
dass die Analyse in der tatsächlichen Tatumgebung stattfindet. Zudem ist das Verfahren
schnell und der Geschädigte muss den PC weder abgeben noch spiegeln lassen. Dennoch
bringt diese Vorgehensweise erhebliche Nachteile mit sich. Der PC des Geschädigten, von
dem ja bereits bekannt ist, dass er mit Malware infiziert ist, stellt augenscheinlich keine
forensische Umgebung dar. Zudem ist die Untersuchung nicht replizierbar. Hinzu kommt
noch, dass eine ganze Reihe von Malware erkennt, ob Wireshark auf dem System ausgeführt wird und gegebenenfalls alle Kommunikation einstellt.
Ein zweites gängiges Verfahren ist es, die Malware zu extrahieren und in eine virtuelle
Umgebung zu bringen. Die Vorteile sind, dass jetzt alle Schritte gut replizierbar sind und
die Analyse in einer definierten Umgebung stattfindet. Zudem erlauben es die verbreiteten Hypervisoren Snapshots anzufertigen, so dass sich RAM-Dumps mit der Malware
im Speicher leicht erzeugen lassen. Bei dieser Konstellation ist es möglich, den Protocol
Analyzer auf dem Host laufen zu lassen und die virtuelle Maschine so zu transparent zu
belauschen, ohne dass die Malware dies detektieren kann. Auf der anderen Seite ist es für
die Malware in diesem Fall möglich, zu erkennen, ob sie innerhalb einer virtuellen Maschine läuft, und wenn dem so ist, eine weitere Analyse zu verhindern [33]. Ein weiteres
Problem ist, dass die Malware ja erst einmal aus dem kompromittierten System extrahiert
werden muss und dass die Analyse nicht in der tatsächlichen Tatumgebung stattfindet.
Ein besseres Verfahren ist das Einrichten eines Laptops mit zwei Netzwerkkarten,
beispielsweise günstigen USB-Netzwerkadaptern als transparente Brücke (Vergleiche
Abb. 7.2). So kann ein mit Malware infizierter PC belauscht werden, ohne dass für die
Malware die Möglichkeit besteht, dies zu erkennen. Die eigentliche Analyse erfolgt auf
einem definierten System, wohingegen das infizierte System das Original ist und nicht
erst eine virtuelle Maschine infiziert werden muss. Das System ist portabel und kann zum
Geschädigten transportiert werden, ohne dass dieser seinen PC abgeben oder spiegeln
lassen muss. Alternativ können passive Netzwerkabzweige, wie der sogenannte Trowing
Star LAN Adapter [15], in die bestehende Netzwerktopologie eingebracht werden. Dann
kann das Sniffen auf einer Netzwerkkarte im Promiscuous Mode erfolgen (Abb. 7.2).
Das Belauschen von Malware auf mobilen Endgeräten erfolgt am einfachsten über den
WLAN-Adapter. Hierzu werden die mobilen Datendienste auf dem zu untersuchenden
7
Malware Forensics
205
Gerät deaktiviert, und es wird in ein überwachtes Drahtlosnetzwerk gebracht. Dabei empfiehlt es sich, einen Untersuchungsrechner als Accesspoint einzurichten. Jetzt kann das
Mobilgerät als einziges Gerät in dieses WLAN eingebunden werden, und der Protocol
Analyzer überwacht den WLAN Adapter. In der Regel ist es hierbei notwendig, den Netzverkehr aus dem abgesetzen WLAN in das Internet weiter zu routen, da ein Großteil der
Malware die Kommunikation einstellt, wenn keine Antworten eingehen.
Alternativ ist es möglich, die Malware auf Android Developer Boards zu bringen und
dort in einer definierten Umgebung an der Ethernet-Schnittstelle zu lauschen. Hier kommen Boards, wie das Wandboard oder Odroid, infrage [10].
Eine ganze Reihe von Malware verwendet DNS, um mit Servern zu kommunizieren.
Falls dem so ist, sollte der Server auch gefunden werden, damit das Schadprogramm mit
der Kommunikation beginnt. Falls der Server aber nicht mehr verfügbar ist, weil beispielsweise die zugehörige Dropzone bereits abgeschaltet wurde, empfiehlt sich die Simulation
der Verbindung. Dies ist durch einen Eintrag des Domainnamens in das Host-File möglich. Eine mächtigere Alternative ist der Einsatz von FakeDNS [23].
Auch erwartet die zu untersuchende Malware in der Regel nicht nur das schlichte
Vorhandensein des entsprechenden Servers, sondern zusätzlich die Bereitstellung spezifischer Dienste durch denselben. Neben der Erreichbarkeit des Ziels müssen also auch diese
Dienste simuliert werden. SMTP-Server lassen sich beispielsweise mit Mailpot [24], einem einfachen Mail-Honeypot, nachbilden. FTP-Server lassen sich sehr leicht mit dem
Freefloat FTP aufsetzen, einem minimalen FTP-Server, der jedes beliebige BenutzerPasswort-Paar akzeptiert.
7.3.2
Inhaltliche Analyse
Zur inhaltlichen Analyse von Malware muss diese zunächst aus dem infizierten System separiert werden. Hierzu kommen zunächst aktuelle Virenscanner zum Einsatz. Im
optimalen Fall werden beim Scan nur einige wenige verdächtige Dateien erkannt. Problematisch ist es, wenn sich auf einem System sehr viele verdächtige Dateien finden. Dann
fällt es schwer, zu differenzieren, welche Datei für den beobachteten Schadeffekt ursächlich ist. Ebenfalls schwierig ist die Analyse, wenn die zu untersuchende Malware noch
nicht von den Virenscannern erkannt wird. In diesem Fall muss die Schadsoftware durch
Methoden der Systemüberwachung erkannt werden.
Wurde die vermeintlich verantwortliche Malware-Executable festgestellt, empfiehlt es
sich, diese durch eine ganze Reihe von Antivirus Suites testen zu lassen. Zu diesem Zweck
bieten sich Webseiten an, wie Virus-Total [9], die eine Datei durch derzeit mehr als 50
verschiedene Antivirussysteme prüfen lässt.
Leider fallen augenblicklich die fehlenden oder nicht beachteten Namenskonventionen für Malware auf. Fast jeder Scanner benennt eine identische, erkannte Schadsoftware
anders. Die verschiedenen Malwareanalysten und Unternehmen haben sich nie auf eine
eindeutige Namenskonvention für Malware einigen können. Dies erschwert die Untersu-
206
C. Hummert
chung von Malware erheblich, weil es so nicht möglich ist, nach bestimmten Malwareprogrammen über ihren Namen zu suchen. Auch ist es schwierig, Ergebnisse zu vergleichen,
oder festzustellen, ob eine bestimmte Malware schon von einem anderen Forensiker untersucht wurde [28].
Nach der Identifizierung der Malware empfiehlt sich zunächst eine automatisierte Untersuchung der Malware. Webseiten wie Anubis ermöglichten es bis 2016, Programmdateien auf einen Server hochzuladen, auf dem diese dann in einer Sandbox ausgeführt
wurden, welche die Ergebnisse der Systemüberwachung als Report zur Verfügung stellte [3]. Für Android-Malware stand die Partnerseite Andrubis zur Verfügung [27]. Anubis
und Andrubis haben ihren Service derzeit allerdings eingestellt. Es ist aber anzunehmen,
dass sich bald vergleichbare Angebote entwickeln werden.
Falls Gründe vorliegen, die dem Hochladen von Programmdateien in das Internet entgegenstehen, existiert mit dem Cuckoo-Framework eine durchaus mit Anubis vergleichbare Möglichkeit, Malware lokal und automatisiert in Sandboxes auszuführen und zu
überwachen [35].
Um eine eigenständige Systemüberwachung zu realisieren, empfehlen sich, zur Analyse von Win32 und Win64 Malware, der Processexplorer und der Process Monitor aus
der Microsoft Sysinternals Suite. Der Processexplorer zeigt Informationen zu den Handles
und DLLs an, die durch Prozesse geöffnet oder geladen wurden. Wohingegen der Process
Monitor die früheren Programme Filemon und Regmon vereint und Zugriffe auf Dateien
und die Windows-Registrierungsdatenbank überwacht [42].
Eine geeignete Vorgehensweise ist es den Processexplorer und den Processmonitor
geöffnet zu halten, dann den Schadcode zur Ausführung zu bringen und die Aufzeichnung schnell anzuhalten. Jetzt können die Veränderungen am System in Ruhe abgelesen
und ausgewertet werden. Alle Dateien, die vom Schädling modifiziert oder geschrieben
werden, bedürfen im Weiteren eine besondere Untersuchung. Bei den geschriebenen Registrierungsschlüsseln handelt es sich in der Regel um Versuche, der Malware sich resident
zu machen.
7.4 Malware Antiforensics
Moderne Malware ist häufig bemüht, die forensische Untersuchung zu behindern oder bis
zur Unmöglichkeit zu erschweren. Zu diesem Zweck kommen verschiedene Techniken
der Verschleierung und der Antiforensik zum Einsatz. Dies betrifft nicht notwendigerweise dieselben Technologien, die von verschiedenen Schadprogrammen verwendet werden,
um sich einer Entdeckung durch Virenscanner zu entziehen [20, 26]. Allerdings erschweren solche Techniken wie Oligomorphie, Polymorphie oder Metamorphie die forensische
Analyse ebenfalls. Auf sie soll dennoch an dieser Stelle nicht eingegangen werden.
7
Malware Forensics
7.4.1
207
Kompression von Executables
Die am häufigsten angewandte Technik, zum Erschweren der Analyse von Malware, ist
Kompression. In den letzten Jahren gab es einen dramatischen Anstieg der Anzahl von
verschiedenen Packern, die zu diesem Zweck eingesetzt werden. Heute (2016) sind über
90 % aller Malware gepackt. Dabei treten über 50 verschiedene Laufzeitkompressionsverfahren auf [45].
Bei der Kompression ausführbarer Programmdateien werden die Programmdaten gepackt und diesen ein Entpackprogrammteil (Decompressor) vorangestellt, der die eigentlichen Programmdaten entpackt und anschließend startet. Das am weitesten verbreitete
Kompessionsverfahren ist mit Abstand UPX [34]. Weit über 50 % aller Malware ist UPX
komprimiert. Andere verbreitete Packer sind PECompact, Upack, ASPack/ASProtect, tELock, FSG, Themida, Armadillo und MEW.
Ist die Malware UPX gepackt, lässt sich das in PEview leicht feststellen, anstelle der
eigentlichen PE-Sections werden zwei Sections „UPX0“ und „UPX1“ angezeigt. Mit dem
Kommandozeilentool UPX (liegt derzeit in Version 3.91w vor) lässt sich die Executable
dann entpacken. Der Befehl hierzu lautet:
upx -d -o entpackt.exe gepackt.exe.
Dabei entspricht gepackt.exe dem Namen der komprimierten Executable, und das entpackte Ergebnis wird nach entpackt.exe geschrieben.
7.4.2
Verschlüsselung von Executables
Eine der ersten Ideen, um die Funktionsweise von Viruscode und die Detektion durch
Virenscanner zu verbergen, war Verschlüsselung. Der erste verschlüsselte Virus, der sich
verbreitete, war DOS/Cascade. Dies war am 01. Oktober 1987.
Bei der Verschlüsselung ausführbarer Programmdateien werden die Programmdaten
verschlüsselt und ihnen ein Entschlüsselungsprogrammteil, der sogenannte Decrypter,
vorangestellt, der die eigentlichen Programmdaten entschlüsselt und anschließend startet.
Dies geschieht analog zum Decompressor bei komprimierten Executables. Beispielhaft
sei hier der Decrypter von Dos/Cascade in Abb. 7.3 dargestellt.
Die Entschlüsselung erfolgt in einer Schleife über den zu entschlüsselnden Code. Die
Richtung dieses sogenannten Decryptor Loops kann vorwärts oder rückwärts sein. Bei
fortgeschrittenerer Malware können auch mehrere Verschlüsselungen übereinanderliegen.
In so einem Fall entschlüsselt der erste Decryptor den zweiten Decryptor usw. (Beispiele
sind: W32/Harrier, W32/Zelly). Bei mehreren Verschlüsselungen, die übereinanderliegen,
ist es auch möglich, die Richtung des Decrypter Loops in jeder Stufe zu ändern. Eine
andere Möglichkeit ist es, nur einen Loop zu verwenden, aber die Schlüssel immer wieder
neu zu ziehen.
208
C. Hummert
Abb. 7.3 Decrypter aus DOS/Cascade (Anm.: Der Decrypter aus DOS/Cascade bedient sich bereits
einer Anti-Debugging-Technik, da der Stack Pointer SP für Entschlüsselung verwendet wird.)
DOS/IDEA war der erste Virus, der starke Kryptografie verwendete. In diesem Fall
war der IDEA-Algorithmus im Virus selbst implementiert. Moderne Schadsoftware hingegen importiert die verwendeten Kryptofunktionen in der Regel. Beispielweise importiert
W32/Crypto die Microsoft Crypto-API und verwendete die KeyGen Funktion um Schlüssel zu generieren. Viele moderne Viren und vor allem Trojaner importieren allerdings die
Kryptofunktionen aus der OpenSSL Library.
Um Kryptografie im Quelltext festzustellen, ist es hilfreich, die Entropie über den
Bytecode zu berechnen. Bei starker Verschlüsselung ist die Entropie maximal oder fast
maximal. Beim Schieben eines Fensters über den Code und die fensterweise Berechnung
der Entropie lässt sich so unter Umständen sogar die Trennlinie zwischen Decrypter und
Chiffrat bestimmen.
7.4.3
Obfuskation
Obfuscation ist eine Technik, die das Verständnis von Code und von Executables erschweren und so eine effektive Analyse mit den Mitteln der Malware Forensik verhindern soll.
Die dahinterstehende Idee ist es, ein Programm durch ein Programm exakt gleicher Funktion, aber mit deutlich schwieriger zu analysierendem Code, zu ersetzten. Ursprünglich
wurde diese Technik entwickelt, um das geistige Eigentum von Softwareentwicklern zu
schützen. Heutzutage wird es aber im großen Maßstab als Antiforensikverfahren bei Malware eingesetzt [50].
7
Malware Forensics
209
Vor allem folgende Techniken finden dabei Anwendung:
Dead-Code Insertion ist eine relativ einfache Technik, bei der sinnlose Operationen,
sogenannter Junk Code, zwischen die sinnhaften Instruktionen integriert wird. Zum Beispiel können nops eingefügt oder auf nicht benötigten Registern sinnlose Operationen
durchgeführt werden.
Register Reassignment ist eine andere vergleichsweise einfache Technik. Hier werden
von Malwaregeneration zu Malwaregeneration die Register verschoben und die gleichen
Operationen auf jeweils anderen Registern durchgeführt. Ein bekanntes Beispiel für diese
Technik ist der Win95/Regswap Virus [48].
Subroutine Reordering verändert und verschleiert den originalen Code, indem die Reihung der Subroutinen zufällig verändert wird. Für k Subroutinen können auf diese Art und
Weise k! verschiedene Varianten eines Programms erzeugt werden.
Instruction Substitution ersetzt Instruktionen durch äquivalente Instruktionen. Beispielsweise können Loops durch Schleifen oder durch Sprünge substituiert werden. Oder
anstatt ein Register zu inkrementieren wird es zunächst dekrementiert, und dann werden
zwei zum Inhalt addiert.
Code Transposition reorganisiert die Abfolge der Instruktionen, ohne den Programmablauf zu verändern. So können beispielsweise Adressen oder Variablen früher oder später
geladen werden, oder bestimmte Aktionen können an andere Stellen im Code verschoben
werden.
In Code Integration ist ein Verfahren, dass nur bei Viren, die eine fremde Software als
Wirt haben, zum Einsatz kommt, hier werden durch Sprünge Teile des Codes der Wirtsoftware in den eigenen Programmablauf eingewoben. Ein Beispiel für In Code-Integration
ist Win95/Zmist [25].
7.4.4
Anti-Debugging Techniken
Eine weitere Klasse von Anti-Forensik-Techniken, die regelmäßig bei Malware zum Einsatz kommt, ist das sogenannte Anti-Debugging. Den Autoren der Schadprogramme wurde schnell klar, dass diese bei einer forensischen Untersuchung häufig in Debuggern
ausgeführt wird, um den Programmablauf besser nachvollziehen zu können. Es liegt also
nahe, Techniken einzusetzen, die Debugging erschweren oder verhindern [6]. Eine Auswahl solcher Techniken sei hier exemplarisch vorgestellt:
Ausmaskieren von Debug-Interrupts: Alle Debbugger müssen sogenannte Debug Interrupts belegen, um den Programmablauf unterbrechen zu können. Einige Schadprogramme
versuchen diese Debug-Interrupts auszumaskieren, zu verbiegen oder zu ersetzen.
Auch durch selbstmodifizierende Programme lässt sich Debugging unterbinden, dies
bedeutet im Wesentlichen, dass der Prozessor das Programm anders ausführt, als es in
den Speicher geladen wurden. Auch Checksummen können in diesem Zusammenhang
verwendet werden, um Debugger zu überlisten.
210
C. Hummert
Eine andere Möglichkeit, den Debugger zu stören sind, unsaubere Jumps, damit ist
ein Sprung mitten in einen Befehl gemeint. Die meisten Debugger können einen solchen
Sprung nicht verarbeiten und springen zu nächsten interpretierbaren Instruktion weiter.
Der Trick ist, an diese Instruktion einen Befehl zum Stoppen des Programms zu platzieren.
Im normalen Betrieb springt die CPU jedoch mit dem unsauberen Jump in den Befehl
hinein und findet dort einen weiteren Sprung über die Stopp-Anweisung hinweg.
Als letzte an dieser Stelle beschriebene Möglichkeit sei das Erkennen und Abschießen
von Debuggern genannt. Malware kann prüfen, ob beispielsweise ein zu Ida Pro, einem
verbreiteten Debugger, gehörender Prozess läuft und diesen Prozess gezielt beenden.
7.5
Malware Anatomie
Nachdem etwaigen Belauschen der Malware und der inhaltlichen Analyse ist es an der
Zeit, sich mit der Anatomie, also dem Programmcode, der Schadsoftware zu beschäftigen.
Bevor mit der Analyse begonnen wird, sollte immer zunächst sichergestellt werden,
dass die zu untersuchende Binary vollständig ist. Malware wird häufig nur unvollständig
oder korrumpiert übertragen. Die Analyse sollte jedoch stets an einer vollständigen Kopie
erfolgen.
In einem zweiten Schritt empfiehlt es sich, die Malware in einem einfachem Hex Editor
zu betrachten. So lässt sich beispielsweise schnell feststellen, um was für ein Format es
sich handelt. Der allergrößte Teil aller Schadprogramme wird als PE-File (Portable Executable) vorliegen. Gelegentlich treten aber auch andere Binärformate auf. Bei PE-Files
sollte immer geprüft werden, ob nur einen PE Header vorliegt, oder ob die Datei mehrere
PE-Header enthält. (Dies ist ein Zeichen für eine If-A-New Infektion [12].)
Als dritter Schritt sollte ein String Dump aus der Executable vorgenommen werden.
Dazu kann beispielsweise das strings-Kommando aus der Microsoft Sysinternals Suite
dienen. Aus den extrahierten Strings können häufig schon Informationen über importierte
Bibliotheken, aber auch über den Programmablauf und in einigen Fällen sogar Netzwerkadressen gewonnen werden.
Jetzt gilt es, sich einen Überblick über die Executable zu verschaffen, bei den üblichen
Windows Portable Executable Files ist das Programm PEview [40] hervorragend geeignet. In PEview werden die einzelnen Sections des PE-Files aufgelistet, und es kann zum
Beispiel schnell erkannt werden, ob die Executable komprimiert ist. Sollte dies der Fall
sein, muss das Programm an dieser Stelle entpackt werden. Nun ist es sinnvoll, mit der
entpackten Version in der Analysekette zurückzugehen und beispielsweise einen neuen
String Dump zu fertigen sowie die entpackte Version erneut in PEview zu betrachten.
Im Folgenden ist es ratsam, mit PEdump den PE-Header weiter zu zerlegen [38], hier
gilt es insbesondere, auf Unstimmigkeiten in den einzelnen Section-Headern zu achten.
Bei infizierten Executables oder bei selbstmodifizierendem Code kommt es hier regelmäßig zu Inkonsistenzen, die weiteren Aufschluss über die Malwareanatomie geben können.
7
Malware Forensics
211
Im nächsten Schritt wird versucht, aus den importierten API-Calls Aufschluss über den
Programmablauf zu erhalten. Ein Werkzeug, das sich in diesem Zusammenhang als besonders wirksam erwiesen hat, ist der Dependency Walker [16]. Diese Software kann 32-bit
und 64-bit Windows Binaries untersuchen und erzeugt eine hierarchiche Darstellung aller
abhängigen Module. Für jedes importierte Modul werden alle Funktionen aufgelistet, die
von diesem Modul exportiert werden, und es wird dargestellt, welche Funktionen tatsächlich gerade gecalled werden.
Im endgültigen Schritt muss die Malware decompiliert und der Assembler Code der
Executable untersucht werden. Das Werkzeug, das sich hier als Goldstandard etabliert
hat, ist der IDA Pro Disassembler [18]. Eine umfangreiche Einführung in MalwareDisassemblierung mit IDA zu geben, würde den Rahmen dieses Buchkapitels bei Weitem
überschreiten. Für eine detaillierte Beschreibung sei hier auf das hervorragende Buch von
Chris Eagle verwiesen. Aber auch ohne detaillierte IDA-Pro-Kenntnisse lohnt sich ein
schnelles Disassemblieren und ein kurzer Blick auf den Code nahezu immer. Für IDA
Pro existieren eine ganze Reihe von Plugins, die sich teilweise als sehr nützlich bei der
Malwareforensik erwiesen haben.
Das vielleicht hilfreichste Plugin, das für IDA Pro zur Verfügung steht, ist das FLARE
Toolkit. Es enthält unter anderem FLIRT, einen Algorithmus, der es ermöglicht, Funktionen aus den Standardbibliotheken im Assembler Code zu entdecken und zu annotieren.
Nachdem der Assembler Code durch FLIRT annotiert wurde wird eine Lesbarkeit erreicht,
die mit Code in einer Hochsprache vergleichbar ist. Allerdings ist es durch sehr fortgeschrittene Anti-Debugging-Konzepte möglich, FLIRT in seiner Analyse zu stören und
eine falsche Interpretation zu provozieren [30]. Dennoch lohnt eine Analyse des Codes
mit FLIRT fast immer.
Ein weiteres, bei der Analyse von Malware extrem hilfreiches IDA Pro Plugin ist findcrypt. Dieses Plugin scannt den Code auf die Verwendung bestimmter Konstanten hin,
die von kryptografischen Algorithmen verwendet werden. Dies erlaubt es, Programmteile, die kryptografische Funktionen implementieren, festzustellen und abzuleiten welche
Algorithmen verwendet werden [49].
Generell sollte das IDA Stealth Plugin verwendet werden. Es bemüht sich, das Vorhandensein von IDA gegenüber der Malware zu verbergen und so etwaige Anti-Dubugging
Techniken ins Leere laufen zu lassen. Leider deckt das Plugin nur einige wenige Detektionsverfahren ab, und moderne Malware hat häufig mehrere intelligente Methoden
implementiert [7]. Trotz des teilweise begrenzten Nutzens kann das Stealth Plugin in jedem Fall schadlos eingesetzt werden.
Auch das von Zbitskiy entwickelte IDA Entropy Plugin kann sich als nützlich erweisen.
Es ermöglicht es, die Entropie für 32-bit PE, ELF und andere Binärformate zu berechnen.
Zusätzlich ermöglicht es die Suche nach Codefragmenten nach einem gegebenen Entropiewert [31].
Das letzte IDA Plugin, das an dieser Stelle vorgestellt werden soll, ist das IDA Deobfuscator Plugin. Es versucht Anti-Disassembly-Code aus der zu untersuchenden Binary zu
212
C. Hummert
entfernen, und obfuskierten Code zu vereinfachen [39]. Dies ist automatisiert allerdings
nur sehr eingeschränkt möglich.
Literatur
1. Andriesse, D., Rossow, C., Stone-Gross, B., Plohmann, D., Bos, H.: Highly resilient peer-topeer botnets are here: An analysis of Gameover Zeus. In: 8th International Conference on
Malicious and Unwanted Software, IEEE, S. 116–123 (2013)
2. Aycock, John: Computer Viruses and Malware. Springer, New York (2006)
3. Bayer, U., Habibi, I., Balzarotti, D., Kirda, E., Kruegel, C.: A View on Current Malware Behaviors. In: LEET (2009)
4. Benford, G.: The Scarred Man. In: Ferman, E.L. (Hrsg.) Venture Science Fiction, Bd.(4/2) S.
122–132. Mercury Press, Cornwall, CT (1970)
5. Benford, Gregory: Catch Me If You Can. Communications of the ACM, 54(3), 112 (2011)
6. Bertelsons, B., Rasch, M.: PC Underground. Data Becker, Düsseldorf (1994)
7. Brand, M., Valli, C., Woodward, A.: Malware Forensics: Discovery of the intent of Deception.
The Journal of Digital Forensics, Security and Law: JDFSL, 5(4), 31–41 (2010)
8. Bundeskriminalamt (Hrsg.): Cybercrime Bundeslagebild 2013. Wiesbaden (2013)
9. Canto, J., Dacier, M., Kirda, E., Leita, C.: Large scale malware collection: lessons learned. In:
IEEE SRDS Workshop on Sharing Field Data and Experiment Measurements on Resilience of
Distributed Computing Systems (2008)
10. Cardoso, D.S.E.: Linux Based Mobile Operating Systems (Dissertation). Instituto Superior de
Engenharia de Lisboa (2015)
11. Chen, Thomas M., Robert, J.-M.: The evolution of viruses and worms. In: Statistical methods
in computer security, S. 265–282 (2004)
12. Cheng W.J.P., Rongcai Z., Xiaoxian L.: Using API Sequence and Byase Algorithm to Detect
Suspicious Behavior. International Conference on Communications and Networking in China,
Information and Coding Theory Symposium Xi’an, China, S. 26–29 (2009)
13. Choo, Kim-Kwang Raymond, Smith, R.G.: Criminal exploitation of online systems by organised crime groups. Asian Journal of Criminology 3.1, 37–59 (2008)
14. Cohen, Fred: Computer Viruses – Theory and Experiments. Computers & Security, 6(1), 22–35
(1987)
15. Dady K.: Sniff ethernet with a throwing star. HackaDay (2011)
16. Dependency Walker. http://dependencywalker.com (2014). Zugegriffen 14. Juni 2016
17. Dewdey, A.K.: Computer Recreations, A Core War Bestiary of Virus, Worms and other Threats
to Computer Memories. Scientific American 252, 14 (1985)
18. Eagle, C.: The IDA PRO Book. No Starch Press, San Francisco (2008)
19. Farwell, James P., Rafal Rohozinski: Stuxnet and the future of cyber war. Survival 53.1, 23–40
(2011)
20. Ferrie, P., Ször, P.: Hunting for metamorphic. Virus, 123–143 (2001)
Literatur
213
21. Gharibi, Wajeb: Studying and Classification of the Most Significant Malicious Software. arXiv
preprint arXiv:1106.0853 (2011)
22. Grier, C., Ballard, L., Caballero, J., et. al.: Manufacturing compromise: the emergence of
exploit-as-a-service. In: Proceedings of the 2012 ACM conference on Computer and communications security, S. 821–832 (2012)
23. Janbeglou, M., Zamani, M., Ibrahim, S.: Redirecting network traffic toward a fake DNS server on a LAN. In: 3rd IEEE International Conference on Computer Science and Information
Technology, S. 429–433 (2010)
24. Jezorek M.: Mailpot https://rubygems.org/gems/mailpot/versions/0.0.2. (2016). Zugeriffen am
14. Juni 2016
25. Konstantinou E.: Metamorphic Virus: Analysis and Detection. RHUL-MA-2008-02, Technical
Report of University of London (2008)
26. Lehner, M., Hermann, E.: Auffinden von verschleierter Malware. In: Datenschutz und
Datensicherheit-DuD, 30(12), S. 768–772. (2006)
27. Lindorfer, M., Neugschwandtner, M., Weichselbaum, L., Fratantonio, Y., Van Der Veen, V.,
Platzer, C.: Andrubis-1,000,000 apps later: A view on current android malware behaviors. Proceedings of the the 3rd International Workshop on Building Analysis Datasets and Gathering
Experience Returns for Security (BADGERS) (2014)
28. Maggi, F., Bellini, A., Salvaneschi, G., Zanero, S.: Finding non-trivial malware naming inconsistencies. In: Information Systems Security, S. 144–159. Springer, Berlin Heidelberg (2011)
29. Mas’ud, M.Z., Sahib, S., Abdollah, M.F., Selamat, S.R., Yusof, R.: Android Malware Detection
System Classification. Research Journal of Information Technology, 6(4), 325–341 (2014)
30. McMaster, J.: Issues with FLIRT aware malware (2011)
31. Mokbel, M.F.: On the Intractability of Designing an Efficient Entropy Brute Forcer (2012)
32. Munir, R., Pagna Disso, J.F., Awan, I., Mufti, M.R.: Quantitative Enterprise Network Security
Risk Assessment. In: UK Performance Engineering Workshop (2013)
33. Nguyen, A.M., Schear, N., Jung, H., Godiyal, A., King, S.T., Nguyen, H.D.: Mavmm:
Lightweight and purpose built vmm for malware analysis. Computer Security Applications
Conference, 2009. ACSAC’09, S. 441–450 (2009)
34. Oberhumer, M.F.X.J., Molnár, L., Reiser, J.F.: UPX: Ultimate packer for executables (2004)
35. Oktavianto, D., Muhardianto, I.: Cuckoo Malware Analysis. Packt Publishing Ltd (2013)
36. Orebaugh, A., Ramirez, G., Beale, J.: Wireshark & Ethereal network protocol analyzer toolkit.
Syngress (2006)
37. Panda Security (Hrsg.): Malware: Unglaublicher Anstieg von 25.000 % seit 2000. PresseBox,
Duisburg (13.07.2007)
38. Pietrek, M.: Inside windows-an in-depth look into the Win32 portable executable file format.
MSDN magazine, 17(2)(2002)
39. Raber, J., Laspe, E.: Deobfuscator: An automated approach to the identification and removal of
code obfuscation. In: wcre, S. 275–276 (2007)
40. Radburn, W.J.: PEview Last updated on 2016-02-07. http://www.wjradburn.com/software/
(2016). Zugeriffen: 14. Juni 2016
41. Rao, Siddharth Prakash: Turning Bitcoins into the Best-coins. arXiv preprint arXiv:1412.7424
(2014)
214
C. Hummert
42. Russinovich, Mark, Bryce Cogswell: Windows sysinternals (2008)
43. Shin, D., Lee, K., Won, D.: Advanced malware variant detection algorithm using structural characteristic of executable file. In: FGIT’11 Proceedings of the third International Conferencence
on Future Generation Information Technology. S. 301–308, Springer, Berlin Heidelberg (2011)
44. Shoch, J.F., Hupp, J.A.: The Worm Programs early Experience with a Distributed Computation.
Communications of the ACM, 25(3) (1982)
45. Sun, L., Versteeg, S., Boztaş, S., Yann, T.: Pattern recognition techniques for the classification
of malware packers. In: Information security and privacy, S. 370–390. Springer, Berlin Heidelberg (2010)
46. Tarakanov, D.: ZeuS on the Hunt. In: SecureList (2012)
47. Thompson, K.: Reflections on trusting trust. Communications of the ACM, 27(8), 761–763
(1984)
48. Wong, W., Stamp, M.: Hunting for metamorphic engines. Journal in Computer Virology, 2(3),
211–229 (2006)
49. Wright, J.L.: Finding cryptography in object code. In: Security Education Conference Toronto
(SecTOR) (2008)
50. You, I., Yim, K.: Malware obfuscation techniques: A brief survey. In: 2010 International conference on broadband, wireless computing, communication and applications, S. 297–300 (2010).
8
Audioforensik
Hartmut Luge
8.1 Einleitung
Die akustische Forensik oder auch Audioforensik ist ein relativ junges Teilgebiet der
Forensik, das durch die wissenschaftliche und technische Analyse von akustischen Signalen Fakten für straf- und zivilgerichtliche Verfahren bereitstellt. Für die Analyse können
originäre oder gespeicherte Audiosignale verwendet werden. Die Entwicklung der Audioforensik ist stark technisch und technologisch dominiert und damit eng an die Entwicklung der Audio- und Kommunikationstechnik gebunden. Mit der Erfindung des Telefons
1861 durch den deutschen Physiker P. Reis gab es die ersten technischen Einrichtungen zur akustischen Fernkommunikation. Die wichtige Speicher- und Verstärkungsmöglichkeit zum Einsatz der Audioforensik konnte mit der Erfindung der Elektronenröhre
1910 und der Tonbandaufzeichnung realisiert werden. Die Entwicklung der magnetischen
Aufzeichnungs- und Speichertechnik begann bereits 1898 durch Waldemar Poulsen, der
versuchte, auf einem Stahldraht erste magnetische Aufzeichnungen von Schallereignissen zu speichern. Die zweite bahnbrechende Erfindung gelang Eduard Schüller im Jahr
1933 mit dem Ringkopf, der als Tonkopf für Magnetbandgeräte eingesetzt wurde. Damit waren in den 1930er Jahren die wesentlichen audiotechnischen Grundlagen für die
akustische Forensik geschaffen. In der Zeit des Zweiten Weltkrieges wurden nicht nur
die ersten effektiven Sprachverschlüsselungsgeräte wie der Bell A3 Scrambler entwickelt,
sondern auch durch das Bell Telephone Laboratory die ersten Spektrogramme zur audioforensischen Identifikation der Stimmen gegnerischer Befehlshaber eingesetzt. Mithilfe der
Spektrogramme konnte der zeitliche Verlauf der in der Sprache enthaltenen Frequenzen
bzw. des Frequenzspektrums dargestellt werden und somit der Vergleich zu den OriginalH. Luge ()
Lehrstuhl für Kommunikationstechnik, University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: luge@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_8
215
216
H. Luge
stimmen realisiert werden. Mit dem Einsatz der ersten kommerziellen Analog-DigitalWandler (AD-Wandler) in den 1980er Jahren war es möglich, die Signalverarbeitung
von analoger Filter- und Signalaufbereitungstechnik auf digitale Signalverarbeitung und
Speicherung umzustellen. Hier konnte erstmals ein verlustfreies Kopieren von akustischen Signalen erreicht werden, wobei die ersten AD-Wandler aufgrund der geringen
Bitauflösung von meist 8 Bit schon einen ersten Informationsverlust gegenüber dem analogen Original erzeugten. Mit heutigen digitalen Speicherformaten und Bitauflösungen von
24 Bit in Kombination mit hohen Abtastfrequenzen bis 96 kHz oder in speziellen Formaten mit noch höheren Abtastfrequenzen kann eine relativ verlustarme digitale Speicherung
der akustischen Schallereignisse erfolgen. Auf diese gespeicherten digitalen Werte können
digitale Signalverarbeitungsverfahren angewendet werden, um zum Beispiel ein Spektrogramm für audioforensische Auswertungen mithilfe der Kurzzeit-Fourier-Transformation
(STFT) zu berechnen.
8.2 Überblick zu den Teilgebieten der akustischen Forensik
Die Audioforensik ist ein umfangreiches Gebiet, das sich durch die digitalen Verfahren der
Signalanalyse, Filtertechnik, Signalaufbereitung und -verstärkung noch weiterentwickeln
wird. Die Audioforensik kann in folgende Teilgebiete untergliedert werden:
phonetische Stimmerkennung und Stimmenvergleich (Voice Identification),
Nebengeräusche und Geräuscherkennung (Sound Identification),
Geräuschsynthese und Beurteilung (Audibility Analysis),
Hör- und Sprachverständlichkeitsverbesserung und phonetische Textanalyse (Intelligibility Enhancement),
Manipulations- und Echtheitsanalyse (Authenticity Analysis),
Zeit-Ereignis-Analyse (Event Sequence Analysis).
Diese audioforensischen Verfahren haben teilweise fließende Übergänge, und die Ergebnisse sollten immer im Zusammenhang betrachtet werden.
8.2.1 Phonetische Stimmerkennung und Stimmenvergleich
(Voice Identification)
Ziel der phonetischen Stimmenerkennung ist es, ausgehend von vorhandenem Audiomaterial einer Stimmaufzeichnung oder einem Original, die Stimme einer bestimmten Person
zuzuordnen [4, 14]. Diese Zuordnung kann manuell durch das Hören der Stimme oder mit
technischen Methoden erfolgen. Für die technische Analyse werden Spektrogramme bzw.
die Sonografie eingesetzt. Eine Spektralanalyse mit der Darstellung des zeitlichen Verlaufs
der im Signal enthaltenen Frequenzanteile eines Audiosignals wird auch als Sonagramm
8
Audioforensik
217
bezeichnet. Insbesondere wird bei der Audioanalyse der Sprache die Formantanalyse eingesetzt. Sie beruht auf den sogenannten Formantfrequenzen, die sprach- und sprecherabhängig sind. Unter anderem wurde die Formantanalyse bereits 1941 durch Kurt Vetterlein
zur Sprachentschlüsselung des Bell A3-Scrambler verwendet [5]. Für die audioforensische Stimmerkennung und den Stimmenvergleich wird die phonetische Charakteristik der
Stimme hinsichtlich Sprachfrequenzbandbreite, Stimmbandgrundschwingung, Formantfrequenzen, Reibelauten, Satzrhythmus und Atemmuster verwendet. Zusätzlich können
durch die Stimmanalyse Informationen über das Geschlecht, Alter, regionale Herkunft,
Muttersprache usw. gewonnen werden.
8.2.2
Nebengeräusche und Geräuscherkennung (Sound Identification)
Zur Geräuscherkennung werden die zu identifizierenden Schallereignisse mit Aufnahmen
von bekannten Geräuschen verglichen, um eventuelle Rückschlüsse über Art, Zeit und
den Entstehungsort durchführen zu können [12]. Zu berücksichtigen ist hier die Möglichkeit, dass sich Störartefakte bedingt durch die Mikrofoninstallation sowie die Aufnahmeund Übertragungstechnik einschleichen können. Nebengeräusche können oft zusätzliche
Informationen über Aufnahmeort und Zeit liefern, aber auch die Spracherkennung behindern. Zur Beseitigung von unerwünschten Nebengeräuschen können statische und adaptive Audiofilter eingesetzt werden.
8.2.3 Geräuschsynthese und Beurteilung (Audibility Analysis)
Bei der Geräuschsynthese werden Geräusche durch informationstechnische Verfahren erzeugt, um sie für eine analytische Hörprobe bereitzustellen. Dafür können vorhandene
Geräusche durch Verstärker und Filtertechnik in Amplitude und Frequenzgang modifiziert
werden. Die zweite Möglichkeit bietet die synthetische Herstellung von Geräuschen durch
Einsatz eines Arbiträrgenerators, der eine beliebige Signalform erzeugen kann. Diese Geräusche können dann durch die technische Modifikationsmöglichkeit in verschiedenen
Hörproben zur Verfügung gestellt werden.
8.2.4 Hör- und Sprachverständlichkeitsverbesserung und phonetische
Textanalyse (Intelligibility Enhancement)
Die Verbesserung der Hör- und Sprachverständlichkeit ist eine Voraussetzung, um Audiosignale für gut erkennbare und verständliche Hörproben bereitzustellen. Dafür gibt es
in der Informations- und Audiotechnik umfangreiche technische Möglichkeiten [2, 13].
Zur Verbesserung der Hörbarkeit können folgende Verfahren auf analoger oder digitaler
Ebene eingesetzt werden:
218
H. Luge
Vergrößern oder Verkleinern der Signalamplituden durch Verstärkung oder Dämpfung
des originalen Audiosignals,
Kompression oder Dekompression der Amplituden des Audiosignals (bei der Kompression werden leise Audiopassagen lauter und laute Passagen werden gedämpft und
damit wird der Dynamikumfang des Signals kleiner, und eventuell bisher verdeckte
Audioanteile können hörbar werden),
Beeinflussung des Frequenzspektrums des Audiosignals durch statische oder adaptive
Filter (einzelne Frequenzbereiche können durch Filtertechnik im Pegel verstärkt oder
gedämpft werden, um zum Beispiel Störgeräusche auszublenden oder andere Schallereignisse besonders hervor zu heben).
Die phonetische Textanalyse wird verwendet, um schwer verständliche Passagen einer
Sprachaufzeichnung in die Schriftform zu übertragen. Hier geht es, analog der Sprachentschlüsselung, um die Spracherkennung bezüglich des Inhalts.
8.2.5 Manipulations- und Echtheitsanalyse (Authenticity Analysis)
Durch Echtheitsanalyse können Aussagen über die Authentizität des Audiomaterials und
eventuell auch des Datenträgers getroffen werden. Ziel ist es, Fälschungen oder Manipulationen durch Untersuchung der Audiosignale und des Datenträgers zu erkennen. Der
Manipulations- oder Fälschungsnachweis ergibt sich aus der Veränderung der Struktur des
Datenträgers zum Beispiel bei analogen Aufzeichnungen auf Magnetband [7] oder dem
nicht miteinander korrelierenden Eigenschaften von Nutzinformation und Nebeninformation. Oft werden bei Fälschungen die Nutzsignale und Informationen geändert und die an
den Nebeninformationen oder Signalen entstehenden Veränderungen nicht berücksichtigt.
Auch nicht durchgeführte Änderungen an den Nebeninformationen oder Signalen können
ein Anhaltspunkt für eine Manipulation oder Fälschung sein. Bei analogen Aufzeichnungen auf Magnetband können zum Beispiel Manipulationen durch optische Betrachtung
des Magnetbandes mit dem Magnetic-Tape-Viewer erkannt werden. Damit ist es möglich, alle Schnitt-, Lösch-, Start- und Stoppimpulse zu erkennen. Für Aufnahmen, die mit
einem an das Stromnetz angeschlossenen Gerät erzeugt oder gespeichert wurden, kann
die Auswertung des Netzfrequenzrauschens durch die ENF-Analyse (Electrical Network
Frequency-Analysis) verwendet werden, um die Echtheit zu überprüfen.
8.2.6 Zeit-Ereignis-Analyse (Event Sequence Analysis)
Mit der Zeit-Ereignis-Analyse wird das Übereinstimmen von Uhrzeit und Herkunft von
akustischen Signalen bzw. Audioaufzeichnungen mit anderen Schallereignissen geprüft.
Bei Übereinstimmung könnte man von einer echten Aufzeichnung ausgehen.
8
Audioforensik
8.3
219
Formate und Verfahren der technischen Audioforensik
8.3.1 Audioformate und Übertragungskanal
Für Analysen in der Audioforensik ist die Qualität des verwendeten Audiomaterials von
Bedeutung. Die Eigenschaften des Audiomaterials hängen vom Speichermedium, Speicherverfahren und dem Übertragungskanal ab. Hier wird zwischen analogen und digitalen Speicherverfahren unterschieden. Zu den analogen Speicherverfahren und Formaten
gehört vor allem die analoge Aufzeichnung auf Magnettonband (s. Abb. 8.1). In der Magnetschicht des Tonbandes wird durch das gleichmäßige Vorbeiziehen des Tonbandes am
Kopfspalt des Aufnahmekopfes eine dauerhafte magnetische Remanenzstruktur erzeugt,
in der die Information des Audiosignals durch entsprechend stärkere und schwächere Magnetfelder gespeichert wird. Die Stärke des Magnetfeldes, das im Aufnahmekopf erzeugt
wird, entspricht der Amplitude des Audiosignals zu einer bestimmten Zeit. Damit erfolgt
eine rein analoge Speicherung des Audiosignals, die wert- und zeitkontinuierlich ist. Hier
entsteht also kein verfahrensbedingter Informationsverlust wie bei digitalen Verfahren.
Für die Wiedergabe des Audiosignals wird in umgekehrter Weise das im Tonband gespeicherte Magnetfeld genutzt, um im Wiedergabekopf unterschiedlich hohe Induktionsspannungen zu erzeugen. Zur Löschung wird bei einfachen Geräten ein Permanentmagnet
eingesetzt. Bei modernen und hochwertigen Geräten erfolgt meist eine Löschung durch
Abb. 8.1 Spulentonbandgerät BG23 für Magnettonaufzeichnungen. (Sammlung H. Luge)
220
H. Luge
Abb. 8.2 links Löschkopf und rechts Wiedergabe-Aufnahmetonkopf mit Schrauben zur Einstellung
der Spurlage. (Sammlung H. Luge)
ein Hochfrequenzfeld, das in einem Löschkopf mit Frequenzen im Bereich um 60 kHz
erzeugt wird (s. Abb. 8.2). Die Geschwindigkeit des Vorbeitransports des Tonbandes am
Tonkopf wird als Bandgeschwindigkeit bezeichnet und kann übliche Werte von 19,05,
9,53, 4,76 und 2,38 cm/s annehmen. Je höher die Bandgeschwindigkeit, desto größer ist
der Frequenzumfang von der unteren bis zur oberen Grenzfrequenz in Abhängigkeit von
der konstruktiven Gestaltung des Kopfspaltes des Tonkopfes. Im Bereich der digitalen
Audiotechnik für Aufnahme, Speicherung, Bearbeitung und Wiedergabe stehen heute ADWandler und DA-Wandler zur Generierung und Wiedergabe digitaler Daten aus analogen
Audiosignalen zur Verfügung. In Abb. 8.3 sind die Komponenten zur Gewinnung von digitalen Daten aus Audiosignalen dargestellt. Am Anfang steht immer ein Tiefpassfilter, um
die Bedingung des Nyquist-Shannon-Abtasttheorems zu erfüllen. Dafür muss ein bandbegrenztes Signal mit der maximalen Frequenz Fmax mit einer Frequenz von mindestens
2 Fmax oder größer abgetastet werden. Nur dann kann aus dem zeitdiskreten Signal wieder ein dem original entsprechendes Signal rekonstruiert werden. Je größer die Abtastrate,
desto besser ist das aus dem Originalsignal restaurierbare Audiosignal.
Generell ist jedoch mit einer Digitalisierung eines analogen Audiosignals durch die
Umwandlung eines zeit- und wertkontinuierlichen Signals in ein zeit- und wertdiskretes Signal immer ein irreversibler Informationsverlust zum Originalsignal verbunden. Die
digitalen Audiorohdaten können in unkomprimierten Audioformaten (wie zum Beispiel
8
Audioforensik
221
Abb. 8.3 Komponenten zur Digitalisierung von Audiosignalen in verschiedene Audioformate
dem Windows wav-Format) und in komprimierten Formaten (wie zum Beispiel dem mp3Format, MPEG 2.5 Layer 3) wie in Abb. 8.4 dargestellt, codiert und gespeichert werden. In
unkomprimierten Audioformaten wird der direkte Abtastwert nur codiert gespeichert. Die
Qualität des Audiosignals hängt von der Bitauflösung des AD-Wandlers und der gewählten Abtastrate ab. Um die anfallenden Datenmengen zu reduzieren, wird eine verlustfreie
oder verlustbehaftete Datenkompression eingesetzt. Übliche Abtastraten sind 8000 Hz bei
8-Bit-Auflösung als abtastorientierte Codierung (sample-based) für Telefonqualität mit
einer Datenrate von 64 kBit/s (8 bit 8000 Abtastungen). Eine deutliche Datenreduzierung ergibt die Verwendung der segmentorientierten Codierung (frame-based) mit einer
weiteren Datenratenreduzierung von kleiner 20 kBit/s durch die modellhafte Übertragung
Abb. 8.4 Speicherung der digitalen Rohdaten in unkomprimierten und komprimierten Audioformaten
222
H. Luge
(LD-CELP, CS-ACELP usw.) des Zustandes des Vokaltraktes. Höherwertige Auflösungen, wie zum Beispiel von einer CD/DVD, werden mit 44.100 Hz abgetastet bei einer
Bitauflösung von 16 Bit. Je höher die Bitauflösung und die Abtastrate, desto höher ist die
Audioqualität. Zusätzlich können auch proprietäre Audioformate entwickelt und verwendet werden – zum Beispiel, um eine sehr hohe Aufzeichnungs- und Wiedergabequalität
zu erreichen. Durch die Überabtastung können mehr Details des Amplitudenverlaufs des
Analogsignals in digitale Abtastwerte überführt werden. Das ermöglicht eine originalgetreuere Reproduktion des Analogsignals in einem DA-Wandler. In der Audioforensik sind
Filter ein wichtiges Arbeitsmittel, um Hör- und Sprachverständlichkeit, Geräuscherkennung und Geräuschunterdrückung im Audiomaterial zu verbessern. Dabei kann zwischen
statischen Filtern und adaptiven Filtern unterschieden werden. Die statischen Filter können analog oder digital ausgeführt werden und besitzen einen festen Frequenzgang. Hier
werden also unabhängig vom Audiosignal bestimmte einstellbare Frequenzbereiche im
Amplitudenpegel verstärkt oder gedämpft. Eingesetzt werden Hochpass, Tiefpass, Bandpass oder Bandsperre mit einstellbaren, aber festen Frequenzen. Ein typischer Anwendungsfall ist der Einsatz eines einstellbaren Equalizers für den Hörfrequenzbereich von
18 Hz bis maximal 20 kHz.
Die adaptiven Filter haben keinen festen Frequenzgang, sondern werden durch komplexe digitale Filteralgorithmen an die Schallereignisse und Geräusche angepasst. Eine
wichtige Anwendung der statischen Filter sind die adaptiven Single Channel Filter, die
bestimmte feste und sich wiederholende Audioanteile von nicht festen Audioanteilen, wie
zum Beispiel Sprache, trennen können. Das können Audioanteile wie Windgeräusche,
Pfeiftöne, Motorbrummen usw. mit relativ konstanter Amplitude und Frequenzbereich
sein. Mithilfe von Latticefiltern können bestimmte Reibelaute und Konsonanten hervorgehoben werden. Durch Anwendung von adaptiven Cross Channel Filtern können Schallereignisse und Geräusche entfernt werden, für die Referenzgeräusche vorhanden sind. Diese
Vergleichsgeräusche, wie zum Beispiel laute Musik zur Überdeckung einer Sprachkommunikation, kann man durch entsprechende Überlagerung mit adaptiven Cross Channel
Filtern entfernen und die Sprache wieder verständlich dargestellen. Mit Hilfe von BandAdaptiven-Filtern werden nicht statische Filter realisiert, die bestimmte Frequenzbereiche
verstärken oder dämpfen sollen. Die Filterparameter für Frequenzbereich und Amplitudengang werden dann adaptiv an das zu verstärkende Nutzsignal oder an das zu dämpfende Störspektrum angepasst. Diese Filter sind adaptive Kombinationen von Bandpass,
Tiefpass, Hochpass und Bandsperre.
8.3.2 Manipulation und Echtheit von Audioaufzeichnungen
Der Manipulations- und Fälschungserkennung einer Audioaufzeichnung kann auf der
Differenz zwischen Nutzinformation bzw. -signalen und den Nebeninformationen bzw.
-signalen basieren. Dabei wird bei einer Fälschung auf jeden Fall die Nutzinformation
geändert, aber die Nebensignale müssen mit der Nutzinformation korrelieren. Passen also
8
Audioforensik
223
Nutzinformation und Nebeninformation nicht zusammen, kann man von einer Manipulation ausgehen. Dabei kann die Nebeninformation entweder gar nicht verändert worden
sein oder nicht zur Nutzinformation passen. Diese grundlegende Korrelation von Nutzinformation bzw. -signal und Nebeninformation kann prinzipiell als Indikator einer Manipulation bzw. Fälschung angesehen werden. Für die akustische Forensik spielten die
Magnettonaufzeichnungen bereits in den 1960er Jahren eine bedeutende Rolle [7] mit
einem umfangreichen Kenntnisstand über Manipulations- und Fälschungsmöglichkeiten
und deren Erkennung. Bei den Magnettonaufzeichnungen kann zwischen mechanischen
und magnetischen Manipulationen unterschieden werden. Zu den mechanischen Manipulationsmöglichkeiten zählt das Herausschneiden oder Einfügen von Bandmaterial im
Nass- oder Trockenverfahren. Auch das Schneiden des Bandes mit einer Metallschere statt
mit einer Plastikschere hinterlässt magnetische Veränderungen auf dem Magnettonband,
die ausgewertet werden können. Zu den Änderungsversuchen zählen Löschung, Löscheinfügung, Kopieren und Zusammenmischen von mehreren Aufzeichnungen. Für die Analyse können optische Verfahren und Signalpegeluntersuchungen durchgeführt werden. Die
optische Untersuchung des Magnettonbandes erfolgt durch Anzeige der magnetischen
Strukturen, die auf dem Tonband vorhanden sind. Durch diese optische Untersuchung können Löschungen, Start und Stopp der Aufzeichnung, direkte Schnitte und kopierte Schnitte
sichtbar dargestellt werden. Die Auswertung des Audiosignals bietet bei der Darstellung
in einem Oszillogramm mit der Aufzeichnung der Amplitude über die Zeit ebenfalls Anhaltspunkte anhand des Amplitudenverlaufs.
Damit kann der Start- und Stoppimpuls einer Löschung und auch eine Löschung eines
Audiosignals gegenüber einem nicht vorhandenen Signal anhand des Rauschpegelabfalls
erkannt werden. Auch eine Einfügung durch Überspielung eines vorhandenen Audiosignals anhand des Audiopegelabfalls zu Beginn der Löschung bzw. der Hochfrequenzvormagnetisierung kann detektiert werden.
Die dritte Möglichkeit der Manipulationserkennung bei Magnettonaufzeichnungen ist
der Einsatz des Spektrogramms mit der Darstellung des Frequenzspektrums. Hier können zum Beispiel auch Schnitte einer Aufnahme nach dem Umkopieren mit Hilfe des
immer noch vorhandenen Schnittimpulses nachgewiesen werden. Weitere Möglichkeiten
zur Identifizierung von Aufnahmegeräten sind die Parameter Spurhöhe, Spurlage, Bandgeschwindigkeitsabweichung, Start und Stopp der Aufnahme, Stärke und Frequenz der
Vormagnetisierung. Für die übliche Hochf 06.01.2017requenzvormagnetisierung wurden
keine quarzstabilen Oszillatoren eingesetzt, sodass je nach Alter der Bauteile und Bauelementtoleranzen Frequenzvariationen auftreten können. Andere gerätespezifische Eigenschaften sind der Signalrausch-Abstand bzw. -stör-Abstand, der bei durchschnittlichen
Geräten um die 40 db liegt. Ebenso kann der Frequenzgang ein charakteristisches Merkmal darstellen. Dieser wird definiert mit unterer und oberer Grenzfrequenz, die sich aus
der Gerätekonstruktion, Schaltungstechnik, Bandgeschwindigkeit und der eingestellten
Spurlage des Tonkopfes ergeben und gerätespezifisch sind. Damit kann ein Rückschluss
auf ein eventuell verwendetes spezifisches Gerät erfolgen.
224
H. Luge
Zur Ermittlung der Manipulation digitaler Audiodaten kann die Höranalyse, Amplituden- und Frequenzanalyse und eine Formantstrukturanalyse durchgeführt werden. Die
Manipulation von digitalen Audiodaten unter Nutzung entsprechender Audiosoftware
zum Löschen, Schneiden und Einfügen ist relativ einfach möglich.
Alle Manipulationen des Audiomaterials wie Schneiden, Löschen, Einfügen und Enoder Decodierung hinterlassen jedoch Spuren in den Audiodateien. Diese Veränderungen,
wie zum Beispiel eine andere Netzfrequenz (ENF-Analyse) oder der Einsatz eines anderen
Mikrofons, können erkannt werden.
Eine wichtige Methode zur Echtheitsprüfung ist die ENF-Analyse des digitalen Audiomaterials bei der das Netzfrequenzrauschen untersucht wird. Für Teile der Welt wie
Europa, Asien, Afrika, Australien gilt eine Netzfrequenz von 50 Hz, während für große
Teile von Amerika eine Frequenz von 60 Hz gilt. Diese Netzfrequenz schwankt je nach
Region, Tageszeit und Netzbelastung um bis zu 1 Hz. Bei starker Netzbelastung sinkt die
Netzfrequenz ab. Diese Schwankungen verursachen bei angeschlossener Audiotechnik ein
Rauschsignal, das für die ENF-Analyse verwendet werden kann. Durch den Vergleich der
von den Netzbetreibern aufgezeichneten Frequenzänderungen mit dem Frequenzrauschen
von Aufzeichnungen kann der Ort und die Uhrzeit der Aufzeichnung validiert werden.
Neuere Forschungen auf dem Gebiet der Audioforensik vermindern die Einflüsse
von niedrigem Signal-Rausch-Verhältnis und kurzen Audioaufzeichnungen durch neue
schwellwertbasierte dynamische Algorithmen [3]. Weitere Methoden sind die Untersuchung von Artefakten auf Basis des akustischen Nachhalls und des Hintergrundrauschens.
Dieses Verfahren der Dynamic Acoustic Environment Identification (AEI) kann über Raum
und Zeit der Aufnahme Aussagen ermöglichen [8].
Auch der Einsatz von zusätzlichem Rauschen, Lärm und Umgebungssignalen kann
verwendet werden, um Manipulationsversuche zu verschleiern. Auch das Problem der modifizierten und getarnten Originalstimmen durch Veränderung des Frequenzspektrums des
Sprachsignals als sogenannte disguised voices kann mit einer relativ hohen Trefferquote
durch neue Verfahren basierend auf den Mel Frequency Cepstrum Coefficients (MFCC) in
einer Analyse gelöst werden [14].
Auch die Schusswaffenerkennung und Kalibererkennung durch audioforensische Untersuchungen des aufgenommen Audiosignal wurde bereits untersucht [12]. Durch den
Einsatz digitaler Aufzeichnungsverfahren in Überwachungskameras, Smartphones und
der aktuellen digitalen Audiotechnik wird umfangreiches Audiomaterial in digitalen Medien (Festplatte, USB usw.) aufgezeichnet und als Archivmaterial bereitgestellt. Diese
digitalen Formate können mit entsprechender Audiosoftware leicht bearbeitet oder auch
verfälscht werden. Zum Schutz gegen diese Verfälschungen gibt es verschiedene Verfahren die einerseits auf kryptografischen Protokollen und Verschlüsselung basieren und
andererseits auf der Auswertung und Einbettung von inhaltsbasierten Merkmalen in die
Audiodatei. Die beiden Ansätze zur Generierung von digitalen Wasserzeichen zum Schutz
des Audiomaterials sind inhaltsfragile Wasserzeichen und invertierbare Wasserzeichen.
Bei den inhaltfragilen Wasserzeichen werden Inhaltsinformationen des Audiomaterials
in das Audiomaterial eingebettet und zur Erkennung von Manipulationen verwendet. In-
8
Audioforensik
225
vertierbare Wasserzeichen haben durch den Einsatz von kryptografischen Verfahren ein
hohes Sicherheitsniveau. Der ausschließlich kryptografische Ansatz, bei dem zum Beispiel im einfachsten Fall die Audiodatei mit einem symmetrischen Verschlüsselungsverfahren (AES, Blowfish etc.) verschlüsselt und anschließend als verschlüsselte Audiodatei
abgespeichert wird, hat leider auch Nachteile, da die Audiodatei vor der Benutzung erst
entschlüsselt werden muss. Der Einsatz von digitalen Signaturen zeigt bei einer Formatwandlung zum Beispiel vom wav-Format in das mp3-Format auch eine unerlaubte
Manipulation an, da durch die verlustbehaftete Kompression digitale Datenbestandteile
verloren gehen. Hauptproblem ist das Fehlen von Informationen über die Integrität des
Audiomaterials im Audiomaterial selbst. Die Lösung ist der Einsatz digitaler Wasserzeichen. Ein digitales Wasserzeichen setzt mit einem Einbettungsalgorithmus ein nicht
erkennbares Muster in das Audiomaterial unter Verwendung eines geheimen Schlüsselcodes ein. Die Auswertung des digitalen Wasserzeichens gestattet es festzustellen, ob
das Audiomaterial oder bestimmte Zusatzinformationen wie zum Beispiel die Metadaten
manipuliert wurden. Der Einsatz von sich selbst verifizierenden inhaltsfragilen digitalen
Wasserzeichen bietet die Möglichkeit, ohne einen geheimen Schlüssel Inhaltsinformationen der Audiodatei zu einem Fingerprint zu berechnen und in die Audiodatei mit
einem Wasserzeichenverfahren einzubetten. Bei einer späteren Verifikation der Echtheit
der Audiodatei wird der Fingerprint aus den Inhaltsmerkmalen neu berechnet, mit dem
vom Wasserzeichenverfahren eingebauten Fingerprint verglichen und bei Übereinstimmung die Echtheit bestätigt. Für die Auswahl der inhaltsabhängigen Audiomerkmale zur
Berechnung des Fingerprint einer Datei bzw. eines Dateiabschnitts sollen folgende Forderungen erfüllt werden. An erster Stelle steht die Stabilität des digitalen Fingerprints
bei geringen und erlaubten Modifikationen wie verlustbehaftete Kompression, zusätzliche
Rauschsignalanteile, geringe Änderung der Abtastrate und Dynamikkompression. Der digitale Fingerprint sollte Angriffe auf das Einbettungsverfahren durch Änderung seines
Fingerprint anzeigen können. Ein grundlegender Ansatz inhaltsrelevante Merkmale für
den Fingerprint zu gewinnen ist, wie auch bei der Spracherkennung, die Bestimmung der
Grundfrequenz bzw. der Stimmbandgrundschwingung. Dazu gibt es mehrere Verfahren,
wie das harmonische Produktspektrum (HPS) und die Phasenraumdarstellung. Insbesondere das harmonische Produktspektrum basiert auf den gleichen Ansätzen der Analyse
wie das Fourier-Spektrum mit Grundwelle f und den harmonischen Oberwellen 2f ,
3f , 4f usw. mit abnehmenden Amplituden. Bei der HPS-Analyse wird durch mehrfache Unterabtastung und Multiplikation der unterabgetasteten Spektren die Grundfrequenz
im Spektrum erkannt.
8.3.3 Formantanalyse und Spracherkennung
Eines der Hauptprobleme der Audioforensik ist die Sprach- und Sprechererkennung sowie der Stimmenvergleich. Zur Lösung dieser Aufgabenstellung gibt es die Ansätze zur
Bestimmung der Grundfrequenz der Stimmbandgrundschwingung, der Formantanalyse
226
H. Luge
Abb. 8.5 Einbettung Fingerprint aus Inhaltsmerkmalen in eine Audiodatei
und der Bestimmung der Cepstrumkoeffizienten. Das menschliche Sprachsignal kann verschiedenen Klängen zugeordnet werden [9]. Ein Klang bzw. eine akustische Artikulation
kann für allgemeine periodische Signale nach Charles Fourier als die Summe von Sinusund Kosinuswellen beschrieben werden. Dabei sind die Frequenzen der einzelnen Wellen
ganzzahlige Vielfache einer Grundfrequenz f0 also 2f0 , 3f0 , 4f0 und weitere Vielfache. In Abb. 8.6 ist der Aufbau eines Klangsignals bestehend aus drei Sinussignalen mit
den Frequenzen f0 D 40 Hz, f1 D 80 Hz und f2 D 120 Hz mithilfe des Arbiträrgenerators NET167 dargestellt. Der Arbiträrgenerator NET167 führt eine direkte digitale
Signalsynthese (DDS) einer in Excel erzeugten Abtastwertetabelle von 256 Werten aus.
Die Ausgabe erfolgt mit einem 16-Bit-DA-Wandler. Die obere blaue Sinusschwingung
stellt dabei die Grundfrequenz dar, die untere die Fouriersynthese aus den drei Sinusschwingungen zu einem Klang (Abb. 8.6). Abb. 8.7 zeigt die Bestandteile der direkten
Abb. 8.6 Klangerzeugung durch direkte digitale Signalsynthese von drei Sinusschwingungen mit
einem Arbiträrgenerator
8
Audioforensik
227
Abb. 8.7 Darstellung der Abtastwerte der einzelnen Signalkomponenten und dem daraus synthetisierten Klang (blau)
digitalen Signalsynthese mit den gewichteten drei Einzelschwingungen f0 (rot), f1 (grün),
f2 (violett) und der resultierenden Syntheseschwingung (blaue Kurve). Die Berechnung
der Abtastwerte erfolgt nach der Formel XYZ. Je nach gewählter Abtastfrequenz des Arbiträrgenerators können aus den 256 generierten Werten verschiedene Frequenzen, bei
gleichbleibender Signalform, erzeugt werden. Bei 256 Abtastwerten und einer Abgabefrequenz von 10.240 Hz ergibt sich damit eine Frequenz von 10:240=256 D 40 Hz für
die Grundschwingung und damit auch für das synthetisierte Klangsignal. In der folgenden Syntheseformel (Gl. 8.1) zum Aufbau der Tabelle für den Arbiträrgenerator sind die
Grundschwingung fo und die erste und zweite Oberwelle dargestellt:
2
65534
U.t/ D 0; 45 cos
A11
C 32768
256
2
2 2
65534
C 0; 15
cos
A11
2
256
3 2
65534
C 0; 4
cos
.A1 1/
2
256
(8.1)
228
H. Luge
Abb. 8.8 Spektralanalyse des
Klangs eines synthetisierten
Audiosignals mit einem Arbiträrgenerator
Umgekehrt bietet die Fourier-Analyse die Möglichkeit, die einzelnen Frequenzanteile
eines Klangs zu berechnen. Das Ergebnis dieser Spektralanalyse kann in einem Spektrogramm dargestellt werden. Bei der Spektralanalyse des oben gezeigten Klangs können
damit die Frequenzbestandteile sichtbar analysiert werden. Mit entsprechenden Spektrumanalysatoren ist es zudem möglich über die Frequenzachse (x-Achse) auch die Amplituden der einzelnen Frequenzkomponenten in der y-Achse darzustellen. Mit der Audioanalysesoftware Praat sind die einzelnen Signalkomponenten des synthetisch erzeugten Klangs in Abb. 8.8 mit den Komponenten 40, 80 und 120 Hz dargestellt. Auch die
menschliche Sprache stellt ein Frequenzgemisch aus mehreren im Vokaltrakt des Menschen resonanzartig hervorgehobenen Frequenzen, den sogenannten Formanten, dar. Die
Bildung des menschlichen Sprachsignals erfolgt in zwei Phasen – erstens einer Anregung
durch einen Luftstrom aus den Lungen und zweitens der Signalformung im Sprechtrakt
bzw. Vokaltrakt. Es werden folgende drei Grundarten der Anregung des Vokaltraktes
unterschieden: Erstens die stimmhafte Anregung als Phonation, zweitens die stimmlose Anregung als Reibe- oder Friktionsgeräusch und drittens die transiente Anregung als
Plosivanregung. Bei der Phonation wird ein Luftstrom im Kehlkopf durch die Stimmbänder so verändert, dass eine quasiperiodische, nicht sinusförmige Schwingung entsteht. Die
Phonation ist das grundlegende Ausgangssignal für Sprache und Gesang. Bei der stimmlosen Anregung durchströmt die Luft bei geöffneten Stimmbändern eine Engstelle im Mund
oder Rachenraum, und es entsteht eine turbulente Strömung in Form eines Rauschens.
Das erzeugte Rauschen bildet das Anregungssignal bei stimmloser Anregung. Das entstehende akustische Signal hängt von der Stellung des Rachenraums ab. Bei transienter
Anregung wird im supraglottalen System ein Verschluss aufgebaut, der dann plötzlich geöffnet wird. Die angestaute Luft mit Überdruck erzeugt das sogenannte Plosivgeräusch.
Der Vokaltrakt kann auch physikalisch als Rohr betrachtet werden, das an einem Ende
geschlossen und am anderen Ende offen ist (Mundöffnung). Ist dies der Fall, stellen sich
Resonanzen für bestimmte Anregungsfrequenzen ein. Dies wiederum entspricht einem
Filter mit geringer Güte. Diese Resonanzfrequenzen folgen der Bedingung, dass genau
8
Audioforensik
229
Abb. 8.9 Formantanalyse des Vokals „a“ mit F1 D 290 Hz und F2 D 854 Hz bei t D 1; 20 s
ein ungeradzahliges Vielfaches einer Viertelwelle in das Rohr bzw. den Vokaltrakt passt.
Diese Resonanzfrequenzen werden als Formantfrequenzen F1 , F2 und F3 bezeichnet. Mit
der Gl. 8.2 können die Formatfrequenzen berechnet werden. Mit der Schallgeschwindigkeit von c D 343 m=s, einer Vokaltraktlänge von ca. 17 cm (Männer) ergeben sich für
k D 1 bis 3 die Formantfrequenzen F1 D 504 Hz, F2 D 1008 Hz und F3 D 1513 Hz. Für
Frauen ergeben sich aufgrund der kürzeren Vokaltraktlänge von ca. 14,5 cm entsprechend
höhere Formantfrequenzen:
.2k 1/ c
(8.2)
Fk D
4l
Durch Verengungen bzw. Veränderungen des Vokaltraktes, zum Beispiel durch Muskelkontraktion m Rachenraum für den Vokal „a“, verändern sich auch die Formantfrequenzen. Abb. 8.9 zeigt die spektrale Analyse des gesprochenen Vokals „a“ mit der Audioanalysesoftware Waveserver und den Formantfrequenzen F1 = rot , F2 = grün, F3 =
blau und F4 = gelb. Zum Zeitpunkt t D 1;2 s können die Formantfrequenzen F1 D
290 Hz und F2 D 854 Hz erkannt werden. In Abb. 8.10 ist die Darstellung der Stimmbandgrundschwingung mit 127 H z zur Zeit t D 1; 1 s während der Aussprache des
Vokales „a“ dargestellt. Die Formantfrequenzen sind von der Sprache (deutsch, englisch
usw.) und vom Sprecher abhängig. Die Zuordnung eines Vokals kann schon durch die
zwei Formantfrequenzen F1 und F2 relativ treffsicher durchgeführt werden. Dafür können
Formantdiagramme bzw. Formantkarten mit F1 in der x-Achse und F2 in der y-Achse
230
H. Luge
Abb. 8.10 Darstellung der
Stimmbandgrundschwingung
einer Sprachaufzeichnung
(127 Hz bei t D 1; 1 s)
verwendet werden. In Abb. 8.11 ist der gesprochene Vokal „i“ mit deutlichem Abstand
der Formantfrequenzen F1 D 299 Hz und F 2 D 2393 Hz zum Zeitpunkt t D 4; 1 s
dargestellt. Für die Audioforensik von Telefongesprächen mit der Bandbreite von 0,3
bis 3,4 kHz können bestimmte F1 Formantfrequenzen von Vokalen (u, i) schon außerhalb des Übertragungsbereiches sein und nicht mehr korrekt übertragen werden. Ebenso
ist die dritte Formantfrequenz F3 D 3391 Hz im obigen Beispiel schon am oberen Ende des Übertragungsfrequenzbereiches von 3,4 kHz angelangt und wird gedämpft. Die
Formantanalyse kann zur Sprach- und Sprechererkennung benutzt werden. Aufgrund von
anatomischen Unterschieden von Sprechern sind die Stimmbandgrundschwingung und
die Formantfrequenzen sprecherabhängig und können zur Sprecheridentifikation verwendet werden.
Abb. 8.11 Formanten des Vokals „i“ mit F1 D 299 Hz und F2 D 2393 und F3 D 3391 Hz bei
t D 4; 10 s
8
Audioforensik
231
8.3.4 Sprachverschlüsselung
Die menschliche Sprache bietet nicht nur die Möglichkeit, Information auszutauschen,
sondern zeigt zusätzlich über die Erkennbarkeit der menschlichen Stimme die Authentizität des Sprechers. Nach der Erfindung des Telefons gab es bereits 1881 ein erstes Patent
zur sicheren Sprachübertragung. Es sollten mehrere umschaltbare Übertragungsleitungen
eingesetzt werden, was damals aber praktisch nicht realisierbar war. Zur sicheren Funkübertragung von Telefongesprächen in die USA in den 1920er Jahren wurden als Erstes
sogenannte Bandinverter entwickelt, die das Telefonfrequenzband von 300 bis 3400 Hz
einfach invertierten. Einfache Bandinverter sind zwar ganz unverständlich haben aber
den Nachteil, dass keine echte Verschlüsselung stattfindet. Diese einfachen Bandinverter
waren der Beginn der Verschlüsselung durch Frequenzpermutation, auch als „Frequency Domain Scrambling“ bezeichnet. Bandsplitter war die nächste Entwicklung, um die
einfache Rückinvertierung des Sprachsignals wie beim Bandinverter zu erschweren. Hier
wird das Sprachfrequenzband in mehrere Frequenzbänder aufgeteilt, die dann in ihrer
Reihenfolge bezüglich der Lage im Sprachfrequenzband vertauscht oder wahlweise noch
invertiert werden. In Abb. 8.12 ist das Arbeitsprinzip dieser Bandsplittersysteme dargestellt. Das Funktionsprinzip der Bandsplittertechnik in Form des Bell-A3-Scramblers
sicherte zum Beispiel ab 1937 die Telefonverbindung San Francisco-Honolulu, und weitere folgten. Beim Bell-A3-Scrambler erfolgte die Aufteilung in sechs Frequenzbereiche,
die dann entsprechend permutiert und invertiert werden konnten. Beim Bell A3 Scrambler
mit sechs Frequenzbereichen ergeben sich damit folgende theoretische Codemöglichkeiten: 1.) 6Š D 1 2 3 4 5 6 D 720 mögliche Vertauschungen der Frequenzabschnitte und
2.) 26 D 222222 D 64 Kombinationen, ob invertiert oder nicht invertiert ergeben sich
720 64 D 46:080 theoretische Codemöglichkeiten. Diese Codemöglichkeiten sind aber
nicht alle anwendbar, da die Vertauschungseffekte aus Sicht der Sprachunverständlich-
Abb. 8.12 Funktionsprinzip der Bandsplittertechnik mit vier Frequenzbereichen zur Sprachverschlüsselung
232
H. Luge
keit oft zu gering sind. Eine einfache Möglichkeit der Kryptanalyse dieser Bandsplitter
ist das parallel listening bei dem das codierte Sprachsignal und eine invertierte Version des Sprachsignals zur selben Zeit gehört werden. Durch das gemeinsame Hören kann
das Sprachsignal verständlich werden. Das System Bell-A3-Scrambler wurde 1941 durch
Kurt Vetterlein (Reichspost–Forschungsanstalt) geknackt. Der Ansatz zum Brechen der
Sprachverschlüsselung des Bell-A3-Scramblers war das Auffinden der Stimmbandgrundschwingung des Sprechers, das Erkennen der Teilbandbreite der sechs Audiofrequenzbänder und eine Formantanalyse. Mit dem SIGSALY-System entstand 1943 das erste
digitale Sprachverschlüsselungssystem. Die Entwicklung erfolgte in den Bell Labs, aufbauend auf Arbeiten zum Vocoder (Voice Coder). Beim SIGSALY-System wurden 10
Frequenzbänder alle 20 ms abgetastet und das Ergebnis zu einer zufälligen Schlüsselsequenz addiert. Die große benötigte Schlüsselmenge wurde erzeugt durch die Abtastung
des thermischen Rauschens von Quecksilberdampfgleichrichtern und der Quantisierung
in sechs Stufen. Diesen sechs Stufen wurden sechs Audiofrequenzen zugeordnet und als
Schlüssel für eine Chiffrierung auf Schallplatten gepresst. An einer leichteren, mobileren
und britischen Version zur Sprachverschlüsselung mit dem Namen „DELILAH“ arbeitete ab 1943 A. Turing. Turing wählte eine maschinelle Schlüsselerzeugung bestehend
aus Rotorwalzen und Steckerfeld für zusätzliche Permutationen, um gegen Kryptanalyse sicher zu sein. Der Audiofrequenzbereich von 250 bis 2000 Hz wurde durch einen
Eingangsbandpass beschränkt, um mit einer Abtastfrequenz von 4000 Hz entsprechend
dem Abtasttheorem arbeiten zu können. Die 4000 Abtastwerte wurden quantisiert und
zu einer Schlüsselwertfolge addiert. Das System hatte aufgrund der Bandbegrenzung von
0,25 bis 2 kHz eine schlechte Sprachverständlichkeit. Die Weiterentwicklung im Bereich
der analogen Sprachverschlüsselung in den 1950er und 60er Jahren basierten auf dem
Einsatz von Kombinationen von Verfahren zur Zeittransposition (Time Domian Scrambling) und Frequenzpermutation (Frequency Domain Scrambling) [1, 11]. In Abb. 8.13 sind
wesentliche funktionale Komponenten in einer möglichen Anordnung dargestellt. Das Mikrofonsignal bzw. Sprachsignal wird über einen Verstärker mit Dynamikkompression an
eine Filterbaugruppe zur Selektion von dem oberen und unteren Halbkanal angeschlossen. Dann folgt eine Modulatorbaugruppe, die eine Frequenzinvertierung bzw. Frequenzverschiebung der originalen Sprachfrequenzen in andere Frequenzbereiche durchführen
kann. Für die Blocksynchronisation wird eine Synchronfrequenz in bestimmten zeitlichen
Abständen zugemischt und das Sprachsignal an den Ausgang übertragen. Zur Übertragung zusätzlicher Informationen können auch FSK-Verfahren, zum Beispiel mit zwei
Frequenzen zur Synchronisation und der Übertragung von zusätzlichen digitalen Datenströmen mit geringer Bitrate, verwendet werden. Diese Kombinationen der Modulatoren,
Filter, Zeitverzögerungsglieder und die schlüsselabhängig steuerbaren Analogumschalter
zur Vertauschung vom oberen und unteren Halbkanal können auch mehrfach hintereinander angeordnet werden. In Abb. 8.13 sind die wesentlichen Komponenten zur Zeittransposition als Time Domain Scrambling mit den Zeitverzögerungsgliedern und die
Frequenzpermutation mit den Modulatoren und Filtern als Frequency Domain Scrambling
dargestellt. Eine höhere Komplexität wurde durch den Einsatz mehrerer Zeitverzöge-
8
Audioforensik
233
Abb. 8.13 Übersicht zu möglichen Funktionsgruppen einer
analogen Sprachverschlüsslung
der 1960er Jahre
rungsglieder mit unterschiedlichen Verzögerungszeiten erreicht. Mit der Entwicklung der
Digitaltechnik und der AD-Wandler und DA-Wandler konnte auch die Sprachverschlüsselung digital realisiert werden. Die rein digitalen Verschlüsselungsverfahren benötigen
aber einen digitalen Übertragungskanal (LAN, WLAN, Internet, Mobilfunknetze usw.),
da keine analoge Frequenzinformation mehr übertragen wird. Bei der Nutzung digitaler Netze wird nach einer Quellen-, Kanal- und Leitungscodierung die Übertragung über
einen digitalen Übertragungskanal durchgeführt. In Abb. 8.14 ist der prinzipielle Aufbau
einer digitalen Sprachverschlüsselungslösung aufgezeigt. Als Übertragungskanal kann für
eine digitale Verschlüsselung mit digitalem Übertragungskanal zum Beispiel das Internet
genutzt werden. Für die analoge Sprachverschlüsselung mit den Verfahren Zeittransposition und Frequenzpermutation wird nur ein analoger Kanal mit Telefonbandbreite 0,3 bis
3,4 kHz benötigt. Die analoge Sprachverschlüsselung benötigt nur schmalbandige Über-
Abb. 8.14 Prinzipieller
Aufbau der digitalen Sprachverschlüsselung
234
H. Luge
Abb. 8.15 Aufteilung einer Blocklänge in Symbole für das Time-Domain-Scrambling-Verfahren
Abb. 8.16 Symboltransposition für das Time Domain Scrambling Verfahren im Zeitbereich
tragungskanäle wie zum Beispiel einen einfachen Telefonanschluss, das Mikrofon und
Audioausgang eines Smartphones, Sprechfunkkanäle (2-Meter-Band, weltweiter Kurzwellenfunk usw.), um eine Verbindung zu realisieren. Da die Installation nur im niederfrequenten Pfad erfolgt, ergibt sich eine echte Ende-zu-Ende Sprachverschlüsselung. Diese
kann durch den Zugriff auf den Übertragungsweg bei einer angenommenen effektiven
Verschlüsselung nicht ohne Mehrdeutigkeiten kompromittiert werden. Mit den aktuellen
Möglichkeiten der digitalen Signalverarbeitung können komplexe Methoden und Varianten der Zeittransposition und Frequenzpermutation durchgeführt werden, die eine hohe
taktische Sicherheit bedeuten können. Zur Durchführung des Time-Domain-ScramblingVerfahrens wird eine Blocklänge von zum Beispiel 800 ms und eine Anzahl von Symbolen
definiert. Die Anzahl der Symbole definiert zusammen mit der Blocklänge die Symbolzeit. In Abb. 8.15 ist die Blocklänge als Ausschnitt aus dem Zeitbereich des Audiosignals
mit der Einteilung in vier Symbole mit je 200 ms Symbolzeit dargestellt. Dann erfolgt
die Zeittransposition der einzelnen Symbole entsprechend einem Schlüsselverfahren wie
in Abb. 8.16 dargestellt. Um eine möglichst hohe Sicherheit zu erreichen, sollte eine
kurze Symbolzeit deutlich unter 20 ms gewählt werden, um eine Formantanalyse zu erschweren und eine große Zahl von Mehrdeutigkeiten zu realisieren. Aus dem Schlüssel
8
Audioforensik
235
Abb. 8.17 Testaufbau „HL97“
zur Sprachverschlüsselung mit
LPC1768
wird eine Transpositionstabelle berechnet, die aus den theoretischen Möglichkeiten der
Kombinationen nur einen geringen Prozentsatz (ca. 15 %) verwenden kann, da nicht alle
Zeittranspositionen auch zur Unverständlichkeit des verschlüsselten Sprachsignals führen.
Die theoretischen Möglichkeiten ergeben sich aus Fakultät der Symbolanzahl. Für 400
Millisekunden Blocklänge und 40 Symbole ergeben sich bei einer Symbolzeit von 10 Millisekunden theoretische 40Š D 8; 11047 Transpositionsmöglichkeiten. Auf der Gegenstelle müssen dann diese Zeittranspositionen wieder rückwärts ausgeführt und die originale
Reihenfolge der Sprachsymbole wieder hergestellt werden. Dafür wird im Regelfall eine
Blocksynchronisation zur Erkennung jedes Blockanfangs notwendig. Das kann zum Beispiel durch Einsatz eines Synchronimpulses in Form der Übertragung einer Tonfrequenz
bestimmter Länge im oberen Sprachbandbereich erfolgen. Dieser Synchronimpuls wird
von der Gegenstelle erkannt und entsprechend zur Timersynchronisation benutzt, die den
Blockanfang dann markiert. In Abb. 8.17 ist der Einsatz eines leistungsfähigen Mikrocontrollers LPC1768 [6] zur analogen Sprachverschlüsselung im System „HL97“ für einen
Testaufbau als Ende-zu-Ende-Verschlüsselung mit zwei Smartphones über die analogen
Ein- und Ausgänge des Smartphones dargestellt. Die Blocklängen wurden mit 400 ms
und 40 Symbolen sowie 800 ms und 80 Symbolen bei der Übertragung über das Mobilfunknetz getestet. Die Blocksynchronisation im Testaufbau erfolgt mit einem Tonsignal
von 1,6 kHz und 25 ms Länge. Das Synchronisationssignal wird durch digitale Signalverarbeitung der Abtastwerte erkannt und timergesteuert aus dem Empfangspuffer entfernt.
Die übrigen Abtastwerte werden dann über die Synchronisation und die Erkennung des
Blockanfangs wieder in die originale Reihenfolge transponiert. Dann erfolgt die Ausgabe
der Abtastwerte über den 10-Bit-DA-Wandler mit einem angeschlossenen Tiefpassfilter.
Bei hoher Symbollänge im Time-Domain-Scrambling-Verfahren von 20 ms und größer
kann allerdings noch eine Sprechererkennung durchgeführt werden. Um dieses Problem
zu beseitigen, kann eine Kombination mit einer Frequenzpermutation in einem Frequency
Domain Scrambling Verfahren realisiert werden. Die eingesetzten Verfahren sind unabhängig von ihrer praktischen Realisierung in Analogtechnik oder durch digitale Signal-
236
H. Luge
Abb. 8.18 Funktionsgruppen
des Senders einer der analogen
Sprachverschlüsselung HL97
verarbeitung ähnlich den bereits beschriebenen Verfahren zur Frequenzpermutation. In
Abb. 8.18 sind die Funktionsgruppen des Senders der analogen Sprachverschlüsselung
dargestellt. Die Sicherheit von Time-Domain-Scrambling-Verfahren mit hoher Symbolanzahl und Blocklänge ist höher zu bewerten als Frequency-Domain-Scrambling-Techniken.
Je höher die Blocklänge, desto geringer ist natürlich auch der Telefonkomfort, da mindestens diese Zeit das Gespräch verzögert bei dem Gesprächspartner empfangen werden
kann. Auch die Symbolanzahl spielt für die Sprachverständlichkeit eine entscheidende
Rolle, da mit steigender Symbolzahl die Verzerrungen bzw. der Klirrfaktor des Gesprächs
zunimmt. In Abb. 8.19 ist ein im Jahr 2014 durchgeführter Versuchsaufbau zum Test einer
analogen Sprachverschlüsselung nach dem TDS-Verfahren mit zwei Smartphones über
ein Mobilfunknetz dargestellt. Die Verbindung arbeitete über eine Stunde stabil und die
subjektive Sprachverständlichkeit war gut bis befriedigend je nach Symbolanzahl. Getestet wurde mit einer Blocklänge von 800 Millisekunden und 40 und 80 Symbolen. Das
Synchronsignal von 1,6 kHz hatte beim Empfang am Ausgang der Audiobuchse bedingt
durch das Mobilfunknetz als Übertragungskanal einige Deformationen, konnte aber durch
das Synchronverfahren sicher detektiert werden. Zur Synchronisation können auch mehrere Frequenzen verwendet werden, um eine sichere Erkennung des Synchronsignals zu
8
Audioforensik
237
Abb. 8.19 Testaufbau einer analogen Sprachverschlüsselung mit zwei Smartphones und einer
Ende-zu-Ende-Verschlüsselung
realisieren. Damit können zufällig auftretende Signalanteile des Audiosignals mit gleicher Frequenz und ausreichender Länge nicht zu Störungen der Synchronisation führen
und gleichzeitig können damit auch codierte Informationen geringer Bitrate übertragen
werden. In Abb. 8.20 ist eine Analyse mit dem Programm Waveserver eines mit dem
Verfahren Time-Domain-Scrambling verschlüsselten Signals mit einer Blocklänge von
1000 ms und einer Symbolzeit von 25 ms sowie 10 ms bei 40 bzw. 100 Symbolen dargestellt. Sehr deutlich ist die Symbolzeitlänge im Diagramm erkennbar.
Abb. 8.20 Analoge Sprachverschlüsselung mit 25 (links) und 10 (rechts) ms Symbolzeit
238
H. Luge
Literatur
1. French, R.C.: Speech scrambling and synchronization. Ph.D. thesis, Council for National Academic Awards (1973)
2. von Grünigen, D.C.: Digitale Signalverarbeitung, Bd. 2. Fachbuchverl. Leipzig im Carl-Hanser
(2002)
3. Hua, G., Goh, J., Thing, V.L.: A dynamic matching algorithm for audio timestamp identification
using the enf criterion. Information Forensics and Security, IEEE Transactions on 9(7), 1045–
1055 (2014)
4. Jessen, M.: Phonetische und linguistische Prinzipien des forensischen Stimmenvergleichs. LINCOM Europa (2012)
5. Kahn, D.: The codebreakers: The story of secret writing. The Macmillan Company (1967)
6. Keil: Keil entwicklungssystem. http://www.keil.com (2014)
7. Koristka, C.: Magnettonaufzeichnungen und kriminalistische Praxis. Ministerium des Innern –
Publikationsabteilung (1968)
8. Malik, H.: Acoustic environment identification and its applications to audio forensics. Information Forensics and Security, IEEE Transactions on 8(11), 1827–1837 (2013)
9. Pierce, J.R.: Klang: Musik mit den Ohren der Physik. Heidelberg: Spektrum (1999)
10. Schneier, B.: Angewandte Kryptographie: Protokolle, Algorithmen und Sourcecode in C.
Addison-Wesley (1996)
11. Srinivasan, A., Selvan, P.A.: A review of analog audio scrambling methods for residual intelligibility. Innovative Systems Design and Engineering 3(7), 22–38 (2012)
12. Thumwarin, P., Matsuura, T., Yakoompai, K.: Audio forensics from gunshot for firearm identification. In: 4th Joint International Conference on Information and Communication Technology,
Electronic and Electrical Engineering (JICTEE) 2014, S. 1–4. IEEE (2014)
13. Vary, P., Heute, U., Hess, W.: Digitale Sprachsignalverarbeitung. BG Teubner Stuttgart (1998)
14. Wu, H., Wang, Y., Huang, J.: Identification of electronic disguised voices. Information Forensics
and Security, IEEE Transactions on 9(3), 489–500 (2014)
9
Methoden des maschinellen Lernens und der
Computational Intelligence zur Auswertung
heterogener Daten in der digitalen Forensik
Tina Geweniger, Marika Kaden und Thomas Villmann
9.1
Einleitung
Forensische Analysen beinhalten zunehmend die Auswertung digitaler Daten. Diese stehen in verschiedenster Form zur Verfügung. Beispiele sind digitale Bilddaten von Überwachungskameras und Fingerabdrücken, genetische Informationen, Täterprofile, biometrische und morphologische Personendaten, Personenbewegungsmuster, Beziehungsgraphen
oder Internetchatprotokolle. Aber auch Telefongesprächsprotokolle oder biochemische
Charakteristika diverser Stoffe werden in der digitalen Forensik einer komplexen Analyse
unterzogen. Dabei sind oft mehrere verschiedene Datenarten in Kombination auszuwerten. Diese bei Weitem unvollständige Aufzählung verdeutlicht, dass eine entsprechende
Datenanalyse mit dem Problem sehr heterogener Daten unterschiedlichster Strukturen
konfrontiert wird. In diesem Beitrag sollen wesentliche Datentypen der digitalen Forensik
charakterisiert und Methoden der Computational Intelligence (CI) zur adäquaten Problemlösung vorgestellt werden.
CI ist dabei als ein Arsenal von Methoden zu verstehen, welche adaptive mathematischstatistische Ansätze in sich vereint. Diese sind biologisch oder kognitiv motiviert und
stammen aus den Bereichen künstlicher neuronaler Netze, statistischer Lerntheorie oder
Fuzzy-Methoden. Sie haben sich seit den 1990er Jahren als Ergänzung oder Alternative
T. Geweniger M. Kaden
Mitglied der Computational Intelligence Group, University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: tgewenig@hs-mittweida.de
M. Kaden
E-Mail: kaden1@hs-mittweida.de
T. Villmann ()
Lehrstuhl für Computational Intelligence, University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: thomas.villmann@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_9
239
240
9
Methoden des maschinellen Lernens und der Computational Intelligence
zu Methoden der klassischen Statistik etabliert und erleben mit den Verfügbarkeiten des
mobilen Computings einen erneuten Aufschwung. Waren zunächst viele Methoden nur
heuristisch motiviert, stehen heute zumeist umfangreiche Theorien für die mathematische
Korrektheit der Ansätze zur Verfügung.
Schwerpunkt des vorliegenden Beitrags sind sogenannte prototypbasierte Methoden
zum Clustern und Klassifizieren (Mustererkennung) von Daten. Dabei verstehen wir unter dem Clustern das Gruppieren von Daten entsprechend inhärenter Strukturen (Cluster),
die jedoch vor der Datenanalyse nicht bekannt sind. Klassifizieren wird dagegen als das
Eingruppieren von Daten zu vorgegebenen Strukturen (Klassen) aufgefasst. Prototypbasierte Methoden zeichnen sich dadurch aus, dass Cluster oder Klassen durch prototypische Beispiele beschrieben werden, wobei diese Prototypen sowohl reale Objektbeispiele
sein können, aber auch hypothetische bzw. künstlich generierte Objekte. In diesem Sinne
erlauben prototypbasierte Methoden oft eine gute Modellinterpretation bzw. leicht nachvollziehbare Datenverarbeitung in der Anwendung.
In diesem Beitrag werden die einzelnen Methoden nur in wesentlichen Zügen beschrieben und deren grundlegenden Eigenschaften und Einsatzmöglichkeiten vorgestellt, um
den Leser nicht mit mathematisch-technischen Details zu überfrachten. Für vertiefende
und mathematisch präzise Beschreibungen wird an den entsprechenden Stellen auf die
Literatur verwiesen. Daher orientiert sich auch die Methodenauswahl an den Datencharakteristika, wie sie in der Forensik häufig anzutreffen sind. Dabei erheben wir keinen
Anspruch auf Vollständigkeit – weder bei den Datenstrukturen noch bei der Modellauswahl. Letztere orientiert sich einerseits an den vorliegenden Datenstrukturen, welche
wiederum unter mathematischen Aspekten vereinheitlicht dargestellt werden. Andererseits liegt der Fokus auf solchen Algorithmen und Modellen, die in der Forschungsgruppe
der Autoren entwickelt bzw. angewendet werden, ohne jedoch auf Hinweise zu anderen
Vorgehensweisen zu verzichten. Entsprechend werden zunächst häufig in der Forensik
anzutreffende Datenstrukturen im Sinne der Datenverarbeitung charakterisiert und entsprechende Aufgabenstellungen abgeleitet. Danach werden prototypbasierte Modelle und
Ansätze für diese Szenarien vorgestellt und erläutert.
9.2 Datenstrukturen und Datenähnlichkeit
9.2.1 Daten und Datenstrukturen in der Forensik
Viele personenbezogenen Daten in der Forensik liegen als numerische Werte vor, die auch
als numerische Variablen bzw. Merkmale bezeichnet werden. Diese können in einem Datenvektor v D .v1 ; : : : ; vD /T zusammengefasst werden, wobei die vk den Ausprägungen
der k-ten Variable und D der Anzahl der Variablen entsprechen. Beispiele solcher Variablen sind biometrische Merkmale, Alter, Einkommen etc. Aber auch psychosoziale
Persönlichkeitsmerkmale können als numerische Merkmale erfasst werden [4, 8]. Bilder,
z. B. Fingerabdruckbilder oder Aufnahmen der Iris des Auges, können mittels Merkmals-
9
Methoden des maschinellen Lernens und der Computational Intelligence
241
extraktion aus der Bildverarbeitung ebenfalls als Vektoren kodiert werden. Umfangreiche
Analysefilter werden in der Bildverarbeitung diskutiert. Als Beispiel seien hier die weit
verbreiteten SIF T -Merkmale (scale-invariant feature transformation, [31]) genannt, die
ein umfangreiches Spektrum an strukturellen, skaleninvarianten Bildeigenschaften quantifizieren und in einem Merkmalsvektor von Bildvariablen zusammenfassen [32]. Für Bilder
von Fingerabdrücken sei auf [33] verwiesen.
Nichtnumerische oder beschreibende Variablen vermitteln oder beschreiben semantische Eigenschaften wie z. B. Haarfarbe, Geschlecht, emotionaler Zustand oder auch
Blutgruppe, Tatmotiv bzw. Beruf einer Person. Solche deskriptiven Variablen sind oft
in vorgegebene Kategorien segmentiert. Beispielsweise liegen die verschiedenen Blutgruppen in natürlichen Kategorien vor. Emotionale Zustandskategorien könnten depressiv,
apathisch, cholerisch oder ähnliche beschreibende Attribute sein. Solche semantischen Variablen können oft mit einer Kategorienmenge beschrieben werden, welche die möglichen
Ausprägungen der Variable enthält. Wenn D solcher Ausprägungen zur Verfügung stehen, kann mit dem Prinzip der unären Kodierung einer solchen Variable wiederum ein
Datenvektor v D .v1 ; : : : ; vD /T generiert werden. Dabei entspricht jeder Vektoreintrag
der Ausprägung der jeweiligen Kategorie (0: keine Ausprägung und, 1: volle Ausprägung). Dabei sind auch graduelle Abstufungen möglich, d. h., allgemein gilt 0 vk 1,
und vk gibt die Ausprägungsstärke an.
Dieses Prinzip der vektoriellen Erfassung semantischer Variablen lässt sich u. a. auch
bei der Analyse von Texten einsetzen. Im datenanalytischen Sinn können Texte als Folgen von Symbolen und Symbolgruppen mit semantischer Bedeutung angesehen werden.
In der Forensik sind solche Texte z. B. transkribierte Telefonmitschnitte, Chatprotokolle, Printmedien oder HTML-Seitenbeschreibungen bzw. Internetverbindungsprotokolle.
Ein vorgegebenes Kategoriensystem umfasst die Menge von Schlüsselwörtern, d. h. vorgegebene Schlüsselsymbole oder -symbolgruppen, nach deren Vorkommen der Text zu
analysieren ist. In diesem Fall entspricht ein Vektoreintrag vk der relativen Häufigkeit
des Vorkommens des k-ten Schlüsselwortes. Diese Vorgehensweise wir auch als bag of
words bezeichnet und findet in der automatischen Sprachverarbeitung vielfache Anwendung [42]. Andere Anwendungsgebiete finden sich in der psychotherapeutischen Medizin
und Analyse, wo z. B. die Emotionalität von Texten mit solchen Analysemethoden quantifiziert wird [35].
Im molekularbiologischen Kontext können Gensequenzen mit der Abfolge der Nukleotidbasen Adenin, Thymin, Guanin und Cytosin als Texte verstanden werden [54]. Die
Symbole A; T; G; C entsprechen den Basen, und Symbolfolgen spiegeln die Basengruppierungen wider.
9.2.2
Datenähnlichkeit – mathematische Beschreibung
Zur Klassifizierung und zum Clustern von Datenobjekten müssen diese hinsichtlich ihrer
Ähnlichkeit bzw. Unähnlichkeit verglichen werden. Mathematisch bedeutet dies, dass ein
242
9
Methoden des maschinellen Lernens und der Computational Intelligence
geeignetes Ähnlichkeitsmaß zur Verfügung stehen muss. Zwei Objekte sind umso ähnlicher, je kleiner deren Ähnlichkeitswert ist. Dabei ist der minimale Ähnlichkeitswert 0,
welcher für identische Datenobjekte bzw. auch als Ähnlichkeitswert eines Objektes zu
sich selbst gilt.
Für Vektordaten v; w 2 RD mit D Merkmalsausprägungen (Dimension des Datenvektors) sind oft angewendete Ähnlichkeitsmaße die (quadratische) euklidische Distanz
dE .v; w/ D
D
X
.vk wk /2
(9.1)
d .v; w/ D 1 j .v; w/j ;
(9.2)
kD1
oder die Korrelationsähnlichkeit
wobei .v; w/ wahlweise der Korrelationskoeffizient nach Pearson oder Spearman
ist [41]. Jedoch sind auch andere Vergleichsmaße für Vektoren möglich [38]. Ein von
der euklidischen Distanz Gl. 9.1 abgeleitetes Ähnlichkeitsmaß ist die skalierte Variante
dE
.v; w/ D
D
X
k .vk wk /2
(9.3)
kD1
mit D .1 ; : : : ; D /T als Skalierungsvektor und nichtnegativen Skalierungsfaktoren
k 0. Entscheidende Variablen k können so mit großen Werten k gewichtet werden,
während weniger wichtige Variablen nur kleine Skalierungsfaktoren erhalten.
Gensequenzen werden oft bezüglich der Levenshtein-Distanz dL verglichen [30]. Zwei
Gensequenzen g 1 D b11 b21 b31 b41 : : : und g 2 D b12 b22 b32 b42 : : : können als Folge von Nukleotidbasen bjl aufgefasst und hinsichtlich ihrer gegenseitigen Überführbarkeit mittels elementarer Zeichenkettenoperationen (Einfügen, Löschen und Umbenennung) verglichen
werden.
Dabei
führt jede notwendige Operation zu einer Erhöhung des Ähnlichkeitswer1
2
tes dL g ; g [30].
Ein informationstheoretisches Ähnlichkeitsmaß für allgemeine digitale Objekte bietet
das mathematisch-universale Konzept der minimalen Beschreibungslänge lmin .O/ oder
die Kolmogorov-Komplexität. Letztere ermittelt, wie viel Information notwendig ist, um
eindeutig ein Objekt O zu beschreiben [28, 40]. Daraus lässt sich als Ähnlichkeitsmaß die
normalisierte Informationsdistanz dK ableiten, welche sich als normalisierte Kompressionsdistanz
lmin .T1 / C lmin .T2 /
dK .T1 ; T2 / D
(9.4)
lmin .T12 /
für Textobjekte T1 und T2 berechnen lässt [9]. Dabei entsteht der Text T12 D T1 ˚ T2
durch Hintereinanderschreiben der Texte T1 und T2 . Zur praktische Durchführung kann
die minimale Beschreibungslänge eines digitalen Objektes als die Bytezahl des digital
9
Methoden des maschinellen Lernens und der Computational Intelligence
243
komprimierten Objektes angenommen werden. Dabei sollte ein Kompressionsalgorithmus
basierend auf der mathematischen Theorie entsprechend dem Lempel-Ziv-Algorithmus
gewählt werden [55].
Verschiedene Ähnlichkeitsmaße können auch zu komplexen Maßen für Objekte zusammengefasst werden. Die einfachste, aber für viele Bereiche völlig ausreichende Möglichkeit, ist die Linearkombination
dLK .O1 ; O2 / D
M
X
l dl .O1 ; O2 /
(9.5)
lD1
von M verschiedenen Maßen dl .O1 ; O2 / mit Gewichtsfaktoren l 0 [56]. Die Schwierigkeit liegt hier in der Bestimmung geeigneter aufgabenbezogener Gewichtsfaktoren.
9.3
Aufgabenstellungen in der Datenanalyse
Die Analyse digitaler Daten kann unter verschiedenen Aspekten erfolgen. Das Auffinden
von inhärenten Strukturen in Datensammlungen und die entsprechende Zusammenfassung von entsprechend ähnlichen Objekten in Gruppen ohne die Verwendung weiterer
Zusatzinformationen wird als Clustern bezeichnet. Anwendungen sind z. B. das Gruppieren von Personen mit ähnlichen Persönlichkeitsprofilen in Datenbanken, Gruppieren von
Gensequenzdaten oder das Clustern von HTML-Webseiten. Dabei ist die Anzahl der Cluster von vornherein nicht bekannt und muss entweder durch den Analysten vorgegeben
oder während der Generierung des Clustermodels festgelegt werden. Dies kann sowohl
explizit, aber auch implizit durch interne Festlegungen von Schwellwerten oder die Auswertung anderer interner Kriterien erfolgen. Eine vollkommen automatische Bestimmung
ohne entsprechende A-priori-Annahmen gibt es nicht (mathematisch: ill-posed problem).
Die Gruppenzuordnung von Objekten kann sowohl eindeutig (crisp) oder auch graduell
(fuzzy) sein, je nach verwendetem Clustermodell.
Beim Klassifizieren von Objekten geht es um das Einordnen von Datenobjekten in
ein vorgegebenes Kategoriensystem fK1 ; : : : ; KNK g von NK Klassen Kl . Jedes Objekt
wird dann durch ein mathematisches Klassifikationsmodell einer oder mehreren Klassen
zugeordnet. Einzelne psychosoziale Persönlichkeitsprofile und Beziehungsmuster könnten z. B. bestimmten Straftatbeständen zugeordnet werden, bestimmte molekulargentische
Fingerabdrücke (Genexpressionsprofile) können mit spezifischen Krankheiten oder Beschwerdesymptomen assoziiert werden. Wie auch beim Clustern sind graduelle Zuordnungen zu den Klassen für einige Klassifikationsmodelle möglich (Fuzzy-Klassifizierung).
Die Generierung eines Klassifikationsmodells auf der Basis von Beispieldaten (Beispielzuordnungen) wird als Klassifikationslernen bezeichnet.
Die Generierung eines Vorhersagemodells von numerischen Werten y auf der Basis
vorhandener Werte v1 ; v2 ; : : : wird als Regressionsanalyse bezeichnet. In der CI wird
allgemeiner von Assoziationsanalyse gesprochen [25]. Beispielsweise kann die Aufga-
244
9
Methoden des maschinellen Lernens und der Computational Intelligence
be darin bestehen, ein Vorhersagemodell von Straftatwahrscheinlichkeiten auf der Basis
psychosozialer oder ortsabhängiger Variablen zu erstellen. Dazu gehören z. B. öffentliche
Mobilität, Einkommensstruktur und andere Aspekte. Eine weitere forensische Aufgabenstellung könnte die Bestimmung eines Tatzeitpunktes in Abhängigkeit biochemischer
Analysewerte sein. Die algorithmische Generierung eines solchen Modells anhand von
Beispieldaten wird als Assoziations- bzw. Regressionslernen bezeichnet [19].
Im Sinne der CI wird die Datenanalyse in unüberwachtes und überwachtes Lernen
unterschieden. Zum unüberwachten Lernen gehört das Clustern, während Klassifikationsprobleme und Regressionsanalyse dem überwachten Lernen zugeordnet werden.
9.4 Prototypbasierte Methoden der CI zum Clustern
und Klassifizieren
Prototypbasierte Methoden zum Clustern und Klassifizieren sind, obwohl oft mathematisch tiefgründig fundiert, intuitive Algorithmen basierend auf dem Stellvertreterprinzip.
Ein oder mehrere Prototypen repräsentieren ein Cluster oder eine Klasse. Die geeignete Adaption von Prototypen für eine gegebene Aufgabenstellung ist somit die zentrale
Aufgabe dieser Algorithmen während der Lernphase zur Generierung des entsprechenden Modells. In der Anwendungsphase werden die Daten gemäß dem Prinzip der größten
Ähnlichkeit geclustert bzw. klassifiziert.
Mehr formal betrachtet man eine Menge von NV Daten V D fv1 ; : : : ; vNV g und eine Menge W D fw1 ; : : : ; wNW g von NW Prototypen wj . Während der Generierung des
Modells werden die Daten als Beispiele verwendet, um die Prototypen zu lernen. in der
Anwendungsphase wird nach dem Stellvertreterprinzip ein ungelerntes Datenobjekt v dem
Prototyp zugeordnet, der zu v am ähnlichsten ist. Die Bestimmung dieses sogenannten
Siegerprototyps ws mit dem Index s erfolgt über die Regel
s D argmin d v; wj
(9.6)
j D1;:::NW
bezüglich eines gewählten Ähnlichkeitsmaßes d , z. B. die euklidische Distanz dE . Diese
Regel wird als Winner-takes-all-Regel (WTA-Regel) bezeichnet. Damit kann ein Datenobjekt einem Prototypen und damit einer Klasse oder einem Cluster bezüglich des
Ähnlichkeitsmaßes d eindeutig zugeordnet werden. Das Ähnlichkeitsmaß ist für die Aufgabenstellung geeignet auszuwählen. Alle Datenobjekte, die einem Prototypen wj mittels
der WTA-Regel Gl. 9.6 zugeordnet werden, nennt man Voronoi-Menge zu wj .
Die Generierung eines prototypbasierten Cluster- oder Klassifikationsmodells erfordert neben der Wahl des Ähnlichkeitsmaßes und der Anzahl NW der Prototypen, eine
der Aufgabenstellung angepasste Initialisierung der Prototypen. Oft wird dabei mit einer
zufälligen Konfiguration begonnen und diese dann sukzessive verbessert. Im Folgenden
werden einige Algorithmen zur Prototypenadaption vorgestellt. Dieser Adaptionsprozess
wird auch als Lernen oder Training des Modells bezeichnet.
9
Methoden des maschinellen Lernens und der Computational Intelligence
245
9.4.1 Prototypbasierte Clusteralgorithmen
Bei den folgenden Algorithmen handelt es sich einerseits um Methoden zur Analyse
vektorieller Daten. Andererseits sollen aber auch Daten, für welche eine vektorielle Repräsentation nicht möglich ist, z. B. Texte oder Gensequenzen, untersucht werden. Dafür
stehen sogenannte Median-Varianten der Algorithmen zur Verfügung. Deren Besonderheit besteht darin, dass als Prototypen repräsentative Datenelemente gewählt werden und
der Algorithmus nur auf Ähnlichkeiten zwischen Datenelementen basiert. Analog verhält
es sich auch für die informationstheoretische Methode Affinity Propagation, welche zum
Abschluss dieses Abschnittes kurz dargestellt wird.
Weiterhin wird zwischen der Art der Datenanalyse unterschieden. So ist es einerseits
möglich, über alle Daten zu mitteln, um diese gleichzeitig zu analysieren. Diese Art der
Analyse wird Batch-Verarbeitung genannt. Andererseits können die Daten auch sequentiell abgearbeitet werden, was den Vorteil hat, dass neue Daten im Laufe des Lernens
jederzeit zusätzlich berücksichtigt werden können.
Vektorielle Clusteralgorithmen
Zur Analyse vektorieller Daten stehen eine Vielzahl verschiedener Methoden zur Verfügung. Nachfolgend werden drei etablierte Algorithmen vorgestellt und deren Vor- und
Nachteile näher erläutert. Allen drei Algorithmen ist gemein, dass jedes Cluster von nur
einem Prototyp repräsentiert wird und die Anzahl der Cluster bzw. Prototypen vorgegeben werden muss. Zudem beeinflusst die Wahl des Ähnlichkeitsmaßes das Ergebnis des
Clusterns.
c-Means
Eine einfache und intuitive Methode ist der c-Means (oder auch k-Means) Algorithmus [1,
2]. Dieser gruppiert die Daten entsprechend der WTA-Regel Gl. 9.6 in c bzw. k Cluster,
wobei die Prototypen im Schwerpunkt des repräsentierten Clusters liegen.
Der Algorithmus in Abb. 9.1 zum Lernen des Modells basiert auf einem Wechselspiel
zwischen Datenzuordnung und Positionierung der Prototypen. Nach der zufälligen Initialisierung der Prototypen werden die einzelnen Datenelemente dem ähnlichsten Prototyp
gemäß WTA-Regel Gl. 9.6 zugeordnet. Im nächsten Schritt werden die Prototypen genau
als die Schwerpunkte der einzelnen Cluster berechnet. Diese zwei Schritte werden bis
zur Konvergenz wiederholt. Dieses Lernprinzip wird auch als alternierende Optimierung
bezeichnet.
Mathematisch formuliert besteht das Ziel des Algorithmus in der Minimierung der Kostenfunktion
Nw
Nv X
X
uj .vi / d.vi ; wj /;
(9.7)
ED
i D1 j D1
wobei uj .vi / die Zuweisung des Datenelementes vi zum Prototyp wj beschreibt. Dabei
P w
uj .vi / D 1, d. h., jedes Datenelement
gilt die Einschränkung uj .vi / 2 f0; 1g mit jND1
246
9
Methoden des maschinellen Lernens und der Computational Intelligence
Abb. 9.1 Algorithmus c-Means (batch)
wird nur genau einem Clusterzentrum zugeordnet. Das Distanzmaß d.vi ; wj / entspricht
der Ähnlichkeit zwischen Datenelement und Prototyp und kann beliebig gewählt werden. Oft wird die (quadratische) euklidische Distanz dE verwendet. Verschiedene weitere
Distanzmaße sind in Abschn. 9.2.2 aufgeführt. Die Formel (3) für die Schwerpunktberechnung der Cluster im c-Means-Algorithmus (Abb. 9.1) basiert auf der quadratischen
euklidischen Distanz Gl. 9.1.
Nach erfolgreichem Lernen verfügt man über ein Modell, bei welchem die Prototypen
die zugrunde liegende Datenmenge beschreiben. Neue Daten können jetzt gemäß des Siegerprinzips Gl. 9.6 dem ähnlichsten Cluster zugeordnet werden. Dabei muss das gleiche
Distanzmaß zum Einsatz kommen, welches auch für das Training des Modells verwendet
wurde.
Ein wesentliche Nachteil dieser einfachen Methode besteht darin, dass der Algorithmus sehr sensibel auf die Initialisierung der Prototypen reagiert und dazu tendiert, nur
lokale Optima zu erreichen [11]. Es ist daher notwendig, den Algorithmus mehrfach mit
unterschiedlichen Initialisierungen der Prototypen auszuführen und die geeignetste Clusterlösung gemäß der Aufgabenstellung auszuwählen.
Neural Gas
Ein weiterer vektorbasierter Clusteralgorithmus ist das sogenannte Neural-Gas-Verfahren
(NG) [10, 34]. Der Name steht beschreibend für die Art der Ausbreitung der Prototypen
im Datenraum während des Lernvorgangs, welche der Dynamik eines diffundierenden
Gases gleichkommt, bei dem die Gaspartikel den Prototypen entsprechen.
Der wesentliche Vorteil gegenüber c-Means besteht darin, dass der Algorithmus schneller konvergiert und entweder das globale Minimum findet, oder aber zumindest ein lokales
Minimum, welches dem globalen sehr nahe kommt [52]. Bei der Adaption der Prototypen werden jedoch nicht mehr alle Datenelemente als gleichrangig für einen Prototyp
9
Methoden des maschinellen Lernens und der Computational Intelligence
247
betrachtet. Für jeden Datenpunkt vi wird zunächst der Siegerrang kj .vi ; W / 0 zu allen
Prototypen wj bestimmt. Für den Sieger der WTA-Regel (9.6) ist der Rang gleich Null,
es gilt also ks .vi ; W / D 0. Alle anderen Prototypen erhalten Ränge entsprechend der
Ähnlichkeitsreihenfolge. Dem ermittelten Siegerrang kj .vi ; W / entsprechend wird nun
mittels einer sogenannten Nachbarschaftsfunktion
x
h .x/ D exp 2
2
(9.8)
ein Skalierungswert h .kj .vi ; W //, welcher mit steigendem Rang abnimmt, für die Lernstärke berechnet. Somit üben Daten, welche eine große Ähnlichkeit mit dem Prototyp
aufweisen, mehr Einfluss auf das Update des Prototypen aus (höhere Skalierungswerte)
als weniger ähnliche Daten. Diese Nachbarschaftsfunktion induziert ein sogenanntes kooperatives Lernen der Prototypen, d. h., alle Prototypen reagieren auf einen Input, aber mit
graduell abfallender Stärke entsprechend ihrem Siegerrang. Der Parameter beschreibt
die Reichweite der Kooperativität.
Der NG-Algorithmus minimiert die Kostenfunktion
ED
Nv
Nw X
1 X
h .kj .vi ; W // d.vi ; wj / ,
C j D1 i D1
(9.9)
welche für den Grenzfall & 0 die bekannte Kostenfunktion Gl. 9.7 des c-Means ergibt.
Als Distanzmaß d.vi ; wj / kommen wieder verschiedene Möglichkeiten (s. Abschn. 9.2.2)
in Betracht, jedoch muss für die Anpassung der Prototypen die Differenzierbarkeit bzgl.
der Prototypen wj gewährleistet sein. Im Neural-Gas-Algorithmus (Abb. 9.2) wird die
quadratische euklidische Distanz (Gl. 9.1) verwendet.
Der Lernalgorithmus (Abb. 9.2) zum Training des Modells besteht wieder aus zwei
alternierenden Optimierungsschritten: der Berechnung der Ränge der Datenvektoren und
der Anpassung der Prototypen unter Berücksichtigung der neuen Ränge. Dieses Wechselspiel, im Laufe dessen die Nachbarschaftsreichweite stetig verringert wird, wird solange
wiederholt, bis Konvergenz eintritt. Üblicherweise sind nur wenige Durchläufe notwendig [10].
Bisher wird immer davon ausgegangen, dass eine endliche, vorher definierte Menge
an Daten zum Training des Modells zur Verfügung steht. Es ist jedoch auch möglich,
Daten sequentiell zu verarbeiten, indem diese nacheinander in zufälliger Reihenfolge dem
Algorithmus präsentiert werden. Somit können auch neue Daten während der Lernphase
berücksichtigt werden. Das Lernen erfolgt gemäß des Algorithmus in Abb. 9.3. In jedem
Updateschritt wird zufällig ein Datenvektor vi gewählt und alle Prototypen gemäß
wj D " t h .kj .v; W //
@d.vi ; wj .t//
@wj .t/
(9.10)
248
9
Methoden des maschinellen Lernens und der Computational Intelligence
Abb. 9.2 Algorithmus Neural Gas (batch)
Abb. 9.3 Algorithmus Neural Gas (sequentiell)
adaptiert. Dabei ist 0 < "
1 die datenunabhängige Lernstärke bzw. Lernrate. Aus
Gl. 9.10 geht hervor, dass das verwendete Ähnlichkeitsmaß differenzierbar bzgl. der Prototypen wj sein muss.
Nach erfolgreichem Training des Modells werden – unabhängig davon, ob als BatchVariante oder sequentiell – neue Daten wieder gemäß WTA-Rule (Gl. 9.6) dem Cluster
zugeordnet, welches vom dem Datenvektor ähnlichsten Prototyp repräsentiert wird.
Self-Organizing Maps
Self-Organizing Maps (SOM) [20, 26] (deutsch: selbst-organisierende Karten) gehören zu
den bekanntesten Data Mining und Visualisierungsmethoden. Mit SOMs wird versucht,
die sensorische Informationsverarbeitung in den cortikalen Arealen des Gehirns mit einfa-
9
Methoden des maschinellen Lernens und der Computational Intelligence
249
Abb. 9.4 Algorithmus Self-Organizing Map (sequentiell)
chen Mitteln nachzubilden. Dabei geht man von der Annahme aus, dass die Verarbeitung
ähnlicher Reize in benachbarten Gehirnregionen stattfindet und eine Vernetzung der Neuronen untereinander besteht.
Eine SOM besteht aus einem meist regelmäßigen, oft zweidimensionalen rechteckigen
Knotengitter A. Jedem Knoten (formal: Neuron) wird ein Prototypvektor, hier auch oft
Merkmalsvektor genannt, zugeordnet. Dieser entspricht in Art und Dimensionalität den
Datenvektoren. Dem kooperativen Lernen der Prototypen liegt nun eine Kooperativität
der Knoten im Gitter zugrunde. Dazu wird die Gitterentfernung GA .j; k/ der Knoten bzw.
Neuronen j und k im Gitter A betrachtet. Bei einem regelmäßigen Gitter kann z. B. die
euklidische Gitterdistanz berechnet werden, oder man betrachtet die Weglänge zwischen
den Knoten des als Graphen aufgefassten Gitters entlang der Gitterkanten. Beim SOMAlgorithmus (Abb. 9.4) werden ähnlich wie bei NG für einen gegebenen Datenvektor
v neben dem Siegerprototypen ws alle anderen Protoypen wj graduell entsprechend der
Neuronennachbarschaft gemäß GA .j; s/ adaptiert:
wj .t C 1/ D wj .t/ "h t .GA .j; s//
@d.v; wj .t//
:
@wj .t/
(9.11)
Für die Lernrate " gilt 0 < "
1. Anfangs wird mit hoher Nachbarschaftsreichweite t
gelernt, welche jedoch im Laufe des Training immer weiter abfällt. Somit nimmt der Einfluss benachbarter Knoten stetig ab. Als Distanzmaß während der Siegerbestimmung mit
der WTA-Regel Gl. 9.6 kommen abermals verschiedene Möglichkeiten (s. Abschn. 9.2.2)
in Betracht, doch wiederum ist auf deren Differenzierbarkeit bzgl. der Prototypen wj zu
achten. Die Anzahl der Prototypen entspricht der Menge der Knotenpunkte im Gitter und
ist daher von vornherein durch die Wahl der Größe des Gitter auf einen konstanten Wert
festgelegt.
250
9
Methoden des maschinellen Lernens und der Computational Intelligence
a
b
25
25
20
20
15
15
10
10
5
5
0
0
5
10
15
20
25
0
c
d
25
25
20
20
15
15
10
10
5
5
0
0
5
10
15
20
25
0
0
5
10
15
20
25
0
5
10
15
20
25
Abb. 9.5 Ein zweidimensionaler Spieldatensatz bestehend aus 16 schachbrettartig angeordneten
Gaußwolken (gaußverteilte Datenpunkte) mit jeweils 100 Datenpunkten. a Ausgangsdatensatz b Ergebnis des Neural Gas: Platzierung der 16 Prototypen in den Zentren der Gaußwolken. c Ergebnis
der SOM: Knoten des Gitters entsprechen den Prototypen. d Ergebnis des Fuzzy-c-Means: Platzierung der 16 Prototypen in den Clusterzentren, graduelle Zuweisung der Daten zu den Prototypen
(Graulevel)
SOMs sind in ihren Vektorquantisierungseigenschaften etwas schwächer als der zuvor
besprochene NG-Algorithmus einzuschätzen. Jedoch sind sie hervorragend zur Datenvisualisierung geeignet. Unter bestimmten Umständen erzeugen sie eine Abbildung der
Daten v auf das Gitter A mittels der WTA-Regel Gl. 9.6, sodass ähnliche Daten (geringer
Abstand) auf Neuronen bzw. Knoten im Gitter abgebildet werden, die dort eine minimale
Gitterentfernung GA aufweisen. Diese Eigenschaft wird als topografische oder topologieerhaltende Abbildung bezeichnet. Somit können Datencluster hochdimensionaler Daten
im Gitter (meist zweidimensional!) leicht visualisiert und deren Nachbarschaftsrelationen
erfasst werden [49] (s. Abb. 9.5). Weitere sehr mächtige Datenvisualisierungsfunktionen
unter Benutzung von SOMs findet der Leser in [48]. Jedoch muss betont werden, dass
9
Methoden des maschinellen Lernens und der Computational Intelligence
251
diese Visualisierungstechniken nur dann zulässig sind, wenn eine topographische SOM
vorliegt. Das muss für jede Anwendung nach dem Lernen des SOM-Modells geprüft werden! Entsprechende Werkzeuge findet man in [51] (nebst mathematischen Grundlagen
topografischer SOMs) oder in [3, 24].1
Fuzzy-Varianten
Bei den bisher aufgeführten vektorbasierten Algorithmen wurde jeweils vorausgesetzt,
dass jedes Datenelement genau einem Prototyp bzw. einem Cluster gemäß WTA-Regel
(Gl. 9.6) fest zugeordnet wird. In der Praxis ist jedoch häufig eine eindeutige Zuweisung
nicht sinnvoll oder nicht möglich. Dieser Aspekt sollte auch beim Einsatz der Methoden zur Datenanalyse Berücksichtigung finden. Aus diesem Grund gibt es sogenannte
Fuzzy-Varianten der Algorithmen, welche in unscharfen Gruppierungen bzw. graduellen
Clusterzuweisungen der Daten resultieren.
Beispielsweise ändert sich dann die Kostenfunktion des c-Means-Algorithmus (Gl. 9.7)
dahingehend, dass der Wertebereich der Zuweisungsfunktion nun mit uj .vi / 2 Œ0; 1 mit
PNw
j D1 uj .vi / D 1 definiert ist [5, 12, 18], d. h., es erfolgt eine graduelle Zuordnung der
Datenvektoren zu den Prototypen. In der Kostenfunktion
ED
Nw
Nv X
X
uj .vi /m d.vi ; wj /
(9.12)
i D1 j D1
kommt noch ein weiterer Parameter m > 1 als Exponent der Zuweisungsfunktion hinzu,
welcher die Ausprägung der Unschärfe reguliert. Für m ! 1 ähnelt das Konvergenzverhalten dem des c-Means, d. h., unter Umständen werden nur lokale Minima gefunden. Für
m ! 1 nehmen die Zuordnungen gleichverteilte Werte an. Gute Ergebnisse erhält man
generell für 1:2 m 2:0 [5]. Der Fuzzy-c-Means verhält sich während der Lernphase
wesentlich stabiler als der herkömmliche c-Means und konvergiert häufiger zum globalen
Minimum [36], was einen wesentlichen Vorteil gegenüber der crispen Variante darstellt.
In Abb. 9.6 ist die Funktionsweise des Fuzzy-c-Means veranschaulicht.
Die Zuordnung ungelernter Daten zu den Prototypen erfolgt nun nicht mehr gemäß
WTA-Regel (Gl. 9.6), welche genau einen Siegerprototyp bestimmt, sondern analog der
Berechnung der Fuzzy-Zuweisungen uj der Daten zu den Prototypen gemäß Formel (3),
d. h., der Grad der Zugehörigkeit des Datenobjektes zu den einzelnen Prototypen wird
durch einen Zuweisungsvektor beschrieben. Für Neural Gas und SOM gibt es ähnlich
Modifikationen. Für Details dazu sei jedoch auf weiterführende Literatur verwiesen [15,
23, 53].
Median-Varianten
Für einige Daten, beispielsweise Gensequenzen und Texte, können gemittelte Prototypen wie bei c-Means, Neural Gas oder SOM nicht berechnet werden bzw. sind nicht
1
Eine für nichtkommerzielle Zwecke freie MATLABr-Toolbox für SOMs ist verfügbar [27, 50].
252
9
Methoden des maschinellen Lernens und der Computational Intelligence
Abb. 9.6 Algorithmus Fuzzy-c-Means (batch)
sinnvoll zu interpretieren. Es wird daher versucht, repräsentative Datenobjekte zu finden,
welche als Zentren der einzelnen Cluster verwendet werden. Dabei wird vorausgesetzt,
dass die Ähnlichkeiten d.oi ; pj / zwischen den Objekten oi und pj , entweder extern gegeben sind oder aber mit einem Ähnlichkeitsmaß wie in Abschn. 9.2.2 berechnet oder
anderweitig ermittelt werden können. Für Texte kommt beispielsweise die KolmogorovKomplexität (Gl. 9.4) infrage, während für Gensequenzen die Levenshtein-Distanz [30]
Anwendung findet. Die vorgenannten vektorbasierten Clusteralgorithmen müssen nun dahingehend angepasst werden, dass nur noch die Ähnlichkeiten zwischen den Daten für
die Bestimmung der Clusterzentren bzw. Prototypen herangezogen werden. Das Prinzip
der alternierenden Optimierung wie bei den vorgenannten vektoriellen Clusteralgorithmen
soll jedoch beibehalten werden. Da die Clusterzentren nun aber darauf beschränkt sind,
selbst ausgezeichnete Datenobjekte zu sein, führt das zu veränderten Updateregeln. Für
den Median-Fuzzy-c-Means werden die Prototypen pj bzw. repräsentativen Datenobjekte
ol gemäß der Formel
pj D vl mit l D 0 argmin
l
NV
X
ul 0 .oi /m d.oi ; ol 0 /
(9.13)
i D1
ermittelt. Die Zuweisung der Datenobjekte zu den Clusterzentren erfolgt wie beim Fuzzyc-Means gemäß (3). Man beachte, dass es sich sowohl bei den Datenobjekten oi als auch
den Prototypen pj nicht mehr um Vektoren handelt.
Wie aus dem Algorithmus in Abb. 9.7 hervorgeht, muss auch bei diesen MedianVarianten die Anzahl der gewünschten Prototypen vorab angegeben werden. Die Prototypen selbst werden anfangs auf zufällig gewählte Datenobjekte initialisiert.
9
Methoden des maschinellen Lernens und der Computational Intelligence
253
Abb. 9.7 Algorithmus Median-Fuzzy-c-Means (batch)
Für den klassischen c-Means, Neural Gas und SOM gibt es analoge Median-Varianten
für nichtvektorielle Daten [10].
Affinity Propagation
Affinity Propagation (AP) [14] ist eine Clustermethode, welche den Ansatz einer informationstheoretischen Analyse verfolgt. Dabei agieren die Datenobjekte als Knoten in
einem Netzwerk, wobei anfangs jedes Datenobjekt als potentieller Prototyp betrachtet
wird. Durch den Austausch realwertiger Nachrichten zwischen den Daten kommunizieren
die Objekte miteinander. Dadurch etablieren sich nach und nach einige der Datenobjekte
als Prototypen, und es bilden sich Cluster. Die Anzahl der Cluster wird implizit durch den
Algorithmus festgelegt bzw. kann nur indirekt über das Setzen bestimmter Parameter zur
Granularität der Cluster beeinflusst werden. Der Name Affinity Propagation rührt daher,
dass die Affinitität der Datenobjekte, sich als Prototyp wählen zu lassen, innerhalb des
Netzwerks propagiert wird. Die den Nachrichten zugrunde liegenden Berechnungen sind
einfach und schnell, wodurch der Algorithmus innerhalb kurzer Zeit zu einem stabilen,
reproduzierbaren Ergebnis führt.
Da wie bei den Median-Varianten nur die Ähnlichkeiten zwischen den Daten in
Betracht gezogen werden, ist der Algorithmus sowohl für vektorielle als auch nichtvektorielle Daten oi geeignet. Allerdings hat der Begriff ähnlich eine weitreichendere
Bedeutung. So müssen die Ähnlichkeiten nicht unbedingt symmetrisch sein, d. h.,
d.oi ; ok / ¤ d.ok ; oi / ist erlaubt. Zudem kann auch mit unvollständigen Datensätzen
gearbeitet werden, es müssen also nicht alle Ähnlichkeiten zwischen den Objekten bekannt sein. Jedoch wird bei diesem Algorithmus zwingend vorausgesetzt, dass zwei
Objekte umso ähnlicher sind, je größer der Ähnlichkeitswert ist. Die bekannten Ähnlich-
254
9
Methoden des maschinellen Lernens und der Computational Intelligence
keiten werden initial in den Größen s.i; k/ zusammengefasst. Bei der Verwendung eines
Distanzmaßes d.oi ; ok / zur Erfassung der Ähnlichkeit (z. B. euklidische Distanz) wird
dann s.i; k/ D d.oi ; ok / als Ähnlichkeitsmaß verwendet.
Bei den oben erwähnten Nachrichten, welche zeitgleich und miteinander konkurrierend
zwischen den Datenobjekten ausgetauscht werden, wird zwischen zwei verschiedenen Typen unterschieden. Zum einen gibt es die Responsibilities r.i; k/, welche die Eignung des
Datenobjektes ok als Prototyp zum Ausdruck bringen. Diese Nachrichten werden von anderen Datenelementen oi an den potentiellen Prototyp ok geschickt (propagiert). Und zum
anderen gibt es Availabilities a.i; k/, welche vom möglichen Prototyp ok an andere Datenobjekte oi geschickt werden, und die Eignung von ok als Prototyp beschreiben. Beide
Nachrichtentypen basieren auf einfachen Wahrscheinlichkeitsmodellen, welche als logarithmische Quotienten von Wahrscheinlichkeiten interpretiert werden können. Da in die
Berechnungen die Ähnlichkeiten s.i; k/ zwischen den Datenobjekten einfließen, können
beide Nachrichtentypen nur zwischen den Datenobjekten ausgetauscht werden, für welche
diese Ähnlichkeiten bekannt sind. Die Selbstähnlichkeiten s.i; i/ oder auch Präferenzen
müssen anfangs initialisiert werden. Je höher dieser Wert ist, umso wahrscheinlicher wird
sich das Datenobjekt als Prototyp herauskristallisieren. Um allen Objekten die gleiche
Chance zu geben, als Prototyp gewählt zu werden, müssen die Präferenzen auf einen einheitlichen Wert gesetzt werden. Mögliche Initialisierungen sind Median oder Minimum
aller bekannten Ähnlichkeiten s.i; k/.
Auch dieser Algorithmus folgt dem Prinzip der alternierenden Optimierung (s.
Abb. 9.8). Responsibilities und Availabilities werden wechselweise angepasst, sodass
Abb. 9.8 Algorithmus Affinity Propagation (batch)
9
Methoden des maschinellen Lernens und der Computational Intelligence
a
b
c
255
d
Abb. 9.9 Grafische Darstellung der Funktionsweise der Affinity Propagation. Die Punkte entsprechen den Datenobjekten, durchgezogene Linien stellen die Availabilities dar, gestrichelte Linien die
Responsibilities. a Ausgangsdatensatz, alle Datenobjekte sind potentielle Prototypen. b Austausch
anfangs gleichgroßer realwertiger Nachrichten zwischen allen Datenobjekten. c Herausbildung von
Prototypen basierend auf verstärkten Beziehungen zwischen ähnlich Objekten. d Endergebnis mit
vier Prototypen bzw. Clustern
sich nach und nach die Datenobjekte als Prototypen ergeben, welche sowohl die höchste
Availability als auch Responsibility aufweisen (s. Abb. 9.9).
9.4.2
Prototypbasierte Klassifikation – Lernende Vektorquantisierer
Im Gegensatz zum Clustern, bei dem nach inhärenten Datenstrukturen gesucht wird, geht
man beim Klassifizieren von einer vorgegebenen Klasseneinteilung aus, d. h., die zur
Verfügung stehenden NK Kategorien bzw. Klassen K D fK1 ; : : : ; KNK g sind bekannt.
Dabei werden die Daten vk in je eine Klassen Kl eingruppiert. Bei der Klassifikation
unterscheidet man zwischen Trainings- und Testdaten. Für Trainingsdaten ist die Klassenzugehörigkeit ck 2 K bekannt. Bei neuen Daten, den Testdaten2 , ist die Klasse nicht
bekannt und soll durch das gelernte Klassifikationsmodell in eine Kategorie eingeordnet
werden.
Wir konzentrieren uns wieder auf prototypbasierte Verfahren und speziell auf Methoden der Vektorquantisierung zur Generierung einen Klassifikationsmodells. Jede Klasse
Kl soll dabei durch mindestens einen Prototypvektor, ähnlich wie beim Clustern, beschrieben werden. Wir betrachten daher die Menge W D fw1 ; : : : ; wNW g der Prototypen
T
mit NW NK und dem zusätzlichen (Klassen-) Labelvektor y D y1 ; : : : ; yNW
mit
yj 2 K . Das Vektorelement yj definiert die Klassenzugehörigkeit des entsprechenden
Prototypvektors wj , und jede Klasse Ki sollte mindestens einmal vertreten sein.
Nach dem Training des Modells wird ein Datenvektor vi mittels der Gewinnerregel
Gl. 9.6 einem Siegerindex s D s .vi / zugeordnet und als Klasse ys identifiziert. Stimmen
2
Testdaten sind hier nicht im Sinne einer Modellvalidierung zu verstehen, sondern als zu bearbeitende Daten im Anwendungsfall.
256
9
Methoden des maschinellen Lernens und der Computational Intelligence
bei den Trainingsdaten die gegebene Klasse ci und die prognostizierte Klasse ys überein,
so ist der Datenvektor richtig klassifiziert, andernfalls gilt er als falsch klassifiziert. Als
Evaluierungsmaß für den Klassifikator wird im Allgemeinen die Anzahl der falsch klassifizierten Datenpunkte verwendet, d. h. die Anzahl der Datenpunkte vi mit ci ¤ ys.vi / .
Dieses Maß wird auch als Klassifikationsfehler bezeichnet. Es stehen jedoch weitere Evaluierungsmaße – vor allem für zwei Klassenprobleme (NK D 2) – zur Verfügung [13, 39].
Ein grundlegendes Lernverfahren wurde 1986 von Kohonen entwickelt und lernende Vektorquantisierung (Learning Vector Quantization, LVQ) benannt. Das sequentielle
Lernverfahren ist intuitiv: Zu einem zufällig gewählten Trainingsdatenvektor wird der
ähnlichste Prototypvektor bestimmt. Gehört dieser zur gleichen Klasse wie der Datenvektor, so wird er in dessen Richtung verschoben (Heranziehen/Attraction) und anderenfalls
in die entgegengesetzte Richtung geschoben (Abstoßen/Repulsing). Dies wird solange
wiederholt, bis keine Veränderung der Prototypvektoren mehr stattfindet bzw. bis eine
vorher festgelegte Anzahl von Lernschritten durchlaufen wurde. Im günstigen Fall sind
die Prototypen am Ende des Trainings klassentypisch. Jedoch, ähnlich wie beim c-Means
ist dieses Verfahren stark initialisierungssensibel, und es kann keine Aussage über die
Konvergenz des Verfahrens gemacht werden. Aus diesem Grund wurde der LVQ weiterentwickelt [26, 43, 47]. Eine der bedeutendsten Modifikationen ist der Generalized LVQ
von Sato und Yamada [43].
Generalized Learning Vector Quantization
Wie auch die benannten Clusterverfahren basiert der Generalized LVQ (GLVQ) auf der
Optimierung einer Kostenfunktion. Das Ziel des GLVQ ist es, den Klassifikationsfehler zu
minimieren und dabei das Prinzip der Vektorverschiebung vom LVQ zu bewahren. Dazu
wird die sogenannte Entscheidungsfunktion
W .vi / D
d C .vi / d .vi /
d C .vi / C d .vi /
(9.14)
benötigt. Diese beinhaltet die zwei Ähnlichkeiten d C .vi / D d.vi ; wC / und d .vi / D
d.vi ; w /. Dabei ist wC derjenige Prototyp, welcher aus der Menge der Protoypen mit
der gleichen Klassenzugehörigkeit wie vi dem Datenvektor wi am ähnlichsten ist (best
matching unit). Anderseits ist der Prototyp w derjenige, welcher aus der Menge der restlichen Protoypen (unterschiedliche Klasse) die größte Ähnlichkeit mit dem Datenvektor
wi aufweist. Wie bereits im Abschn. 9.2.2 erwähnt, gilt d.vi ; wl / < d.vi ; wk /, wenn
wl ähnlicher zu vi ist als wk . Somit ergibt sich bei näherer Betrachtung, dass der Wert
der Entscheidungsfunktion negativ ist, wenn der Datenvektor richtig klassifiziert wird,
d. h., wC ist ähnlicher als w . Als Ähnlichkeitsmaß d ˙ .v/ wird im Allgemeinen die euklidische Distanz gewählt, jedoch sind auch andere differenzierbare Maße denkbar (vgl.
Abschn. 9.2.2).
9
Methoden des maschinellen Lernens und der Computational Intelligence
257
Abb. 9.10 Veranschaulichung des GLVQ-Lernprinzips: Es wird der Datenvektor v zufällig gewählt
und die Prototypen w˙ ermittelt. Der Prototyp wC wird zum Datenvektor v herangezogen und der
Prototyp w wird weggeschoben
Die Kostenfunktion des GLVQ lautet
V
1X
f .W .vi // ,
2 i D1
N
ED
(9.15)
wobei die Transferfunktion f .x/ eine monoton wachsende Funktion ist. Sie wird oft als
1
gewählt. Daidentische Funktion f .x/ D x oder Sigmoidfunktion f .x/ D 1Cexp.x/
mit approximiert die Kostenfunktion Gl. 9.15 den Klassifikationsfehler [22].
Das Lernverfahren erfolgt nun prinzipiell wie bei den sequentiellen Clustermethoden.
Für einen zufällig ausgewählten Datenpunkt vi werden die entsprechenden Prototypen,
hier wC und w , angepasst. Die Updateformel unter Verwendung eines allgemeinen differenzierbaren Ähnlichkeitsmaßes lautet:
w˙ D w˙
mit
w˙
(9.16)
w˙ D "W f 0 .W .vi //
4 d .vi /
.d C .v
2
i / C d .vi //
.vi w˙ / .
(9.17)
Dabei ist 0 < "W << 1 die Lernrate der Prototypen.
Somit wird der richtige Prototyp wC wie beim grundlegenden LVQ-Verfahren zum
Datenvektor herangezogen. Zusätzlich wird der Prototypvektor w , welcher zu einer anderen Klasse als der Datenvektor gehört, weggeschoben. Dieses Prinzip wird in Abb. 9.10
nochmals verdeutlicht. Der komplette Algorithmus ist in Abb. 9.11 gegeben.
Bei Verwendung eines allgemein differenzierbaren Ähnlichkeitsmaßes ergibt sich
Gl. 9.16 zu
w˙ D "W f 0 .W .vi //
˙2 d .vi /
.d C .vi / C d .vi //
2
.vi w˙ /
@d ˙ .vi /
.
@w˙
(9.18)
Der GLVQ ist ein mathematisch fundiertes Verfahren, welches in der Praxis zu guten Ergebnissen führt. Ein Vorteil der Methode ist, dass die Komplexität des Modells,
in diesem Fall die Anzahl der Prototypen, von vornherein festgelegt wird. Das hat den
Vorteil, dass bei der Wahl einer geringen Anzahl von Prototypen nicht die Gefahr des
258
9
Methoden des maschinellen Lernens und der Computational Intelligence
Abb. 9.11 Algorithmus Generalized Learning Vector Quantization (sequentiell)
Auswendiglernens (engl. overfitting) besteht, d. h., das Modell des GLVQ generalisiert
das zugrunde liegende Klassifikationsproblem und liefert auch bei neuen (Test-)Daten eine gute Prognose. Modelle mit großer Komplexität neigen zu einer guten Performanz auf
den Trainingsdaten, jedoch nicht auf Testdaten.
Neben dem sequentiellen GLVQ für vektorielle, gibt es ebenso Erweiterungen für
nichtvektorielle Daten bzw. für vektorielle Daten, deren Ähnlichkeitsmaß nicht differenzierbar ist (Median-GLVQ [37], Relational-GLVQ [16]).
Automatische Skalierung von Datenmerkmalen – Relevanzlernen
Datenvektoren beschreiben verschiedene Merkmale eines Datenobjektes, z. B. können zu
einer Person verschiedene metrische Merkmale wie Gewicht, Alter, Körpergröße, Bildungsgrad, Blutzuckerspiegel, Einkommen, Schuldengröße usw. in einem solchen Vektor
zusammengefasst sein. Diese haben bei unterschiedlichen Problemstellungen eine unterschiedliche Wichtigkeit (Relevanz). Beispielsweise ist für ein charakteristisches Täterprofil im Umfeld von Diebstählen der Bildungsgrad von geringer Relevanz, während
die Schuldenhöhe eventuell von höherer Bedeutung ist. Anderseits kann bei politisch
motivierten Gewaltdelikten der Bildungsgrad eine wichtige Komponente im Täterprofil
darstellen. Für eine konkrete Problemstellung ist jedoch eine Vorhersage der Wichtigkeit
bzw. Relevanz der einzelnen Merkmale nicht bekannt bzw. nicht absehbar. Die automatische Anpassung der Relevanz solcher Merkmale an die Problemstellung ist beim
GLVQ-Klassifikationslernen möglich (vgl. Abb. 9.12). Diese Methode wird als Relevanzlernen bezeichnet [17].
9
Methoden des maschinellen Lernens und der Computational Intelligence
259
Abb. 9.12 Ein beispielhaftes Relevanzprofil für ein charakteristisches Täterprofil im Umfeld von
Diebstählen. In diesem Fall hat das Einkommen und die Schuldenhöhe ein hohen Einfluss auf die
Klassifikation
Bei der Verwendung der skalierten euklidischen Distanz Gl. 9.3 können die Skalierungsfaktoren k parallel zu den Prototypen adaptiert werden. Das Update für die Faktoren ergibt sich zu:
k D k
k
mit
k D "
2 f 0 .W /
.d C .v/ C d .v//
2
d .v/.vk wkC / d C .v/.vk wk /
mit einer Lernrate 0 < " < "W . Die Skalierungsfaktoren k bilden das Relevanzprofil
D .1 ; ; D /. Dabei werden hohe Werte für k als hohe Relevanz des Merkmales k
für die Klassifikation interpretiert.
Neben der Gewichtung einzelner Merkmale kann auch das Zusammenspiel bzw. die
Korrelation der Merkmale eine entscheidene Rolle für die Klassifikation spielen. Mithilfe
des Klassifikations-Korrelations-Lernens GLVQ [44] können diese Korrelationen ebenso
automatisch angepasst werden. Für eine detaillierte Ausführung und Beispiele für deren
erfolgreiche Anwendung sei auf [45] und [6] verwiesen.
9.4.3 Andere Verfahren zum Clustern und Klassifizieren – Bemerkungen
Neben diesen hier näher vorgestellten Verfahren existiert eine große Anzahl weiterer Algorithmen und Methoden zum Clustern und Klassifizieren. In der klassischen Statistik
sind zum Beispiel die Diskriminanzanalyse oder Bayes’sche Entscheidungsmodelle weit
verbreitet [11, 29]. Die im Beitrag vorgestellten Verfahren sind als Ergänzungen bzw. Alternativen zu diesen Methoden zu sehen, die einen intuitiven Zugang bieten und ebenso
leicht zu interpretierende Modelle.
Ähnliche Bemerkungen gelten für Verfahren des hierarchischen Clusterns bzw. der
Klassifikation mit Entscheidungsbäumen [7, 11]. Diese Methoden sind oft erfolgreich an-
260
9
Methoden des maschinellen Lernens und der Computational Intelligence
gewendet worden. Insbesondere vermittelt die baumartige Hierarchiestruktur der Zuordnungen bzw. Entscheidungen ein vermeintlich klares Entscheidungsbild. Unglücklicherweise sind diese Verfahren jedoch sehr sensibel gegenüber einer veränderten Datenlage.
Selbst kleine Änderungen der Daten können die erzeugte Hierarchiestruktur vollkommen
zerstören, d. h., eine Neuberechnung kann zu grundlegend anders strukturierten Hierarchiebäumen führen. Dieses sensible Verhalten erschwert eine verlässliche Interpretation.
Ein ebenfalls mächtiges Lernverfahren zu Klassifikation von Datenobjekten mit gegebenen Ähnlichkeiten sind die Support-Vektor-Maschinen (SVM, [46]). Der sehr guten
Leistungsfähigkeit dieses Modells steht eine eingeschränkte Interpretierbarkeit gegenüber.
Weiter muss einschränkend gesagt werden, dass auch dieser Algorithmus ein profundes
Wissen über die theoretischen mathematischen Hintergründe sowie eine solide Erfahrung
bei der Anwendung voraussetzt, obwohl in der Literatur oft ein andere Eindruck suggeriert wird. Durch ein formales Anwenden ohne Beachtung der Details kann man schnell zu
irreführenden Ergebnissen gelangen, welche insbesondere die propagierte Verallgemeinerungsfähigkeit des Modells betreffen.
In diesem Sinne sind die in diesem Beitrag vorgestellten Modelle auch als robuste
Alternativen anzusehen, bieten natürlich aber auch keinen vollständigen Überblick. Einen
sehr aktuellen Überblick über weitere Methoden der Computational Intelligence findet
man in [21].
Es ist jedem Leser klar, dass die hier vorgestellten Verfahren, Modelle und Überlegungen nur einen kleinen Ausschnitt aus dem großen Pool entsprechender Algorithmen
und Herangehensweisen darstellen, der naturgemäß dem Erfahrungswissen der Autoren
angepasst ist. Daher ist für konkrete Problemstellungen ein weiteres Literaturstudium
unerlässlich. Die Autoren sind jedoch gerne bereit, mit ihrem Rat und Wissen bei entsprechenden Fragen zu helfen.
Literatur
1. Ball, G., Hall, D.: Isodata an iterative method of multivariate data analysis and pattern classification (1965)
2. Ball, G.H., Hall, D.J.: A clustering technique for summarizing multivariate data. Behavioral
Science 12(2), 153–155 (1967)
3. Bauer, H.U., Pawelzik, K.R.: Quantifying the neighborhood preservation of Self-Organizing
Feature Maps. IEEE Trans. on Neural Networks 3(4), 570–579 (1992)
4. Becker, P.: Wie big sind die Big Five. Zeitschrift für Differentielle und Diagnostische Psychologie 17(4), 209–221 (1996)
5. Bezdek, J.: A convergence theorem for the fuzzy isodata clustering algorithms. IEEE Transactions on Pattern Analysis and Machine Intelligence 2(1), 1–8 (1980)
6. Biehl, M.: Prototype-based classifiers and their application in the life sciences. In: Advances
in Self-Organizing Maps and Learning Vector Quantization – Proceedings of the 10th International Workshop, WSOM 2014, Mittweida, Germany, July, 2–4, 2014, S. 121 (2014). doi:
10.1007/978-3-319-07695-9_11. http://dx.doi.org/10.1007/978-3-319-07695-9_11
Literatur
261
7. Bishop, C.: Pattern Recognition and Machine Learning. Springer Science+Business Media,
LLC, New York, NY (2006)
8. Borkenau, P., Ostendorf, F.: Untersuchung zum Fünf-Faktorenmodell der Persönlichkeit und
seiner diagnostischen Erfassung. Zeitschrift für Differentielle und Diagnostische Psychologie
10(4), 239–251 (1989)
9. Cilibrasi, R., Vitányi, P.: Clustering by compression. IEEE Transactions on Information Theory
51(4), 1523–1545 (2005)
10. Cottrell, M., Hammer, B., Hasenfuss, A., Villmann, T.: Batch and median neural gas. Neural
Networks 19, 762–771 (2006)
11. Duda, R., Hart, P.: Pattern Classification and Scene Analysis. Wiley, New York (1973)
12. Dunn, J.C.: A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters. Journal of Cybernetics 3(3), 32–57 (1973). doi:
10.1080/01969727308546046
13. Fawcett, T.: An introduction to roc analysis. Pattern Recogn. Lett. 27(8), 861–874 (2006). doi:
10.1016/j.patrec.2005.10.010. http://dx.doi.org/10.1016/j.patrec.2005.10.010
14. Frey, B.J., Dueck, D.: Clustering by passing messages between data points. Science 315, 972–
976 (2007)
15. Geweniger, T., Fischer, L., Kaden, M., Lange, M., Villmann, T.: Clustering by fuzzy
neural gas and evaluation of fuzzy clusters. Comp. Int. and Neurosc. 2013 (2013). doi:
10.1155/2013/165248. http://dx.doi.org/10.1155/2013/165248
16. Hammer, B., Schleif, F.M., Zhu, X.: Relational extensions of learning vector quantization.
In: Lu, B.L., Zhang, L., Kwok, J. (Hrsg.) Neural Information Processing, Lecture Notes in
Computer Science, Bd. 7063, S. 481–489. Springer Berlin Heidelberg (2011). doi: 10.1007/9783-642-24958-7-56. http://dx.doi.org/10.1007/978-3-642-24958-7_56
17. Hammer, B., Villmann, T.: Generalized relevance learning vector quantization. Neural Networks
15(8–9), 1059–1068 (2002)
18. Hathaway, R., Bezdek, J.: Local convergence of the fuzzy c-means algorithm. Pattern recognition 19(6), 477–480 (1986)
19. Haykin, S.: Neural Networks - A Comprehensive Foundation. IEEE Press, New York (1994)
20. Heskes, T.: Energy functions for self-organizing maps. In: Oja, E., Kaski, S. (Hrsg.) Kohonen
Maps, S. 303–316. Elsevier, Amsterdam (1999)
21. Kacprzyk, J., Pedrycz, W. (Hrsg.): Springer Handbook of Computational Intelligence. Springer,
Dordrecht, Heidelberg (2014)
22. Kaden, M., Riedel., M., Hermann, W., Villmann, T.: Border-sensitive learning in generalized
learning vector quantization: an alternative to support vector machines. Soft Computing, S. in
press (2015)
23. Kästner, M., Villmann, T.: Fuzzy supervised self-organizing map for semi-supervised vector
quantization. In: Rutkowski, L., Korytkowski, M., Scherer, R., Tadeusiewicz, R., Zadeh, L., Zurada, J. (Hrsg.) Artificial Intelligence and Soft Computing, Lecture Notes in Computer Science,
Bd. 7267, S. 256–265. Springer Berlin Heidelberg (2012)
24. Kiviluoto, K.: Topology preservation in self-organizing maps. In: ICNN 96. The 1996 IEEE
International Conference on Neural Networks, Bd. 1, S. 294–9. IEEE, New York, NY, USA
(1996)
262
9
Methoden des maschinellen Lernens und der Computational Intelligence
25. Kohonen, T.: Self-Organization and Associative Memory, Springer Series in Information
Sciences, Bd. 8. Springer, Berlin, Heidelberg (1984). 3. Aufl. 1989.
26. Kohonen, T.: Self-Organizing Maps, Springer Series in Information Sciences, Bd. 30. Springer,
Berlin, Heidelberg (1995). (2. erweiterte Aufl. 1997).
27. Kohonen, T.: MATLAB Implementations and Applications of the Self-Organizing Map. Unigrafia Oy, Helsinki, Finland (2014)
28. Kolmogorov, A.: On tables of random numbers. Sankhya: The Indian Journal of Statistics. Ser.
A 25, 369–375 (1963)
29. Läuter, H., Pincus, R.: Mathematisch-statistische Datenanalyse. Akademie-Verlag (1989)
30. Levenshtein, V.: Binary codes capable of correcting deletions, insertions, and reversals. Doklady
Akademii Nauk SSSR 163(4), 845–848 (1965)
31. Lowe, D.: Object recognition from local scale-invariant features. In: The Proceedings of the
Seventh IEEE International Conference on Computer Vision, Bd. 2, S. 1150–1157 (1999)
32. Lowe, D.: Distinctive image features from scale-invariant keypoints. International Journal of
Computer Vision 60(2), 91–110 (2004)
33. Maltoni, D., Maio, D., Jain, A., Prabhakar, S.: Handbook of Fingerprint Recognition. Springer,
Berlin-Heidelberg (2009)
34. Martinetz, T.M., Berkovich, S.G., Schulten, K.J.: “neural-gas” network for vector quantization
and its application to time-series prediction. IEEE Transactions on Neural Networks 4(4), 558–
569 (1993)
35. Mergenthaler, E.: Emotions-Abstraktionsmuster in Verbatimprotokollen. Verlag für Akademische Schriften, Frankfurt (1997)
36. Miyamoto, S., Ichihashi, H., Honda, K.: Algorithms for Fuzzy Clustering, Studies in Fuzziness
and Soft Computing, Bd. 229. Springer (2008)
37. Nebel, D., Villmann, T.: Median variants of LVQ for optimization of statistical quality measures for classification of dissimilarity data. Machine Learning Reports 8(MLR-03-2014), 1–25
(2014). ISSN:1865-3960, http://www.techfak.uni-bielefeld.de/~fschleif/mlr/mlr_03_2014.pdf
38. Pekalska, E., Duin, R.: The Dissimilarity Representation for Pattern Recognition: Foundations
and Applications. World Scientific (2006)
39. Powers, D.M.: Evaluation: From precision, recall and f-factor to roc, informedness, markedness
& correlation. Journal of Machine Learning Technologies 2, 37–63 (2011). http://www.bioinfo.
in/contents.php?id=51. ISSN 2229-2981
40. Rissanen, J.: Modeling by shortest data description. Automatica 14, 149–162 (1978)
41. Sachs, L.: Angewandte Statistik, 7. Aufl. Springer (1992)
42. Salton, G., McGill, M.: Introduction to modern information retrieval. McGraw-Hill, New York
(1983)
43. Sato, A.S., Yamada, K.: Generalized learning vector quantization. In: G. Tesauro, D. Touretzky,
T. Leen (Hrsg.) Advances in Neural Information Processing Systems, Bd. 7, S. 423–429. MIT
Press (1995)
44. Schneider, P., Hammer, B., Biehl, M.: Adaptive relevance matrices in learning vector quantization. Neural Computation 21, 3532–3561 (2009)
Literatur
263
45. Schneider, P., Schleif, F.M., Villmann, T., Biehl, M.: Generalized matrix learning vector quantizer for the analysis of spectral data. In: Verleysen, M. (Hrsg.) Proc. Of European Symposium on
Artificial Neural Networks (ESANN’2008), S. 451–456. d-side publications, Evere, Belgium
(2008)
46. Schölkopf, B., Smola, A.: Learning with Kernels. MIT Press (2002)
47. Seo, S., Obermayer, K.: Soft learning vector quantization. Neural Computation 15, 1589–1604
(2003)
48. Vesanto, J.: Som-based data visualization methods. Intelligent Data Analysis 3, 111–26 (1999)
49. Vesanto, J., Alhoniemi, E.: Clustering of the self-organizing map. IEEE Transaction on Neural
Networks 11(3), 586–600 (2000)
50. Vesanto, J., Alhoniemi, E., Himberg, J., Kiviluoto, K., Parviainen, J.: Self-organizing map for
data mining in matlab: The som toolbox. Simulation News Europe (25), 54 (1999)
51. Villmann, T., Der, R., Herrmann, M., Martinetz, T.M.: Topology preservation in self-organizing
feature maps: exact definition and measurement. IEEE Transactions on Neural Networks 8(2),
256–266 (1997)
52. Villmann, T., Hammer, B., Biehl, M.: Some theoretical aspects of the neural gas vector quantizer. In: M. Biehl, B. Hammer, M. Verleysen, T. Villmann (Hrsg.) Similarity-based Clustering,
LNAI, Bd. 5400, S. 23–34. Springer, Berlin (2009)
53. Villmann, T., Seiffert, U., Schleif, F.M., Brüß, C., Geweniger, T., Hammer, B.: Fuzzy labeled self-organizing map with label-adjusted prototypes. In: Schwenker, F., Marinai, S. (Hrsg.)
Proceedings of Conference Artificial Neural Networks in Pattern Recognition (ANNPR) 2006,
Ulm, Germany, LNAI 4087, S. 46–56. Springer (2006)
54. Watson, J., Crick, F.: Molecular structure of nucleic acids. a structure for deoxyribose nucleic
acid. Nature 171(4356), 737–738 (1953)
55. Ziv, J., Lempel, A.: Compression of individual sequences via variable-rate coding. IEEE Transactions on Information Theory 24(5), 530–536 (1978)
56. Zühlke, D.: Vector quantization based learning algorithms for mixed data types and their application in cognitive support systems for biomedical research. Ph.D. thesis, University Groningen,
Johann-Bernoulli-Institute for Mathematics and Computer Sciences (2012)
Digitale Forensik zwischen
(Online-)Durchsuchung, Beschlagnahme
und Datenschutz
10
Frank Czerner
10.1 Einleitung
Für die digitale Forensik besteht das Problem, dass infolge ständig fortschreitender technischer Neuerungen, denen das Recht zumeist „hinterherhinken muss“, oftmals fraglich ist,
ob für bestimmte strafprozessuale Maßnahmen zur Sicherung und Auswertung von möglichen Beweismitteln mit dem Ziel der Klärung der Täterschaft einschlägige gesetzliche
Grundlagen existieren und inwieweit deren Voraussetzungen bejaht werden können, um
z. B. den E-Mail-Verkehr eines Beschuldigten (Abschn. 10.9) oder um eine (grundsätzlich [noch] unzulässige) Online-Durchsuchung (Abschn. 10.12) anordnen, durchführen
und die gewonnenen Erkenntnisse im Strafverfahren verwerten zu können. Anders stellen
sich die rechtlichen Rahmenbedingungen im Bereich der von der Polizei wahrzunehmenden Gefahrenabwehr, also präventiver Maßnahmen zur Abwehr künftig zu erwartender
Straftaten dar – jene Regularien finden sich u. a. im Gesetz über das Bundeskriminalamt
(BKAG) in dem Gesetz über die Antiterrordatei (ATDG, Abschn. 10.13), vornehmlich
jedoch in den jeweiligen Polizeigesetzen der Bundesländer.
In memoriam Joachim Vogel († 2013)
F. Czerner ()
Lehrstuhl Recht in der Sozialen Arbeit, University of Applied Sciences Mittweida
Technikumplatz 17, 09648 Mittweida, Deutschland
E-Mail: czerner@hs-mittweida.de
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2_10
265
266
F. Czerner
10.2 Daten und Dateien als Gegenstände einer Durchsuchung
und Beschlagnahme?
„Klassische“ Beweismittel, mit denen im Rahmen eines Strafprozesses die Schuld eines
mutmaßlichen1 Täters (mit) bewiesen – oder auch ausgeschlossen – werden können, sind
bestimmte Gegenstände, die sich im Kontext von Durchsuchung und Beschlagnahme im
Besitz des Tatverdächtigen befinden, z. B. das Tat- bzw. Einbruchswerkzeug, aber auch
Gegenstände, mit denen unmittelbar die gesamte Straftat begangen worden sein kann
(z. B. Waffen). Elektronische Daten als solche sind (nach nicht unumstrittener Ansicht)
jedoch keine Gegenstände, die einer Beschlagnahme nach § 94 StPO unterliegen können.2
Allerdings gehören zu den für die digitale Forensik relevanten und einer Beschlagnahme
nach § 94 StPO unterfallenden Gegenstände die physischen Datenträger wie Festplatten
eines Rechners, CDs, DVDs, USB- bzw. Memory Sticks, Speicherkarten, Disketten3 und
Smartphones4 , weitere Ton- und Bildträger und sonstige „verkörperte Informationsspeicher“5 , weil die höchstrichterliche Rechtsprechung6 auch auf Medien elektronisch gespeicherte Informationen zu den sicherstellungsfähigen Gegenständen gemäß § 94 StPO
zählt. Dies soll auch für sogenannte Kommunikationsdaten gelten, die z. B. auf einem
PC des Adressaten bzw. des Senders oder auf einem Mobiltelefon gespeichert sind, d. h.
E-Mails bzw. Anschlussnummern von eingegangenen bzw. ausgegangenen Telefonaten,
die aus dem Speichermedium des Mobiltelefons ausgelesen werden können.7 Nach Auffassung des BVerfG8 soll der Schutz des Post- und Fernmeldegeheimnisses nach Art. 10
GG, in welches nur in ganz besonders schwerwiegenden Fällen eingegriffen9 werden darf,
weil das Brief-, Post- und Fernmeldegeheimnis „unverletzlich“ ist und nur aufgrund eines Gesetzes (des Bundes oder eines Bundeslandes) beeinträchtigt werden darf, wobei
die kollidierenden Rechtsgüter – Geheimhaltungsinteresse bzw. Datenschutz versus Tataufklärung - sorgfältig gegeneinander abzuwägen sind, und damit auch der Schutz von
1
Die übliche Formulierung „mutmaßlicher“ Täter ist der Unschuldsvermutung aus Art. 6 II EMRK
geschuldet, wonach jeder Tatverdächtige bis zum gesetzlichen Nachweis seiner Schuld als unschuldig zu gelten hat.
2
Roxin und Schünemann [38, S. 274]; anderer Ansicht: Zimmermann [46, S. 321 f.]; Korge [26,
S. 95, S. 156, dort These II 1]; BVerfGE 113, S. 29 (50).
3
BVerfG-NStZ-RR 2003, S. 176 f.; BVerfG-NJW 2005, S. 1917 (1920); Kemper [22, S. 538 (540,
dort Fn. 17)]; Meyer-Goßner und Schmitt [30, § 94 Rdz. 4, 16a: Beschlagnahme durch Datenübermittlung]; BVerfGE 124, S. 43 (54); Gercke [13, § 94 Rdz. 17-19].
4
BVerfG-NJW 2005, S. 1917 (1919); Zimmermann [46, S. 321 f.].
5
BVerfG-NStZ-RR 2003, 176; BGH-NStZ 1997, 247; Hartmann und Schmidt [16, S. 135 Rdz. 418];
Herrmann und Soiné [17, S. 2922].
6
BVerfGE 113, S. 29; BVerfG-NJW 2007, S. 3343
7
Hartmann und Schmidt [16, S. 135 Rdz. 418].
8
BVerfGE 115, S. 166, 183.
9
Ein Eingriff in das Fernmeldegeheimnis liegt nach Ansicht des BVerfG (NJW 2012, 833 (836))
vor, wenn staatliche Stellen sich ohne Zustimmung der Beteiligten Kenntnis vom dem Inhalt oder
den Umständen eines fernmeldetechnisch vermittelten Kommunikationsvorgangs verschaffen.
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 267
§ 100a StPO, enden, wenn die Daten auf dem Gerät des Nutzers, an den sie gerichtet
sind, gespeichert sind. Ab diesem Zeitpunkt unterliegen sie der Beschlagnahme nach § 94
StPO10 , weil die Daten dann physisch auf den technischen Gerätschaften des Betroffenen
lokalisierbar und dort abrufbar sind (Abschn. 10.9).
Die Strafprozessordnung enthält nur marginale Regelungen zum beweismitteltechnischen Umgang mit Datenträgern und den in ihnen gespeicherten bzw. mit ihnen
abrufbaren digitalen Informationen. Auch ist zu berücksichtigen, dass die „Auswahl“
der jeweiligen strafprozessualen Eingriffsnormen zur rechtlichen Ermöglichung der
Datensicherstellung/-beschlagnahme erheblichen Einfluss auf deren Legitimierung hat:
Die Telekommunikationsregularien der §§ 100a ff. StPO sind wesentlich strenger und
demnach eine Durchsuchung bzw. Sicherstellung von Daten wegen des Erfordernisses
einer Katalogtat nach § 100a II StPO wesentlich schwieriger zu rechtfertigen als nach
den allgemeineren und nur einen vagen Anfangsverdacht11 voraussetzenden Bestimmungen der §§ 94 ff. StPO12 , nach welchen schon sogenannte „zureichende tatsächliche
Anhaltspunkte“ i. S. d. § 152 II StPO, d. h. die Möglichkeit einer begangenen Straftat, als
solche bereits ausreichen. Wenn dieser Anfangsverdacht in Bezug auf die Beschlagnahme gegeben ist, muss, weil es sich hierbei um einen fixen Konditionalsatz („wenn !
dann“ handelt), diese Maßnahme durchgeführt werden (§ 94 StPO: „Gegenstände, die
als Beweismittel [. . . ] von Bedeutung sein können, sind in Beschlag zu nehmen oder in
anderer Weise sicherzustellen“). Dies lässt sich sowohl mit der Unschuldsvermutung aus
Art. 6 II EMRK begründen, die zumindest einen Anfangsverdacht voraussetzen muss,
um eine derartige grundrechtssensible Maßnahme rechtfertigen zu können, als auch mit
dem Verhältnismäßigkeitsgrundsatz, nach welchem staatlich-hoheitliche Maßnahmen,
wozu insbesondere jene der Strafverfolgung gehören, geeignet, erforderlich und angemessen sein müssen. Für die Sicherstellung bzw. Beschlagnahme folgt hieraus, dass
erst ab einem „Mindestverdachtsgrad“ von einer geeigneten Strafverfolgungsmaßnahme
ausgegangen werden kann, sie also nicht „ins Blaue hinein“, quasi wie die Nadel im
sprichwörtlichen Heuhaufen, erfolgen darf, sondern aufgrund konkreter Anhaltspunkte,
welche eine Straftat dieses Betroffenen nach derzeitigem Erkenntnisstand zumindest als
möglich erscheinen lassen. Allerdings ist im Rahmen präventiv-polizeilicher Maßnahmen
zur Gefahrenabwehr eine rein vorsorgliche Beschlagnahme, z. B. die Beschlagnahme der
Festplatte eines Computers, auf der sich verdachtsunabhängig „rein theoretisch“ Hinweise auf eine Straftat finden lassen könnten, grundsätzlich unzulässig13 (s. aber § 20a
BKAG sowie § 5 ATDG zur vorbeugenden Terrorismusbekämpfung, Abschn. 10.13). Ein
Gegenstand, der als Beweismittel in Betracht kommt, kann nach § 94 StPO in Verwahrung
genommen oder in anderer Weise sichergestellt, d. h. in amtliche Verwahrung genommen
10
Hartmann und Schmidt [16, S. 135 Rdz. 418]; Michalke [31, S. 287 (291)].
Instruktiv zum Anfangsverdacht: Kohlmann [25, S. 164 ff., 173 ff.]; zum Tatverdacht im Rahmen einer Beschlagnahme gemäß § 94 StPO: Hartmann und Schmidt [16, S. 137 Rdz. 421] sowie
BVerfG, 2BvR9/10, Kriminalistik 2015, S. 100.
12
Roxin und Schünemann [38, S. 274].
13
Hartmann und Schmidt [16, S. 137 Rdz. 421].
11
268
F. Czerner
werden. Erst wenn diese Gegenstände von dem Betroffenen nicht freiwillig herausgegeben werden, ist eine sogenannte Beschlagnahme, d. h. Wegnahme eines Gegenstandes
gegen den Willen des Betroffenen, durch die Strafverfolgungsbehörden, d. h. auch durch
die Polizei, zulässig. Nach dieser Norm kann z. B. ein kompletter Rechner sichergestellt
bzw. beschlagnahmt werden, um beispielsweise auf der Festplatte, der externen Festplatte
oder auf anderen Speichermedien be- oder auch entlastendes Material zu entdecken.
10.3 Beschlagnahme und Durchsuchung bei E-Mails, SMS etc.
Etwas komplexer als im vorgenannten Abschn. stellt sich die rechtliche Lage bei E-Mails,
Sprachnachrichten, SMS, Faxen etc. dar, die beim Provider zwischengespeichert sind.14
Wenn und solange der Empfänger der betreffenden Nachricht (E-Mails/SMS) (noch) keinen unmittelbaren Zugriff auf diese Nachrichten hat und somit die E-Mails beim Provider weder aufrufen, noch lesen, noch bearbeiten und jene lediglich auf sein privates
Telekommunikationsgerät abrufen kann, gilt der Telekommunikationsvorgang, also ein
dynamischer15 Prozess der Nachrichtenübermittlung, als noch nicht abgeschlossen, und
der Zugriff der Strafverfolgungsbehörden richtet sich nach den Telekommunikationsüberwachungsregularien des § 100a StPO.16 Der Grund für die Anwendbarkeit von § 100a
StPO liegt im laufenden Telekommunikationsprozess, unter welchem nach Ansicht der
Rechtsprechung17 gemäß des § 3 Nr. 22 und Nr. 23 TKG (Telekommunikationsgesetz)
das Aussenden, Übermitteln und Empfangen von Nachrichten aller Art unter Verwendung
technischer Einrichtungen zu verstehen ist, welche die Nachricht z. B. in elektromagnetische oder optische Signale umformen18 , also alle modernen Kommunikationsformen.19
Dass diese Legaldefinition der Telekommunikation primär aus technischer Perspektive
formuliert wurde, während § 100a StPO primär auf Kommunikation zugeschnitten ist,
welche beobachtet werden soll, ist für die Brauchbarkeit dieser Legaldefinition letztlich
unerheblich20 , weil sich die Vorschrift des § 100a StPO ebenfalls sehr eng an den telekommunikationsrechtlichen Regularien orientiert. Zudem spricht die systematische Auslegung
von § 3 Nr. 22 TKG und von § 100a StPO für eine Zugrundelegung der TKG-Definition.
Vereinzelt wird bzgl. dieser Phase das Gegebensein einer Datenübertragung jedoch ab14
Hartmann und Schmidt [16, S. 135 Rdz. 418].
So die zutreffende Beschreibung durch Klein [24, S. 2996].
16
Hartmann und Schmidt [16, S. 135 Rdz. 418].
17
BGH-NJW 1997, S. 1934.
18
Siehe Hartmann und Schmidt [16, S. 186 Rdz. 579]; siehe auch Weiß [45, S. 99 f.].
19
Bär [5, S. 218 (220)].
20
Anders hingegen Paa [35, S. 109], welcher die Legaldefinition des § 3 Nr. 22 TKG in Bezug
auf § 100a StPO für nicht anwendbar hält und stattdessen die – wesentlich ungenauere – allgemeine Schutzzweckbestimmung aus dem Post- und Fernmeldegeheimnis aus Art. 10 I GG bemühen
will. Eine Präzisierung des Telekommunikationsvorganges wird hierdurch freilich nicht erreicht,
nur das Ergebnis bereits vorweggenommen, welches erzielt werden soll. Problematisierend auch
Gercke [13, § 100a Rdz. 9].
15
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 269
gelehnt, weil die Daten nur zwischengespeichert würden, ohne dass Signale ausgesendet
oder übermittelt würden.21 Bei isolierter Betrachtung dieser Phase ist diese Auffassung
zutreffend, doch ist gerade für den Prozess der Telekommunikation entscheidend, dass
auch datenübermittlungsfreie Zwischenphasen den Gesamtprozess letztlich nicht unterbrechen. Zutreffend wird auf die Einheitlichkeit des Übermittlungsvorgangs hingewiesen,
welche zudem nicht zu einer Umgehung der (im Vergleich zu §§ 94 ff. StPO) erhöhten
Voraussetzungen des § 100a StPO führen soll.22 Solange allerdings die Signale in diesem
Stadium noch nicht an den Empfänger weitergeleitet worden sind, also noch nicht empfangen wurden, dauert der Telekommunikationsvorgang gemäß § 3 Nr. 22 TKG noch an,
und hierauf basierend gestattet § 100a StPO die Überwachung und Aufzeichnung der Telekommunikation, wenn bestimmte Tatsachen den Verdacht begründen, dass jemand als
Täter oder Teilnehmer (= Mittäter, Anstifter oder Gehilfe) eine in Absatz 2 bezeichnete
schwere Straftat begangen hat bzw. versucht hat zu begehen.
Ist demgegenüber ein Zwischenspeicher auf einem Server des Providers eingerichtet, auf welchen der Nutzer passwortgeschützt über das Internet unmittelbaren Zugriff
hat und somit Nachrichten lesen, schreiben und löschen kann, ohne die Nachrichten auf
ein permanentes Speichermedium seines PC oder Telekommunikationsgerät herunterladen zu müssen, wie z. B. bei gmx.de, web.de und hotmail.com, ist die Beschlagnahme der
in einem derartigen Postfach beim Provider gespeicherten E-Mails nach Auffassung des
BGH23 auf der Basis von § 99 StPO (nicht § 100a StPO) zulässig.24
Zudem hat das BVerfG25 festgestellt, dass zugangsgesicherte E-Mail-Postfächer unter
dem Schutz des Post- und Fernmeldegeheimnisses nach Art. 10 I GG stehen, weil der verfassungsrechtliche Schutzbereich des Art. 10 I GG nicht auf telekommunikationsgesetzlicher Ebene des § 3 Nr. 22 TKG definiert und hierdurch möglicherweise eingeschränkt
wird, sondern an die grundrechtliche Schutzbedürftigkeit des Betroffenen anknüpfe: Wenn
Dritte in diesem Kommunikationsvorgang einbezogen würden, sei die Schutzbedürftigkeit auch bzw. vor allem bei einer Zwischenspeicherung der Kommunikationsinhalte bei
einem Provider gegeben.26 Erst wenn die Daten vom Empfänger abgerufen/gelesen bzw.
auf seinem Endgerät abgespeichert sind, ist der Telekommunikationsvorgang i. S. d. § 3
Nr. 22 TKG abgeschlossen und somit die Regelung des § 100a StPO nicht mehr auf ihn
anwendbar.
21
Korge [26, S. 78] unter Berufung auf eine wörtlich-restriktive Auslegung der Begriffs der „Nachrichtenübertragung“ und „Telekommunikation“, zustimmungswürdig i. E. jedoch auf [26, S. 80, 83]
sowie [26, S. 157 These II 7 ]; ähnlich auch Neuhöfer [33, S. 48 f.].
22
Paa [35, S. 112]; Neuhöfer [33, S. 50 ff., 58 m. w. N.].
23
BGH-NJW 2009, S. 1828.
24
Klein [24, S. 2996]; Hartmann und Schmidt [16, S. 135 Rdz. 418].
25
BVerfGE NJW 2009, S. 2431 f.
26
Hartmann und Schmidt [16, S. 135 Rdz. 418].
270
F. Czerner
10.4 Kopieren von Daten (Image) als eingriffsschwächeres
Äquivalent zur Beschlagnahme eines Rechners?
Teilweise wird die Ansicht vertreten, eine mildere Maßnahme als die Beschlagnahme
nach den §§ 94 ff. StPO stelle das Kopieren der Daten27 des Beschuldigten dar, sofern
dies mit einem Herausgabeverlangen nach § 95 StPO von nach konkreten Kriterien zusammengestellten Einzeldaten in Kopie auf separaten Datenträgern kombiniert werden
kann. Unter den Begriff der Beschlagnahme i. S. d. §§ 94 ff. StPO soll daher nach – nicht
unumstrittener28 Ansicht der höchstrichterlichen Rechtsprechung auch die Anfertigung
von Sicherungskopien zu verstehen sein, weil nur die Kopie des Datenbestandes eine
Beschlagnahme ersetzen könne.29 Hier ist aus historischen Gründen zu berücksichtigen,
dass dem damaligen Reichsgesetzgeber bei der Verabschiedung der Strafprozessordnung
im Jahr 1877 die heutigen Möglichkeiten der Informationstechnologie nicht ansatzweise
bekannt sein konnten, sodass vorliegend eine unbeabsichtigte und damit planwidrige Regelungslücke vorliegt, welche im Wege einer Analogie geschlossen werden kann.30 Die
Auffassung, das Kopieren stelle eine mildere Maßnahme gegenüber einer Beschlagnahme
des ganzen Rechners dar, ist insofern zutreffend, als der Gegenstand „Rechner“, „CD“
etc. hierbei beim Beschuldigten verbleibt und ihm nicht weggenommen wird, allerdings
können auch durch das „bloße“ Kopieren hochsensible Daten und Informationen an die
Strafverfolgungsbehörden gelangen, und der Rechner ist während des gesamten Kopiervorgangs für den Betroffenen nicht nutzbar, sodass sich – je nach Umfang des Kopierens
unter Verhältnismäßigkeitsgesichtspunkten die Frage stellt, welche Maßnahme sich nach
ihren Auswirkungen letztlich als eingriffsintensiver (und damit stärker rechtfertigungsbedürftig) erweist. Im Schrifttum31 findet sich die Ansicht, die gesamte Festplatte sei
schreibgeschützt auszulesen und eine Kopie in Form eines identischen Abbildes (1:1Kopie, „Image“) anzufertigen. Das „Image“ eines Datenträgers beinhaltet mehr als die
bloße Kopie von Dateien, es „spiegelt“ den ganzen Datenträger auch mit seinen gelöschten oder überschriebenen Dateien auf einen anderen Datenträger.32 Über diese Imagekopie
werde eine kryptographische Prüfsumme („Hash“) berechnet, welche zu dokumentieren
sei. Erst danach würden an der Imagekopie – niemals an dem Originaldatenträger – ebenfalls dokumentationspflichtige inhaltliche Untersuchungen vorgenommen: Die Nichtver27
BVerfG-NStZ-RR 2003, S. 176 f.; Kemper [22, S. 538 (540, dort auch in Fn. 21)]; Obenhaus [34,
S. 651 f., 653]; Korge [26, S. 61 f., 158, dort These 9]; Zimmermann [46, S. 321 f.]; Roxin und Schünemann [38, S. 274 m. w. N.]; Gercke [13, § 94 Rdz. 21].
28
Zur Nicht-Beschlagnahmefähigkeit der Daten als solcher: Kemper [22, S. 538 (541)].
29
Kemper [22, S. 538 (540, dort Fn. 29)]; so auch Korge [26, S. 95, 125].
30
Hierauf weist berechtigt Rux [39, S. 285 (290), dort auch m. w. N. in Fn. 32] mit insoweit
zutreffender Kritik an Kemper [22, S. 538 ff.] und an Hofmann [18, S. 121], hin. Zu den inhaltlichmethodischen Voraussetzungen analoger Rechtsanwendung, insbesondere zur Feststellung der
Planwidrigkeit einer Regelungslücke siehe Czerner [8, S. 182 (188)].
31
Kemper [22, S. 538 (540 ff, dort auch in Fn. 21, 29 und 47, 543 f.)]; Hansen und Pfitzmann [15,
S. 225].
32
Kemper [22, S. 538 (542, dort in Fn. 48)].
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz
271
änderung der sichergestellten Originaldatenträger sei damit wesentliche Voraussetzung
für die Verlässlichkeit sowie für die Revisionsfestigkeit dieser Untersuchungsmethode.
Eine Verletzung der Urheberrechte sei durch den Kopiervorgang nicht gegeben, weil § 45
UrhG eine Vervielfältigung von Werken für Verfahrenszwecke ausdrücklich gestatte.33
Zu beachten ist beim Sichten und Kopieren von Datenbeständen, dass auch vom Nutzer
gelöschte Dateien von den Ermittlungsbehörden aufgefunden und rekonstruiert werden
können, z. B. über vom Dienstanbieter angefertigte Sicherungskopien, die dem Nutzer
zwar nicht angezeigt werden, aber ggf. langfristig gespeichert werden können.34
10.5 Problem der Begrenzung von Durchsuchung und
Beschlagnahme auf verfahrensrelevante Datenbestände
versus Amtsermittlungsgrundsatz im Strafprozess
Ein weiteres Problem unter Verhältnismäßigkeitsgesichtspunkten, so wenig wie möglich
in die Rechte des Betroffenen einzugreifen, stellt die Beschränkung der Beschlagnahme
auf relevante Daten(bestände) dar. Werde festgestellt, dass sich auf dem Datenträger keine
verfahrenserheblichen Daten befinden können, wäre die Sicherstellung des Datenträgers
bereits ungeeignet und somit unzulässig.35 Der Zugriff auf Daten, die für das Verfahren bedeutungslos seien, müsse möglichst vermieden werden und nicht gebrauchte Daten
müssten herausgegeben bzw. gelöscht werden.36 Eine Trennung von relevanten bzw. nicht
relevanten Daten ist bei der Beschlagnahme eines Mediums jedoch nicht ohne Weiteres
möglich, weil das Speichermedium physisch nicht teilbar ist37 und weil auch unverdächtig
anmutenden Dateinamen nicht der Inhalt der Dateien anzusehen ist. Der Betroffene kann
durch technische Maßnahmen die gesuchten Daten verschleiern, vermischen, verschlüsseln, unsichtbar machen oder löschen.38 Auch nur halbwegs umsichtige Täter werden es
in der Regel vermeiden, für die Strafverfolgungsbehörden interessante Daten mit einem
eindeutigen Titel zu versehen, der Aufschluss über seinen Inhalt gibt.39 Insofern ist nur
schwerlich nachzuvollziehen, warum elektronisch gespeicherte Daten nicht alleine deshalb eingesehen werden dürften, weil sie versteckt, verschlüsselt oder gelöscht waren40 ,
sofern sie nicht zuvor auf ihre potentielle Beweiserheblichkeit für das konkrete Verfahren
überprüft worden sind. Solange die Datenspeicher nicht eingesehen werden, dürfte die
33
So Bär [5, S. 218 (220)].
Brodowski [6, S. 402 f., 404, 406].
35
BVerfG-NJW 2005, S. 1917 (1920); Kutzner [28, S. 2652 f.].
36
Vgl. BVerfGE 113, S. 29 (53, 55); BVerfG-NJW 2005, S. 1917, 1921, 1923; Jahn [20, S. 255
(262)]; Hartmann und Schmidt [16, S. 140 Rdz. 431].
37
Korge [26, S. 128].
38
Korge [26, S. 148].
39
Kohlmann [25, S. 46].
40
So aber Korge [26, S. 149]. Gelöschte Dateien sind für den „normalen“ Anwender nicht mehr
lesbar, sie sind aber, soweit dieser Bereich im Speicher nicht mit anderen Daten überschrieben wird,
noch vorhanden und mithilfe spezieller Software wieder rekonstruierbar (Weiß [45, S. 22]).
34
272
F. Czerner
potentielle Beweisbedeutung von bestimmten Daten/Dateien im Vorfeld nur schwer zu
bewerten sein, denn es lässt sich nur schwer vorhersagen, ob Daten aufgefunden werden,
welche im Zusammenhang mit Straftaten stehen (können) oder welche berufliche oder nur
private Angelegenheiten betreffen41 . Dazu müsste letztlich jede Datei zumindest gesichtet
werden, um aus der Fülle an Material Wesentliches von Unwesentlichem zu trennen und
hiervon diejenigen Dateien herauszufiltern, die mit dem Tatvorwurf in Zusammenhang
stehen (können)42 und um z. B. gelöschte oder versteckte Dateien überhaupt entdecken
und untersuchen zu können.43 Um einen „Kompromiss“ zwischen möglichst umfassender Sachverhaltsaufklärung einerseits und möglichst niedrigschwelligem Eingriff beim
Beschuldigten andererseits auszutarieren, kann die Durchsuchung und Beschlagnahme
auf bestimmte Absender- oder Empfängerangaben limitiert, in inhaltlicher Perspektive
oder durch Suchbegriffe im Mailtext beschränkt44 und/oder auf einen bestimmten Zeitraum begrenzt werden.45 Dabei gilt es primär zu klären, welche Daten und Informationen
für das (weitere) Verfahren von Bedeutung sind bzw. sein können.46 Damit ist zwangsläufig nicht auszuschließen, dass zahlreiche bzw. die allermeisten Daten und Dateien
im Strafverfahren letztlich keine Verwendung finden, zumal ihre Einbeziehung im Rahmen eines das Prozessstadium einleitenden Ermittlungsverfahrens unter einem (ersten)
Anfangsverdacht, der bloßen Möglichkeit des Vorliegens einer Straftat, gekennzeichnet
ist.47 Angesichts der häufig vorzufindenden Datenmengen wurde jedoch vonseiten der
Praxis bereits vor zehn Jahren eingewendet, es sei schlichtweg „unmöglich, unrealistisch
und lebensfremd“48 , jede einzelne kopierte Datei aufzuzeichnen; allenfalls die gesicherten Verzeichnisstrukturen könnten ausgedruckt werden. Vor diesem Hintergrund stößt die
genuine Verpflichtung der Strafverfolgungsbehörden wie auch der Gerichte zur Erfassung der Beweisaufnahme auf alle Tatsachen und Beweismittel, die für die Entscheidung
von Bedeutung sind (§ 244 II StPO), infolge faktisch-technischer Hindernisse an ihre
Grenzen. Damit steigt zugleich das Risiko einer möglichen Revisibilität einer auf eine
lediglich fragmentarische Beweisaufnahme beruhenden Aburteilung (Verurteilung oder
Freispruch), weil die gerichtliche Entscheidung möglicherweise anders ausgefallen wäre,
wenn alle Dateien aus der Imagekopie in die Beweiswürdigung mit einbezogen worden
wären (vgl. den relativen Revisionsgrund in § 337 StPO). Begrüßenswert ist vor diesem
Hintergrund die Nichtbeanstandung einer vollständigen Kopie sämtlicher sichergestell41
Vgl. Obenhaus [34, S. 651 f.], dort jedoch im Zusammenhang mit dem Problem der Datensichtung beim Cloud Computing (Abschn. 10.14), wobei strukturell die gleichen Schwierigkeiten des
verdachtgestützten Vermutens über verfahrensrelevante Datenbestände bestehen.
42
Berthel et al. [3, S. 70]; Korge [26, S. 126, 146]; Rogge [36, S. 29].
43
Kemper [22, S. 538 (540, dort in Fn. 21, 542)]; Korge [26, S. 52].
44
Kasiske [21, S. 228 (232)]; Brodowski [6, S. 402 (410)].
45
BVerfGE 113, S. 29 (56); BGH-NJW 2010, S. 1297 f.; dem berechtigt folgend: Zimmermann [46,
S. 321 f.].
46
Berthel et al. [3, S. 70].
47
Dies wurde berechtigt vom BVerfG-NJW S. 1995, 2839 f. festgestellt.
48
So der gewichtige Einwand von Kemper [22, S. 538 (541, dort auch in Fn. 45)].
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz
273
ter E-Mails durch das Bundesverfassungsgericht.49 Im Zusammenhang mit dem Kopieren
von Datenbeständen wird allerdings auf das Risiko technisch bedingter Fehlerquellen hingewiesen: Beispielsweise können im Originalspeichermedium versteckte oder gelöschte
Dateien beim Kopieren nicht mit übertragen werden, wobei derartige Fehler i. d. R. nur
von Spezialisten erkannt werden können.50 Der Beweiswert kopierter Datenbestände soll
daher hinter dem Beweiswert der Originaldatei als geringer einzustufen sein.51
10.6 Durchsuchung und Beschlagnahme von Daten
und der „Kernbereich privater Lebensgestaltung“
Rechtsprechung52 und Teile der Literatur53 sind sich dem Grunde nach einig darüber,
dass der (etwas hochtrabend formulierte) „Kernbereich privater Lebensgestaltung“54 als
ein „letzter unantastbarer Bereich menschlicher Freiheit, der der Einwirkung der öffentlichen Gewalt entzogen ist“ (höchstpersönliche, intime Gedanken, Gefühlsäußerungen)
ausreichend geschützt wird. Bedeutung erlangt die Bezugnahme auf den „Kernbereich
privater Lebensgestaltung“ insofern, als der PC nicht lediglich als „Edelvariante“ einer
elektrischen Schreibmaschine, als „Rechenknecht“ oder bloßes Portal zum Internet dient,
sondern zunehmend auch als Adressbuch, Archiv, Bibliothek und auch als Tagebuch fungiert.55 Ob Computer allerdings automatisch und zwangsläufig deshalb dem Zugriff der
Behörden entzogen bleiben müssen bzw. ob gefordert werden kann, Daten aus diesem
geschützten „Kernbereich privater Lebensgestaltung“ sollten erst gar nicht erhoben werden56 , ist fraglich, zumal sich infolge unterschiedlichster Dateien auf einem Rechner, die
von mehreren Personen genutzt werden können, teilweise private und teilweise weniger
private Inhalte finden lassen werden – jene Unterschiede gilt es im Wege der Durchsuchung zunächst herauszufiltern. Aus diesem Grunde statuierte der Gesetzgeber ein spezielles Beweisverbot in § 100a IV 1 StPO und die daraus ableitbare Unzulässigkeit der
gerichtlichen Nutzung bestimmter Erkenntnisse, wenn diese allein aus dem „Kernbereich
privater Lebensgestaltung“ stammen. In der Regel ist jedoch nicht vorhersehbar, welchen Inhalt die erhobenen Daten haben57 , und dem jeweiligen Speichermedium ist der
49
BVerfG-NJW 2009, S. 2431, Rdz. 108 ff.
Korge [26, S. 126, 158, dort These 9].
51
Korge [26, S. 130, 152].
52
Substantiell bereits in BVerfGE 6, S. 32 (41); BVerfGE 109, S. 279 (313 ff.).
53
Zum Beispiel Roßnagel [37, S. 225 (230)]; Zimmermann [46, S. 321 (327)].
54
Hierzu ausführlich Paa [35, S. 52 ff., 119 ff., 149 ff.]; Kohlmann [25, S. 120 ff., 229]; Weiß [45,
S. 193 ff., 275]; Gercke [13, vor §§ 94 ff. Rdz. 18, 19 sowie § 100a Rdz. 32].
55
Rux [39, S. 285, 291]; Kohlmann [25, S. 107, dort Fn. 450].
56
Rux [39, S. 285, 291, dort in Fn. 37 f. mit Hinweis auf BVerfGE 80, S. 367 (373, Tagebuch), der
Diktion nach BVerfGE 109, 279 (großer Lauschangriff); BVerfGE 113, S. 348 (390 ff.)].
57
So berechtigt gesehen vom BVerfG-NJW 2008, S. 822 (834) mit Hinweis auf BVerfGE 113,
S. 348 (392) = NJW 2005, S. 2603 (2612).
50
274
F. Czerner
Informationsgehalt nicht ohne Weiteres anzusehen58 (s. o., Abschn. 10.5), sodass eine umfangreiche Erhebung grundsätzlich geboten sein wird. Hier offenbart sich die Schwäche
des Kernbereichsarguments zumindest für die Durchsicht bestimmter Datenbestände auf
verfahrensrelevante Informationen: Die Gewissheit, ob sich überhaupt relevante Dateien
auf dem Rechner befinden, wird erst und nur durch die heimliche Überwachungsmaßnahme ermöglicht – dann aber ist bereits in den möglichen „Kernbereich“ eingegriffen worden – ,der Schutz der Menschenwürde greife daher erst und nur nach ihrer Verletzung.59
Folgerichtig wird eine Beeinträchtigung der Menschenwürde und damit ein Verstoß gegen Art. 1 I GG nicht schon bei einer bloßen Kenntnisnahme von „kernbereichsrelevanten“
Informationen durch die Strafverfolgungsorgane gegeben sein; vielmehr müssen weitere
Umstände hinzutreten, die insgesamt eine Missachtung der Subjektqualität des Menschen
erkennen lassen.60
Auch ist bei dieser zweifelsohne wichtigen, aber nicht selten gebetsmühlenartig wiederholten Formulierung „Kernbereich privater Lebensgestaltung“ zu beachten, dass zunächst in jedem Einzelfall sehr genau geprüft werden muss, ob, wann und wodurch genau
(Kausalität!) überhaupt in den Kernbereich privater Lebensgestaltung eingegriffen wird,
zumal diese Formulierung sehr gerne als „argumentatives Totschlagsargument“ dazu genutzt wird, um notwendige staatliche Ermittlungsbefugnisse (Abschn. 10.12.2) weitgehend zu minimieren und dadurch (unbewusst oder bewusst) dem Täterschutz im Bereich
der Schwerkriminalität bzw. der schwer aufzuklärenden Kriminalität Vorschub zu leisten.
Zutreffend verwehrte das BVerfG61 einem Beschuldigten die Verhinderung der Beschlagnahme von Unterlagen, obwohl jener sie als „Verteidigungsunterlagen“ bezeichnete, um
durch diese Schutzbehauptung der Beschlagnahme zu entgehen. Vor allem das Strafverfahrensrecht sieht sich durch die Zuerkennung von Vetorechten der Gefahr einer Hypertrophie der Beschuldigtenrechte ausgesetzt, wodurch unverzichtbare Ermittlungsmaßnahmen
ausgeschaltet bzw. umgangen werden können.62 Freilich bewegt sich die Frage nach der
Reichweite staatlicher Eingriffsbefugnisse auf dem Grat zwischen Sicherheit und Freiheit und der Frage, wie viel der Mensch von sich aus preisgeben muss, damit der Staat
effektiv Sicherheit gewährleisten kann.63 Der Schutz der Privatsphäre, eine große Errungenschaft des freiheitlich-demokratischen Rechtsstaates, darf jedoch weder als „Schonraum“ für Straftäter vor Strafverfolgung, noch als Alibi für eine unzureichende Ermittlung
von Straftaten dienen. Andernfalls bestünde die Gefahr, worauf der Tübinger Abgeordnete des Parlamentarischen Rates, Carlo Schmid (1896-1979) bei den Vorarbeiten zum
Grundgesetz hingewiesen hatte, dass die Grundrechte die Voraussetzungen für ihre eige58
Korge [26, S. 1].
Hierauf machten die Richterinnen Jaeger und Hohmann-Dennhardt in ihrem Sondervotum zu
BVerfGE 109, S.279 (383 f.) berechtigt aufmerksam; siehe hierzu auch Paa [35, S. 60, dort Fn. 287].
60
Paa [35, S. 61].
61
BVerfG-NJW 2002, S. 1410.
62
Für den Bereich rechtsmedizinisch indizierter Sektionen untersucht von Czerner [9, S. 1 f., 7 ff.].
63
Siehe die lesens- und diskussionswürdige, konzise Aufbereitung dieser Abwägungsproblematik
von Di Fabio [10, S. 421].
59
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz
275
ne Abschaffung liefern könnten. Berechtigt schränkte das BVerfG64 einerseits den „nur“
grundsätzlich zu gewährenden „Kernbereichsschutz“ selbst bei (stets höchstpersönlichen)
Tagebuchaufzeichnungen ein, wenn jene einen unmittelbaren Bezug zu einer konkreten
Straftat aufweisen (z. B. Geständnis). Unverständlich ist daher, weshalb das BVerfG65
später in seiner Entscheidung zur akustischen Wohnraumüberwachung den „Kernbereich
privater Lebensgestaltung“ für unabwägbar hielt und selbst nach Maßgabe des Verhältnismäßigkeitsgrundsatzes keinerlei Eingriff zulassen möchte. Davon abgesehen, dass der
Kernbereichsschutz – entgegen seinem eigentlichen Ziel des Schutzes höchstpersönlicher
Geheimhaltungsinteresses – sich hierdurch auch zu einem faktisch wie rechtlichen strafverfolgungsfreien Schonraum für Straftäter entwickeln würde, ist die Gleichsetzung des
Kernbereichsschutzes mit der unabwägbaren Menschenwürde gemäß Art. 1 I GG, dem
absoluten, niemals einschränkbaren Recht, nicht nachvollziehbar. Allein ihr gebührt die
Unantastbarkeit, nicht aber einem, wenn auch mit ihr zusammenhängenden abgeleiteten
Recht. Für die Reglungen zum Schwangerschaftsabbruch hat das BVerfG in seinen zwei
Entscheidungen66 die mit tangierte Menschenwürde in Verbindung mit dem allgemeinen
Persönlichkeitsrecht für abwägbar und somit einschränkbar erachtet – wenn dies schon
für das irreversibel zerstörbare Lebensrecht gilt, muss dies erst recht für den insoweit
schwächeren Kernbereichsschutz gelten, zumal diesem (auch gebotenen) Schutz durch
eine restriktive Handhabung sowie durch Implementierung verfahrensrechtlicher Hürden
Rechnung getragen werden kann, um dem Staat nicht zu starke Überwachungs- und Kontrollmechanismen zu gewähren.
Einen weiteren Aspekt im Rahmen dieser strafprozessualen grundrechtlichen Eingriffsmaßnahme gilt es unter Verhältnismäßigkeitsgesichtspunkten zu beachten: Wenn problemverkennend und reduktionistisch nur die Wahrscheinlichkeit der Rechtsgutsverletzung umso höher sein müsse, je intensiver der Grundrechtseingriff67 ist, dann muss in
diese Verhältnismäßigkeitsprüfung neben der bloßen Wahrscheinlichkeit68 , dass es zu einer Rechtsgutsverletzung kommt, ebenso mit einbezogen werden, um welches geschütztes
Rechtsgut es sich handelt, zu deren Zweck eine Durchsuchung bzw. Beschlagnahme auch
allein aus Beweisgründen angeordnet werden sollte. Der allgemeine Rechtfertigungsgrund
des § 34 StGB hat die wesentlichen Abwägungsparameter genannt, wobei diese Norm
die erforderliche Gefahrenlage für weniger schützenswerte Rechtsgüter (z. B. Eigentum)
als höher einstuft als die Gefahrenlage für ein höchst schützenswertes Rechtsgut wie das
menschliche Leben.
64
BVerfGE 80, S. 367 (374 f.); BVerfG-NJW 2012, S. 833 (837); BGHSt 34, S. 397 (400 f.).
BVerfGE 109, S. 279 (314).
66
BVerfGE 39, S. 1 ff. und BVerfGE 88, S. 203 ff.
67
Vgl. die eindimensionale Sichtweise z. B. von Roßnagel [37, S. 225 (230)].
68
Siehe die kluge Anmerkung zum Wahrscheinlichkeitsbegriff von Kohlmann [25, S. 163, dort
Fn. 728].
65
276
F. Czerner
10.7 Durchsuchung und Beschlagnahme
auch bei Nichtbeschuldigten?
Eine besondere Ausprägung erfährt der Verhältnismäßigkeitsgrundsatz, wenn es sich um
die Sicherstellung bzw. Beschlagnahme von Gegenständen, also Rechnern, Festplatten,
CDs etc., bei Nichtbeschuldigten handelt69 , zumal die Beschlagnahmevorschriften gemäß
§§ 94 ff. StPO stets den Beschuldigtenstatus voraussetzen, d. h. eine bestimmte Person,
gegen welche zumindest ein Anfangsverdacht – oder im Rahmen der Telekommunikationsüberwachung sogar ein dringender Tatverdacht bestehen muss, d. h. die hohe Wahrscheinlichkeit, dass der Betreffende die Tat wirklich begangen hat und deshalb höchstwahrscheinlich verurteilt werden wird, wenn sich dies in der Hauptverhandlung bestätigen
lässt. Die Durchsuchung bei Dritten erfordert neben dem Verdacht einer Straftat, dass
der einfache Verdacht besteht, beim Dritten könnten konkret bestimmte und bezeichnete Spuren einer Straftat, beschlagnahmefähige Gegenstände oder der Beschuldigte selbst
gefunden werden.70
10.8
Formalia bei der Anordnung und Durchführung
von Durchsuchung und Beschlagnahme
Die Anordnung der Beschlagnahme erfolgt gemäß § 98 I StPO durch das Gericht, wobei
die Inverwahrungnahme des Gegenstandes von jedem Polizeibeamten durchgeführt werden kann.71 Die gerichtliche Beschlagnahmeanordnung ergeht als Beschluss, der schriftlich zu fixieren und zu begründen ist (§ 34 StPO); der Betroffene ist nach § 98 II 5 StPO
über seine Rechtsschutzmöglichkeiten zu belehren.72 Bei Gefahr in Verzug sind die Staatsanwaltschaft und ihre Ermittlungspersonen anordnungsbefugt.73
10.9 Telekommunikationsüberwachung gemäß § 100a StPO
Eine (heimliche) Überwachung der Telekommunikation (zur Legaldefinition der Telekommunikation Abschn. 10.3) stellt einen Eingriff in das durch Art. 10 GG geschützte Postund Fernmeldegeheimnis und zudem einen Eingriff in das allgemeine Persönlichkeitsrecht
nach Art. 2 I i. V. m. Art. 1 I GG dar und bedarf wegen des Gesetzesvorbehalts in Art. 10
GG einer (bundes- oder landes-)gesetzlichen Regelung – diese ist mit der Norm des § 100a
StPO geschaffen worden.74 § 100a StPO gilt gemäß § 3 Nr. 22 und Nr. 23 Telekommunika69
OLG Koblenz, NStZ 2007, S. 285 f.; Hartmann und Schmidt [16, S. 140 Rdz. 431].
Kühne [23, S. 319 § 29 Rdz. 497].
71
Hartmann und Schmidt [16, S. 142 Rdz. 435].
72
Hartmann und Schmidt [16, S. 142 Rdz. 438, S. 144 Rdz. 444].
73
Hartmann und Schmidt [16, S. 144 Rdz. 444].
74
Hartmann und Schmidt [16, S. 185 Rdz. 578].
70
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz
277
tionsgesetz (TKG) einerseits für analoge und digitale Signale, für die leitungsgebundene
Übermittlung und den Mobilfunk, andererseits auch für den Fernschreib- und Telefaxdienst; für Telegramme gilt § 99 StPO als speziellere Regelung.75 § 100a StPO erfasst alle
Formen des „Abhörens“ der Inhalte von Telekommunikation, auch Chatdienste, Internettelefonie („Voice over IP“ – Sprachübertragung in Echtzeit mittels Internetprotokoll76 –
und E-Mail77 ), mithin jegliche Art der Nachrichtenübermittlung.78 Diese Norm gestattet
die Überwachung und Aufzeichnung der Telekommunikation, wenn bestimmte Tatsachen
den Verdacht begründen, dass jemand als Täter oder Teilnehmer (= Mittäter, Anstifter oder
Gehilfe) eine der in Absatz 2 bezeichneten schweren Straftaten begangen bzw. versucht
hat zu begehen.
10.9.1 Rechtliche Qualifizierung einzelner Phasen im E-Mail-Verkehr
Die Telekommunikationsüberwachung in Bezug auf E-Mails wird in rechtlicher Perspektive kontrovers diskutiert, und es werden je nach Phase der E-Mail-Bearbeitung durch den
Absender bzw. den Adressaten unterschiedliche rechtliche Regelungen zugrunde gelegt,
welche nachfolgend angesichts der Komplexität in stichpunktartiger Darstellung vorgestellt werden:79
Phase 1: Schreiben der E-Mail
1a: Sonderkonstellation des Entwurfsstadiums beim Webmail-Service
Phase 2: Absenden der E-Mail und Übermittlung über Mail-Provider des Absenders an Mailprovider des Empfängers
Phase 3: Zwischenspeicherung der noch ungelesenen Mail beim Empfängerprovider
Phase 4: Abruf der E-Mail durch Empfänger: Herunterladen oder speichern der
Mail mit Webmailservice, z. B. gmx
Phase 5: Herunterladen und Speichern der (gelesenen) Mail durch den Adressaten
Phase 6: Endspeicherung beim Mailprovider des Empfängers
75
Hartmann und Schmidt [16, S. 187 Rdz. 580].
Bär [5, S. 218 (220)].
77
BGH-NJW 1997, S. 1934.
78
BGH-NStZ 1997, S. 247.
79
Diese Übersicht orientiert sich maßgeblich an dem inhaltlich wie didaktisch vorzüglichen
Übersichtsartikel von Zimmermann [46, S. 321 ff.] sowie an der Rechtsprechung. Ein anderes Phasenmodell findet sich beispielsweise bei Gercke [11, S. 624], bei Brodowski [6, 402 f. (7 Phasen)]
sowie bei Klein [24, S. 2996 f.]; Kasiske [21, S. 228 (3 Phasen)]; Neuhöfer [33, S. 27 ff.]; Paa [35,
S. 111 (ebenfalls 3 Phasen)]; Korge [26, S. 68 f., 157, dort These II 6].
76
278
F. Czerner
Phase 1 und 5
Phase 1 – noch kein Telekommunikationsvorgang
Phase 5 – bereits abgeschlossene Telekommunikation
Folglich ist in beiden Fällen das Fernmeldegeheimnis gemäß Art. 10 GG nicht betroffen
Offener Zugriff: Strafverfolgungsbehörden können die Speichermedien gemäß §§ 94 ff.
StPO sicherstellen bzw. beschlagnahmen; Durchsicht des gesamten Mailbestands auf
verfahrensrelevante E-Mails gemäß § 110 I StPO; bei Speicherung der Mails auf externen Servern können Ermittler vom Rechner des Beschuldigten die andernorts gespeicherten Nachrichten aufrufen – falls jene passwortgeschützt sind, besteht gemäß
§§ 95, 110 III, 100j I 2 StPO i. v. m. § 113 I 2, IV 1 TKG für den Provider (sofern er
TK-Dienstleister ist) eine Auskunftspflicht zur Bekanntgabe des Passworts, andernfalls
„Knacken“ des Passworts; Problem bei im Ausland befindlichen Servern: Geltung des
Übereinkommens über Computerkriminalität, BGBl. 2008 II S. 1242, ggf. vorläufige
Datensicherung i. V. m. einem Rechtshilfeersuchen an den betreffenden Staat (hierzu
Abschn. 10.15)
Verdeckter (heimlicher) Zugriff auf die Festplatte des Beschuldigten von außerhalb
mittels Spionagesoftware im Wege einer Online-Durchsuchung (Abschn. 10.12):
§ 100a StPO hierbei nicht anwendbar, weil eine Telekommunikation noch bzw. nicht
mehr gegeben ist; keine Rechtsgrundlage zugunsten einer Online-Durchsuchung und
Beweisverwertungsverbot, falls doch Daten erhoben wurden; Mindermeinung: §§ 102
StPO80 soll auch Online-Durchsuchung gestatten
Phase 1a
Obwohl erst im Entwurfsstadium, wird die serverbasiert entworfene Mail beim
Absender-E-Mailprovider als Entwurf zwischengespeichert – liegt hier beim Absenderverbleib der E-Mail bereits/dennoch ein Telekommunikationsvorgang vor?
– Falls der Entwurfsordner auf dem Server des E-Mail-Providers als externe Festplatte eines lokalen Rechners angesehen werden würde, könnte ein Telekommunikationsvorgang (noch) verneint werden81 : Der Entwurf wäre genau wie unter (1)
beschrieben als Offline-Entwurf zu betrachten –> (offene) Beschlagnahme gemäß
§ 94 i. V. m. § 110 III StPO möglich; Zugriff auf den Entwurfsordner könnte (auch)
mittels einer Durchsuchung beim Mail-Provider gemäß § 103 StPO und einer anschließenden Beschlagnahme seines Inhalts erfolgen82
– Postbeschlagnahme, § 99 StPO analog: Ähnlich wie der BGH in Phase 3 wird die
heimliche Beschlagnahme gemäß § 99 StPO für zulässig erachtet, weil eine Mail
im Entwurfsordner wie eine bei der Post „zwischengelagerte“ Karte anzusehen sei,
80
Zur Anwendbarkeit von § 102 StPO siehe Kohlmann [25, S. 54 ff.]; Weiß [45, S. 57 f., 60, 63,
67 f.].
81
Brodowski [6, S. 402 (405)].
82
So der Lösungsvorschlag von Hermann/Soiné [17, S. 2922 (2924)].
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 279
welche der Post unter dem Vorbehalt anvertraut worden ist, sie bis zur endgültigen Entscheidung des Absenders zurückzuhalten, abzuschicken oder zu vernichten.
Dieser Vergleich ist insofern unzulässig, als die Post keine Karten/Briefe unter Vorbehalt des Weitersendens „zwischenlagert“; infolge des Ruhens der Telekommunikation handelt es sich nicht um einen TK-Vorgang83
– Überwiegende Ansicht: TKÜ: Die im Entwurf-Ordner abgelegte Mail sei bereits
Teil eines TK-Vorgangs, zumal eine Datenübermittlung gemäß § 3 Nr. 22 TKG (vom
Rechner des Nutzers zum Server) stattgefunden hat, die Mail potentiell an einen bestimmten Adressaten gerichtet sei und sie einem Dritten (Provider) anvertraut sei,
sodass die vom BVerfG beschriebene „Gefährdungslage“ bestehe –> Lösung wie
in Phase 3: entweder (offene) Beschlagnahme gemäß § 93 ff. StPO oder verdeckter/heimlicher Zugriff gemäß § 100a StPO
– Telekommunikation in der Cloud (Abschn. 10.14): bloßes „Ablegen“ von (passwortgeschützten) Daten auf dem Server des Providers kann dann einen TK-Vorgang
darstellen, wenn ein Dritter berechtigten Zugriff auf die Daten haben kann. Ungeklärt ist die Frage, ob die Nutzung von Cloud-Storage-Diensten wie dropbox als
überwachte TK gemäß § 100a StPO anzusehen ist: Nutzen Personen die Cloud zu
Kommunikationszwecken, indem sie die Zugangsdaten teilen und Dateien mit darin enthaltenen Nachrichten hochladen oder online verändern, sei dies genauso zu
bewerten wie bei der Entwurfsordner-Konstellation. Das Praxisproblem bestehe jedoch darin, dass der Cloudanbieter in der Regel nicht als TK-Diensteanbieter i. S. d.
§ 3 Nr. 24 i. V. m. § 110 I 1 TKG anzusehen und daher nicht gemäß § 110b III 1
StPO zur TKÜ-Mitwirkung verpflichtet sei
Phase 2 und 4
In beiden Phasen befindet sich die Mail im Telekommunikationsvorgang (§ 3 Nr. 22
TKG) und unterliegt somit dem Fernmeldegeheimnis; TKÜ gemäß § 100a StPO möglich; Beweisverwertungsverbot in § 100a IV StPO
Phase 3
Umstritten, auf welcher Rechtsgrundlage ein Zugriff auf die noch ungelesenen E-Mails
beim Provider zulässig ist
– BGH (2009): Postbeschlagnahme gemäß §§ 99 ff. StPO, obwohl der TKÜ-Vorgang
gemäß § 100a StPO jetzt bereits abgeschlossen ist; ungelesene Mail sei mit Postkarte vergleichbar, die bei der Post auf ihren Weiterversand/Zustellung „wartet“; die
bei § 99 StPO fehlende Zwangsbefugnis gegenüber. TK-Anbieter lasse sich aus § 95
II StPO analog herleiten84 ; Vorteil gegenüber. der TKÜ gemäß § 100a StPO: Anfangsverdacht genügt, keine Anforderung an Schwere der Straftat, keine explizite
83
84
Anders jedoch BVerfGE 124, S. 43 (55 ff.).
BGH-StV 2009, S. 623 (v.31.3.2009); BGH-NStZ 2009, S. 397 f.
280
F. Czerner
Nennung des privaten Kernbereichsschutzes; kann auch heimlich erfolgen (§ 101
IV 2 Nr. 2 StPO) mit nachträglicher Information des Betroffenen; Sichtung dieser
E-Mails nur durch Gericht und Staatsanwaltschaft, nicht durch polizeiliche Ermittlungsbeamte (§ 100 III StPO)
– Überwiegende Ansicht: TKÜ gemäß § 100a StPO, obwohl der Telekommunikationsvorgang gemäß § 3 Nr. 22 TKG jetzt bereits abgeschlossen ist, jedoch sei TKÜDefinition für die StPO nicht (!) maßgeblich85 ; Art. 10 I GG spreche nicht vom
Fernmeldeverkehr, sondern von Fernmeldegeheimnis –> Bei Vorliegen einer richterlichen Anordnung gemäß § 100a StPO wäre TK-Anbieter zur Herausgabe der
ungelesenen E-Mails verpflichtet (Katalogtat erforderlich)
– Bundesverfassungsgericht86 : entscheidend sei, ob der Zugriff auf die ungelesene EMail offen oder verdeckt (= heimlich) erfolge; Fernmeldegeheimnis gemäß Art. 10
I GG gelte auch hier;
–> bei offenem Zugriff: Beschlagnahme gemäß § 94 StPO i. V. m. Durchsicht des
Speichers gemäß § 110 StPO –> Beschlagnahme könne gegenüber. E-MailProvider angeordnet werden
–> bei verdecktem Zugriff: wegen hoher Eingriffsintensität nur unter den TKÜVoraussetzungen von § 100a StPO zulässig87 , welche nicht durch die „einfache“
Postbeschlagnahme umgangen werden dürften; Zugriff auf den Server des Providers sei auch heimlich zulässig, vgl. § 110 III StPO (mit nachträglicher Benachrichtigungspflicht gemäß § 33 StPO)
– Mindermeinung: keine Rechtsgrundlage und damit unzulässig, weil sich TKÜ
(§ 100a StPO) und Beschlagnahme (§§ 94 ff. StPO) nicht miteinander kumulieren
lassen88 –> massive Beeinträchtigung einer effizienten Strafverfolgung
Phase 6
Telekommunikationsvorgang ist jetzt beendet, Rechtsgrundlage umstritten:
– Überwiegende Ansicht: Auch die beim Provider endgespeicherten E-Mails unterliegen dem Fernmeldegeheimnis nach Art. 10 I GG89 , weil sie nach wie vor dem
Zugriff Dritter preisgegeben sind; Lösung nach Vorgabe des BVerfG wie bei Phase
3 bei ungelesenen Mails:
Beschlagnahme gemäß § 94 StPO bei offenem Zugriff
TKÜ gemäß § 100a StPO bei verdecktem/heimlichem Zugriff – gilt auch, wenn
der Absender die Mail dauerhaft in seinem Gesendet-Ordner serverbasiert gespeichert hat
85
Dann ist allerdings fraglich, wie das Prinzip der Einheit der Rechtsordnung gewahrt bleiben soll,
wenn die systematische Konnexität beliebig (willkürlich?) angenommen oder auch abgelehnt werden kann.
86
BVerfGE 124, S. 43, 55, 58, 60 m. Anmerkung von Klein [24, S. 2996].
87
Vgl. BVerfGE 124, S. 43 (62 f.).
88
So BGHSt 51, S. 211 (219).
89
BVerfGE 124, S. 43 (56).
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz
281
– Mindermeinung: (Post-)Beschlagnahme gemäß § 94 StPO (offen) bzw. § 99 StPO
(heimlich) –> Problem bei heimlicher Maßnahme: Es ist praktisch schwer feststellbar, ob eine auf dem Provider gespeicherte Mail noch auf ihren Abruf beim
Empfänger „wartet“ – vgl. Phase 3, dann TKÜ gemäß § 100a StPO einschlägig,
oder ob sie bereits gelesen90 wurde, dann Phase 6 gemäß § 99 StPO
Um den verfassungsrechtlich garantierten Schutzbereich von Art. 10 GG möglichst weit
zu spannen, unterliegen nicht nur das jeweilige Gespräch bzw. die übermittelte Nachricht
dem Grundrechtsschutz, sondern auch flankierend die Verbindungs- bzw. sogenannten
Verkehrsdaten (hierzu Abschn. 10.11) gemäß § 3 Nr. 30 i. V. m. § 96 TKG bzw. § 100g III
StPO. Diese Daten enthalten Informationen zu einem konkreten Kommunikationsvorgang
mit den beteiligten Rufnummern, Datum, Uhrzeit sowie beim Mobilfunk auch den Standort (= Funkzelle, vgl. § 100i StPO) und bei Internetnutzung auch die jeweilige dynamische
IP-Adresse.91 Der Schutz des Post- und Fernmeldegeheimnisses von Art 10 GG und der
strafprozessualen Vorschrift des § 100a StPO endet, wenn die Daten auf dem Gerät des
Nutzers, an den sie adressiert wurden, gespeichert sind – dann unterliegen sie einerseits
den Durchsuchungsregularien der §§ 102, 103 StPO und andererseits der Beschlagnahmeregelung des § 94 StPO.92 Erst wenn der Telekommunikationsvorgang abgeschlossen
ist, greifen diese Telekommunikationsregelungen nicht mehr ein, und es verbleiben nur
noch das seit 1983 anerkannte grundrechtsgleiche Recht auf informationelle Selbstbestimmung93 sowie der Schutz des „Kernbereichs privater Lebensgestaltung“, z. B. wenn
ein Mobiltelefon mit den darauf gespeicherten persönlichen Daten beschlagnahmt wird.94
10.9.2 Voraussetzungen und Möglichkeiten der
Telekommunikationsüberwachung gemäß § 100a StPO
Die Regelung des § 100a StPO enthält in Absatz 2 einen numerus clausus, einen abgeschlossenen Katalog, in welchen Fällen von einer „schweren Straftat“ auszugehen ist;
eine erweiternde Auslegung ist nicht zulässig, auch nicht unter Berufung auf den allgemeinen strafrechtlichen Rechtsfertigungsgrund des Notstandes gemäß § 34 StGB.95 Diese
Ansicht kann sich auf den Wortlaut der Regelung berufen, weil in § 100a II StPO eine feststehende Definition formuliert worden ist: „Schwere Straftaten [. . . ] sind“. § 100a
90
Für Brodowski [6, S. 402 (405)] bedeutet es keinen Unterschied, ob die E-Mail bereits gelesen
worden ist oder noch nicht, da sich das Fernmeldegeheimnis nach Art. 10 I GG nicht lediglich auf
den Kommunikationsvorgang, sondern auch auf dessen Inhalte beziehe.
91
Bär [5, S. 218 f.].
92
Nachweise in Neuhöfer [33, S. 18, dort Fn. 11]; Hartmann und Schmidt [16, S. 187 Rdz. 580].
93
Statuiert vom BVerfG in BVerfGE 65, S. 1 ff.
94
BVerfG-NJW 2006, S. 976, 978 f.; Hartmann und Schmidt [16, S. 185 Rdz. 578].
95
Hartmann und Schmidt [16, S. 185 Rdz. 578, S. 188 Rdz. 582]; Meyer-Goßner und Schmitt [30,
§ 100a Rdz. 15].
282
F. Czerner
StPO wurde durch das Gesetz zur Neuregelung der Telekommunikationsüberwachung erheblich umgestaltet, wobei u. a. der Straftatenkatalog neu geregelt und nun in Absatz 2
zusammengefasst ist.96 In diesem Zusammenhang führte der Gesetzgeber in Absatz 2 die
„schwere Straftat“ als eine neue straf(verfahrens)rechtliche Kategorie ein, bei welcher die
Höchststrafe, mit der eine „schwere Straftat“ gesühnt werden kann, mindestens fünf Jahre Freiheitsstrafe betragen muss.97 Um die Bestimmung des § 100a StPO nicht zu weit
auszulegen, genügt es nicht, dass eine Straftat, z. B. ein Raub gemäß § 249 StGB, hier
i. V. m. § 100a II Nr. 1k StPO, grundsätzlich, sondern auch in dem jeweiligen Einzelfall,
in welchem ermittelt wird, schwer wiegen muss (§ 100a I Nr. 2 StPO).98 Ein nicht zu einer Maßnahme nach § 100a StPO berechtigender Raub würde z. B. vorliegen, wenn beim
Entwenden einer Geldbörse der Arm nur kurz festgehalten wird, um sie aus der Hand
zu reißen. Allerdings kann die Tat dann schwer wiegen, wenn die Tatfolgen für das Opfer so gravierend sind, dass sie den Einsatz der Telekommunikationsüberwachung zur
Aufklärung dieser Tat rechtfertigen.99 Diese viktimodogmatische Handhabung des § 100a
StPO verdient Zustimmung, weil die berechtigten Opferinteressen nicht unter pauschaler Berufung auf den Schutz der Persönlichkeitssphäre des Tatverdächtigen hinter dessen
Interessen zurücktreten dürfen. Insgesamt ist für die Auslegung des § 100a I StPO jedoch von zentraler Bedeutung, dass alle in den drei dort genannten Nummern genannten
Voraussetzungen kumulativ vorliegen müssen, um eine restriktive Handhabung der Norm
durch die Strafverfolgungsbehörden sicherstellen zu können. Im Zuge der Reform dieses
Paragrafen wurden einige Delikte, die den erforderlichen Schweregrad nicht erreichen,
aus dem Katalog gestrichen, wobei insgesamt die Delikte, bei deren (mutmaßlicher) Begehung eine Überwachung der Telekommunikation zulässig ist, deutlich vermehrt wurden.
Bemerkenswert ist in diesem Zusammenhang, dass nicht alle Delikte mit einer Mindesthöchststrafe von fünf Jahren Freiheitsstrafe im Katalog des § 100a II StPO aufgelistet
sind. Beispielsweise fehlen die §§ 224 – 227, 221 III StGB.100 Die Begrenzung auf den
derzeit geltenden Katalog von § 100a II StPO ist auf das kriminalpolitische Interesse an
der Aufklärung [nur] bestimmter Delikte zurückzuführen: Die nicht genannten Delikte
stellen somit keine schweren Straftaten dar oder es fehlt das rechtstatsächliche Bedürfnis, diese Taten im Katalog des § 100a II StPO beizubehalten.101 Ungeachtet dessen sei
die deutliche Zunahme der Überwachungsanordnungen nach den Forschungsergebnissen
des Max-Planck-Instituts für internationales und ausländisches Strafrecht in Freiburg i.
Br.102 nicht auf eine erhöhte Kontrolldichte zurückzuführen, sondern beruhe einerseits auf
96
Hartmann und Schmidt [16, S. 186 Rdz. 579]. Ausführlich zu den einzelnen Änderungen: Paa [35,
S. 114 ff.] sowie mit einem diskussionswürdigen Vorschlag zur Neufassung von § 100a StPO auf [35,
S. 249 ff.].
97
Hartmann und Schmidt [16, S. 186 Rdz. 579].
98
Hartmann und Schmidt [16, S. 188 Rdz. 582].
99
Hartmann und Schmidt [16, S. 188 Rdz. 582].
100
Paa [35, S. 33].
101
BT-Drs. 16/5846, S. 40 f.; Paa [35, S. 33].
102
Albrecht et al. [1]; gut dargestellt auch in Paa [35, S. 117 ff.].
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 283
einem sprunghaftem Anstieg der Nutzung von Telekommunikationsmitteln und andererseits auf dem Versuch der Täter, Überwachungsmaßnahmen durch Nutzung zahlreicher
Anschlüsse und Geräte zu unterlaufen.103
Der Tatverdacht für die Telekommunikationsüberwachung gemäß § 100a StPO muss
weder dringend, noch hinreichend sein104 ; es genügt also der Anfangsverdacht, d. h. zureichende tatsächliche Anhaltspunkte i. S. d. § 152 II StPO. Nach Ansicht des Bundesgerichtshofes105 müssen bestimmte Tatsachen vorliegen, die den Verdacht einer Katalogtat
i. S. von § 100a II StPO begründen und zumindest ein gewisses Maß an Konkretisierung
erreicht haben, wobei kriminalistische Erfahrungen mit berücksichtigt werden dürfen.
Auch muss die Schwere des Eingriffs durch die Überwachung der Telekommunikation
in angemessenem Verhältnis zum intendierten Zweck stehen, wie es die Subsidiaritätsklausel des § 100a I Nr. 3 StPO als kumulative Ermittlungsvoraussetzung zwingend vorschreibt. Somit darf die Telekommunikationsüberwachung nur angeordnet werden, wenn
ansonsten, d. h. bei Einsatz eines milderen Mittel, also einer weniger eingriffsintensiven
Maßnahme, die Erforschung des Sachverhalts oder die Ermittlung des Aufenthaltsortes
des Beschuldigten aussichtslos oder zumindest erheblich erschwert wäre. Aussichtslos
ist die Maßnahme, wenn andere Aufklärungsmittel nicht vorhanden sind oder mit hoher Wahrscheinlichkeit keinen Erfolg versprechen.106 Eine wesentliche Erschwerung der
Sachverhaltsaufklärung liegt vor, wenn die Erfolgsaussichten anderer Maßnahmen als erheblich geringer einzustufen sind, z. B. wenn die anderen Ermittlungsmaßnahmen einen
erheblich höheren Zeitaufwand erfordern und das Verfahren hierdurch wesentlich verzögert würde, oder wenn ein deutlich erhöhter Personal- und/oder Materialaufwand gegeben
wäre, dass hierdurch die Sachverhaltsermittlung insgesamt beeinträchtigt wäre107 ; ein
zusätzlicher Kostenfaktor als solcher ohne weitere Folgen genügt hierfür nicht.108 Dass
hierbei entgegen der vorgenannten Auffassung des BGH zwangsläufig auf kriminalistisches Erfahrungswissen zurückgegriffen werden muss (und nicht nur darf), drängt sich
geradezu auf und kann auch bereits aus dem Amtsermittlungsgrundsatz nach §§ 160,
244 II StPO abgeleitet werden. Die Angemessenheit der Telekommunikationsüberwachung wird von der Rechtsprechung109 bejaht, wenn aufgrund bestimmter Tatsachen, wie
§ 100a I Nr. 1 StPO voraussetzt, im jeweiligen Einzelfall durch Einsatz dieses Mittels
konkrete (und nicht lediglich abstrakt-theoretische) Erfolgsaussichten bestehen. Eine weitere Einschränkung der Anwendbarkeit dieser Norm folgt aus § 100a IV StPO, wonach
die Telekommunikationsüberwachung unzulässig ist, wenn mit ihr allein Erkenntnisse
aus dem „Kernbereich privater Lebensgestaltung“ erlangt würden. Hierdurch soll das
im Strafverfahrensrecht wie im Verfassungsrecht hinsichtlich der Reichweite umstritte103
Hartmann und Schmidt [16, S. 186 Rdz. 579].
BGHSt 41, S. 30 (33); contra legem: dringender Tatverdacht: Kühne [23, S. 334 § 30 Rdz. 521.2].
105
BGHSt 41, S. 30 (34).
106
Vgl. Hartmann und Schmidt [16, S. 188 Rdz. 584].
107
Meyer-Goßner/Schmitt [30, § 100a Rdz. 13].
108
Hartmann und Schmidt [16, S. 188 Rdz. 584].
109
BVerfG-NJW 2007, S. 2752 f.
104
284
F. Czerner
ne Persönlichkeitsrecht des/der Betroffenen gegenüber staatlicher Ausforschung gewahrt
werden, wie dies grundlegend in der fundamentalen Volkszählungsentscheidung des Bundesverfassungsgerichts vom Dezember 1983110 mit dem grundrechtsgleichen Recht auf
informationelle Selbstbestimmung statuiert wurde. Werden durch diese Ermittlungsmaßnahme dennoch Erkenntnisse aus dem „Kernbereich privater Lebensgestaltung“ erlangt,
dürfen diese nach § 100a IV 3 StPO im Strafverfahren nicht verwertet werden (= Beweisverwertungsverbot)111 ,und entsprechende Aufzeichnungen hierüber sind zu löschen, und
dieses wiederum muss dokumentiert werden. Das anordnende Gericht hat gemäß § 100b II
Nr. 3 StPO Art, Umfang und Dauer der Telekommunikationsüberwachung schriftlich anzugeben. Die Telekommunikationsüberwachung darf sich nach § 100a III StPO einerseits
gegen den Beschuldigten, d. h. eine Person, gegen die ein strafrechtliches Ermittlungsverfahren durch Erstattung einer Strafanzeige oder eines Strafantrages gemäß § 158 StPO in
Gang gesetzt wurde, andererseits allerdings auch gegen Nichtverdächtige richten, wenn
aufgrund bestimmter Tatsachen (und nicht nur infolge vager Vermutungen) anzunehmen
ist, dass sie für den Beschuldigten Mitteilungen entgegennehmen oder weiterleiten oder
dass der Beschuldigte ihren Anschluss benutzt, selbst wenn dies dem betreffenden nichtverdächtigen Anschlussinhaber nicht bekannt ist. Für Nichtverdächtige gilt demnach systemkonform derselbe (Anfangs-)Tatverdacht wie für den Tatverdächtigen (= „zureichende
tatsächliche Anhaltspunkte“).
10.9.3 Anordnung und Durchführung der
Telekommunikationsüberwachung
Die Telekommunikationsüberwachung gemäß § 100a StPO kann gemäß § 100b StPO
grundsätzlich nur vom Gericht auf Antrag der Staatsanwaltschaft angeordnet werden, bei
Gefahr in Verzug auch vom Gericht, ohne die Staatsanwaltschaft zuvor zu fragen (§ 165
StPO), bzw. auch nur von der Staatsanwaltschaft, wobei die gerichtliche Entscheidung
schnellstmöglich (binnen drei Tagen, § 43 II StPO) nachzuholen ist. Eine Anordnung der
Telekommunikation durch Ermittlungspersonen der Staatsanwaltschaft (§ 152 GVG) ist
unzulässig. Vor der Anordnung werden weder der Betroffene (Beschuldigter wie Nichtverdächtigter), noch das auskunftspflichtige Telekommunikationsunternehmen gehört, um
den Zweck und den Überraschungseffekt dieser Maßnahme nicht zu gefährden (§ 33 IV 1
StPO); des Weiteren steht dem Telekommunikationsunternehmen keine Überprüfung der
Rechtmäßigkeit der Überwachungsmaßnahme zu.112 Die Personen, welche die Überwachung durchführen, werden in der Anordnung weder bezeichnet, noch bestimmt.113
110
BVerfGE 65, S. 1 ff. vom Dezember 1983.
Siehe BVerfG-NJW 2001, S. 3793 f.
112
Hartmann und Schmidt [16, S. 190 Rdz. 588].
113
Meyer-Goßner und Schmitt [30, § 100b Rdz. 5 a. E.].
111
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 285
§ 100b II Nr. 2 StPO gestattet eine Anordnung bezogen auf eine Gerätekennung
(IMEI114 ), wenn diese nur einmal vergeben ist; hierdurch soll eine lückenlose Überwachung ermöglicht werden, wenn Täter die SIM-Karten ihres Mobiltelefons laufend
umtauschen.115 Nach § 100b II Nr. 3 StPO sind hierbei Art, Umfang und Dauer der
Maßnahme unter Benennung des Endzeitpunktes zu benennen.
Zulässige Maßnahmen sind die Überwachung und Aufzeichnung der Telekommunikation. Adressat dieser Maßnahme sind in der Regel jedoch nicht zwingend Telekommunikationsdienstleister (vgl. § Nr. 24 TKG); vielmehr zählen hierzu auch Mobilfunkbetreiber,
Online-Dienste, Mailbox-Betreiber, Internet-Access-Provider etc.116 Die Maßnahme kann
auch der Überwachung von Firmen- und Behördenintranets dienen oder von der Polizei
ohne Unterstützung der Dienstleister durchgeführt werden, sofern das technisch möglich
ist.117 Die Höchstdauer für die einzelne Anordnung beträgt drei Monate und die Anordnung kann mehrfach um jeweils max. drei weitere Monate verlängert werden, wie § 100b
I S. 4 und 5 StPO regeln.
Die Durchführung der Telekommunikationsüberwachung obliegt nach § 36 II StPO
der Staatsanwaltschaft, welche den Telekommunikationsunternehmen eine Ausfertigung
bzw. beglaubigte Abschrift der Anordnung übergibt. In Eilfällen kann dies auch mündlich erfolgen, muss aber schnellstmöglich schriftlich nachgeholt werden. In technischer
Hinsicht geschieht die TKÜ i. d. R. über eine vom TK-Anbieter den Strafverfolgungsbehörden zur Verfügung zu stellende Standardschnittstelle (§ 110 VI TKG.118 ) Mit der
technischen Durchführung werden normalerweise die Polizeidienststellen beauftragt.119
Gemäß § 100b III StPO i. V. m. § 110 TKG i. V. m. der TKÜV müssen die Telekommunikationsdienstleister die technische Umsetzung dieser Maßnahme ermöglichen. Um
dies auch tatsächlich garantieren zu können, bezieht sich § 100b III 3 StPO auf § 95
II StPO, welcher wiederum auf die strafprozessualen Zwangsmittel Ordnungsgeld und
Ordnungshaft nach § 70 StPO120 verweist, allerdings verbietet das Prinzip der Selbstbelastungsfreiheit (Art. 14 III g IPBPR) die Anwendung dieser Zwangsmittel auf den
Beschuldigten, so das z. B. der Arbeitgeber des Beschuldigten zur Passwortoffenbarung
gezwungen werden kann.121 Gegen die Anordnung des Gerichts über die Durchführung
der Telekommunikationsüberwachung steht den Betroffenen, die in ihren Rechten beeinträchtigt worden sein können, die Beschwerde gemäß § 304 StPO zur Verfügung. Die
114
Michalke [31, S. 287, dort Fn. 3]: IMEI = International Mobile Station Equipment Identity, eine
15-stellige Seriennummer, anhand derer jedes GSM- oder UMTS-Endgerät (Mobilstation) eindeutig
identifiziert werden kann; siehe auch Korge [26, S. 88, dort Fn. 474].
115
Hartmann und Schmidt [16, S. 190 Rdz. 589].
116
Hartmann und Schmidt [16, S. 190 Rdz. 590].
117
Hartmann und Schmidt [16, S. 190 Rdz. 590].
118
Details hierzu in der TKÜV sowie in Anlage F der hierzu ergangenen Richtlinie des Bundesnetzagentur (TR TKÜV, Ausgabe 6.2), ausführlich zur TKÜV: Kohlmann [25, S. 33 ff.];
Zimmermann [46, S. 321 (323, dort Fn. 51)].
119
Hartmann und Schmidt [16, S. 191 Rdz. 591].
120
Zimmermann [46, S. 321 (323)].
121
Zimmermann [46, S. 321 f.].
286
F. Czerner
Staatsanwaltschaft kann sich demgegenüber bei Ablehnung des Antrags bzw. bei Ablehnung der Bestätigung nach § 100b I 3 StPO beschweren. Gegen die Art und Weise der
Durchführung der Maßnahme ist ein Antrag analog § 98 II 2 StPO möglich.122 Es besteht
hierbei allerdings keine Pflicht zur Inanspruchnahme des TK-Dienstleisters bei der Überwachung, sodass die Strafverfolgungsbehörden auch selbstständig tätig werden können,
z. B. bei der WLAN-Überwachung.123
10.10 Quellen-Telekommunikationsüberwachung
Von der soeben dargestellten Maßnahme der Telekommunikationsüberwachung zu unterscheiden ist die sogenannten Quellen–Telekommunikationsüberwachung (Quellen-TKÜ),
bei welcher von den Strafverfolgungsbehörden ein Programm auf den zu überwachenden Computer installiert wird, welches die Sprache bei der Internettelefonie (z. B. Skype) an der „Quelle“ abfängt, bevor sie für den Transport via Internet kodiert wird, weil
nach der Kodierung eine Entschlüsselung durch die Strafverfolgungsbehörden nicht mehr
sicher möglich ist.124 Es handelt sich also um eine Überwachung von Telefongesprächen, die nicht über das klassische Telefonnetz geführt werden, sondern über das Internet
durch Sprachübertragung mittels IP (Voice-over-IP-Kommunikation).125 Ähnlich wie bei
der Online-Durchsuchung (Abschn. 10.12) erfolgt der verdeckte Eingriff in vier Schritten126 :
1. Einspielen einer sogenannten Remote Forensic Software,127 (RFS – „Bundestrojaner“)
2. heimliche Übernahme der Administratorenrechte, d. h. Kontrolle über das Zielsystem,
3. Ausnutzen dieser Rechte zur Übermittlung der noch unverschlüsselten Daten aus dem
Zielsystem via Internet an staatliche Stellen, wo sie gespeichert und ausgewertet werden,
4. spurenfreie Deinstallation und Löschung der RFS.
Die Quellen-TKÜ soll bislang die einzig funktionierende, öffentlich bekannte Form
der Online-Durchsuchung darstellen.128 Von der Online-Durchsicht und der OnlineÜberwachung unterscheidet sich die Quellen-TKÜ dadurch, dass die abgegriffenen Daten
stets einem Kommunikationsvorgang zuzuordnen und im Begriffe sind, den Herrschaftsbereich des Nutzers zu verlassen.129 Ob die Quellen-TKÜ auf die Regelung des § 100a
122
Hartmann und Schmidt [16, S. 192 Rdz. 598].
Zimmermann [46, S. 321 (323)].
124
Vogel und Brodowski [42, S. 630 (632)]; Hartmann und Schmidt [16, S. 187 Rdz. 580].
125
Birkenstock [4, S. 219].
126
Vogel und Brodowski [42, S. 630 (633)] sowie Brodowski [6, S. 402 f.].
127
Dazu Birkenstock [4, S. 100 f., 198 f.]; Kohlmann [25, S. 28].
128
Vogel und Brodowski [42, S. 630 (633 m. w. N. dort in Fn. 10)].
129
Vogel und Brodowski [42, S. 630 (633)].
123
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 287
StPO gestützt werden kann, ist umstritten: Während eine beachtliche Kommentaransicht130 dies bejaht, verneinen Teile der Rechtsprechung131 und der Literatur132 dies und
fordern eine eigenständige gesetzliche Ermächtigungsgrundlage für derartige Eingriffe.
Das Gespräch wird also zweimal kodiert und via Internet sowohl zum Gesprächspartner
als auch zu einem Account der Strafverfolgungsbehörden geleitet; entsprechendes gilt für
die Sprachdaten, die vom Gesprächspartner eingehen.133 Sofern sich die Überwachung
ausschließlich auf die Daten eines laufenden Telekommunikationsvorganges beschränken, was durch technische Vorkehrungen und rechtliche Vorgaben gewährleistet sein
muss, ist diese Ermittlungsmaßnahme zulässig.134 Demgegenüber ist die Auswertung frei
zugänglicher Daten aus dem Internet nach der allgemeinen Ermittlungsgeneralklausel der
§§ 161, 163 StPO statthaft.135
10.11 Speicherung von Verkehrsdaten für eine spätere
Strafverfolgung
Die anlasslose Speicherung von Verkehrsdaten der Telekommunikation bei den Telekommunikationsdienstleistern für einen eventuellen späteren Abruf durch die Ermittlungsbehörden, wie dies durch die Bestimmung des § 100g StPO geregelt wurde, ist vom Bundesverfassungsgericht – nach hier vertretener Ansicht nicht nachvollziehbar – für verfassungswidrig und nichtig erklärt worden.136 Verkehrsdaten sind nach § 3 Nr. 30 TKG
i. V. m. § 96 I TKG Daten, die bei der Erbringung eines Telekommunikationsdienstes
erhoben, verarbeitet oder genutzt werden, um die Gerätekennung, die Teilnehmeridentifikationsnummer, die IP-Adresse137 sowie IMSI und IMEI eines Computers zu ermitteln.138
Weil Verkehrsdaten auf den Endgeräten nichts mehr mit der laufenden Telekommunikation zu tun haben, können sie grundsätzlich nach der allgemeinen Regelung des § 94 II
StPO beschlagnahmt werden.139
130
Meyer-Goßner und Schmitt [30, § 100a Rdz. 7a].
HansOLG StV 2009, S. 630 f.; BVerfGE 120, S. 274 (308 f.).
132
Vogel und Brodowski [42, S. 630 (634)].
133
Hartmann und Schmidt [16, S. 187 Rdz. 580].
134
Siehe Becker und Meinicke [2, S. 50]; Hartmann und Schmidt [16, S. 187 Rdz. 580].
135
Bär [5, S. 218 (221)]; Hartmann und Schmidt [16, S. 187 Rdz. 580].
136
BVerfG-NJW 2010, S. 833 ff., Urteil vom 02.03.2010.
137
Zu IP-Daten: Birkenstock [4, S. 113 ff., 274] – IP-Daten als Verkehrsdaten behandeln.
138
Korge [26, S. 88]; ausführlich zu den konkreten Daten: Paa [35, S. 141 ff.].
139
Korge [26, S. 96].
131
288
F. Czerner
10.12 Online-Durchsuchungen zugunsten effektiver
Strafverfolgung?
10.12.1 Online-Durchsuchung im geltenden Strafprozess
Derzeit existiert (noch) keine strafprozessrechtliche Grundlage für die Durchführung von
heimlichen „Online-Durchsuchungen“140, der Suche nach verfahrensrelevanten Inhalten
auf Datenträgern (Computern oder auch Mobiltelefonen sowie elektronischen Terminkalendern141 ), die sich nicht in direktem physikalischen Zugriff der Strafverfolgungsbehörden befinden, sondern nur über Kommunikationsnetze erreichbar sind142 , also dem heimlichen Ausspionieren von Computerdaten durch heimliches Installieren einer Entschlüsselungssoftware143 /Kopierprogramm (Trojanisches Pferd – kurz „Trojaner“144 , „BackdoorProgramm“145 ) über das Internet, beispielsweise durch Überwinden einer Zugangssperre.
Trojaner verfügen über eine sehr ausgedehnte Funktionsvielfalt, wobei z. B. Computersysteme durch Fernsteuerung manipuliert und sensible Daten wie Passwort, Kreditkartennummer, Zugangsdaten etc. ausgespäht werden können.146 Mit deren Hilfe können die
Ermittler via Internet auf den Rechner zugreifen und die auf dem System vorhandenen Daten auslesen oder sogar auch verändern147 und nicht zuletzt das Surfverhalten des Nutzers
auch über längere Zeit beobachten148 – allerdings funktioniert dies technisch nur, wenn
der Rechner online149 ist. Der unbestreitbare Vorteil der heimlichen Überwachung besteht
darin, dass der Betroffene sich unbeobachtet fühlt und einer etwaigen Verdunkelungsgefahr entgegengewirkt wird, indem vermieden werden kann, dass wichtige Hinweise gelöscht oder eventuelle Mittäter gewarnt werden oder (weiteres) Beweismaterial vernichtet
wird.150 Hierbei ist jedoch nicht auszuschließen, dass neben dem Nutzer und den Ermittlern auch weitere Dritte, z. B. durch Installation eines weiteren Trojanischen Pferdes,
ggf. sogar gleichzeitig Kontrolle über den Rechner ausüben und gezielt Manipulationen
140
Neben dem Fehlen einer ausdrücklichen Rechtsgrundlage für diese Maßnahme auf dem Gebiet
der Strafverfolgung siehe auch BGHSt 51, S. 211 f.; BGH-NJW 2007, S. 930 f.; detailliert: Birkenstock [4, S. 95 ff., 273]; Roxin und Schünemann [38, S. 282 (Rdz. 2)]; Hartmann und Schmidt [16,
S. 177 Rdz. 547, S. 187 Rdz. 580].
141
Paa [35, S. 239].
142
So lautet die parlamentarische Definition der Online-Durchsuchung in BT-Drs. 16/3231, S. 11
(Frage/Antwort Nr. 21); Vogel und Brodowski [42, S. 630 (632)]; Brodowski [6, S. 402 (411)];
Weiß [45, S. 6 ff.].
143
HansOLG StV 2009, S. 630; Kohlmann [25, S. 25].
144
Hierzu: Birkenstock [4, S. 99 ff.]; Kohlmann [25, S. 25]; Weiß [45, S. 18 f.].
145
Siehe Kohlmann [25, S. 23, 29]; Weiß [45, S. 20 f.].
146
Marberth-Kubicki [29, S. 212 f.].
147
Hansen und Pfitzmann [15, S. 225 (228)].
148
Paa [35, S. 239].
149
Warntjen [44, S. 581, dort m. w. N. in Fn. 7, S. 585]; Birkenstock [4, S. 15, 251]; Hofmann [18,
S. 121].
150
Birkenstock [4, S. 91 f.].
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 289
an den Datenbeständen vornehmen können.151 Zudem ist nicht auszuschließen, dass die
Zielperson, der Adressat, die Durchführung dieser Maßnahme entdeckt, weil die Menge
der übertragenen Daten auffallen kann.152 Auch kann er das Trojanische Pferd entfernen
und damit die Maßnahme vorzeitig beenden oder gezielt unverdächtiges Datenmaterial
versenden, um die Ermittler zu täuschen. Sogar eine Ausforschung des Rechners der Ermittler soll mittels des beim Beschuldigten eingeschleusten Trojaners möglich sein.153
Daher sollten diese Maßnahmen, ihre Zulässigkeit vorausgesetzt, so verdeckt wie möglich
und hinsichtlich der Datenübertragung allein aus kriminalistischen Gründen nur in geringem Umfang durchgeführt werden. In diesem Zusammenhang ist zu beachten, dass die
Online-Durchsuchung entweder einmalig erfolgen kann oder sich über einen bestimmten Zeitraum erstrecken kann.154 Schließlich muss berücksichtigt werden, dass die per
Online-Durchsuchung gewonnenen Daten nicht annähernd so verlässlich sind wie Daten,
die im Wege der Beschlagnahme von einem Rechner erlangt worden sind155 , sodass deren Beweiswert in Zweifel gezogen wird156 , denn sowohl die zugreifende Stelle als auch
Dritte, die eventuell das Zugriffsprogramm missbrauchen, können aufgrund der Infiltration des Zugriffsrechners Datenbestände „versehentlich“ bzw. durch gezielte Manipulation
löschen, verändern oder neu anlegen, was den Beschuldigten zu Unrecht belasten kann.157
Online-Durchsuchungen können auch zu Datenverlust beim Betroffenen oder zu sonstigen Schäden in dem durchsuchten System führen.158 Auch ist nicht auszuschließen, dass
der Betroffene dieses Programm [unwissentlich] an Dritte weiterleitet, deren Computersysteme ebenfalls geschädigt werden können.159
Das (nach wie vor bestehende) Verbot einer strafprozessualen Online-Durchsuchung ist
in verfassungsrechtlicher Perspektive im Wesentlichen auf das vom Bundesverfassungsgericht weiterentwickelte grundrechtsgleiche Recht auf Gewährleistung der Vertraulichkeit
und Integrität informationstechnischer Systeme160 zurückzuführen.
Die Ablehnung der für die Wohnungsdurchsuchung konzipierten §§ 102 ff. StPO161
durch die höchstrichterliche Rechtsprechung wird primär mit der Heimlichkeit der Maßnahme begründet, gegen welche sich der Betroffene, im Unterschied zur offen durchgeführten Durchsuchung und ggf. Beschlagnahme, mangels Kenntnis hiervon nicht zur Wehr
setzen könne. Die Argumentation des BGH162 hierzu vermag nur bedingt zu überzeugen:
151
Hansen und Pfitzmann [15, S. 225 (228)]; Rogge [36, S. 26 (30)].
Hansen und Pfitzmann [15, S. 225 (228)].
153
Hansen und Pfitzmann [15, S. 225 (228)].
154
Weiß [45, S. 21].
155
Hansen und Pfitzmann [15, S. 225 (228)].
156
Birkenstock [4, S. 280].
157
BVerfG-NJW 2008, S. 822 (830).
158
So BVerfGE 120, S. 274 (325 f.); Paa [35, S. 241]; Birkenstock [4, S. 100]; Kohlmann [25,
S. 26 f.].
159
BVerfG-NJW 2008, S. 822 (830).
160
BVerfGE 120, S. 274 ff.; Kutscha [27, S. 1042]; Roxin und Schünemann [38, S. 282 dort Fn. 2].
161
So aber noch der Generalbundesanwalt in BGH-NJW 2007, S. 930.
162
BGH-NJW 2007, S. 930 mit Hinweis auf BVerfGE 115, S. 166, 185 ff.
152
290
F. Czerner
Freilich vermag sich ein Betroffener mangels Kenntnis von einer gegen ihn gerichteten Maßnahme nicht zur Wehr zu setzen, doch dass dies bei offenen Durchsuchungsund Beschlagnahmemaßnahmen der Fall sein soll, wie der BGH behauptet, ist in den
meisten Fällen nicht zutreffend: Gegen die richterlich angeordnete Durchsuchung sowie
gegen die Beschlagnahme bestimmter Gegenstände i. S. d. §§ 94 ff. StPO kann zwar richterliche Entscheidung beantragt werden, einen Suspensiveffekt bzw. eine grundsätzliche
Aussetzung dieser Maßnahme, wollen sich die Ermittler bzw. Ermittlungsbehörden nicht
zum willfährigen Spielball des Beschuldigten machen, wird dies ebenso wenig auslösen
können wie eine Verhinderung der Durchsuchung bzw. der Herausgabepflicht. Immerhin
kann dieses Informationsdefizit durch eine nachträgliche Benachrichtigung kompensiert
werden, zumal die Informierung über verdeckte Ermittlungsmaßnahmen zu den wesentlichen Erfordernissen eines effektiven Grundrechtsschutzes gehört.163 Ein wesentliches
Argument wurde allerdings vom BGH und dem Schrifttum übersehen: Wenn die Anwendung von § 102 StPO unzulässig sein soll, hätte dies mit dem Wortlaut der Norm
begründet werden können, zumal sich diese Norm auf Wohnungen bezieht, nicht auf
Rechner bzw. auf (sich wo auch immer befindende) Speicherplätze bzw. Server, sodass
diese Regelung aufgrund des anderen Regelungsgehalts hätte für nicht einschlägig erklärt werden können. Andererseits lässt sich hiergegen wiederum einwenden, dass die
Online-Durchsuchung eines Rechners im Regelfall mangels Betretens der Wohnung einen
wesentlich geringeren Eingriff beinhaltet, auch und vor allem hinsichtlich der verfassungsrechtlich grundsätzlich garantierten Unverletzlichkeit der Wohnung gemäß Art 13
GG, sodass im Wege eines erst-recht-Schlusses eine Online-Durchsuchung als mildere
Maßnahme gegenüber der Wohnungsdurchsuchung nach § 102 StPO statthaft sein müsste. Jedoch wird der BGH diese zumindest diskussionswürdige Lösungsoption „übersehen“
haben, weil er im Ergebnis die Online-Durchsuchung nach wie vor als unzulässig beurteilen will. Demgegenüber verneint der BGH164 aus formalen Gründen zutreffend die
Anwendbarkeit von § 100a StPO in Bezug auf Online-Durchsuchungen, weil die Tatbestandsvoraussetzungen für eine Telekommunikation (vgl. § 3 Nr. 22 und Nr. 23 TKG),
nicht gegeben sind: Es werde nicht die Telekommunikation zwischen dem Tatverdächtigen
und einem Dritten überwacht, sondern zielgerichtet eine umfassende Übermittlung der auf
dem Zielcomputer vor Beginn des Kommunikationsvorgangs gespeicherten Daten an die
ermittelnde Stelle zum Zwecke der Suche nach Beweismitteln oder weiteren möglichen
Ermittlungsansätzen ausgelöst – der Datenfluss während des Online-Status werde lediglich aus technischen Gründen zum Zwecke der Übertragung der in den Speichermedien
abgelegten Dateien benutzt. Ebenso lehnt der BGH165 zwecks Rechtfertigung des Verbots
der Online-Durchsuchung den Rückgriff auf die Regelungen zur akustischen Wohnraumüberwachung166 (sogenannten Lauschangriff) gemäß § 100c StPO ab, wobei sich jene
163
Berechtigt BVerfG-NJW 2012, S. 833 (835 m. w. N.).
BGH-NJW 2007, S. 930 ff. = BGHSt 51, S. 211 ff. unter Bezugnahme auf Hofmann [18, S. 121
(123)].
165
BGH-NJW 2007, S. 930 (932).
166
BVerfGE 109, S. 279 ff.
164
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz
291
Norm auf das Abhören und die technische Aufzeichnung des (nichtöffentlich) gesprochenen Wortes in der Wohnung bezieht, wobei jedoch strukturelle Parallelen zwischen diesen
beiden Maßnahmen bestehen.167 Schließlich greife die Datennutzungsklausel des § 161
StPO bei verdeckten Ermittlungen nur in den Fällen ein, in denen keine spezielle Eingriffsermächtigung der Strafprozessordnung existiere und in welchen nur geringfügig die
Grundrechte des Betroffenen beeinträchtigt werden.168 Während die erste Voraussetzung,
eine fehlende spezialgesetzliche Regelung zugunsten der Online-Durchsuchung, gegeben
ist, kann vorliegend nicht von einem lediglich geringfügigen Eingriff in die Grundrechte
des von dieser Maßnahme Betroffenen ausgegangen werden, weil durch das Kopieren aller möglichen Dateien auch persönliche Geheimnisse betroffen seien, sodass § 161 StPO
ebenfalls nicht Abhilfe schaffen kann. § 161 StPO ist im Falle stärkerer Grundrechtseingriffe kein Ersatz für fehlende Einzeleingriffsermächtigungen.169
10.12.2 Notwendigkeit einer Legitimierung von Online-Durchsuchungen
im Strafverfahren
Sowohl für Täter als auch für Ermittler bietet der technologische Fortschritt neue Möglichkeiten. Deshalb bedienen sich Terroristen, Mitglieder krimineller Vereinigungen und
nicht zuletzt Wirtschaftsstraftäter zur Planung und Durchführung ihrer Taten dieser Techniken.170 Das Internet kann sowohl als Tatmittel als auch als Tatort dienen; auch kann
die reine Vorbereitung von Delikten via Internet erfolgen und es lassen sich weltweit
kriminelle Netzwerke aufbauen171 . Massenkommunikationsmittel wie das Internet oder
Mobilfunk führen nicht nur zu einer immer dichter werdenden Vernetzung der Menschen, sondern auch zu einer Verbesserung der Infrastruktur für Kriminelle.172 Wenn den
Strafverfolgungsbehörden – korrespondierend zu den technischen Weiterentwicklungen –
ein modernes Ermittlungsinstrumentarium zur Verfügung stehen soll, das die Durchsetzung des staatlichen Strafanspruchs unter den Rahmenbedingungen der technologisierten
Welt möglich macht und so die Funktionsfähigkeit der Strafrechtspflege gewährleistet,173
dann muss der Gesetzgeber im Falle von Gesetzeslücken entsprechende Rechtsgrundlagen schaffen, um eine effiziente Strafverfolgung garantieren zu können. Dies ist der
Staat infolge des Gewaltmonopols seinen Bürgern schuldig. Den Ermittlungsbehörden
sind dieselben Maßnahmen an die Hand zu geben, mit denen sie dieselbe Technik nutzen
167
So auch Warntjen [44, S. 581].
BGH-NJW 2007, S. 930 (932); Zimmermann [46, S. 321], beide m. Hinweis auf Meyer-Goßner
und Schmitt [30, § 161 Rdz. 1].
169
Kohlmann [25, S. 75].
170
Vgl. Neuhöfer [33, S. 16]; Kohlmann [25, S. 19]; Rogge [36, S. 29]; Vollmar [43, S. 132 (134)],
dort auch zur Erpressung durch Verschlüsselungs- oder Sperrtrojaner (Ransomware) sowie zur Erlangung von Kreditkarten (sogenannten Carding).
171
Birkenstock [4, S. 2]
172
Paa [35, S. 24 f.].
173
Paa [35, S. 20, 245].
168
292
F. Czerner
dürfen, die auch die Täter verwenden174 – freilich impliziert dies auch die Anordnung und
Durchführung heimlicher.175 Ermittlungsmaßnahmen, wenn sich die Strafverfolgungsorgane nicht gänzlich dem beweismittelvernichtenden Zuvorkommen durch gut informierte
Kriminelle aussetzen wollen. Andernfalls besteht die Gefahr einer Verschärfung der Bedrohungslagen, wenn der Staat versucht, diese Bedrohungsszenarien unter beschwichtigendem Hinweis auf die uneinschränkbare Freiheit seiner Bürger zu ignorieren176 . Zutreffend wird auf das Verbot des Unterschreitens des Mindestmaßes an Schutz zugunsten
der Bürger hingewiesen.177 Ein lediglich fragmentarischer Strafrechtsschutz darf kein
Freibrief für technisch versierte Straftäter sein, die gezielt diese Lücken für ihre Taten
aussuchen. Nicht zuletzt ist an das Gebot eines effektiven Opferschutzes zu erinnern, wobei vor allem in dem hier in Rede stehenden Deliktsbereich auch von Schwerstkriminalität
mit zahlreichen Todesopfern ausgegangen werden muss.178 Ebenso wenig ist auch nur annähernd einsichtig, wieso der Beschuldigte durch diese heimliche Ermittlungsmaßnahme
„eo ipso zum bloßen Objekt“ herabgewürdigt werden soll179 , zumal eine Beeinträchtigung
der Menschenwürde gemäß Art. 1 I GG bekanntlich etwas mehr voraussetzt als lediglich
eine effektive Strafverfolgungsmaßnahme. Hier sind zahlreiche noch offene Fragen zu
klären, denen sich der Gesetzgeber im Interesse einer effektiven Verbrechensbekämpfung
und der Rechtssicherheit zugunsten der Betroffenen staatlich angeordneter Eingriffe in
grundrechtssensible Bereiche baldmöglichst stellen sollte.
Eine Orientierung am Maßstab der Katalogtaten von § 100a II StPO, welcher vom
BVerfG180 als verfassungskonform beurteilt wurde, wäre hierfür sinnvoll, aber auch aus
ermittlungstaktischen Gründen notwendig, zumal die Strafverfolgungsbehörden nach zutreffender parlamentarischer181 Ansicht die geeigneten und erforderlichen Mittel zur Verfolgung schwerer und schwer ermittelbarer Kriminalität erhalten müssen. Gegen ein Zuviel an staatlicher Kontrolle schützen neben dem Richtervorbehalt,182 dem „Garanten für
eine neutrale, objektive Kontrolle“, die Kumulierung der drei Voraussetzungen in Abs. 1
dieser Norm, die einzeln benannten Straftaten in dem Katalog183 sowie ein Tatverdacht,
174
Kohlmann [25, S. 324 f.].
Strafverfahrensrechtler, welche die StPO lediglich als Schon- und Schutzraum für Straftäter,
nicht aber als ein Instrumentarium zur effektiven Strafverfolgung ansehen, sprechen in diesem Kontext gerne von „metastasierenden geheimdienstlichen Komponenten“, so z. B. Schünemann [40,
S. 314 (316)].
176
In dieser wünschenswerten Klarheit: Kohlmann [25, S. 18].
177
Absolut berechtigt: Kohlmann [25, S. 19].
178
Die Aufgabe des Rechtsgüterschutzes, vornehmlich des Opferschutzes, verkennt Schünemann [40, S. 314 (320, dort Fn. 35)], wenn er polemisierend und verächtlich vom „Allerweltsargument“ des Opferschutzes spricht.
179
So aber die zumindest eine latente Täterfreundlichkeit offenbarende Argumentation von Schünemann [40, S. 314 (323)].
180
BVerfG-NJW 2012, S. 833 (836 f.).
181
Bundestagsdrucksache 16/5846, S. 40.
182
Hierzu speziell BVerfG-NJW 2008, S. 822 (832 ff.).
183
Zur Fassung von Straftatenkatalogen: Kohlmann [25, S. 319 f.].
175
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 293
der sich auf „bestimmte Tatsachen“, also schon konkretisierte Verdachtsmomente gründen
muss, wodurch eine restriktive Handhabung der Durchsuchung und Beschlagnahme und
somit ein hinreichend vertretbarer Schutz des „Kernbereichs privater Lebensgestaltung“
sichergestellt werden kann. Flankiert wird dieser Schutz, wie durch das BVerfG gefordert
und vom Gesetzgeber genauestens umgesetzt, zudem durch das Beweiserhebungsverbot
sowie durch das Verwertungsverbot in § 100a IV 1, 2 StPO. Es verbleibt bei dem Appell
an den Gesetzgeber, eine spezielle Norm mit klar definierten Eingriffsvoraussetzungen
und begrenzungen zur grundsätzlichen Wahrung zugunsten der Online-Durchsuchung zu
schaffen. Dabei wird sich der Gesetzgeber angesichts der Intensität dieses Grundrechtseingriffs an die Vorgabe des BVerfG184 halten müssen, dass die heimliche Infiltration
eines informationstechnischen Systems, mittels dessen die Nutzung des Systems überwacht und seine Speichermedien ausgelesen werden können, nur dann verfassungsgemäß
ist, wenn tatsächliche Anhaltspunkte einer konkreten Gefahr für ein überragend wichtiges
Rechtsgut (Leib, Leben, Freiheit der Person, Güter der Allgemeinheit, deren Bedrohung,
die Grundlagen oder den Bestand des Staates) berührt. Gerade in einem Rechtsstaat ist
die Heimlichkeit staatlicher Ermittlungen die Ausnahme und bedarf besonderer Rechtfertigung.185 Jedoch können, je nach Zwecksetzung durch die beteiligten Behörden, die
Eingriffsvoraussetzungen im Bereich der strategischen Telekommunikationsüberwachung
anders bestimmt werden als im Polizei- und im Strafprozessrecht, wobei nicht immer
für jeden Fall tatsächliche Anhaltspunkte für bestimmte bevorstehende Straftaten gefordert werden müssen186 , also im (gut zu begründenden) Ausnahmefall sogar unterhalb
der Schwelle des sogenannten Anfangsverdachts Überwachungsmaßnahmen zulässig sein
können. Das BVerfG187 fordert zutreffend, der jeweilige Eingriff müsse in einem angemessenen Verhältnis zur der Schwere der Straftat und der Stärke des Tatverdachts stehen.
Zudem stellte das BVerfG fest, dass der Einsatz der Online-Durchsuchung auch zur Strafverfolgung gerechtfertigt sein kann.188
10.13 Online-Durchsuchung zur terroristischen Gefahrenabwehr:
Ermittlungsbefugnisse nach dem BKAG und dem ATDG
Eine präventiv-gefahrenabwehrrechtliche Online-Durchsuchung ist nach Ansicht des
Bundesverfassungsgerichts189 nur dann verfassungsgemäß, wenn tatsächliche Anhaltspunkte (vgl. § 152 II StPO = Anfangsverdacht) dafür bestehen, dass ein überragend
184
BVerfG-NJW 2008, S. 822.
BVerfG-NJW 2008, S. 822 (830).
186
BVerfG-NJW 2008, S. 822 (832).
187
BVerfG-NJW 2005, S. 1917 (1922).
188
BVerfGE 120, S. 274 (315). Vor diesem Hintergrund ist unverständlich, warum beispielsweise
Paa [35, S. 242, 245] sich im Ergebnis für einen Verzicht auf die Online-Durchsuchung ausspricht
und dies zudem als „rechtsstaatlichen Gewinn“ bezeichnet. Es würde sich dabei eher um einen
Gewinn zugunsten besserer Tatgelegenheitsstrukturen für Straftäter handeln.
189
BVerfGE 120, S. 274 ff., 315.
185
294
F. Czerner
wichtiges Rechtsgut (Leben, Leib, Freiheit der Person und Güter der Allgemeinheit, die
Grundlagen oder der Bestand des Staates oder die Grundlagen der Existenz der Menschen) bedroht ist. In präventiver Perspektive wurde für den Bereich der Gefahrenabwehr
zur Terrorismusbekämpfung im Jahr 2008 eine (spätestens zum 30.06.2018 wegen Verfassungswidrigkeit außer Kraft tretende) Rechtsgrundlage zur Online-Durchsuchung in
§ 20k BKAG190 geschaffen. Die an sich nach § 20v V Nr. 3 BKAG mögliche Übermittlung der dabei (präventiv) erlangten Daten zur (repressiven) Beweisverwertung in einem
Strafverfahren soll, solange die Strafprozessordnung keinerlei Regularien zur OnlineDurchsuchung aufweist, an der Vorschrift des § 161 II StPO scheitern.191 Jedoch dürfen
gemäß § 161 II StPO nach anderen Gesetzen erlangte personenbezogene Daten ohne
Einwilligung des Betroffenen zu Beweiszwecken im Strafverfahren nur zur Aufklärung
solcher Straftaten verwendet werden, zu deren Aufklärung eine solche Maßnahme nach
diesem Gesetz (hier BKAG) hätte angeordnet werden dürfen. Diese Limitierung schränkt
bestimmte Strafverfolgungsmaßnahmen erheblich ein, weil beispielsweise die Gestattung
derartiger Maßnahmen bei Implementierung eines abschließenden, d. h. keine erweiternde
Auslegung gestattenden Straftatenkataloges, z. B. nach dem Vorbild von § 100a II StPO
oder § 100c StPO, zu diskutieren ist, um ein spezifisches Feld computergestützter Kriminalität auch auf repressiver Ebene besser bekämpfen zu können, zumal es sich gerade
hierbei um schwerwiegende Delikte handelt, welche mit hoher krimineller Energie und
oftmals massiven und bleibenden Schäden beim Tatopfer einhergehen. Ein Argument
für die hier favorisierte Ausdehnung von Ermittlungsbefugnissen in § 161 II StPO findet
sich in der Ansicht, dass zwar eine Entsprechung in der Art der Maßnahme, nicht jedoch bei den jeweiligen Eingriffsvoraussetzungen gegeben sein müsse.192 Begründet wird
diese Restriktion auf ein bestimmtes Gesetz mit dem datenschutzrechtlichen Zweckbindungsgrundsatz und dem Bedenken, dass zu schwerwiegende Eingriffe in das Recht auf
informationelle Selbstbestimmung erfolgen könnten. Zweifelsohne können schwerwiegende Beeinträchtigungen in grundrechtlich geschützte Positionen erfolgen, allerdings
steht jeder Eingriff unter dem Verdikt eines oder mehrerer verfassungsrechtlich ebenso
geschützter bzw. schützenswerter Rechtfertigungsgründe, welche nicht unter pauschaler Berufung auf einen vorrangigen Täterschutz unterlaufen werden dürfen. Etwaige
Beeinträchtigungen im Nachhinein nachweislich Unschuldiger bzw. Dritter, d. h. nichtverdächtiger Personen, können durch Löschungspflichten, wie sie z. B. in § 100a IV 3,
4 StPO für die Telekommunikation verankert sind, kompensiert werden. Immerhin sei
190
Eine vorzügliche Diskussion der Verfassungskonformität von § 20k BKAG haben Schwarz/Colussi [41, S. 199 ff.] vorgelegt. Siehe aktuell die (nach hier vertretener Ansicht unter dem Aspekt
eines effektiven Gefahrenabwehrrechts bedenkliche) Entscheidung des Bundesverfassungsgerichts
vom 20.04.2016 zur Unvereinbarkeit von § 20k BKAG sowie zahlreicher weiterer Reglungen der
§§ 20 g, h, v BKAG mit dem Grundgesetz und die Höchstbegrenzung der Geltungsdauer dieser Normen bis zum 30.06.2018: https://www.bundesverfassungsgericht.de/SharedDocs/Entscheidungen/
DE/2016/04/rs20160420_1bvr096609.html
191
Roxin und Schünemann [38, S. 282 dort Fn. 1].
192
Griesbaum [14, § 161 Rdz. 35] mit Hinweis auf Bundestagsdrucksache 16/5846, S. 40.
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 295
allerdings nach dem Ermittlungs- bzw. Spurenansatz eine mittelbare Auswertung dieser
präventiv erlangten Daten in einem Strafverfahren zulässig, ebenso zur Ermittlung des
Aufenthaltsortes des Beschuldigten, wenn die Daten also nicht zu Beweiszwecken genutzt
werden.193 Daher dürfen Daten, die nach § 20k BKAG (Online-Durchsuchung) und nach
§ 20h BKAG (akustische und visuelle Wohnraumüberwachung) erhoben worden sind,
gemäß § 20v V Nr. 3 BKAG als Ermittlungsansatz für die Strafverfolgung genutzt werden.194 Das BVerfG195 vertritt die insoweit zutreffende Ansicht, dass Zufallserkenntnisse
aus einer rechtmäßig durchgeführten Maßnahme, welche zwar nicht Katalogtaten betreffen, aus den o. g. Gründen nicht zu Beweiszwecken verwertet werden dürfen, immerhin
als Grundlage zu weiteren Ermittlungen zur Gewinnung neuer Beweismittel dienen können. Nicht nachvollziehbar ist allerdings, warum jene Zufallserkenntnisse nicht auch
zu Beweiszwecken genutzt werden dürfen, zumal der Betroffene ohnehin ins Visier der
Strafverfolgung geraten und eine zulässige Ermittlungshandlung erfolgt ist, in deren Zusammenhang weitere, zuvor nicht bekannte mögliche Beweismittel aufgetaucht sind. Ein
ausdrückliches Verbot der Nutzung von Zufallsfunden besteht lediglich auf der Ebene des
§ 108 II StPO („lex Theissen“), also muss im Wege des Umkehrschlusses mangels eines
expliziten Verbots und vor dem Hintergrund des Legalitätsprinzips gemäß § 152 II, 160
I, 163 StPO196 ein solcher Zufallsfund auch als Beweismittel genutzt werden dürfen. Die
Voraussetzungen zur Datenerhebung und -auswertung zum Zweck der Aufklärung und
Bekämpfung des internationalen Terrorismus mit Bezug zur Bundesrepublik Deutschland
finden sich im Gesetz zur Errichtung einer standardisierten zentralen Antiterrordatei von
Polizeibehörden und Nachrichtendiensten von Bund und Ländern – Antiterrordateigesetz
(ATDG).197 Die betreffenden Tätergruppen werden in § 2 ATDG normiert; § 3 ATDG. § 5
ATDG enthält Bestimmungen darüber, wann die beteiligten Behörden die in der Antiterrordatei gespeicherten Daten nutzen dürfen. Aufgrund ihrer inhaltlichen Bestimmtheit,
ihres sehr eng umrissenen Anwendungsbereiches unter Beachtung des Subsidiaritätsgrundsatzes und der Dokumentationspflicht ist § 5 ATDG verfassungskonform.
10.14 Die rechnerexterne Datenspeicherung im World Wide Web:
Cloud Computing
Beim sogenannten Cloud Computing, dem Datenspeichern nicht auf der (eigenen) Festplatte, sondern im Internet, stellt sich die Rechtslage demgegenüber anders dar. Hierbei
werden (mit Ausnahme von E-Mails) die Daten nicht mehr lokal auf dem eigenen Rech193
Meyer-Goßner und Schmitt [30, § 161 Rdz. 18e]; Griesbaum [14, § 161 Rdz. 36]; Roxin und
Schünemann [38, S. 282 dort Fn. 1]; zum Spuren- bzw. Ermittlungsansatz s. Paa [35, S. 166, dort
auch Fn. 773 mit w. N.]; Birkenstock [4, S. 153].
194
Griesbaum [14, § 161 Rdz. 36].
195
BVerfG-NJW 2005, S. 2766.
196
Dieses Argument wird von Korge [26, S. 136] zwar zutreffend eingebracht, im Ergebnis jedoch
verworfen.
197
Bundesgesetzblatt I 2006, S. 3409; Bundesgesetzblatt I 2014, S. 2318.
296
F. Czerner
ner oder auf externen Festplatten bzw. USB-Sticks gespeichert, welche sich in der eigenen
Wohnung befinden, sondern es laufen alle Anwendungen im Web ab, d. h., alle Programme und vor allem die Daten lagern auf den Anbieterservern und werden nach Bedarf
geladen.198 Damit ist es möglich, straftatrelevante Daten an verschiedenen Orten/Servern zu platzieren und den Strafverfolgungsbehörden den Zugriff zu erschweren.199 Auf
dieses Problem der dezentralisierten bzw. dezentralisierbaren Daten hat der Gesetzgeber
zum Jahresbeginn 2008 mit der Einfügung von § 110 III StPO reagiert, womit der Zugriff auf externe Speichermedien, z. B. auf andere Server, die physisch vom Rechner des
Betroffenen entfernt sind, unter bestimmten Voraussetzungen erlaubt ist. Durch die Regelung des § 110 III StPO ist es zulässig, die Durchsicht elektronischer Datenträger auch
auf räumlich getrennte Speichereinheiten (z. B. Speicherplatz auf Servern im Internet) zu
erstrecken, soweit auf jene vom unmittelbar betroffenen Speichermedium aus eine berechtigte Zugriffsmöglichkeit besteht, weil andernfalls der Verlust der gesuchten Daten zu
befürchten ist und der Zugriff von dem durchsuchten Zugangsgerät (i. d. R. der PC des Beschuldigten) möglich ist.200 Der Zugriff muss gemäß § 110 III StPO berechtigt sein, weil
mit dieser Norm ausdrücklich nicht die heimliche Online-Durchsuchung erlaubt werden
sollte.201 Diese Zugriffsmöglichkeit erhält mit der Ausbreitung des Cloud Computing eine
zunehmende Bedeutung.202 Solange die Durchsicht andauert, ist die Durchsuchung noch
nicht abgeschlossen, und es kann dagegen analog § 98 II StPO das Gericht angerufen werden.203 Jedoch muss zunächst bekannt sein, dass überhaupt Daten in einer Cloud, d. h.
rechnerextern, gespeichert sind, wo sie sich befinden und ob sie möglicherweise auf Servern außerhalb des Hoheitsgebietes der Bundesrepublik Deutschland gespeichert sind204 ,
womit weitere praktische wie rechtliche Probleme aufgeworfen werden (Abschn. 10.15).
Weil beim Cloud Computing weder die Anwendungsdaten noch die Anwendungsprogramme auf dem lokalen Rechner gespeichert werden, können die Ermittlungspersonen
nicht damit rechnen, auf dem betreffenden Rechner beweiserhebliche Informationen zu
entdecken bzw. Informationen aufzufinden, die auf das Vorhandensein verfahrenserheblicher Daten/Dateien in einer Cloud hinweisen.205 Kann bei der Durchsicht des lokalen
Rechners des Betroffenen auf das Netzwerk – und somit auf die Daten – zugegriffen werden, ist die Datenspeicherung grundsätzlich vom Durchsuchungsbeschluss gedeckt und
nach § 110 III 2 StPO eröffnet.206 Mit der Regelung des § 110 III StPO, mit welcher ein
punktueller Zugriff in Form einer Durchsicht, jedoch keine längerfristige Überwachung
198
Obenhaus [34, S. 651].
Obenhaus [34, S. 651].
200
Roxin und Schünemann [38, S. 285 Rdz. 14]; Hartmann und Schmidt [16, S. 174 f. Rdz. 531].
201
Bundestagsdrucksache 16/5846, S. 64.
202
Roxin und Schünemann [38, S. 285 Rdz. 14]; Obenhaus [34, S. 651 ff.].
203
BVerfG-NStZ-RR 2002, S. 144, dem folgend: Roxin und Schünemann [38, S. 285 Rdz. 14].
204
Obenhaus [34, S. 651 f.].
205
Obenhaus [34, S. 651 f.].
206
Siehe Meyer-Goßner und Schmitt [30, § 110 Rdz. 6, 7b]; Obenhaus [34, S. 651 f.].
199
10
Digitale Forensik zwischen (Online-)Durchsuchung, Beschlagnahme und Datenschutz 297
auch neu erstellter bzw. gespeicherter Daten erlaubt sei207 , sollte Art. 19 der sogenannten
Cyber-Crime-Convention, das Übereinkommen des Europarates über Computerkriminalität vom 23.11.2001, in innerstaatliches Recht umgesetzt werden.208 Bei elektronischen
Speichermedien ist zu beachten, dass der Datenträger mit dem jeweiligen Zugangsgerät
keine räumlich-gegenständliche Einheit bilden muss und dass u. U. eine Beschlagnahme des Zugangsgerätes in diesen Fällen zwecklos ist: Beim Cloud Computing kann der
Dateninhaber jene über eine Internetverbindung auf Datenspeicher auslagern, die er bei
einem Dienstleistungsunternehmen angemietet oder z. B. kostenlos zur Verfügung gestellt
bekommen hat, z. B. durch eine Dropbox.209 Wo sich der betreffende Datenspeicher physikalisch befindet, entzieht sich zumeist der Kenntnis des Dateninhabers.210 Wenn räumlich
entfernte Datenbestände zeitlich verzögert durchgesehen werden müssten, bestünde die
Gefahr, dass zwischenzeitlich bestimmte beweiserhebliche, also vermutlich belastendes
Datenmaterial, schnell gelöscht werden. Zahlreiche Nutzer von Computern können sich
die Zugangsdaten von Webdiensten nicht merken und setzen Lesezeichen im Webbrowser
und nutzen auf dem Rechner installierte Programme, die Kennwörter und Zugangsdaten speichern, sodass dem Ermittler entweder der Zugang zur aufgerufenen Webseite
versperrt ist oder der Zugang zum Kennwort-Verwaltungsprogramm.211 Da sich der Beschuldigte nicht selbst zu belasten braucht (Art. 14 III g IPBPR), braucht er an seiner
Überführung nicht mitzuwirken, und er ist somit nicht herausgabepflichtig.212 Das Dekodieren/„Knacken“ des Zugangscodes entspricht dem gewaltsamen Öffnen einer Tür oder
eines Tresors und ist über § 105 StPO zulässig.213
10.15 Daten auf Servern außerhalb des Hoheitsgebietes
der Bundesrepublik Deutschland
Bereits im Jahr 2004 war in ca. 80 % der Fälle, in denen das Internet als Medium bei
der Begehung oder Durchführung von Straftaten genutzt wurde, ein Zugriff auf im Ausland gespeicherte Daten erforderlich.214 Für die Sichtung von Daten auf Servern im Ausland fehlt es an einem direkten Recht zum Zugriff; ohne Zustimmung des Beschuldigten
können die Daten nur im Wege eines internationalen Rechtshilfeersuchens an den betreffenden Staat gerichtet werden, in welchem sich der/die jeweiligen Server befinden.215
Den inländischen Ermittlungsbehörden stehen im Ausland grundsätzlich keine Hoheits207
So restriktiv Brodowski [6, S. 402 (408)].
Hartmann und Schmidt [16, S. 173 Rdz. 531]; BGBl 2008 II, S. 1242.
209
Hartmann und Schmidt [16, S. 174 Rdz. 531].
210
Hartmann und Schmidt [16, S. 174 Rdz. 531].
211
Obenhaus [34, S. 651 f.].
212
Obenhaus [34, S. 651 (653)].
213
Vgl. Meyer-Goßner und Schmitt [30, § 105 Rdz. 13].
214
Gercke [12, S. 271 dort m. w. N. in Fn. 9].
215
Kasiske [21, S. 228 (234)]; Hartmann und Schmidt [16, S. 173 Rdz. 531 m. w. N. dort in Fn. 907];
ausführlich zum Zugriff auf im Ausland gespeicherte Daten: Weiß [45, S. 244-257].
208
298
F. Czerner
befugnisse zu.216 Dies soll selbst dann gelten, wenn den Behörden die Kennungsdaten des
Accountinhabers bekannt sind, sodass ein Zugriff über die Regelung des § 110 III StPO
möglich wäre, allerdings wäre ein direkter Zugriff deutscher Behörden auf Daten eines
ausländischen Herrschaftsbereichs ein völkerrechtlicher Eingriff in fremde Hoheitsrechte217 , sodass § 110 III StPO infolge seiner intranationalen Geltung hierfür nicht anwendbar
ist.218 Im Völkerrecht gilt der Grundsatz, dass die territoriale Souveränität in Bezug auf
das Staatsgebiet mit der Souveränität der rechtsprechenden Gewalt dieses Staates einhergeht219 . Innerhalb der Europäischen Union ist eine Beweissicherung durch die Europäische Sicherstellungsanordnung (vgl. § 94 IRG) erleichtert; im Geltungsbereich des Übereinkommens über Computerkriminalität stehen dessen vorläufige Sicherungsmaßnahmen
zur Verfügung.220 Zu beachten sind auch die Vorgaben der Cybercrimekonvention des
Europarates221 , durch welche in Art. 19 die Verpflichtung statuiert ist, dass jede Vertragspartei den Behörden ermöglichen muss, Zugriff auf Computersysteme bzw. Datenträger
nehmen zu können. Nicht zuletzt stellt sich die Frage, welche rechtlichen Schritte gegen aus dem Ausland begangene Rechtsverletzungen im Internet vor deutschen Gerichten
möglich sind.222
Literatur
1. Albrecht, H.J., Dorsch, C., Krüpe, C.: Rechtswirklichkeit und Effizienz der Überwachung der
Telekommunikation nach den §§ 100a, 100b, StPO und anderer verdeckter Ermittlungsmaßnahmen (2003). https://www.mpicc.de/files/pdf1/fa-tue.pdf. Zugegriffen: 17.01.2017
2. Becker, C., Meinicke, D.: Die sog. Quellen-TKÜ und die StPO - Von einer „herrschenden Meinung“ und ihrer fragwürdigen Entstehung. Strafverteidiger (StV) S. 50–52 (2011)
3. Berthel, R., Mentzel, T., Schröder, D., Spang, T., Clages, H., Neidhardt, K.: Grundlagen der
Kriminalistik/Kriminologie, Lehr- und Studienbriefe Kriminalistik/Kriminologie, Bd. 1, 3. Aufl.
Verlag Deutsche Polizeiliteratur (2008)
4. Birkenstock, L.D.: Zur Online-Durchsuchung: Zugang zu einem informationstechnischen System und Infiltration zur Datenerhebung im Strafverfahren: Unter besonderer Berücksichtigung
des Urteils des Bundesverfassungsgerichts vom 27.02. 2008, 1. Aufl. Verlag Dr. Kovac (2013)
5. Bär, W.: EDV-Beweissicherung im Strafverfahren bei Computern. Deutsche Richterzeitung
(DRiZ) S. 218–221 (2007)
6. Brodowski, D.: Strafprozessualer Zugriff auf E-Mail-Kommunikation. Juristische Rundschau
(JR) (10), 402–412 (2009)
7. on Cybercrime, C.C.: Übereinkommen über Computerkriminalität (2001). http://conventions.
coe.int/Treaty/GER/Treaties/Html/185.htm
216
Obenhaus [34, S. 651 (654)].
Kasiske [21, S. 228 (234)].
218
Gercke [12, S. 271 f.].
219
Vgl. Epping in: Ipsen [19, § 5 II, S. 50 Rdz. 3].
220
Brodowski [6, S. 402 (411, dort m. w. N. in Fn. 115)].
221
Übereinkommen über Computerkriminalität [7].
222
Moos [32, S. 208].
217
Literatur
299
8. Czerner, F.: Legitimierung von Behandlungsabbrüchen durch § 1904 BGB? Kritische Vierteljahressschrift für Gesetzgebung und Rechtswissenschaft (KritV) S. 182–196 (2004)
9. Czerner, F.: Strafprozessuale Verdachtsgraduierung, Verhältnismäßigkeitsrestriktionen und
Veto-Optionen bei rechtsmedizinisch indizierten Sektionen. Archiv für Kriminologie S. 1–23
(2010)
10. Di Fabio, U.: Sicherheit in Freiheit. Neue Juristische Wochenschrift (NJW) S. 421–425 (2008)
11. Gercke, B.: Anm. zu BGH-StV 2009, 623, Beschl. v. 31.03.2009. Strafverteidiger (StV) S. 623
(624) (2009)
12. Gercke, B.: Zur Zulässigkeit sog. Transborder Searches: Der strafprozessuale Zugriff auf im
Ausland gespeicherte Daten. Strafverteidiger-Forum (StraFo) S. 271–274 (2009)
13. Gercke, B., Julius, K.P., Temming, D., Zöller, M.A., Ahlbrecht, H., Brauer, J., Kurth, H.J.,
Pollähne, H., Posthoff, K.H., Rautenberg, E.C., Schmidt, E.C., Weißer, B.: Heidelberger Kommentar zur Strafprozessordnung, 5. Aufl. C.F. Müller (2012)
14. Hannich, R., Appl, E., Barthe, C., Bruns, M., Diemer, H., Fischer, T., Gericke, J., Gieg, G.,
Gmel, D., Graf, J.P., Greger, A., Greven, M., Griesbaum, R., Jakobs, S., Krehl, C., Kuckein,
J.D., Laufhütte, H., Maul, H., Maur, L., Mayer, H., Moldenhauer, G., Ott, Y., Paul, C., Schädler,
W., Scheuten, F.K., Schmidt, W., Schneider, H., Schultheis, U., Senge, L., Spillecke, K., Wenske, M., Willnow, G., Zabeck, A.: Karlsruher Kommentar zur Strafprozessordnung: mit GVG,
EGGVG, EMRK, 7. Aufl. C.H.Beck (2013)
15. Hansen, M., Pfitzmann, A., Roßnagel, A.: Online-Durchsuchung. Deutsche Richterzeitung
(DRiZ) (8), 225–228 (2007)
16. Hartmann, A., Schmidt, R.: Strafprozessrecht: Grundzüge des Strafverfahrens, 6. Aufl. Grasberg
bei Bremen (2016)
17. Hermann, K., Soiné, M.: Durchsuchung persönlicher Datenspeicher und Grundrechtsschutz.
Neue Juristische Wochenschrift (NJW) S. 2922–2928 (2011)
18. Hofmann, M.: Die Online-Durchsuchung - staatliches „Hacken“ oder zulässige Ermittlungsmaßnahme? Neue Zeitschrift für Strafrecht (NStZ) S. 121–125 (2005)
19. Ipsen, K.: Völkerrecht, 6. Aufl. C.H. Beck (2014)
20. Jahn, M.: Strafprozessuale Eingriffsmaßnahmen im Lichte der aktuellen Rechtsprechung des
BVerfG. Neue Zeitschrift für Strafrecht (NStZ) S. 255–265 (2007)
21. Kasiske, P.: Neues zur Beschlagnahme von E-Mails beim Provider. Strafverteidiger-Forum
(StraFo) S. 228–235 (2010)
22. Kemper, M.: Die Beschlagnahmefähigkeit von Daten und E-Mails. Neue Zeitschrift für Strafrecht (NStZ) S. 538–544 (2005)
23. Kühne, H.H.: Strafprozessrecht: Eine systematische Darstellung des deutschen und europäischen Strafverfahrensechts, 9. Aufl. C.F. Müller (2015)
24. Klein, O.: Offen und (deshalb) einfach: Zur Sicherstellung und Beschlagnahme von E-Mails
beim Provider. Neue Juristische Wochenschrift (NJW) S. 2996–2999 (2009)
25. Kohlmann, D.: Online-Durchsuchungen und andere Maßnahmen mit Technikeinsatz, 1. Aufl.
Nomos Verlag (2012)
26. Korge, T.: Die Beschlagnahme elektronisch gespeicherter Daten bei privaten Trägern von
Berufsgeheimnissen. Schriftenreihe der Juristischen Fakultät der Europa-Universität Viadrina
Frankfurt (Oder). Springer Verlag (2009)
300
F. Czerner
27. Kutscha, M.: Mehr Schutz von Computerdaten durch ein neues Grundrecht? Neue Juristische
Wochenschrift (NJW) S. 1042–1044 (2008)
28. Kutzner, L.: Die Beschlagnahme von Daten bei Berufsgeheimnisträgern. Neue Juristische Wochenschrift (NJW) S. 2652–2654 (2005)
29. Marberth-Kubicki, A.: Internet und Strafrecht. Deutsche Richterzeitung (DRiZ) S. 212–217
(2007)
30. Meyer-Goßner, L., Schmitt, B.: Strafprozessordnung: StPO, 59. Aufl. C.H. Beck (2016)
31. Michalke, R.: Staatlicher Zugriff auf elektronische Medien. Strafverteidiger-Forum (StraFo) S.
287–292 (2008)
32. Moos, F.: Möglichkeiten und Grenzen der Sanktionierung von Rechtsverletzungen im Internet
vor deutschen Gerichten. Deutsche Richterzeitung (DRiZ) S. 208–211 (2007)
33. Neuhöfer, D.: Der Zugriff auf serverbasiert gespeicherte E-Mails beim Provider: Verfassungsrechtliche Anforderungen an eine strafverfahrensrechtliche Ermächtigungsgrundlage, 1. Aufl.
Verlag Dr. Kovac (2011)
34. Obenhaus, N.: Cloud Computing als neue Herausforderung für Strafverfolgungsbehörden und
Rechtsanwaltschaft. Neue Juristische Wochenschrift (NJW) S. 651–655 (2010)
35. Paa, B.: Der Zugriff der Strafverfolgungsbehörden auf das Private im Kampf gegen schwere
Kriminalität. C.F. Müller (2013)
36. Rogge, M.: Moderne mobile Forensik für Strafverfolgungsbehörden. der kriminalist Bd. 6 S.
29–34 (2015)
37. Roßnagel, A.: Verfassungspolitische und verfassungsrechtliche Fragen der OnlineDurchsuchung. Deutsche Richterzeitung (DRiZ) S. 229–230 (2007)
38. Roxin, C., Schünemann, B.: Strafverfahrensrecht, 28. Aufl. C.H. Beck (2014)
39. Rux, J.: Ausforschung privater Rechner durch die Polizei- und Sicherheitsbehörden S. 285–295
(2007)
40. Schünemann, B.: Prolegomena zu einer jeden künftigen Verteidigung, die in einem geheimdienstähnlichen Strafverfahren wird auftreten können. Goltdammer’s Archiv (GA) S. 314–334
(2008)
41. Schwarz, R., Colussi, M.: Polizeiliche Gefahrenabwehr in Fällen des internationalen Terrorismus. Kriminalistik S. 199–202 (2015)
42. Vogel, J., Brodowski, D.: Anmerkung zu Hans. OLG Hamburg, Beschl. v. 12.11.2007, Az. 6
Ws 1/07. Strafverteidiger (StV) S. 630 (632) (2009)
43. Vollmar, K.: Die Bedeutung von Kreativität und Innovation im Kontext der Bekämpfung von
Cybercrime. Kriminalistik S. 132–136 (2015)
44. Warntjen, M.: Die verfassungsrechtlichen Anforderungen an eine gesetzliche Regelung der
Online-Durchsuchung. Jura S. 581–585 (2008)
45. Weiss, A.: Online-Durchsuchungen im Strafverfahren, 1. Aufl. Verlag Dr. Kovac (2009)
46. Zimmermann, T.: Der strafprozessuale Zugriff auf E-Mails. Juristische Arbeitsblätter (JA) S.
321–327 (2014)
Ausgewählte Rechtsnormen (Auszug)
1 Strafprozessordnung – StPO
§ 94 I und II Sicherstellung und Beschlagnahme von Gegenständen zu
Beweiszwecken
(1) Gegenstände, die als Beweismittel für die Untersuchung von Bedeutung sein können,
sind in Verwahrung zu nehmen oder in anderer Weise sicherzustellen.
(2) Befinden sich die Gegenstände in dem Gewahrsam einer Person und werden sie nicht
freiwillig herausgegeben, so bedarf es der Beschlagnahme.
§ 100a Telekommunikationsüberwachung
(1) Auch ohne Wissen der Betroffenen darf die Telekommunikation überwacht und aufgezeichnet werden, wenn
1. bestimmte Tatsachen den Verdacht begründen, dass jemand als Täter oder Teilnehmer eine in Absatz 2 bezeichnete schwere Straftat begangen, in Fällen, in denen der
Versuch strafbar ist, zu begehen versucht, oder durch eine Straftat vorbereitet hat,
2. die Tat auch im Einzelfall schwer wiegt und
3. die Erforschung des Sachverhalts oder die Ermittlung des Aufenthaltsortes des Beschuldigten auf andere Weise wesentlich erschwert oder aussichtslos wäre.
(2) Schwere Straftaten im Sinne des Absatzes 1 Nr. 1 sind:
1. aus dem Strafgesetzbuch:
(a) Straftaten des Friedensverrats, des Hochverrats und der Gefährdung des demokratischen Rechtsstaates sowie des Landesverrats und der Gefährdung der äußeren
Sicherheit nach den §§ 80 bis 82, 84 bis 86, 87 bis 89a, 89c Abs. 1 bis 4, 94 bis
100a,
© Springer-Verlag GmbH Deutschland 2017
D. Labudde, M. Spranger (Hrsg.), Forensik in der digitalen Welt,
DOI 10.1007/978-3-662-53801-2
301
302
Ausgewählte Rechtsnormen (Auszug)
(b) Bestechlichkeit und Bestechung von Mandatsträgern nach § 108e,
(c) Straftaten gegen die Landesverteidigung nach den §§ 109d bis 109h,
(d) Straftaten gegen die öffentliche Ordnung nach den §§ 129 bis 130,
(e) Geld- und Wertzeichenfälschung nach den §§ 146 und 151, jeweils auch in Verbindung mit § 152, sowie nach § 152a Abs. 3 und § 152b Abs. 1 bis 4,
(f) Straftaten gegen die sexuelle Selbstbestimmung in den Fällen der §§ 176a, 176b,
177 Abs. 2 Nr. 2 und des § 179 Abs. 5 Nr. 2,
(g) Verbreitung, Erwerb und Besitz kinder- und jugendpornographischer Schriften
nach § 184b Abs. 1 und 2, § 184c Abs. 2,
(h) Mord und Totschlag nach den §§ 211 und 212,
(i) Straftaten gegen die persönliche Freiheit nach den §§ 232 bis 233a, 234, 234a, 239a
und 239b,
(j) Bandendiebstahl nach § 244 Abs. 1 Nr. 2 und schwerer Bandendiebstahl nach
§ 244a,
(k) Straftaten des Raubes und der Erpressung nach den §§ 249 bis 255,
(l) gewerbsmäßige Hehlerei, Bandenhehlerei und gewerbsmäßige Bandenhehlerei
nach den §§ 260 und 260a,
(m)Geldwäsche und Verschleierung unrechtmäßig erlangter Vermögenswerte nach
§ 261 Abs. 1, 2 und 4,
(n) Betrug und Computerbetrug unter den in § 263 Abs. 3 Satz 2 genannten Voraussetzungen und im Falle des § 263 Abs. 5, jeweils auch in Verbindung mit § 263a
Abs. 2,
(o) Subventionsbetrug unter den in § 264 Abs. 2 Satz 2 genannten Voraussetzungen und
im Falle des § 264 Abs. 3 in Verbindung mit § 263 Abs. 5,
(p) Straftaten der Urkundenfälschung unter den in § 267 Abs. 3 Satz 2 genannten Voraussetzungen und im Fall des § 267 Abs. 4, jeweils auch in Verbindung mit § 268
Abs. 5 oder § 269 Abs. 3, sowie nach § 275 Abs. 2 und § 276 Abs. 2,
(q) Bankrott unter den in § 283a Satz 2 genannten Voraussetzungen,
(r) Straftaten gegen den Wettbewerb nach § 298 und, unter den in § 300 Satz 2 genannten Voraussetzungen, nach § 299,
(s) gemeingefährliche Straftaten in den Fällen der §§ 306 bis 306c, 307 Abs. 1 bis 3,
des § 308 Abs. 1 bis 3, des § 309 Abs. 1 bis 4, des § 310 Abs. 1, der §§ 313, 314,
315 Abs. 3, des § 315b Abs. 3 sowie der §§ 316a und 316c,
(t) Bestechlichkeit und Bestechung nach den §§ 332 und 334,
2. aus der Abgabenordnung:
(a) Steuerhinterziehung unter den in § 370 Abs. 3 Satz 2 Nr. 5 genannten Voraussetzungen,
(b) gewerbsmäßiger, gewaltsamer und bandenmäßiger Schmuggel nach § 373,
(c) Steuerhehlerei im Falle des § 374 Abs. 2,
3. aus dem Arzneimittelgesetz: Straftaten nach § 95 Abs. 1 Nr. 2a unter den in § 95 Abs. 3
Satz 2 Nr. 2 Buchstabe b genannten Voraussetzungen,
4. aus dem Asylverfahrensgesetz:
Ausgewählte Rechtsnormen (Auszug)
303
(a) Verleitung zur missbräuchlichen Asylantragstellung nach § 84 Abs. 3,
(b) gewerbs- und bandenmäßige Verleitung zur missbräuchlichen Asylantragstellung
nach § 84a,
5. aus dem Aufenthaltsgesetz:
(a) Einschleusen von Ausländern nach § 96 Abs. 2,
(b) Einschleusen mit Todesfolge und gewerbs- und bandenmäßiges Einschleusen nach
§ 97,
6. aus dem Außenwirtschaftsgesetz: vorsätzliche Straftaten nach den §§ 17 und 18 des
Außenwirtschaftsgesetzes,
7. aus dem Betäubungsmittelgesetz:
(a) Straftaten nach einer in § 29 Abs. 3 Satz 2 Nr. 1 in Bezug genommenen Vorschrift
unter den dort genannten Voraussetzungen,
(b) Straftaten nach den §§ 29a, 30 Abs. 1 Nr. 1, 2 und 4 sowie den §§ 30a und 30b,
8. aus dem Grundstoffüberwachungsgesetz: Straftaten nach § 19 Abs. 1 unter den in § 19
Abs. 3 Satz 2 genannten Voraussetzungen,
9. aus dem Gesetz über die Kontrolle von Kriegswaffen:
(a) Straftaten nach § 19 Abs. 1 bis 3 und § 20 Abs. 1 und 2 sowie § 20a Abs. 1 bis 3,
jeweils auch in Verbindung mit § 21,
(b) Straftaten nach § 22a Abs. 1 bis 3,
10. aus dem Völkerstrafgesetzbuch:
(a) Völkermord nach § 6,
(b) Verbrechen gegen die Menschlichkeit nach § 7,
(c) Kriegsverbrechen nach den §§ 8 bis 12,
11. aus dem Waffengesetz:
(a) Straftaten nach § 51 Abs. 1 bis 3,
(b) Straftaten nach § 52 Abs. 1 Nr. 1 und 2 Buchstabe c und d sowie Abs. 5 und 6.
(3) Die Anordnung darf sich nur gegen den Beschuldigten oder gegen Personen richten,
von denen auf Grund bestimmter Tatsachen anzunehmen ist, dass sie für den Beschuldigten bestimmte oder von ihm herrührende Mitteilungen entgegennehmen oder weitergeben
oder dass der Beschuldigte ihren Anschluss benutzt.
(4) Liegen tatsächliche Anhaltspunkte für die Annahme vor, dass durch eine Maßnahme
nach Absatz 1 allein Erkenntnisse aus dem Kernbereich privater Lebensgestaltung erlangt
würden, ist die Maßnahme unzulässig. Erkenntnisse aus dem Kernbereich privater Lebensgestaltung, die durch eine Maßnahme nach Absatz 1 erlangt wurden, dürfen nicht
verwertet werden. Aufzeichnungen hierüber sind unverzüglich zu löschen. Die Tatsache
ihrer Erlangung und Löschung ist aktenkundig zu machen.
304
Ausgewählte Rechtsnormen (Auszug)
§ 110 III Durchsicht von Papieren und elektronischen Speichermedien
(3) Die Durchsicht eines elektronischen Speichermediums bei dem von der Durchsuchung
Betroffenen darf auch auf hiervon räumlich getrennte Speichermedien, soweit auf sie von
dem Speichermedium aus zugegriffen werden kann, erstreckt werden, wenn andernfalls
der Verlust der gesuchten Daten zu besorgen ist. Daten, die für die Untersuchung von
Bedeutung sein können, dürfen gesichert werden; § 98 Abs. 2 gilt entsprechend.
§ 160 Pflicht zur Sachverhaltsaufklärung
(1) Sobald die Staatsanwaltschaft durch eine Anzeige oder auf anderem Wege von dem
Verdacht einer Straftat Kenntnis erhält, hat sie zu ihrer Entschließung darüber, ob die öffentliche Klage zu erheben ist, den Sachverhalt zu erforschen.
(2) Die Staatsanwaltschaft hat nicht nur die zur Belastung, sondern auch die zur Entlastung dienenden Umstände zu ermitteln und für die Erhebung der Beweise Sorge zu tragen,
deren Verlust zu besorgen ist.
(3) Die Ermittlungen der Staatsanwaltschaft sollen sich auch auf die Umstände erstrecken, die für die Bestimmung der Rechtsfolgen der Tat von Bedeutung sind. Dazu kann
sie sich der Gerichtshilfe bedienen.[. . . ]
§ 161 Allgemeine Ermittlungsbefugnis der Staatsanwaltschaft
(1) Zu dem in § 160 Abs. 1 bis 3 bezeichneten Zweck ist die Staatsanwaltschaft befugt,
von allen Behörden Auskunft zu verlangen und Ermittlungen jeder Art entweder selbst
vorzunehmen oder durch die Behörden und Beamten des Polizeidienstes vornehmen zu
lassen, soweit nicht andere gesetzliche Vorschriften ihre Befugnisse besonders regeln. Die
Behörden und Beamten des Polizeidienstes sind verpflichtet, dem Ersuchen oder Auftrag
der Staatsanwaltschaft zu genügen, und in diesem Falle befugt, von allen Behörden Auskunft zu verlangen.
(2) Ist eine Maßnahme nach diesem Gesetz nur bei Verdacht bestimmter Straftaten zulässig, so dürfen die auf Grund einer entsprechenden Maßnahme nach anderen Gesetzen
erlangten personenbezogenen Daten ohne Einwilligung der von der Maßnahme betroffenen Personen zu Beweiszwecken im Strafverfahren nur zur Aufklärung solcher Straftaten
verwendet werden, zu deren Aufklärung eine solche Maßnahme nach diesem Gesetz hätte
angeordnet werden dürfen. § 100d Abs. 5 Nr. 3 bleibt unberührt.
(3) In oder aus einer Wohnung erlangte personenbezogene Daten aus einem Einsatz technischer Mittel zur Eigensicherung im Zuge nicht offener Ermittlungen auf polizeirechtlicher Grundlage dürfen unter Beachtung des Grundsatzes der Verhältnismäßigkeit zu
Beweiszwecken nur verwendet werden (Art. 13 Abs. 5 des GG), wenn das Amtsgericht
(§ 162 Abs. 1), in dessen Bezirk die anordnende Stelle ihren Sitz hat, die Rechtmäßigkeit
Ausgewählte Rechtsnormen (Auszug)
305
der Maßnahme festgestellt hat; bei Gefahr im Verzug ist die richterliche Entscheidung
unverzüglich nachzuholen.
§ 163 Aufgaben der Polizei im Ermittlungsverfahren
(1) Die Behörden und Beamten des Polizeidienstes haben Straftaten zu erforschen und alle
keinen Aufschub gestattenden Anordnungen zu treffen, um die Verdunkelung der Sache
zu verhüten. Zu diesem Zweck sind sie befugt, alle Behörden um Auskunft zu ersuchen,
bei Gefahr im Verzug auch, die Auskunft zu verlangen, sowie Ermittlungen jeder Art vorzunehmen, soweit nicht andere gesetzliche Vorschriften ihre Befugnisse besonders regeln.
(2) Die Behörden und Beamten des Polizeidienstes übersenden ihre Verhandlungen ohne
Verzug der Staatsanwaltschaft. Erscheint die schleunige Vornahme richterlicher Untersuchungshandlungen erforderlich, so kann die Übersendung unmittelbar an das Amtsgericht
erfolgen.[. . . ]
2 Telekommunikationsgesetz – TKG
§ 3 Begriffsbestimmungen
Im Sinne dieses Gesetzes ist oder sind
1.
„Anruf“ eine über einen öffentlich zugänglichen Telekommunikationsdienst aufgebaute Verbindung, die eine zweiseitige Sprachkommunikation ermöglicht;
2. „Anwendungs-Programmierschnittstelle“ die Software-Schnittstelle zwischen Anwendungen, die von Sendeanstalten oder Diensteanbietern zur Verfügung gestellt
werden, und den Anschlüssen in den erweiterten digitalen Fernsehempfangsgeräten
für digitale Fernseh- und Rundfunkdienste;
3. „Bestandsdaten“ Daten eines Teilnehmers, die für die Begründung, inhaltliche Ausgestaltung, Änderung oder Beendigung eines Vertragsverhältnisses über Telekommunikationsdienste erhoben werden;
6. „Diensteanbieter“ jeder, der ganz oder teilweise geschäftsmäßig
(a) Telekommunikationsdienste erbringt oder
(b) an der Erbringung solcher Dienste mitwirkt;
7. „digitales Fernsehempfangsgerät“ ein Fernsehgerät mit integriertem digitalem Decoder oder ein an ein Fernsehgerät anschließbarer digitaler Decoder zur Nutzung digital
übertragener Fernsehsignale, die mit Zusatzsignalen, einschließlich einer Zugangsberechtigung, angereichert sein können;
19. „Standortdaten“ Daten, die in einem Telekommunikationsnetz oder von einem Telekommunikationsdienst erhoben oder verwendet werden und die den Standort des
306
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
Ausgewählte Rechtsnormen (Auszug)
Endgeräts eines Endnutzers eines öffentlich zugänglichen Telekommunikationsdienstes angeben;
„Teilnehmer“ jede natürliche oder juristische Person, die mit einem Anbieter von
öffentlich zugänglichen Telekommunikationsdiensten einen Vertrag über die Erbringung derartiger Dienste geschlossen hat;
„Teilnehmeranschluss“ die physische Verbindung, mit dem der Netzabschlusspunkt
in den Räumlichkeiten des Teilnehmers mit den Hauptverteilerknoten oder mit einer
gleichwertigen Einrichtung in festen öffentlichen Telefonnetzen verbunden wird;
„Telekommunikation“ der technische Vorgang des Aussendens, Übermittelns und
Empfangens von Signalen mittels Telekommunikationsanlagen;
„Telekommunikationsanlagen“ technische Einrichtungen oder Systeme, die als
Nachrichten identifizierbare elektromagnetische oder optische Signale senden, übertragen, vermitteln, empfangen, steuern oder kontrollieren können;
„Telekommunikationsdienste“ in der Regel gegen Entgelt erbrachte Dienste, die ganz
oder über-wiegend in der Übertragung von Signalen über Telekommunikationsnetze
bestehen, einschließlich Übertragungsdienste in Rundfunknetzen;
„telekommunikationsgestützte Dienste“ Dienste, die keinen räumlich und zeitlich
trennbaren Leistungsfluss auslösen, sondern bei denen die Inhaltsleistung noch während der Telekommunikationsverbindung erfüllt wird;
„Telekommunikationslinien“ unter- oder oberirdisch geführte Telekommunikationskabelanlagen einschließlich ihrer zugehörigen Schalt- und Verzweigungseinrichtungen, Masten und Unterstützungen, Kabelschächte und Kabelkanalrohre;
„Telekommunikationsnetz“ die Gesamtheit von Übertragungssystemen und gegebenenfalls Vermittlungs- und Leitwegeinrichtungen sowie anderweitigen Ressourcen,
einschließlich der nicht aktiven Netzbestandteile, die die Übertragung von Signalen über Kabel, Funk, optische und andere elektromagnetische Einrichtungen ermöglichen, einschließlich Satellitennetzen, festen, leitungs- und paketvermittelten
Netzen, einschließlich des Internets, und mobilen terrestrischen Netzen, Stromleitungssystemen, soweit sie zur Signalübertragung genutzt werden, Netzen für Hörund Fernsehfunk sowie Kabelfernsehnetzen, unabhängig von der Art der übertragenen Information;
„Übertragungsweg“ Telekommunikationsanlagen in Form von Kabel- oder Funkverbindungen mit ihren übertragungstechnischen Einrichtungen als Punkt-zu-Punktoder Punkt-zu-Mehrpunktverbindungen mit einem bestimmten Informationsdurchsatzvermögen (Bandbreite oder Bit-Rate) einschließlich ihrer Abschlusseinrichtungen;
„Unternehmen“ das Unternehmen selbst oder mit ihm im Sinne des § 36 Abs. 2 und
§ 37 Abs. 1 und 2 des Gesetzes gegen Wettbewerbsbeschränkungen verbundene Unternehmen;
„Verkehrsdaten“ Daten, die bei der Erbringung eines Telekommunikationsdienstes
erhoben, verarbeitet oder genutzt werden;
Ausgewählte Rechtsnormen (Auszug)
307
30a. „Verletzung des Schutzes personenbezogener Daten“ eine Verletzung der Datensicherheit, die zum Verlust, zur unrechtmäßigen Löschung, Veränderung, Speicherung,
Weitergabe oder sonstigen unrechtmäßigen Verwendung personenbezogener Daten
führt, die übertragen, gespeichert oder auf andere Weise im Zusammenhang mit der
Bereitstellung öffentlich zugänglicher Telekommunikationsdienste verarbeitet werden sowie der unrechtmäßige Zugang zu diesen; [. . . ]
3
Bundeskriminalamtgesetz – BKAG
§ 20a Allgemeine Befugnisse
(1) Das Bundeskriminalamt kann zur Erfüllung seiner Aufgabe nach § 4a Abs. 1 Satz 1
die notwendigen Maßnahmen treffen, um eine Gefahr abzuwehren, soweit nicht dieses
Gesetz die Befugnisse des Bundeskriminalamtes besonders regelt. Die §§ 15 bis 20 des
Bundespolizeigesetzes gelten entsprechend.
(2) Gefahr im Sinne dieses Unterabschnitts ist eine im Einzelfall bestehende Gefahr für
die öffentliche Sicherheit im Zusammenhang mit Straftaten gemäß § 4a Abs. 1 Satz 2.
§ 20k Verdeckter Eingriff in informationstechnische Systeme
(1) Das Bundeskriminalamt darf ohne Wissen des Betroffenen mit technischen Mitteln
in vom Betroffenen genutzte informationstechnische Systeme eingreifen und aus ihnen
Daten erheben, wenn bestimmte Tatsachen die Annahme rechtfertigen, dass eine Gefahr
vorliegt für
1. Leib, Leben oder Freiheit einer Person oder
2. solche Güter der Allgemeinheit, deren Bedrohung die Grundlagen oder den Bestand
des Staates oder die Grundlagen der Existenz der Menschen berührt.
Eine Maßnahme nach Satz 1 ist auch zulässig, wenn sich noch nicht mit hinreichender
Wahrscheinlichkeit feststellen lässt, dass ohne Durchführung der Maßnahme in näherer
Zukunft ein Schaden eintritt, sofern bestimmte Tatsachen auf eine im Einzelfall durch
bestimmte Personen drohende Gefahr für eines der in Satz 1 genannten Rechtsgüter hinweisen. Die Maßnahme darf nur durchgeführt werden, wenn sie für die Aufgabenerfüllung
nach § 4a erforderlich ist und diese ansonsten aussichtslos oder wesentlich erschwert wäre.
(2) Es ist technisch sicherzustellen, dass
1. an dem informationstechnischen System nur Veränderungen vorgenommen werden,
die für die Datenerhebung unerlässlich sind, und
308
Ausgewählte Rechtsnormen (Auszug)
2. die vorgenommenen Veränderungen bei Beendigung der Maßnahme soweit technisch
möglich automatisiert rückgängig gemacht werden.
Das eingesetzte Mittel ist nach dem Stand der Technik gegen unbefugte Nutzung zu schützen. Kopierte Daten sind nach dem Stand der Technik gegen Veränderung, unbefugte
Löschung und unbefugte Kenntnisnahme zu schützen.
(3) Bei jedem Einsatz des technischen Mittels sind zu protokollieren
1. die Bezeichnung des technischen Mittels und der Zeitpunkt seines Einsatzes,
2. die Angaben zur Identifizierung des informationstechnischen Systems und die daran
vorgenommenen nicht nur flüchtigen Veränderungen,
3. die Angaben, die die Feststellung der erhobenen Daten ermöglichen, und
4. die Organisationseinheit, die die Maßnahme durchführt.
Die Protokolldaten dürfen nur verwendet werden, um dem Betroffenen oder einer dazu
befugten öffentlichen Stelle die Prüfung zu ermöglichen, ob die Maßnahme nach Absatz 1
rechtmäßig durchgeführt worden ist. Sie sind bis zum Ablauf des auf die Speicherung folgenden Kalenderjahres aufzubewahren und sodann automatisiert zu löschen, es sei denn,
dass sie für den in Satz 2 genannten Zweck noch erforderlich sind.
(4) Die Maßnahme darf sich nur gegen eine Person richten, die entsprechend § 17 oder
§ 18 des Bundespolizeigesetzes verantwortlich ist. Die Maßnahme darf auch durchgeführt
werden, wenn andere Personen unvermeidbar betroffen werden.
(5) Die Maßnahme nach Absatz 1 darf nur auf Antrag des Präsidenten des Bundeskriminalamtes oder seines Vertreters durch das Gericht angeordnet werden.
(6) Die Anordnung ergeht schriftlich. In ihr sind anzugeben
1. die Person, gegen die sich die Maßnahme richtet, soweit möglich, mit Name und Anschrift,
2. eine möglichst genaue Bezeichnung des informationstechnischen Systems, in das zur
Datenerhebung eingegriffen werden soll,
3. Art, Umfang und Dauer der Maßnahme unter Benennung des Endzeitpunktes sowie
4. die wesentlichen Gründe.
Die Anordnung ist auf höchstens drei Monate zu befristen. Eine Verlängerung um jeweils
nicht mehr als drei weitere Monate ist zulässig, soweit die Anordnungsvoraussetzungen
unter Berücksichtigung der gewonnenen Erkenntnisse fortbestehen. Liegen die Voraussetzungen der Anordnung nicht mehr vor, sind die auf Grund der Anordnung ergriffenen
Maßnahmen unverzüglich zu beenden.
(7) Liegen tatsächliche Anhaltspunkte für die Annahme vor, dass durch die Maßnahme allein Erkenntnisse aus dem Kernbereich privater Lebensgestaltung erlangt würden, ist die
Maßnahme unzulässig. Soweit möglich, ist technisch sicherzustellen, dass Daten, die den
Kernbereich privater Lebensgestaltung betreffen, nicht erhoben werden. Erhobene Daten
Ausgewählte Rechtsnormen (Auszug)
309
sind unter der Sachleitung des anordnenden Gerichts nach Absatz 5 unverzüglich vom
Datenschutzbeauftragten des Bundeskriminalamtes und zwei weiteren Bediensteten des
Bundeskriminalamtes, von denen einer die Befähigung zum Richteramt hat, auf kernbereichsrelevante Inhalte durchzusehen. Der Datenschutzbeauftragte ist bei Ausübung dieser
Tätigkeit weisungsfrei und darf deswegen nicht benachteiligt werden (§ 4f Abs. 3 des Bundesdatenschutzgesetzes). Daten, die den Kernbereich privater Lebensgestaltung betreffen,
dürfen nicht verwertet werden und sind unverzüglich zu löschen. Die Tatsachen der Erfassung der Daten und der Löschung sind zu dokumentieren. Die Dokumentation darf
ausschließlich für Zwecke der Datenschutzkontrolle verwendet werden. Sie ist zu löschen,
wenn sie für diese Zwecke nicht mehr erforderlich ist, spätestens jedoch am Ende des Kalenderjahres, das dem Jahr der Dokumentation folgt.
4 Antiterrordateigesetz – ATDG
§ 3 Zu speichernde Datenarten
(1) In der Antiterrordatei werden, soweit vorhanden, folgende Datenarten gespeichert:
1. zu Personen nach § 2 Satz 1 Nummer 1 und 2
(a) der Familienname, die Vornamen, frühere Namen, andere Namen, Aliaspersonalien, abweichende Namensschreibweisen, das Geschlecht, das Geburtsdatum, der
Geburtsort, der Geburtsstaat, aktuelle und frühere Staatsangehörigkeiten, gegenwärtige und frühere Anschriften, besondere körperliche Merkmale, Sprachen, Dialekte, Lichtbilder, die Bezeichnung der Fallgruppe nach § 2 und, soweit keine
anderen gesetzlichen Bestimmungen entgegenstehen und dies zur Identifizierung
einer Person erforderlich ist, Angaben zu Identitätspapieren (Grunddaten),
(b) folgende weitere Datenarten (erweiterte Grunddaten):
aa). eigene oder von ihnen genutzte Telekommunikationsanschlüsse und Telekommunikationsendgeräte,
bb). Adressen für elektronische Post,
cc). Bankverbindungen,
dd). Schließfächer,
ee). auf die Person zugelassene oder von ihr genutzte Fahrzeuge,
ff). Familienstand,
gg). Volkszugehörigkeit,
hh). Angaben zur Religionszugehörigkeit, soweit diese im Einzelfall zur Aufklärung oder Bekämpfung des internationalen Terrorismus erforderlich sind,
ii). besondere Fähigkeiten, die nach den auf bestimmten Tatsachen beruhenden
Erkenntnissen der beteiligten Behörden der Vorbereitung und Durchführung
terroristischer Straftaten nach § 129a Abs. 1 und 2 des Strafgesetzbuchs die-
310
Ausgewählte Rechtsnormen (Auszug)
nen können, insbesondere besondere Kenntnisse und Fertigkeiten in der Herstellung oder im Umgang mit Sprengstoffen oder Waffen,
jj). Angaben zum Schulabschluss, zur berufsqualifizierenden Ausbildung und
zum ausgeübten Beruf,
kk). Angaben zu einer gegenwärtigen oder früheren Tätigkeit in einer lebenswichtigen Einrichtung im Sinne des § 1 Abs. 5 des Sicherheitsüberprüfungsgesetzes oder einer Verkehrs- oder Versorgungsanlage oder -einrichtung, einem
öffentlichen Verkehrsmittel oder Amtsgebäude,
ll). Angaben zur Gefährlichkeit, insbesondere Waffenbesitz oder zur Gewaltbereitschaft der Person,
mm). Fahr- und Flugerlaubnisse,
nn). besuchte Orte oder Gebiete, an oder in denen sich in § 2 Satz 1 Nr. 1 und 2
genannte Personen treffen,
oo). Kontaktpersonen zu den jeweiligen Personen nach § 2 Satz 1 Nr. 1 Buchstabe a oder Nr. 2,
pp). die Bezeichnung der konkreten Vereinigung oder Gruppierung nach § 2
Satz 1 Nr. 1 Buchstabe a oder b,
qq). der Tag, an dem das letzte Ereignis eingetreten ist, das die Speicherung der
Erkenntnisse begründet,
rr). auf tatsächlichen Anhaltspunkten beruhende zusammenfassende besondere
Bemerkungen, ergänzende Hinweise und Bewertungen zu Grunddaten und
erweiterten Grunddaten, die bereits in Dateien der beteiligten Behörden gespeichert sind, sofern dies im Einzelfall nach pflichtgemäßem Ermessen geboten und zur Aufklärung oder Bekämpfung des internationalen Terrorismus
unerlässlich ist, und
ss). von der Person betriebene oder maßgeblich zum Zweck ihrer Aktivitäten
nach § 2 Satz 1 Nummer 1 oder Nummer 2 genutzte Internetseiten,
2. Angaben zur Identifizierung der in § 2 Satz 1 Nummer 3 genannten Vereinigungen,
Gruppierungen, Stiftungen, Unternehmen, Sachen, Bankverbindungen, Anschriften,
Telekommunikationsanschlüsse, Telekommunikationsendgeräte, Internetseiten oder
Adressen für elektronische Post, mit Ausnahme weiterer personenbezogener Daten,
und
3. zu den jeweiligen Daten nach den Nummern 1 und 2 die Angabe der Behörde, die über
die Erkenntnisse verfügt, sowie das zugehörige Aktenzeichen oder sonstige Geschäftszeichen und, soweit vorhanden, die jeweilige Einstufung als Verschlusssache.
(2) Kontaktpersonen nach Absatz 1 Nummer 1 Buchstabe b Doppelbuchstabe oo sind Personen, bei denen tatsächliche Anhaltspunkte vorliegen, dass sie mit den in § 2 Satz 1
Nummer 1 Buchstabe a oder Nummer 2 genannten Personen nicht nur flüchtig oder in
zufälligem Kontakt in Verbindung stehen und durch sie weiterführende Hinweise für die
Aufklärung oder Bekämpfung des internationalen Terrorismus zu erwarten sind. Angaben
zu Kontaktpersonen dürfen ausschließlich als erweiterte Grunddaten nach Absatz 1 Num-
Ausgewählte Rechtsnormen (Auszug)
311
mer 1 Buchstabe b Doppelbuchstabe oo mit folgenden Datenarten zur Identifizierung und
Kontaktaufnahme gespeichert werden: der Familienname, die Vornamen, frühere Namen,
andere Namen, Aliaspersonalien, abweichende Namensschreibweisen, das Geschlecht,
das Geburtsdatum, der Geburtsort, der Geburtsstaat, die aktuelle Staatsangehörigkeit, die
gegenwärtige Anschrift, Lichtbilder, eigene oder von ihnen genutzte Telekommunikationsanschlüsse sowie Adressen für elektronische Post, sonstige Angaben zur beruflichen
Erreichbarkeit.
(3) Soweit zu speichernde Daten aufgrund einer anderen Rechtsvorschrift zu kennzeichnen sind, ist diese Kennzeichnung bei der Speicherung der Daten in der Antiterrordatei
aufrechtzuerhalten.
(4) Das Bundeskriminalamt legt die Kriterien und Kategorien für die zu speichernden Datenarten in den Fällen des Absatzes 1 Nummer 1 Buchstabe b Doppelbuchstabe gg, hh, ii,
kk und nn in einer Verwaltungsvorschrift fest. Diese ist in der jeweils aktuellen Fassung
im Bundesanzeiger zu veröffentlichen. Das Bundeskriminalamt kann Kriterien für die zu
speichernden Datenarten in den weiteren Fällen des Absatzes 1 in derselben Verwaltungsvorschrift vorsehen.
§ 5 Zugriff auf die Daten
(1) Die beteiligten Behörden dürfen die in der Antiterrordatei gespeicherten Daten im
automatisierten Verfahren nutzen, soweit dies zur Erfüllung der jeweiligen Aufgaben zur
Aufklärung oder Bekämpfung des internationalen Terrorismus erforderlich ist. Im Falle
eines Treffers erhält die abfragende Behörde Zugriff
1. (a) bei einer Abfrage zu Personen auf die zu ihnen gespeicherten Grunddaten oder
(b) bei einer Abfrage zu Vereinigungen, Gruppierungen, Stiftungen, Unternehmen,
Sachen, Bankverbindungen, Anschriften, Telekommunikationsanschlüssen, Telekommunikationsendgeräten, Internetseiten oder Adressen für elektronische Post
nach § 2 Satz 1 Nummer 3 auf die dazu gespeicherten Daten, und
2. auf die Daten nach § 3 Abs. 1 Nr. 3.
Auf die zu Personen gespeicherten erweiterten Grunddaten kann die abfragende Behörde
im Falle eines Treffers Zugriff erhalten, wenn die Behörde, die die Daten eingegeben hat,
dies im Einzelfall auf Ersuchen gewährt. Die Entscheidung hierüber richtet sich nach den
jeweils geltenden Übermittlungsvorschriften. Wenn die abfragende Behörde ohne Angabe
eines Namens nach § 3 Absatz 1 Nummer 1 Buchstabe a mittels Angaben in den erweiterten Grunddaten sucht, erhält sie im Falle eines Treffers lediglich Zugriff auf die Daten
nach § 3 Absatz 1 Nummer 3 Satz 5 gilt entsprechend, wenn die Suche trotz Angabe eines
Namens mehrere Treffer erzeugt.
(2) Die abfragende Behörde darf im Falle eines Treffers unmittelbar auf die erweiterten Grunddaten zugreifen, wenn dies aufgrund bestimmter Tatsachen zur Abwehr einer
312
Ausgewählte Rechtsnormen (Auszug)
gegenwärtigen Gefahr für Leib, Leben, Gesundheit oder Freiheit einer Person oder für
Sachen von erheblichem Wert, deren Erhaltung im öffentlichen Interesse geboten ist, unerlässlich ist und die Datenübermittlung aufgrund eines Ersuchens nicht rechtzeitig erfolgen
kann (Eilfall). Ob ein Eilfall vorliegt, entscheidet der Behördenleiter oder ein von ihm besonders beauftragter Beamter des höheren Dienstes. Die Entscheidung und ihre Gründe
sind zu dokumentieren. Der Zugriff ist unter Hinweis auf die Entscheidung nach Satz 3 zu
protokollieren. Die Behörde, die die Daten eingegeben hat, muss unverzüglich um nachträgliche Zustimmung ersucht werden. Wird die nachträgliche Zustimmung verweigert, ist
die weitere Verwendung dieser Daten unzulässig. Die abfragende Behörde hat die Daten
unverzüglich zu löschen oder nach § 11 Abs. 3 zu sperren. Sind die Daten einem Dritten
übermittelt worden, ist dieser unverzüglich darauf hinzuweisen, dass die weitere Verwendung der Daten unzulässig ist.
(3) Innerhalb der beteiligten Behörden erhalten ausschließlich hierzu ermächtigte Personen Zugriff auf die Antiterrordatei.
(4) Bei jeder Abfrage müssen der Zweck und die Dringlichkeit angegeben und dokumentiert werden und erkennbar sein.
Glossar
Alterungstheorie lassen sich in Evolutions- und Schadenstheorien einteilen. Die Schadenstheorien befassen sich dabei mit dem Umstand wie ein Organismus altert, die evolutionsbezogenen Theorien hingegen warum er altert.
Anatomische Weichteilmarker auch bekannt als Landmarken, repräsentieren definierbare durchschnittliche Weichteildicken an wesentlichen anatomischen Punkten des Schädels.
Antemortal bedeutet „vor dem Tode“.
Blender ist eine Open-Source-Software, die den gesamten Workflow vom Modellieren
über das Texturieren bis hin zur Animation und zum Rendering von 3D-Modellen abdeckt.
Daktyloskopie ist ein Verfahren zur Auswertung von Fingerabdrücken.
Dermis ist die zweite Hautschicht. Bei dieser handelt es sich um eine 2–4 mm dicke,
kollagenreiche Bindegewebsschicht, die sich unterhalb der Epidermis befindet und hauptsächlich aus Fibroblasten besteht.
Epidermis auch Oberhaut genannt, ist ein externes Epithel frei von Blut- oder Nervenversorgung mit einer Größe von etwa 5–100 µm, das eine Grenzschicht zwischen Körper
und Umwelt darstellt.
Extrinsische Hautalterung ist der Alterungsprozess der Haut durch lebenslang einwirkende Umweltprozesse. Zu den extrinsischen Einflüssen zählen vor allem die ultraviolette
(UV) Strahlung, Nikotinkonsum, Infrarotstrahlung und Ozon.
313
314
Glossar
Gesichtsweichteilrekonstruktion ist eine Variante der Auswertung von vorgefundenen
biologischen Spuren und dem daraus abgeleiteten Versuch das äußere Erscheinungsbild
eines unbekannten Toten in einem möglichst realen und lebensnahen Modell nachzubilden.
Hautpigmentierung ist der Schutzmechanismus der Haut vor ultravioletten Strahlen
(UV-A: 320–400 nm und UV-B: 280–320 nm), welche die Haut schädigen können.
Hausdorff-Distanz dient dem Vergleich von zwei Modellen durch Berechnung der Distanz zwischen diesen.
Hypodermis ist die letzte Schicht der Haut, die auch Subkutis genannt wird. Die Hypodermis ist eine lockere Bindegewebsschicht, die die Haut mit darunterliegendem Gewebe
verbindet.
Intrinsische Hautalterung sind natürliche, genetisch determinierte Prozesse die zu dieser führen. Wie bei dem Alterungsprozess des gesamten Organismus spielen auch bei der
Alterung der Haut verschiedene Theorien wie die der freien Radikale sowie die begrenzte
Teilungsmöglichkeit von Zellen durch die Verkürzung der Telomere eine entscheidende
Rolle.
Melanin ist ein Pigment, dass beim Menschen für die Färbung der Haare, Haut und Aderhaut verantwortlich ist.
Melaninsynthese nutzt als chemische Grundsubstanz die Aminosäure Tyrosin. Diese
wird zu Dihydroxiphenylalanin (DOPA) hydrolyisert, welches anschließend zu DOPAquinon oxidiert wird. Beide Reaktionen werden dabei durch das Enzym Tyrosinase katalysiert
und laufen in Phäo- und Eumelanosomen äquivalent ab.
MeshLab ist eine portable und erweiterbare Software für die Verarbeitung und Editierung von unstrukturierten 3D-Punktwolken.
Mimische Muskulatur Der individuelle Charakter eines Gesichtes wird wesentlich
durch die Aktivität der mimischen Muskulatur bestimmt. Die mimischen Muskeln stellen
die oberflächliche Schicht der Muskeln im Gesichtsbereich dar und lassen sich in die
obere und tiefere Schicht gliedern.
Morphognostik ist die Beurteilung von Knochen anhand der sichtbaren Einzelmerkmale.
Glossar
315
Neurocranium auch bekannt als Gehirnschädel besteht aus sieben teils unregelmäßigen
Einzelknochen und dient dem Schutz des Gehirns. Anatomisch lässt dieses sich weiter in
Schädeldach (lat. Calvaria) und Schädelbasis (lat. Basis cranii) unterteilen.
Odontostomatologie ist die Lehre von Struktur, Entwicklung und Anomalien der Zähne.
Im forensischen Kontext wird diese unter anderem für die Identifikation unbekannter Toter
eingesetzt.
Osteologie ist die Lehre von den Knochen. Der Begriff der forensischen Osteologie
bezieht sich auf die Untersuchung und Beurteilung aufgefundener Knochen und Knochenfragmente.
Osteometrie befasst sich mit der Charakterisierung der Form von Knochen durch quantifizierbare Maßzahlen.
Viscerocranium auch bekannt als Gesichtsschädel besteht aus 15y Einzelknochen und
stellt die Grundlage des Gesichtes dar. Der Gesichtsschädel formt die Augen-, Nasen- und
Mundhöhle und bildet somit die Grundlage des Gesichtes. Die Knochen des Gesichtsschädels bestimmen in großem Maß das Aussehen eines Menschen.
VisualSfM ist ein Open-Source-Softwarepaket mit dem aus Mehrbildfotoaufnahmen eines Objektes eine 3D-Punktwolke berechnet und aus diesem ein 3D-Modell erstellt werden kann. Die Bezeichnung Visual ist auf die verfügbare graphische Oberfläche zurückzuführen, Structure from Motion (SfM) hingegen bezeichnet den automatischen Prozess, der
die räumliche Struktur der Objekte aufgrund von korrespondierenden Merkmalen in den
Aufnahmen erkennt.
Sachverzeichnis
3D-Modell, 61, 66, 67, 70, 74–77, 79–81, 85,
86
3D-Punktwolke, 66, 67, 71, 72
3D-Rekonstruktion, 3
3D-Szenen, 15
A
Abhören, 277
Abstammungsanalyse, 94
abtastorientierte Codierung, 221
AccessData, 130
Accountinhaber, 298
Administratorenrechte, 286
Adressbuch, 273
Adware, 202
AFF-Format, 129
Affinity Propagation, 253
AFIS, 40
Ähnlichkeit, 241
akustische Forensik, 215
Allel, 93
Allelfrequenz, 98
allgemeines Persönlichkeitsrecht, 275, 276
Amelogenin, 91
Amtsermittlungsgrundsatz, 283
Anbieterserver, 296
Anfangsverdacht, 267, 276, 279, 293
Anhaltspunkte, 293
zureichende tatsächliche, 267
Anklageschrift, 21
Annährungsort, 8
Anonymität, 163
Anti-Debugging, 209
Antiterrordatei, 265, 295
Antiterrordateigesetz, 295
Anubis, 206
Archiv, 273
ARPANET, 4
Assoziationsanalyse, 243
Assoziationslernen, 244
Audibility Analysis, 217
Audioforensik, 215
audioforensische Identifikation, 215
Audiosignale, 215
Aufzeichnung der Telekommunikation, 285
Auskunftspflicht, 278
Ausland, 278
Authentifizierung, 32
B
Backdoor, 201
Backdoor-Programm, 288
Bacteria, 201
Benachrichtigungspflicht, 280
Beschlagnahme, 266, 278, 279
Beschlagnahme von Gegenständen, 276
Beschluss, 276
Beschuldigte, 276, 278
Beschuldigtenrecht, 274
Beweis, 20
Beweisaufnahme, 272
Beweisbedeutung, 272
Beweislastverteilung, 20
Beweismaterial, 288
Beweismittel, 265–267, 272, 290, 295
Beweissicherung, 298
Beweisverbot, 273
Beweisverwertung, 294
Beweisverwertungsverbot, 278, 279
Beweiswert, 273, 289
Beweiswürdigung, 272
Beweiszweck, 295
317
318
Bibliothek, 273
Big Data, 12
Biometrie, 26
Bitcoin, 156
Bitcoinnetzwerk, 156
bitgenaue Kopie, 118
BKA, 52
Black-Hats, 4
Blender, 15
Blockchain, 158
Blocksynchronisation, 235
Bootstrapping, 183
Bot, 202
Botnet, 202
Brief-, Post- und Fernmeldegeheimnis, 266
Browser-Cache, 143, 145
Bundestrojaner, 286
Bundesverfassungsgericht, 280, 287
C
Canny-Algorithmus, 33
Carving, 137
Chat-Dienste, 277
chemischer Fingerabdruck, 51
Clarke-Winkel, 35
Clickbaiting, 202
Cloud, 279
Cloud Computing, 295, 296
Cloudanbieter, 279
Cloudspeicher, 147
Cloud-Storage-Dienst, 279
Cluster, 136
Clusteralgorithmus
Affinity Propagation, 253
c-Means, 245
fuzzy, 251
Neural Gas (NG), 246
protoypbasiert, 245
Self-Organizing Map (SOM), 248
vektoriell, 245
Clustern, 240
c-Means, 245
Code Transposition, 209
Cohens Virus, 199
cold cases, 89
Cold-Booting, 121
Command-and-Control-Server, 203
Computerforensik, 113
computergestützte Kriminalität, 294
Sachverzeichnis
Computerkriminalität, 297, 298
Cracking, 4
Creeper, 199
CSI-Effekt, 2, 25
Cuckoo, 206
Cybercrime, 2
Cyber-Crime-Convention, 297
Cybercrimedelikt, 10
Cybercrimekonvention des Europarates, 298
Cybermobbing, 3
Cyberspace, 3, 8
D
Daktyloskopie, 40
Dateinamen, 271
Dateisignatur, 140
Daten
-analyse, 126
elektronische, 266
-kategorien, 136, 140
Kommunikation, 266
kopieren, 270, 271, 273, 291
nichtvektoriell, 241, 258
-rekonstruktion, 141
-remanenz, 121
-sicherung, 127
-sicherungsprozess, 119, 132
-spur, 115
-übertragung, 268
unstrukturiert, 170
vektoriell, 240, 258
Datenähnlichkeit, 240
Datenanalyse, 243
Datenbank, 94
AFIS, 54
DAD, 52
dbGaP, 102
DBGV, 102
dbSNP, 102
Eurodac, 55
GWAS Central, 102
IBIS, 53
NCBI, 102
PDQ, 53
SoleMate, 54
TreadMate, 54
ViCLAS, 52
YHRD, 101
Datenbanken, 52
Sachverzeichnis
Dateninhaber, 297
Datenschutz, 266
Datenspeicherung, 296
Datenstrukturen, 240
Datenträger, 266
CD, 266, 276
Disketten, 266
DVD, 266
Festplatte, 266–268, 270, 276, 278, 295
extern, 268, 278, 296
Memory Sticks, 266
separat, 270
-sicherung, 129
Speicherkarten, 266
USB, 266
USB-Stick, 296
Datenübermittlung, 279
Datenverlust, 289
Datenvisualisierung, 250
Daugman-Algorithmus, 38
dd, 130
ddrescue, 130
dead analysis, 125
Dead-Code Insertion, 209
Debug Interrupts, 209
Decryptor Loop, 207
Dekodieren, 297
Dellingers Virii, 199
Dependency Walker, 211
dezentralisierbare Daten, 296
dezentralisiert, 296
digitale Signalsynthese, 226
digitale Spur, 114, 116
digitalisierte Spuren, 3
Distanz
euklidische (quadr.), 242
euklidische (skaliert), 242
Informationsdistanz, 242
Levenshtein, 242
DNA
allgemein, 89
degradierte, 97
Intelligenz, 95
low-template, 97
Marker, 92
mtDNA, 91
Profil, 90
Satelliten, 94
Dokumentationspflicht, 295
319
DOS/Cascade, 207
Doyle, 19
Draper, 3
dringender Tatverdacht, 276
Drive-Slack, 132
Drohne, 81
Dropbox, 148, 279, 297
Dropper, 202
Dropzone, 203
DumpIt, 122
Durchsicht, 278
Durchsuchung, 266
Durchsuchung bei Dritten, 276
Durchsuchungsbeschluss, 296
E
einfache Verdacht, 276
Eingriffsbefugnisse, 274
Eingriffsvoraussetzung, 293, 294
elektronische Speichermedien, 297
elektronische Terminkalender, 288
elektronischer Datenträger, 296
Elektropherogramm, 91
Elk Cloner, 199
E-Mail, 268, 277, 295
E-Mail-Postfach, 269
E-Mail-Verkehr, 277
Endgerät, 269, 287
GSM, 285
UMTS, 285
Entropie, 138, 208
Entschlüsselungssoftware, 288
Entwurf-Ordner, 278
Entwurfstadiums, 277
ePass, 31
Ereignisort, 8
Erfahrungswissen, 283
Ermittlungsansatz, 295
Ermittlungsbefugnisse, 294
Ermittlungsbehörden, 271, 287, 290, 291, 297
Ermittlungsgeneralklausel, 287
Ermittlungspersonen, 276
euklidische Distanz
quadratisch, 242
skaliert, 242
Europäische Union, 298
Europarates, 297
EVCs, 103
Event Sequence Analysis, 218
320
EWF-Format, 129
ewfquire, 131
externe Server, 278
externe Speichermedien, 296
F
Fahrzeughacks, 12
Fax, 268
Fernmeldegeheimnis, 278–280
Fernmeldeverkehr, 280
Fernschreibdienst, 277
File-Slack, 132
Fingerabdruck, 39
CCD-Sensor, 41
Minutien, 43, 48
Offline-System, 41
Online-System, 41
Papillarlinien, 40
Siliziumsensoren, 41
Ultraschallwellsensoren, 42
FKTImager, 130
FLARE Toolkit, 211
FLIRT, 211
flüchtige Spuren, 9
Forensic Science, 5
forensically sound, 120
Forensik, 5, 92
forensische Dateiformate, 128
forensische Wissenschaft, 1
Fork-Bomb, 202
Formantanalyse, 225
Formantfrequenzen, 229
Formspuren, 28
Fotogrammetrie, 16
Fouriersynthese, 226
fragmentarischer Strafrechtsschutz, 292
Freefloat FTP, 205
Frequency Domain Scrambling, 231
Frequenzspektrum, 223
Funktion
identische Funktion, 257
Sigmoidfunktion, 257
Transferfunktion, 257
Funkzelle, 281
Fußabdruck, 33
Fuzzy-Methoden, 239, 251
G
Gefahr in Verzug, 276
Sachverzeichnis
Gefahrenabwehr, 265, 267
Gegenstandsspuren, 28
Geheimhaltungsinteresse, 266
Gennat, 3
Genotypisierung, 90
Genvarianten, 100
Gerätekennung, 285, 287
Gericht, 280
gerichtliche Beschlagnahmeanordnung, 276
Gesetzesvorbehalt, 276
Gesichtsmerkmale, 67, 70, 74, 77, 79
Gesichtsweichteilrekonstruktion, 62, 64
computergestützt, 61, 66, 69, 71, 79
Definition, 59, 60
klassisch, 61, 65, 79
Prozessüberblick, 70
Geständnis, 275
Grey-Hat, 4
Grundrechte, 274, 291
Grundrechtseingriff, 291
grundrechtsgleiche Recht auf Gewährleistung
der Vertraulichkeit und Integrität
informationstechnischer Systeme, 289
grundrechtsgleiche Recht auf informationelle
Selbstbestimmung, 281, 284
Grundrechtsschutz, 281, 290
guymager, 131
H
Hacker, 3
Hackerattacke, 3
Hacking, 3
Haplogruppe, 101
Haplotyp, 101
Hardware Damaging Malware, 202
Hash, 270
Hashfunktion, 126
Hash-Verfahren, 13
Hauptverhandlung, 276
heimliche Ermittlungsmaßnahmen, 292
heimliche Überwachungsmaßnahme, 274
heimlicher Zugriff, 278
Herausgabe, 280
Herausgabeverlangen, 270
Herunterladen, 277
Hoheitsbefugnisse, 298
Hoheitsgebiet der Bundesrepublik Deutschland,
296
Hör- und Sprachverständlichkeit, 217
Sachverzeichnis
Hype-Cycles, 12
Hypothesenzyklus, 11
I
IDA Pro, 211
Identifikation, 26
identische Funktion, 257
Identitätsklau, 3
If-A-New Infektion, 210
Image, 13, 270
IMEI, 285, 287
IMSI, 287
In Code Integration, 209
Indizien, 21
Information
elektronisch gespeichert, 266
informationelle Selbstbestimmung, 294
Informationsdistanz, 242
Informationsextraktion, 177
Definition, 173
ontologiebasiert, 173
Informationsgehalt, 274
informationstechnisches System, 293
Informationstechnologie, 270
Inhalte
private, 273
INPOL, 52
Instant-Messaging, 150
Instruction Substitution, 209
internationale Terrorismus, 295
Internet, 291
Internetprotokoll, 277
Internettelefonie, 277, 286
intranationale Geltung, 298
Inverwahrungnahme, 276
IP-Adresse, 281, 287
Iris, 36
Code, 38
Iriserkennung, 36
Irismuster, 36
IT-Forensik, 114, 117
J
John Aycock, 201
juristischen Wissenschaft, 17
K
Kapillarelektrophorese, 91
Katalogtat, 267, 280
321
Kategorizierung
Text, 182
Ken Thompson, 202
Kennungsdaten, 298
Kernbereich privater Lebensgestaltung,
273–275, 283, 284, 293
Kernbereichsschutz, 280
Klassifikation
Learning Vector Quantization (LVQ), 256
prototypbasiert, 255
Support-Vektor-Maschine (SVM), 260
vektoriell, 255
Klassifikationslernen, 243, 258
Klassifikationsmodell, 243, 255
Klassifizieren, 240
kodiert, 287
Kollisionsresistenz, 126
Kolmogorov-Komplexität, 242
Kommunikationsvorgang, 281, 286
Konversation
Bewertung, 193
Detektion, 190
Kopierbarkeit, 9
Kopierprogramm, 288
Korrelationsähnlichkeit, 242
Kreditkartennummer, 288
Kriminalistik, 5
Kriminalprävention, 6
Kriminaltaktik, 5
Kriminaltechnik, 6
Kriminalwissenschaft, 5
kriminelle Netzwerke, 291
kriminelle Vereinigungen, 291
Kriminologie, 6
künstliche Neuronale Netze, 239
KY-Index, 35
L
Längenpolymorphismen, 94
STR, 91
Lauschangriff, 290
Learning Vector Quantization (LVQ), 256
leitungsgebundene Übermittlung, 277
Lempel-Ziv-Algorithmus, 243
Levenshtein-Distanz, 242
LIME, 122
Live-Response-Analyse, 119
Locard, 2, 18
Locard’sche Prinzip, 28
322
Logic Bomb, 201
lokale Rechner, 278
Lokus, 91
Löschungspflichten, 294
M
Mailbestand, 278
Mailbox-Betreiber, 285
Mailpot, 205
Maltego, 154, 155
Malware Builder, 203
Manipulation, 289
Manipulierbarkeit, 9
Massenkommunikationsmittel, 291
Maßnahme
mildere, 270, 290
Materialspuren, 28
MD5, 126
Menschenwürde, 274, 275, 292
Messengerdienst, 150
Metamorphie, 206
Mikrocontroller, 235
MIT, 3
Mixer, 164
Mobile Network Analyzer, 188
Mobilfunk, 277, 281, 291
Mobilfunkbetreiber, 285
Mobiltelefon, 266, 285, 288
Molekulargenetik, 89
Morphotyp, 100
Morris-Wurm, 199
Multilingualismus, 175
Mustererkennung, 240
N
Nachrichtendienst, 295
Nachrichtenübermittlung, 268
Vorgang, 269
Namenskonventionen für Malware, 205
Netzwerk, 296
Neural Gas (NG), 246
neuronale Netze (künstliche), 239
NGS, 91
Nichtbeschuldigten, 276
nichtvektorielle Daten, 241, 258
Nichtverdächtige, 284
Nullhypothese, 14
numerus clausus, 281
Sachverzeichnis
O
Obfuscation, 208
Odroid, 205
Offener Zugriff, 278
Offline-Entwurf, 278
Oligomorphie, 206
Online-Dienste, 285
Online-Durchsuchung, 21, 265, 278, 286, 288,
290, 293, 294, 296
Ontologie, 172, 179
Open-Source-Software, 13, 16, 61, 66, 69, 70,
78–81
Blender, 67, 74, 75, 77, 79–81
CMPMVS, 66, 71, 72, 80
MeshLab, 66, 67, 74
Oberflächenrekonstruktion, 66, 71, 72, 74
VisualSfM, 66, 71, 72, 80
Order of Volatility, 117
Ordnungsgeld, 285
Ordnungshaft, 285
Organisationssystem, 19
OSINT, 154
P
Partition-Slack, 134
Partitionstabelle, 134
Passwort, 288
passwortgeschützt, 278, 279
Payload, 201
PCR, 89
PEdump, 210
Peer-to-Peer, 156
persistente Daten, 9
PEview, 210
Phänotyp, 95
HIrisplex, 97
IrisPlex, 96
Physiognomie, 33
Physische Medienanalyse, 132
Polizeibeamte, 276
polizeiliche Ermittlungsbeamte, 280
Polymorphie, 206
Popper, 18
Post- und Fernmeldegeheimnis, 268, 276
Postbeschlagnahme, 278–280
Post-mortem-Analyse, 125
präventiv-gefahrenabwehrrechtliche
Online-Durchsuchung, 293
Predictive Policing, 2, 13
Sachverzeichnis
Process Monitor, 206
Processexplorer, 206
Profiling, 2
Prototyp, 240, 244
prototypbasierte Klassifikation, 255
prototypbasierte Methoden, 240, 244
prototypbasierter Clusteralgorithmus, 245
Prototypenadaption, 244
Provider, 268, 269, 278–281
E-Mail, 277, 278, 280
Internet-Access, 285
Prüfsumme
kryptographische, 270
Q
quadratische euklidische Distanz, 242
Quellen–Telekommunikationsüberwachung,
286
R
Rabbit, 201
RAM-Slack, 132, 133
randotypisch, 31
Ransomware, 202
Rat, 201
Raub, 282
RAW-Format, 128
Rechner, 266
Rechtshilfeersuchen, 278, 297
Rechtsmittel, 21
Rechtsschutzmöglichkeiten, 276
Rechtsstaat, 293
Rechtssystem, 17
Register Reassignment, 209
Regressionsanalyse, 243
Regressionslernen, 244
Relevanzlernen, 258
Relevanzprofil, 259
Remote Forensic Software, 286
Richtervorbehalt, 292
Rootkit, 201
Ruhen der Telekommunikation, 279
S
Sachverhaltsermittlung, 283
SAP, 10
Scalpel, 139
schwere Straftat, 277, 281
Schwerkriminalität, 274
323
Schwerstkriminalität, 292
Script Kiddies, 4
Selbstbelastungsfreiheit, 285
Self-Organizing Map (SOM), 248
Semantik, versteckt, 172, 179
semipersistente Daten, 9
Sequenzpolymorphismen, 94
Server, 280, 290
SHA1, 126
SHA2, 126
Sicherstellen, 278
Sicherstellung, 267
Sicherstellungsanordnung, 298
Sicherung digitaler Spuren, 118
Sicherungskopien, 270, 271
Sicherungsstrategie, 120
SIFT, 66, 72
Sigmoidfunktion, 257
SIM-Karte, 285
Singularitäten, 43
Delta, 43
Schleife, 43
Wirbel, 43
Situtionsspuren, 28
Skype, 286
Slackbereich, 133
Sleuth Kit, 134
Smartphones, 266
SMS, 186, 268
inkriminiert, 187
SNPs, 91
AISNPs, 94
IISNPs, 94
LISNPs, 94
PISNPs, 95
Speicherabbild, 118, 120
Speichermedien, 278, 293
Speichern, 277
Spektrogramm, 223
Spionage-Software, 278
Sprachnachrichten, 268
Sprachübertragung, 286
Spur, 8, 17
Spurenansatz, 295
Spurenkunde, 90
Spyware, 202
SQLite, 144, 152
staatliche Kontrolle, 292
Staatsanwaltschaft, 20, 276, 280, 285
324
Standardschnittstelle, 285
Strafantrag, 284
Strafanzeige, 284
strafrechtliches Ermittlungsverfahren, 284
Straftat
schwere, 269, 282
Straftatenkatalog, 282
Strafverfahren, 20
Strafverfolgung, 267, 280, 293, 295
Strafverfolgungsbehörde, 278, 285, 291
Stuxnet, 202
Subroutine Reordering, 209
Subsidiaritätsgrundsatz, 295
Subsidiaritätsklausel, 283
Support-Vektor-Maschine (SVM), 260
Surfverhalten, 288
Sysinternals Suite, 206, 210
Systemdaten, 9
T
Tagebuch, 273
Tagebuchaufzeichnungen, 275
tamper-evident, 119
Tatablaufsimulation, 14, 19
Tatbegehung, 20
Täter, 269, 271, 277, 283, 285, 291, 292
Täterschaft, 20
Täterschutz, 274, 294
Tatmittel, 291
Tatort, 2, 7, 113, 291
Tatortrekonstruktion, 79–81
computergestützt, 79, 80
Tatrekonstruktion, 14
Tatverdacht, 292
Anfangs-, 284
Tatverdächtiger, 266
Tatvorwurf, 272
Teilnehmer, 269, 277
Anstifter, 269, 277
Gehilfe, 269, 277
Mittäter, 269, 277, 288
Teilnehmeridentifikationsnummer, 287
Telefaxdienst, 277
Telegramme, 277
Telekommunikation, 278
Gerät, 268
Vorgang, 268, 269, 278–281, 287
Telekommunikationsdienst, 287
Telekommunikationsdienstleister, 285
Sachverzeichnis
Telekommunikationsgesetz, 277
Telekommunikationsüberwachung, 276, 293
Telekommunikationsunternehmen, 284, 285
territoriale Souveränität, 298
Terrorismusbekämpfung, 267, 294
Terroristen, 291
Text
forensisch, 172
inkriminiert, 170
TK-Diensteanbieter, 279
TK-Dienstleister, 278
TK-Vorgang, 279
Top-Down-Prozess, 16
Topic Map, 175
Totanalyse, 125
Transferfunktion, 257
Trojaner, 201, 288
Trojanisches Pferd, 288
Trowing Star LAN Adapter, 204
Typisierung, 91
U
UAV, 12
Übereinkommen über Computerkriminalität,
278
Überführung, 297
überragend wichtiges Rechtsgut, 294
überwachtes Lernen, 244
Überwachungsmaßnahme, 283
Unähnlichkeit, 241
unsauberer Jump, 210
Unschuldsvermutung, 267
unüberwachtes Lernen, 244
Unverletzlichkeit der Wohnung, 290
unverschlüsselte Daten, 286
UPX, 207
Urheberrecht, 271
V
vektorielle Daten, 240, 258
vektorielle Klassifikation, 255
vektorieller Clusteralgorithmus, 245
Vektorquantisierung, 244, 255
Verbrechen, 7
verdeckter Zugriff, 280
Verdunkelungsgefahr, 288
verfahrensrelevante Informationen, 274
Verhältnismäßigkeitsgesichtspunkt, 270, 271,
275
Sachverzeichnis
Verhältnismäßigkeitsgrundsatz, 267, 275, 276
Verhältnismäßigkeitsprüfung, 275
Verifikation, 26
Verkehrsdaten, 281, 287
Vernehmungsmethode, 22
verschlüsseln, 271
Vertragspartei, 298
viktimodogmatisch, 282
Virtualisierung, 121
virtuelle Spuren, 8
Virus, 201
Virus-Total, 205
Visualisierung, 248
Voice over IP, 277
Voice-over-IP-Kommunikation, 286
Vokaltrakt, 228
Volatility Framework, 123
völkerrechtlich, 298
Vorbereitungsort, 8
vorläufige Datensicherung, 278
W
Wahrscheinlichkeit, 17
Wandboard, 205
Webdienst, 297
Webmail-Service, 277
Weichteilmarker
anatomische, 61, 62, 65, 68, 74, 77
325
Weysflog-Index, 35
WhatsApp, 151, 152
White-Hats, 4
WikiLeaks, 4
Wirtschaftsstraftäter, 291
Wissenschaft, 17
Wohnraumüberwachung
akustische, 275, 290, 295
visuelle, 295
Wohnungsdurchsuchung, 289
Wurm, 201
X
Xbox-Kinect, 16
Xerox Worms, 199
Z
Zeittransposition, 233
Zeus Trojaner, 203
Zufallserkenntnisse, 295
Zugangsdaten, 288
Zugangsgerät, 297
Zugangskode, 297
Zugangssperre, 288
zureichende tatsächliche Anhaltspunkte, 284
zwischengespeichert, 278
Zwischenspeicher, 269, 277
springer.com
Willkommen zu den
Springer Alerts
••
Unser Neuerscheinungs-Service für Sie:
aktuell *** kostenlos *** passgenau *** flexibel
Springer veröffentlicht mehr als 5.500 wissenschaftliche Bücher jährlich in
gedruckter Form. Mehr als 2.200 englischsprachige Zeitschriften und mehr
als 120.000 eBooks und Referenzwerke sind auf unserer Online Plattform
SpringerLink verfügbar. Seit seiner Gründung 1842 arbeitet Springer
weltweit mit den hervorragendsten und anerkanntesten Wissenschaftlern
zusammen, eine Partnerschaft, die auf Offenheit und gegenseitigem
Vertrauen beruht.
Die SpringerAlerts sind der beste Weg, um über Neuentwicklungen im
eigenen Fachgebiet auf dem Laufenden zu sein. Sie sind der/die Erste,
der/die über neu erschienene Bücher informiert ist oder das Inhaltsverzeichnis des neuesten Zeitschriftenheftes erhält. Unser Service ist
kostenlos, schnell und vor allem flexibel. Passen Sie die SpringerAlerts
genau an Ihre Interessen und Ihren Bedarf an, um nur diejenigen Information zu erhalten, die Sie wirklich benötigen.
Mehr Infos unter: springer.com/alert
A14445 | Image: Tashatuvango/iStock
Jetzt
anmelden!