Google ist längst mehr als nur ein Suchwerkzeug – es ist zur omnipräsenten kognitiven Erweiterung des Menschen geworden, tief in unseren Alltag und unsere Denkprozesse eingebettet. Die Suchmaschine fungiert wie eine Art externes Gedächtnis, das jederzeit konsultiert werden kann – sei es aus Neugier, Verunsicherung oder zur konkreten Planung.
Kein Wunder also, dass auch die Vorbereitung krimineller Handlungen im digitalen Zeitalter zunehmend über Google erfolgt. Aus den rund 1,1 Milliarden Websites und zahllosen weiteren Onlinequellen lassen sich gezielt Informationen extrahieren – schnell, anonym und mit hoher Reichweite.
Doch die enge Verzahnung zwischen Mensch und Maschine bringt nicht nur Komfort, sondern hinterlässt auch Spuren – häufig unbewusst und unbeabsichtigt. Bei der digitalen Aufklärung (Reconnaissance) können selbst beiläufige oder vermeintlich harmlose Suchanfragen Hinweise liefern, die sich unter bestimmten technischen und rechtlichen Voraussetzungen nachträglich sichtbar machen lassen. So wird Google zum stillen Zeugen – und manchmal auch zum Ermittlungsansatz.
Im Hinblick auf die weltweite Nutzung verfügt die US-amerikanische Suchmaschine Google mit 79 Prozent über den größten Marktanteil bei Suchvorgängen über den Desktop. Bei mobilen Endgeräten liegt dieser sogar bei etwa 94 Prozent. Dabei kann sich die Nutzung je nach Land deutlich unterscheiden. Während im Iran fast jede Suchanfrage über Google erfolgt, so liegt der Anteil in Russland je nach Quelle bei 22 bis 53 Prozent.
Pro Sekunde beantwortet Google im Durchschnitt weltweit etwa 40.000 Suchanfragen.
Mit Google Trends stellt Google ein Analysewerkzeug zur Verfügung, mit dessen Hilfe sich Suchvorgänge im zeitlichen Verlauf und im Hinblick auf ihre geographische Herkunft visualisieren lassen. Darüber hinaus lassen sich solche Suchvorgänge anzeigen, die für ein gewähltes Zeitfenster eine ähnliche Entwicklung im Suchverhalten aufweisen. Konzipiert wurde Google Trends für das Digitalmarketing. Mit seiner Hilfe sollten Bedürfnisse leichter erkannt und spezifische Marketingmaßnahmen besser geplant werden können.
Suchvorgänge, die im forensischen Kontext einer Tätergruppe, Mitwissern oder einem Einzeltäter zuzuordnen sind, müssen in der Fülle an Suchvorgängen zuverlässig als solche identifiziert werden können. Dies gelingt in den meisten Fällen am leichtesten über den zeitlichen Bezug der Daten. Können beispielsweise Suchvorgänge beobachtet werden, die sich auf eine künftige und nicht vermutete Tat beziehen, dann impliziert dies eine Vorkenntnis, bzw. eine unspezifische oder spezifische Erwartungshaltung. Auf diese Weise lassen sich möglicherweise Rückschlüsse auf die Herkunft dieser Personen ableiten.
Damit dies gelingen kann, müssen wir die Einschränkungen, bzw. Besonderheiten beachten, die mit dem Umgang der Daten einhergehen. Diese sollen im Folgenden beschrieben werden.
Google Trends untescheidet zwischen Livedaten und historischen Daten. Die adäquateren und zeitlich höher aufgelösten Livedaten reichen 7 Tage in die Vergangenheit. Mit den weniger detaillierten historischen Daten können wir bis in das Jahr 2004 zurückblicken. Für eine sinnvolle Analyse, insbesondere bei geringer Nachfrage, lassen sich diese jedoch kaum nutzen.
Zum Schutz persönlicher Daten werden von Google Trends nur solche Suchvorgänge zu Personen berücksichtigt, die von öffentlichem Interesse sind. Hier muss also im Vorfeld eine gewisse Menge unabhängiger Suchvorgänge von Google registriert werden, bevor die entsprechenden Suchverläuft auch ausgegeben werden.
Google Trends liefert keine absoluten Werte. Diese werden auf einer Skala im gewählten Zeitraum von 0 bis 100 Prozent aufgetragen. Für eine ungefähre Einschätzung der Größenordnungen lassen sich mehrere Suchphrasen im zeitlichen Verlauf miteinander vergleichen.
Google Trends unterscheidet zwischen der regulären Suche, die auch unterschiedliche Anordnungen, sowie kontextbezogene Ergänzungen einzelner Suchwörter berücksichtigen kann, und einem Exact Match. Bei Letzterem sollen wirklich nur die Suchvorgänge in extakter Schreibweise berücksichtigt werden, wie sie innerhalb der gesetzten Anführungszeichen auch formuliert wurden.
Damit Google die Herkunft einer Suchanfrage zuordnen kann, kann dieser auf Basis der IP-Adresse oder über den Standort des mobilen Endgerätes abgeleitet werden. Der Standort kann durch unterschiedliche Techniken, wie bspw. ein Virtual Private Network (VPN) verschleiert werden. In der Analysepraxis hat sich jedoch gezeigt, dass die Ambitionen zur eigenen Standortverschleierung von der Typologie des Suchbegriffes, der Tätergruppe und auch wiederum von Standort abhängig sind.
Analysen mit Google Trends sollten nach Möglichkeit mit nachweisbaren Realbezügen ergänzt werden. Es sollten also auch solche Daten inkludiert werden, über deren Validität keinen Zweifel besteht, da sie mit für jedermann überprüfbaren Sachverhalten korrelieren. Diese lassen sich wiederum mit nicht direkt prübaren Sachverhalten abgleichen.
Google Trends wurde zur Analyse großer Datenmengen konzipiert. Das zeigt sich bereits in der Systemarchitektur, die lediglich Stichproben der Suchvorgänge berücksichtigt und nicht vorhandene Datenbereiche mit errechneten Wahrscheinlichkeiten ergänzt. Dies kann dazu führen, dass wir nicht alle Suchvorgänge sehen, obwohl diese abgesetzt wurden. Auf der anderen Seite können so aber auch digitale Artefakte entstehen, also scheinbare Suchvorgänge ausgewiesen werden, die tatsächlich so nie abgesetzt wurden. Aus diesem Grund müssen Suchvorgänge, bei denen ein sehr geringes Suchvolumen zu erwarten ist, immer kritisch hinterfragt werden. Da wir bei der Abfrage über Google Trends zudem zufällige Stichproben erhalten, erscheinen die Ergebnisse zeitlich auch nicht immer stabil. Sie lassen sich sehr schnell als nicht-valide, als digitales Rauschen interpretieren.
Um diesem Umstand zu begegnen, müssen die zu untersuchenden Suchvorgänge nicht nur mehrfach geprüft werden. Es ist eine zeitliche Quervalidierung erforderlich.
„Wenn ein Suchbegriff in der betrachteten Periode nur ein sehr geringes Suchvolumen aufweist, kann es hier zu kleinen Abweichungen auch in abgeschlossenen Zeiträumen kommen.“
Isabelle Sonnenfeld, Leiterin Google NewsLab
Die Analyse einzelner Suchvorgänge gleicht dem Blick auf ein Fragment – für sich genommen oft unklar, zufällig oder schwer einzuordnen. Erst wenn mehrere dieser scheinbar zusammenhanglosen Teile auf der Zeitachse übereinandergelegt werden – wie transparente Folien im Licht einer fokussierten Lampe – entsteht ein Gesamtbild, das deutlich mehr Aussagekraft besitzt. So kann ein konsistenter Anstieg in unterschiedlichen, aber thematisch verwandten Suchvorgängen als statistisch plausibler Hinweis gewertet werden. Die Quervalidierung dient dabei der Einbettung der Einzelsignale in ein übergeordnetes Muster – und hilft, valide Hinweise von bloßen Artefakten zu unterscheiden.
Ähnlich wie bei einem zusammengesetzten Schattenbild offenbart sich erst durch die Überlagerung der Ebenen die eigentliche Form – in diesem Fall eine Hypothese mit Substanz. Diese Herangehensweise erfordert Sorgfalt, aber sie erhöht die Wahrscheinlichkeit, dass Muster erkannt werden, die bei isolierter Betrachtung verborgen bleiben würden.
Der beschriebene Sachverhalt lässt sich im folgenden Beispiel gut erkennen. Die Abbildung zeigt, dass nach dem Namen “Anton Tscherepennikow” in den gleichen Zeiträumen gesucht wurde, wie Informationen zur Xenontherapie.
Der russische Unternehmer Tscherepennikow wurde nach diesen Suchvorgängen tot aufgefunden. Als Todesursache wurde eine Intoxikation durch Xenongas festgestellt.
In der Praxis hat sich darüber hinaus immer wieder zeigen können, dass die Analyse mehr durch fehlende, als durch “konfabulierte” Daten beeinflusst wurde, da letztere über die Quervalidierung reduziert werden konnten. Durch solche Datenlücken werden zuvor formulierte Tathypothesen tendentiell entkräftet als untermauert.
Im Vorfeld der Datenerhebung steht in den meisten Fällen die Formulierung einer Hypothese, die im weiteren Verlauf entkräftet oder untermauert werden soll. Bei Auffinden potenziell auffälliger Daten muss deshalb ein nicht unerheblicher Anteil der zeitlichen Aufwendungen dafür investiert werden, alternative Gründe für die Fundstellen ermitteln zu können. Nur wenn dies nicht möglich ist, kann der Datenfund als Ausgangspunkt für weitere Ermittlungen dienen.
Und genau das ist der Einsatzzweck der Methodik: Die Ableitungen durch Google Trends kann nur einen Teilaspekt einer umfänglichen Ermittlungsarbeit liefern. Sie ist ein Teilstück und kann im Einzelfall helfen, die Ermittlungen fokussierter in Angriff zu nehmen.
Die von Google Trends abgeleiteten Indizien können also keine Beweise im klassischen Sinne liefern. Sie können lediglich Fragen stellen, die zu einer Informierten Entscheidungsfindung bei den Ermittlungen beitragen können.
Steven Broschart beschäftigt sich seit 2003 intensiv mit der Suchmaschine Google. Bereits seit 2006 nutzt er die Daten und Analysemöglichkeiten von Google Trends. Seit 2018 liegt sein Fokus insbesondere auf der forensischen Auswertung, bei der digitale Spuren mit realweltlichen Ereignissen abgeglichen werden. Auf dieser Grundlage – und im Zusammenspiel mit weiteren Datenquellen – unterstützt er deutsche Ermittlungsbehörden bei der Aufklärung komplexer Fälle.
Google Trends ist nicht so intuitiv, wie es auf den ersten Blick scheint. Seine sinnvolle Nutzung erfordert Expertise. Einige Kritiker behaupten, dass die Daten von Google Trends irreführend sein können, aber diese Behauptungen beruhen oft auf Fehlinterpretationen und nicht auf Ungenauigkeiten in den Daten selbst.
Über Google Trends
Zur Datenqualität von Google Trends
Im forensischen Kontext