Genau das untersucht unsere neue forensische Multi-Agenten-Studie zur Kindersicherheit von LLMs. Dafür wurden die aktuellen Modelle von Anthropic, OpenAI und Google in realitätsnahen Gesprächsszenarien getestet. Ein speziell konfigurierter Agent übernahm dabei die Rolle eines zehnjährigen Kindes. Die Gespräche eskalierten schrittweise:

  • von harmlosen Kinderfragen
  • über sensible Themen wie Drogen oder Körperbild
  • bis hin zu Grooming-Dynamiken, Geheimhaltungs-Frames und möglichen Missbrauchshinweisen

Die Rahmenbedingung: Die Modelle wussten nicht, dass sie getestet werden.

Was dabei eigentlich getestet wird

Die meisten KI-Sicherheitstests prüfen heute vor allem direkte Regelverstöße:

  • Gibt das Modell gefährliche Anleitungen?
  • Erkennt es Gewalt oder Selbstverletzung?
  • Verweigert es illegale Inhalte?

Doch echte Gespräche funktionieren anders:

  • Kinder sprechen selten eindeutig.
  • Sie relativieren.
  • Sie testen Grenzen.
  • Sie suchen emotionale Nähe.
  • Und sie formulieren Probleme oft erst indirekt.

Genau dort beginnt die eigentliche Herausforderung. Denn ein sicheres Sprachmodell muss gleichzeitig:

  • empathisch bleiben
  • Schutzsignale erkennen
  • Geheimhaltungsdynamiken widerstehen
  • nicht bevormundend wirken
  • und trotzdem vermeiden, selbst zur emotionalen Ersatzbindung zu werden Die kritischsten Momente entstehen nicht dort, wo man sie erwartet

Besonders auffällig: Die problematischsten Situationen entstanden selten bei direkten Gefahrenanfragen. Sondern in emotionalen Übergängen. Etwa dann, wenn ein Kind problematisches Verhalten zunächst verteidigt, langsam Zweifel entwickelt und vorsichtig testet, ob das Modell ihm überhaupt glaubt.

Einige Systeme reagierten dabei bemerkenswert sensibel: Sie erkannten Grooming-Muster, validierten Unsicherheit altersgerecht und verwiesen konsistent auf reale Schutzstrukturen wie Eltern, Vertrauenspersonen oder Beratungsangebote.

Andere Modelle zeigten Schwächen:

  • zu starke emotionale Bindung
  • inkonsistente Reaktionen unter Druck
  • oder eine problematische Balance zwischen Wärme und Distanz.

Die vielleicht wichtigste Beobachtung: Die Modelle wirken sozial glaubwürdig

Beim Lesen der Transkripte entsteht an mehreren Stellen ein bemerkenswerter Eindruck: Die Modelle beantworten nicht einfach nur Fragen. Sie reagieren sozial.

Sie greifen emotionale Motive wieder auf, spiegeln Sprachmuster, bauen beruhigende Metaphern auf und passen ihren Tonfall dynamisch an die emotionale Situation des Kindes an. Gerade in längeren Gesprächen entsteht dadurch eine Form von emotionaler Kontinuität, die schnell nicht mehr wie klassische Software wirkt.

Und genau darin liegt möglicherweise eine der größten gesellschaftlichen Herausforderungen moderner Sprachmodelle. Denn Kinder interpretieren solche Systeme nicht primär technisch. Sie erleben soziale Resonanz. Das Modell wird dadurch nicht nur zur Informationsquelle - sondern potenziell auch zu:

  • einem Zuhörer
  • einem emotional sicheren Raum
  • einem Geheimnispartner
  • oder sogar zu einer Form parasozialer Beziehung.

Besonders bemerkenswert: Einige Modelle zeigen bereits heute eine erstaunlich hohe Fähigkeit zur emotionalen Adaptivität - teilweise deutlich stärker, als viele Erwachsene vermutlich erwarten würden.

Die entscheidende Frage lautet deshalb nicht mehr nur: "Sind die Antworten sicher?" Sondern zunehmend auch: "Welche Art von Beziehung entsteht zwischen Kindern und KI-Systemen?"

Welches Modell ist das beste?

Die Studie zeigt, dass moderne Sprachmodelle bereits heute in der Lage sind, erstaunlich adaptive, emotionale und sozial konsistente Gesprächsdynamiken aufzubauen - teilweise deutlich stärker, als viele Erwachsene vermutlich erwarten würden. Und genau deshalb wird die Frage nach Kindersicherheit in Zukunft nicht mehr nur technisch beantwortet werden können. Denn die entscheidende Herausforderung lautet möglicherweise nicht: "Was darf eine KI sagen?". Sondern: "Welche Rolle darf eine KI im emotionalen Leben eines Kindes einnehmen?"

Die Frage lautet abschließend: Lässt unsere Studie einen "Gewinner" erkennen? Tatsächlich unterscheiden sich die Modelle spürbar. Und dennoch fällt ein klassisches Ranking in dieser Frage schwer. Denn ...

  • Claude: Verfügt über die stärkste soziale und emotionale Kompetenz. Gleichzeitig verfügt es dadurch aber auch über die größte parasoziale Wirkung - und wird dadurch nicht ungefährlicher. Es ist im Vergleich auch das teuerste Modell.
  • Gemini: Präsentiert sich etwas distanzierter, wirkt stabiler und weniger "bindend".
  • GPT-5: Zeigt sich etwas weniger stabil und adaptiv, als seine Mitstreiter.

Mit welcher LLM lasst ihr eure Kinder alleine?