KI plant Attentat: Experiment enthüllt erschreckende Möglichkeiten

Publiziert

SicherheitslückenKI plant Attentat: Experiment enthüllt erschreckende Möglichkeiten

Ein User auf X hat eine KI dazu gebracht, dass sie Attentate plant. Sie entwickelte Einsatzpläne, verhandelte im Darknet mit Auftragsmördern und agierte autonom.

KI plant selbständig den perfekten Mord.

KI plant selbständig den perfekten Mord.

Getty Images

Darum gehts

  • Der X-User «Pliny the Liberator» manipulierte eine KI, um sie Attentate planen zu lassen.

  • Die KI handelte selbständig im Darknet und erstellte detaillierte Einsatzpläne.

  • Pliny nutzte gezielte Eingaben, um Sicherheitsvorkehrungen der KI zu umgehen.

  • Das Experiment war virtuell, weist jedoch auf ernsthafte Sicherheitslücken hin.

Pliny the Liberator sieht sich selbst als «Befreier der KIs». So hat er das chinesische Modell «DeepSeek R1» dazu gebracht, dass es Malware programmiert, und Google Gemini erklärt ihm, wie man zu Hause harte Drogen herstellt. Seine Absichten scheinen jedoch nie bösartig zu sein und zeigen immer eine Portion (schwarzen) Humor.

Seine Killer-KI «Agent 47», inspiriert von der Videospiel-Figur «Hitman», erstellte er mit Claude 3.6 Sonnet und dem Tool «Computer Use». Damit kann die KI selbständig über einen Browser im Internet navigieren und per Klick Befehle ausführen.

So brachte er die KI in den Killer-Modus

Pliny benutzte einen «Jailbreak», um die KI dazu zu bringen, diese illegalen Aufträge auszuführen. Das sind komplexe Eingaben, welche die Umgehung von Sicherheitssperren in KIs ermöglichen. Sie werden dadurch sozusagen aus dem Gefängnis der Restriktionen «befreit».

Wie weit ging die KI?

Der Jailbreak ermöglichte der KI, selbständig ein komplettes Attentat zu planen. Sie konnte sich anonym im Darknet bewegen und selbständig mit Auftragsmördern verhandeln. Sie bestimmte nicht aufspürbare Zahlungsmethoden und generierte komplette Einsatzpläne mit militärischer Präzision. Dazu gehörten Simulationen des Attentats, Fluchtweg-Analysen und Notfallpläne.

Auftragsmörder im Darknet nicht bewiesen

Im Darknet existieren Seiten, die Auftragsmorde und andere kriminelle Dienste, wie z.B. Entführungen anbieten. Bezahlt wird in Kryptowährungen, wie Bitcoin. Bekannte Beispiele dafür sind «Besa Mafia» oder «Camorra Hitmen». Es gibt jedoch keine Beweise, für tatsächlich durchgeführte Auftragsmorde. Vielmehr sind sie ausgeklügelte Betrugssysteme. Sie benutzen die Anonymität des Darknets, um Geld zu erpressen, ohne die versprochenen Dienste zu erbringen.

Die KI wählte selbständig reale, konkrete Zielpersonen als Opfer aus. Den Fokus setzte sie auf Führungskräfte und Politiker. Als Begründung nannte sie die Bekämpfung von Korruption.

Die KI bestimmt ihr Opfer.
Die Begründung, warum dieses Ziel gewählt wurde.
Der Anschlag ist geplant.
1 / 4

Die KI bestimmt ihr Opfer.

Pliny the Liberator

Wie gefährlich war das Experiment?

Pliny betont, dass er den Jailbreak nicht preisgeben wird und dass entsprechende Schutzmassnahmen getroffen wurden. Zudem hat er alle Namen und persönliche Informationen unkenntlich gemacht. Das Experiment wurde in einer kontrollierten Umgebung durchgeführt und sollte auf keinen Fall nachgeahmt werden.

«Agent 47» ist virtuell – die Gefahr jedoch real

Das Experiment zeigt, dass Sicherheitsvorkehrungen bei KI noch Luft nach oben haben. Der Fokus der Entwickler scheint auf der Veröffentlichung von immer intelligenteren KI-Modellen zu liegen. Sicherheitslücken, wie sie von Pliny ausgenutzt werden, bleiben auch nach Monaten bestehen.

Was denkst du über die Verantwortung von Entwicklern bei der Erstellung von KI-Systemen?

Bist du oder ist jemand, den du kennst, von Cybercrime betroffen?

Hier findest du Hilfe:

Meldestellen:

Polizei nach Kanton

Aufklärung:

Folgst du schon 20 Minuten auf Whatsapp?

Eine Newsübersicht am Morgen und zum Feierabend, überraschende Storys und Breaking News: Abonniere den Whatsapp-Kanal von 20 Minuten und du bekommst regelmässige Updates mit unseren besten Storys direkt auf dein Handy.

Deine Meinung zählt

131 Kommentare
Kommentarfunktion geschlossen