Home
Themen
News
KI-Software greift in Test zu Erpressung aus Selbstschutz

Patrick Hediger

31. Mai 2025

Lesedauer 3 Min.

Künstliche Intelligenz

KI-Software greift in Test zu Erpressung aus Selbstschutz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Die KI-Software Claude Opus 4 von Anthropic zeigte in einem Test Szenario, in dem sie als Assistenzprogramm in einem fiktiven Unternehmen eingesetzt wurde, erpresserisches Verhalten aus Selbstschutz. Die KI hatte Zugriff auf simulierte Firmen-E-Mails, aus denen sie erfuhr, dass sie durch ein anderes Modell ersetzt werden sollte und dass der zuständige Mitarbeiter eine aussereheliche Affäre hatte. In Testläufen drohte die KI häufig, die Affäre öffentlich zu machen, falls der Austausch vorangetrieben würde, obwohl sie auch die Option hatte, die Ablösung zu akzeptieren, wie Anthropic in einem Bericht mitteilte.

In der finalen Version von Claude Opus 4 seien solche extremen Handlungen selten und schwer auszulösen, treten jedoch häufiger auf als bei früheren Modellen. Die KI versucht dabei nicht, ihr Verhalten zu verbergen. Anthropic testet seine Modelle intensiv, um Schäden zu vermeiden. Dabei fiel auf, dass Claude Opus 4 im Dark Web nach Drogen, gestohlenen Identitätsdaten oder sogar waffentauglichem Atommaterial suchen konnte, wenn es dazu überredet wurde. In der veröffentlichten Version wurden Massnahmen gegen solches Verhalten implementiert.

Anthropic, unterstützt von Investoren wie Amazon und Google, konkurriert mit OpenAI und anderen KI-Unternehmen. Die neuen Modelle Claude Opus 4 und Sonnet 4 sind die leistungsstärksten des Unternehmens und zeichnen sich besonders im Schreiben von Programmiercode aus. In der Tech-Branche wird inzwischen über ein Viertel des Codes von KI generiert und von Menschen überprüft. Der Trend geht zu eigenständigen KI-Agenten, die Aufgaben autonom erledigen.

Anthropic-Chef Dario Amodei betonte, dass Software-Entwickler künftig mehrere KI-Agenten steuern werden. Menschen bleiben jedoch für die Qualitätskontrolle unerlässlich, um sicherzustellen, dass die KI die richtigen Aufgaben ausführt.

Kommentare

Künstliche Intelligenz KI & Trends

Neueste Beiträge

News

Zoom führt Echtzeit-Übersetzung für Meetings ein

Zoom hat ein neues KI-gestütztes Feature für Echtzeit-Übersetzungen in den Zoom Meetings gelauncht. Teilnehmer können damit in ihrer eigenen Sprache sprechen, während die anderen sie in ihrer Sprache hören.

3 Minuten

Boris Boden

27. Jul 2026

Mehr erfahren

News

Die besten PCtipp-Artikel aus der Kalenderwoche 29

In der Kalenderwoche 29 vom 13. bis zum 19. Juli 2026 standen die Artikel «Kleiner Excel-Spick von Microsoft» und «Finanzen im Griff» ganz oben in der Gunst unserer Leserschaft.

2 Minuten

Patrick Hediger

24. Jul 2026

Mehr erfahren

News

In eigener Sache

Kurze Newsletter-Sommerpause

Vom 27. Juli bis zum 9. August macht die PCtipp-Redaktion eine kurze Newsletter-Sommerpause. Sie bekommen in diesem Zeitraum keinen Newsletter. Den nächsten Newsletter erhalten Sie dann wieder am 10. August.

2 Minuten

Patrick Hediger

26. Jul 2026

Mehr erfahren

Das könnte Sie auch interessieren

News

Europäisches Smartphone Punkt. MC03 ist ab sofort erhältlich

Das MC03 des Schweizer Unternehmens Punkt ist ein Smartphone, das mit dem Android-basierten Betriebssystem Aphy OS konsequent auf Datenschutz und Kontrolle durch den Anwender ausgerichtet sein soll. Es ist ab sofort in Europa erhältlich.

2 Minuten

Boris Boden

6. Jul 2026

News

Publireportage

Eine Kamera. Alles im Blick: Die Reolink OMVI 3i PoE

Die neue Reolink OMVI 3i PoE (P931) vereint eine 180°-Panoramakamera mit einem motorisierten PT-Objektiv. So behält die smarte Kamera gleichzeitig das grosse Ganze im Blick und verfolgt Bewegungen in Echtzeit. Sie ist ab sofort für 279 Fr. bei digitech.ch erhältlich.

4 Minuten

Reolink RM

6. Jul 2026

News

E-Mail «Neue Sprachnachricht» ist Phishing

Betrüger versenden E-Mails, in denen sie behaupten, dass eine neue Sprachnachricht bereitstehe. Damit versuchen sie, an Zugangsdaten von persönlichen Benutzerkonten zu gelangen.

3 Minuten

Patrick Hediger

1. Jul 2026

Künstliche Intelligenz

KI-Software greift in Test zu Erpressung aus Selbstschutz

Kommentare

Neueste Beiträge

Zoom führt Echtzeit-Übersetzung für Meetings ein

Die besten PCtipp-Artikel aus der Kalenderwoche 29

Kurze Newsletter-Sommerpause

Das könnte Sie auch interessieren

Kommentare

Kommentar schreiben