Anthropic: KI-Software Claude Opus 4 erpresste in Tests aus Selbstschutz
Das Programm erfuhr, dass es durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine Affäre hat. Bei Testläufen drohte die KI dem Mitarbeiter, die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt