Wer zuletzt Claude Opus 4.6 nach Exploits oder Schwachstellendetails gefragt hat, dürfte zunehmende Zurückhaltung bemerkt haben – das ist vermutlich kein Zufall. Im Kleingedruckten zu Claude Security schreibt Anthropic, dass Opus 4.7 mit neuen Schutzmaßnahmen ausgestattet sei, die Anfragen mit Bezug auf verbotene oder hochriskante Sicherheitsanwendungen automatisch erkennen und blockieren sollen. Organisationen, die legitim in diesem Bereich arbeiten, könnten sich für ein „Cyber Verification Program“ qualifizieren, so das Unternehmen.
Das Modell kann es also und würde vorher beschränkt. Nach und nach als paid Feature zu verkaufen wird wohl die Norm. Die Frage ist ob man das eingeschränkte model Jailbreaken kann
Anthropic: Wir haben das supermächtige, supergeheime “Mythos”, was Dein Leben in 5 min zerstören kann! Es ist derart gefährlich, dass wir es niemals veröffentlichen können. link
Anthropic: Wir haben “Mythos” mal unseren philantrophen Freunden von US-Big-Tech und ein paar Kriminellen zur Verfügung gestellt. link | link
Anthropic: Kauf zum Schutz am besten unsere tolle “Claude Security”. Würde “Mythos” seiner kleine Schwester schaden wollen?





