• voodoocode@feddit.org
    link
    fedilink
    arrow-up
    1
    ·
    2 months ago

    Wer zuletzt Claude Opus 4.6 nach Exploits oder Schwachstellendetails gefragt hat, dürfte zunehmende Zurückhaltung bemerkt haben – das ist vermutlich kein Zufall. Im Kleingedruckten zu Claude Security schreibt Anthropic, dass Opus 4.7 mit neuen Schutzmaßnahmen ausgestattet sei, die Anfragen mit Bezug auf verbotene oder hochriskante Sicherheitsanwendungen automatisch erkennen und blockieren sollen. Organisationen, die legitim in diesem Bereich arbeiten, könnten sich für ein „Cyber Verification Program“ qualifizieren, so das Unternehmen.

    Das Modell kann es also und würde vorher beschränkt. Nach und nach als paid Feature zu verkaufen wird wohl die Norm. Die Frage ist ob man das eingeschränkte model Jailbreaken kann

  • marv99@feddit.orgM
    link
    fedilink
    Deutsch
    arrow-up
    1
    ·
    edit-2
    2 months ago

    Anthropic: Wir haben das supermächtige, supergeheime “Mythos”, was Dein Leben in 5 min zerstören kann! Es ist derart gefährlich, dass wir es niemals veröffentlichen können. link

    Anthropic: Wir haben “Mythos” mal unseren philantrophen Freunden von US-Big-Tech und ein paar Kriminellen zur Verfügung gestellt. link | link

    Anthropic: Kauf zum Schutz am besten unsere tolle “Claude Security”. Würde “Mythos” seiner kleine Schwester schaden wollen?