Claude Sonnet 5: Neues Standardmodell mit stärkerem Fokus auf Agenten-Aufgaben

Neuer Tag, neues Modell: Anthropic hat Claude Sonnet 5 vorgestellt. Das Modell soll deutlich stärker bei agentischen Aufgaben sein und rückt laut Unternehmen leistungsmäßig näher an die größeren Opus-Modelle heran. Gleichzeitig bleibt Sonnet 5 günstiger und wird ab sofort zum Standardmodell für die Free- und Pro-Tarife. Auch Nutzer von Max, Team und Enterprise erhalten Zugriff. Entwickler können das Modell über die Claude API sowie in Claude Code nutzen.

Im Mittelpunkt stehen Verbesserungen bei Planung, Tool-Nutzung und eigenständigem Arbeiten. Laut Anthropic kann Claude Sonnet 5 komplexere Aufgaben selbstständig zu Ende führen, Browser und Terminal effizienter einsetzen und die eigenen Ergebnisse häufiger überprüfen. Das Modell soll außerdem bei Programmierung, Reasoning und allgemeiner Wissensarbeit gegenüber Sonnet 4.6 spürbar zulegen. In den veröffentlichten Benchmarks liegt Sonnet 5 in vielen Bereichen nahe an Opus 4.8, erreicht dieses aber insbesondere bei besonders anspruchsvollen Aufgaben noch nicht vollständig.

Auch beim Thema Sicherheit sieht Anthropic Fortschritte. Interne Tests bescheinigen Sonnet 5 eine geringere Neigung zu Halluzinationen, weniger sykophantisches Verhalten (Schmeicheln, Einschleimen) und eine bessere Erkennung beziehungsweise Ablehnung missbräuchlicher Anfragen als beim Vorgänger. Gleichzeitig weist das Unternehmen darauf hin, dass Sonnet 5 deutlich geringere Fähigkeiten bei potenziell gefährlichen Cybersecurity-Aufgaben besitzt als aktuelle Opus-Modelle. Zwar könne das Modell einfache, ungefährliche Sicherheitsaufgaben erledigen, bei der Entwicklung funktionierender Exploits habe es in den internen Tests jedoch keine vollständigen Erfolge erzielt. Details findet ihr hier.

Transparenz: In diesem Artikel sind Partnerlinks enthalten. Durch einen Klick darauf gelangt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalten wir eine kleine Provision. Für euch ändert sich am Preis nichts. Partnerlinks haben keinerlei Einfluss auf unsere Berichterstattung.