Anthropic Claude Opus 4.8 vorgestellt

22:46 / 28.05.2026·204·Technologie

Anthropic hat Claude Opus 4.8 vorgestellt, ein Update seines Flaggschiff-Modells, das signifikante Verbesserungen bei der Code-Genauigkeit verspricht. Zum gleichen Preis wie der Vorgänger, nämlich 5 $ pro Million Eingabe-Token und 25 $ pro Million Ausgabe-Token, wird diese Version vom Unternehmen als bescheidene, aber spürbare Verbesserung gegenüber Opus 4.7 beschrieben. Dies berichtet Habr.com .

Ein herausragendes Merkmal von Claude Opus 4.8 ist die Fähigkeit, eigene Code-Fehler effektiver zu erkennen und zu beheben. Laut internen Messungen übersieht das Modell viermal weniger Fehler als die Vorgängerversion. Dies löst ein häufiges Problem bei großen Sprachmodellen, da diese oft voreilige Schlüsse ziehen und Erfolge ohne ausreichende Beweise melden.

Trotz der moderaten Verbesserungen zeigt Claude Opus 4.8 hohe Ergebnisse in verschiedenen Benchmarks. Es erzielte 69,2 % bei SWE-Bench Pro für agentische Programmierung und übertraf damit die 64,3 % von Opus 4.7. Bei OSWorld-Verified für Computersteuerung erreichte es 83,4 % und erzielte 1890 Punkte bei der GDPval-AA Wissensbewertung, womit es GPT-5.5 mit 1769 Punkten übertrifft. Bei Terminal-Bench für Terminal-Codierung erzielte es jedoch 74,6 %, was unter den 78,2 % von GPT-5.5 liegt.

Anthropic betonte zudem die verbesserte Sicherheit des Modells, was auf eine geringere Tendenz zu Täuschung oder Missbrauch hindeutet. Claude Opus 4.8 kommt in dieser Hinsicht fast an die experimentelle Claude Mythos Preview heran und zeigt erhebliche Fortschritte bei der Ausrichtung des Modellverhaltens an ethischen Standards.