Anthropic Claude Опус 4.8 тақдим этилди

Anthropic Claude Опус 4.8 ни тақдим этди, бу унинг асосий моделининг янгиланиши бўлиб, код аниқлигида сезиларли яхшиланишларни вада қилади. Олдинги версияси билан бир хил нархда, яни миллион кириш токенлари учун $5 ва миллион чиқиш токенлари учун $25, ушбу нашр компания томонидан Опус 4.7 га нисбатан камтарона, аммо сезиларли яхшиланиш сифатида тавсифланади. Бу ҳақда Habr.com хабар беради.
Claude Опус 4.8 нинг ажралиб турадиган хусусияти унинг ўз код хатоларини янада самарали аниқлаш ва тузатиш қобилиятидир. Ички ўлчовларга кўра, модел олдинги версияга нисбатан тўрт баробар камроқ хатоларни эътибордан четда қолдиради. Бу катта тил моделлари билан боғлиқ умумий муаммони ҳал қилади, чунки улар кўпинча шошилинч хулосалар чиқаради ва этарли далилсиз муваффақиятни ишонч билан хабар қилади.
Камтарона яхшиланишларига қарамай, Claude Опус 4.8 турли мезонларда юқори натижалар кўрсатади. У агент дастурлаш учун СВE-Бенч Pro да 69.2% балл тўплаб, Опус 4.7 нинг 64.3% баллидан ўзиб кетади. Компьютер бошқаруви учун ОСВорлд-Верифиед да 83.4% га эришади ва ГДПвал-АА билим баҳолашида 1890 балл тўплаб, GPT-5.5 нинг 1769 баллидан устун келади. Бироқ, Терминал-Бенч да терминал кодлашда 74.6% балл тўплаб, GPT-5.5 нинг 78.2% баллидан пастроқ натижа кўрсатади.
Anthropic, шунингдек, моделнинг яхшиланган хавфсизлигини таъкидлади, бу эса алдаш ёки нотўғри фойдаланиш тенденцияларининг камайишини кўрсатади. Claude Опус 4.8 бу борада экспериментал Claude Мйтос Превиев га деярли тенглашиб, моделнинг хулқ-атворини ахлоқий стандартларга мослаштиришда сезиларли ютуқларни кўрсатади.
“Zamin”ни Telegram'да ўқинг!