date

Anthropic Claude Opus 4.8 таныстырылды

Anthropic Claude Opus 4.8 таныстырылды

Anthropic өзінің негізгі моделінің жаңартуы болып табылатын және код дәлдігінде айтарлықтай жақсартуларды уәде ететін Claude Opus 4.8-ді таныстырды. Алдыңғы нұсқасымен бірдей бағада, яғни миллион кіріс токені үшін $5 және миллион шығыс токені үшін $25 тұратын бұл шығарылымды компания Opus 4.7-ге қарағанда қарапайым, бірақ маңызды жақсарту ретінде сипаттайды. Бұл туралы хабарлайды Habr.com.

Claude Opus 4.8-дің ерекшелігі — оның өз код қателерін тиімдірек анықтау және түзету қабілеті. Ішкі өлшемдерге сәйкес, модель алдыңғы нұсқаға қарағанда төрт есе аз қателік жібереді. Бұл үлкен тілдік модельдерге тән жалпы мәселені шешеді, өйткені олар көбінесе асығыс қорытынды жасайды және жеткілікті дәлелсіз сәттілік туралы сенімді түрде хабарлайды.

Қарапайым жақсартуларға қарамастан, Claude Opus 4.8 әртүрлі критерийлер бойынша жоғары нәтижелер көрсетеді. Агенттік бағдарламалау үшін SWE-Bench Pro-да 69,2% ұпай жинап, Opus 4.7-нің 64,3% көрсеткішінен асып түседі. Компьютерді басқару үшін OSWorld-Verified-де 83,4%-ға жетеді және GDPval-AA білім бағалауында 1890 ұпай жинап, GPT-5.5-тің 1769 ұпайынан озып кетеді. Алайда, Terminal-Bench-те терминалдық кодтауда 74,6% ұпай жинап, GPT-5.5-тің 78,2% нәтижесінен төменірек көрсеткіш көрсетеді.

Anthropic сонымен қатар модельдің жақсартылған қауіпсіздігін атап өтті, бұл алдау немесе дұрыс пайдаланбау үрдістерінің төмендегенін көрсетеді. Claude Opus 4.8 бұл тұрғыда эксперименталды Claude Mythos Preview-ге дерлік теңесіп, модельдің мінез-құлқын этикалық стандарттарға сәйкестендіруде айтарлықтай жетістіктерді көрсетеді.

Ctrl
Enter
Қате таптыңыз ба?
Сөйлемді бөліп, Ctrl+Enter басыңыз
Ақпарат
«Қонақ» тобындағы келушілер бұл жарияланымға пікір қалдыра алмайды.
Жаңалықтар » Технология » Anthropic Claude Opus 4.8 таныстырылды