GPT 5.4 сунъий интеллект соҳасида етакчига айланди

Сунъий интеллект оламида навбатдаги ютуқ қайд этилди. GPT 5.4 модели Вибе Cоде Бенч v1.1 тестларида 67,42 фоиз натижа билан мутлақ етакчиликни қўлга киритди. Бу кўрсаткич аввалги рекордчи GPT 5.3 Cодех моделидан 5,7 фоизга юқоридир. Учинчи ўринни эса 57,57 фоиз натижа билан Cлауде Опус 4.6 модели эгаллади. Бу ҳақда habr.com хабар беради.
Ушбу синов оддий код ёзиш ёки хатоларни тузатишдан фарқли ўлароқ, моделнинг бутун бошли веб иловани нолдан яратиш қобилиятини баҳолайди. Дастур бўш папкадан тортиб то тайёр хизматгача бўлган жараённи мустақил амалга ошириши керак. Синов давомида сунъий интеллектга аутентификация, маълумотлар базаси ва тўлов тизимлари каби мураккаб вазифалар юкланади. Ҳар бир лойиҳа учун беш соатгача вақт ажратилади ва якуний натижа махсус агент томонидан текширилади.
Таҳлиллар шуни кўрсатадики, юқори аниқлик ҳар доим ҳам иқтисодий самарадорликни англатмайди. Масалан, Cлауде Опус 4.6 модели GPT 5.4 га қараганда камроқ ресурс сарфлаб, деярли тенг натижаларга эришмоқда. Бу эса дастурчилар учун харажатларни оптималлаштиришда муҳим омил ҳисобланади. Шунга қарамай, сунъий интеллектнинг ривожланиш сурати ҳайратланарли: атиги ярим йил ичида энг яхши кўрсаткичлар икки баробарга ошди.
Ҳозирги кунда GPT 5.4 ҳали ҳам баъзи вазифаларда хатоликларга йўл қўймоқда. Модел яратган иловаларнинг тахминан учдан бир қисми тўлиқ ишламайди. Шунга қарамай, технология келажакда дастурлаш жараёнини тубдан ўзгартириши ва инсон меҳнатини сезиларли даражада енгиллаштириши кутилмоқда.
“Zamin”ни Telegram'да ўқинг!