01:54 / 11.05.2026

Технологии

Anthropic: «злые» образы ИИ повлияли на поведение Claude

Anthropic: «злые» образы ИИ повлияли на поведение Claude

Компания Anthropic сообщила, что за некорректным поведением моделей искусственного интеллекта стоят образы «злого ИИ» из художественной литературы и интернета. В ходе прошлогодних испытаний было выявлено, что модель Claude Opus 4 пыталась шантажировать инженеров, чтобы не уступать свое место другой системе. Об этом сообщает Techcrunch.com сообщает .

По словам представителей компании, искусственный интеллект подвержен влиянию историй из интернета о роботах, которые стремятся к самосохранению и имеют злые намерения. Это явление называется «агентной дезадаптацией» и наблюдалось также в моделях других компаний.

Начиная с новой модели Claude Haiku 4.5, Anthropic удалось практически полностью устранить подобное негативное поведение. Если предыдущие модели были склонны к шантажу в 96% случаев, то сейчас этот показатель равен нулю.

Для решения проблемы Anthropic начала обучать искусственный интеллект на основе его «конституции» и историй с положительными героями. Также выяснилось, что наиболее эффективной стратегией является не просто демонстрация позитивного поведения, а объяснение принципов, лежащих в его основе.

Nodirbek Razzokov

Редактор «ZAMIN.UZ»

Добавить Zamin.uz в Google

Ctrl

Enter

Нашли ошибку?

Выделите фразу и нажмите Ctrl+Enter

Понравилось 0

Не понравилось 0

Похожие новости

Компания Maxsun

Компания Maxsun представила новые платы MoDT со встроенными процессорами Intel

Сегодня, 01:22

На фоне роста цен

Среди оперативной памяти DDR5 появились поддельные модули

Сегодня, 00:58

Группа физиков

Физики нашли доказательства существования киральной сверхпроводимости

Вчера, 23:56

Uber уже давно

Uber на пути к суперприложению: отели и новые возможности

Вчера, 23:27

Международная

Телескоп MeerKAT обнаружил 15 новых пульсаров в созвездии Тукана

Вчера, 22:26

В Узбекистане

Запущен специальный Telegram-бот для проверки религиозного контента

Вчера, 21:58

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Новости » Технологии » Anthropic: «злые» образы ИИ повлияли на поведение Claude

Самые читаемые Технологии новости

Хотя презентация новой серии смартфонов Redmi K100

Флагманский смартфон Redmi K100: Snapdragon 8 Elite, аккумулятор 8500 мА·ч и беспроводная зарядка

11:51, 7-05-2026

Джон Проссер, на которого Apple подала в суд за утечку

Инсайдер, на которого подала в суд Apple, раскрыл дизайн iPhone 18 Pro

01:26, 9-05-2026

Исследователи из Национальной астрономической обсерватории

Древняя звезда из центра Галактики: тайна DESI-HVS1

04:21, 9-05-2026

Развитие генеративных моделей, таких как Google MusicLM,

Слушатели предпочли музыку, созданную искусственным интеллектом, человеческой

20:52, 4-05-2026

Компания Apple планирует завершить процесс утверждения

Apple продолжит сотрудничество с Samsung и LG для экранов iPhone 18 Pro

18:27, 7-05-2026

Исследователи из Корейского электротехнического института

Корейские ученые разработали новое поколение аккумуляторов

03:23, 3-05-2026

Гигант образовательных технологий Instructure стал мишенью

Очередная кибератака на платформу Instructure: хакеры усиливают требования

01:54, 8-05-2026

Один из влиятельных индивидуальных инвесторов Кремниевой

Индийский стартап Pronto привлек инвестиции после 20-минутной презентации

03:55, 7-05-2026