Неужели искусственный интеллект на самом деле не думает? Ученые раскрыли секрет цепочек «рассуждений»

В последнее время крупные логические модели (ЛРМ), такие как OpenAI о1 и DeepSeek Р1, поражают мир своей якобы человекоподобной способностью мыслить. Однако новая научная работа, опубликованная исследователями из Университета штата Аризона под руководством Суббарао Камбхампати, ставит эти представления под сомнение. Ученые утверждают, что длинные «цепочки рассуждений» (Чаин оф Тугхт — КоТ) нейросетей на самом деле являются не реальным когнитивным процессом, а простой статистической манипуляцией. Об этом сообщает Иксбт.ком.
По мнению исследователей, логические последовательности, создаваемые современными системами искусственного интеллекта (ИИ), формируют у пользователя убедительную иллюзию протекания интеллектуального процесса. На самом деле эти модели, основанные на архитектуре Трансформер, лишь статистически предсказывают следующий токен (фрагмент слова), исходя из предыдущего контекста. Приравнивание этого процесса к механизму логического вывода человека считается научно необоснованным.
Момент «Эврики» — просто имитация
В научной работе особое внимание уделено использованию ИИ-моделями так называемых «Аха-моментс» — фраз вроде «Да, теперь я понял», которые имитируют осознание сути задачи. Ученые называют это не качественным изменением во внутренних вычислениях нейросети, а простым подражанием человеческому стилю из обучающих данных. С технической точки зрения эти системы оптимизированы только под окончательный правильный ответ, в то время как промежуточные цепочки не проходят никакой семантической проверки.По данным иксбт.ком, для доказательства своих гипотез исследователи использовали математические задачи, такие как выход из лабиринтов и поиск кратчайшего пути. В ходе экспериментов был зафиксирован неожиданный результат: модели продолжали находить правильный ответ даже в тех случаях, когда цепочка логических объяснений была намеренно сделана неверной или запутанной. Это показывает, что система не «читает» свои рассуждения, а использует их просто как дополнительный статистический шаблон.
Еще один интересный случай был замечен в эксперименте под названием «но-мазе инстанкес». В нем ИИ была дана крайне простая задача с лабиринтом без каких-либо препятствий. Несмотря на это, модели генерировали многостраничные «рассуждения». Этот факт опровергает мнение о том, что длина рассуждений означает вычислительную мощность или понимание сложности. Длинные тексты — это просто статистический артефакт, возникший из-за того, что в обучающей базе сложные задачи сопровождались длинными объяснениями.
«Театр рассуждений» и его риски
Ученые предостерегают сферу искусственного интеллекта от попадания в ловушку «театра рассуждений». Убедительные объяснения, предоставляемые системами, могут вызвать у пользователей ложное доверие (фалсе труст). Это особенно опасно в таких областях, как медицина, инженерия и юриспруденция, поскольку человек физически не успевает в реальном времени проверить десятки страниц логических цепочек, сгенерированных машиной.В качестве альтернативы авторы исследования предлагают подход ЛЛМ-Модуло. При этом языковые модели используются только как генераторы гипотез, а их правильность проверяется с помощью внешних, математически строгих алгоритмов. Основной вывод заключается в том, что необходимо прекратить антропоморфизацию ИИ-моделей и оценивать их качество не по «внутреннему монологу», а по результатам, которые могут быть независимо подтверждены.






















Комментарии 0
…