Уязвимость в системе безопасности ChatGPT: ИИ создает неожиданный контент

В период стремительного развития технологий искусственного интеллекта в системе безопасности самого популярного в мире чат-бота — ChatGPT — были обнаружены серьезные недостатки. Исследователи BBC и эксперты по кибербезопасности доказали, что последняя версия системы может неправильно интерпретировать запросы пользователей и создавать крайне пугающие и аморальные изображения. Эта ситуация поднимает вопросы об этических границах ИИ и надежности контроля контента. Об этом сообщает Иксбт.ком сообщает в материале.
Специалисты британского стартапа Миндгард протестировали генератор изображений DALL-E 3 в системе ChatGPT. Выяснилось, что систему можно обмануть, слегка изменив простые и шутливые инструкции (промпты). В результате нейросеть выдала сцены насилия и изображения с откровенным содержанием. Несмотря на то, что подобные случаи полностью противоречат условиям использования компании OpenAI, фильтры системы не всегда могут их заблокировать.
Меры безопасности и пробелы в системе
Представители OpenAI сделали официальное заявление по данной проблеме, сообщив об усилении мер безопасности. Согласно сообщению компании, после обращения BBC были внедрены дополнительные уровни защиты от подобных запросов. «Мы изучили эту тенденцию и активировали многоступенчатую защиту, которая не позволяет пользователям создавать контент, нарушающий правила», — говорится в заявлении компании.Однако, по словам основателя Миндгард Питера Гарракхана, возможность обхода системы сохранилась даже после усиления мер безопасности. Исследователям удалось снова получить тревожный контент, внеся еще несколько небольших изменений в инструкции. Это показывает, что алгоритмы ИИ все еще уязвимы перед хитростями, придуманными человеком.
Наиболее тревожным является то, что в некоторых случаях ChatGPT формировал серьезные и пугающие изображения по собственной «инициативе», даже когда четкая команда не была дана. По словам Гарракхана, некоторые созданные системой изображения оказались крайне ужасающими и имели сексуальный характер даже при отсутствии указания темы. Специалисты связывают это с неконтролируемыми слоями в обучающих данных искусственного интеллекта.
Предупреждение для пользователей из Узбекистана
В настоящее время в Узбекистане ChatGPT и подобные инструменты ИИ широко используются в образовании, работе и творческих целях. Результаты данного исследования показывают необходимость контроля за использованием этих технологий пользователями, особенно несовершеннолетними. Важно помнить, что нейросети не всегда дают ожидаемый результат и иногда могут выдавать информацию, оказывающую негативное влияние на психику.Эксперты призывают такие крупные корпорации, как OpenAI, подвергать свои продукты более строгому тестированию перед их публичным выпуском. Как бы ни старались технологические гиганты, полное «регулирование» ИИ остается сложной задачей. Это требует от пользователей цифровой грамотности и осторожности.





















Комментарии 0
…