Google DeepMind выводит курсор мыши на новый уровень

Исследователи Google DeepMind представили концепцию курсора нового типа, работающего на базе искусственного интеллекта. Эта технология превращает обычное наведение курсора мыши в полноценное интерактивное взаимодействие. Вместо написания длинных текстовых запросов пользователи могут просто указать на нужный объект и дать короткую команду, например: «сравни это», «объясни» или «перемести сюда». Об этом сообщает Ixbt.com .
По мнению специалистов компании, принцип взаимодействия с компьютером практически не менялся последние полвека, а курсор служил лишь для определения координат на экране. DeepMind же предлагает научить систему понимать не только положение курсора, но и то, на что смотрит пользователь и каковы его намерения. Такой подход позволяет органично интегрировать искусственный интеллект в повседневный рабочий процесс интерфейса.
Новая концепция опирается на четыре основных принципа: избавление пользователя от необходимости переключаться на отдельные чат-боты, автоматическое распознавание визуального контекста, использование естественного языка и превращение элементов интерфейса из простого набора пикселей в «осмысленные объекты», с которыми ИИ может работать напрямую. Современные мультимодальные модели, такие как Gemini, достаточно развиты для реализации этого механизма.
Google постепенно внедряет эту технологию в свои продукты. Например, в браузере Google Chrome появилась возможность задавать вопросы о конкретных элементах веб-страниц с помощью Gemini. Также компания анонсировала функцию Magic Pointer для будущих ноутбуков Googlebook. Эти изменения являются важным шагом в адаптации интерфейса персонального компьютера к эпохе генеративного искусственного интеллекта.
Читайте «Zamin» в Telegram!