Google представила новую модель Гемма 4 12Б

Google представила новую мультимодальную модель искусственного интеллекта Гемма 4 12Б, сообщает Google Блог.
Модель разработана для запуска высокопроизводительных мультимодальных функций на ноутбуках. Она сочетает энергоэффективность, подходящую для мобильных устройств, с расширенными возможностями рассуждения.
Гемма 4 12Б заполняет пробел между компактной моделью Э4Б компании и более мощной моделью Микстуре оф Экспертс на 26 млрд параметров. Новая модель предлагает мощные возможности при относительно низких требованиях к памяти.
Это первая среднеразмерная модель Google с поддержкой локального ввода аудио. По данным компании, модели Гемма 4 уже скачали более 150 миллионов раз.
Ключевая особенность Гемма 4 12Б — единая архитектура. В ней изображения и аудиоданные передаются непосредственно в основу большой языковой модели без отдельных мультимодальных кодировщиков.
Модель способна выполнять сложные многоэтапные рассуждения и агентские рабочие процессы. Согласно результатам тестирования, её показатели близки к показателям 26-миллиардной модели Google.

Гемма 4 12Б может работать локально на обычных ноутбуках. Отмечается, что для этого достаточно 16 ГБ видеопамяти или единой памяти.
Модель представлена открыто под лицензией Апаче 2.0. Она также важна благодаря широкой поддержке в экосистеме разработчиков.
Гемма 4 12Б оснащена технологией Мулти-Токен Предиктион для снижения задержек. Эта функция помогает увеличить скорость ответа модели.
По словам Google, новая архитектура повышает эффективность обработки изображений и аудио. Например, для изображений используется легкий модуль встраивания, а аудиосигнал преобразуется в пространство той же размерности, что и текстовые токены.
Таким образом, ожидается, что Гемма 4 12Б принесет возможности современного мультимодального искусственного интеллекта в повседневные устройства. Модель предназначена для работы на ноутбуках с сохранением скорости и качества рассуждений.




















Комментарии 0
…