Google представила новую мультимодальную модель ИИ Гемма 4 12Б

Google представила новую мультимодальную модель ИИ Гемма 4 12Б

Компания Google представила новую модель Гемма 4 12Б, предназначенную для локальной работы на ноутбуках и устройствах с ограниченными вычислительными ресурсами. Эта мультимодальная система искусственного интеллекта является промежуточным звеном между компактной Э4Б и крупной архитектурой МоЭ с 26 миллиардами параметров. Главная особенность модели — она первая в своем классе среднеформатных систем, поддерживающая аудио сигналы напрямую (нативно). Об этом сообщает Иксбт.ком сообщает .

По словам разработчиков, Гемма 4 12Б может обрабатывать изображения и аудио без традиционных отдельных энкодеров. Вместо этого мультимодальные сигналы интегрируются непосредственно в основную языковую модель. Для обработки изображений вместо отдельного висион-энкодера используется легкий модуль, основанный на матричных преобразованиях, что значительно снижает вычислительные затраты.

Аудиосигналы проецируются в поле текстовых токенов в виде сырого сигнала, без каких-либо энкодеров. Несмотря на упрощенную архитектуру, Гемма 4 12Б демонстрирует производительность, близкую к крупным моделям с 26 миллиардами параметров, в стандартных бенчмарках. При этом она менее требовательна к памяти и легко запускается на устройствах с 16 ГБ видеопамяти.

Модель поддерживает механизм Мулти-Токен Предиктион (МТП), снижающий задержки при генерации текста, и предназначена для сложных агентных сценариев. По данным Google, семейство Гемма было загружено более 150 миллионов раз. Новая модель распространяется под лицензией Апаче 2.0 и позволяет пользователям использовать передовые возможности искусственного интеллекта непосредственно на своих устройствах без облачных сервисов.

Добавьте сайт Zamin.uz в GoogleЧитайте «Zamin» в Telegram!
Abror Shuhratov
«ZAMIN.UZ» редактор

Комментарии 0

Похожие новости

Google представила новую мультимодальную модель ИИ Гемма 4 12Б – Zamin.uz, 05.06.2026