Google жаңа Gemma 4 12B мультимодальды жасанды интеллект моделін таныстырды

Google жаңа Gemma 4 12B мультимодальды жасанды интеллект моделін таныстырды

Google компаниясы ноутбуктерде және шектеулі есептеу ресурстары бар құрылғыларда жергілікті жұмыс істеуге арналған жаңа Gemma 4 12B моделін таныстырды. Бұл мультимодальды жасанды интеллект жүйесі шағын E4B пен 26 миллиард параметрі бар үлкен MoE архитектурасы арасындағы аралық буын болып табылады. Модельдің басты ерекшелігі — ол өз санатында аудио сигналдарды тікелей (нативті) қолдайтын алғашқы орташа көлемді жүйе. Бұл туралы Ixbt.com хабар таратады.

Әзірлеушілердің айтуынша, Gemma 4 12B суреттер мен аудионы өңдеу үшін дәстүрлі бөлек кодтаушыларсыз жұмыс істей алады. Оның орнына мультимодальды сигналдар тікелей негізгі тілдік модельге интеграцияланады. Суреттерді өңдеуде бөлек vision-кодтаушының орнына матрицалық түрлендірулерге негізделген жеңіл модуль қолданылады, бұл есептеу шығындарын айтарлықтай азайтады.

Аудио сигналдар кез келген кодтаушыларсыз, шикі сигнал түрінде мәтіндік токендер алаңына проекцияланады. Жеңілдетілген архитектураға қарамастан, Gemma 4 12B стандартты бенчмарктерде 26 миллиард параметрі бар үлкен модельдерге жақын өнімділікті көрсетеді. Сонымен қатар, ол жадыға аз талап қояды және 16 ГБ бейнежадысы бар құрылғыларда оңай іске қосылады.

Модель мәтін жасаудағы кідірістерді азайтатын Multi-Token Prediction (MTP) механизмін қолдайды және күрделі агенттік сценарийлерге арналған. Google деректеріне сәйкес, Gemma отбасы қазірге дейін 150 миллионнан астам рет жүктелген. Жаңа модель Apache 2.0 лицензиясы бойынша таратылады және пайдаланушыларға бұлттық қызметтерсіз, тікелей өз құрылғыларында озық жасанды интеллект мүмкіндіктерін пайдалануға мүмкіндік береді.

Zamin.uz сайтын Google'ге қосыңыз"Zamin"ді Telegram'да оқыңыз!
Abror Shuhratov
«ZAMIN.UZ» редактор

Пікірлер 0

Байланысты жаңалықтар