Google présente le nouveau modèle Gemma 4 12B

Google présente le nouveau modèle Gemma 4 12B

Google a présenté un nouveau modèle d'intelligence artificielle multimodal appelé Gemma 4 12B, comme l'a rapporté le blog de Google.

Le modèle est conçu pour lancer des capacités multimodales haute performance sur les ordinateurs portables. Il combine l'efficacité adaptée aux appareils mobiles avec des capacités de raisonnement avancées.

Gemma 4 12B comble le fossé entre le modèle compact E4B de l'entreprise et le modèle Mixture of Experts 26B plus puissant. Le nouveau modèle offre des capacités robustes tout en nécessitant relativement peu de mémoire.

Il s'agit du premier modèle de taille moyenne de Google à prendre en charge l'entrée audio locale. Selon l'entreprise, les modèles Gemma 4 ont été téléchargés plus de 150 millions de fois à ce jour.

Une caractéristique clé de Gemma 4 12B est son architecture unifiée. Les données image et audio sont transmises directement au modèle de langage de base sans encodeurs multimodaux séparés.

Le modèle peut gérer des raisonnements complexes en plusieurs étapes et des flux de travail d'agents. Les résultats des tests indiquent que ses performances sont proches de celles du modèle 26B de Google.

Google présente le nouveau modèle Gemma 4 12B

Gemma 4 12B peut fonctionner localement sur des ordinateurs portables standards. Il est noté que 16 Go de VRAM ou de mémoire unifiée suffisent à cet effet.

Le modèle a été publié ouvertement sous la licence Apache 2.0. Il est également important pour son large soutien au sein de l'écosystème des développeurs.

Gemma 4 12B est équipé de la technologie Multi-Token Prediction pour réduire la latence. Cette fonction aide à augmenter la vitesse de réponse du modèle.

Selon Google, la nouvelle architecture améliore l'efficacité du traitement des images et de l'audio. Par exemple, un module d'embedding léger est utilisé pour les images, tandis que les signaux audio sont mappés directement dans un espace ayant les mêmes dimensions que les jetons de texte.

Ainsi, Gemma 4 12B devrait apporter des capacités d'IA multimodale modernes aux appareils du quotidien. Le modèle est conçu pour fonctionner sur les ordinateurs portables tout en maintenant la vitesse et la qualité du raisonnement.

Ajouter Zamin.uz à GoogleLisez «Zamin» sur Telegram!
Nodirbek Razzokov
«ZAMIN.UZ» rédacteur

Commentaires 0

Actualités connexes