Google presenta el nuevo modelo Gemma 4 12B

Google ha presentado un nuevo modelo de inteligencia artificial multimodal llamado Gemma 4 12B, según informó el blog de Google.
El modelo está diseñado para lanzar capacidades multimodales de alto rendimiento en portátiles. Combina la eficiencia adecuada para dispositivos móviles con capacidades de razonamiento avanzadas.
Gemma 4 12B llena el vacío entre el modelo compacto E4B de la empresa y el modelo Mixture of Experts 26B más potente. El nuevo modelo ofrece capacidades robustas requiriendo relativamente poca memoria.
Este es el primer modelo de tamaño medio de Google que admite entrada de audio local. Según la empresa, los modelos Gemma 4 se han descargado más de 150 millones de veces hasta la fecha.
Una característica clave de Gemma 4 12B es su arquitectura unificada. Los datos de imagen y audio se alimentan directamente al modelo de lenguaje base sin codificadores multimodales separados.
El modelo puede manejar razonamientos complejos de múltiples pasos y flujos de trabajo de agentes. Los resultados de las pruebas indican que su rendimiento es cercano al del modelo 26B de Google.

Gemma 4 12B puede ejecutarse localmente en portátiles estándar. Se señala que 16 GB de VRAM o memoria unificada son suficientes para este propósito.
El modelo se lanzó abiertamente bajo la licencia Apache 2.0. También es significativo por su amplio apoyo dentro del ecosistema de desarrolladores.
Gemma 4 12B está equipado con la tecnología Multi-Token Prediction para reducir la latencia. Esta función ayuda a aumentar la velocidad de respuesta del modelo.
Según Google, la nueva arquitectura mejora la eficiencia en el procesamiento de imágenes y audio. Por ejemplo, se utiliza un módulo de embedding ligero para las imágenes, mientras que las señales de audio se asignan directamente a un espacio con las mismas dimensiones que los tokens de texto.
Así, se espera que Gemma 4 12B lleve capacidades modernas de IA multimodal a los dispositivos cotidianos. El modelo está diseñado para funcionar en portátiles manteniendo la velocidad y la calidad del razonamiento.














Comentarios 0
…