Google DeepMind lleva el cursor del ratón a un nuevo nivel

Investigadores de Google DeepMind han presentado un nuevo concepto de cursor basado en inteligencia artificial. Esta tecnología transforma el simple acto de señalar con el ratón en un diálogo totalmente interactivo. En lugar de escribir largas consultas de texto, los usuarios pueden simplemente señalar un objeto y dar comandos cortos como "compara esto", "explica" o "mueve aquí". Así lo informa Ixbt.com informa .
Según los expertos de la empresa, el principio de interacción con el ordenador apenas ha cambiado en el último medio siglo, y el cursor solo servía para marcar coordenadas en la pantalla. DeepMind propone enseñar al sistema no solo a rastrear la ubicación del cursor, sino a entender qué está mirando el usuario y cuál es su intención. Este enfoque permite integrar la IA de forma fluida en los flujos de trabajo diarios.
El nuevo concepto se basa en cuatro principios clave: liberar al usuario de cambiar a chatbots separados, la comprensión automática del contexto visual, el uso del lenguaje natural y la transformación de los elementos de la interfaz de simples conjuntos de píxeles en "objetos significativos" con los que la IA puede trabajar directamente. Los modelos multimodales modernos como Gemini son lo suficientemente avanzados para implementar este mecanismo.
Google está integrando gradualmente esta tecnología en sus productos. Por ejemplo, en el navegador Google Chrome ha aparecido la posibilidad de hacer preguntas sobre elementos específicos de las páginas web utilizando Gemini. La empresa también anunció la función Magic Pointer para los futuros portátiles Googlebook. Estos cambios son un paso importante para adaptar la interfaz del PC a la era de la IA generativa.
¡Lee “Zamin” en Telegram!