Google DeepMind hebt den Mauszeiger auf ein neues Level

Forscher von Google DeepMind haben ein neues Cursor-Konzept auf Basis künstlicher Intelligenz vorgestellt. Diese Technologie verwandelt die einfache Zeigebewegung der Maus in einen vollständig interaktiven Dialog. Anstatt lange Textanfragen zu schreiben, können Nutzer einfach auf ein Objekt zeigen und kurze Befehle wie „vergleiche das“, „erkläre es“ oder „hierher verschieben“ geben. Dies berichtet Ixbt.com berichtet .
Experten des Unternehmens zufolge hat sich das Prinzip der Computerinteraktion in den letzten 50 Jahren kaum verändert; der Cursor diente lediglich dazu, Koordinaten auf dem Bildschirm zu markieren. DeepMind schlägt vor, das System nicht nur die Cursor-Position erfassen zu lassen, sondern auch zu verstehen, worauf der Nutzer schaut und was seine Absicht ist. Dieser Ansatz ermöglicht eine nahtlose Integration von KI in tägliche Arbeitsabläufe.
Das neue Konzept basiert auf vier Grundprinzipien: Wegfall des Wechsels zu separaten Chatbots, automatische Erfassung des visuellen Kontexts, Nutzung natürlicher Sprache und die Umwandlung von Interface-Elementen von bloßen Pixelansammlungen in „bedeutungsvolle Objekte“, mit denen KI direkt arbeiten kann. Moderne multimodale Modelle wie Gemini sind ausgereift genug, um diesen Mechanismus umzusetzen.
Google integriert diese Technologie schrittweise in seine Produkte. Im Browser Google Chrome gibt es beispielsweise die Möglichkeit, mithilfe von Gemini Fragen zu spezifischen Elementen auf Webseiten zu stellen. Zudem kündigte das Unternehmen die Magic Pointer-Funktion für zukünftige Googlebook-Laptops an. Diese Änderungen sind ein wichtiger Schritt zur Anpassung der PC-Oberfläche an das Zeitalter der generativen KI.
Lesen Sie „Zamin“ auf Telegram!