Google DeepMind сичқонча кўрсаткичини янгича даражага олиб чиқди

Google DeepMind тадқиқотчилари сунъий интеллект ёрдамида ишловчи янги турдаги курсор концепциясини тақдим этишди. Ушбу технология сичқонча ёрдамида оддий кўрсатиш ҳаракатини тўлиқ интерактив мулоқотга айлантиради. Фойдаланувчилар эндиликда узун матнли сўровлар ёзиш ўрнига, шунчаки керакли объектни кўрсатиб, «буни таққосла», «тушунтириб бер» ёки «бу ерга кўчир» каби қисқа буйруқлар беришлари мумкин. Бу ҳақда Ixbt.com хабар беради.
Компания мутахассисларининг фикрича, компьютер билан ўзаро мулоқот қилиш принципи сўнгги ярим аср давомида деярли ўзгармаган ва курсор фақат экрандаги координаталарни белгилаш учун хизмат қилган. DeepMind эса тизимни нафақат курсорнинг жойлашувини, балки фойдаланувчи нимага қараётганини ва унинг ниятини тушунишга ўргатишни таклиф қилмоқда. Бу ёндашув сунъий интеллектни кундалик интерфейс иш жараёнига узвий боғлаш имконини беради.
Янги концепция тўртта асосий тамойилга таянади: фойдаланувчини алоҳида чат-ботларга ўтишдан халос этиш, визуал контекстни автоматик англаш, табиий тилдан фойдаланиш ва интерфейс элементларини шунчаки пикселлар тўплами эмас, балки сунъий интеллект бевосита ишлай оладиган «маъноли объектлар»га айлантириш. Gemini каби замонавий мультимодал моделлар ушбу механизмни амалга ошириш учун етарлича ривожланган.
Google ушбу технологияни ўз маҳсулотларига босқичма-босқич жорий этмоқда. Масалан, Google Chrome браузерида Gemini ёрдамида веб-саҳифалардаги аниқ элементлар ҳақида саволлар бериш имконияти пайдо бўлди. Шунингдек, компания келажакдаги Googleбоок ноутбуклари учун Магик Поинтер функциясини эълон қилди. Бу ўзгаришлар шахсий компьютер интерфейсини генератив сунъий интеллект даврига мослаштириш йўлидаги муҳим қадамдир.
“Zamin”ни Telegram'да ўқинг!