Google Gemini Омни: Тасвир, аудио ва матнни видеога айлантирувчи янги модел

Бундан уч йил аввал Google компанияси Gemini лойиҳасини ишга туширганда, асосий мақсад матн, тасвир, аудио ва видео маълумотлар асосида ўқитилган ягона мультимодал нейротармоқ яратиш эди. Бугун Google И/О конференциясида компания бош директори Sundar Pichai ушбу мақсад сари ташланган муҳим қадам — Gemini Омни моделини тақдим этди. Унинг сўзларига кўра, янги модел ҳар қандай кириш маълумотидан исталган контентни ярата олади. Бу ҳақда Techcrunch.com хабар беради.
Gemini Омни фойдаланувчиларга тасвир, аудио, видео ва матнларни бирлаштириш имконини беради. Шунчаки маълумотларни жамлашдан фарқли ўлароқ, Омни уларнинг барчасини таҳлил қилиб, физика қонуниятлари, маданият, тарих ва фан тушунчаларига асосланган юқори сифатли видеоларни тақдим этади. Шунингдек, фойдаланувчилар мураккаб дастурларсиз, оддий матнли буйруқлар орқали суратларни таҳрирлашлари мумкин бўлади.
Google DeepMind вакили Николе Бричтова ушбу янгиликни Gemini интеллекти ва медиа моделларнинг визуаллаштириш қобилиятини бирлаштиришдаги навбатдаги босқич деб атади. Масалан, моделга оқсилнинг букланиши ҳақида видеодарслик тайёрлаш буйруғи берилганда, у нафақат анимацияни яратади, балки жараённи тушунтириб берувчи овозли матнни ҳам қўшиб беради.
Янги модел ёрдамида фойдаланувчилар ўзларининг рақамли аватарларини ҳам яратишлари мумкин. Деэпфаке хавфининг олдини олиш мақсадида Google махсус хавфсизлик тизимини жорий этган: фойдаланувчи ўзини видеога олиб, маълум рақамларни айтиши талаб этилади. Шундан сўнггина аватар сақланади ва келгусида фойдаланиш учун рухсат берилади.
Барча Gemini Омни орқали яратилган видеолар Google'нинг СйнтҳИД рақамли сув белгиси билан ҳимояланади. Бу фойдаланувчиларга видеонинг сунъий интеллект томонидан яратилганини текшириш имконини беради. Sundar Pichai таъкидлаганидек, сунъий интеллект энди шунчаки матнни башорат қилишдан реалликни симуляция қилиш босқичига ўтмоқда.













