date

Google Gemini Omni: Tasvir, audio va matnni videoga aylantiruvchi yangi model

Google Gemini Omni: Tasvir, audio va matnni videoga aylantiruvchi yangi model

Bundan uch yil avval Google kompaniyasi Gemini loyihasini ishga tushirganda, asosiy maqsad matn, tasvir, audio va video maʼlumotlar asosida oʻqitilgan yagona multimodal neyrotarmoq yaratish edi. Bugun Google I/O konferensiyasida kompaniya bosh direktori Sundar Pichai ushbu maqsad sari tashlangan muhim qadam — Gemini Omni modelini taqdim etdi. Uning soʻzlariga koʻra, yangi model har qanday kirish maʼlumotidan istalgan kontentni yarata oladi. Bu haqda Techcrunch.com xabar beradi.

Gemini Omni foydalanuvchilarga tasvir, audio, video va matnlarni birlashtirish imkonini beradi. Shunchaki maʼlumotlarni jamlashdan farqli oʻlaroq, Omni ularning barchasini tahlil qilib, fizika qonuniyatlari, madaniyat, tarix va fan tushunchalariga asoslangan yuqori sifatli videolarni taqdim etadi. Shuningdek, foydalanuvchilar murakkab dasturlarsiz, oddiy matnli buyruqlar orqali suratlarni tahrirlashlari mumkin boʻladi.

Google DeepMind vakili Nicole Brichtova ushbu yangilikni Gemini intellekti va media modellarning vizuallashtirish qobiliyatini birlashtirishdagi navbatdagi bosqich deb atadi. Masalan, modelga oqsilning buklanishi haqida videodarslik tayyorlash buyrugʻi berilganda, u nafaqat animatsiyani yaratadi, balki jarayonni tushuntirib beruvchi ovozli matnni ham qoʻshib beradi.

Yangi model yordamida foydalanuvchilar oʻzlarining raqamli avatarlarini ham yaratishlari mumkin. Deepfake xavfining oldini olish maqsadida Google maxsus xavfsizlik tizimini joriy etgan: foydalanuvchi oʻzini videoga olib, maʼlum raqamlarni aytishi talab etiladi. Shundan soʻnggina avatar saqlanadi va kelgusida foydalanish uchun ruxsat beriladi.

Barcha Gemini Omni orqali yaratilgan videolar Google’ning SynthID raqamli suv belgisi bilan himoyalanadi. Bu foydalanuvchilarga videoning sunʼiy intellekt tomonidan yaratilganini tekshirish imkonini beradi. Sundar Pichai taʼkidlaganidek, sunʼiy intellekt endi shunchaki matnni bashorat qilishdan reallikni simulyatsiya qilish bosqichiga oʻtmoqda.

Ctrl
Enter
Xato topdIngizmi?
Iborani ajratib Ctrl+Enter tugmasini bosing
Ma’lumot
Mehmon guruhidagi foydalanuvchilar ushbu nashrga izoh qoldira olmaydi.
Yangiliklar » Texno » Google Gemini Omni: Tasvir, audio va matnni videoga aylantiruvchi yangi model