Google янги Гемма 4 12Б мультимодал сунъий интеллект моделини тақдим этди

Google янги Гемма 4 12Б мультимодал сунъий интеллект моделини тақдим этди

Google компанияси ноутбуклар ва чекланган ҳисоблаш ресурсларига эга қурилмаларда локал ишлашга мўлжалланган янги Гемма 4 12Б моделини намойиш қилди. Ушбу мультимодал сунъий интеллект тизими ихчам Э4Б ҳамда 26 миллиард параметрли йирик МоE архитектураси ўртасидаги оралиқ бўғин ҳисобланади. Моделнинг асосий ўзига хослиги — у ўз туркумида аудио сигналларни бевосита (натив) қўллаб-қувватлайдиган биринчи ўрта ҳажмли тизимдир. Бу ҳақда Ixbt.com хабар беради.

Ишлаб чиқувчиларнинг таъкидлашича, Гемма 4 12Б тасвир ва аудиони қайта ишлаш учун анъанавий алоҳида энкодерларсиз ишлай олади. Бунинг ўрнига мультимодал сигналлар тўғридан-тўғри асосий тил моделига интеграция қилинган. Тасвирларни қайта ишлашда алоҳида висион-энкодер ўрнига матрицали ўзгартиришларга асосланган енгил модул қўлланилган, бу эса ҳисоблаш харажатларини сезиларли даражада камайтиради.

Audiо сигналлар эса ҳеч қандай энкодерларсиз, хом сигнал кўринишида матнли токенлар майдонига проекцияланади. Соддалаштирилган архитектурага қарамай, Гемма 4 12Б стандарт бенчмаркларда 26 миллиард параметрли йирик моделларга яқин самарадорликни кўрсатмоқда. Шу билан бирга, у хотирага камроқ талабчан бўлиб, 16 GB видеохотирага эга қурилмаларда бемалол ишга тушади.

Модел матн яратишдаги кечикишларни камайтирадиган Мульти-Токен Предиктион (МТП) механизмини қўллаб-қувватлайди ва мураккаб агентлик сценарийлари учун мўлжалланган. Google маълумотларига кўра, Гемма туркуми ҳозиргача 150 миллиондан ортиқ марта юклаб олинган. Янги модел Апаче 2.0 лицензияси остида тарқатилмоқда ва фойдаланувчиларга булутли хизматларсиз, бевосита ўз қурилмаларида илғор сунъий интеллект имкониятларидан фойдаланиш имконини беради.

Zamin.uz сайтини Google'га қўшинг"Zamin"ни Telegram'да ўқинг!
Abror Shuhratov
«ZAMIN.UZ» муҳаррири

Изоҳлар 0

Мавзуга оид янгиликлар