Stability AI алты минуттық әндер жасай алатын жаңа модельді таныстырды

Stable Diffusion жасаушысы Stability AI компаниясы Stable Audio 3.0 деп аталатын жаңа аудио модельдер отбасын жариялады. Компанияның мәлімдеуінше, бұл сериядағы ең озық модель алты минуттан асатын кәсіби деңгейдегі музыканы генерациялау мүмкіндігіне ие. Жаңа отбасы төрт модельді қамтиды: small SFX, small, medium және 2,7 миллиард параметрі бар large моделі. Бұл туралы Techcrunch.com хабарлайды .
Кіші модельдер құрылғылардың өзінде екі минутқа дейінгі дыбыс пен музыканы жасауға арналған. Medium және large нұсқалары 6 минут 20 секундтық толық композицияларды жасай алады. Бұл 2024 жылы шығарылған Stable Audio 2.0 мүмкіндіктерінен екі есе көп. Stability AI кіші және орта модельдерін ашық кодты (open weights) түрінде ұсынды, бұл пайдаланушыларға оларды өзгертуге және жеке мақсаттарда қолдануға мүмкіндік береді.
Ең ірі модель тек API және ақылы қызметтер арқылы пайдалану үшін қолжетімді. Сондай-ақ, табысы 1 миллион доллардан асатын компаниялар корпоративтік лицензия алуы талап етіледі. Қазіргі уақытта Google және ElevenLabs сияқты алпауыттар да музыка генерациясы саласында өз құралдарын жасап жатыр. Алайда, Suno және Udio-ға қатысты сот процестері көрсеткендей, авторлық құқық және лицензиялау мәселесі бұл қызметтердің болашағы үшін шешуші маңызға ие.
Stability AI өз жаңа модельдерін толық лицензияланған деректер негізінде оқытқанын мәлімдеді. Компания өткен жылы Warner Music Group және Universal Music Group-пен серіктестік келісімдеріне қол қойған болатын. Сондай-ақ, стартап кәсіби музыканттар үшін жаңа өнімдер жиынтығын әзірлеп жатыр және бұл бағытты басқару үшін Universal Audio-ның бұрынғы басшысы Этан Каплан командаға қосылды.
“Zamin”-ді Telegram-нан оқыңыз!