Stability AI представила новую модель для создания шестиминутных песен

Компания Stability AI, создатель Stable Diffusion, анонсировала новое семейство аудиомоделей под названием Stable Audio 3.0. По заявлению компании, самая продвинутая модель в этой серии способна генерировать музыку профессионального уровня длительностью более шести минут. Новое семейство включает четыре модели: small SFX, small, medium и large с 2,7 миллиардами параметров. Об этом сообщает Techcrunch.com сообщает .
Малые модели предназначены для создания звуков и музыки длительностью до двух минут непосредственно на устройствах. Версии medium и large могут создавать полноценные композиции продолжительностью 6 минут 20 секунд. Это в два раза больше возможностей Stable Audio 2.0, выпущенной в 2024 году. Stability AI предоставила малые и средние модели в формате open weights, что позволяет пользователям модифицировать их и использовать в личных целях.
Самая крупная модель доступна только через API и платные сервисы. Кроме того, компании с доходом более 1 миллиона долларов обязаны приобретать корпоративную лицензию. В настоящее время такие гиганты, как Google и ElevenLabs, также разрабатывают свои инструменты в области генерации музыки. Однако, как показали судебные процессы, связанные с Suno и Udio, вопросы авторского права и лицензирования имеют решающее значение для будущего этих сервисов.
Stability AI заявила, что обучила свои новые модели на полностью лицензированных данных. В прошлом году компания подписала партнерские соглашения с Warner Music Group и Universal Music Group. Также стартап разрабатывает новый набор продуктов для профессиональных музыкантов, и к команде присоединился бывший руководитель Universal Audio Итан Каплан, чтобы возглавить это направление.
Читайте «Zamin» в Telegram!