Stability AI представила новую модель для создания шестиминутных песен

Компания Stability AI, создатель Стабле Диффусион, анонсировала новое семейство аудиомоделей под названием Стабле Аудио 3.0. По заявлению компании, самая продвинутая модель в этой серии способна генерировать музыку профессионального уровня длительностью более шести минут. Новое семейство включает четыре модели: смалл СФКс, смалл, медиум и ларге с 2,7 миллиардами параметров. Об этом сообщает Techcrunch.ком сообщает .
Малые модели предназначены для создания звуков и музыки длительностью до двух минут непосредственно на устройствах. Версии медиум и ларге могут создавать полноценные композиции продолжительностью 6 минут 20 секунд. Это в два раза больше возможностей Стабле Аудио 2.0, выпущенной в 2024 году. Stability AI предоставила малые и средние модели в формате опен веигхтс, что позволяет пользователям модифицировать их и использовать в личных целях.
Самая крупная модель доступна только через API и платные сервисы. Кроме того, компании с доходом более 1 миллиона долларов обязаны приобретать корпоративную лицензию. В настоящее время такие гиганты, как Google и ElevenLabs, также разрабатывают свои инструменты в области генерации музыки. Однако, как показали судебные процессы, связанные с Suno и Удио, вопросы авторского права и лицензирования имеют решающее значение для будущего этих сервисов.
Stability AI заявила, что обучила свои новые модели на полностью лицензированных данных. В прошлом году компания подписала партнерские соглашения с Варнер Мусик Груп и Универсал Мусик Груп. Также стартап разрабатывает новый набор продуктов для профессиональных музыкантов, и к команде присоединился бывший руководитель Универсал Аудио Итан Каплан, чтобы возглавить это направление.























Комментарии 0
…