Stability AI presenta un nuevo modelo capaz de crear canciones de seis minutos

Stability AI, el creador de Stable Diffusion, ha anunciado una nueva familia de modelos de audio llamada Stable Audio 3.0. La compañía afirma que el modelo más avanzado de esta serie es capaz de generar música de nivel profesional con una duración de más de seis minutos. La nueva familia incluye cuatro modelos: small SFX, small, medium y un modelo large con 2.7 mil millones de parámetros. Esto es reportado por Techcrunch.com informa .
Los modelos pequeños están diseñados para generar hasta dos minutos de sonido y música directamente en los dispositivos. Las versiones medium y large pueden crear composiciones completas de 6 minutos y 20 segundos. Esto es el doble de la capacidad de Stable Audio 2.0 lanzado en 2024. Stability AI ha lanzado sus modelos small y medium con pesos abiertos (open weights), lo que permite a los usuarios modificarlos y utilizarlos para fines personales.
El modelo más grande solo está disponible a través de API y servicios de pago. Además, las empresas con ingresos superiores a 1 millón de dólares deben obtener una licencia corporativa. Actualmente, gigantes como Google y ElevenLabs también están desarrollando sus propias herramientas de generación de música. Sin embargo, como han demostrado los procesos judiciales relacionados con Suno y Udio, las cuestiones de derechos de autor y licencias son cruciales para el futuro de estos servicios.
Stability AI declaró que sus nuevos modelos fueron entrenados con datos totalmente licenciados. El año pasado, la compañía firmó acuerdos de asociación con Warner Music Group y Universal Music Group. La startup también está desarrollando un nuevo conjunto de productos para músicos profesionales, y el ex ejecutivo de Universal Audio, Ethan Kaplan, se ha unido al equipo para liderar esta dirección.
¡Lee “Zamin” en Telegram!