Stability AI présente un nouveau modèle capable de créer des chansons de six minutes

Stability AI, le créateur de Stable Diffusion, a annoncé une nouvelle famille de modèles audio appelée Stable Audio 3.0. L'entreprise affirme que le modèle le plus avancé de cette série est capable de générer de la musique de qualité professionnelle durant plus de six minutes. La nouvelle famille comprend quatre modèles : small SFX, small, medium et un modèle large avec 2,7 milliards de paramètres. C'est ce que rapporte Techcrunch.com rapporte .
Les petits modèles sont conçus pour générer jusqu'à deux minutes de son et de musique directement sur les appareils. Les versions medium et large peuvent créer des compositions complètes de 6 minutes et 20 secondes. C'est deux fois plus que les capacités de Stable Audio 2.0 sorti en 2024. Stability AI a publié ses modèles small et medium avec des poids ouverts (open weights), permettant aux utilisateurs de les modifier et de les utiliser à des fins personnelles.
Le plus grand modèle n'est disponible que via API et des services payants. De plus, les entreprises dont le chiffre d'affaires dépasse 1 million de dollars doivent obtenir une licence d'entreprise. Actuellement, des géants comme Google et ElevenLabs développent également leurs propres outils de génération musicale. Cependant, comme l'ont montré les procédures judiciaires impliquant Suno et Udio, les questions de droits d'auteur et de licences sont cruciales pour l'avenir de ces services.
Stability AI a déclaré que ses nouveaux modèles ont été entraînés sur des données entièrement sous licence. L'année dernière, l'entreprise a signé des accords de partenariat avec Warner Music Group et Universal Music Group. La startup développe également une nouvelle suite de produits pour les musiciens professionnels, et l'ancien dirigeant d'Universal Audio, Ethan Kaplan, a rejoint l'équipe pour diriger cette direction.
Lisez “Zamin” sur Telegram !