Stability AI stellt neues Modell zur Erstellung von sechsminütigen Songs vor

Stability AI, der Schöpfer von Stable Diffusion, hat eine neue Familie von Audiomodellen namens Stable Audio 3.0 angekündigt. Das Unternehmen gibt an, dass das fortschrittlichste Modell dieser Serie in der Lage ist, Musik in professioneller Qualität mit einer Länge von über sechs Minuten zu generieren. Die neue Familie umfasst vier Modelle: small SFX, small, medium und ein large Modell mit 2,7 Milliarden Parametern. Dies berichtet Techcrunch.com berichtet .
Die kleinen Modelle sind darauf ausgelegt, bis zu zwei Minuten Ton und Musik direkt auf Geräten zu erzeugen. Die Medium- und Large-Versionen können vollständige Kompositionen von 6 Minuten und 20 Sekunden erstellen. Dies ist die doppelte Kapazität des 2024 veröffentlichten Stable Audio 2.0. Stability AI hat seine kleinen und mittleren Modelle mit offenen Gewichten (open weights) veröffentlicht, was es Benutzern ermöglicht, sie für persönliche Zwecke anzupassen.
Das größte Modell ist nur über API und kostenpflichtige Dienste zugänglich. Zudem müssen Unternehmen mit einem Umsatz von über 1 Million US-Dollar eine Unternehmenslizenz erwerben. Derzeit entwickeln auch Giganten wie Google und ElevenLabs eigene Tools zur Musikgenerierung. Wie jedoch die Gerichtsverfahren gegen Suno und Udio gezeigt haben, sind Urheberrechts- und Lizenzfragen entscheidend für die Zukunft dieser Dienste.
Stability AI gab an, dass seine neuen Modelle auf vollständig lizenzierten Daten trainiert wurden. Im vergangenen Jahr unterzeichnete das Unternehmen Partnerschaftsverträge mit der Warner Music Group und der Universal Music Group. Das Startup entwickelt zudem eine neue Produktreihe für professionelle Musiker, und der ehemalige Universal Audio-Manager Ethan Kaplan ist dem Team beigetreten, um diesen Bereich zu leiten.
Lesen Sie „Zamin“ auf Telegram!