Le nouveau réseau neuronal Stable Audio génère de la musique basée sur une description textuelle

Miscellanea / by admin / September 14, 2023

click fraud protection

Par les créateurs de Stable Diffusion.

Stability AI, connue principalement pour les réseaux de neurones permettant de générer des images (Diffusion stable, Doodle stable et pas seulement), libéré nouveau réseau neuronal Stable Audio. Comme son nom l'indique, il génère des clips audio.

Capture d'écran: Lifehacker

Tout fonctionne à peu près de la même manière que les générateurs d'images basés sur des descriptions textuelles. L'utilisateur précise des mots-clés (par exemple, "hip-hop lo-fi mélodique, mélodique, 85 BPM" ou « death metal avec des riffs de guitare puissants et une batterie rapide »), la durée souhaitée et attend le résultat.

Nous avons utilisé le même modèle que dans Stable Diffusion comme base, mais nous l'avons formé sur des compositions musicales plutôt que sur des images. Au total, elle a reçu environ 800 000 titres du site de musique AudioSparx, soit environ 19 500 heures de sons différents.

Les créateurs notent que la principale caractéristique de Stable Audio est la possibilité de générer des compositions d'une durée donnée. Auparavant, les réseaux de neurones ne fonctionnaient qu'avec une durée fixe: s'ils étaient entraînés sur des clips audio de 30 secondes, ils ne pouvaient générer que des compositions de 30 secondes. Pour pouvoir ajuster la durée d'une piste, les développeurs ont dû changer le modèle et ajouter des métadonnées pour le début et la fin de la composition.

instagram viewer

Stable Audio est proposé en trois modèles. La version gratuite vous permet de générer pas plus de 20 chansons d'une durée maximale de 45 secondes par mois. Il existe également un abonnement professionnel qui vous permet de créer jusqu'à 500 pistes d'une durée maximale de 90 secondes pour 12 $ par pièce. mois (≈1 200 roubles) et l'option Entreprise pour les entreprises avec la possibilité de sélectionner individuellement le volume de production et le prix d'accord. Vous ne pouvez pas utiliser la musique générée à des fins commerciales sans abonnement payant.

Comme d’autres réseaux de neurones similaires, Stable Audio s’adresse davantage aux créateurs de contenu qu’aux musiciens professionnels. De tels outils conviennent pour créer rapidement une musique de fond pour des podcasts et des vidéos lorsque vous n'avez ni le temps ni le budget nécessaires pour collaborer avec un compositeur. Il peut également remplacer les sons d'origine si vous souhaitez des rires uniques ou des bruits de foule.

Vous pouvez essayer Stable Audio sur le site officiel. Vous devrez vous inscrire ou vous connecter avec un compte Google. Au début, il peut y avoir des interruptions d'accès en raison de la forte charge sur le serveur.

Audio stable →

Plus de nouveaux réseaux de neurones🦾✨

L'assistant virtuel AIDA de Sber diagnostiquera les patients dans les cliniques de Moscou
La nouvelle application Artisse génère de superbes photos avec le visage de l'utilisateur
Stability AI a présenté le chatbot Stable Chat - un analogue gratuit de ChatGPT

Nuage

Miscellanea

Évaluation

vues

Commentaires