Du texte à la musique : qu’est-ce qui rend MusicGen si surprenant ?

MusicGen propose la création de musiques à partir d’un texte. Mais il se distingue par une capacité innovante, et plus que prometteuse.

Cela vous intéressera aussi

[EN VIDÉO] Une bulle de savon qui danse sur la musique Pas besoin de pinceaux pour peindre avec de la musique, c’est possible avec du savon…

En matièrematière de génération de musique par intelligence artificielleintelligence artificielle, nous avons eu droit, pour l’heure, à trois approches principales :

  • les applications telles que Soundraw vous demandent de  choisir une atmosphèreatmosphère, un genre musical, un tempo… À partir de là, un morceau est généré ;
  • fort original, SingSong de Google nous demande de fredonner un morceau et il crée alors un accompagnement ;
  • Google MusicLM, Mubert ou Riffusion nous demandent de taper un « prompt » décrivant la musique et génèrent alors celle-ci. MusicLM a paru assez avancé en la matière, mais nous n’avons pas encore pu le tester à ce jour.

C’est la 3e approche qu’a choisie Meta/Facebook avec son MusicGen. Que dire ? Il se sort honorablement de l’opération. Meta affirme que le point distinctif serait l’usage d’un modèle de génération simplifié qui a été entraîné sur 20 000 de musique « autorisée », et d’une base de données de 10 000 enregistrements audio de qualité.

Nous avons soumis MusicGen à divers prompts (requêtes), y compris en lui demandant de générer un morceau « à la française ». Vous pouvez découvrir les résultats dans la vidéo ci-dessous. Comme vous pourrez le constater, il faut parfois se montrer un peu détaillé dans sa requête pour obtenir le résultat souhaité.

Test de MusicGen, l’application « text to music » de Meta. © Meta

À la manière de…

Toutefois, ce qui distingue MusicGen, c’est qu’il est possible de partir d’un enregistrement existant. Un peu comme lorsque, dans MidJourney, vous générez une illustration à partir d’une image que vous lui soumettez. Là encore, la vidéo vous propose deux exemples de morceaux habilement dérivés de Bach. À terme, rien ne vous empêcherait de charger « Balance ton quoi », « Roxanne » ou « Yesterday » et de générer des morceaux originaux à partir de ces bases. Il faudra toutefois vérifier qu’aucune atteinte aux droits d’auteur n’est patente.

Sur Hugging Face

Si vous souhaitez juste tester la bête sans trop vous soucier de code PythonPython, vous pouvez accéder à cette démo sur Hugging Face. Le souci, c’est qu’elle est terriblement lente et qu’il faut se préparer à attendre des dizaines de minutes pour générer un simple morceau – lorsque l’application ne vous dit pas, purement et simplement, qu’elle est saturée de demandes et qu’il faudra réessayer plus tard.

Depuis Google Colab

L’alternative, a priori intimidante consiste à passer par l’interface Google Colab. Pas d’inquiétude, le code Python est prédéfini et il vous suffit de cliquer sur les flèches situées à gauche de chaque bloc de code, afin de l’exécuter. Lorsque vous parvenez au dernier bloc de code, vous pouvez remplacer les prompts par des requêtes de votre choix.

Leave a Reply

Discover more from Ultimatepocket

Subscribe now to keep reading and get access to the full archive.

Continue reading