Après ChatGPT, cette IA peut créer de la musique à partir d’une simple description

onde musique
Crédits : Tetiana Voitenko / iStock

Tout récemment, des chercheurs de Google ont présenté une nouvelle IA : MusicLM. Comme son nom l’indique, celle-ci se dédie à la création de musique. Pour l’instant à l’état de prototype, ce système est capable de générer des mélodies à l’aide de descriptions sous forme de texte.

Une IA très qualitative

Dernièrement, nous évoquions ChatGPT, s’illustrant avec brio dans la génération de texte ainsi que Midjourney, plutôt performant dans l’élaboration d’images en tout genre. Ces intelligences artificielles fonctionnent d’une manière assez similaire. En effet, l’utilisateur humain entre une description textuelle (ou un prompt) avant que l’IA débute son travail. Ce fonctionnement est le même pour MusicLM, un système que des chercheurs de Google ont dévoilé dans une pré-publication sur la plateforme arXiv le 26 janvier 2023.

Dans leur papier, les scientifiques expliquent que MusicLM est un modèle génératif capable de produire une musique de haute qualité à 24 kHz. Celle-ci reste cohérente sur plusieurs minutes tout en étant fidèle à un signal de conditionnement textuel. Autrement dit, l’IA crée des morceaux de musique à partir d’une description textuelle avec une qualité optimale.

MusicLM peut reproduire différents sons, tels ceux provenant d’instruments comme la flûte, le piano, la guitare ou la harpe, entre autres. Il peut également s’agir de reproduire différents styles musicaux tels que le rock, la pop, le jazz, l’électro, etc. L’IA peut aussi permettre l’ajout de voix humaines dans les morceaux et adapter son travail à différents niveaux de complexité, c’est-à-dire pour les musiciens débutants, intermédiaires ou professionnels.

notes musique
Crédits : Yuliya Shavyra / iStock

Encore inaccessible au public

Selon les chercheurs de Google, MusicLM affiche des débuts très prometteurs et a d’ores et déjà surpassé les systèmes existants. Ces performances accrues concernent notamment la qualité audio et le respect des descriptions textuelles. Par ailleurs, malgré ces débuts convaincants, MusicLM reste pour l’heure inaccessible au public. La raison n’est autre que le risque d’abus, concernant principalement les détournements potentiels du contenu créatif. Néanmoins, Google a déjà mis en ligne de nombreux exemples de bandes sonores que l’IA a élaboré – sur la plateforme GitHub. Il s’agissait pour les chercheurs de présenter leur outil et communiquer sur ses performances.

Par exemple, la description textuelle du premier morceau de la liste est relative à la musique principale d’un jeu d’arcade, rapide et optimiste avec un riff de guitare électrique accrocheur, une musique répétitive et facile à retenir mais pouvant surprendre avec des sons inattendus de type roulements de tambour et coups de cymbales.