Après ChatGPT et Dall-E, Google a publié les ébauches de son nouveau projet, MusicLM, un générateur de son à partir de mots.
«MusicLM a été entrainé sur une large gamme de données musicales et il apprend à générer de longue musique cohérente à 24kHz depuis un texte complexe », annonce l’équipe chargée du projet dans un rapport.
À partir d’une simple description, l’intelligence artificielle est capable de produire des sons, des arrangements et même des voix, mais ces dernières sont souvent incompréhensibles pour l’oreille humaine.
Comme exemple de descriptions possible, on trouve « la bande originale d’un jeu d’arcade. Le son est rapide et entrainant, avec un riff de guitare électrique accrocheur. »
On trouve aussi des sons associés à des tableaux. Ainsi, la persistance de la mémoire de Salvador Dali génère une mélodie hors du temps.
MusicLM n’est pas la première de sa lignée, en 2020, Open AI (les créateurs de ChatGpt) avaient sorti un projet similaire nommé JukeBok. Mais il semblerait que ce nouveau projet soit le plus avancé de son temps.
Risques et droits d’auteurs
Les récentes poursuites contre Dall-e concernant des droits d’auteurs des œuvres utilisés pour l’apprentissage de l’intelligence artificielle pourraient se répéter avec les sons de MusicLM. «Nous reconnaissons le risque de détournement potentiel de contenu créatif associé à notre logiciel, a écrit l’équipe de MusicLM. Nous soulignons la nécessité de mener des recherches approfondies afin d’enrayer les risques associés à la génération de musique.» à expliquer l’équipe Google.
Futur outil pour la musique ?
Même si la qualité des sons n’est pas comparable à celle produit par les humains, cet outil pourrait amorcer un changement dans l’industrie musicale.
Sans compter les heures gagnées pour les musiciens, MusicLM ouvre la porte de tous les possibles créatifs pour les artistes.