La décision d’utiliser une forme d’IA pour ressusciter la voix de John Lennon dans ce que Paul McCartney a appelé “le dernier disque des Beatles” a suscité un certain émoi. Ce qu’ils ont fait est loin des imitations d’artistes par l’IA que l’on voit aujourd’hui sur Soundcloud, et a beaucoup plus en commun avec une application plus prosaïque de l’apprentissage automatique : la réduction du bruit.
À entendre les gens en parler, on pourrait croire qu’il s’agit d’une abjecte opération financière utilisant les dernières technologies de synthèse vocale pour imiter l’un des auteurs-compositeurs les plus célèbres de tous les temps. Mais la véritable histoire est plus simple et plus poignante que cela, et la technologie est bien moins fantastique.
Comme le rappellent les membres du groupe dans un petit film sur la création de la chanson, “Now And Then” était à l’origine une démo au piano que Lennon avait réalisée peu avant sa mort, en 1980. Sa veuve, Yoko Ono, a ensuite fourni au groupe la cassette sur laquelle elle avait été enregistrée, mais la qualité de l’enregistrement n’était pas excellente, voire mauvaise.
Lorsque nous avons écouté “Now And Then”, c’était très difficile parce que John était en quelque sorte caché”, explique Ringo Starr dans le court-métrage du making-of.
“À chaque fois, je voulais un peu plus de la voix de John”, se souvient McCartney. “Ce piano est apparu et a brouillé les pistes. Et à l’époque, bien sûr, nous ne disposions pas de la technologie nécessaire pour faire la séparation.
Ils se sont “essoufflés” en 1995 lorsqu’ils ont essayé de sauver la chanson, mais en 2022, ils travaillaient avec Peter Jackson sur le documentaire “Get Back”. Le cinéaste et son équipe appliquaient une technologie moderne de traitement audio à des images d’archives du groupe afin d’isoler les instruments et les voix.
“Nous accordions beaucoup d’attention à la restauration technique. Cela nous a finalement conduits à développer une technologie qui nous permet de prendre n’importe quelle bande sonore et d’en séparer les différentes composantes en pistes distinctes sur la base de l’apprentissage automatique”, explique Jackson dans le court métrage.
MAL, comme ils l’ont appelé, est une version des technologies d’isolation audio qui ont beaucoup évolué ces dernières années. Les modèles d’apprentissage automatique peuvent être entraînés sur, par exemple, de nombreuses pistes de guitare et apprendre quelle est la forme d’onde ou la signature spectrale d’une guitare, et peuvent, avec plus ou moins de succès, l’extraire d’une piste mixée.
Cette technique est également couramment utilisée dans les appels vidéo, à l’aide de modèles formés sur des voix humaines. En supprimant tout ce qui n’est pas la voix de l’interlocuteur, les bruits de fond tels que les aboiements de chiens ou un café bruyant peuvent être réduits au silence en temps réel. Des versions plus rudimentaires de ce système ont parfois été utilisées pour créer des versions karaoké de chansons, en identifiant et en supprimant les pistes vocales.
Dans le cas de la démo de Lennon, cela a fonctionné comme un charme, comme vous pouvez l’entendre à cet instant dans le making-of.
“La voix de John était là, claire comme de l’eau de roche”, explique Paul. “Nous pouvions maintenant la mixer et en faire un enregistrement digne de ce nom.
Certains peuvent s’interroger sur l’éthique de cet enregistrement, mais toutes les personnes impliquées semblent penser que John aurait été d’accord, car il aimait bricoler avec la technologie et avait, bien sûr, écrit et interprété la chanson à l’origine avec l’intention de l’enregistrer.
Mais plus important encore, il semble que cela ait permis au groupe de tourner la page. Les vicissitudes de la célébrité et de la créativité qu’ils ont endurées sont plus que bien documentées, mais perdre un ami et un partenaire créatif pendant des décennies de cette façon, et avoir ce dernier morceau qui reste suspendu juste hors de portée, a dû être torturant.
Comme peuvent en témoigner tous ceux qui ont perdu quelqu’un, chaque vestige de cette personne devient précieux. “Entendre la voix de John… c’est une chose que nous devrions chérir”, avait déclaré George Harrison en 1995.
Et aujourd’hui, avec un quart de siècle d’améliorations technologiques, c’est exactement ce qu’ils ont pu faire.
“Nous n’aurons jamais été aussi proches de son retour dans la salle”, a déclaré Ringo.
Vous pouvez écouter “Now And Then” ici.