L’appel du 18 juin 40 reconstitué via le « voice cloning » ?
Choses à Savoir TECH - A podcast by Choses à Savoir
Categories:
Le monde de l'intelligence artificielle est en constante évolution et de nouvelles technologies émergent régulièrement. L'une d'entre elles, connue sous le nom de "voice cloning", a récemment permis de reconstituer la voix du général de Gaulle. Pour résumer brièvement, le voice cloning est une technique de reproduction de la voix assistée par intelligence artificielle, qui comme son nom anglais l’indique, permet de cloner la voix d’une personne. À partir d'enregistrements existants, l’IA va mobiliser ce qu’on appelle ses réseaux de neurones pour analyser les caractéristiques de la voix et la répliquer de manière numérique. Vous ne le savez peut-être pas, mais cette technique est utilisée dans de nombreux domaines comme pour les assistants virtuels, Siri, Google, Alexa… toutes sont nées du voice cloning. Cette technique est aussi utilisée dans les jeux vidéo et les séries télé ou encore pour la production de contenu audio comme les podcasts ou les livres audio. Dans le cas du général de Gaulle, cette initiative de recréer son célèbre « Appel du 18 juin 1940 » a été lancée par le journal Le Monde. Il aura fallu un mois de travail acharné pour y parvenir, tout d’abord en rédigeant le discours du général à l’identique, avant de le faire interpréter par le comédien François Morel, lequel a dû imiter le plus fidèlement possible la façon de parler de De Gaulle. Une fois cette étape passée, les enregistrements de François Morel ont été soumis à une IA de l’IRCAM, l’Institut de recherche et coordination acoustique/musique qui je cite peut « reproduire automatiquement toutes les émotions et articulations dynamiques d’une voix existante » fin de citation. Enfin, la voix synthétique de De Gaulle a été ainsi appliquée au modèle joué par François Morel afin d’obtenir une reproduction fidèle du son timbre de voix et de son phrasé. Une fois le discours enregistré d’un côté, et l’IA capable de reproduire la voix du général de l’autre, il ne restait plus qu’à lier les deux. Un travail visiblement ardu pour l’IRCAM puisque je cite, « les enregistrements originaux du Général sont d’une qualité variable, parfois très dégradés, avec du souffle, ce qui complique le travail de la machine » fin de citation. Il a donc fallu dégrader la voix synthétique par souci de réalisme afin qu’elle sonne comme si elle sortait des enceintes d’un vieux transistor. Learn more about your ad choices. Visit megaphone.fm/adchoices