Sous l’impulsion de Thierry Ardisson, MacGuff et Ircam Amplify ont travaillé sur deux procédés « FaceRetriever » pour les visages et « Voice Cloning » pour la voix, deux réelles avancées technologiques made in France, pour faire redécouvrir aux téléspectateurs des personnalités cultes.
Qui n’a jamais rêvé de réécouter les grandes légendes disparues ? C’est désormais possible !
« Voice Cloning », est un procédé technologique de reconstitution vocale capable de déterminer et « apprendre » les éléments qui permettent de reproduire automatiquement toutes les émotions et articulations dynamiques d’une voix existante. Une rigueur documentaire et quelques dizaines de minutes seulement sont nécessaires pour analyser l’enregistrement de la voix d’origine grâce au Machine Learning et à l’Intelligence Artificielle, afin de la caractériser finement et de manière unique.
En parallèle, le propos est enregistré avec un acteur portant les intonations et les émotions, sans chercher à imiter la voix à recréer. « Voice Cloning » « habille » ensuite cette base avec la fibre que la machine a apprise pour reconstituer la voix. Ce propos est in fine le squelette sur lequel « Voice Cloning » applique ce muscle, cet ADN.
La reconstitution vocale, un outil au service de projets culturels
Cette innovation majeure proposée par Ircam Amplify, filiale de l’Ircam, pour l’émission « Hôtel du Temps » s’appuie sur les technologies et les savoir-faire de l’Ircam, expert dans le domaine du son et de la voix.
Sur la base de propos écrits ou prononcés par des personnalités, “Voice Cloning” permet ici de donner de la voix à des documentaires ou des œuvres culturelles.
Ainsi, pour « Hôtel du Temps », « Voice Cloning » offre une interview aussi fluide que réaliste, sur la base de l’identité vocale despersonnalités.
En complément de la reconstitution des visages des personnalités avec « FaceRetriever » de Mac Guff, le traitement de la voix permet de reconstituer les éléments de langages propres à l’interview, en respectant la prosodie de chaque personnalité.
Véritable pont entre l’état de l’art de la recherche audio des 100 chercheurs de l’Ircam et le monde industriel au niveau mondial, Ircam Amplify participe à la révolution du son au 21ème siècle dans le quotidien. À l’heure de l’intelligence artificielle, du deep learning et des assistants vocaux, l’Ircam se place comme un pionnier en matière de voix de synthèse, et nous sommes très fiers de participer à ce beau projet.
Nathalie Birocheau, CEO Ircam Amplify
Rendez-vous le lundi 2 mai à 21h10 sur France 3 pour redécouvrir le visage et la voix de Dalida !
Cette innovation majeure proposée par Ircam Amplify s’appuie sur les technologies et les savoir-faire de l’Ircam.
Avec :
Ircam Amplify
- Nicolas Pingnelain, directeur commercial
- Frederic Amadu, directeur technique
- Elias Karam, chef de projet
Ircam
- Sylvain Cadars, réalisateur en ingénierie sonore et informatique musicale
Unité Mixte de recherche Sciences et technologies de la musique et du son (qui associe le CNRS, Sorbonne Université, le ministère de la Culture et l’Ircam) :
- Axel Roebel, responsable de l’équipe Analyse et synthèse des sons
- Nicolas Obin, enseignant chercheur
Avec le soutien de l’Agence Nationale de la Recherche dans le cadre des projets TheVoice et ARS
Contact presse : Agence Oxygen – Marie-Hélène Veillon – marie-helene.v@oxygen-rp.com – 06 07 28 69 43