Nicolas Obin
Faculté des Sciences et Ingénierie
Ingénierie
Nicolas Obin enseigne à Sorbonne Université (SU) et effectue sa recherche au laboratoire des Sciences et Technologies de la Musique et du Son (STMS), laboratoire CNRS-SU hébergé à l’Institut de Recherche et Coordination Acoustique/Musique (IRCAM).
Biographie
Ses thématiques de recherche principales portent sur la synthèse vocale et la transformation de la voix.
Nicolas Obin est un expert reconnu en modélisation générative de signaux audio, en particulier de la synthèse vocale et de la transformation de la voix.
Son activité de recherche est à l’interface des sciences informatiques et des sciences humaines, sollicitant des domaines comme le traitement du signal et de l’information, l’intelligence artificielle et l’apprentissage machine, la linguistique appliquée.
Il est l’auteur de nombreuses publications scientifiques dans des conférences et des revues internationales de premier rang, et présente régulièrement les enjeux des technologies de la voix et de l’intelligence artificielle à des audiences spécialisées ou non spécialisées et dans les médias.
Nicolas Obin est passionné par l’art et très impliqué dans le développement et la promotion des technologies audio pour la création, l’art et la culture.
Pour relever les défis technologiques et artistiques de l’IA dans le domaine de la synthèse vocale, Nicolas Obin travaille activement à la conception et à la réalisation d’architectures de réseaux de neurones profonds pour appuyer ses autres domaines d’expertises dans le traitement du signal audio et le traitement automatique de la parole.
Il a remporté, en 2011, le prix de la meilleure thèse délivré par la Fondation Des Treilles pour : MeLos: Analysis and Modelling of Speech Prosody and Speaking Style.
Références
M. Fares, C. Pelachaud and N. Obin (2025). TranSTYLer : Multimodal Behavioural Style Transfer for Facial and Body Gestures Generation , Speech Communication
T. Lemerle, N. Obin, A. Roebel (2024). Lina-Speech : Prefix-Free and Scalable Prompting for Text-to-Speech Synthesis, soumis à International Conference on Machine Learning (2025)
T. Lemerle, N. Obin, A. Roebel (2024). Small-E : Small Language Model with Linear Attention for Efficient Speech Synthesis, in ISCA Interspeech.
L. Benaroya, N. Obin and A. Roebel (2023). Manipulating Voice Attributes by Adversarial Learning of Structured Disentangled Representations, in Entropy 2023, 25(2)
C. Robinson, N.Obin, A. Roebel (2019). Sequence-To-Sequence Modelling of F0 for Speech Emotion
Conversion, International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
Son activité se développe au travers de multiples projets collaboratifs en collaborations étroite avec des partenaires industriels dont Orange, Acapela, Voyxgen, Dubbing Brothers, PSA, Softbank robotics et Ubisoft ainsi que de nombreuses startups.
Project RIAM VIVOS : Creation of expressive voices : multimedia applications (RIAM, 2005-2008).
Projet PostGenAI. IA Cluster : pôles de recherche et de formation de rang mondial en intelligence artificielle (France 2030, 2025-2030).
Projet ANR EVA : Explicit Voice Attributes (ANR, 2023-2026).
Projet ASTRID DeTOX : Lutte contre les vidéos hyper-truquées de personnalités françaises (ASTRID, 2022-2025)
Projet ANR PRCE EXOVOICES : Lecture Virtuelle d’Histoires pour Enfants : Aspects Expressifs et Cognitifs de la Voix de Synthèse (ANR, 2022-2026)
Project TheVoice : Design de voix design pour les industries créatives (ANR, 2017-2021).
Project ChaNTeR : Real-time controlled digital singing (ANR, 2014-2017).
Project Rhapsodie : A reference prosodic corpus of spoken French (ANR, 2007-2011)