Bonjour. Je suis

Anais Chanclu

Accompagnée de mon fidèle vélociraptor Gromulphodus, j’ai vécu des aventures trépidantes, façonnant mon expertise en travaillant à Google, où j’ai contribué à améliorer les services de reconnaissance et de synthèse vocales à Dublin et à Paris, participant à la genèse de la voix de Google Assistant. Mon parcours a ensuite évolué dans le domaine de la comparaison de voix au sein de la police scientifique. Forte de ces expériences, Gromulphodus et moi-même sommes prêts à relever de nouveaux défis et à apporter notre expertise unique à des horizons inexplorés.

Musique
Jeux de société
Dinosaures
Plantes
Astronomie
Doctor Who

Compétences

Traitement de la parole

Reconnaissance de la parole, reconnaissance du locuteur, comparaison de voix, synthèse de la parole

Speechbrain
kaldi
PASE
Whisper
Praat
openSMILE
mbrola
espeak

Intelligence artificielle

Apprentissage automatique, apprentissage profond, apprentissage supervisé et non supervisé, explicabilité

PyTorch
HuggingFace
Keras
scikit-learn
SHAP
Captum
scipy

NLP

Classification textuelle, reconnaissance d'entités nommées, recherche d'information, fouille de textes

BERT
spaCy
Flair
Gensim
NLTK
Stanford CoreNLP
fastText
polyglot

DevOps

Conception d'API, bases de données, développement front-end, contrôle de version, intégration continue, déploiement

React
Next.js
FastAPI
Git
Express
mongoDB
SQL
Rust
Scala
Gitlab CI
Docker Compose

Méthodologies agiles

Management visuel, amélioration continue, design thinking, poker planning, animation d'ateliers et serious games

Scrum
Kanban
Jira
Redmine
Klaxoon
Definition of Ready
Definition of Done

Personnalité

Organisation, communication, autonomie, pensée critique, leadership, attitude positive, travail d'équipe, éthique du travail

Curiosité
Créativité
Esprit critique
Qualité
Rigueur
Autonomie
Esprit d'équipe

Expérience

Développeuse full-stack

Wisper

2023

Au sein de l’équipe XiVO chez Wisper, j’ai amélioré l’expérience utilisateur via l’API REST, couvrant l’authentification, la gestion des droits, et les renvois d’appels. Chargée de la maintenance et des mises à jour régulières, j’ai garanti la qualité par une documentation exhaustive. En parallèle, j’ai été moteur dans l’implémentation du framework Scrum, renforçant la collaboration et l’agilité.

Scala
Play Framework
Postman
SQL
Python
Bash
Git
Docker
Docker Compose
Scrum

Développeuse full-stack

Wisper

2023

Dardilly

Scala
Play Framework
Postman
SQL
Python
Bash
Git
Docker
Docker Compose
Scrum

Ingénieure audio adjointe à la cheffe de section

Service national de police scientifique

2021-2022

Écully

Au Laboratoire central de criminalistique numérique, j’ai principalement travaillé sur la comparaison de voix, couvrant études de faisabilité, amélioration acoustique, prélèvement vocal, et rapports détaillés. En tant que référente IA, j’ai guidé les équipes et encadré un alternant dans la conception d’un système de reconnaissance de phonèmes, démontrant ma capacité à partager mes connaissances et à favoriser les talents.

Adobe Audition
Batvox
iZotope Suite
Praat
PyTorch

Doctorante

Avignon Université

2018-2021

Avignon

Au sein du projet ANR Voxcrim, en tant que doctorante au Laboratoire Informatique d’Avignon, j’ai analysé les performances du système ECAPA-TDNN en variant plusieurs facteurs liés aux enregistrements et/ou locuteurs. Actrice majeure dans la description des bases de données FABIOLE 2 et PTSVOX, j’ai enrichi les ressources en reconnaissance du locuteur. J’ai conçu et évalué un système PASE+ et un MLP pour détecter le type de phonation. Mes recherches ont inclus l’évaluation de la performance humaine dans la tâche de regroupement en locuteurs pour le challenge VoicePrivacy. En parallèle, j’ai partagé mes connaissances à travers des cours d'algèbre booléane, de programmation web et du tutorat en C++.

PyTorch
scikit-learn
HuggingFace
Captum
SHAP
openSMILE
Git
React
FastAPI
HTML
CSS
PHP
Javascript
C++
Kanban

Computational Linguistics Manager

Snips

2017-2018

Paris

En qualité de Computational Linguistics Manager, j’ai recruté et dirigé une équipe de linguistes spécialisées en allemand et japonais pour l’enrichissement d’un assistant vocal multilingue. Notre mission a consisté à créer des grammaires de génération de données et des grammaires de détection d’entités nommées, assurant ainsi la fluidité et la précision des interactions dans les deux langues cibles. Ma supervision attentive a permis d’harmoniser les compétences linguistiques et techniques, garantissant une intégration réussie des langues dans l’assistant vocal.

Python
Rust

TTS Language Engineer

Amazon

2017

Gdansk

Pour créer la voix française d'Amazon Alexa, j'ai dirigé les efforts visant à garantir la pertinence et l'actualité des ressources linguistiques. Ma responsabilité principale consistait à planifier les tâches pour des équipes de linguistes à distance, englobant la normalisation textuelle et la mise à jour du dictionnaire de prononciation pour optimiser les modèles linguistiques. En parallèle, j'ai assuré la supervision des enregistrements de la comédienne fournissant sa voix, contribuant ainsi à l'authenticité et à la qualité sonore de la voix d'Amazon Alexa.

Python
Pseudo-scrum

Junior Linguist

Google (via Adecco Outsourcing)

2016-2017

Paris

À Google, j’ai été une actrice-clef dans l’optimisation de la base de données acoustiques pour la synthèse vocale de Google Assistant, garantissant la qualité des enregistrements par l’identification d’axes d’amélioration. Mes responsabilités comprenaient la relecture de contenus variés et la gestion de ressources phonologiques cruciales pour la synthèse vocale. Mon engagement envers l’amélioration s’est manifesté à travers la rédaction de grammaires de génération de phrases sur divers sujets, ainsi que la mise en place de flux de travail automatisés grâce à des scripts Python et Bash. En l’absence de ma manager, j’ai assumé la responsabilité de la gestion d’équipe et des tâches, en plus de fournir des informations essentielles aux équipes en charge de la synthèse vocale de l’Assistant Google.

Python
Bash
Kanban

Speech Data Evaluator for French

Google (via Berkley Recruitment Ltd.)

2015-2016

Dublin

Au sein d’une équipe de 4 membres intégrée à un pôle multilingue de 16 personnes, j’ai œuvré à l’amélioration des services de reconnaissance automatique et de synthèse de la parole pour le français. Mon rôle impliquait la transcription de fichiers audio et la maintenance du dictionnaire de prononciation. J’ai également contribué à la correction d’erreurs générées par la reconnaissance de la parole, tout en élaborant des grammaires pour la reconnaissance d’entités nommées à l’aide d’expressions régulières.

Python
Regex
Java
Kanban

Formation et stages

Doctorat en informatique
2023Avignon Université
Sujet de recherche : Reconnaître les personnes à leur voix : définition d’un cadre scientifique pour garantir la fiabilité des résultats d’une comparaison de voix dans le cadre criminalistique
Master en traitement automatique des langues
2016Université Sorbonne Nouvelle
Sujet de recherche : Estimation de la gravité d’erreur dans les systèmes de transcription de la parole dans une tâche de reconnaissance d’entités nommées
Maîtrise en linguistique
2013Université de Tours
Licence LLCE anglais
2012Université de Tours

Laboratoire national de métrologie et d'essais2016
Dans le cadre du projet ANR VERA, j’ai travaillé sur le protocole d’un test perceptif qui vise à évaluer sur les erreurs des systèmes de reconnaissance automatique de la parole sont considérées comme « graves » par des humains. Pour cela, j’ai procédé à l’échantillonnage des données en utilisant des scripts, j’ai recruté les sujets et organisé les sessions sur un mois. J’ai également effectué l’analyse des résultats. service lors des événements sociaux.
Laboratoire de Phonétique et Phonologie2015
Dans le cadre du projet ANR Orfeo, mon travail consistait a écrire un script pour effectuer la conversion de lextrees du format Decoda vers le format Orfeo en utilisant des expressions régulières.

Publications

Chanclu, A., Amor, I. B., Gendrot, C., Ferragne, E., & Bonastre, J.-F. (2021). Automatic Classification of Phonation Types in Spontaneous Speech: Towards a New Workflow for the Characterization of Speakers & Voice Quality. Proc. Interspeech 2021, 1015–1018. https://doi.org/10.21437/Interspeech.2021-1765

Chanclu, A., Georgeton, L., Fredouille, C., & Bonastre, J.-F. (2020). PTSVOX : une base de données pour la comparaison de voix dans le cadre judiciaire. 6e conférence conjointe Journées d’études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d’Études sur la Parole, 73–81. https://hal.archives-ouvertes.fr/hal-02798519

Gendrot, C., Ferragne, E., & Chanclu, A. (2022). Analyse phonétique de la variation inter-locuteurs au moyen de réseaux de neurones convolutifs : voyelles seules et séquences courtes de parole. Proc. XXXIVe Journées d’Études Sur La Parole – JEP 2022, 891–899. https://doi.org/10.21437/JEP.2022-94

Tomashenko, N., Wang, X., Vincent, E., Patino, J., Srivastava, B. M. L., Noé, P.-G., Nautsch, A., Evans, N., Yamagishi, J., O’Brien, B., Chanclu, A., Bonastre, J.-F., Todisco, M., & Maouche, M. (2022). Supplementary material to the paper The VoicePrivacy 2020 Challenge: Results and findings. https://hal.archives-ouvertes.fr/hal-03335126

Tomashenko, N., Wang, X., Vincent, E., Patino, J., Srivastava, B. M. L., Noé, P.-G., Nautsch, A., Evans, N., Yamagishi, J., O’Brien, B., Chanclu, A., Bonastre, J.-F., Todisco, M., & Maouche, M. (2022). The VoicePrivacy 2020 Challenge: Results and findings. Computer Speech & Language, 101362. https://doi.org/10.1016/j.csl.2022.101362

O’Brien, B., Tomashenko, N., Chanclu, A., & Bonastre, J.-F. (2021). Anonymous speaker clusters: Making distinctions between anonymised speech recordings with clustering interface. Proc. Interspeech 2021, 3580–3584. https://doi.org/10.21437/Interspeech.2021-1588

Projets personnels

Le MajordomeHub domotique qui permet de créer des requêtes API sur l’ensemble des objets connectés par la voix.Première version prévue pour 2024.

LothariusCompositions orchestrales, épiques et d’ambiance avec Cubase et la suite iZotope.Premier EP prévu pour 2024.

RaptoriaBlog dédié à mes expériences en informatique, électronique et bidouille. En pause.https://raptoria.fr

Contact

Anais Chanclu

Compétences

Traitement de la parole

Intelligence artificielle

NLP

DevOps

Méthodologies agiles

Personnalité

Expérience

Développeuse full-stack

Développeuse full-stack

Ingénieure audio adjointe à la cheffe de section

Doctorante

Computational Linguistics Manager

TTS Language Engineer

Junior Linguist

Speech Data Evaluator for French

Formation et stages

Laboratoire national de métrologie et d'essais2016

Laboratoire de Phonétique et Phonologie2015

Publications

Projets personnels

Contact