Anais Chanclu

Anais Chanclu

Accompagnée de mon fidèle vélociraptor Gromulphodus, j’ai vécu des aventures trépidantes, façonnant mon expertise en travaillant à Google, où j’ai contribué à améliorer les services de reconnaissance et de synthèse vocales à Dublin et à Paris, participant à la genèse de la voix de Google Assistant. Mon parcours a ensuite évolué dans le domaine de la comparaison de voix au sein de la police scientifique. Forte de ces expériences, Gromulphodus et moi-même sommes prêts à relever de nouveaux défis et à apporter notre expertise unique à des horizons inexplorés.

J'aime
  • Musique
  • Jeux de société
  • Dinosaures
  • Plantes
  • Astronomie
  • Doctor Who

Compétences

Traitement de la parole

Reconnaissance de la parole, reconnaissance du locuteur, comparaison de voix, synthèse de la parole

  • Speechbrain
  • kaldi
  • PASE
  • Whisper
  • Praat
  • openSMILE
  • mbrola
  • espeak

Intelligence artificielle

Apprentissage automatique, apprentissage profond, apprentissage supervisé et non supervisé, explicabilité

  • PyTorch
  • HuggingFace
  • Keras
  • scikit-learn
  • SHAP
  • Captum
  • scipy

NLP

Classification textuelle, reconnaissance d'entités nommées, recherche d'information, fouille de textes

  • BERT
  • spaCy
  • Flair
  • Gensim
  • NLTK
  • Stanford CoreNLP
  • fastText
  • polyglot

DevOps

Conception d'API, bases de données, développement front-end, contrôle de version, intégration continue, déploiement

  • React
  • Next.js
  • FastAPI
  • Git
  • Express
  • mongoDB
  • SQL
  • Rust
  • Scala
  • Gitlab CI
  • Docker Compose

Méthodologies agiles

Management visuel, amélioration continue, design thinking, poker planning, animation d'ateliers et serious games

  • Scrum
  • Kanban
  • Jira
  • Redmine
  • Klaxoon
  • Definition of Ready
  • Definition of Done

Personnalité

Organisation, communication, autonomie, pensée critique, leadership, attitude positive, travail d'équipe, éthique du travail

  • Curiosité
  • Créativité
  • Esprit critique
  • Qualité
  • Rigueur
  • Autonomie
  • Esprit d'équipe

Expérience

Développeuse full-stack

Wisper
2023
Dardilly

Au sein de l’équipe XiVO chez Wisper, j’ai amélioré l’expérience utilisateur via l’API REST, couvrant l’authentification, la gestion des droits, et les renvois d’appels. Chargée de la maintenance et des mises à jour régulières, j’ai garanti la qualité par une documentation exhaustive. En parallèle, j’ai été moteur dans l’implémentation du framework Scrum, renforçant la collaboration et l’agilité.

  • Scala
  • Play Framework
  • Postman
  • SQL
  • Python
  • Bash
  • Git
  • Docker
  • Docker Compose
  • Scrum

Ingénieure audio adjointe à la cheffe de section

Service national de police scientifique
2021-2022
Écully

Au Laboratoire central de criminalistique numérique, j’ai principalement travaillé sur la comparaison de voix, couvrant études de faisabilité, amélioration acoustique, prélèvement vocal, et rapports détaillés. En tant que référente IA, j’ai guidé les équipes et encadré un alternant dans la conception d’un système de reconnaissance de phonèmes, démontrant ma capacité à partager mes connaissances et à favoriser les talents.

  • Adobe Audition
  • Batvox
  • iZotope Suite
  • Praat
  • PyTorch

Doctorante

Avignon Université
2018-2021
Avignon

Au sein du projet ANR Voxcrim, en tant que doctorante au Laboratoire Informatique d’Avignon, j’ai analysé les performances du système ECAPA-TDNN en variant plusieurs facteurs liés aux enregistrements et/ou locuteurs. Actrice majeure dans la description des bases de données FABIOLE 2 et PTSVOX, j’ai enrichi les ressources en reconnaissance du locuteur. J’ai conçu et évalué un système PASE+ et un MLP pour détecter le type de phonation. Mes recherches ont inclus l’évaluation de la performance humaine dans la tâche de regroupement en locuteurs pour le challenge VoicePrivacy. En parallèle, j’ai partagé mes connaissances à travers des cours d'algèbre booléane, de programmation web et du tutorat en C++.

  • PyTorch
  • scikit-learn
  • HuggingFace
  • Captum
  • SHAP
  • openSMILE
  • Git
  • React
  • FastAPI
  • HTML
  • CSS
  • PHP
  • Javascript
  • C++
  • Kanban

Computational Linguistics Manager

Snips
2017-2018
Paris

En qualité de Computational Linguistics Manager, j’ai recruté et dirigé une équipe de linguistes spécialisées en allemand et japonais pour l’enrichissement d’un assistant vocal multilingue. Notre mission a consisté à créer des grammaires de génération de données et des grammaires de détection d’entités nommées, assurant ainsi la fluidité et la précision des interactions dans les deux langues cibles. Ma supervision attentive a permis d’harmoniser les compétences linguistiques et techniques, garantissant une intégration réussie des langues dans l’assistant vocal.

  • Python
  • Rust

TTS Language Engineer

Amazon
2017
Gdansk

Pour créer la voix française d'Amazon Alexa, j'ai dirigé les efforts visant à garantir la pertinence et l'actualité des ressources linguistiques. Ma responsabilité principale consistait à planifier les tâches pour des équipes de linguistes à distance, englobant la normalisation textuelle et la mise à jour du dictionnaire de prononciation pour optimiser les modèles linguistiques. En parallèle, j'ai assuré la supervision des enregistrements de la comédienne fournissant sa voix, contribuant ainsi à l'authenticité et à la qualité sonore de la voix d'Amazon Alexa.

  • Python
  • Pseudo-scrum

Junior Linguist

Google (via Adecco Outsourcing)
2016-2017
Paris

À Google, j’ai été une actrice-clef dans l’optimisation de la base de données acoustiques pour la synthèse vocale de Google Assistant, garantissant la qualité des enregistrements par l’identification d’axes d’amélioration. Mes responsabilités comprenaient la relecture de contenus variés et la gestion de ressources phonologiques cruciales pour la synthèse vocale. Mon engagement envers l’amélioration s’est manifesté à travers la rédaction de grammaires de génération de phrases sur divers sujets, ainsi que la mise en place de flux de travail automatisés grâce à des scripts Python et Bash. En l’absence de ma manager, j’ai assumé la responsabilité de la gestion d’équipe et des tâches, en plus de fournir des informations essentielles aux équipes en charge de la synthèse vocale de l’Assistant Google.

  • Python
  • Bash
  • Kanban

Speech Data Evaluator for French

Google (via Berkley Recruitment Ltd.)
2015-2016
Dublin

Au sein d’une équipe de 4 membres intégrée à un pôle multilingue de 16 personnes, j’ai œuvré à l’amélioration des services de reconnaissance automatique et de synthèse de la parole pour le français. Mon rôle impliquait la transcription de fichiers audio et la maintenance du dictionnaire de prononciation. J’ai également contribué à la correction d’erreurs générées par la reconnaissance de la parole, tout en élaborant des grammaires pour la reconnaissance d’entités nommées à l’aide d’expressions régulières.

  • Python
  • Regex
  • Java
  • Kanban

Formation et stages

  • Doctorat en informatique
    2023Avignon Université
    Sujet de recherche : Reconnaître les personnes à leur voix : définition d’un cadre scientifique pour garantir la fiabilité des résultats d’une comparaison de voix dans le cadre criminalistique
  • Master en traitement automatique des langues
    2016Université Sorbonne Nouvelle
    Sujet de recherche : Estimation de la gravité d’erreur dans les systèmes de transcription de la parole dans une tâche de reconnaissance d’entités nommées
  • Maîtrise en linguistique
    2013Université de Tours
  • Licence LLCE anglais
    2012Université de Tours
  • Laboratoire national de métrologie et d'essais2016

    Dans le cadre du projet ANR VERA, j’ai travaillé sur le protocole d’un test perceptif qui vise à évaluer sur les erreurs des systèmes de reconnaissance automatique de la parole sont considérées comme « graves » par des humains. Pour cela, j’ai procédé à l’échantillonnage des données en utilisant des scripts, j’ai recruté les sujets et organisé les sessions sur un mois. J’ai également effectué l’analyse des résultats. service lors des événements sociaux.

  • Laboratoire de Phonétique et Phonologie2015

    Dans le cadre du projet ANR Orfeo, mon travail consistait a écrire un script pour effectuer la conversion de lextrees du format Decoda vers le format Orfeo en utilisant des expressions régulières.

Publications

Chanclu, A., Amor, I. B., Gendrot, C., Ferragne, E., & Bonastre, J.-F. (2021). Automatic Classification of Phonation Types in Spontaneous Speech: Towards a New Workflow for the Characterization of Speakers & Voice Quality. Proc. Interspeech 2021, 1015–1018. https://doi.org/10.21437/Interspeech.2021-1765
Chanclu, A., Georgeton, L., Fredouille, C., & Bonastre, J.-F. (2020). PTSVOX : une base de données pour la comparaison de voix dans le cadre judiciaire. 6e conférence conjointe Journées d’études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d’Études sur la Parole, 73–81. https://hal.archives-ouvertes.fr/hal-02798519
Gendrot, C., Ferragne, E., & Chanclu, A. (2022). Analyse phonétique de la variation inter-locuteurs au moyen de réseaux de neurones convolutifs : voyelles seules et séquences courtes de parole. Proc. XXXIVe Journées d’Études Sur La Parole – JEP 2022, 891–899. https://doi.org/10.21437/JEP.2022-94
Tomashenko, N., Wang, X., Vincent, E., Patino, J., Srivastava, B. M. L., Noé, P.-G., Nautsch, A., Evans, N., Yamagishi, J., O’Brien, B., Chanclu, A., Bonastre, J.-F., Todisco, M., & Maouche, M. (2022). Supplementary material to the paper The VoicePrivacy 2020 Challenge: Results and findings. https://hal.archives-ouvertes.fr/hal-03335126
Tomashenko, N., Wang, X., Vincent, E., Patino, J., Srivastava, B. M. L., Noé, P.-G., Nautsch, A., Evans, N., Yamagishi, J., O’Brien, B., Chanclu, A., Bonastre, J.-F., Todisco, M., & Maouche, M. (2022). The VoicePrivacy 2020 Challenge: Results and findings. Computer Speech & Language, 101362. https://doi.org/10.1016/j.csl.2022.101362
O’Brien, B., Tomashenko, N., Chanclu, A., & Bonastre, J.-F. (2021). Anonymous speaker clusters: Making distinctions between anonymised speech recordings with clustering interface. Proc. Interspeech 2021, 3580–3584. https://doi.org/10.21437/Interspeech.2021-1588

Projets personnels

Le MajordomeLe MajordomeHub domotique qui permet de créer des requêtes API sur l’ensemble des objets connectés par la voix.Première version prévue pour 2024.
LothariusLothariusCompositions orchestrales, épiques et d’ambiance avec Cubase et la suite iZotope.Premier EP prévu pour 2024.
RaptoriaRaptoriaBlog dédié à mes expériences en informatique, électronique et bidouille. En pause.https://raptoria.fr

Contact

© 2014-2024 Anaïs Chanclu. Tous droits réservés..