Sarra EL AYARI

Présentation / Presentation
Ingénieure de Recherche Hors Classe (PhD) en production et analyse de données linguistiques, spécialisée en ingénierie pour l'acquisition des langues
Langues : français (native), anglais (fluent), allemand (B1) et LSF (A2)

 

Compétences / Skills
  • Création et développement d'interfaces ludiques pour l'apprentissage des langues (CALL/iCALL)
  • Outillage, exploration, annotation et visualisation de corpus
  • Développement web
  • Valorisation des données de la recherche
  • Enrichissement et interrogation de corpus et bases de données multimodales et multilingues
  • Documentation (métadonnées), formatage, archivage,

 

Domaines de recherche :

  • Acquisition des langues secondes
  • Corpus d'apprenants
  • Linguistique de corpus
  • Reconnaissance automatique de la parole
  • Traitement automatique des langues

 

Projets / Projects
  • TranSLA : projet de recherche de transcription automatique de données orales d'apprenants L2 du français
  • PhonoFLES : projet de type "recherche-action" pour développer des interfaces ludiques autour de la prononciation du français
  • LudiLang : projet de recherche pour le développement d'outils informatiques ludiques et ergonomiques ayant vocation à être utilisés en cours de langue
  • Sarramanka : plateforme en ligne d'exploration et d'annotation de corpus
  • CotaSigne - en collaboration avec M. Blondel et S. Caët
  • BabyMorPhon - en collaboration avec S. Wauquier, M. Philippart De Foy et Naomi Yamaguchi
  • LGMEF (responsable technique)
  • Dynascript
  • Membre de l'ANR DINLANG (2021-2022)
  • Membre de l'ANR Demonext - en collaboration avec G. Duboisdindien (2020-2021)
  • Otil (Outil de traitement des informations langagières) - en collaboration avec A.-C. Demagny, SFL & A. Arslangul, CRLAO

 

Avant 2018 :

  • Participation au projet "Computational Exploration of the Linguistic Structures of Future-Oriented Expression" (voir)
  • Développement de la plateforme InteRessources au sein du LabEx EFL

 

Enseignements / Teachings

A l'INALCO :

  • Langages web dans le cadre du MASTER 1 Ingénierie multilingue (depuis 2023)
  • Web, bases de données et localisation dans le cadre des MASTER 2 Tetradom et Ingénierie multilingue (depuis 2012)
  • Conception et développement web dans le cadre du MASTER 2 Communication, Organisations et nouveaux médias en Contexte Interculturel (depuis 2022)

 

A l'Université Paris 8

  • Octobre 2023 : intervention dans le cours "Diversités linguistiques" (M. Watorek) : La chaîne de traitements linguistiques.

 

Encadrement / Supervision

Stagiaires :

  • AAP VILLA-IA : A. Skrzyniarz (2025)
  • AAP tranSLA : Z. Li (2024)
  • Inalco : L. Bessac (2024)
  • AAP Sarramanka : O. Elomari (2022)
  • Université Paris 8 : S. Michel, M1 (2019-2020) et M2 (2020-2021), I. Deme (2022-2023 / 2023-2024), C. Richard (2023-2024)
  • Consortium CORLI : A. Pierredon, INALCO (2019)
  • Projet LGMEF (2014 - auj.) : C. Onambélé, Y. Shen, T. Rosenberg, O. Richard, T. Kiseleva, H. Farah, M. Ray, S. Jabali, N. Gerasymenko, H. Qiu, M. Belarbi

 

Encadrement de mémoires

  • Chinatsu Kuroiwa (M2 Ingénierie multilingue INALCO) - 2021
  • Suhaib Etarhuni (M2 Ingénierie multilingue INALCO) - 2019

 

Comités de suivi de thèses

  • M. Accattoli, M. Al-Hjouj, M. Barqach, A. Béton, J. Bordes, C. Ceccaldi, N. Demir, C. Kamissoko, S. Liu, H. Majdoub, N. Michit

 

Valorisation de la recherche / Science outreach

 

Consortiums :

  • Membre du comité de pilotage du consortium CORLI
  • Participation au groupe-projet Multilinguisme du consortium CORLI (2023-auj.)
  • Co-responsable de l'axe transversal Recensement des ressources  du consortium "Corpus, Langues et Interactions" (CORLI - TGIR Huma-Num), 2016-2019
  • Co-pilote du groupe de travail Dépôt, conservation et diffusion des corpus oraux et multimodaux du consortium Corpus Oraux et Multimodaux (IRCOM- TGIR Huma-Num), 2015-2016

 

Podcast :

 

Invitations récentes :

  • 17 octobre 2023 - Présentation au séminaire de l'action Corpus d'apprenants et acquisition L2 du LIDILEM (Université Grenoble Alpes)
  • 15 mai 2023 - Présentation au séminaire Lundis de LIDILE (Université Rennes 2)

 

Comités scientifiques :

 

Organisation d'événements

 

Responsabilités :

  • Membre du bureau du GIS RéAL2
  • Membre du groupe de recherche "Metadata in Learner Corpus Research" (Learner Corpus Association & CLARIN K-centre for Learner Corpora)
  • Correspondante Valorisation à l'INSHS
  • Participation à des recrutements d'ITA au CNRS (présidente du jury et membre experte)
  • Responsable ORTOLANG & COCOON pour SFL
  • Responsable HAL pour SFL
  • Organisatrice du Café-signe

 

Publications récentes / Recent publications
  • Sarra El Ayari & Marzena Watorek. What has Automatic Speech Recognition to offer for the study of learners' corpora? 3rd conference of the european Second Language Association (EuroSLA), July 2024, Montpellier, France.
  • Stéphanie Caët, Marion Blondel, Sarra El Ayari, Claire Danet, Christelle Pepin, Jeanne Butel Mouillard et Clémence Beirnaert . CotaSigne, une expérience de recherche à plusieurs mains. La main de Thôt : théories, enjeux et pratiques de la traduction, 11.
  • Sarra El Ayari. Assisting Language Teaching at the Crossroads of Didactics and Second Language Acquisition. 11th European Conference on Language Learning, July 2023, London, UK.
  • Sarra El Ayari. Sarramanka, une plateforme outillée de transcription, d’annotation et d’exploration de corpus. SHS Web of Conferences, EDP Sciences, 2022, 138, pp.10006.

 

Liste complète des publications / Publication list