Présentation / Presentation
Ingénieure de Recherche Hors Classe (PhD) en production et analyse de données linguistiques, spécialisée en ingénierie pour l'acquisition des langues
Langues : français (native), anglais (fluent), allemand (B1) et LSF (A2)
Compétences / Skills
- Création et développement d'interfaces ludiques pour l'apprentissage des langues (CALL/iCALL)
- Outillage, exploration, annotation et visualisation de corpus
- Développement web
- Valorisation des données de la recherche
- Enrichissement et interrogation de corpus et bases de données multimodales et multilingues
- Documentation (métadonnées), formatage, archivage,
Domaines de recherche :
- Acquisition des langues secondes
- Corpus d'apprenants
- Linguistique de corpus
- Reconnaissance automatique de la parole
- Traitement automatique des langues
Projets / Projects
- TranSLA : projet de recherche de transcription automatique de données orales d'apprenants L2 du français
- PhonoFLES : projet de type "recherche-action" pour développer des interfaces ludiques autour de la prononciation du français
- LudiLang : projet de recherche pour le développement d'outils informatiques ludiques et ergonomiques ayant vocation à être utilisés en cours de langue
- Sarramanka : plateforme en ligne d'exploration et d'annotation de corpus
- CotaSigne - en collaboration avec M. Blondel et S. Caët
- BabyMorPhon - en collaboration avec S. Wauquier, M. Philippart De Foy et Naomi Yamaguchi
- LGMEF (responsable technique)
- Dynascript
- Membre de l'ANR DINLANG (2021-2022)
- Membre de l'ANR Demonext - en collaboration avec G. Duboisdindien (2020-2021)
- Otil (Outil de traitement des informations langagières) - en collaboration avec A.-C. Demagny, SFL & A. Arslangul, CRLAO
Avant 2018 :
- Participation au projet "Computational Exploration of the Linguistic Structures of Future-Oriented Expression" (voir)
- Développement de la plateforme InteRessources au sein du LabEx EFL
Enseignements / Teachings
A l'INALCO :
- Langages web dans le cadre du MASTER 1 Ingénierie multilingue (depuis 2023)
- Web, bases de données et localisation dans le cadre des MASTER 2 Tetradom et Ingénierie multilingue (depuis 2012)
- Conception et développement web dans le cadre du MASTER 2 Communication, Organisations et nouveaux médias en Contexte Interculturel (depuis 2022)
A l'Université Paris 8
- Octobre 2023 : intervention dans le cours "Diversités linguistiques" (M. Watorek) : La chaîne de traitements linguistiques.
Encadrement / Supervision
Stagiaires :
- AAP VILLA-IA : A. Skrzyniarz (2025)
- AAP tranSLA : Z. Li (2024)
- Inalco : L. Bessac (2024)
- AAP Sarramanka : O. Elomari (2022)
- Université Paris 8 : S. Michel, M1 (2019-2020) et M2 (2020-2021), I. Deme (2022-2023 / 2023-2024), C. Richard (2023-2024)
- Consortium CORLI : A. Pierredon, INALCO (2019)
- Projet LGMEF (2014 - auj.) : C. Onambélé, Y. Shen, T. Rosenberg, O. Richard, T. Kiseleva, H. Farah, M. Ray, S. Jabali, N. Gerasymenko, H. Qiu, M. Belarbi
Encadrement de mémoires
- Chinatsu Kuroiwa (M2 Ingénierie multilingue INALCO) - 2021
- Suhaib Etarhuni (M2 Ingénierie multilingue INALCO) - 2019
Comités de suivi de thèses
- M. Accattoli, M. Al-Hjouj, M. Barqach, A. Béton, J. Bordes, C. Ceccaldi, N. Demir, C. Kamissoko, S. Liu, H. Majdoub, N. Michit
Valorisation de la recherche / Science outreach
Consortiums :
- Membre du comité de pilotage du consortium CORLI
- Participation au groupe-projet Multilinguisme du consortium CORLI (2023-auj.)
- Co-responsable de l'axe transversal Recensement des ressources du consortium "Corpus, Langues et Interactions" (CORLI - TGIR Huma-Num), 2016-2019
- Co-pilote du groupe de travail Dépôt, conservation et diffusion des corpus oraux et multimodaux du consortium Corpus Oraux et Multimodaux (IRCOM- TGIR Huma-Num), 2015-2016
Podcast :
- Marzena Watorek & Sarra El Ayari, pour le podcast Inclusioni, Università di Verona, « Le lingue non maggioritarie: perché bisogna studiarle e promuoverle? », 2024
Invitations récentes :
- 17 octobre 2023 - Présentation au séminaire de l'action Corpus d'apprenants et acquisition L2 du LIDILEM (Université Grenoble Alpes)
- 15 mai 2023 - Présentation au séminaire Lundis de LIDILE (Université Rennes 2)
Comités scientifiques :
- Colloque Influence translinguistique : Où en est-on aujourd’hui ?, juillet 2021
- Ecole d'été STALS2024, août 2024
- Journées d'études Acquisition, teaching and promotion of “non-majoritarian” varieties, octobre 2024
Organisation d'événements
- Organisation de l'atelier "Outillage statistique de l'acquisition des langues secondes" 2023, Réseau RéAL2 (hiver 2024, Paris)
- Organisation de l'atelier "Outillage de l'acquisition des langues secondes pour la phonologie" 2023, Réseau RéAL2 (octobre 2023, Grenoble)
- Organisation de l'atelier "Outillage de l'acquisition des langues secondes pour l'annotation des données" - Réseau RéAL2 (2022, en ligne)
- Organisation de l'atelier "Outillage de l'acquisition des langues secondes" - Réseau RéAL2 (décembre 2020, en ligne)
- Organisation de l'atelier "Outillage de l'acquisition des langues secondes" - Réseau RéAL2 (octobre 2019, Paris)
- Participation à l'organisation de JEP-TALN-RECITAL 2016 (juillet, Paris)
- Participation à l'organisation de ISGS 2016 (juillet, Paris)
Responsabilités :
- Membre du bureau du GIS RéAL2
- Membre du groupe de recherche "Metadata in Learner Corpus Research" (Learner Corpus Association & CLARIN K-centre for Learner Corpora)
- Correspondante Valorisation à l'INSHS
- Participation à des recrutements d'ITA au CNRS (présidente du jury et membre experte)
- Responsable ORTOLANG & COCOON pour SFL
- Responsable HAL pour SFL
- Organisatrice du Café-signe
Publications récentes / Recent publications
- Sarra El Ayari & Marzena Watorek. What has Automatic Speech Recognition to offer for the study of learners' corpora? 3rd conference of the european Second Language Association (EuroSLA), July 2024, Montpellier, France.
- Stéphanie Caët, Marion Blondel, Sarra El Ayari, Claire Danet, Christelle Pepin, Jeanne Butel Mouillard et Clémence Beirnaert . CotaSigne, une expérience de recherche à plusieurs mains. La main de Thôt : théories, enjeux et pratiques de la traduction, 11.
- Sarra El Ayari. Assisting Language Teaching at the Crossroads of Didactics and Second Language Acquisition. 11th European Conference on Language Learning, July 2023, London, UK.
- Sarra El Ayari. Sarramanka, une plateforme outillée de transcription, d’annotation et d’exploration de corpus. SHS Web of Conferences, EDP Sciences, 2022, 138, pp.10006.
Liste complète des publications / Publication list