Christian Cuxac
Les données de ce projet continuent à être exploitées pour différents travaux de recherche.
ANR 2008-2011
Le projet Réalisation de corpus de donnés visuelles pour l’analyse des processus de création d’unités gestuelles (CREAGEST) a pour ambition la constitution et la documentation de corpus de données vidéo de productions gestuelles incluant des productions discursives de Langue des Signes Française (LSF) d’enfants et d’adultes sourds et des productions de gestualité naturelle (gestualité dite coverbale). Un enjeu opérationnel large de ce projet est, à terme, de mettre à la disposition des communautés françaises et internationales de chercheurs des corpus substantiels et représentatifs en s’attachant à pallier les manques actuels en la matière et en visant une complémentarité avec les corpus déjà constitués.
Le choix des types de corpus et les méthodologies proposées visent à répondre à deux niveaux corrélés d’objectifs :
- Un objectif de modélisation linguistique : il s’agit d’approfondir notre compréhension des processus à l’œuvre dans la création, la sémiotisation et la stabilisation de la gestualité humaine signifiante. Le modèle linguistique élaboré par Cuxac (1996, 2000) pour la LSF se fonde sur l’hypothèse d’une sémiogénèse ancrée sur un processus d’iconicisation de l’expérience perceptivo-pratique qui serait à l’œuvre aussi bien au plan ontogénétique de l’acquisition et de la mise en place des structures linguistiques de la LSF chez l’enfant sourd qu’au plan phylogénétique de la constitution de la langue et de son évolution. Notre projet vise à constituer des corpus permettant d’explorer et tester la validité de cette hypothèse.
- Un objectif centré sur la documentation des corpus : l’enjeu est de permettre à terme aux différentes communautés de chercheurs et de locuteurs un accès constructif et pérenne aux données recueillies.
On projette à ce titre :
L’élaboration d’une plateforme devant permettre la formation d’enquêteurs sourds aux méthodes de recueil de données, l’archivage sur un serveur, la mise en place des moyens de pérennisation des méthodes, des collectes et des collaborations.
Une optimisation des outils d’annotation, qui comprendra une formation générale à un outil d’annotation (ANVIL), permettant aux chercheurs de concevoir des fichiers de spécifications (standard XML).
Une prise en compte de l’interopérabilité, pour un meilleur échange international des données et des analyses entre chercheurs : Projet ECHO (avec la norme IMDI pour les métadonnées et le logiciel ELAN), l’immense base de données CHILDES.
Université Paris 8 / UMR 7023 - équipe Langues des signes et gestualité
- Christian Cuxac
- Dominique Boutet
- Ivani Fusellier-Souza
- Brigitte Garcia
- Marie-Thérèse L'Huillier
- Marie-Anne Sallandre
Université Lille 3 /UMR 8163 - Savoirs, textes, langage
Université de Caen et Paris 5 / UMR 6194 - Groupe d’imagerie neurofonctionnelle
- C. Courtin