Thème 1 : Traductologie et Multi-linguisme (Resp : Durieux C)
L’étude porte en particulier sur la construction du sens par l’interprète de conférence et le traducteur professionnel. Cette recherche s’inscrit dans le paradigme d’une théorie cognitive de la traduction, en double rupture épistémique par rapport à la linguistique contrastive. La construction du sens est considérée in fine comme le résultat d’une décision pilotée par les émotions. Ce travail comporte deux volets.
Une partie expérimentale, associant traductologie et informatique, qui porte sur trois points.
(1) La fouille de documents à des fins d’extraction d’informations et de terminologie dans une visée d’aide à la réalisation de traductions ou à la préparation de conférences spécialisées par l’interprète de conférences.
(2) Les outils informatiques actuels d’aide à la traduction les plus répandus dans les organisations internationales étant des systèmes à corpus alignés (Trados et Multitrans), il y a lieu de poursuivre le travail sur l’alignement, qui reste très imparfait dans les systèmes actuels même les plus performants.
(3) La conception de sites Web multilingues se prêtant à une hypernavigation efficace et fonctionnelle.
Une partie associant traductologie et psychologie cognitive qui porte sur deux points.
(1) Une étude psychologique expérimentale du fonctionnement cognitif du traducteur au cours du processus dit de « déverbalisation » avec une critique des modèles proposés, l’élaboration et la mise à l’épreuve d’un modèle défini dans une orientation énactique. Ce travail engage la collaboration de A. Kosma (doctorante), J. Vivier, D. Jacquet, H. Platel et fera l’objet d’une thèse de doctorat.
(2) Une étude analytique fondée sur un examen de l’expression verbale des émotions. Le corpus retenu comporte deux parties. D’une part, la traduction des questionnaires d’évaluation de la douleur chez les patients hospitalisés. De fait, les hôpitaux français reçoivent beaucoup de patients de diverses nationalités et les cellules « douleur » disposent de questionnaires qu’il y a lieu de traduire en plusieurs langues. Au-delà de l’aspect interlinguistique, l’aspect interculturel est d’autant plus fort que la douleur est perçue, considérée et exprimée de façons très différentes selon les langues-cultures. D’autre part, la traduction des textes de droit international. La situation est alors l’inverse du cas précédent. Ici la recherche d’une convergence entre les différentes versions d’un même texte est un impératif. Là encore, cette recherche fera l’objet d’une thèse de doctorat.
Thème 2 : Sémantiques (Resp : Legallois D et Enjalbert P)
-
Opération 1 : Lexicologie, (Resp : Manguin J.L.et François J)
Les projets de cette opération s’appuient sur le Dictionnaire Electronique des Synonymes du CRISCO. Tout d’abord, il s’agit d’intégrer ce dictionnaire dans la plate-forme Linguastream, afin de l’utiliser dans l’analyse des structures discursives. Cette intégration sera le déclencheur d’une évolution de ce dictionnaire dans sa structure, par exemple dans la séparation des homographes et la prise en compte des catégories grammaticales ; un ajout d’information sémantique pouvant déboucher sur une typologie interne de la relation synonymique est également envisagé.
Un deuxième projet vise à réaliser une expérience psycholinguistique sur les synonymes dont les sujets seraient les internautes ; ceux-ci devront, en binôme aveugle, proposer des synonymes à un mot donné. Cette tâche leur sera présentée comme un jeu dans lequel l’attribution des points dépendra de la coïncidence des synonymes proposés par les deux partenaires. L’attractivité du jeu sera renforcée par la publication d’un classement sur le site ; l’analyse des résultats doit nous mener à des regroupements de synonymes sur des bases expérimentales statistiques. Les résultats de ce jeu sont susceptibles d’alimenter les travaux sur les expansions de requêtes ou l’indexation par mots-clés. De plus, la réalisation de l’infrastructure Web de cette expérience pourra être utilisée dans d’autres projets.
Un troisième concerne spécifiquement l’adjectif en corpus et dans le dictionnaire des synonymes. Les études portent principalement sur le lexique adjectival en position d’épithète (donc en contexte nominal), et plus particulièrement sur la sélection de sens d’un adjectif polysémique opérée par son contexte ; le couplage des données paradigmatiques (issues du dictionnaire des synonymes du CRISCO) et des données syntagmatiques (par analyse distributionnelle faite sur corpus) permet d’aller plus loin : regroupements des synonymes de sens voisins, détermination des oppositions antonymiques partielles, mise en évidence des associations préférentielles, comparaisons diachroniques ou synchroniques en appliquant la méthode à des corpus différents. -
Opération 2 : Discours (Resp : LegalloisD. et Enjalbert P.)
Les études sur l’organisation du discours connaissent un intérêt croissant de la communauté, tant linguistique que TAL. L’organisation du colloque pluridisciplinaire « Discours et Document » (ISDD 06) à Caen en Juin 2006, le lancement de la revue en ligne DISCOURS, à laquelle nous participons également témoignent de l’engagement de nos équipes.
Une première collaboration structurée entre CRISCO et GREYC concerne la formalisation du discours évaluatif. On parie sur la dimension phraséologique (collocations, expressions idiomatiques) et la répétition de séquences lexico-grammaticales d’un corpus (un ensemble de critiques de livres déposés par des internautes sur les sites amazon.fr et fnac.com) pour implémenter, à partir de la base « linguastream », une grammaire locale du discours évaluatif. Cette grammaire doit pouvoir être projetée à terme sur tout texte (ou corpus) ayant comme finalité l’évaluation des objets culturels, afin qu’une analyse du discours puisse discerner les différentes stratégies argumentatives et énonciatives mises en jeu, noter les écarts entre types de textes, et mieux comprendre la dimension sociale des valeurs convoquées.
Dans Patterns of lexis in text, (1991), le linguiste anglais M.Hoey propose un ensemble de principes visant à mettre en évidence le rôle de la répétition lexicale dans l'organisation des textes non narratifs. Ce modèle d'analyse de la cohésion lexicale a été appliqué dans divers travaux par Dominique Legallois. Mais si le texte possède une organisation réticulaire, la lecture des textes est-elle conditionnée par cette organisation ? Autrement dit, peut-on repérer, à partir de données oculométriques (Eye-Tracking), des indices permettant de conclure à un parcours réticulaire du texte pendant la lecture ? Une expérience a été entreprise en ce sens sur une quarantaine de sujets, en collaboration avec une doctorante du LPCP, F. Marie Dit-Dinard. Elle consiste à enregistrer les mouvements des yeux pendant l’acte de lecture d’un texte journalistique (deux lectures) ; des réponses à un questionnaire et / ou un résumé du texte sont ensuite demandés aux sujets. Une première étape devrait s’achever en 2007 et se prolonger ensuite.
D’autres travaux sont menés dans nos équipes. Au GREYC autour de l’analyse thématique, avec notamment des implications en recherche d’information (cf. opération 3). Au CRISCO autour des structures d’enchaînement ou la narration, dans la perspective de grammaires textuelles, thèmes qui intéresse également le GREYC. Notre intention est donc de s’appuyer sur ces travaux pour développer des travaux communs sur un thème aujourd’hui « porteur ». -
Opération 3 : Accès sémantique à l’information. (Resp : Enjalbert P.)
Un premier volet de l’opération concerne le recours à des sémantiques lexicales linguistiquement fondées dans des procédures d’indexation et de recherche d’information. L’intégration du dictionnaire des synonymes dans LinguaStream va ainsi permettre de mettre en œuvre et de tester des procédures d’expansion de requêtes, notamment pour le moteur de recherche géographique développé dans le cadre du projet GéoSem. Par ailleurs l’exploitation des méthodes de la sémantique différentielle dans une application de cartographie thématique de collections documentaires se poursuivra.
Un second volet concerne spécifiquement la recherche d’information géographique et les suites du programme GéoSem autour de deux aspects prioritaires : l’expérimentation par les géographes et des utilisateurs « institutionnels » du moteur de recherche, notamment dans le cadre des projets interrégionaux « atlas normand » et du projet interReg EMDI ; et l’analyse sémiotique des cartes, en utilisant notamment l’oculomètre (cf. Thème « capture du regard ») pour étudier les stratégies de « lecture de carte ». -
Opération 4 : Analyse automatique des formes métriques et élaboration d'une base de données de textes poétiques annotés du 17e au 19e siècle.
Il s’agit d’élaborer une base de données de textes poétiques prétraités (balisage XML) et d’outils appropriés pour l’étude des formes poétiques sur le plan de leur structure formelle (analyse prosodico-métrique). L’élaboration de tels outils passe par la conception d’algorithmes portant sur : la langue des vers, les propriétés prosodico-métriques du vers, les propriétés de la rime, le répertoire des mètres, les schémas de rime, la distribution de la ponctuation de fin de vers et la formulation d’hypothèses relatives au traitement automatique de la périodicité métrique. Ces différents modules seront ensuite intégrés dans la plateforme de TAL (LinguaStream). A terme, il sera mis en oeuvre une base de données sur serveur de textes poétiques annotés (balisage XML) à partir de textes numérisés d'origine diverse et ciblée (Projet Gutenberg, gallica...). L'annotation consistera à introduire de manière automatique toutes les informations utiles au traitement ultérieur des propriétés prosodicométriques.
Thème 3 : Interactions Langagière et Multimodales (Resp : Jacquet P et Beust P.)
-
Opération 1 : Expression verbale de la douleur
L'évaluation de l'enfant douloureux fait l’objet d’une interaction patient/adulte qui met en jeu bien plus que les connaissances médicales de l'adulte. Lorsqu'il s'agit d'une auto-évaluation de la part de l'enfant, le dialogue implique une interprétation de l'adulte qui écoute. Cette interprétation est nécessairement un processus qui consiste à construire une représentation commune de l’expérience douloureuse. Pour cela, l’adulte ne peut faire l'impasse des capacités de l'enfant, de ses limites, pour qu'enfin une référence commune se partage.
L’intérêt fondamental de ce travail est de mettre en évidence les caractéristiques du dialogue enfant-adulte à propos de la douleur. L’enjeu pour les deux partenaires de l’interaction est de partager un ensemble de représentations concernant un objet commun. Cela nécessite une interprétation de la part de l’adulte de ce que dit l’enfant de ce phénomène subjectif qu’est la douleur. L’enfant, lui aussi, doit interpréter les perspectives et le savoir de l’adulte. La construction de ce « terrain commun » implique un ajustement réciproque dont les étapes se manifestent dans le dialogue.
Les données recueillies et analysées sont des dialogues enfant-soignant ayant pour objet la caractérisation et l’évaluation de l’état douloureux.
Ce travail vise en premier lieu une application pratique. En effet, ce projet permettra de dégager plusieurs caractéristiques de l’expression verbale de la douleur chez l’enfant :
- la nature du vocabulaire utilisé par l’enfant (sensoriel, affectif...) l’utilisation de métaphores et leurs propriétés (exemple : « c’est comme des coups de poing »),
- les conditions d’utilisation de ce vocabulaire en fonction du type de douleur (chronique versus aiguë) en fonction de l’âge de l’enfant et en fonction du contexte (hospitalier ou autre) et de l’histoire médicale de l’enfant.
Cette étude vise aussi la mise en évidence des caractéristiques de l’entretien conduit par l’adulte :
- la nature des outils d’évaluation de la douleur (questionnaires, échelles),
- leur place dans l’évaluation (intensité douloureuse, périodicité de la douleur, localisation et nature de la douleur) et leur fonction dans l’entretien (mesure objective ou support de l’entretien).
- La mise en évidence des éléments caractéristiques du dialogue d’évaluation de la douleur chez l’enfant devra permettre d’établir un guide d’entretien et un questionnaire adaptés à l’âge de l’enfant, à sa pathologie, et au contexte de l’évaluation.
Ce projet fera l’objet d’une part, d’une collaboration entre psychologues, linguistes et informaticiens sur l’analyse et le traitement des corpus notamment à propos des processus métaphoriques particulièrement présents dans la mesure où il n’existe pas à proprement parler de lexique dédié à l’expression de la douleur en français, et d’autre part, d’une collaboration avec les Universités grecques de Corfou (Traductologie) et de Ioannina (Psychologie de la Santé) portant sur la prise en compte des variations interculturelles dans l’expression et l’évaluation de la douleur. -
Opération 2 : Approche énactive pour l’interprétation de documents numériques
Cette opération vise l’étude de l’interprétation de documents numériques dans le cadre de systèmes informatiques du point de vue du paradigme émergent actuellement en Sciences Cognitives qu’est la théorie de l’énaction issue des travaux de Francisco Varela. Dans la conception de systèmes d’aide à l’interprétation, il convient de donner une place centrale à l’utilisateur (voir à un groupe d’utilisateurs) en prenant en compte des spécificités socio-linguistiques telles que son domaine d’activité, ses centres d’intérêt, son lexique et ses terminologies. Ces spécificités ainsi que les rapports entre sujets interprétants et documents manipulés rendent nécessaire plus d’interaction pour un meilleur couplage système/utilisateur. L’interprétation, et l’aide à l’interprétation, sont vues ici comme des activités sémiotiques complexes et forcément interactives car perpétuellement en aller-retour entre le développement de ressources termino-ontologiques (même assez rudimentaires), l’analyse de corpus et la visualisation de données dans le but de faire sens pour l’utilisateur (par rapport à sa tâche). Pour ces raisons, le cadre de l’énaction est tout à fait adapté pour analyser l’interprétation dans un couplage système/utilisateur. Dans une approche énactive de l’interprétation des documents il convient de penser différemment les systèmes à concevoir. Plutôt que de viser un usage particulier (qui en général est contourné par les utilisateurs qui en inventent de nouveaux), il semble préférable ne pas contraindre au préalable des besoins et des finalités des utilisateurs car justement, de manière énactive, ils se définissent dans l’interaction et c’est en partie cela qu’il est particulièrement intéressant d’étudier. Cette opération est menée dans le cadre d’une collaboration avec des collègues Rouennais (Maryvonne Holzem, Jacques Labiche, Jean-Philippe Kotowicz, Nathalie Chaignaud, Eric Trupin, Dominique Dionisi) et soutenue dans les actions STIC/SHS du PUN. -
Opération 3 : Communication médiée et accession aux TIC
Il s’agit ici de s’intéresser aux effets sur le processus de référenciation de la communication médiée par un dispositif d’interface de type Technologies de l’Information et de la Communication. La finalité est double, d’une part étudier les spécificités de ce type de communication et d’autre part, engager les concepteurs de tels systèmes à tenir compte de ces spécificités.
Dans ce contexte, une collaboration est en cours avec la société Utilis. Cette société est en gestation dans le cadre de Normandie Incubation et est soutenue par l’ANVAR.
Les études porteront sur la complexité des systèmes multimodaux dans les processus de communication relatifs à l’interaction homme – machine. Notamment :
- Mieux comprendre les enjeux de la communication verbale et non verbale face aux T.I.C.
- Développer et améliorer les techniques pédagogiques impliquées dans l’utilisation des T.I.C.
- Elaborer les concepts de l’ergonomie cognitive et, notamment, adapter les outils informatiques en relation à chaque type de public impliqué dans le projet Utilis
- Le double enjeu de l’activité de recherche portée par le projet Utilis va être de définir des méthodes pédagogiques (champ lexical, méthodes d’apprentissage, contenu formatif), et de concevoir un cahier des charges sur l’évolution des interfaces, permettant de fournir à ce public particulier un système qui leur soit directement adapté.
Deux thèses, dont une en cotutelle, sont en cours sur ces sujets. -
Opération 4 : La fonction de la multimodalité dans le développement cognitif et langagier des enfants
La communication non verbale dans le développement des enfants, n’est pas juxtaposée au développement cognitif et langagier. Toutefois il est difficile d’objectiver le fonctionnement de cette interaction entre communication non verbale et parole dans le développement des enfants. Dans l’un des projets (thèse de S. Kassouha co encadrée par J Vivier et M. Zabalia) la question est étudiée dans le contexte des structures pédagogiques d’intégration (classes élémentaires et CAT). Dans un second projet, il s’agit de mettre en évidence l’apport cognitif d’une pratique de l’image photographique numérique. Cette étude se réfère notamment aux travaux piagétiens des années 1974 (thèse de W Hodifa, encadrement : J. Vivier)




