Soutenance de thèse de Firas HMIDA
6 février 2017 @ 14 h 00 min - 17 h 00 min
FreeFiras vous invite à sa soutenance de thèse réalisée sous l’encadrement de Emmanuel Morin et Béatrice Daille, intitulée :
« Identification et exploitation de contextes riches en connaissances pour l’aide à la traduction terminologique ».
Ella aura lieu lundi 6 février 2017 à 14h00 à la FST – salle 3 du bâtiment 11.
———-
Résumé :
Les outils de Traduction Assistée par Ordinateur et de gestion terminologique sont le plus souvent utilisés pour répondre au besoin de la gestion de l’écrit multilingue et monolingue. En effet, ils facilitent l’accès aux termes techniques et aux expressions liés à des domaines de spécialité, et indispensables à tout processus de communication.
La compréhension de ces expressions techniques peut être potentialisée au moyen de leur « contextualisation ». Néanmoins, avoir accès à un terme ou à sa traduction ne suffit pas, encore faut-il être capable de l’employer correctement et d’en appréhender le sens exact. Cette contextualisation a donc lieu à deux niveaux : dans les textes et dans la terminologie. Au niveau textuel, l’utilisateur doit avoir accès à des informations concernant l’usage des termes, à savoir des contextes riches en connaissances linguistiques. Au niveau terminologique, il doit avoir accès aux relations sémantiques ou conceptuelles entre termes afin de mieux en saisir le sens, à savoir des contextes riches en connaissances conceptuelles. Dans le cadre de cette thèse, nous avons proposé une stratégie d’extraction de contextes riches en connaissances (CRC) permettant de produire une nouvelle génération de dictionnaires terminologiques. Ces derniers présentent, pour chaque terme et ses traductions éventuelles, une fiche terminologique listant les CRC et explicitant les connaissances qu’ils contiennent.
Nous avons poursuivi nos travaux dans un cadre bilingue et plus particulièrement en phase de révision du processus de traduction spécialisée. Cette phase, qui veille à la cohérence du document produit, nécessite la mobilisation d’informations terminologiques accessibles à travers des glossaires et des outils de gestion dédiés. Dans ce travail, nous proposons une méthodologie d’élaboration d’un concordancier bilingue fournissant des CRC alignés à partir de corpus comparables spécialisés. Il s’agit de contextes partageant des propriétés bilingues conservées entre les langues source et cible d’un corpus comparable. Ces contextes ont pour but d’aider à vérifier l’usage d’un terme à traduire et de sa traduction attestée. Les évaluations manuelle et expérimentale menées avec des réviseurs montrent que les CRC proposés sont utiles malgré la difficulté de l’exercice étudié.
———-
Abstract:
Computer-assisted translation and terminology management tools are often used to meet the needs in management of multilingual and monolingual writings. These tools facilitate the access to technical terms and expressions that are related to areas of specialty, and essential to any communication process.
The understanding of technical terms can be potentiated by their « contextualization ». However, having access to a term or its translation is not enough, since it is also necessary to be able to use it properly and to understand its exact meaning.
Thus, this contextualization is estabilished on two levels : in texts and in the terminology. In texts, the user must have access to information regarding the use of terms, namely linguistic knowledge-rich contexts. In the terminology, the user requires access to semantic or conceptual relationships between the terms to better understand its meaning, namely conceptual rich-knowlegde contexts.
In the framework of this thesis, we proposed a strategy for extracting Knowledge-Rich Contexts (KRCs) to produce a new generation of terminological dictionaries. They are to provide, for each term and its possible translations, the KRCs in which it occurs.
We continued our work in a bilingual phase part of specialized translation, under continuous revision. This phase, which ensures the consistency of the document produced, requires the preparation of terminological information accessible through glossaries and dedicated management tools. We propose a new generation of bilingual concordancers that take as input a term and its translation, and provides not parallel, but aligned Knowledge-Rich Contexts from specialized comparable corpora. Both the manual evaluation and a real experiment with student revisers show that our concordancer actually assists revisers despite the difficulty of the task.