• Aucun résultat trouvé

III – Méthodes existantes de comparaison et d’évaluation des outils d’aide à la traduction

7. Exécuter l'évaluation:

4.3 Profil utilisateur

Un profil utilisateur est « une source de connaissance qui contient des acquisitions sur tous les aspects de l'utilisateur qui peuvent être utiles pour le comportement du système32 ».

32 Wahlster et Kobsa (1986)

Dans notre cas, le profil utilisateur prend en compte la personne en charge de l’alignement, mais aussi le type d’outils utilisé par cette personne, ainsi que le corpus de textes à sa disposition, qui est représentatif du type de textes traduits au CICR. Les prochains points présenteront en détails tous les aspects du profil utilisateur de ce travail.

4.3.1 La personne chargée de l’alignement

Il est important de connaître la façon dont est utilisé un outil pour pouvoir définir correctement les critères que nous souhaitons évaluer. Comme nous l’avons expliqué auparavant, la mémoire de traduction du CICR est alimentée massivement via l’outil d’alignement WinAlign. L’utilisateur est donc une personne qui récupère des couples de textes, les prépare, puis les aligne dans WinAlign. Ensuite, elle doit impérativement vérifier que les alignements sont corrects, afin de garantir une qualité irréprochable aux segments présents dans la mémoire.

Pour pouvoir aligner correctement avec WinAlign, la préparation des textes est indispensable : elle consiste à supprimer certains éléments des textes, comme le suivi des corrections, les smart tags, les retours forcés, les tables des matières… Le but est d’éviter que WinAlign ne les reconnaisse pas et bloque durant la segmentation, ou qu’il segmente de manière erronée et que la validation de l’alignement soit plus longue.

Les tests que nous allons faire passer aux deux outils ont souvent été imaginés sur la base de l’expérience de travail que nous avons accumulée avec WinAlign. Nous allons donc faire passer ces tests à WinAlign et à AlignFactory, pour voir lequel des deux est le plus performant. Mais nous n’allons pas seulement tenter de piéger AlignFactory sur la base des erreurs relevées lors de l’utilisation de WinAlign : nous allons bien entendu également comparer la gestion des tâches basiques par les deux outils.

4.3.2 WinAlign de SDL Trados 2007

WinAlign fait partie de la suite d’outils de Traduction Assistée par Ordinateur SDL Trados 2007, qui contient aussi une mémoire de traduction (le Workbench) et un outil d’alignement (WinAlign).

Le service du Comité International de la Croix-Rouge où j’ai effectué mon stage utilise la suite d’outils de SDL Trados depuis le milieu des années 90. La mémoire de traduction est la plupart du temps alimentée massivement via WinAlign par des stagiaires engagés spécialement pour le faire. Les traducteurs du service sont peu nombreux à travailler avec la mémoire de traduction – l’utilisation de celle-ci impliquant un investissement en temps que tous ne peuvent pas se permettre. La situation est en train de changer, puisque les traducteurs qui entrent sur le marché aujourd’hui ont souvent reçu une formation pour ces outils, contrairement à leurs prédécesseurs.

Les traducteurs qui travaillent avec le Workbench de Trados envoient leurs textes nettoyés aux réviseurs, puis enregistrent eux-mêmes les corrections dans la mémoire après que la révision a été faite. Si un texte important doit être ajouté à la mémoire, les traducteurs peuvent le faire eux-mêmes en suivant la procédure mise en place dans le service, mais cela reste exceptionnel.

4.3.3 AlignFactory de Terminotix

Quant à la suite d’outils de Terminotix Inc., elle ne contient pas de mémoire de traduction, mais un outil d’alignement (AlignFactory). Elle peut être complétée par un moteur de recherche terminologique (LogiTerm) et un outil de dépouillement terminologique (SynchroTerm).

Terminotix propose donc un outil d’alignement destiné à alimenter les mémoires de traduction de ses concurrents, puisque lui-même n’en offre pas. Dans ce dessein, il enregistre les fichiers qu’il produit au format .tmx, pour qu’ils soient compatibles avec la plupart des autres mémoires de traduction. À noter que depuis août 2009, Terminotix offre la possibilité d’aligner gratuitement des textes en

ligne grâce à YouAlign (http://www.youalign.com/). Même si la taille des fichiers est limitée et que toutes les fonctionnalités ne sont pas disponibles, cela donne une bonne idée des capacités de l’outil complet qu’est AlignFactory.

4.3.4 Le corpus de textes

Le corpus que nous allons utiliser pour ce travail est composé de textes traduits et révisés par les traducteurs du CICR de Genève dans le courant de l’année 2008, puis alignés et importés dans la mémoire de traduction pendant mon stage, au mois de juillet 2009. Ils sont, pour la plupart, publiés et accessibles sur le site www.cicr.ch, et bien entendu de nature non-confidentielle. Il s’agit de communiqués de presse, de rapports, d’études ou de bulletins.

Les textes fournis ont systématiquement une version en français ; ensuite, la plupart sont des bitextes (français + anglais ou espagnol) et quelques-uns des multi-textes (français + anglais + espagnol).

Les fichiers ont été enregistrés au format Word 2007 et sont tous de tailles différentes ; en effet, certains textes ne font que quelques lignes alors que d’autres font plusieurs pages.

Afin d’effectuer l’évaluation, nous avons choisi les textes qui me semblaient le mieux correspondre à chaque type de test. Nous avons, par exemple, choisi des textes longs pour le test sur la vitesse d’alignement, de manière à obtenir un résultat interprétable. Les textes seront alignés à l’état brut (sans préparation), sauf pour les tests concernant la performance des outils avec et sans préparation.

Les textes choisis seront présentés plus en détail (longueur, nombre de mots, préparation) dans la partie 4.5 de ce mémoire, qui définira les critères détaillés.