• Aucun résultat trouvé

Partie II : Évaluer pour aller vers un outil idéal

Chapitre 3 : Choix des outils

3. Grille d’analyse des trois outils

Nous venons de présenter les trois outils dont nous nous servons pour la tâche d’évaluation dans les prochains chapitres : la MT de MultiTrans Prism, ainsi que les concordanciers myCAT et ParaConc. Nous pouvons mettre en relation ces outils à travers six aspects : la famille, la conception technique, le codage du texte, l’alignement, la recherche et autres fonctions.

Nous les présentons un à la fois en mettant en évidence les différences entre nos trois outils.

À suivre, notre grille d’analyse qui réunit tous ces aspects.

3.1. Famille

Cet aspect indique si l’outil est un logiciel spécifique en commerce, un logiciel mandaté, donc développé pour un client spécifique, ou un logiciel open source, c'est-à-dire un logiciel libre.

Comme nous décrivons dans la section 2, MultiTrans Prism et ParaConc sont des outils spécifiques en commerce, tandis que myCAT est un outil open source.

3.2. Conception technique

La conception technique rassemble les aspects techniques des outils. Tout d’abord, nous distinguons le nombre d’utilisateurs, entre mono-utilisateur, si le logiciel peut être utilisé par une seule personne à la fois, et multi-utilisateurs, si plusieurs personnes peuvent l’utiliser en même temps. Étant un outil qui existe en plusieurs versions, MultiTrans Prism est à la fois mono-utilisateur et multi-utilisateurs, ParaConc est mono-utilisateur, alors que myCAT est multi-utilisateurs.

La deuxième distinction concerne l’architecture qui peut être monoposte (installé sur un ordinateur), client-serveur (installé sur un serveur interne ou externe à l’entreprise qui l’utilise) et interface web (accessible depuis un navigateur web). MultiTrans Prism est disponible dans les trois versions. ParaConc est exclusivement monoposte, alors que myCAT est disponible uniquement en version client-serveur.

La troisième distinction concerne les caractéristiques techniques. Nous avons vu que MultiTrans Prism et ParaConc sont compatibles avec les systèmes d’exploitation Microsoft

64

Windows 32 bits, alors que myCAT est compatible avec Windows 7 64 bits, Windows 2008 Server 64 bits et Ubuntu 12.04 Desktop 64 bits.

Concernant les formats de fichiers supportés, ParaConc n’accepte que les fichiers au format texte, myCAT accepte les PDF ainsi que les fichiers des paquets Microsoft Office et OpenOffice, alors que MultiTrans Prism accepte au total 17 formats de fichiers.

Au niveau des langues supportées, le plus faible semble être ParaConc avec 35 langues, alors que les deux autres logiciels sont en mesure de toutes les supporter.

Enfin, concernant le fonctionnement de base, MultiTrans Prism et myCAT sont des outils statistiques, alors que ParaConc est hybride.

3.3. Codage du texte

Le codage du texte indique la manière dont les corpus sont stockés dans le logiciel.

MultiTrans Prism et myCAT indexent les unités, alors que ParaConc permet d’annoter ou de lemmatiser les corpus.

3.4. Alignement

L’aspect de l’alignement est repris tels que décrit dans le chapitre 2 (section 2). MultiTrans Prism et myCAT disposent d’un alignement automatique, tandis que ParaConc dispose d’un alignement semi-automatique.

Concernant le niveau d’alignement, nous avons vu que les trois alignent au niveau de la phrase, mais que ParaConc utilise l’alignement par longueur de phrases. Quant à myCAT, il utilise pour certaines langues des cartes d'alignement qui sont construites avec Moses et, pour les autres langues, pour lesquelles ces cartes d’alignement ne sont pas disponibles, il fait un alignement géométrique. MultiTrans Prism dispose d’un alignement statistique.

3.5. Recherche

MultiTrans Prism permet d’effectuer des recherches par mot, par troncature et par fuzzy match. Il affiche les concordances en plein texte et propose une liste de mots.

ParaConc propose des recherches par mot avec ou sans joker, par troncature, avec l’opérateur OU, par cooccurrent, par expressions régulières ainsi que des recherches parallèles. Il dispose d’un affichage KWIC avec possibilité de voir l’occurrence sélectionnée en plein texte dans le document d’origine. Il permet également d’obtenir des listes de mots et des collocations.

65

Le logiciel myCAT permet d’effectuer des recherches par mot, par mot avec joker (mais seulement avec une unité), par troncature, par opérateur OU et par cooccurrent. L’affichage est en plein texte avec la possibilité de voir le document dans son format d’origine.

Nous approfondissons l’analyse de l’aspect de la recherche dans les chapitres 4 et 5 car cet aspect est au centre de notre évaluation (voir section 1 du chapitre 4).

3.6. Autres fonctions

Parmi les autres fonctions, MultiTrans Prism dispose, dans l’interface de recherche, d’une fonction permettant de sélectionner et d’ajouter des termes dans la TermBase. Le concordancier myCAT est composé de deux autres parties permettant d’analyser le document à traduire : Quote Detector qui compare le texte à traduire avec les documents contenus dans le corpus et surligne en jaune les parties déjà traduites et Self-Quote Detector qui détecte les séquences de mots qui se répètent le plus souvent.

Nous présentons ci-dessous la grille qui résume les aspects tels que décrits dans cette section.

MT Multi Trans Prism ParaConc myCAT

1. Famille 1. logiciel spécifique en cormmerce X X

2. logiciel spécifique mandaté

3. logiciel open source X

2 .Conception techniques 2.1. nombre d’utilisateurs mono-utilisateur X X

multi-utilisateurs X X

3. Codage du texte 3.1 indexation X X

3.2 annotation X

5. Recherche 5.1. Modalitès de recherche 5.1.1. Recherche simple recherche par mot X X X

recherche par mot avec joker X oui, mais seulement avec un mot

recherche par trocature X X X

5.2 Affichage des données 5.2.1. Concordances affichage plein texte X X

affichage KWIC X

possibilité de voir le document d'origine X X

5.3. Recherche d'informations spéc. 5.3.1. Liste de mots X X

5.3.2. Cluster X

doc, docx, txt, rtf, ppt, pptx, xlsx, xml, html, pdf, wpd,INX, DITA,

MIF, TMX, XLIFF et RTF

PDF, Microsoft Office, OpenOffice txt

67