• Aucun résultat trouvé

PARTIE II : ÉTUDE EMPIRIQUE

Chapitre 7 : Extractions et études de collocations

7.4 Problèmes d’extractions et de traduction

Le TAL a plusieurs défis dont l’un des plus difficiles à relever est le traitement des expressions polylexicales et autres expressions idiosyncrasiques. L’étiquetage en partie du discours avec Winbrill, auquel nous avons eu recours dans

le cadre de notre mémoire de Master a montré beaucoup de limites, du fait d’un taux

élevé d’erreurs d’étiquetage. Avec l’extraction des patrons qui comportent des adjectifs, aussi bien pour l’anglais que pour le français, l’étiqueteur se trompe

presque systématiquement en confondant pour une forme donnée, -ed par exemple,

les catégories de nom et adjectif. Du fait de ces multiples reconnaissances erronées, nous avons préféré procéder de manière semi-automatique.

En partant d’une considération purement statistique, l’extraction de termes candidats qui ont trait à la terminologie médicale a été faite à partir du corpus. Ensuite différentes combinaisons acceptables ont été essayées avant de nous assurer, à l’aide d’autres corpus et dictionnaires de leur existence effective. Cela montre l’intérêt que peut avoir un travail de repérage, recensement et de compilation des collocations dans une base de données en vue de leur exploitation future. Le corpus proposé dans les trois langues sera enrichi tout au long de nos recherches. Cela dans le but de concevoir un corpus représentatif, de poursuivre un travail de recherche et d’enrichissement terminologique du wolof.

La plasticité fonctionnelle des formes a donc constitué le principal problème pour l’extraction des patrons N_ADJ pour ce qui est des lexèmes qui se terminent en

-ed en anglais. Un autre cas de plasticité qui concerne l’adjectif est celui qui est suivi de deux noms et peut donc modifier soit les deux noms soit le premier. En français, la difficulté porte sur le statut d’adjectif et le participe passé. Dans tous les cas de figure, cette plasticité fonctionnelle des formes doit être prise en compte dans le cadre d’un traitement automatique.

Les problèmes de traduction rencontrés sont à la fois d’ordre lexical et grammatical. Les problèmes d’ordre grammatical nous intéressent tout particulièrement. En effet, la difficulté de dénomination rencontrée est étroitement

liée au fait de trouver des équivalences concises en wolof lorsqu’il s’agit de traduire

les patrons syntaxiques N_ADJ du français. Le connectif u assure différents rôles.

Valeur relationnelle (de localisation)

La première valeur du u est relationnelle (lié à). C’est une formulation qui

établit un rapport entre l'affection et sa localisation dans une partie du corps, un objet « non aliénable » (le cœur, les yeux, les pieds, etc.). Le premier constat à faire

est son caractère générique, voire approximatif. C’est une formulation qui induit d’autres caractérisations en vue de retrouver des différentiations. On peut prendre l’exemple de veine et artère qui ont été désignés par waruwaayu deret (canal, lieu

de passage du sang) alors que respectivement la spécification de jujëmcixol (qui va

vers le cœur) et jujógecixol (qui part du cœur) ne transparaît pas.

Valeur causale

C’est une valeur qui s’attache à l’origine ou à l’agent qui provoque une maladie. C’est une formulation qui est également générique et fait appel à davantage de spécifications :

(55) Feebaru suukaru deret su ëpp Maladie de sucre de sang Relat en trop Hyperglycémie

(56) Feebaru suukaru deret su yés Maladie de sucre de sang Relat en carence Hypoglycémie

L’usage de paraphrase révèle, au-delà de carences lexicales, que la notion de qualificatif et d’adjectif est indissociable du système verbal. Thiaw (2013) donne deux caractéristiques morphosyntaxiques. Elles sont propres à des lexèmes à fonction modificatrice qui ont également tous les attributs aspecto-temporels du verbe.

Ainsi, selon Thiaw (2013), une caractéristique morphologique de certains lexèmes à fonction modificatrice est de former leur substantif en aay.

(57) Magg / maggaay Grand / Grandeur (58) Ñuul / Ñuulaay Noir / Noirceur

Du point de vue syntaxique, il est possible de leur adjoindre un déterminant à la fin du syntagme modificateur.

Dans les exemples suivants, il faut relever la plasticité sémantique des formes verbonominales.

176

(59) Ferñent wu weex Cellule relat blanc Globule blanc

Ici, weex, revêt un statut de verbe portant toutes les valeurs d’aspect et de temps. Il revêt également un statut d’adjectif et en accepte les caractéristiques

morphosyntaxiques : une substantivation en –aay,l’adjonction de défini.

(60) Waxu wu magg (goitre)

Magg porte toutes les valeurs aspecto-temporelles et accepte les

caractéristiques morphosyntaxiques. Ainsi, on a, du point de vue morphologique

maggaay (grandeur) et syntaxique Magg bi (le grand, celui qui est grand).

Nous pensons que la combinaison, lexème+classe+connectif, lorsqu’elle

entre en relation avec un autre lexème crée un rapport modificateur avec celui-ci. Elle garde des attributs verbaux, sauf dans les cas où l’expression comporte un certain degré de figement. Dans ces cas de figure, si la phrase est syntaxiquement

acceptable, sa sémantique pose problème, puisque la combinaison n’a pas

Synthèse de chapitre

Ce chapitre consacré à l’extraction de termes en anglais et en français a permis de voir les différentes typologies de collocations les plus fréquentes pour ces langues. Des comparaisons ont été effectuées. Celles qui seraient susceptibles d’apparaître dans notre corpus trilingue ont été répertoriées. Une attention particulière a été accordée aux collocations lexicales qui nous semblent les plus représentatives. Par ailleurs, vu la place du système verbal wolof dans cette langue, l’on pouvait se douter que l’étude des constructions à verbes supports révélerait des résultats tout aussi intéressants que ceux qui ont été trouvés dans les deux langues étudiées.

Dans le corpus anglais et français, on relève une multitude de possibilités collocationnelles de l’anglais qui se limite à deux occurrences. Le français les rend

avec trois occurrences comportant la préposition de, en l’absence d’adjectifs. Deux

types de discours ont été explorés : le discours scientifique spécialisé et le discours de vulgarisation. Le rôle du premier est de permettre le repérage de termes et de patrons syntaxiques propres à la langue de spécialité, le second apparaît comme l’équivalent de notre corpus wolof. La multiplicité de types de patrons syntaxiques (N_ADJ, V_N, etc.) ainsi que leur nombre devraient faciliter la constitution de corpus en wolof.

Dans le corpus wolof, un certain nombre de verbes, d’expressions et de tournures propres à la métalangue a été relevé.

Les collocations de type N_ADJ sont celles qui occupent une place centrale dans notre travail. Elles sont les collocations les plus nombreuses. En langue de spécialité, elles sont révélatrices d’un certain degré de spécialisation. Des difficultés ont été rencontrées à la suite des démarches systématisantes de désignations équivalentes en wolof.

Ces difficultés liées à l’extraction sont essentiellement le fait de la plasticité fonctionnelle des formes et des limites du traitement automatique de la langue.Ces écueils ont pu être évités, notamment grâce à une extraction semi-automatique qui requiert plus de temps. Un tel procédé a permis d’avoir un résultat dépouillé et qui est conforme à nos besoins de compilations de termes et de collocations.

178

Pour ce qui est de l’usage de deux substantifs reliés par un connectif, son caractère parfois générique donne lieu à une autre spécification. Au lexème déjà

modifié, est ajoutée une autre précision. Cela se fait à l’aide d’une subordination ou

d’une séquence nom+connectif+nom.

Que cela soit pour la suite de deux lexèmes ou encore la paraphrase, la traduction des termes et collocations extraits vers le wolof, révèle le caractère imbriqué entretenu par le système verbal et la notion d’adjectif. La modification ne

se fait pas qu’à l’aide d’un lexème, il apparaît néanmoins que le degré de figement

Chapitre 8 : Discussions

Ce chapitre qui clôt l’étude empirique est consacré à un compte rendu du travail de terrain que nous avons effectué dans le but de répertorier les besoins terminologiques. Il permet aussi de faire des remarques sur notre principal outil de travail : le corpus. En effet, un travail portant sur la terminologie répond à des besoins spécifiés. Il semble donc opportun de déterminer ces besoins avec l’aide des spécialistes concernés.

Les études sur corpus ont fait l’objet de nombreuses critiques, notamment sur le fait que les résultats produits ne soient pas véritablement généralisables. Il s’agit

de relever les limites auxquelles nous avons fait face. Les extractions d’informations

terminologiques sont évoquées. Les modalités de constitution de corpus trilingue, en annexes, sont données.

Le dernier point abordé est le cadre d’application des présents travaux. Nous

avons, tout au long de nos recherches, gardés à l’esprit qu’une thèse doit servir à la

communauté scientifique, en enrichissant un champ de recherche, en apportant des précisions, mais qu’elle doit in fine, avoir un impact positif, palpable ou encore

opératoire. Nous avons alors fait mention de l’aspect utilitaire, didactique

principalement de nos recherches.

Le développement de la terminologie en wolof passe par la socioterminologie. Cette dernière est prise en compte dans un cadre social bien déterminé. Il semble donc nécessaire pour la mise en œuvre d’un tel travail de voir si le besoin d’élaboration de terminologie est exprimé (§8.1) par les professionnels et quel en serait la portée. Si d’après nos recherches les besoins sont réels, il n’en demeure pas moins que les principaux concernés suggèrent sur quels points, il est essentiel de centrer un tel travail. Il est donc nécessaire qu’un travail de terrain d’envergure nationale se fasse. C’est la raison pour laquelle nous avons tenu, à notre niveau, à mener une enquête de terrain auprès des professionnels de la santé.

L’étude sur corpus a montré des avantages dont nous avons parlé (§8.2). Dans le sous-chapitre suivant (§8.3), les principes de constitution du corpus terminologique trilingue sont dégagés. Aussi, a-t-il paru opportun de donner le cadre d’application des travaux terminologiques (§8.4).

180