• Aucun résultat trouvé

CHAPITRE V :D’UN CORPUS A L’ELABORATION D’UN RESEAU RELATIONNEL : LA QUESTION

2. R OLE DU CORPUS DANS LA DESCRIPTION DES MARQUEURS DE RELATIONS CONCEPTUELLES

2.1. Postulats sous-tendant la constitution de réseaux, en terminologie et en intelligence artificielle

2.2.2 Dépendance en fonction du genre du corpus

2.2.2.2 Le cas de chez

Chez apparaît dans certains énoncés où « s’exprime » une relation de méronymie. Par

exemple :

Chez les colobinés, le nez fait saillie sur la lèvre supérieure.

Contrairement à avec, pour chez, une étude complète a été menée, qui est décrite dans (Condamines, 2000). Je ne donne ici que les principaux résultats.

Afin de suivre mon intuition selon laquelle l’interprétation méronymique des phrases avec

chez est particulièrement liée au domaine des sciences naturelles, j’ai étudié une série

d’exemples contenant chez en provenance de textes qui varient quant à leur genre. Le corpus d’étude contient ainsi trois séries de phrases :

les unes extraites de l’Encyclopedia Universalis (387 occurrences de chez), ensemble noté EU1,

d’autres extraites du journal Le Monde (100 occurrences de chez), ensemble noté LM,

– d’autres extraites du Cahier de notes de Claude Bernard de 1860 (127 occurrences de chez), ensemble noté CB.

Ces trois séries d’occurrences ont été sélectionnées dans des rubriques (dans un livre pour la troisième) relevant des sciences naturelles. Un quatrième exemplier a été utilisé comme élément de comparaison, il s’agit d’extraits de l’Encyclopaedia Universalis comportant chez, en lien avec le domaine des idées et de la création (78 occurrences), noté EU2. Au total, ce sont donc 692 exemples qui ont été étudiés.

Structure et interprétation des phrases en chez

Les phrases avec chez correspondent à trois structures (la position du syntagme avec chez n’est pas prise en compte car elle n’a pas de pertinence pour l’expression de la méronymie). 1- Chez (det1)N1, structure présentative det2N2

Chez les lémurs, il existe des zones glandulaires circumgénitales (N1 : Lémurs, N2 : zones glandulaires circumgénitales).

136 2- Chez (det1)N1, det2N2 prédicat

Les callosités ischiatiques sont séparées chez les mâles comme chez les femelles (N1 : mâles, femelles, N2 : callosités ischiatiques).

3- Chez (det1)N1, (det3N3) prédicat det2N2

L’arrivée du printemps crée une sorte de fièvre chez les observateurs d’oiseaux

(N1 : observateurs d’oiseaux, N2 : fièvre, N3 : arrivée du printemps).

Il faut tenir compte du fait que chez n’est pas toujours associé à une interprétation méronymique mais parfois à une interprétation d’une autre nature : localisation concrète (spatiale), ou relation d’une autre nature, souvent difficile à identifier. Le décompte pour chacune des quatre séries d’exemples (EU1, LM, CB et EU2), pour chacune des trois structures et pour chacune des trois interprétations de la relation entre N1 et N2 permet d’aboutir aux conclusions suivantes.

Aucune structure syntaxique n’est particulièrement habilitée à renvoyer à une interprétation plutôt qu’une autre.

En revanche, la nature du corpus intervient dans l’interprétation de la relation entre N1 et N2 : les corpus didactiques de sciences naturelles (EU1 et CB) favorisent l’interprétation méronymique (plus de 50% des cas) alors que le corpus didactique sur un autre domaine (EU2) l’empêche complètement, ce qui confirme mon intuition première. Le corpus journalistique sur les sciences naturelles (LM) est plutôt favorable à l’interprétation d’une relation non méronymique entre N1 et N2 (environ 70 % des cas), ce qui prouve que la notion de didacticité joue un rôle majeur dans l’expression de la méronymie en lien avec chez ; les deux caractéristiques sont ainsi importantes : le corpus doit à la fois appartenir aux sciences naturelles et il doit être didactique.

On retrouve le même mode de fonctionnement qu’avec dans la mesure où il fait intervenir une forme, une interprétation et un genre de corpus. Toutefois, deux changements majeurs sont à noter.

D’une part, la structure dans laquelle apparaît chez ne semble pas pertinente pour repérer la relation puisqu’aucune des trois structures identifiées n’est discriminante (alors que pour

avec, seules les structures de type [détN1 avec détN2] étaient pertinentes).

D’autre part, dans le cas de avec, on avait le sentiment que c’était cette préposition même qui permettait l’accès à l’interprétation relationnelle et donc qu’un rapport très stable s’établissait entre l’élément et l’interprétation. Il en va tout autrement avec chez. En effet, si l’on considère des exemples qui ont une structure parfaitement identique et qui sont issus du même genre de corpus (sciences naturelles et didactique), on constate que certains, majoritaires, ont une interprétation méronymique et d’autres non. Ainsi, il y a méronymie dans :

Chez la majorité des bivalves…, le caecum du stylet s’isole de la poche stomacale,

mais pas dans :

La ménarche chez les Cercopithecoidea et les Hominoidea est généralement suivie par une période de « stérilité d’adolescence »…

Dans ces deux exemples, seule varie la position du syntagme avec chez, dont j’ai montré qu’elle n’était pas pertinente (cf. l’article complet). Or, dans le premier exemple, il y a une relation de partie à tout entre caecum du stylet et bivalves alors qu’il n’y a pas cette relation entre ménarche et cercopithecoidea. L’interprétation est peut-être guidée par certains autres éléments des énoncés, que l’on peut caractériser sémantiquement : poche stomacale dans le premier cas, qui oriente vers une interprétation méronymique, période de stérilité dans le second, qui oriente vers une interprétation non-méronymique, mais dans certains exemples, rien ne permet de décider ou pas en faveur de l’interprétation méronymique :

137

Chez les cercopithécidés, le magot (Macaca sylvanus) occupe une place à part du fait de l’intensité des interactions entre les mâles adultes et les jeunes.

D’autres occurrences de ces noms, dans d’autres contextes, peuvent permettre d’aider à l’interprétation mais en aucune manière, on ne peut considérer que la présence de la préposition chez suffit pour discriminer les énoncés méronymiques des autres. En d’autres termes, alors que chez apparaît très souvent dans des contextes où l’interprétation de relation méronymique est possible, on ne peut pas dire que ce soit chez qui donne accès à cette interprétation mais un ensemble d’autres éléments, présents ou non dans le corpus entier66. On peut essayer de comprendre comment ce fonctionnement se met en place avec chez.

En fait, chez permet de mettre un élement en évidence, le reste de la phrase donnant une information sur cet élément. Ce qui reste vrai, c’est que, dans le contexte des sciences naturelles, cette information porte majoritairement sur l’anatomie, d’où une abondance de phrases qui mentionnent un élément « méronymique »67. On ne peut pas dire ainsi que chez « marque » la relation méronymique entre deux éléments ; en revanche, si l’on se place du point de vue de la recherche d’information, on peut dire que chez, dans un corpus de sciences naturelles, didactique, peut être utilisé comme marqueur de la possible présence d’une relation de méronymie : d’une certaine façon, il sert de marqueur (d’indice) de la possibilité de trouver une relation mais il n’en donne pas l’interprétation. Dans une perspective de recherche d’information, il est intéressant de se fonder sur cet élément puisque, si le corpus est didactique dans le domaine des sciences naturelles, dans un cas sur deux la relation sera méronymique.

On pourrait penser que ce fonctionnement est propre à chez. Or, ce n’est pas le cas. J’ai mentionné pour avec des cas où [détN1 avec détN2] « n’exprimait pas » une méronymie par exemple, T2 avec vue sur les Pyrénées.

On pourrait trouver bien d’autres exemples, comme ces phrases avec comme extraites du même Atlas scolaire :

Un département comme la Seine bénéficie à la fois d’arrivées d’enfants et de scolaires.

On comprend que les lycées professionnels et d’enseignements général, comme l’université, soient très peu tournés vers les formations scientifiques et technologiques.

Dans le premier cas, il existe une relation d’hyperonymie entre La Seine et département mais ce n’est pas cette relation qui existe dans le second exemple. Les structures étant identiques, elles ne peuvent être utilisées pour discriminer les deux sens. Pour un corpus sur un domaine inconnu, le recours à ce seul marqueur ne permet pas de décider pour l’un ou l’autre sens. Dans certains cas toutefois, on peut arriver à trouver d’autres éléments de forme qui contraignent l’interprétation. Le repérage des déverbaux peut ainsi permettre de sélectionner les exemples sans relation partie à tout, aussi bien dans le cas de chez que dans celui d’avec :

Chez les embryons , l’excitation des nerfs donne lieu à des convulsions dans les muscles. Séjour avec accès direct à la piscine.

Mais il reste des phrases qui échappent à toute possibilité de contrôle par la seule forme :

La frugivorie est le régime le plus répandu chez les primates. Résidence avec gardien.

66 Lorsque ces éléments ne sont pas présents dans le corpus complet, on peut dire qu’ils proviennent d’une connaissance antérieure, « présupposée », c’est-à-dire en fait, rencontrée dans d’autres discours, par exemple, lors de l’apprentissage de la langue.

67 Il faut noter d’ailleurs que les cas d’interprétation méronymique apparaissent majoritairement au début des articles de l’Encyclopaedia : c’est en effet, par la description anatomique que commencent généralement ces articles, qui se poursuivent par la description du mode de vie : alimentation, habitat, reproduction…

138

Comme je l’ai déjà signalé, seule une analyse sémantique approfondie qui s’appuie à la fois sur la compétence de locuteur, sur les autres occurences des termes à analyser (souvent dans d’autres textes que celui à l’étude d’ailleurs), sur l’objectif de la modélisation, voire, sur le recours à un expert, peut permettre d’interpréter certains exemples.

D’un point de vue informatique, donc strictement formel, on ne peut pas arriver à discriminer les cas qui, bien qu’apparaissant dans une structure particulière peuvent avoir au moins deux interprétations possibles68. Dans un souci d’efficacité, on peut cependant constater, après analyse linguistique approfondie d’un corpus échantillon, qu’une des interprétations est largement favorisée et donc que le bruit (produit par un outil) à gérer par l’interprétant ne sera pas trop important. Par exemple, il n’est certainement pas pertinent de chercher à repérer la méronymie dans un corpus littéraire (au cas où cela pourrait avoir un intérêt mais qui sait ?) en recherchant les phrases contenant avec ; en revanche, cela a une pertinence si on utilise un corpus de genre « catalogue ».