• Aucun résultat trouvé

Chapitre 3 Classification sémantique du LST nominal

3.2 Sémantique et typologie lexicale

3.2.2 Typologie lexicale

3.2.2.1 Classes de mots et propriétés

La définition de classes de mots est une tâche complexe pour laquelle la subjectivité est souvent de mise. Cruse (1986) remarque qu’il est parfois préférable d’opter pour une plus grande richesse descriptive (au détriment d’une plus grande rigueur théorique), plutôt que de privilégier une théorie complexe aux dépens de l’analyse descriptive. Nous voulons ici représenter les classes le plus formellement possible, cependant, notre but premier est la description sémantique du lexique nominal transdisciplinaire. Dans nos emprunts aux différentes méthodologies et typologies lexicales sur lesquelles nous revenons, nous tenons ainsi compte des particularités du genre étudié et des objectifs détaillés dans l’introduction.

Une typologie peut se faire de manière ontologique ou fonctionnelle (Huyghe, 2015). La première est composée de types incompatibles, partitionnant le réel, définis selon les propriétés référentielles et les « propriétés distributionnelles distinctives ». Les classes de noms d’objets (Le N se trouve) et de noms d’événements (Le N a lieu), décrites à l’aide de constructions linguistiques, relèvent ainsi de la caractérisation ontologique.

La seconde typologie, fonctionnelle, dont les types ne s’excluent pas, prend en compte les relations prédicatives entre arguments, telle la classe des noms partitifs, dont les méronymes guidon, clavier, main décrivent des parties fonctionnelles et séparables. Cette classe regroupe des éléments syncatégorématiques, dénués d’autonomie référentielle, opposés aux noms catégorématiques, comme le rappellent Kleiber et al. (2012). Ces classes nominales « ajoutent ainsi à la composante référentielle la description d’une relation ou d’une prédication » (Huyghe, 2015, p. 12), comme dans les exemples suivants : le guidon

de ce vélo, la main de untel. Les classes fonctionnelles ne correspondent donc pas

à un découpage du réel mais sont caractérisées différemment, par exemple au niveau de leurs rôles relationnels ou argumentaux.

Certaines classes, basées sur les rôles thématiques, combinent typologie fonctionnelle et ontologique. Ainsi, Huyghe & Tribout (2015) étudient les noms d’agents caractérisés ontologiquement (entité animée) et fonctionnellement (agent

réalisant l’action décrite par le verbe de base : un squatteur fait action de squatter,

un chanteur fait action de chanter). La construction de classes de noms peut donc

se fonder sur différents critères : syntaxiques, ontologiques, morphologiques, etc. Barque (2015), dans son étude sur les noms relationnels, note également qu’il n’y a pas de correspondance systématique entre les classements ontologiques et fonctionnels.

Au niveau des critères classificatoires, nombre de travaux en classification lexicale définissent les classes de mots en fonction de propriétés linguistiques. Ainsi, Flaux & Van De Velde (2000) définissent des classes de noms selon des propriétés syntactico-morphologiques vérifiées par des tests linguistiques. Leur classement distingue par exemple les noms de qualité (employés dans la construction être d’un N + expansion8) des noms d’affects (construits avec les verbes ressentir et éprouver).

Le regroupement en classes de mots sur la base de propriétés syntaxiques partagées est également à la base des travaux de Levin (1993) sur les prédicats verbaux de l’anglais. Dubois & Dubois-Charlier (1997) construisent selon une approche similaire, à partir des propriétés syntactico-sémantiques des verbes du français, la ressource Les Verbes Français9 (LVF) à laquelle nous avons eu recours.

Gross (1994) élabore des classes d’objets à partir de traits (humain, animal, locatif…) et définit alors ces groupes en extension en listant les verbes s’y inscrivant. Comme le remarque Le Pesant (1994), le principe des classes d’objets non hiérarchisées fait que certaines classes rassemblent des éléments qui ne sont pas nécessairement en relation de co-hyponymie, ce qui rend leur représentation dans une arborescence unifiée impossible. De plus, Giry-Schneider (1994) soulève les problèmes liés à l’utilisation de ces traits, en premier lieu celui de leur inventaire, pour lequel un consensus reste à trouver.

Au niveau de la structuration des typologies lexicales, Kleiber & Lammert (2012) rappellent que les études se sont spécifiquement concentrées sur 3 domaines particuliers : la détermination (à travers l’opposition comptable/massif), la hiérarchisation des noms (par les relations d’hyponymie et d’hyperonymie) et les

8 « Ce passage est d’une grande clarté » – Orléan, A. (2005). La sociologie économique et la question de l’unité des sciences sociales. L’Année sociologique, 55(2), 279-305.

9 Disponible à cette adresse : http : : //rali.iro.umontreal.ca/rali/? q=fr/node/1237 [consulté le 30/07/2015]

correspondances entre les noms et leurs dérivés verbaux, adjectivaux ou adverbiaux. Plus spécifiquement, les recherches sur les noms sont particulièrement nombreuses, ces derniers étant des « items lexicaux privilégiés dans la réflexion […] sur la structure du lexique » (Huyghe, 2015). La catégorie nominale, la plus fréquente dans les vocabulaires et les occurrences, est également centrale dans la réflexion sur l’organisation des concepts. Afin de réduire au maximum la subjectivité inhérente à la classification sémantique, les chercheurs élaborent des tests sur les propriétés spécifiques des membres d’une classe. Ces propriétés peuvent porter sur la complémentation, la possible association avec certains verbes supports, l’aspect duratif, etc. Ainsi, parmi les classes ayant fait l’objet d’études approfondies, nous pouvons citer, d’après Huyghe (2015) :

Les noms d’artefacts : comptables, se construisent avec des verbes comme

fabriquer, construire.

Les noms de propriétés : dénotent des situations d’aspect statif, non dynamique.

Les noms de territoires : hyponymes des noms de lieux, se construisent avec

dans et sur, et ne peuvent être repris par dedans et dessus.

Différents critères sont utilisés pour définir les types, notamment ceux portant sur la description spatio-temporelle : les tests d’extension (Le N mesure/a duré), d’ancrage (Il y a eu un N), et le repérage (Elle est vers le N, Elle a lieu lors du N). Les noms d’objets répondent positivement aux tests spatiaux tandis que les noms d’événements valident les tests temporels. Cette distinction permet ainsi de désambiguïser l’acception résultative ou processive d’un nom déverbal (le nom

classification peut valider le test d’extension temporelle dans son acception processive mais non dans son acception résultative). Un autre critère, l’aspect dynamique, est également employé, via la construction venir de / être en train de. Des classes intermédiaires sont quelquefois définies, pour une description plus fine, tel le dégroupement fait entre objets matériels et informationnels, ou celui opéré entre agentifs dispositionnels et occasionnels (Huyghe & Tribout, 2015). La définition et l’étude de ces sous-classes sont alors justifiées par la grande hétérogénéité de leur super-classe.

Huyghe (2015) note cependant que même la dichotomie concret/abstrait est complexe à définir, selon que la distinction repose sur l’aspect matériel/immatériel, accessible/inaccessible aux sens, autonome/dépendant ontologiquement.

Nous nous situons ici dans une approche comparable à celle de Flaux & Van de Velde, en définissant des classes sémantiques en fonction de propriétés lexico-syntaxiques. Des tests d’appartenance sont alors associés aux classes en question, validant les traits définitoires de celles-ci. En cas de polysémie, il faut s’assurer de tester le mot sous l’acception traitée afin de ne pas intégrer à tort une acception à une classe, comme le note Cruse (1986). Considérons par exemple le nom étude et les acceptions qu’il recouvre selon le DEM :

1. ‘travail intellectuel’: acception relevant du LST, appartenant à la sous-classe {processus_cognitif/examen} ;

2. ‘livre sur sujet défini’:acception non intégrée au LST, du fait de la relation entre acception processive (sens précédent) et acception résultative (sens présent) comme nous le détaillons dans la section 3.3.1.2 ;

3. lieu pour travail individuel’: acception ne relevant pas du LST ;

Lorsque nous intégrons à la classification le nom étude, nous testons son appartenance à une classe dans son acception transdisciplinaire, à savoir l’acception 1. Le test lexico-syntaxique d’appartenance à la sous-classe {processus_cognitif/examen} est « fournir/conduire un N ». L’acception 1 du nom

étude satisfaisant le test de cette sous-classe, cette entrée étude-1 du LST nominal y est intégrée.

L’acception 3 répond positivement au test de la classe {espace} : « Se situer dans/à N ». Cependant, comme ce sens ne relève pas du LST, le nom étude n’est pas associé à cette classe.

En conclusion de cette revue des travaux antérieurs, nous pouvons distinguer, en sémantique lexicale, les travaux portant sur des classes larges et génériques, de ceux se concentrant sur l’étude de classes précises. Parmi les premiers, Fasciolo (2012) met en place des tests pour différencier les mots dont les traits définitoires sont des connaissances partagées (tigre, ordinateur) des noms

plus abstraits (lieu, chose), les sommitaux10, comparés aux pronoms de par leurs comportements similaires. Parmi les seconds, se trouvent les études centrées sur les noms d’agents et d’instruments (Huyghe & Tribout, 2015), d’idéalités (Flaux & Stosic, 2014), relationnels (Barque, 2015), dynamiques (Haas & Gréa, 2015), etc.

De ces travaux, nous reprenons plusieurs points :

la prise en compte de la polysémie nominale (voir l’exemple précédent avec le nom étude) ;

une approche basée sur la combinatoire, en associant aux classes des tests lexico-syntaxiques déduits de l’observation des cooccurrences en corpus ;

certaines classes déjà décrites par différents auteurs : temporalité, espace ;

certains tests lexico-syntaxiques :

test d’extension, pour la classe {temporalité/durée} : année, cycle, période ;

test d’ancrage, pour la classe {support de communication/exposé} :

colloque, conférence.

Nous notons cependant que ces différentes classifications ne sont pas complètement adaptées à notre lexique spécialisé (aux acceptions largement abstraites) et aux applications que nous visons. En effet, les traitements automatiques de recherche d’informations (de termes, de routines sémantico-rhétoriques) impliquent une certaine granularité dans la typologie du LST. Nous retiendrons ainsi certains éléments de ces travaux tout en s’assurant de leur adéquation avec la spécificité du genre d’écrit et de lexique qui nous intéressent ici. Nous présentons dans la partie suivante les études portant sur l’élaboration de classifications dans les écrits scientifiques dont nous reprenons en partie la méthodologie ou la typologie.

10 Les noms sommitaux constituent « un ensemble réduit de noms à fréquence élevée ayant une référence généralisée au sin de classes nominales majeures (e.g. noms de lieux, faits). » (Adler & Eshkol-Taravella, 2012, p. 113)