L’obtention des variantes syntaxiques - Les marqueurs de définition

5.2 Les marqueurs de définition

5.2.2 L’obtention des variantes syntaxiques

Le tableau 5.2 est le résultat de l’examen systématique des combinaisons des différents constituants, avec indication dans la colonne de droite des combinaisons effectivement attestées (référence de schéma), des combinaisons envisageables (A créer), et des combinaisons impossibles (~).

Nc1 Nn V= Nc2 Vp SV Schéma + + + + + + SE + + + + - + À créer + + + - + + ~ + + + - - + ~ + + - + + + ~ + + - + - + ~ + + - - + + SR1’ + + - - - + SR1’’ - + + + + + SR1 - + + + - + À créer - + + - + + ~ - + + - - + ~ - + - + + + ~

45 Cette section reproduit presque textuellement Pascual et Péry-Woodley 1997c. Bien que j’aie pris une part active à l’élaboration du travail présenté dans cet article, et que j’aie malheureusement assumé seule sa rédaction après la disparition d’Elsa Pascual, l’idée de départ avait été largement impulsée par elle, et m’a conduite dans des territoires qui m’étaient quelque peu étrangers. D’où une difficulté d’intégration dans le reste de mes travaux, et par conséquent de reformulation.

- + - + - + ~

- + - - + + SR2

- + - - - + SR2’

Tableau 5.2 : Combinatoire des catégories. Quelques explications :

a) Nn et SV étant les éléments de base des schémas ne peuvent être soumis à cet examen systématique. Sans terme à définir, sans differentiae, pas de définition…

b) V= et Nc2 vont obligatoirement de pair, puisque le rôle de V= est précisément d’établir la relation d’équivalence entre le definiendum qui le précède et le definiens qui le suit. C’est là la base même de la définition classificatoire : L’objet EXTRACTION (Nc1 Nn) désigne (V=) un fichier ASCII (Nc2). Comme on va le voir, cet aspect classificatoire peut être absent de la définition (V= et Nc2 tous deux absents), mais il est inconcevable de rencontrer V= ou Nc2 sans son compagnon. Le tableau 5.2 fait donc état de combinatoires fonctionnellement impossibles (notées ~), qu’on ne cherchera pas à générer46.

c) les catégories sur lesquelles on peut jouer sont par conséquent Nc1 et Vp. Le tableau 5.2 indique deux schémas non-attestés mais possibles (A créer), qui ne diffèrent de schémas attestés que par l’absence de Vp :

Nc1 Nn V= Nc2 SV Nn V= Nc2 SV

Les textes suivants, qui bien que non-attestés semblent tout à fait acceptables, ont été produits selon ces deux schémas possibles :

(18’) Le paramètre entier est un filtre numérique qui sélectionne les contextes à afficher ou à exporter

à partir de l’exemple attesté :

(18) Le paramètre entier est un filtre numérique qui permet de sélectionner les contextes à afficher ou à exporter

De même :

(19’) Le filtre est un patron de fouille qui définit les entrées du dictionnaire que l’on veut sauvegarder.

à partir de :

(19) Le filtre est un patron de fouille qui permet de définir les entrées du dictionnaire que l’on veut sauvegarder.

Apparaît donc clairement ici un méta-schéma constitué par la présence de toutes les catégories, dont les variantes peuvent être décrites en termes de réduction à zéro d’une ou plusieurs catégories. Pour vérifier l’hypothèse d’un méta-schéma unique, nous en avons examiné de plus près l’obtention selon la méthode harrissienne (Harris, 1968; 1982; 1991). Des schémas observés aux phrases élémentaires : la méthode harrissienne

Dans le modèle mathématique élaboré par Harris, la langue apparaît comme un système d’ensembles définis par des relations entre éléments. Les phrases ont ainsi la propriété d’être décomposables en phrases primaires ou élémentaires; inversement, il est possible d’engendrer de manière récursive toutes les phrases possibles à partir d’un sous-ensemble de phrases élémentaires. Ceci est faisable parce que le modèle définit les relations

46 Notons que cette optique “génération” n’implique pas exclusivement une visée applicative en génération de texte, puisqu’on peut aussi souhaiter générer systematiquement toutes les variantes possibles pour le repérage automatique.

entre phrases de la langue et phrases élémentaires en termes d’un nombre fini de transformations et d’opérateurs. La formulation d’une théorie du langage repose pour Harris sur cette abstraction d’éléments primitifs à partir des objets directement observables. Nous montrons comment la formulation des liens formels qui unissent nos schémas de définition nous a amenées à modifier notre description initiale.

Si deux schémas de phrase sont reliés par une transformation, la différence dans les séquences de mots ou de classes de mots constituant ces schémas peut être :

– une permutation des classes de mots ou des constantes, – l’addition ou l’omission d’une constante,

– l’addition ou l’omission d’une classe de mots.

Les transformations sont obtenues par application successive d’un nombre restreint d’opérateurs :

– les opérateurs de phrase : ϕ_s.Les opérandes de ces opérateurs sont des phrases, qui se comportent alors comme des noms, devenant un sujet ou un objet de l’opérateur.

– les opérateurs de connexion : ϕc : S1, S2 ∅ S1 C S2. Il s’agit d’opérateurs portant sur des couples de phrases, réalisés par exemple en français par les conjonctions de coordination et de subordination.

– l’opérateur de permutation sur les symboles : ϕp..

– l’opérateur de réduction à zéro : ϕz. Les réductions à zéro interviennent après l’application de ϕs ou de ϕc, rendant possible dans certaines conditions l’effacement d’éléments reconstituables à partir de la phrase réduite. C’est le cas dans nos métaschémas pour les sujets de propositions infinitives ou les antécédents répétés de pronoms relatifs. On verra qu’elles s’appliquent aussi sur les métaschémas eux-mêmes pour produire des variantes.

– l’opérateur de changement morphophonématique : ϕm. Il agit sur la forme phonématique d’un morphème sous l’effet d’un opérateur.

Il faut ajouter à cette liste l’opérateur ϕk, opérateur de bonne formation, qui produit les phrases élémentaires. L’application successive de ces opérateurs est à la base de presque toutes les transformations. Il convient de distinguer dans cette liste les opérateurs de bonne formation et de connexion, qui sont des opérateurs dits "incrémentiels" parce qu’instrumentaux dans la construction de la signification de la phrase, des trois derniers, qui sont qualifiés d’opérateurs "déformationnels", leur application ne modifiant pas la signification.

Un exemple : l’obtention d’un méta-schéma particulier

Dans un premier temps, nous partons d’un exemple attesté, qui va nous permettre d’exposer pas à pas et de façon illustrée l’obtention d’un méta-schéma. Après avoir analysé cet exemple en phrases élémentaires, nous décrivons dans le détail le processus de sa reconstruction par l’application d’opérateurs. Nous présentons ensuite le processus général, sous la forme d’un arbre tenant compte des différentes réalisations.

Notre analyse va prendre comme point de départ un schéma complet, exemplifié par la définition attestée suivante :

(20) L’objet message désigne un écran de messages qu’on peut superposer sur l’écran du journal

Cette définition est analysable en trois phrases élémentaires : – Message est un objet

– X superpose cet écran de messages sur l’écran du journal

Les transformations qui s’appliquent à ces phrases élémentaires sont détaillées ci-dessous (les éléments soulignés sont ceux sur lesquels porte l’opérateur) :

1. Nn être un Nc1 ϕ_k

Message est un objet

2. Ce Nc1 V= un Nc2 ϕ_k

Cet objet désigne un écran de messages

3. Le Nc1 Nn V= un Nc2 ϕ_c(ϕ_m(ϕ_p(ϕ_z(1))), ϕ_z(2)) L’objet message désigne un écran de messages

4. X V= Ωi ϕ_k

X superpose cet écran de messages sur l’écran du journal

5b. X Vp que 4 ϕ_s(4)

X peut que X superpose cet écran de messages sur l’écran du journal

6bγ. X Vp 5b ϕ_m(ϕ_z(5))

X peut superposer cet écran de messages sur l’écran du journal

7bγ. 3 [qu] 6bγ ϕ_c(3,6)

L’objet message désigne un écran de messages [qu] on peut superposer cet écran de messages sur l’écran du journal

8bγ. Le Nc1 Nn V= un Nc2 qu’ on Vp V-inf (SN) ϕ_m(ϕ_z(7))

L’objet message désigne un écran de messages qu’on peut superposer sur l’écran du journal

Commentaire :

– les phrases 1, 2 et 4 sont les phrases élémentaires de départ (ϕ_k) ;

– la phrase 3 est obtenue par la connexion (ϕ_c) des phrases 1 et 2, connexion qui s’accompagne de la réduction à zéro de V= (ϕ_z(1)), de la permutation de Nn et de Nc1 (ϕ_p), de la transformation du déterminant (ϕ_m), et de la réduction à zéro de Ce Nc1 (ϕ_z(2)) ;

– la phrase 5b est le résultat de l’application d’un opérateur de phrase (ϕ_s) qui lui intègre la phrase 4 ;

– la phrase 6bγ résulte d’une réduction à zéro de que X (ϕ_z(5)) et du passage du verbe à l’infinitif (ϕ_m) ;

– l’application d’un opérateur de connexion sur 3 et 6 donne la phrase 7bγ ;

– 7bγ, par l’application d’une réduction à zéro (ϕ_z(7)) et la réalisation de l’opérateur [qu] par qu (ϕ_m), devient 8bγ, notre phrase de départ.

Les quatre réalisations du méta-schéma

Si de 1 à 4, le processus d’obtention des méta-schémas s’applique de la même façon à toutes les définitions, les indices ajoutés à la numérotation à partir de 5 indiquent en revanche qu’on a alors plusieurs options, l’exemple développé ci-dessus appartenant à la branche bγ. La figure 5.2 représente sous forme arborescente les divers embranchements du processus général d’obtention des méta-schémas. La première fourche, en 4, correspond à des constructions relatives différentes, objet du verbe comme ci-dessus, ou sujet comme dans

(21) Le paramètre entier est un filtre numérique qui permet de sélectionner les contextes à afficher ou à exporter

L’exemple (21) correspond à la connexion des deux phrases : 3. Le Nc1 Nn V= un Nc2

Le paramètre entier est un filtre numérique 6a Ce Nc2d Vp 5a

Ce filtre numérique permet de sélectionner les contextes à afficher ou à exporter

La réduction à zéro s’opère de la même façon que pour la branche a, mais l’opérateur [qu] sera dans ce cas réalisé par qui pour donner :

8a Le Nc1 Nn V= un Nc2 qui Vp Vi-inf (Sn)

Outre cette distinction entre relative sujet et objet, représentée par les branches a et b respectivement, trois autres différences syntaxiques entraînent une complexification de l’arbre d’obtention des méta-schémas. La branche a autorise une forme de connexion entre les phrases constituantes autre que la transformation relative de la branche aα, comme le montre l’exemple ci-dessous :

(22) La commande Distance est un analyseur lexico-statistique. Elle permet de comparer statistiquement les lexiques de deux sous-textes quelconques d’un corpus. Ici, on garde deux phrases et la connexion se fait par le biais de la pronominalisation. C’est la branche aβ. Pour la branche b, on a vu dans l’exposé initial un exemple où l’antécédent de la relative était complément direct du verbe de la phrase 6. Il s’agit de la branche bγ. L’antécédent peut aussi être un complément prépositionnel, et ainsi appartenir à la branche bδ comme dans :

(23) L’objet EXPORTATION désigne un fichier de listage standard en ASCII sur lequel pourront être exportés divers résultats affichables

1 ϕϕϕϕk 2 ϕϕϕϕk 3 ϕϕϕc(ϕϕ ϕϕϕm(ϕϕp(ϕϕϕ ϕϕz(1))), ϕϕ ϕϕz(2)) ϕ 4 (4γ, 4δ) ϕϕϕϕk (Nc2=sujetV=) (Nc2=compV=) 5a 5b ϕϕs(4) ϕϕ (Nc2=objet V=) (Nc2=c.prép V=) 6a 6bγ 6bδ ϕϕm(ϕϕϕ ϕϕϕz(5)) ϕc=relative ϕc=pronom 7aα 7aβ 7bγ 7βδ ϕϕc(3,6) ϕϕ 8aα 8aβ 8bγ 8βδ ϕϕm(ϕϕϕ ϕϕϕz(7)) Figure 5.2 : Obtention des méta-schémas.

La figure 5.2 résume l’obtention des quatre méta-schémas. Elle montre ce qui les rassemble, – un processus commun faisant intervenir les mêmes opérateurs –, et ce qui les distingue, – des relations syntaxiques différentes au sein des phrases élémentaires de départ, et une réalisation différente de l’opérateur de connexion en ce qui concerne la branche aβ. Transformations sur les méta-schémas

Pour être complète, cette modélisation doit maintenant envisager les transformations qui peuvent s’appliquer aux quatre méta-schémas, examiner les contraintes auxquelles elles sont soumises, et en projeter les résultats. Les attestations de transformations dans le corpus sont de deux types : réductions à zéro et permutations.

a) Réductions à zéro

On a déjà observé, lors de l’examen de la combinatoire des catégories, certaines des contraintes qui s’appliquent aux réductions à zéro : Nn et SV ne peuvent y être soumis, V= et Nc2 sont inséparables et ne peuvent s’effacer que simultanément.On peut maintenant y ajouter les observations suivantes, présentées dans l’ordre syntagmatique des éléments47, à partir d’une variante d’un schéma du tableau 5.1 :

Nc1 Nn V= Nc2 Vp SV

(24) La commande Distance est un analyseur lexico-statistique

qui permet de ^{comparer statistiquement les} lexiques de deux sous-textes quelconques d’un corpus

47 Pour la clarté de la présentation, j’illustre toutes les réductions à partir du même exemple. Les attestations en corpus sont bien sûr différentes. L'utilisation d'un seul exemple permet également de mettre en valeur la faculté génératrice de la méthode.

1) Nc1 : la réduction à zéro de Nc1 semble n’être soumise à aucune condition. A partir de tout méta-schéma on doit donc pouvoir systématiquement dériver un schéma réduit. Pour la phrase (24), cela donne :

(24’) Distance est un analyseur lexico-statistique qui permet de comparer statistiquement les lexiques de deux sous-textes quelconques d’un corpus.

2) [V= Nc2] : la réduction à zéro de [V= Nc2] a pour condition que Nc2 soit sujet de Vp, en d’autres termes elle ne s’applique qu’à la branche a de l’arbre d’obtention des méta-schémas. Rappelons que dans le méta-schéma, V= met en relation d’équivalence Nc2 et le couple Nc1 Nn. Une fois Nc2 réduit à zéro, c’est ce couple Nc1 Nn qui devient sujet de Vp. L’application de cette transformation à notre exemple produira :

(24’’) La commande Distance permet de comparer statistiquement les lexiques de deux sous-textes quelconques d’un corpus.

3) VP : la réduction à zéro de Vp nécessite également que Nc2 soit sujet de Vp (branche a). Elle est toutefois indépendante de la réduction à zéro de [V= Nc2], comme le montrent les phrases suivantes, dérivées de deux états différents de notre exemple :

(24’’’) La commande Distance est un analyseur lexico-statistique qui compare statistiquement les lexiques de deux sous-textes quelconques d’un corpus

(24’’’’) La commande Distance compare statistiquement les lexiques de deux sous-textes quelconques d’un corpus

b) Permutation par passivation

Nous faisons état dans (Pascual & Péry-Woodley, 1997c) de deux types de permutation : passivation et permutation de Nc1. La seconde nécessiterait une étude plus approfondie, comme elle met en cause la relation entre les deux expressions possibles du genus, par Nc1 sans assertion, et par Nc2 avec assertion. Je ne la traiterai donc pas ici. Je reviendrai en revanche sur la question de l’assertion du genus en 5.2.3.

La passivation requiert que Vp ait un sujet autre que Nc2 (branche b de l’arbre d’obtention des méta-schémas), toujours réalisé par on dans les attestations, comme dans l’exemple ci-dessous :

Nc1 Nn V= Nc2 Vp SV

(25) L’objet MESSAGE désigne un écran de messages qu’on peut superposer sur l’écran du journal

L’application de la passivation à cette phrase, avec effacement de on, donne :

(25’) L’objet MESSAGE désigne un écran de messages qui peut être superposé sur l’écran du journal.

Ce travail doit être envisagé comme une étape dans la modélisation de la structure interne de l’objet textuel définition et de son fonctionnement dans les textes à consignes. Il permet de mettre au jour les liens formels unissant les diverses formulations de définitions par une analyse qui est en même temps une méthode de génération systématique. Nous avons en effet montré que des métaschémas sont obtenus de façon régulière par l’application d’un petit nombre d’opérateurs. Ces métaschémas donnent ensuite lieu à des transformations qui produisent autant de variantes. Les diverses configurations sur lesquelles s’appliquent les opérateurs ont été décrites, et on a pu montrer que les types d’opérations et l’enchaînement de leur application étaient communs à toute une famille de schémas. Ceci équivaut à la mise au point d’une méthode systématique d’obtention de définitions.

Dans le document Une pragmatique à fleur de texte : approche en corpus de l'organisation textuelle (Page 75-82)