• Aucun résultat trouvé

Que, la valse des étiquettes

N/A
N/A
Protected

Academic year: 2022

Partager "Que, la valse des étiquettes"

Copied!
14
0
0

Texte intégral

(1)

Que, la valse des étiquettes

Marie-Paule Jacques

Équipe de Recherche en Syntaxe et Sémantique, UMR 5610

Maison de la Recherche, Université Toulouse le Mirail

(2)

Module de l’analyseur SYNTEX (Bourigault et al.) :

Un module dédié à l’analyse de que

- prend en entrée un texte étiqueté par TreeTagger, produit une analyse syntaxique en dépendance ;

- divers modules se succèdent pour déterminer les relations de dépendances des différents mots de la phrase ;

- les plus tardifs peuvent s’appuyer sur les relations placées par les modules précédents.

(3)

Se prononce sur deux types d’étiquettes :

– catégorie morphosyntaxique

– relations de dépendance avec autres mots de la phrase : recteur, régi

Tu crois que tu viendras ?

CSub

Le module d’analyse de que

Principe : mener de front une analyse syntaxique et des décisions sur la catégorie morphosyntaxique, en fondant celles-ci sur la syntaxe.

(4)

Pour TreeTagger, trois étiquettes possibles :

– adverbe

Que cela nous semble alors loin !

Les geysers n’entrent en activité que la nuit et au petit matin.

– pronom relatif

Le volcan est connu pour les risques qu’il constitue pour les populations avoisinantes.

– conjonction de subordination

Les raisons invoquées proviennent du fait que la médecine n’est pas une science exacte.

Catégorie morphosyntaxique

(5)

Quelques difficultés

On appelle compétence du courant la possibilité qu’il a de transporter des matériaux.

J. et M. semblent exclure la possibilité que des opportunités demeurent non perçues.

Cependant on n'est plus persuadé que cette action rasante soit entièrement responsable des formes de champignons constatées dans les déserts

Le volcan n’émet plus, par de nombreux points du cratère, que de la vapeur d’eau surchauffée

(6)

Quelques difficultés

Une solution française semble dans ce cas plus difficile à envisager qu’une reprise par un groupe étranger.

Il n’en reste pas moins difficile à expliquer que les crêtes et sillons prélittoraux ne soient pas toujours parallèles à la côte.

(7)

Principes :

– analyse en deux temps fondée sur des règles

1. exploitation d’informations contextuelles 2. exploitation d’informations de structure

– procède au réétiquetage de que en fonction des

constructions identifiées, si aucune construction n’est positivement identifiée, conservation de l’étiquette attribuée par TreeTagger.

Méthode d’analyse

(8)

Etape 1 : informations locales

Un étiquetage erroné dégrade l’analyse syntaxique.

Aussi ne peut-on que s'inquiéter de voir l'Afghanistan désormais sous la coupe de ces soldats séminaristes archaïques et brutaux.

Donc, nécessité de réviser l’étiquetage morphosyntaxique très tôt dans la chaîne.

Mais, peu d’informations de structure.

(9)

Etape 1 : informations locales

- rattachement des auxiliaires et des adverbes

- liste de noms (fait, possibilité, probabilité, hypothèse, etc.) + que

- liste de verbes (penser, croire, estimer, considérer, espérer, etc.) + que

- liste d’adverbes « comparatifs » (plus, moins, davantage, aussi, autant, etc.) [+ Adj.] + que

Analyse très locale :

il n' a été exploré qu' à la fin du XIXème siècle

il forme une montagne de plus de 9 000 mètres, plus grande que l'Everest !

(10)

Etape 2 : informations structurelles

Permettent analyse à grande distance

Mêmes éléments et règles que précédemment + toutes relations de dépendance

Un « champ électrique » implique une activité qui ne peut être exprimée d’une façon univoque qu’en fonction du temps et de deux ou trois dimensions.

Les procédures s’appliquent aussi bien à une interface à débit de base qu’à une interface à débit primaire.

(11)

Exemple

Il apparaît au contraire à Paul Amiell que la qualité de ses produits et leur suivi de fabrication exigent une production en France.

A gauche de que, Nom Propre, régi par une Prep, régie par un verbe. Test de conditions sur le verbe :

- présence seule de ne : négation exceptive Æ Adv ;

- présence des adverbes : plus, moins, davantage, autant, mieux, tellement… Æ CSub ;

- appartenance du verbe à la liste de ceux qui prennent que comme objet direct Æ CSub + recherche du verbe de la subordonnée introduite par que.

(12)

Résultats

92% +3%

Étape 2

89% +14%

Étape 1

75 % Étiquetage initial

Précision Etape

Etiquetage morphosyntaxique

(13)

Relations de dépendance syntaxique

94% -3%

93% +33%

Étape 2

97%

60%

Étape 1

Précision Rappel

Etape

Résultats

(14)

Conclusion

Stratégie payante : amélioration de l’étiquetage de que, analyse syntaxique convenable, mais…

Différencier selon le genre ?

Impact sur le reste de l’analyse ?

Analyse de surface vs interprétation des relations

Adopter la même méthode pour d’autres mots multicatégoriels ? (comme, si…)

Références

Documents relatifs

Plus le pH est proche de 0, plus la solution est (fortement/faiblement) acide.. Plus le pH est proche de 14, plus la solution est (fortement/faiblement)

[r]

international de ce nouveau système, couvrant les secteurs du transport, du travail et de la consommation, sont décrits dans le « livre mauve » (voir page précédente) : « améliorer

En effet, nous avons encore la perspective d’augmenter la surface accessible au pâturage, de réduire encore les besoins en maïs et donc en intrants. Nous encourageons

De- puis, la fiscalité locale est en questions : assiette archaïque car inadaptée à l’économie devenue numérique et générant des inégalités territoriales qu’une

Dans cet article, nous montrerons comment les humains mobilisent ces deux types de rituels pour voir, finalement, dans quelle mesure la ruse est le mode d’interaction le plus usité

de jongleurs que de

[r]