• Aucun résultat trouvé

4.3 Analyse syntaxique

4.3.1 S YGMART : un outil de manipulation d’éléments structurés

4.3.2.1 La grammaire de S YGFRAN

L’analyse syntaxique produite par SYGFRAN respecte assez rigoureusement nos règles structurelles définies dans le précédent chapitre. Il existe cependant quelques différences, dont certaines affectent notre approche. Nous présentons maintenant ces différences.

L’attachement des compléments. SYGFRAN adopte, pour certains constituants, un point de vue similaire à celui de la grammaire traditionnelle, où les verbes requérant un groupe circonstanciel comme compléments sont marqués d’un trait d’intransitivité. Ce comportement a pour conséquence de généralement attacher à la proposition ces consti- tuants, comme pour le groupe à Paris dans la phrase Je vais à Paris, et donc de les considérer comme des modifieurs de la proposition, lesquels sont effaçables, à tort ici. D’autres attachements de compléments, notamment aux têtes adjectivales et adverbiales, ne sont pas toujours considérés dans SYGFRAN.

Comme dans le Lefff , ce sont les verbes qui disposent de l’information la plus complète sur leurs éléments sous-catégorisés. Cependant, le caractère obligatoire des compléments n’est pas spécifié dans SYGFRAN.

Ces différences ne sont dues qu’à une légère différence de point de vue dans les gram- maires ainsi qu’une grande quantité d’informations de sous-catégorisation manquantes dans le dictionnaire de SYGFRAN. Ce dernier pourrait d’ailleurs être enrichi et ajusté sur ce point, à l’aide de ressources lexicales telles le Lefff .

Cette problématique a fait l’objet d’un stage de première année en informatique à l’École Normale Supérieure de Lyon68. Ce stage, intitulé « Exploitation de la construc-

tion syntaxique des verbes pour l’évaluation automatique de l’influence sémantique de leurs compléments », fut réalisé début 2006 par François Dupressoir, encadré par Augusta Mela, maître de conférences en sciences du langage à l’Université de Montpellier 3, et moi-même. Durant ce travail, F. Dupressoir a posé les prémisses à l’exploitation d’une ressource lexicale, le lexique-grammaire, dans l’objectif d’améliorer la qualité des attache- ments des compléments du verbe dans SYGFRAN, pour enfin prévenir la suppression des compléments obligatoires lors d’une compression de phrases.

Cette étude a abouti à une technique de correction de l’analyse qui consiste, dans les grandes lignes, à :

1. pour chaque verbe de la phrase, considérer l’ensemble de ses constituants frères et oncles dans l’arbre syntagmatique, c’est-à-dire ceux qui ont le plus de chance de correspondre à un complément du verbe mal attaché ;

2. pour chacun de ces constituants, sélectionner ceux qui se voient attribuer la même fonction syntaxique pour toutes les entrées, dans le lexique, du verbe considéré ; 3. pour enfin attacher les constituants sélectionnés à leur tête verbale.

Pour les constituants qui, selon les entrées du lexique, disposent de fonctions différentes vis-à-vis du verbe considéré, F. Dupressoir propose de marquer l’ambiguïté d’attachement en générant deux sous-arbres syntagmatiques dans le groupe verbal, un pour chaque at- tachement. Ainsi aucune information n’est perdue lors de l’analyse, et d’autres critères pourront être utilisés, dans un traitement ultérieur, pour trancher sur l’attachement.

Cette approche s’est concentrée sur les compléments du verbe, cependant le principe reste applicable à tout type de tête. En pratique, comme nous l’avons vu au chapitre précédent, les ressources lexicales exploitables adéquates à ce type de travail ne couvrent à l’heure actuelle qu’une petite partie du lexique. Nous n’avons donc pas encore pu réaliser une mise en œuvre de cette technique de correction sur l’attachement des compléments.

Il est cependant possible de procéder à des corrections manuelles par l’ajout de règles en post-traitement à l’analyse TELESI de SYGFRAN. À ce sujet, nous avons vu deux

68

exemples de telles règles en section 4.3.1.3. Nous avons exploité cette technique pour garantir un bon attachement des compléments, sur un petit corpus de textes, lors de l’évaluation de COLIN, présentée dans le prochain chapitre. Ce procédé reste toutefois limité, car il n’est pas possible de créer manuellement des règles permettant de couvrir l’ensemble des sous-catégorisations pour tous les lemmes de toutes les catégories lexicales de têtes. De plus, une adaptation du dictionnaire et des règles de SYGFRAN, en intégrant ces informations de sous-catégorisation, est plus adéquate à cette problématique. Cela nécessite toutefois un travail d’enrichissement de grande envergure qui n’est envisageable qu’à plus long terme.

L’attachement des modifieurs. Certains modifieurs ne révèlent que peu d’informa-

tion sur l’élément auquel ils doivent s’attacher. Parfois, des connaissances très précises sur les têtes impliquées sont nécessaires. Ainsi dans l’exemple4.2, le constituant souligné de la phrase a est modifieur du nom salade, alors que dans la phrase b, le constituant souligné est modifieur de la proposition.

Exemple 4.2

a Je mange une salade avec des croûtons. b Je mange une salade avec des baguettes.

SYGFRAN les analyse tous deux comme attachés à la proposition. Pour déterminer l’attachement correct dans la phrase a, il faudrait disposer de l’information que des croû- tons ne peuvent habituellement être utilisés comme instrument pour le prédicat manger. D’autres constituants ne fournissent aucune information sur leur attachement, révélant alors une réelle ambiguïté. Ainsi dans l’exemple4.3, il est impossible de déterminer si les jumelles sont l’instrument avec lequel le sujet regarde la fille ou si ces jumelles sont un objet que la fille porte (ou des êtres humains jumeaux de sexe féminin accompagnant la fille) : les deux attachements sont possibles et tout à fait corrects.

Exemple 4.3 Je regarde une fille avec des jumelles.

Comme pour le précédent cas, SYGFRAN attache par défaut le constituant souligné à la proposition.

Ces problèmes d’attachement affectent moins la qualité des compressions produites, puisque la fonction syntaxique de ces constituants mal attachés reste celle de modifieur.

Les variables syntaxiques. Un certain nombre d’autres différences porte sur la termi-

nologie des fonctions syntaxiques. SYGFRAN utilise un vocabulaire inspiré de grammaires telles le Grevisse ou le Bescherelle, qui diffère sensiblement du nôtre. Ainsi, un adjoint dans SYGFRAN désigne un modifieur. Au sujet des compléments, un attribut du sujet ou un complément d’objet direct, indirect ou second désigne un complément du verbe. SYGFRAN attribue la fonction de sujet au groupe sujet, laquelle correspond à un com- plément obligatoire dans notre grammaire. Il nous suffit alors de rechercher les sujets et de leur attribuer notre fonction. Enfin, SYGFRAN n’attribue pas de fonction au prédicat. Cependant, le groupe verbal complément de la proposition est facilement identifiable, car c’est le seul fils du nœud propositionnel de type groupe verbal fléchi.

Cette terminologie est utilisée au niveau des variables renseignées pour chaque nœud de l’arbre. Afin de retrouver notre terminologie, nous avons créé notre propre variable fonctionnelle, qui exploite alors les variables précédemment citées pour déterminer la fonction syntaxique de nos constituants.