• Aucun résultat trouvé

Problèmes généraux de la détection des propositions Nous examinons maintenant les problèmes généraux liés à l’opération de Nous examinons maintenant les problèmes généraux liés à l’opération de

4 É TUDE DE LA PROPOSITION EN FRANÇAIS

4.8 Problèmes généraux de la détection des propositions Nous examinons maintenant les problèmes généraux liés à l’opération de Nous examinons maintenant les problèmes généraux liés à l’opération de

dé-tection automatique des propositions.

Nous allons tout d’abord traiter les problèmes liés aux symboles de ponctua-tion susceptibles de marquer la frontière de proposiponctua-tions mais aussi de provoquer une erreur d’interprétation. Nous aborderons ensuite l’ambiguïté de rattache-ment des syntagmes en fin de phrase, souvent ambigus. Nous examinerons éga-lement deux autres problèmes liés aux deux types de structures où apparaissent particulièrement des ambiguïtés de rattachement ou des problèmes liés à l’ellipse, difficiles – voire impossibles – à résoudre sans contexte : les structures à dépen-dance à distance et les structures de coordination.

Nous ne pouvons, bien entendu, proposer aucune solution à ces questions, mais présentons tout de même l’existence de ces cas d’un point de vue théorique. Il serait intéressant d’étudier, d’un point de vue pratique, la conséquence de ces problèmes dans de futurs travaux afin d’essayer de trouver une piste prometteuse.

4.8.1 Problèmes liés aux symboles de ponctuation

Comme on peut le constater dans la définition des éléments extra-prédicatifs ou des propositions détachées-insérées ou encore des propositions circonstan-cielles insérées, nous accordons de l’importance aux symboles de ponctuation, tels que les virgules, les parenthèses et les tirets, qui sont souvent complètement ignorés dans beaucoup de grammaires formelles.

Beaucoup de structures ne peuvent pas être interprétées correctement sans interprétation correcte des virgules utilisées. À tel point que l’absence d’une vir-gule peut entraîner des ambiguïtés comme le montre Fuchs (1996, p. 110) :

« Au sein d’un texte, par ailleurs ponctué, il suffit parfois de l’ab-sence d’une virgule pour que la segmentation de la phrase en propo-sitions devienne problématique :

Quant à la réforme fiscale, on se demande qui en veut vrai-ment : "Les élus en parlent tant qu’ils n’ont pas à la voter" a dit le ministre.

"Les élus en parlent tant [= tellement], qu’ils n’ont pas à la 176

4.8. Problèmes généraux de la détection des propositions voter" / "Les élus en parlent, tant qu’ [= aussi longtemps

que] ils n’ont pas à la voter" »

Il faut cependant noter leur fiabilité également restreinte, notamment celle de la virgule, comme indicateurs syntaxiques. Le Goffic définit, dans la section consa-crée à la ponctuation de Le Goffic (1993a), la virgule comme séparateur faible, du fait de son caractère polysémique et la qualifie de « séparateur à tout faire ».

Mais s’ils sont polysémiques, c’est bien qu’ils ont un/des sens. Nous devons, lors de l’analyse, non pas les ignorer totalement, mais explorer les indices que laissent ces symboles autant que possible et ce le plus correctement possible. Nous les considérons donc comme des indicateurs secondaires importants et en profitons dans les cas où la frontière indiquée par la virgule est relativement fiable. Nous examinerons l’influence de l’importance accordée à ces symboles – no-tamment les virgules – sur les résultats de l’analyse automatique lors de l’évalua-tion du système dans la secl’évalua-tion 9.3.

4.8.2 Ambiguïté du rattachement des éléments en fin de phrase

Dans certains cas – avec ou sans détachement –, la phrase étant ambiguë, les éléments en fin de phrase peuvent être interprétés aussi bien comme des consti-tuants de la subordonnée que de la racine.

On peut trouver des exemples de ce type dans l’ouvrage de Fuchs (1996) consa-cré aux problèmes des ambiguïtés :

1. Il a dit qu’il donnerait son avis par fax. – Il a dit qu’il donnerait son avis par fax – Il a dit qu’il donnerait son avis par fax

2. Au zoo, on peut voir un lion qui terrifie les badauds et de pauvres petites an-tilopes.

– ... voir un lion qui terrifie les badauds et de pauvres petites antilopes – ... voir un lion qui terrifie les badauds et de pauvres petites antilopes Ce type d’ambiguïté est malheureusement impossible à traiter de façon au-tomatique. Il nous faudra donc décider de la position à adopter face à de telles ambiguïtés.

Dans un autre cas, le rattachement des éléments en fin de phrase peut être correctement analysé par l’introduction d’informations supplémentaires plus ou moins complexes, telles que celles sur la structure argumentale du verbe. Toute-fois, sur le plan pratique, l’ajout de ce type d’information risque de démultiplier les calculs.

Dans le cadre de la présente thèse, nous ne considérons les propositions comme des subordonnées détachées-insérées que lorsqu’elles sont bien entou-rées et détachées par deux symboles de même type. Ainsi, dans le cas des exemples ambigus cités précédemment, les éléments en fin de phrase seraient analysés, non pas comme des compléments discontinus du verbe principal, mais comme des éléments de la subordonnée.

4. ÉTUDE DE LA PROPOSITION EN FRANÇAIS

4.8.3 Structures à dépendance lointaine

Considérons d’abord une phrase ayant une relative dite « longue » ou « imbri-quée ».

Ce philosophe qu’il fautquevous lisiez est très connu. Delaveau (2001, p. 111) explique cette construction ainsi :

« Comme dans les relatives avecdontet pronom, il y a une complétive dominée par la relative, [...], dans les cas de relatives longues, il y a un vide dans la complétive, lequel a la fonction que requiert le pronom relatif en tête. »

Cette dépendance à distance apparaît non seulement dans les relatives, mais aussi dans les percontatives, ainsi que dans les structures clivées :

– Dites-moi avec qui vous croyez que vit Marie. – C’est à Marie que je veux que tu parles.

Il est à noter que les structures déclaratives posent un problème d’apparte-nance du circonstant. La phrase suivante reprise de Fuchs (1996) :

Lundi prochain, fais-moi penser qu’il faudra relire le manuscrit. peut être interprétée comme

– Lundi prochain, fais-moi penser [A] + qu’il faudra relire le manuscrit (= A) – fais-moi penser [A] + Lundi prochain, ... qu’il faudra relire le manuscrit (= A) Dans une structure dans laquelle l’antécédent (ou l’élément extrait dans la structure clivée) a fonction de circonstant, cet antécédent peut être raccroché soit au prédicat de la relative ou de la percontative, soit au prédicat de la complétive enchâssée. Ainsi, dans la phrase (Fuchs, 1996) :

Montre-moi l’endroit où tu as dit qu’il fallait chercher. (relative) Montre-moi à quel endroit tu as dit qu’il fallait chercher. (perconta-tive)

les deux interprétations sont possibles :

– ... l’endroit de ta déclaration selon laquelle il fallait chercher. – ... l’endroit de la recherche nécessaire, selon tes dires.

4.8.4 Structures de coordination

Outre la difficulté de représentation hiérarchique que nous avons abordée dans la section 4.4.2, la structure de coordination est intimement liée, comme le disent Fuchs & Victorri (1993b), au phénomène très délicat et difficile à traiter qu’est l’ellipse.

L’ellipse est « définie comme "l’effacement" de constituantsa priori obliga-toires » (Fuchs et Victorri,Ibid.). Par exemple, souvent, les propositions subordon-nées coordonsubordon-nées partagent des éléments constituants, comme le COD « leurs pains » dans la phrase suivante :

Les boulangersquipréparent etquivendent leurs pains. 178

4.8. Problèmes généraux de la détection des propositions Dans cette phrase, la première proposition subordonnée est-elle terminée

seulement par « préparent » ou partage-t-elle « leurs pains » avec la seconde ? Il est plus naturel de considérer que le syntagme « leurs pains » joue à la fois la fonction de COD pour la première et la seconde proposition sans pour autant être marqué à chaque fois.

L’ellipse a une lourde conséquence pour la détection des propositions. Étu-dions chaque cas d’ellipse en fonction du type d’élément non exprimé.

Omission d’un complément

C’est le cas de l’exemple précédent :

Les boulangersquipréparent etquivendent leurs pains.

Pour nos travaux de détection des propositions, l’idéal serait sans doute d’indi-quer la présence d’un complément non seulement dans la proposition précédant directement le complément, mais également dans la proposition éloignée.

Toutefois, la détermination du complément commun ou non est également délicate. Dans certains cas, la détermination est réalisable par consultation de l’identité lexicale des verbes concernés. Mais dans d’autres cas, elle est impossible comme dans les exemples présentés dans Fuchs (1996) et repris ci-dessous :

Il regarde et il admire Marie. – Il regarde + et il admire Marie

– Il regarde (Marie) + et il admire Marie Il est venu et il est reparti avec tristesse. – Il est venu + et il est reparti avec tristesse

– Il est venu (avec tristesse) + et il est reparti avec tristesse.

Nous abandonnons, du moins dans le cadre de la présente thèse, la détermi-nation des éléments communs et tenons compte uniquement des éléments ex-plicites. La reconnaissance est donc réalisée en extrayant simplement la première subordonnée délimitée par un connecteur quelconque de la seconde subordon-née, sans nous préoccuper des problèmes de l’appartenance des compléments suivant la deuxième subordonnée. Cette représentation est peu cohérente dans le cas où le complément appartient effectivement à la première subordonnée aussi. Nous évaluerons les conséquences de ce choix dans les résultats d’alignement.

Omission du sujet

Nous constatons des problèmes similaires dans les structures de coordination de verbes comme :

Ilachète et revenddes vieux meubles.

Dans ce cas, la question concerne non seulement le complément mais aussi le sujet.

On peut donc considérer que dans l’exemple du paragraphe précédent « Les boulangers qui préparent et qui vendent leurs pains », le complément – commun

4. ÉTUDE DE LA PROPOSITION EN FRANÇAIS

aux deux propositions – est omis dans la première proposition et que pour le der-nier exemple, le complément « des vieux meubles » est omis dans la première pro-position et le sujet « il » dans la seconde propro-position.

La détection de la proposition subordonnée dans laquelle le sujet est omis est réalisable en posant comme condition minimale la présence d’un verbe fini et éventuellement d’un connecteur. Même l’indication du sujet implicite semble envisageable. Mais dans un premier temps nous appliquons au sujet implicite la même règle qu’avec le COD implicite, à savoir la représentation uniquement avec des éléments explicites.

Omission du verbe

Le problème de l’ellipse peut se rapporter non seulement aux compléments, mais aussi aux verbes.

Mon père est français etma mère japonaise.

Les structures des propositions participiales entraînent également l’ellipse de « étant », produisant ainsi des sous-phrases nominales.

Exemples (tirés de Le Goffic (1993a)) :

– Cette affaire (étant) terminée, nous pouvons penser à la suite. – Nous réglerons cette question le moment venu.

– Il est tombé la tête la première.

La détection des propositions dans le cas où le verbe est omis est plus déli-cate que dans les deux cas précédents, car nous ne pouvons plus utiliser comme repère la présence d’un verbe fini. La reconnaissance de ces propositions coor-données sans verbe nécessite beaucoup de calculs comme pour la détection des constructions détachées à prédication seconde, que nous avons abordée dans la section 4.4.3. Tout en ayant conscience de leur importance, nous laissons de côté, dans le cadre de la présente thèse, leur détection qui demanderait une analyse fine de la structure de l’ensemble de la phrase.