• Aucun résultat trouvé

Ellipse dans les questions fragmentaires {qs-frag}

Évaluation de la détection automatique sur un corpus de sous-titres

1. Conditions morphosyntaxiques des ellipses et lecture des patrons utilisés

1.9. Ellipse dans les questions fragmentaires {qs-frag}

En dépit de l’absence d’un élément déclencheur de cette catégorie, nous avons maintenu sa détection parce qu’il est possible d’en décrire les conditions morphosyntaxiques dans un patron. En effet, en considérant les indices que ce type d’ellipse laisse dans la phrase, il est généralement observé que le repérage automatique de l’auxiliaire et du sujet manquants peut être envisagé.

Nous avons remarqué que dans certains types et registres de discours, notamment en anglais, tels les dialogues informels et spontanés, lorsque le sujet est ellipsé, son auxiliaire l’est également, rendant parfois la compréhension problématique sans accès au contexte linguistique et/ou extralinguistique. L’exemple (62) ci-dessous illustre justement une question fragmentaire dans laquelle le sujet et son auxiliaire sont omis, laissant visibles seulement le participe présent de la forme aspectuelle be + ing, expecting.

(62) <CDEV> Expecting somebody?

La particularité de ce type de constructions elliptiques tient au fait que leur antécédent est rarement explicite. L’élément ellipsé est cependant sous-jacent à la construction canonique de la phrase.

Ce type d’ellipse vient remettre en question les études antérieures ayant eu recours à une reconnaissance automatique de l’antécédent pour les repérer. En effet,

si le repérage automatique de l’antécédent est nécessaire à l’interprétation du site elliptique, il reste cependant insuffisant lorsqu’il est exophorique, ne se trouvant pas dans le contexte linguistique. S’ajoute à ceci, dans certaines constructions, la difficulté présentée par l’absence d’une marque morphologique d’accord du verbe, qui, si elle était là, pourrait servir d’indice au repérage de ce qui manque. Ces occurrences apparaissent notamment dans les énoncés interrogatifs requérant une réponse affirmative ou négative de la part du co-locuteur (yes/no questions). Il existe en grammaire anglaise deux façons d’exprimer ce type de questions :

– Soit l’auxiliaire est apparent (formes verbales aspectuelles) ; dans ce cas l’interrogation est formulée comme suit : auxiliaire + sujet + verbe ? comme dans

Are you leaving?

– Soit la phrase ne contient pas d’auxiliaire (formes verbales simples), dans ce cas la structure implique l’ajout de l’opérateur do (présent/passé) + sujet + verbe ? comme dans Did she come?

En réalité, l’interaction du registre et de la structure syntaxique est contraignante dans la plupart des cas. Selon le type de discours et son registre, le locuteur prend parfois la liberté d’abréger son propos en ne formulant que la moitié de la question. Il omet ainsi l’auxiliaire et parfois le sujet en ne laissant dans la phrase que le verbe principal. Comme on le voit dans l’exemple (63) ci-dessous, seuls le verbe principal

give et les compléments sont présents.

(63) <CDEV> Ø Ever give money to Gary Thorp? - No, Ø never heard of him.

L’absence de flexion (ou désinence) sur le verbe give dans l’occurrence (63) montre qu’il s’agit ici d’une ellipse de do et du sujet. Se pose alors le problème du temps de do. Or, il s’avère parfois difficile, voire impossible, de le déterminer en particulier lorsque les situations syntaxiques ne contiennent aucun indice, et que seul le contexte en fournit. De la même façon, l’exemple présenté ci-dessous (64) est ambigu du fait de l’incertitude pesant sur le temps de la phrase : do peut être au présent ou au passé sans que la grammaticalité de l’échange en soit affectée.

(64) <CDEV>- Ø Pinch anything?

Par contre, la forme du verbe plein restant dans la phrase interrogative aide au repérage des auxiliaires have et be lorsqu’ils sont ellipsés. En effet, dans l’exemple (64), have et be ne pourraient convenir pour restituer l’ellipse tout comme do ne le pourrait dans l’exemple (65) :

(65) <CDEV> Ø Seeing someone now? Course you are Ø!

C’est également le cas de l’exemple (66) où le participe passé done et la réponse du co-locuteur plaident en faveur d’une ellipse de l’auxiliaire have. Dans ce dialogue, sont fragmentaires à la fois la question et la réponse. En effet, dans la réponse qu’apporte le co-locuteur, une partie du syntagme verbal est ellipsée. L’antécédent de cette ellipse est apparent dans l’occurrence précédente et s’il devait réapparaître dans la structure grammaticale de la réponse, un ajustement devrait être effectué pour garantir sa grammaticalité101 (Hardt, 1991). De ce fait, le remplacement de

something par anything (réponse à something dans le cas d’une déclaration négative)

est nécessaire : done anything like that.

(66) <CDEV>- Ø Ever done something like that? - I haven’t Ø.

Si les flexions et les formes ing et en/ed des verbes restants aident à déterminer l’auxiliaire ou l’opérateur manquant, le temps auquel ce dernier est conjugué n’est pas aisément identifiable par un simple repérage syntaxique. Il requiert en outre de porter une attention particulière à la situation extralinguistique de l’énoncé.

Il est en effet difficile dans certains cas d’identifier le sujet ellipsé dans la phrase. Par défaut, lorsqu’il s’agit d’un dialogue, you est le plus fréquent et convient le plus souvent aux situations. Néanmoins, il arrive parfois que le sujet soit à la troisième personne. Là encore, lorsque l’auxiliaire est ellipsé avec le sujet, il est impossible de déterminer si le pronom ellipsé est celui de la deuxième personne ou de la troisième personne (par exemple, you ou he/she) puisque la terminaison qui permet de faire la

101 Nous rappelons que, comme l’affirment les partisans des approches syntaxiques de l’ellipse, l’élément ellipsé n’est pas toujours une copie exacte de l’antécédent, et des modifications syntaxiques devront être effectuées pour assurer la grammaticalité et l’acceptabilité de la phrase.

distinction en anglais est la marque des auxiliaires. L’exemple (66) accepterait un sujet à la troisième personne sans risque d’agrammaticalité, sous réserve toutefois d’une réponse congruente.

De cette manière, pour constituer le patron permettant la détection automatique de ce type d’ellipse, il apparait nécessaire de prendre en compte les deux conditions ci-dessous :

– Si la phrase commence par un verbe lexical et se termine par un point d’interrogation, nous supposerons qu’il y a deux vides syntaxiques : un vide sujet et un vide auxiliaire.

– Si le verbe est réduit à un participe passé ou un participe présent, nous supposerons que l’auxiliaire absent est soit have, soit be. En revanche, si le verbe est une base verbale (stem), nous supposerons que l’opérateur do ou éventuellement un modal est ellipsé.

Ces conditions sont réunies dans 3 patrons :

Le premier repère chaque phrase contenant un verbe non-conjugué et se terminant par un point d’interrogation. Seuls trois types de tokens peuvent précéder ce verbe, de manière optionnelle : un tiret ou un point (marqueurs typographiques d’un dialogue dans les sous-titres), éventuellement suivis d’un adverbe ou d’un adjectif, puis d’une virgule. Par ailleurs, on ne devra pas trouver de pronom personnel ou de virgule après le verbe.

Le deuxième patron écarte les occurrences comme thank you confondues avec les ellipses, alors que le troisième est consacré aux questions fragmentaires qui n’apparaissent pas en début du dialogue et qui peuvent être précédées par une virgule.

qs-frag 3

^ /[-.]+/? [{pos:/RB|JJ/}]? /,/?

[{pos:/VB|VB[^PZD].*/}] [!{pos:/PRP/} & ! /,/] []* /[?]/

^ /[-.]+/? [{pos:/RB|JJ/}]? /,/?

[{pos:/VB|VB[^PZD].*/} & !{lemma:thank}] [{pos:/PRP|NN/}]? /[?]/

/,/ [{pos:/VB|VB[^PZD].*/} & !{lemma:thank}] [{pos:/PRP|NN/}]? /[?]/

Pour conclure, il n’échappera pas au lecteur que si les patrons sont relativement longs, c’est bien pour détailler toutes les conditions nécessaires à la présence d’occurrences elliptiques de façon à atteindre le plus grand degré de précision. En revanche, ils ne sont pas exhaustifs et ne détectent pas toutes les occurrences existantes. En effet, seules les structures syntaxiques des ellipses figurant dans le corpus de développement sont transférées dans les patrons. L’observation des résultats de la détection dans le corpus d’évaluation permettra de dégager les autres conditions et d’envisager leur détection dans un travail futur.