• Aucun résultat trouvé

Les règles de grammaire utiles à la structuration de la LSF ont donc été élaborées dans le but d’analyser des énoncés en LSF et d’en produire des arbres de dépendance en premier lieu, puis des graphes sémantiques en second lieu.

La démarche a donc été, pour pouvoir analyser la LSF, d’en formaliser la transcription des éléments « lexicaux », ce que nous avons présenté dans la section précédente. Ces éléments lexicaux établis, nous avons cherché à observer comment ils interagissaient, i.e. quels éléments dépendaient de quels éléments. S’est alors installé un dialogue entre la grammaire et le lexique que nous avons appréhendé comme étant morphologiquement riche, avec de forts liens morphosyntaxiques. C’est ainsi qu’a émergé toute notre approche de la typologie verbale et des flexions nominales que nous avons exposées dans le chapitre précédent.

Illustration

Pour mettre en évidence que la spécificité linguistique de la LSF est bien retrouvée, prenons l’énoncé en français (101) qui doit être traduit par (102). Bien entendu, cette spécificité est relative à la hauteur de ce que nous avons pu en traiter.

(101) Donnez-moi du dentifrice (102) Dentifrice donner’tu’je’bco

La traduction automatique génère le graphe sémantique de la Figure 37.

Graphe issu du traitement effectué avec TiLT, France Télécom Figure 37 : Graphe conceptuel correspondant à l’énoncé « donnez-moi du dentifrice »

Ce graphe conceptuel donne les éléments suivants : [TRANSACTION.donner] est la représentation prédicative du verbe donner. Sont liés à ce prédicat 4 individus représentant le bénéficiaire [ACTANT.locuteur], l'interlocuteur [ACTANT.interlocuteur], la situation [MODE~IMPERATIVE] et le dentifrice [ACTIVE_SUBSTANCE.dentifrice]. On peut noter que l’interlocuteur émerge de la flexion de donnez et ne correspond pas à une unité lexicale autonome dans la phrase source.

Le verbe donner en LSF se fléchit en agent, en patient et en proforme. En génération, les prédicats [ACTANT.locuteur] et [ACTANT.interlocuteur] se grammaticalisent donc sur le verbe pour restreindre le paradigme des formes possibles pour le verbe donner. La règle d'attachement (Figure 38) de la relation THEME contraint les verbes de ce type à s'accorder en proforme avec leur thème. Cette contrainte sélectionne la proforme « bco96 » disponible pour un signe comme dentifrice et compatible avec le verbe donner. Le schéma de cette règle précise également, par l’orientation des chevrons (>>), que le constituant THEME se place avant le verbe.

96 « bco » signifie « bec de canard ouvert ».

RègleAttachement GV-PROF-CC THEME Schéma GV-PT-ABC >> GN-NC|GN-NP ConditionsPrincipal (SY_THEME_GV/!)

AutresConditions ((P/CONFIGURATION U D/CONFIGURATION_VERB) (P += SY_THEME_GV))

Figure 38 : Règle de grammaire pour l'attachement du THEME

Figure 39 : Arbre syntaxique non-linéarisé généré pour « dentifrice donner’tu’je’bco »

L'arbre syntaxique (Figure 39) généré permet de linéariser correctement l'énoncé en LSF (103) avant d’obtenir la sortie XML (104) que l’on transmettra à l’avatar.

(103) dentifrice donner’tu’je’bco (104) <SYNTHESE_SIGNES>

<SEQUENCE>

<SIGNE ID="DENTIFRICE"/>

<SIGNE ID="DONNER_TU-JE">

<CHANNEL TYPE="RIGHT_HAND">

<CONFIG>

<START ID="BCO"/>

<END ID="BCO"/>

</CONFIG>

</CHANNEL>

</SIGNE>

<SIGNE ID="."/>

</SEQUENCE>

<TEXTE_SOURCE LAN="francais">Donnez-moi du dentifrice</TEXTE_SOURCE>

<TEXTE_CIBLE LAN="sgn-FR">dentifrice donner'tu'je'bco.</TEXTE_CIBLE>

</SYNTHESE_SIGNES>

Applications

Développées par le laboratoire LN

Le dispositif est au centre d’un certain nombre d’applications en cours de développement telles que :

le système de questions-réponses pour des applications liées à des bases de données : annuaires, services, etc.

l’abrégeur de textes qui produit des résumés en mots clés ou phrases clés

la découpe thématique qui permet l’extraction des thèmes d’un texte, la découpe des paragraphes en thèmes homogènes

le filtrage et l’indexation linguistique qui permet une organisation des données linguistiques d’une entrée – corpus, sortie du module de reconnaissance vocale, texte saisi en ligne, etc. – en vue d’un traitement ultérieur

l’identificateur de langue qui repose sur une analyse statistique classique et/ou une analyse linguistique avec prise en compte de données lexicales et grammaticales le traducteur automatique.

Développées en collaboration avec d’autres unités

Certaines applications, peuvent être complétées par des modules de traitement préalables du message à traiter et de mise en forme de la sortie obtenue par TiLT. C’est le cas des logiciels de questions-réponses ou du traducteur qui peuvent utiliser pour la saisie du message les technologies de reconnaissance vocale et pour la sortie celle de la synthèse vocale. Dans le cadre de notre recherche il est indispensable de se poser la question de la mise en forme du message. En effet, pour les premières applications auxquelles nous pensons, le traitement ne s’effectuera que dans un seul sens : du message écrit en français vers la LSF. C’est ainsi qu’a été pris en compte le couplage avec un avatar. En amont, il sera intéressant de coupler la technologie à un module de reconnaissance de la parole.

5 Conclusion

Ce chapitre a pu démontrer comment, dans un système initialement dédié aux langues vocales, nous avons intégré la problématique de la traduction automatique du français vers la LSF du point de vue de la manipulation syntaxique de la langue, c’est-à-dire indépendamment d’une quelconque mise en forme du signifiant.

La profondeur du travail déjà réalisé (accord verbal, modification adjectivale et adverbiale, etc.) et les pistes de travail envisagées nous autorisent à affirmer que l’objectif de la thèse est rempli et ce en mettant en avant la sauvegarde des spécificités de la LSF. Partir, pour les règles de génération de LSF, des règles d’analyse, élaborées à partir de l’observation de la LSF, nous aura permis de ne pas être dans une approche « français signé ». Il faut cependant accepter d’obtenir des énoncés plus « normés » ou « figés » que ne le ferait un humain, cela étant dû d’une part à la nature et au contenu du message initial rédigé en français (pour une traduction qui va dans le sens du français vers la LSF) et d’autre part à la contrainte de travail sur des énoncés autonomes (sémantiquement non dépendants d’un contexte) imposée par les capacités actuelles – limitées – du traitement automatique des langues.

Notre travail de thèse aurait pu s’arrêter là puisque nous étions parti de l’idée de travailler sur la syntaxe de la LSF en vue de son traitement automatique et notamment de la traduction entre le français et la LSF. Nous nous sommes rapidement rendu-compte, au stade du développement des données linguistiques auquel nous étions arrivé, que l’évaluation du résultat des manipulations linguistiques ne pourrait faire longtemps l’économie de la visualisation du signal obtenu. En effet même si notre système de transcription permet d’avoir une bonne représentation des signes manipulés, avec un degré de finesse sur la direction du mouvement des verbes et les proformes utilisées, il demeurait difficile d’apprécier le rendu de l’association des signes réalisés les uns après les autres, notamment lorsqu’ils contiennent des éléments se répétant d’un signe sur l’autre, comme les variations adjectivales par exemple.

C’est pourquoi nous avons rapidement réorienté la fin de notre travail vers la production des signifiants au moyen de personnages virtuels. C’est ce que nous nous proposons de décrire dans le chapitre suivant.

CHAPITRE IV : MISE EN FORME DU