• Aucun résultat trouvé

Dialogue oral homme-machine

CHAPITRE 1 DIALOGUE ORAL HOMME-MACHINE ET SYSTEME DE DIALOGUE

1.2 Dialogue oral homme-machine

Avant de présenter des connaissances liées au système de dialogue, nous abordons dans cette

section des principes généraux du dialogue oral homme-machine, ainsi que ses caractéristiques.

1.2.1 Interaction homme-machine

La recherche dans le domaine de l'interaction homme-machine (IHM) attire beaucoup

d’attention non seulement des chercheurs, mais également des entreprises. En général, l’IHM est un

domaine très large qui regroupe plusieurs disciplines comme la psychologie, l’ergonomie, la

linguistique, les sciences cognitives, les arts graphiques, l’électronique… et surtout l’informatique.

Au point de vue informatique, l’IHM peut être considérée comme l’interface entre les mondes

informels manipulés par l’utilisateur et le monde formel de l’informatique qui représente un

système informatif. Sa nature multidisciplinaire et sa situation par essence constituent donc un

écueil dans le processus de développement d’un système informatif en général.

L’interaction entre l’utilisateur et le système informatif peut être effectuée par plusieurs

modalités différentes. Bien évidemment, les objectifs des chercheurs dans ce domaine sont

d’apporter tous les moyens de communication efficace, du point de vue psychologique, à intégrer

au système informatif. En effet, l’être humain perçoit naturellement l’environnement en

convoquant les cinq sens : vue, ouïe, toucher, goût et odorat. Bien que la comparaison entre le

système nerveux chez l’être humain et la capacité cognitive dans un système informatif soit une

chose absurde, cependant, on pourrait de plus en plus équiper de ces cinq sens le système

informatif.

Comme l’interaction homme-homme, l’interaction homme-machine dans les systèmes

d’information peut se composer de trois parties : perception, action et cognition. L’action est une

chose purement informatique. Par contre, la perception et la cognition dépendent forcément des

demandes et des contextes de chaque application. La plupart des applications actuelles utilisent des

modalités avec le toucher, la vue et l’ouïe comme perception et implémentent la capacité cognitive

sous forme de la mémorisation et de l’apprentissage (si nécessaire). Dans le domaine du dialogue

oral homme-machine, nous ne nous intéressons donc qu’à l’ouïe qui est bien représentée par la

parole, et la cognition dans de telles applications dédiées.

1.2.2 Ingénierie de la parole

La parole est une modalité dédiée à l’interaction homme-machine. Tenant compte des

avantages de la parole, au cours des décennies dernières, des recherches importantes dans le

domaine du traitement de la parole se sont déjà imposées et ont donné également beaucoup de

résultats qui promeuvent non seulement ce domaine, mais également d’autres applications vocales.

En adaptant la structuration de la parole de Schmandt [Schmandt, 1994], nous envisageons

celle-ci sous forme de huit niveaux différents comme illustré dans la figure 1.1. Les niveaux plus

bas sont donc implémentés dans les moteurs de reconnaissance/synthèse de la parole, tandis que les

niveaux hauts résident évidemment dans les applications vocales, les systèmes de dialogue oral

(nous abordons ces deux concepts dans les sections ci-dessous). Les deux niveaux « syntaxique » et

« lexical » sont considérés à la fois dans les applications vocales et dans les noyaux de traitement

du langage.

Discours

Figure 1.1 : Niveaux de traitement de la parole

Pragmatique

Sémantique

Syntaxique

Phonétique

Lexical

Acoustique

Articulatoire

A

pp

lication vocale

Moteur de reconnaissance /

synthèse de la parole

Naturellement, la recherche qui s’impose dans le domaine du dialogue homme-machine n’est

intéressée que par les cinq niveaux en haut. Cependant, les autres niveaux apportent également des

intérêts nettement utiles aux travaux encadrés de ce domaine.

1.2.3 Dialogue oral homme-machine : de la parole à l’action au monde

Intuitivement, le dialogue oral homme-machine (désormais DHM) engage deux

interlocuteurs : l’un est l’homme qui représente l’entité à la fois dynamique et interagissante, et

l’autre est le système d’information qui est abstrait (résumé par le mot « machine »). Il est le fruit

de la rencontre entre les deux domaines : interface homme-machine et ingénierie de la parole

(reconnaissance et synthèse de la parole). De manière générale, on peut considérer le dialogue oral

homme-machine comme un ensemble d’interactions entre l’utilisateur et le système d’information

via l’interface vocale.

L’interaction est caractérisée par des énoncés, soit prononcés par l’utilisateur, soit générés par

le système. L’utilisateur parle au système en donnant ses ordres, ses demandes, ses souhaits… et le

système lui répond en visant à satisfaire ses intentions.

Une paire de deux énoncés consécutifs de chaque interlocuteur constitue un tour de parole qui

est également considéré comme un élément de base du dialogue. Un dialogue oral homme-machine

est donc un ensemble de tours de parole entre un utilisateur et le système d’information, avec

l’objectif de satisfaire de manière maximale le souhait de l’utilisateur.

1.2.4 Propriétés du dialogue oral homme-machine

De nombreuses différences entre le mode de transformation d’information entre un dialogue

écrit et un dialogue oral existent naturellement dans la vie sociale : on peut modifier ce que l’on

écrit jusqu’à la satisfaction, et à l’inverse, le lecteur peut relire une phrase, un paragraphe en cas

d’incompréhension, de doute, d’ambiguïté. Par contre, quand on utilise la parole pour donner des

informations, les erreurs peuvent être corrigées par répétition, autocorrection…, mais non effacées

[Minker et Bennacef, 2001]. Une autre différence importante à souligner entre les deux modes de

dialogue réside dans le fait que la compréhension d’un dialogue écrit est statique, alors que l’oral

est dynamique : il évolue au cours du dialogue.

De plus, un dialogue oral présente généralement des caractéristiques intrinsèques comme la

spontanéité, la structure agrammaticale des énoncés et l’apparition de sous-dialogues incidents

[Néel et Minker, 1999]. La spontanéité se caractérise par des attributs comme redondance

d’information, répétitions, hésitations, contradictions au cours des énoncés. En ce qui concerne la

structure agrammaticale, elle est liée évidemment à la langue parlée de l’interlocuteur : l’énoncé

doit naturellement respecter des règles de grammaire. La dernière caractéristique concerne

l’apparition de sous-dialogues qui servent à clarifier ou reformuler les intentions de l’interlocuteur.

Un dialogue oral homme-machine garde, en bien et en mal, les caractéristiques d’un dialogue

homme-homme. Heureusement, sauf en cas d’amusement, l’utilisateur a toujours en conscience les

différences entre la communication quotidienne entre les hommes et devant une machine. Il tolère

des fautes du système mais pas toujours chez l’être humain.

En ce qui concerne la souplesse d’un dialogue homme-machine, Sabah [Sabah, 1989] a

envisagé des aspects en fondant sur des aspects linguistiques, sur la flexibilité, sur l’adaptation à

l’interlocuteur et sur le métaraisonnement. Nous reprenons donc ces notions pour viser à réaliser le

système de dialogue oral homme-machine.

Documents relatifs