CHAPITRE 1 DIALOGUE ORAL HOMME-MACHINE ET SYSTEME DE DIALOGUE
1.2 Dialogue oral homme-machine
Avant de présenter des connaissances liées au système de dialogue, nous abordons dans cette
section des principes généraux du dialogue oral homme-machine, ainsi que ses caractéristiques.
1.2.1 Interaction homme-machine
La recherche dans le domaine de l'interaction homme-machine (IHM) attire beaucoup
d’attention non seulement des chercheurs, mais également des entreprises. En général, l’IHM est un
domaine très large qui regroupe plusieurs disciplines comme la psychologie, l’ergonomie, la
linguistique, les sciences cognitives, les arts graphiques, l’électronique… et surtout l’informatique.
Au point de vue informatique, l’IHM peut être considérée comme l’interface entre les mondes
informels manipulés par l’utilisateur et le monde formel de l’informatique qui représente un
système informatif. Sa nature multidisciplinaire et sa situation par essence constituent donc un
écueil dans le processus de développement d’un système informatif en général.
L’interaction entre l’utilisateur et le système informatif peut être effectuée par plusieurs
modalités différentes. Bien évidemment, les objectifs des chercheurs dans ce domaine sont
d’apporter tous les moyens de communication efficace, du point de vue psychologique, à intégrer
au système informatif. En effet, l’être humain perçoit naturellement l’environnement en
convoquant les cinq sens : vue, ouïe, toucher, goût et odorat. Bien que la comparaison entre le
système nerveux chez l’être humain et la capacité cognitive dans un système informatif soit une
chose absurde, cependant, on pourrait de plus en plus équiper de ces cinq sens le système
informatif.
Comme l’interaction homme-homme, l’interaction homme-machine dans les systèmes
d’information peut se composer de trois parties : perception, action et cognition. L’action est une
chose purement informatique. Par contre, la perception et la cognition dépendent forcément des
demandes et des contextes de chaque application. La plupart des applications actuelles utilisent des
modalités avec le toucher, la vue et l’ouïe comme perception et implémentent la capacité cognitive
sous forme de la mémorisation et de l’apprentissage (si nécessaire). Dans le domaine du dialogue
oral homme-machine, nous ne nous intéressons donc qu’à l’ouïe qui est bien représentée par la
parole, et la cognition dans de telles applications dédiées.
1.2.2 Ingénierie de la parole
La parole est une modalité dédiée à l’interaction homme-machine. Tenant compte des
avantages de la parole, au cours des décennies dernières, des recherches importantes dans le
domaine du traitement de la parole se sont déjà imposées et ont donné également beaucoup de
résultats qui promeuvent non seulement ce domaine, mais également d’autres applications vocales.
En adaptant la structuration de la parole de Schmandt [Schmandt, 1994], nous envisageons
celle-ci sous forme de huit niveaux différents comme illustré dans la figure 1.1. Les niveaux plus
bas sont donc implémentés dans les moteurs de reconnaissance/synthèse de la parole, tandis que les
niveaux hauts résident évidemment dans les applications vocales, les systèmes de dialogue oral
(nous abordons ces deux concepts dans les sections ci-dessous). Les deux niveaux « syntaxique » et
« lexical » sont considérés à la fois dans les applications vocales et dans les noyaux de traitement
du langage.
Discours
Figure 1.1 : Niveaux de traitement de la parole
Pragmatique
Sémantique
Syntaxique
Phonétique
Lexical
Acoustique
Articulatoire
A
pp
lication vocale
Moteur de reconnaissance /
synthèse de la parole
Naturellement, la recherche qui s’impose dans le domaine du dialogue homme-machine n’est
intéressée que par les cinq niveaux en haut. Cependant, les autres niveaux apportent également des
intérêts nettement utiles aux travaux encadrés de ce domaine.
1.2.3 Dialogue oral homme-machine : de la parole à l’action au monde
Intuitivement, le dialogue oral homme-machine (désormais DHM) engage deux
interlocuteurs : l’un est l’homme qui représente l’entité à la fois dynamique et interagissante, et
l’autre est le système d’information qui est abstrait (résumé par le mot « machine »). Il est le fruit
de la rencontre entre les deux domaines : interface homme-machine et ingénierie de la parole
(reconnaissance et synthèse de la parole). De manière générale, on peut considérer le dialogue oral
homme-machine comme un ensemble d’interactions entre l’utilisateur et le système d’information
via l’interface vocale.
L’interaction est caractérisée par des énoncés, soit prononcés par l’utilisateur, soit générés par
le système. L’utilisateur parle au système en donnant ses ordres, ses demandes, ses souhaits… et le
système lui répond en visant à satisfaire ses intentions.
Une paire de deux énoncés consécutifs de chaque interlocuteur constitue un tour de parole qui
est également considéré comme un élément de base du dialogue. Un dialogue oral homme-machine
est donc un ensemble de tours de parole entre un utilisateur et le système d’information, avec
l’objectif de satisfaire de manière maximale le souhait de l’utilisateur.
1.2.4 Propriétés du dialogue oral homme-machine
De nombreuses différences entre le mode de transformation d’information entre un dialogue
écrit et un dialogue oral existent naturellement dans la vie sociale : on peut modifier ce que l’on
écrit jusqu’à la satisfaction, et à l’inverse, le lecteur peut relire une phrase, un paragraphe en cas
d’incompréhension, de doute, d’ambiguïté. Par contre, quand on utilise la parole pour donner des
informations, les erreurs peuvent être corrigées par répétition, autocorrection…, mais non effacées
[Minker et Bennacef, 2001]. Une autre différence importante à souligner entre les deux modes de
dialogue réside dans le fait que la compréhension d’un dialogue écrit est statique, alors que l’oral
est dynamique : il évolue au cours du dialogue.
De plus, un dialogue oral présente généralement des caractéristiques intrinsèques comme la
spontanéité, la structure agrammaticale des énoncés et l’apparition de sous-dialogues incidents
[Néel et Minker, 1999]. La spontanéité se caractérise par des attributs comme redondance
d’information, répétitions, hésitations, contradictions au cours des énoncés. En ce qui concerne la
structure agrammaticale, elle est liée évidemment à la langue parlée de l’interlocuteur : l’énoncé
doit naturellement respecter des règles de grammaire. La dernière caractéristique concerne
l’apparition de sous-dialogues qui servent à clarifier ou reformuler les intentions de l’interlocuteur.
Un dialogue oral homme-machine garde, en bien et en mal, les caractéristiques d’un dialogue
homme-homme. Heureusement, sauf en cas d’amusement, l’utilisateur a toujours en conscience les
différences entre la communication quotidienne entre les hommes et devant une machine. Il tolère
des fautes du système mais pas toujours chez l’être humain.
En ce qui concerne la souplesse d’un dialogue homme-machine, Sabah [Sabah, 1989] a
envisagé des aspects en fondant sur des aspects linguistiques, sur la flexibilité, sur l’adaptation à
l’interlocuteur et sur le métaraisonnement. Nous reprenons donc ces notions pour viser à réaliser le
système de dialogue oral homme-machine.
Dans le document
Dialogue Homme-Machine : Modélisation de multisession
(Page 33-36)