• Aucun résultat trouvé

État de l’art

1.2 Prédiction Inférence et Anticipation

Dans cette Section, nous présenterons en détail les notions d’anticipation et de prédiction. Mais avant cela, nous commençons ici par clarifier la différence entre la prédiction et l’inférence. La prédiction correspond à “l’annonce d’événements futurs par la connaissance qu’on a de leurs causes. [Larousse]”. Cette prédiction a lieu par exemple lorsque le robot calcule la continuation d’un mouvement à partir de ses connaissances et de ses observations. L’action d’inférer correspond

17. Ces informations correspondent aux signaux mesurables qui proviennent de l’utilisateur et de l’environnement. 18. Les variables latentes sont des variables non directement observables, mais qui sont prédites à l’aide d’un modèle et d’autres variables qui sont, quant à elles, directement mesurées.

à “tirer une conséquence de quelque chose, conclure, induire quelque chose de quelque chose .[Larousse]”. Notre robot infère par exemple qu’elle est la catégorie de mouvement qu’il perçoit ou encore qu’elle est la vitesse du mouvement actuel et en déduit la durée totale du mouvement. En plus d’estimer l’intention et donc le but de l’utilisateur [229, 216], le robot doit aussi prédire puis anticiper les mouvements futurs de celui-ci, afin de planifier ses propres actions, tout en respectant son intention.

1.2.1 Définitions

Dans le langage courant, les termes prédiction et anticipation sont souvent utilisés comme des synonymes. C’est pourquoi nous commençons ici par préciser leur signification et leur différence, en définissant tout d’abord ce qu’est un système anticipatif.

Un système anticipatif est “un système contenant un modèle prédictif de lui-même et/ou de l’environnement, lui permettant de changer d’état à un instant, en accord avec les prédictions de son modèle relatif à un instant futur” [189]. Plus précisément, un système anticipatif se compose d’un système prédictif, qui représente les états futurs de l’environnement avec lequel il interagit. Ces prédictions de changements d’état permettent au système d’anticiper et de contrôler son interaction avec l’ environnement, afin de répondre à des buts. Ainsi, ce sont des processus ou comportements qui ne dépendent pas seulement des mesures passées et présentes de l’environnement, mais aussi des mesures prédites sur l’avenir, basées sur des attentes et des croyances [33].

Dans [180], Pezzulo et al.différencient un système anticipatif d’un système réactif. Contraire-ment à un simple système réactif, les systèmes anticipatifs sont capables de formuler des prédictions et de les utiliser afin de répondre à des buts. Ainsi en robotique, les robots qui utilisent un système prédictif peuvent seulement formuler une attente, alors qu’en utilisant un système anticipatif, ils choisissent une action à effectuer, en fonction de l’espérance qu’ils pensent en tirer. Puis, Pezzulo et al.expliquent dans cette même étude les différences entre l’anticipation et la prédiction, mais aussi avec deux notions liées à ces termes : l’attente (prévision) et l’espérance. Pour résumer, la prédiction apporte une prévision de ce qui est susceptible de se produire. L’anticipation quant à elle, est une prévision à laquelle s’ajoute la prise en compte de la préparation et l’exécution d’un comportement que l’agent a choisi d’effectuer. Finalement, l’espérance est le(s) résultat(s) qu’il s’attend à obtenir. Le schéma de la Figure 1.1 représente cette différence.

D’un point de vue mathématique, ces notions peuvent être formulées avec les équations suivantes :

Prédiction : P (xt+1|et, xt, θ) Anticipation : P (xt|et, xt, at, θ).

Avec xtl’état courant du processus analysé, et, l’état courant de l’environnement (composé de l’ensemble des événements qui interagissent avec le processus), at l’action prévue et θ les paramètres qui définissent la modélisation du processus étudié, qui permet de prédire et d’anticiper le futur état du système.

1.2.2 L’anticipation en robotique

En robotique, l’anticipation est considérée comme la capacité du robot à choisir correctement la tâche à effectuer, selon une situation donnée [101]. Pour cela, le robot doit prédire l’effet de son action, en prenant par exemple en compte le concept d’affordance [113, 191, 121] et il doit prédire les événements et états futurs, c’est-à-dire être capable de simuler l’évolution du système

prédiction prévision anticipation espérance et P(xt|et, st, 𝜽) xt P(xt|et, at, st, 𝜽) at xt xt action prévue at environnement et état du système xt

Figure 1.1 – Différence entre prédiction et anticipation.

couplé humain-robot, comme cela est fait dans les modèles de contrôle prédictif [241, 112] ou de planification [3, 200].

Dans [2], Alami et al.s’intéressent ainsi a créer un robot capable de planifier les mouvements et les tâches à effectuer, en vérifiant que le comportement du robot résultant de cette planification respecte les contraintes d’interaction avec les humains (convention sociale, sécurité, comportement de l’humain, etc.). Par exemple, l’architecture proposée permet de vérifier que les mouvements [204] et actions [2] du robot : sont compréhensibles par les humains en interaction avec lui ; sont acceptés socialement (pas trop proche, surtout d’une personne assise ; dans le champ de vision de l’utilisateur, etc.) ; diminuent l’effort d’action de la personne interactive, etc.

Dans [200], Shah et al.étudient les comportements humains lors de tâches collaboratives, comportements qui leur permettent de s’informer sur leurs intentions réciproques et ainsi d’an-ticiper et de planifier les différentes actions à effectuer. Ils ont ainsi mis en évidence que les différentes tâches à effectuer ne sont pas distribuées à l’avance (“decision on the fly”) ; que, plus les coéquipiers communiquent sur l’avancée de leurs actions, plus la coopération est efficace ; et finalement, que les coéquipiers prennent en compte les conséquences de leurs actions sur les autres, grâce à un modèle mental partagé de la tâche à effectuer. Shah et al.proposent alors un système robotique d’exécution de plan qui prend en compte ces différents critères afin de permettre à un robot d’anticiper les actions à effectuer et donc de collaborer avec ses coéquipiers humains de manière plus naturelle, plus fluide et plus rapide.

D’autres études, dont la nôtre, cherchent à doter des robots de capacités prédictives afin d’améliorer la collaboration humain-robot. C’est ce que nous verrons dans la Section suivante.

1.2.3 La prédiction en robotique

Pour répondre au sujet de cette thèse, le robot doit prédire le futur de la trajectoire qui correspond à l’intention de son partenaire, puis anticiper la trajectoire et la position du but de son mouvement, afin de respecter la volonté de son partenaire. Dans d’autres études, il s’agit de prédire le mouvement de l’humain, pour adapter le comportement du robot en conséquence et garantir la sécurité de l’interaction, comme dans [13], où l’algorithme prédit dans cette optique de sécurité, les zones dans lesquelles se dirigent les personnes.

Dans d’autres études, la prédiction de l’intention de l’utilisateur se limite souvent à la prédiction de la position finale. Par exemple, dans [228], Wang et al.proposent une méthode appelée Modèle Dynamique Dirigé vers le But (Intention-Driven Dynamics Model), basée sur les Modèles Dynamiques de Processus Gaussiens (Gaussian Process Dynamical Models) [226]. Cette méthode permet d’inférer, lors d’un match de ping-pong, l’intention de l’adversaire humain, décrit comme la position qu’il souhaite que la balle atteigne. Cette inférence se base sur le mouvement du corps complet de l’adversaire, avant même que celui-ci frappe la balle. Dans [80], Ferrer et al.proposent un algorithme bayésien, nommé Prédiction Bayésienne de l’Intention du Mouvement Humain (Bayesian Human Motion Intentionality Prediction), permettant de prédire l’intention du

mouvement humain. Cet algorithme consiste à calculer géométriquement le but le plus probable de l’humain, à partir de la méthode Espérance-Maximisation (Expectation-maximization) et d’un simple classificateur bayésien. Finalement, une approche classique permettant de répondre à ce problème consiste à considérer chaque mouvement comme l’instance d’une action particulière, ou d’une primitive de mouvement dirigée vers un but. L’état de l’art sur les primitives de mouvement sera présenté plus en détail dans la Section 1.7.