• Aucun résultat trouvé

Extended Abstract (in French)

Chapitre 6 Coordination des comportements

Des commandes motrices peuvent être regroupées en motifs simples et indépen-dants : suivre un objet, aller tout droit, et ainsi de suite. Chaque motif est appelé ici un comportement de base, et dans ce chapitre nous proposons l’addition d’un méca-nisme de choix de comportement au filtre bayésien du chapitre précédent. Le choix du comportement le plus adéquat est fait en utilisant la fusion des propositions des filtres élémentaires, qui sont le résultat d’une stratégie locale de choix de comportement de chaque filtre élémentaire selon son propre sous-ensemble de variables.

6.1 Programme bayésien

Pour programmer un robot de telle manière qu’il exécute un comportement préala-blement indiqué, les combinaisons des motifs simples de commande motrice sont sou-vent suffisantes pour créer des comportements résultantes plus complexes.

Ce chapitre présente des commandes motrices regroupées en motifs, et chaque filtre élémentaire évalue chaque motif moteur possible afin d’estimer son adéquation avec son propre sous-ensemble de variables d’état et d’observation. La fusion des proposi-tions de chaque filtre élémentaire permet de décider quel motif de commande motrice est plus convenable et permet son exécution cohérente avec l’aide des modèles moteur de tous les filtres élémentaires.

6.1.1 Description

Pour coordonner l’exécution des motifs moteur, nous proposons ajouter un ensemble de variables de comportement, notées Bt, communes à tous les filtres élémentaires. La sémantique de ces variables est liée aux motifs trouvés dans les commandes motrices : chaque variable correspond à un groupe de motifs moteur, une valeur pour chaque mo-tif.

Ces variables de comportement sont communes à tous les filtres élémentaires, et la fusion avec cohérence est appliquée pour décrire le modèle de choix de comportement : βtreprésente l’ensemble de variables de cohérence liées aux variables de comportement

EXTENDED ABSTRACT - FRENCH xlvii Bt. Le nombre de variables de cohérence dépend du nombre de variables de comporte-ment et du nombre de filtres élécomporte-mentaires : une variable β est nécessaire pour chaque variable de comportement B dans chaque filtre élémentaire.

La distribution conjointe pour un filtre élémentaire général est montrée ci-dessous.

P (M0:tSi0:tZi0:tB0:tλ0:ti βi0:tπi) = Qt j=1 P (Sij|Sij−1Mj−1πi) ×P (Zij|Sijπi) ×P (Bji) × P (βij|BjBj−1Sijπi) ×P (Mji) × P (λji|MjSijBjMj−1πi) ×P (M0S0 iZ0 iB0λ0 iβ0 ii). (6)

La troisième ligne montre le modèle de comportement, dans la forme de fusion avec cohérence P (βj

i|BjSijBj−1πi). Le comportement choisi au pas de temps actuel dépend des variables d’état et du comportement choisi au pas de temps précédent.

La relation entre le comportement actuel et le comportement précédent vise à as-surer la continuité (aussi appelée persistance) dans l’exécution d’un comportement. La dépendance à l’égard de l’état actuel favorise la réactivité aux changements dans l’en-vironnement.

Il est intéressant de souligner le rôle de la variable de comportement dans le mo-dèle moteur. Les variables de comportement exécutent la sélection du motif moteur : chaque valeur des variables de comportement correspond à un motif moteur défini par un modèle moteur spécifique.

6.1.2 Utilisation

L’utilisation de ce filtre consiste à poser les questions de prédiction, comportement, estimation et commandes motrices aux distributions conjointes des filtres élémentaires. Après avoir posé la question de comportement à tous les filtres élémentaires, la fusion des réponses des filtres est réalisée et à partir du résultat de la fusion, la valeur actuelle du comportement choisi est décidée. Au moment où la question de commande motrice est posée à chaque filtre, la valeur du comportement actuel est déjà connue et pour avoir la distribution de probabilité globale des variables de commande motrice, la fusion a posteriori des réponses de tous les filtres élémentaires doit être exécutée.

6.1.3 Exemple

L’exemple présenté dans les chapitres précédents est repris ici et on y ajoute un mo-dèle de choix de comportement à partir de l’identification des motifs moteurs.

6.1.4 Hypothèses supplémentaires

– Des commandes motrices peuvent être assemblées dans les motifs bien identifiés, appelés comportements de base.

xlviii EXTENDED ABSTRACT - FRENCH

– La stratégie de choix de comportement est individuelle pour chaque filtre élémen-taire. Des propositions de chaque filtre sont combinées pour un choix global. – Le choix du comportement actuel est influencé par des caractéristiques de robot et

d’environnement, et par le comportement spécifié pour le robot.

– Le choix de comportement dépend du comportement au pas de temps précédent. – Un seul comportement est actif à la fois.

6.2 Analyse de critères

6.2.1 Complexité spatiale

La quantité de mémoire augmente avec le plus grand sous-ensemble de variables d’état et d’observation, avec le nombre de filtres élémentaires, et avec le nombre de variables de commande motrice et de comportement. Il est possible conclure aussi que la complexité de l’espace ne change pas avec l’ajout des variables de comportement pour la plupart des applications en robotique.

6.2.2 Complexité temporelle

Un nouveau terme dans la complexité temporelle apparaît, lié aux questions de com-portement, et qui dépend du plus grand sous-ensemble de variables d’observation, des variables de comportement et du plus grand sous-ensemble de variables d’état.

Pour la plupart des applications en robotique, pourtant, il est possible conclure que l’addition des variables de comportement ne change pas l’expression de complexité du chapitre précedent.

6.2.3 Programmation

Le modèle de choix de comportement met alors en application la stratégie de choix dans chaque filtre élémentaire, sur la base de ses propres variables d’état, et par consé-quent sans disposer des informations concernant les variables d’état dans d’autres filtres.

Il est plus facile de le programmer parce que des connaissances limitées sont utilisées dans chaque filtre, et un plus petit nombre de variables doit être pris en compte.

La programmation proscriptive met l’accent sur la nécessité d’interdire des compor-tements prohibés plutôt que de recommander des valeurs désirées. Elle est fortement désirable dans un schéma de fusion des capteurs, et dès que la fusion avec cohérence donne un résultat similaire, elle est également utile pour des commandes motrices et des modèles de choix de comportement.

Des niveaux de probabilité sont choisis pour classifier des comportements pour une situation indiquée : fortement recommandée, recommandée, indifférente, imprudente, strictement interdite. Chaque situation est définie en associant une valeur de probabilité pour chaque comportement possible en fonction de la valeur du comportement choisi au pas de temps précédent et des valeurs possibles des variables d’état actuelles. Au lieu d’avoir un très grand nombre de valeurs de probabilité à ajuster (approximative-ment égal à la quantité de mémoire nécessaire pour stocker le modèle de comporte(approximative-ment

EXTENDED ABSTRACT - FRENCH xlix dans la mémoire), seulement cinq paramètres doivent être accordés : les valeurs de pro-babilité utilisées pour chaque situation décrite ci-dessus.

6.3 Discussion

6.3.1 Robotique

Nous discutons ici deux points principaux concernant des mécanismes de choix d’action : la granulité de la définition d’action, et les critères habituels pour un mé-canisme de choix d’action.

Le rôle spécial des variables de comportement est également montré : ainsi que les variables motrices, elles sont considérées comme un genre spécial de variables d’état avec des valeurs connues.

6.3.2 Cognition

Le cadre proposé suggère de séparer le choix du comportement actuel des com-mandes motrices. Ceci est basé sur le principe des unités de base des mouvements co-ordonnés, appelées les synergies.

En particulier, le corps des vertébrés possède trop de degrés de liberté à commander par le cerveau. Un nombre relativement petit de mouvements coordonnés (certains très simples, d’autres plus complexes) sont choisis comme des mouvements naturels et ils sont appelés synergies. Ce répertoire de mouvements coordonnés constitue la base de tous les mouvements complexes : l’ordre d’exécution des synergies adéquates à chaque situation est choisi selon le comportement désiré.

Documents relatifs