• Aucun résultat trouvé

Extended Abstract (in French)

Chapitre 4 Filtre Bayésien

Ce chapitre propose appliquer une structure de filtre bayésien afin de désaccoupler partiellement la dépendance entre les variables à différents instants. On ne souhaite pas oublier toute l’information du passé, mais limiter la dépendance du temps à une pro-fondeur raisonnable. Cette limite est imposée ici en appliquant l’hypothèse de Markov de premier ordre.

La dépendance avec le temps est également réduite en assumant que les modèles sont stationnaires dans temps. Des informations sur le passé sont résumées et des consi-dérations instantanées du pas de temps présent sont utilisées pour estimer les valeurs actuelles des variables. Cette estimation est réalisée par un calcul récursif qui réduit le temps de calcul.

Le filtre bayésien proposé dans ce chapitre inclut les commandes de moteur et son modèle dans le calcul récursif du filtre. Cela permet au filtre de fournir une réponse à la question ultime, et constitue ainsi une première proposition de solution.

4.1 Programme bayésien

Nous visons ici définir la dépendance entre les variables à un moment donné, et maintenons ces dépendances stationnaires : elles ne changent pas avec le temps. Afin de maintenir la relation avec le passé, les variables considérées dans chaque terme de la distribution conjointe incluent les variables actuelles et les variables de temps passé. La dépendance entre les variables utilisées dans le chapitre précédent est employée ici avec quelques différences : les modèles capteur et moteur sont encore employés, mais un modèle dynamique concernant les variables d’état est ajouté. Si nécessaire, les va-riables de temps passé sont incluses dans les dépendances des modèles. L’utilisation est également très similaire, avec des questions d’estimation des états et de commandes

EXTENDED ABSTRACT - FRENCH xli motrices. Afin de réduire le temps de calcul, une boucle de calcul récursif est employée pour répondre à ces questions.

4.1.1 Description

Comme dans le chapitre précédent, les variables impliquées dans ce programme sont l’ensemble des variables d’observation Z, l’ensemble des variables M de com-mande de moteur et l’ensemble de variables d’état S. Mais, contrariament au chapitre précédent, tous les instants, de 0 à un instant arbitraire t, sont considérés. Ainsi l’en-semble total de variables pertinentes est M0:t, Z0:t et S0:t.

La distribution conjointe du filtre bayésien fait intervenir toutes les variables perti-nentes : P (M0:tS0:tZ0:tf) = Qt j=1 P (Sj|Sj−1Mj−1πf) ×P (Zj|Sjπf) ×P (Mj|SjMj−1πf) ×P (M0S0Z0f). (3)

On remarque que l’hypothèse de Markov de premier ordre est présente dans le mo-dèle dynamique et dans le momo-dèle moteur : la dépendance de temps a une profondeur limité à un instant. Le produit des termes dans la distribution conjointe est une consé-quence de l’hypothèse de stationnarité : les modèles ne changent pas avec le temps. Ils sont définis pour différentes variables à chaque pas de temps, mais la relation entre ces variables demeure le même pour tous les pas de temps.

4.1.2 Utilisation

Le calcul récursif dans le filtre bayésien ci-dessus consiste à poser trois questions, séquentiellement, à la distribution conjointe du filtre. La première question s’appelle

prédiction, et c’est la partie de la boucle de calcul où les informations sur le passé sont

mises à jour en utilisant le modèle dynamique.

La deuxième question s’appelleestimation, et elle vise à mettre à jour le résultat de la

question de prédiction avec l’évidence donnée par les observations.

Une fois que l’estimation des variables d’état est calculée, il est possible d’appliquer cette estimation pour décider quelles commandes de moteur sont les plus appropriées pour la situation actuelle : c’est la question decommande motrice.

Le calcul de la prédiction utilise l’estimation calculée au pas de temps précédent, l’estimation actuelle est calculée en utilisant la prédiction, et la question de commande motrice utilise l’estimation pour être calculée. La recursivité du calcul est démontrée dans cette section.

4.1.3 Exemples

Deux exemples sont présentés dans cette chapitre : le premier est une version réduite du deuxième.

xlii EXTENDED ABSTRACT - FRENCH

Le premier exemple montre un filtre bayesien et son utilisation : le choix des va-riables, la distribution conjointe, la façon dont les formes paramétriques sont choisis, et les questions posées. Des résultats de la simulation sont aussi montrés pour illustrer le fonctionnement du filtre.

Le deuxième exemple est plus complexe et montre comment un comportement plus sophistiqué peut être programmé.

4.1.4 Hypothèses supplémentaires

– Les variables d’état du pas de temps actuel dépendent des états du pas de temps précédent aussi bien que des variables moteur du pas de temps précédent.

– L’hypothèse de Markov de première ordre impose une limite pour la profondeur de dépendance dans le temps à un pas de temps.

– Les modèles dynamiques, capteur et moteur sont stationnaires dans le temps.

4.2 Analyse de critères

4.2.1 Complexité spatiale

Pour comparer avec la solution proposé au chapitre 1 pour répondre à la question finale, un tableau présente l’espace mémoire nécessaire pour stocker le filtre bayésien proposé dans ce chapitre. Une réduction substantielle de place mémoire est visible.

Le problème principal de l’utilisation du filtre Bayésien est la dépendance exponen-tielle au nombre de variables d’état. Dans les applications en robotique, le nombre de variables d’état est directement lié à la difficulté du comportement spécifié et la sophis-tication de l’environnement : le nombre de variables d’état augmente avec la complexité de la tâche et avec la richesse de l’environnement.

4.2.2 Complexité temporelle

Le temps de calcul pour l’utilisation du filtre de Bayes est la somme des opérations nécessaires pour résoudre les trois questions à chaque pas de temps : prédiction, esti-mation et commande motrice.

Comme pour la complexité spatiale, nous trouvons encore une dépendance expo-nentielle à l’égard du nombre de variables d’état.

4.2.3 Programmation

Il est nécessaire de programmer trois termes de la distribution conjointe : modèle dynamique, modèle capteur et commande moteur. Ces termes ont une signification pré-cise directement liée au robot, à l’environnement et à la tâche à programmer. Pour cette raison, même si une table est utilisée au lieu des formes paramétriques, chaque valeur de probabilité peut être associée à une situation réelle, et peut donc être choisie plus facilement.

EXTENDED ABSTRACT - FRENCH xliii

4.3.1 Robotique

Le programme bayésien décrit dans ce chapitre n’est pas classifié comme une spécia-lisation de la locaspécia-lisation Markovienne à cause de la présence du modèle moteur dans la distribution conjointe. Nous classifions notre proposition comme un type de filtre Bayesien.

Les variables motrices, non incluses dans la structure générale d’un filtre bayésien basique, sont utilisées dans notre proposition, et elles sont très similaires aux variables d’état.

De même que les variables d’état, les variables motrices ont une dynamique associée, donnée par le modèle moteur. Dans l’expression de la solution de la question moteur, on voit intervenir l’estimation des variables d’états. De ce fait, les variables motrices sont estimées, plutôt que predictes.

En fait, la principale différence entre les variables d’état et les variables motrices ré-side dans le fait que ces dernières ont des valeurs attribuées. À la fin de chaque itération, une décision est prise au sujet des valeurs des commandes motrices et, à la prochaine itération, les variables moteur ont des valeurs attribuées, alors que les variables d’état ne sont jamais connues avec précision, mais seulement estimées.

4.3.2 Cognition

Si on assume que le cerveau utilise un filtre bayésien, cela implique le cerveau uti-lise des distributions de probabilités. Cette hypothèse amène à la révision des plusieurs concepts dans l’étude de comment l’information est codée, processée et utilisé par le cer-veau. Le besoin de prendre de décisions, l’horizon de temps et la relation entre modèles stationnaires et l’apprentissage sont aussi discutés.

Documents relatifs