• Aucun résultat trouvé

6.3 Caractéristiques

6.3.2 Analogies avec le contrôle sensorimoteur

Les différentes architectures de contrôles présentées précédemment sont re-lativement génériques et éclipsent une réalité bien plus diversifiée. Il est de même pour les techniques de mise en œuvre de ces schémas de contrôle (fonc-tions de transfert, réseaux de neurones, filtre de Kalman, modèles de Markov cachés, etc.). Ainsi le modélisateur dispose d’une multitude d’approches pour décrire la plasticité du système sensorimoteur. Une première étape dans la sélec-tion d’un type de contrôleur est la catégorisasélec-tion direct/indirect. L’approche indirecte aussi appelée explicite est basée sur un modèle du processus piloté dont les paramètres sont estimés en ligne. Une fois ces paramètres obtenus, ce sont ceux de la loi de commande qui sont calculés. A contrario, selon l’approche directe ou encore implicite, les paramètres de la loi de commande sont direc-tement calculés à partir des signaux de consigne et d’observation du processus piloté. Ainsi aucun modèle du processus n’apparait de manière explicite dans le schéma de contrôle et c’est au niveau de la conception même du contrôleur que les connaissances du processus sont finalement intégrées. Il apparait donc que selon la stratégie d’adaptation employée par le système nerveux central (prin-cipalement la mise à jour de modèle interne et la modulation d’impédance, voir chapitre 5) correspondra l’une de ces deux classes de contrôleur adaptatif. Nous présentons à ce sujet un récapitulatif des différents schémas de contrôle pro-posés plus haut ainsi que de certaines analogies avec les propriétés du contrôle sensorimoteur (voir aussi tableau 6.1).

Gain Scheduling. Le contrôle par planification de gain est de la classe di-recte et s’apparente à la théorie du point d’équilibre (Merton, 1953, Feldman, 1966) énoncée au chapitre 4. Rappelons que selon cette théorie, le système ner-veux central serait en mesure de contrôler la contraction et la relaxation des muscles afin de mouvoir un membre (par exemple la main) entre deux posi-tions d’équilibre stables. Cette théorie repose en particulier sur les propriétés viscoélastiques des muscles (Merton, 1972). Un mouvement pourrait alors être programmé au niveau neuronal comme une séquence de gains décrivant l’évolu-tion temporelle de la contracl’évolu-tion des muscles impliqués dans le mouvement en question et dont la commutation entre deux valeurs successives serait continue. High Gain Adaptive Control. Le contrôle adaptif par gains élevés est à l’instar du contrôle par la planification de gains une approche directe tirant bénéfice du caractère viscoélastique des muscles et de leur capacité de fonc-tionnement synergique au travers de la co-activation musculaire (voir chapitre 3). L’indexation des gains d’un contrôleur sur le niveau d’un signal d’erreur et le contrôle adaptatif par gains élevés s’apparente à la stratégie de modulation d’impédance (Hogan, 1984, Mussa-Ivaldi et al., 1985). En effet, nous avons vu

au chapitre 5 que la contraction simultanée de muscles et de leurs antagonistes respectifs avait la propriété d’accroitre à la fois la robustesse des membres en mouvement sans modifier la cinématique des trajectoires réalisées mais aussi la stabilité des membres immobiles.

Multi Model Adaptive Control. Le contrôle adaptatif par sélection de modèle est une méthode indirecte qui, comme nous l’avons vu précédemment ne présente pas de réelles capacités d’apprentissage. En effet, ses jeux de pa-ramètres (modèles internes et régulateurs) sont figés et adaptés à un certain nombre fini de contextes identifiés au préalable. Toutefois cette approche pré-sente un double intérêt. Le premier concerne l’identification de changement du contexte courant ainsi que la commutation sur un jeu de paramètres adéquats. Plusieurs études (Elkind et al., 1964) avaient permis de mettre en lumière les capacités de pilotes d’avions, entrainés à différents modes de fonctionnement de leur aéronef à reconnaître l’occurrence de ces modes et à basculer dans un mode de contrôle adapté, en quelques secondes seulement. Un second intérêt du contrôle adaptatif par sélection de modèle est de proposer une forme de mémorisation alors que dans les autres approches, un changement de contexte engendre un apprentissage qui entraine la disparition de ces connaissances. Model Reference Adaptive Control. Tout comme le contrôle adaptatif par sélection de modèle, le contrôle adaptatif par modèle de référence est une approche indirecte qui possède deux propriétés intéressantes. Cela provient de l’entité qui sera considérée comme modèle de référence. Si le modèle de réfé-rence est une représentation interne du comportement global du système piloté attendu, alors ce sont les paramètres de la loi de commande qui sont modifiés. Le comportement du système «Homme-Machine » présente alors une certaine forme de constance, ce qui n’est pas sans rappeler le modèle cross − over (ci-temcruer1962, McRuer et Krendel, 1974). Il serait alors possible d’expliquer ces observations expérimentales par une architecture de contrôle adaptatif par mo-dèle de référence. Mais le choix du momo-dèle de référence peut également porter sur le système piloté. Le contrôleur devenant alors un observateur du processus réel et permettant l’apprentissage de ses caractéristiques. Cette mise au point d’un modèle interne direct (voir chapitre 4) confère au système nerveux cen-tral des capacités de prédiction du comportement du processus piloté. Cette caractéristique est essentielle en particulier pour la détection de changements de l’environnement déclenchée par une incohérence entre prédiction et obser-vation.

Feedback Error Learning, Adaptive Sliding Control. Ces deux ap-proches directes combinent à la fois contrôle en boucle ouverte (par modèle

6.4. CONCLUSION 93 Méthode Analogie

Gain Scheduling Théorie du point d’équilibre High Gain Adaptive Control Modulation d’impédance Multi Model Adaptive Control Memorisation et commutation

de modes de contrôle Model Reference Adaptive

Control

Modèle cross − over, apprentis-sage de modèles directs, prédic-tion

Adaptive Sliding Control Contrôle boucle ouverte et boucle fermée, apprentissage de modèles inverses

Feedback Error Learning Contrôle boucle ouverte et boucle fermée, apprentissage de modèles inverses

Table 6.1 – Analogies entre les schémas de contrôle adaptitif présentés et certaines propriétés du contrôle sensorimoteur.

interne inverse du système piloté) et contrôle en boucle fermée (par boucle de régulation classique). Cet apprentissage de la dynamique inverse d’un système simultané à son contrôle offre des similarités avec la stratégie d’adaptation par mise à jour de modèle interne (Held, 1965, Bhushan et Shadmehr, 1999). Par ailleurs, la mise en place d’un dispositif de modulation des paramètres de régulation de la boucle fermée permettait de rendre compte des deux princi-pales stratégies d’adaptations (apprentissage et modulation d’impédance) dont l’exécution conjointe a été expérimentalement observée (Thoroughman et Shad-mehr, 1999, Smith et al., 2006).

6.4 Conclusion

Nous avons au cours de ce chapitre présenté différentes approches pour la conception de contrôleurs adaptatifs. La validation formelle de ces différents schémas, tant au niveau de la stabilité, de la robustesse du contrôle que de la convergence des mécanismes d’apprentissage s’avère généralement lourde et contraignante sur la mise en place d’hypothèses, en particulier concernant les changements d’environnement. Il est alors fréquent de recourir à des outils nu-mériques pour s’assurer de leur fonctionnement correct (attendu). Nous avons pu remarquer que ces différentes approches intègrent certaines caractéristiques du contrôle sensorimoteur observées expérimentalement. Cela permet d’orienter le modélisateur selon les propriétés qu’il souhaite prendre en compte. Le choix

des techniques mathématiques pour leur mise en œuvre se doit aussi d’être approprié au contexte de l’étude (gestion de bruits, d’incertitudes de mesures, de retard, etc.) et d’éviter autant que faire ce peu de conférer au contrôleur des propriétés non physiologiquement avérées. Il convient de plus d’établir deux niveaux de spécifications : le premier décrivant les caractéristiques globales, génériques des boucles d’apprentissage (vitesse de mise à jour, etc.), le second propre à la technique d’implémentation employée, dont des équivalences avec des méthodes concurrentes pourront être établies. En conclusion, la théorie du contrôle adaptif fournit un panel d’outils nous autorisant la mise en place de mécanismes adaptatifs au sein des modèles de conducteurs, présentant par ailleurs une certaine cohérence avec les observations expérimentales menées à ce sujet.

Deuxième partie

Modélisation et

expérimentations

Chapitre 7

Méthodologie

Sommaire

7.1 Introduction . . . 98 7.2 Méthodologie . . . 98 7.2.1 Impact . . . 98 7.2.2 Détection . . . 100 7.2.3 Interprétation . . . 100 7.2.4 Réaction . . . 101 7.2.5 Performance . . . 103 7.3 Application . . . 103 7.3.1 Stratégies adaptatives . . . 103 7.3.2 Contexte de l’étude . . . 104 7.4 Conclusion . . . 105 97

7.1 Introduction

Au regard des diverses informations collectées lors des recherches biblio-graphiques, nous allons au cours de ce chapitre clarifier voire reformuler notre problématique posée initialement. Pour ce faire, nous ne nous contenterons pas d’introduire un modèle de conducteur adaptif, modèle qui fera par ailleurs l’objet d’un chapitre spécifique (voir chapitre 8) mais nous nous emploierons à considérer une approche plus globale et générique, une méthodologie visant à faciliter pour le modélisateur, l’étude du comportement adaptatif des conduc-teurs. Ainsi, nous présenterons dans une première partie différents points d’in-térêt que nous jugeons essentiels pour répondre à notre problématique. Puis dans une seconde partie, nous nous concentrerons sur la redéfinition de notre contexte de travail.