• Aucun résultat trouvé

8.4 Composants adaptatifs

8.4.1 Mise à jour de modèle interne

et EImpedance= " e ˙e # .

Le tableau 8.2 récapitule les différents paramètres, entrées et sorties du module d’interaction sensorimotrice, dénué de toute capacité adaptative.

8.4 Composants adaptatifs

Nous présentons ci-dessous une manière d’implémenter des capacités adap-tatives aux composants du module d’interaction sensorimotrice.

8.4.1 Mise à jour de modèle interne

Notre problématique concerne ici la mise à jour du modèle interne direct de la dynamique du système volant présent dans le module d’interaction sensori-motrice et nécessaire à l’établissement du couple de poursuite ΓP oursuite. Nous avons vu au chapitre 6 que la technique MRAC (contrôle adaptatif par modèle

8.4. COMPOSANTS ADAPTATIFS 117 Type Nom Déscription Gamme de valeurs

en

trée θDesire Position consigne d’angle volant Non contraint

θCourant Position courante d’angle volant Butées matérielles

sortie

ΓP oursuite Couple de poursuite Limites physiologiques

ΓImpedance Couple d’impédance Limites physiologiques

paramètre

ˆ

KV olant Estimation de la raideur du volant Non contraint

KImpedance Raideur apparente du conducteur De 0 à 150N.m/rad

BImpedance Viscosité apparente du conducteur De 0 à 5N.m/rad/s

ωc Pulsation de coupure des muscles De l’ordre de 30rad/s Table8.2 – Récapitulatif des entrées-sorties-paramètres du module d’interac-tion sensorimotrice, sans capacités adaptatives.

de référence) peut assurer cette fonction. En effet, un tel contrôleur peut être transformé en un observateur et ce en échangeant simplement les rôles du sys-tème de référence et du syssys-tème piloté. Ainsi, les paramètres du modèle interne direct du système volant peuvent être ajustés grâce à l’observation des entrées et sorties de ce même système.

Nous choisissons comme critère de coût J à minimiser le carré de l’erreur

EP oursuite, écart entre la position angulaire courante θCourant du volant et la

prédiction ˆθCourantefournie par le modèle interne. Les paramètres de ce modèle interne sont alors regroupés sous le vecteur α. Nous avons alors

EP oursuite= θCourant− ˆθCourante (8.16)

J(α) =1 2.E

2

P oursuite (8.17)

Nous prenons comme loi d’ajustement la loi MIT décrivant finalement une descente de gradient :

dt = −γP oursuite.

∂J(α)

∂α (8.18) Le scalaire γP oursuite décrit la vitesse de ce processus de mise à jour (voir figure 8.4). Ainsi une valeur nulle de ce paramètre rendra le modèle interne complètement statique et donc incapable d’intégrer toute modification du sys-tème volant. Par ailleurs, nous définissons le seuil rP oursuite, en deçà duquel le mécanisme d’ajustement ne sera pas déclenché malgré un niveau d’erreur

EP oursuite non nul. Des équations 8.17 et 8.18, la loi d’ajustement devient :

dt = −γP oursuite.EP oursuite.

∂EP oursuite(α)

∂α (8.19) Il convient alors d’expliciter la relation 8.19. Pour cela, nous raisonnerons à l’aide du formalisme de Laplace. Nous supposons que le conducteur dispose

d’une représentation interne du système volant de structure identique à celle du système réel. Le conducteur a donc, par l’expérience, internalisé un sys-tème masse-ressort-amortisseur. Comme dans notre approche seule la raideur du système volant est modifiée, nous émettons l’hypothèse que seule la repré-sentation interne de celle-ci est mise à jour. En posant CConducteur le couple global produit par le conducteur (regroupant ainsi les couples de poursuite et d’impédance), nous avons :

θCourant CConducteur = 1 Jsv.s2+ Bsv.s + Ksv (8.20) ˆ θCourante CConducteur = 1 ˆ Jsv.s2+ ˆBsv.s + ˆKsv (8.21) Où Jsv, Bsvet Ksvreprésentent respectivement l’inertie, l’amortissement et la raideur du système volant et ˆJsv, ˆBsvet ˆKsvleurs représentations internes. La loi d’ajustement devient alors :

d ˆKsv

dt = −γP oursuite.EP oursuite.

CConducteur

( ˆJsv.s2+ ˆBsv.s + ˆKsv)2 (8.22) En multipliant par CConducteur

CConducteur nous obtenons enfin : d ˆKsv dt = −γP oursuite.EP oursuite. ˆ θ2 Courante CConducteur (8.23) Nous remarquons que dans cette expression apparaît l’inverse du couple produit par le conducteur, qui, s’il s’annule, rend impossible tout processus de mise à jour des paramètres du modèle interne. Il est à noter que ce résultat provient du choix de la loi d’ajustement qui dans notre contexte n’est peut-être pas parfai-tement adaptée. Toutefois, il convient de s’interroger sur la signification et les conséquences d’une annulation du couple conducteur. En effet, l’apprentissage de la dynamique du système volant ne peut être réalisé que lorsque ce système est stimulé. Les volants sont des systèmes dits neutres car leur position cen-trale correspond à une orientation des roues et une remontée de couple nulles. Lors d’une conduite en ligne droite, sans dissymétrie de glissement entres les roues gauches et droites, sans vent latéral, etc., il est impossible au conduc-teur d’estimer la raideur du volant. Nous avons pu tester avec succès d’autres lois d’ajustement (voir équation 8.24), établies par exemple de manière plus empirique.

d ˆKsv

dt = −γP oursuite.EP oursuite.CConducteur (8.24)

Il n’est pour le moment pas établi de loi d’ajustement physiologiquement plau-sible. De ce fait, le choix d’une loi par le modélisateur peut être dicté par différents critères, que ce soit pour garantir la stabilité du processus d’adap-tation (par des fonctions de Lyapunov par exemple), par simplicité de calcul,

8.4. COMPOSANTS ADAPTATIFS 119

Figure8.4 – Influence de la vitesse d’apprentissage sur l’estimation de la rai-deur du système volant. La conduite est réalisée en virage établi, la rairai-deur du volant passe brusquement de 3 à 6N.m/rad. Les courbes figurant ci-dessus re-présentent la valeur de l’estimation de cette raideur par le conducteur. Du choix de la vitesse d’apprentissage dépendra la capacité à internaliser plus ou moins rapidement les changements de contextes. Nous observons avec cet exemple une difficulté courante avec l’approche MRAC : des choix de vitesses d’apprentis-sage trop élevées peuvent être sources d’oscillations et donc d’instabilités mais doivent être suffisantes pour répondre au signal d’excitation.

etc. Pour récapituler, le tableau 8.3 présente les différentes entrées, sorties et paramètres du mécanisme d’adaptation. Par ailleurs, la stratégie de mise à jour du modèle interne de la dynamique du système volant suit les règles suivantes :

– Si |EP oursuite| ≤ rP oursuite alors d ˆKsv

dt = 0

– Si |EP oursuite| > rP oursuitealorsd ˆKsv

dt = −γP oursuite.EP oursuite. θˆ2Courante

CConducteur