Paramétrage - Comparaison des algorithmes de contrôle de plateforme

3.6 Comparaison des algorithmes de contrôle de plateforme

4.1.1 Paramétrage

Il est évident que la solution du problème d’optimisation dépend directement de sa formulation. C’est pourquoi, nous analysons les paramètres qui interviennent dans la mise en œuvre du MPC en temps réel, qui augmentent la fidélité de mouvements et qui maximisent l’espace de travail de la plateforme. Le réglage de l’algorithme consiste à choisir les poids de pondération, les horizons de prédiction et de contrôle, le temps d’échantillonnage, la référence future du système et les facteurs d’échelle pour obtenir les performances souhaitées du système.

Horizons de prédiction et contrôle

La commande prédictive est un type de contrôle optimal qui n’utilise pas un Np =

Nu = ∞ dans la fonction de coût (25), puisqu’il s’agit d’une stratégie à horizon fini.

Par conséquent, afin d’obtenir une loi de contrôle MPC avec les mêmes performances que la stratégie optimale, il est nécessaire de définir un Nu et un Np suffisamment

long [Rossiter, 2003]. Pour l’horizon de contrôle, nous avons choisi Nu = 3 parce

qu’à partir de cette valeur, la performance de la loi de contrôle ne varie pas. Au contraire, une valeur plus élevée consomme plus de temps de calcul.

Lorsque la plateforme est proche de ses limites, celle-ci doit s’arrêter avec une valeur inférieure au seuil du mouvement humain afin de respecter l’enveloppe de travail. Ce seuil est conçu pour que le conducteur ne perçoive pas de faux indices de mouvement. Les détails de ce choix et de cette technique ont été précisés dans la partie 2.3.5.

D’après la littérature [Fang et al., 2017], un temps de prédiction entre 7 et 14 secondes est nécessaire pour que le simulateur freine avant d’arriver à ses limites (tableau 2). Ainsi, si nous considérons un temps de prédiction minimum de 7 secondes et une fréquence de contrôle nécessaire de 100 Hz1_{, l’horizon de prédiction}

devient Np = 700. Cette période de prédiction est appliquée au système dans la

prédiction des états (partie 3.4.2) et aux contraintes (22), ce qui représente un coût de calcul important dans l’optimisation. Ce coût empêche de résoudre le problème d’optimisation en temps réel. Afin d’atteindre ce temps de prédiction en temps réel, nous utilisons une fréquence d’échantillonnage ts non-uniforme le long de l’horizon de prédiction.

La méthode consiste à appliquer deux fréquences différentes lors de la discrétisation du système et des contraintes. La première période d’échantillonnage ts1 est la

même que la fréquence de contrôle (0,01s) et sera fixée dans les 10 premiers pas de temps. Pour la seconde période d’échantillonnage ts2, nous avons fait un test en

simulation pour choisir le meilleur compromis entre la performance et le temps de calcul. Ainsi, nous avons fait varier le nombre de pas dans l’horizon de prédiction

Np et ts2 afin d’obtenir le temps de prédiction requis de 7,1 secondes qui est dans la

gamme des valeurs nécessaires pour que le simulateur freine avant d’arriver à ses limites. Il faut signaler que si ts2 augmente, la valeur de Np diminue ainsi que le

temps de calcul. La figure 39 illustre la distribution de ts1 et ts2 pour un horizon de

prédiction donné et le tableau 8 résume les différentes conditions de simulation.

FIGURE39 – Temps d’échantillonnage non uniforme.

Il faut signaler que cette méthode a été inspirée des travaux effectués par [Ma- ran et al., 2015], dans lequel un temps d’échantillonnage différent est appliqué au problème d’optimisation dans les variables de décision ∆U afin de réduire le temps de calcul de l’optimisation. En revanche, dans notre méthode, les temps d’échantillonnage sont appliqués dans la prédiction des états et les contraintes du système.

ts1*(N1) ts2*(N2) Dimension de Np Temps de prédiction (s)

0,01*(10) 0,5*(140) 150 7,1 0,01*(10) 0,1*(70) 80 7,1 0,01*(10) 0,15*(47) 57 7,1 0,01*(10) 0,2*(35) 35 7,1

TABLEAU 8 – Fréquences d’échantillonnage différentes pour un même temps de

prédiction.

Afin de simuler les différentes ts2 et horizons de prédiction Np, une accélération de

référence accveh avec des composantes à hautes et à basses fréquences a été choisie

comme indiqué dans la figure 40. Cette figure montre les réponses du système en boucle fermée en utilisant différentes fréquences dans l’horizon de prédiction non uniforme. Nous observons que plus la valeur de ts2 est faible, plus le suivi du signal

d’entrée est important. Cependant, un ts2 petit génère un coût de calcul élevé à

cause de la valeur de Np. En tenant compte du temps de calcul et de la performance

de la stratégie de contrôle, nous avons choisi un ts2 = 0, 1 avec Np = 80, car il est

suffisamment petit pour permettre une mise en œuvre du MPC en temps réel avec un bon suivi de la trajectoire. Nous constatons également que dans aucune des configurations la référence n’est entièrement suivie, à cause des fortes restrictions imposées aux états.

FIGURE 40 – Réponses en boucle fermée avec différentes fréquences dans l’horizon

de prédiction non uniforme (les valeurs correspondent à ts2∗ N2 dans le tableau 8).

Réglage des poids

Bien que nous ayons déjà défini l’horizon de contrôle et de prédiction, ces deux conditions ne sont pas suffisantes pour assurer la faisabilité du problème de mi- nimisation de l’équation (25) en temps réel. En fait, il reste à choisir les poids des matrices de pondération Qδ, Qλ et Qq qui définiront la loi de contrôle et par

conséquent, le comportement du système en boucle fermée.

La plupart des auteurs choisissent les matrices de pondération de manière in- tuitive aux moyens d’essais et d’erreurs [Beghi et al., 2012; Correia Augusto & Leal Loureiro, 2009; Garrett & Best, 2013]. Pour ce faire, des valeurs constantes ou des séquences exponentielles sont utilisées [Mohammadi et al., 2016]. Ainsi, si les poids de pondération de l’erreur ont une valeur élevée au début de l’horizon de prédiction, le contrôle sera strict. Au contraire, si les poids sont importants à la fin de l’horizon de prédiction, le contrôle sera plus fluide [Bordons & Camacho, 2007]. D’autres auteurs utilisent des méthodes d’optimisation pour déterminer les poids qui donnent une meilleure performance du système selon une référence donnée [Mohammadi et al., 2018]. Bien que cette dernière offre de nombreux avantages en ce qui concerne les performances du système, notre objectif n’est pas de fixer une référence future dans la prédiction puisque le comportement du conducteur est inconnu. C’est pourquoi nous avons décidé de choisir les pondérations en utilisant la méthode de l’essai-erreur.

Un autre paramètre de réglage important du MPC est la mise à l’échelle du signal d’entrée. Comme nous l’avons mentionné dans la section 3.1, une reproduction 1 :

1 n’est pas toujours possible étant donné l’espace de travail limité du simulateur. Cependant, comme il est dit dans [Bruschetta et al., 2016], le choix de la valeur de mise à l’échelle est un sujet de débat important dans la littérature, principalement en raison de la présence du conducteur dans la boucle de contrôle. En outre, la mise à l’échelle dépend fortement de l’utilisation du simulateur : soit pour tester une nouvelle technologie, soit pour un scénario de conduite spécifique. Par conséquent, nous nous sommes basés sur l’étude réalisée par [Berthoz et al., 2013] afin de choisir le facteur d’échelle du signal de référence. Dans celle-ci, 65 participants indiquent une préférence pour les facteurs d’échelle inférieurs à l’unité et compris dans une large gamme de valeurs acceptables entre 0,4 et 0,75. En dehors de ces valeurs, les performances de conduite se dégradent considérablement.

Dans le document Contrôle plateforme pour la validation du véhicule autonome sur simulateur dynamique à hautes performances (Page 102-105)