• Aucun résultat trouvé

3.2 Méthodes de régression utilisées

4.1.3 Lissage des données

Comme vu dans la section 4.1.2, on dispose de deux jeux de données. De ces jeux de données, on souhaite extraire deux jeux de trajectoires à exploiter. Des informations telles l’énergie et surtout sa variation nous semblent nécessaires. En effet, dans les modèles physiques dit à énergie totale, tel BADA par exemple, la modélisation des forces projetées

−250 0 250 500 0 500 1000 1500 2000 t [s] ∆ X [m]

Figure 4.3 – Pour une trajectoire donnée issue du Mode-C, ce graphique représente la variation ∆X de la coordonnée X entre deux plots consécutifs en fonction du temps. On observe une quantification sur X ; celle-ci est présente pour toutes les grandeurs et pour toutes les trajectoires d’avions. Pour nos données, la granularité de la quantification sur X et Y est de 29 m.

−250 0 250 500 0 500 1000 1500 2000 t [s] ∆ X ∆ t [m/s]

Figure 4.4 – Pour une trajectoire donnée issue du Mode-C, ce graphique représente les différents taux d’accroissements de X calculés entre des plots successifs. On observe la superposition de deux courbes, l’une valant le double de l’autre. Celle qui vaut le double correspond à des ∆t d’une seconde. Cette superposition de deux courbes qui n’a pas lieu d’être est une conséquence de la datation des plots à la seconde près.

21000 24000 27000 30000 0 100 200 300 400 t [s] altitude [ft]

Figure 4.5 – Pour une trajectoire donnée issue du Mode-S, ce graphique représente l’alti- tude en fonction du temps. On observe des « trous » dans la trajectoire.

sur le vecteur vitesse ne sert qu’à estimer cette variation d’énergie. Partant de cette né- cessité, il nous faut obtenir un taux de montée et une accélération. L’obtention de ces informations requiert un lissage. Prendre naïvement le taux d’accroissement n’est pas sat- isfaisant comme illustré figure 4.4.

À partir d’une succession de n points à lisser, (xi, yi) ∈ R2 avec x1 ⩽ . . . ⩽ xn, le

lissage permet de n’en retenir que la tendance générale en éludant des variations de faible amplitude ou de fréquence élevée. Dans la plupart des méthodes de lissage, l’utilisateur ajuste les paramètres de la méthode pour sélectionner une tendance générale qui l’intéresse. Si les variations enlevées provenaient d’un bruit, le lissage va permettre de réduire le bruit des données.

Concernant le lissage de trajectoires radar d’avions, différents algorithmes de lissage ont été expérimentés tels les splines [Mehadhebi 99b], les filtres de Kalman [Mehadhebi 99a] et les B-splines à rigidité variable [Mehadhebi 02]. On a choisi d’utiliser un lissage par spline. Une spline d’ordre m est une fonction C2(m−1) définie par morceaux à l’aide de

polynômes de degré 2m− 1. Les points séparant ces polynômes sont appelés nœuds. Les splines de lissage sont plus lisses que les splines d’interpolation car on les autorise à ne pas passer par les points (xi, yi). De cet ajout de liberté résulte un compromis à résoudre

par l’utilisateur entre le caractère lisse de la spline et l’approximation faite des points (xi, yi). Ce compromis est traduit par le critère L(f, λ) à minimiser, défini en 4.1, qui

correspond à une pondération de deux termes, chacun de ces termes représentant un des deux critères antagonistes : la somme des erreurs au carré permet de prendre en compte l’erreur d’approximation ; et la norme L2 de la dérivée d’ordre m sur l’intervalle [x

1; xn]

représente le caractère lisse de la spline. Le caractère lisse peut être défini autrement en modifiant la pénalité ; en considérant la norme L2 d’une combinaison linéaire des dérivées

de f , [Ramsay 97] spécifie ainsi une pénalité qui va considérer comme lisse des oscillations d’une certaine fréquence. La détermination de la spline f minimisant L(f, λ) est faite avec une complexité temporelle en O(n) ([Reinsch 67]).

L(f, λ) = 1 n ni=1 (yi− f(xi))2+ λxn x1 f(m)(t)2dt (4.1)

Le paramètre de lissage λ doit être choisi. La validation-croisée ([Stone 74]), présen- tée plus en détail section 3.1.2, peut être utilisée pour sélectionner ce paramètre. Dans la pratique, cette méthode est décevante comme l’illustre la figure 4.6. Le paramètre λ semble sous-estimé ; la trajectoire lissée exhibe des sauts peu probables pour une trajec- toire d’avion. Cette sous-estimation du paramètre de lissage λ est aussi observée dans la thèse de Simpkin sur l’estimation des dérivées par le biais d’un lissage ([Simpkin 10]). Pour contourner ce problème, la fonction D1D2 du package R sfsmisc servant à estimer les dérivées premières et secondes rajoute un terme constant arbitraire au λ estimé par validation croisée.

Pour notre problème, on utilise un critère plus pragmatique pour sélectionner le paramètre de lissage λ. Une fois lissée, la trajectoire sera échantillonnée avec un certain pas de temps ∆t. On souhaite que la trajectoire échantillonnée ainsi que ses dérivées apparaissent co-

hérentes. Par exemple, si on a calculé un taux de montée sur le point courant, on s’attend à ce que le point suivant ait une altitude cohérente avec ce taux de montée. On veut aussi que la trajectoire échantillonnée soit proche des points effectivement mesurés. On a choisi de trancher ce compromis entre la cohérence de la trajectoire échantillonnée et la précision en minimisant l’écart entre les observations et une trajectoire reconstituée. Cette trajec- toire reconstituée est construite à partir des dérivées calculées tous les ∆t que l’on intègre numériquement. Fixer un ∆t va donc nous permettre, indirectement, de sélectionner un λ. Le ∆t sera le même pour toutes les trajectoires mais le λ correspondant sera ajusté pour chaque trajectoire.

Il nous faut également choisir l’ordre de la spline m. Si l’on souhaite estimer la kime

dérivée, les discussions issues de [Silverman 85] suggèrent de prendre m ⩾ k + 2. Ainsi, si on veut uniquement la dérivée, on prendra m ⩾ 3 et si l’on veut en plus l’accélération, on prendra m ⩾ 4. Sous certaines hypothèses détaillées dans [Ragozin 83], les dérivées estimées convergent vers les vraies dérivées au sens L2.

Une fois le lissage choisi, les dérivés pouvant nous intéresser sont calculées de proche en proche en utilisant la formule :

d dt[f (x1(t), . . . , xn(t))] = ni=1 ∂f ∂xi (x1(t), . . . , xn(t)) ∂xi ∂t(t)

Pour le Mode-C par exemple, on a lissé x, y et Hp. On a donc accès à leur dérivées égale-

ment. La grille météo nous permet de décrire le vent w en fonction de la position de l’avion (x, y, Hp) et de la date t. Ainsi, en appliquant la formule précédente à w(x(t), y(t), Hp(t), t),

on obtient la dérivée du vent w par rapport au temps. Cette dérivée va pouvoir être à son tour utilisée pour calculer la dérivée d’une expression faisant intervenir le vent, comme la TAS par exemple.

Paramètres de lissage pour le Mode-C

Pour choisir un lissage, on va regarder l’erreur faite entre la trajectoire lissée et la trajectoire brute. Cette erreur va dépendre des paramètres de lissage choisis. Le tableau 4.1 présente les erreurs obtenues suivant le lissage. Les différentes Root Mean Square Error (RMSE) obtenues sont du même ordre de grandeur. Toutefois, l’erreur maximum obtenue est bien plus faible pour la spline d’ordre 3. Comme illustré figure 4.7, on peut observer des écarts importants entre les valeurs lissées, en particulier sur les bords. Concernant cet exemple, la spline d’ordre 3 est la plus proche des données brutes, en particulier sur les bords. Ce constat se répétant sur plusieurs trajectoires nous conduit à choisir une spline d’ordre 3 pour les trajectoires Mode-C. Pour λ, on a choisi ∆t = 15 s car les erreurs sont assez similaire entre ∆t = 10 s et ∆t = 15 s et l’on préfère choisir les trajectoires les plus lisses pour des erreurs du même ordre de grandeur. Toutefois, on a écarté ∆t = 20 s à cause des erreurs maximum plus élevées.

−1 0 1 2 0 500 1000 1500 t [s] dV g dt [kts/s] ordre 2 3 4

Figure 4.6 – Pour un avion donné, ce graphique représente l’estimation de l’accélération par rapport au sol par une spline dont le paramètre de lissage λ a été ajusté par validation croisée. On observe des oscillations rapides de l’accélération, en particulier pour la spline d’ordre 2.

100 200 300 400 500 0 500 1000 1500 t [s] Vg [kts] ordre 2 3 4

Figure 4.7 – Pour un avion donné, ce graphique représente l’estimation de la vitesse par rapport au sol par des splines d’ordres différents. Le paramètre de lissage λ a été ajusté avec ∆t = 15s.

Table 4.1 – Statistiques sur l’écart entre les trajectoires lissées et les plots observés pour les trajectoires Mode-C.

x [m] y [m] Hp [ft]

rmse max rmse max rmse max

∆t = 10 2 77.22 1749.12 79.97 1828.93 36.16 371.92 ∆t = 10 3 42.40 433.13 51.14 448.68 36.10 344.15 ∆t = 10 4 55.56 1807.99 60.68 2242.47 36.81 348.75 ∆t = 15 2 117.27 1892.43 110.12 1833.88 43.24 395.90 ∆t = 15 3 49.01 468.77 54.77 543.79 38.22 344.15 ∆t = 15 4 80.03 2671.71 79.23 2446.30 38.69 348.75 ∆t = 20 2 153.45 1892.43 135.28 1833.88 46.18 973.67 ∆t = 20 3 50.23 732.01 55.42 863.39 39.50 344.15 ∆t = 20 4 121.16 2701.72 104.60 2445.53 41.06 521.07 λ ordre

Paramètres de lissage pour le Mode-S

Pour les trajectoires Mode-S, le tableau 4.2 présente les erreurs obtenues suivant le lissage. Les erreurs sont du même ordre de grandeur pour tous les paramétrages. Pour les même raisons que pour les trajectoires Mode-C, on préfère la spline d’ordre 3. Pour des raisons de simplification, les trajectoires Mode-C et Mode-S seront échantillonnées avec le même pas de temps 15 s.

Table 4.2 – Statistiques sur l’écart entre les trajectoires lissées et les plots observés pour les trajectoires Mode-S. cap [] route [] Vsol [kts] CAS [kts] TAS [kts] Mach[-] Hp [ft] rmse max rmse max rmse max rmse max rmse max rmse max rmse max ∆t = 10 2 0.19 5.81 0.15 5.46 0.52 4.72 0.49 7.23 0.69 8.11 0.00 0.01 7.73 104.19 ∆t = 10 3 0.14 6.84 0.11 5.27 0.48 5.54 0.43 6.09 0.62 6.60 0.00 0.01 6.04 87.18 ∆t = 10 4 0.15 7.33 0.13 7.49 0.50 5.90 0.45 9.12 0.65 8.16 0.00 0.01 6.31 156.96 ∆t = 15 2 0.21 5.81 0.19 5.46 0.54 10.54 0.51 8.75 0.74 8.11 0.00 0.01 7.77 181.80 ∆t = 15 3 0.20 10.91 0.17 10.99 0.55 7.76 0.53 11.94 0.74 13.12 0.00 0.02 7.36 141.80 ∆t = 15 4 0.23 9.60 0.19 11.41 0.59 8.89 0.59 11.81 0.79 12.52 0.00 0.02 8.44 164.04 ∆t = 20 2 0.29 14.77 0.24 10.09 0.70 9.08 0.74 13.53 1.01 14.41 0.00 0.02 8.76 183.72 ∆t = 20 3 0.31 14.10 0.28 14.56 0.67 9.12 0.68 11.94 0.91 13.12 0.00 0.02 10.56 219.99 ∆t = 20 4 0.32 18.81 0.29 19.44 0.71 13.03 0.73 11.81 0.94 16.50 0.00 0.02 10.94 200.45 λ ordre 71

Documents relatifs