• Aucun résultat trouvé

2.2 Définition et propriétés des profils spatiaux de vitesse

2.2.3 Somme de deux profils spatiaux de vitesse

  6(t − 1) si t ≤ 1 0 si 1 ≤ t ≤ 2 6(t − 2) si t ≥ 2 ,

et que F00 est continue. Donc F est de classe C2. L’étude de F000 donne :

F000(t) =    6 si t < 1 0 si 1 < t < 2 6 si t > 2 ,

avec Fg000(1) = 6 6= Fd000(1) = 0 et Fg000(2) = 6 6= Fd000(2) = 0. Donc en particulier, F000 n’est pas définie pour t = 1.

Enfin, on étudie la dérivabilité de vS = F0◦ F−1.

En utilisant l’expression de F0, on en déduit l’expression de vS = F0◦ F−1 : vS =

(

3(x − 1)23 si x ≤ 1 3(x − 1)23 si x > 1 .

On retrouve donc la fonction vS obtenue à l’exemple2.4. Donc vSn’est pas dérivable en x0 = 1.

2.2.3 Somme de deux profils spatiaux de vitesse

Proposition 2.2. Soit v1 et v2 deux profils spatiaux de vitesse appartenant à ESSP et définis sur [0, xf]. Soit F1 : [0, T1] −→ [0, xf] la fonction associée à v1 telle que v1(x) = F10 ◦ F1−1(x) et vérifiant les hypothèses (H1) ou (H2) du théorème 2.5. Soit x0 ∈ [0, xf] tel que v1(x0) = 0 et v2(x0) > 0. Alors la somme v1+ v2 n’est pas un profil spatial de vitesse.

Démonstration. Soit v1 et v2 appartenant à ESSP et définis sur [0, xf]. Par defi-nition, il existe T1, T2 ∈ R+ et il existe deux fonctions F1 : [0, T1] −→ [0, xf] et F2 : [0, T2] −→ [0, xf] de classe C2, croissantes et nulles en zéro telles que v1(x) = F10 ◦ F1−1(x) et v2(x) = F20 ◦ F2−1(x). On suppose que F1 vérifie les hy-pothèses (H1) ou (H2) du théorème 2.5, et on pose x0 ∈ [0, xf] tel que v1(x0) = 0 et v2(x0) > 0. Alors, d’après les théorèmes2.4et2.5, v1 n’est pas dérivable en x0 et v2 est dérivable en x0. Si on étudie les taux d’accroissement respectifs de v1 et v2 en x0, on a : v1(x0+ h) − v1(x0) h  +∞ si h → 0+ −∞ si h → 0 ,

car la courbe représentative de v1 présente un point de rebroussement de première espèce au point (x0, 0), et

v2(x0+ h) − v2(x0)

par définition de la dérivabilité. Ainsi, si on étudie le taux d’accroissement de la somme v1+ v2 en x0, on obtient : (v1+ v2)(x0+ h) − (v1+ v2)(x0) h = v1(x0+ h) − v1(x0) h + v2(x0+ h) − v2(x0) h  +∞ si h → 0+ −∞ si h → 0 . Donc la courbe représentative de la fonction v1+ v2 présente un point de rebrous-sement de première espèce au point (x0, 0). Autrement dit, la fonction v1+ v2 n’est pas dérivable en x0. Or (v1+ v2)(x0) > 0 et on a montré que les profils spatiaux de vitesse étaient dérivables sur H+ = {x ∈ [0, xf], vS(x) > 0} (th.2.4). On en déduit donc que la somme v1+ v2 n’est pas un profil spatial de vitesse.

Cette proposition montre que la somme de deux profils spatiaux de vitesse n’est pas toujours un profil spatial de vitesse. Ainsi, faire la moyenne arithmétique de plusieurs profils spatiaux de vitesse n’a de sens que dans deux cas :

– soit lorsque tous les profils sont strictement positifs (pas d’arrêts),

– soit lorsque tous les profils passent par zéro aux mêmes points (i.e. tous les véhicules s’arrêtent exactement aux mêmes endroits).

La gestion des arrêts est donc un problème qu’il faudra prendre en compte lors de la construction du profil de référence. En effet, si on choisit le profil moyen (correspon-dant à la moyenne arithmétique de tous les profils) comme profil de référence, il faut soit exclure les arrêts, ce qui paraît être une solution irréaliste, soit recaler les profils afin qu’ils s’annulent tous aux mêmes points. Cette deuxième solution nécessite en fait deux étapes : dans un premier temps, classer les profils en groupes distinguant, pour chaque arrêt, ceux qui se sont arrêtés et ceux qui ne se sont pas arrêtés ; puis dans un deuxième temps, recaler les profils afin que les arrêts soient situés aux mêmes positions. Ce problème de recalage des profils de vitesse sera traité au chapitre5.

2.3 Conclusion

Nous avons vu dans ce chapitre que l’analyse des données fonctionnelles avait connu un véritable essor depuis une vingtaine d’années et était utilisé dans des do-maines très divers (chimiométrie, climatologie...). Cependant, à notre connaissance, l’analyse des données fonctionnelles est très peu utilisée dans le domaine routier. On citera essentiellement les travaux de Maza [108] et Allain [4], réalisés dans le cadre de thèses CIFRE entre l’Institut de Mathématiques de Toulouse et la société Médiamo-bile, qui représentent les profils temporels de vitesse comme des fonctions du temps dans un objectif d’analyse et de prévision du trafic routier à court terme. Allain [4] propose notamment un modèle linéaire fonctionnel des vitesse observées (page 37). On peut également citer les travaux de Besse et Cardot [19] consacrés à l’approxi-mation spline avec contrainte de rang, sur un intervalle de temps, d’un processus

à temps continu, et appliqués à la prévision du trafic autoroutier. Enfin, on citera dans le domaine aérien, les travaux de Tastambekov et al. [162] qui s’intéressent à la prédiction de la trajectoire d’un avion et qui utilisent un modèle fonctionnel de régression linéaire avec une décomposition dans une base d’ondelettes.

Pourtant, nous avons montré dans ce chapitre l’importance de se placer dans un cadre fonctionnel pour l’étude des profils spatiaux de vitesse. En effet, nous avons vu les limites de la statistique multivariée dans le cas de données discrètes issues d’un processus sous-jacent continu et l’intérêt de prendre en compte le caractère fonction-nel de ces données (dérivées, régularité, contraintes de forme...). De plus, nous avons vu que, d’une part, la plupart des méthodes classiques de statistique multivariée ont été adaptées aux données fonctionnelles (analyses factorielles, modèles linéaires...), et que d’autre part, ces données ont permis l’apparition de nouvelles méthodes te-nant compte de leurs caractéristiques fonctionnelles (recalage de courbes, modèles fonctionnels définis par des équations différentielles...). Notons que les problèmes de calcul des dérivées et de recalage de profils de vitesse ont été évoqués dans le cha-pitre précédent et nous avons vu à ce sujet, les limites de méthodes actuellement utilisées dans le domaine routier. Ainsi, l’approche fonctionnelle permet de résoudre ces problèmes et est donc bien adaptée à l’étude des profils de vitesse.

En particulier, l’analyse des données fonctionnelles est particulièrement bien adaptée aux profils spatiaux de vitesse puisqu’elle permet de tenir compte de la richesse des données issues de véhicules traceurs et de préserver la cohérence phy-sique entre vitesse et position (et implicitement temps). Nous avons donc choisi dans cette thèse de nous placer dans un cadre fonctionnel et de traiter les profils spatiaux de vitesse comme des fonctions. Dans ce chapitre, nous avons proposé une modéli-sation fonctionnelle des profils spatiaux de vitesse. Nous avons défini les fonctions pouvant être la représentation d’un profil spatial de vitesse et nous avons étudié cer-taines propriétés de ces fonctions. En particulier, nous avons montré que les profils spatiaux de vitesse n’étaient pas dérivables aux points où la vitesse s’annule, ce qui pose le problème de la gestion des arrêts. Cette propriété devra être prise en compte dans l’étape de lissage permettant de convertir les données en courbes et dans la construction du profil de vitesse de référence que nous aborderons dans les chapitres suivants.

Méthodes de lissage : l’approche

par splines

L’objet de ce chapitre est de présenter les principales méthodes de lissage et plus particulièrement les méthodes de lissage utilisant les splines. En effet, nous avons vu au chapitre 2l’intérêt de traiter les profils spatiaux de vitesse comme des fonctions plutôt que des vecteurs de Rn. Nous avons également vu que la première étape d’une analyse de données fonctionnelles consistait à convertir les données brutes de na-ture vectorielle en objet fonctionnel. Les mesures de vitesse et de position issues de capteurs étant bruitées, cette étape nécessite l’utilisation d’une méthode de lissage. On se ramène donc à un problème de régression non paramétrique où l’on cherche à estimer la fonction de régression.

Dans une première section, nous rappelons quelques généralités sur la régression non paramétrique et nous présentons les méthodes de lissage généralement utilisées pour le traitement des profils spatiaux de vitesse, à savoir la méthode du noyau et la méthode par polynômes locaux.

Puis nous présentons en détails les méthodes de lissage utilisant les fonctions splines en distinguant les splines de régression, les splines de lissage et les splines pénalisées. Nous montrons notamment sur un jeu de données réelles, l’efficacité des splines de lissage par rapport à la méthode du noyau et à la méthode des polynômes locaux, pour l’estimation des profils temporels de vitesse et d’accélération.

Enfin, nous terminons ce chapitre par une généralisation de la notion de splines dans le contexte plus large des méthodes de régularisation où les splines sont définies comme la solution d’un problème variationnel dans un espace de Hilbert à noyau reproduisant.

3.1 Méthodes classiques de lissage