• Aucun résultat trouvé

2.2 Définition et propriétés des profils spatiaux de vitesse

2.2.3 Somme de deux profils spatiaux de vitesse

6(t−1) sit≤1

0 si1≤t≤2

6(t−2) sit≥2

,

et queF00 est continue. DoncF est de classeC2. L’étude deF000 donne :

F000(t) =

6 sit <1

0 si1< t <2

6 sit >2

,

avec Fg000(1) = 6 6=Fd000(1) = 0 etFg000(2) = 6 6=Fd000(2) = 0. Donc en particulier,F000

n’est pas définie pourt= 1.

Enfin, on étudie la dérivabilité de vS =F0◦F1.

En utilisant l’expression de F0, on en déduit l’expression devS =F0◦F1 :

vS =

(

3(x−1)23 six≤1

3(x−1)23 six >1 .

On retrouve donc la fonctionvS obtenue à l’exemple2.4. DoncvSn’est pas dérivable

en x0 = 1.

2.2.3 Somme de deux profils spatiaux de vitesse

Proposition 2.2. Soit v1 et v2 deux profils spatiaux de vitesse appartenant à ESSP

et définis sur [0, xf]. Soit F1 : [0, T1]−→ [0, xf] la fonction associée à v1 telle que

v1(x) =F10 ◦F11(x) et vérifiant les hypothèses (H1) ou (H2) du théorème 2.5. Soit

x0 ∈ [0, xf] tel que v1(x0) = 0 et v2(x0) > 0. Alors la somme v1+v2 n’est pas un

profil spatial de vitesse.

Démonstration. Soit v1 et v2 appartenant à ESSP et définis sur [0, xf]. Par

defi-nition, il existe T1, T2 ∈ R+ et il existe deux fonctions F1 : [0, T1] −→ [0, xf]

et F2 : [0, T2] −→ [0, xf] de classe C2, croissantes et nulles en zéro telles que

v1(x) = F10 ◦ F11(x) et v2(x) = F20 ◦ F21(x). On suppose que F1 vérifie les

hy-pothèses (H1) ou (H2) du théorème 2.5, et on pose x0 ∈[0, xf]tel que v1(x0) = 0

etv2(x0)>0. Alors, d’après les théorèmes2.4et2.5,v1 n’est pas dérivable enx0 et

v2 est dérivable en x0. Si on étudie les taux d’accroissement respectifs dev1 etv2 en

x0, on a :

v1(x0+h)−v1(x0)

h

+∞ sih→0+

−∞ sih→0 ,

car la courbe représentative de v1 présente un point de rebroussement de première

espèce au point(x0,0), et

v2(x0+h)−v2(x0)

par définition de la dérivabilité. Ainsi, si on étudie le taux d’accroissement de la

sommev1+v2 en x0, on obtient :

(v1+v2)(x0+h)−(v1+v2)(x0)

h =

v1(x0+h)−v1(x0)

h +

v2(x0+h)−v2(x0)

h

+∞ sih→0+

−∞ sih→0 .

Donc la courbe représentative de la fonction v1+v2 présente un point de

rebrous-sement de première espèce au point(x0,0). Autrement dit, la fonctionv1+v2 n’est

pas dérivable enx0. Or (v1+v2)(x0) >0 et on a montré que les profils spatiaux de

vitesse étaient dérivables surH+ ={x∈[0, xf], vS(x)>0} (th. 2.4). On en déduit

donc que la sommev1+v2 n’est pas un profil spatial de vitesse.

Cette proposition montre que la somme de deux profils spatiaux de vitesse n’est

pas toujours un profil spatial de vitesse. Ainsi, faire la moyenne arithmétique de

plusieurs profils spatiaux de vitesse n’a de sens que dans deux cas :

– soit lorsque tous les profils sont strictement positifs (pas d’arrêts),

– soit lorsque tous les profils passent par zéro aux mêmes points (i.e. tous les

véhicules s’arrêtent exactement aux mêmes endroits).

La gestion des arrêts est donc un problème qu’il faudra prendre en compte lors de la

construction du profil de référence. En effet, si on choisit le profil moyen

(correspon-dant à la moyenne arithmétique de tous les profils) comme profil de référence, il faut

soit exclure les arrêts, ce qui paraît être une solution irréaliste, soit recaler les profils

afin qu’ils s’annulent tous aux mêmes points. Cette deuxième solution nécessite en

fait deux étapes : dans un premier temps, classer les profils en groupes distinguant,

pour chaque arrêt, ceux qui se sont arrêtés et ceux qui ne se sont pas arrêtés ; puis

dans un deuxième temps, recaler les profils afin que les arrêts soient situés aux mêmes

positions. Ce problème de recalage des profils de vitesse sera traité au chapitre5.

2.3 Conclusion

Nous avons vu dans ce chapitre que l’analyse des données fonctionnelles avait

connu un véritable essor depuis une vingtaine d’années et était utilisé dans des

do-maines très divers (chimiométrie, climatologie...). Cependant, à notre connaissance,

l’analyse des données fonctionnelles est très peu utilisée dans le domaine routier. On

citera essentiellement les travaux de Maza [108] et Allain [4], réalisés dans le cadre de

thèses CIFRE entre l’Institut de Mathématiques de Toulouse et la société

Médiamo-bile, qui représentent les profils temporels de vitesse comme des fonctions du temps

dans un objectif d’analyse et de prévision du trafic routier à court terme. Allain [4]

propose notamment un modèle linéaire fonctionnel des vitesse observées (page 37).

On peut également citer les travaux de Besse et Cardot [19] consacrés à

l’approxi-mation spline avec contrainte de rang, sur un intervalle de temps, d’un processus

à temps continu, et appliqués à la prévision du trafic autoroutier. Enfin, on citera

dans le domaine aérien, les travaux de Tastambekov et al. [162] qui s’intéressent à

la prédiction de la trajectoire d’un avion et qui utilisent un modèle fonctionnel de

régression linéaire avec une décomposition dans une base d’ondelettes.

Pourtant, nous avons montré dans ce chapitre l’importance de se placer dans un

cadre fonctionnel pour l’étude des profils spatiaux de vitesse. En effet, nous avons vu

les limites de la statistique multivariée dans le cas de données discrètes issues d’un

processus sous-jacent continu et l’intérêt de prendre en compte le caractère

fonction-nel de ces données (dérivées, régularité, contraintes de forme...). De plus, nous avons

vu que, d’une part, la plupart des méthodes classiques de statistique multivariée ont

été adaptées aux données fonctionnelles (analyses factorielles, modèles linéaires...),

et que d’autre part, ces données ont permis l’apparition de nouvelles méthodes

te-nant compte de leurs caractéristiques fonctionnelles (recalage de courbes, modèles

fonctionnels définis par des équations différentielles...). Notons que les problèmes de

calcul des dérivées et de recalage de profils de vitesse ont été évoqués dans le

cha-pitre précédent et nous avons vu à ce sujet, les limites de méthodes actuellement

utilisées dans le domaine routier. Ainsi, l’approche fonctionnelle permet de résoudre

ces problèmes et est donc bien adaptée à l’étude des profils de vitesse.

En particulier, l’analyse des données fonctionnelles est particulièrement bien

adaptée aux profils spatiaux de vitesse puisqu’elle permet de tenir compte de la

richesse des données issues de véhicules traceurs et de préserver la cohérence

phy-sique entre vitesse et position (et implicitement temps). Nous avons donc choisi dans

cette thèse de nous placer dans un cadre fonctionnel et de traiter les profils spatiaux

de vitesse comme des fonctions. Dans ce chapitre, nous avons proposé une

modéli-sation fonctionnelle des profils spatiaux de vitesse. Nous avons défini les fonctions

pouvant être la représentation d’un profil spatial de vitesse et nous avons étudié

cer-taines propriétés de ces fonctions. En particulier, nous avons montré que les profils

spatiaux de vitesse n’étaient pas dérivables aux points où la vitesse s’annule, ce qui

pose le problème de la gestion des arrêts. Cette propriété devra être prise en compte

dans l’étape de lissage permettant de convertir les données en courbes et dans la

construction du profil de vitesse de référence que nous aborderons dans les chapitres

suivants.

Méthodes de lissage : l’approche

par splines

L’objet de ce chapitre est de présenter les principales méthodes de lissage et plus

particulièrement les méthodes de lissage utilisant les splines. En effet, nous avons vu

au chapitre 2l’intérêt de traiter les profils spatiaux de vitesse comme des fonctions

plutôt que des vecteurs deRn. Nous avons également vu que la première étape d’une

analyse de données fonctionnelles consistait à convertir les données brutes de

na-ture vectorielle en objet fonctionnel. Les mesures de vitesse et de position issues de

capteurs étant bruitées, cette étape nécessite l’utilisation d’une méthode de lissage.

On se ramène donc à un problème de régression non paramétrique où l’on cherche à

estimer la fonction de régression.

Dans une première section, nous rappelons quelques généralités sur la régression

non paramétrique et nous présentons les méthodes de lissage généralement utilisées

pour le traitement des profils spatiaux de vitesse, à savoir la méthode du noyau et

la méthode par polynômes locaux.

Puis nous présentons en détails les méthodes de lissage utilisant les fonctions

splines en distinguant les splines de régression, les splines de lissage et les splines

pénalisées. Nous montrons notamment sur un jeu de données réelles, l’efficacité des

splines de lissage par rapport à la méthode du noyau et à la méthode des polynômes

locaux, pour l’estimation des profils temporels de vitesse et d’accélération.

Enfin, nous terminons ce chapitre par une généralisation de la notion de splines

dans le contexte plus large des méthodes de régularisation où les splines sont définies

comme la solution d’un problème variationnel dans un espace de Hilbert à noyau

reproduisant.

3.1 Méthodes classiques de lissage