• Aucun résultat trouvé

3.7 Novation sur une grille d’observation

3.7.1 Corrélation des observations

Le problème de filtrage en grande dimension est un domaine beaucoup étudié ces dernières années. On sait en particulier que les filtres à particules sont peu performants dans ce genre de cas. Il y a deux raisons à cela. La première est que, plus on considère de dimensions, plus la probabilité qu’une particule ait une vraisemblance élevée est faible. En effet si on prend l’exemple d’une loi normale, on sait qu’en grande dimension, la fonction de répartition est "pointue". Cela correspond au fait que pour un rayon r > 0 fixé, la probabilité de présence d’une particule dans la boule de rayon r décroit avec le nombre de dimensions. La deuxième raison qui empêche l’utilisation de particules dans le cas de grandes dimensions est que le nombre de particules nécessaires au filtrage augmente de

manière exponentielle en fonction du nombre de dimensions. D’un point de vue numérique, cela signifie qu’il faudrait environ exp(2700) particules pour pouvoir filtrer correctement le processus du problème de la section précédente. On a cependant été capable de filtrer les observations et de reconstruire l’influence des phénomènes sous-maille avec seulement 50 particules. Notre objectif est d’expliquer pourquoi notre algorithme n’est pas soumis aux problèmes des grandes dimensions.

On sait que notre algorithme est en mesure de reconstruire des structures de plus petite taille que celles de la grille. Si l’on reprend les notations du système (3.2), on peut exprimer les fonctions de structures spatiotemporelles sur la grille. Pour cela on prend deux points de grille a et b. Les structures sur la grille entre les points a et b correspondent à la covariance E[X1

n(a)X1

n(b)]. On peut développer le calcul de cette covariance grâce à l’équation d’évolution du processus.

E h Xn1(a)Xn1(b)i = E   Fn1,1(Xn−11 (a)) + Fn,X2,11

n−1(a)(Xn−12 (a)) + Wn1(a) ×Fn1,1(Xn−11 (b)) + Fn,X2,11 n−1(b)(Xn−12 (b)) + Wn1(b)  = E  Fn1,1(Xn−11 (a))Fn1,1(Xn−11 (b))  | {z } S1 n−1(a,b) + E  Fn,X2,11 n−1(a)(Xn−12 (a))Fn1,1(Xn−11 (b))  | {z } S2→1 n−1(a,b) + E  Fn1,1(Xn−11 (a))Fn,X2,11 n−1(b)(Xn−12 (b))  | {z } S1→2 n−1(a,b) + E  Fn,X2,11 n−1(a)(Xn−12 (a))Fn,X2,11 n−1(b)(Xn−12 (b))  | {z } S2 n−1(a,b)

en utilisant le fait que les bruits sont centrés et indépendants.

On a ainsi la structure qui correspond à la partie que l’on connaît de l’évolution :

S1

n−1(a, b). Cette structure est automatiquement connue à partir du moment où on a estimé le processus au pas de temps n − 1. La structure S2

n−1(a, b) correspond à la partie que l’on ne cherche pas à estimer. En effet il s’agit de la structure qui reste dans la petite échelle et que nous pourront assimiler à du bruit. Les structures qui nous intéressent sont donc S2→1

n−1(a, b) et S1→2

n−1(a, b). Ces structures correspondent respectivement à l’influence des phénomènes de petites échelles autour du point de grille a sur le processus au point de grille b, et inversement l’influence des phénomènes de petites échelles autour du point de grille b sur le processus au point de grille a. Ce sont donc ces structures que l’on a estimées à l’aide de notre algorithme.

Or l’information que l’on a obtenu vient de quelque part. On sait que c’est en partie l’utilisation du modèle d’évolution qui a permis d’apprendre ces structures. Il est

pour-tant clair que l’on devait disposer d’informations dessus dans une certaine mesure, sinon l’algorithme de filtrage n’aurait pas été en mesure de les apprendre. On pense donc que les observations doivent contenir, au moins en partie, des structures du processus. On reprend l’écriture de l’observation du système (3.4). De la même manière que précédem-ment, on développe la covariance spatiale des observations entre deux points de grille a et b : EhYn1(a)Yn1(b)i. E h Yn1(a)Yn1(b)i = E  Hn1(Xn1(a)) + Vn1(a)Hn1(Xn1(b)) + Vn1(b)  = E  Hn1Fn1,1(Xn−11 (a) + Fn,X2,11

n−1(a)(Xn−12 (a)) + Wn1(a) ×Hn1Fn1,1(Xn−11 (b) + Fn,X2,11

n−1(b)(Xn−12 (b)) + Wn1(b)



en utilisant encore une fois le fait que les bruits sont indépendants et centrés.

On peut constater que l’observation contient toutes les structures spatiotemporelles du processus, modulo la troncature imposée par la fonction Hn. Par exemple dans le cas simplifié où la fonction d’observation est linéaire, on voit que, à une constante multiplica-tive près, l’observation contient vraiment toutes les structures du processus. Bien sûr dans le cas général ce n’est pas aussi simple. On ne sait pas calculer d’emblée ces covariances pour pouvoir connaître la perte sur les structures réelles du processus. On voit cependant que les observations peuvent contenir une information sur ces structures. Le fait de ne pas considérer les points de grille comme indépendants nous permet donc de propager l’in-formation entre les points de grille et donc d’estimer la corrélation des observations. Ces corrélations apportent des informations sur les covariances spatiotemporelles du processus et permettent donc d’estimer la remontée d’échelle.

On voit alors que, quand on estime la remontée d’échelle avec notre algorithme, on estime en même temps une partie de la corrélation des observations. On peut alors se défaire de l’hypothèse qui correspond à dire que les observations sont indépendantes en chaque point de grille. On diminue ainsi la dimension du problème. En effet quand on suppose que les observations sont indépendantes, on écrit la dépendance sur la grille s1,..,d, avec d le nombre de points de grille.

P  Xn1(s1,..,d)|Yn1(s1,..,d)= d Y i=1 P  Xn1(si)|Yn1(si)

On voit que si chacune des probabilités du membre de droite est de l’ordre de 1/2, le produit va rapidement tendre vers 0 avec le nombre de points de grille.

Lorsque que l’on prend en compte les corrélations entre les observations, et que l’on est en mesure de les estimer, on peut changer la forme que prend la vraisemblance.

P  Xn1(s1,..,d)|Yn1(s1,..,d)= PXn1(sσ(1),..,σ(d0))|Yn1(sσ(1),..,σ(d0))= d0 Y i=1 P 

Dans ce cas là, d0 est la dimension effective du problème. Cela signifie que lorsque l’on connaît les covariances entre les points de grille, la connaissance du processus sur la grille

sσ(1),..,σ(d0) suffit à estimer le processus sur la grille complète s1,..,d.

Dans le cas de l’expérience avec l’équation de shallow water de la section précédente, on pense que la dimension effective du problème doit être de l’ordre de 3 ou 4, ce qui expliquerait le faible nombre de particules nécessaires.

On ne connaît pas, a priori, de méthode pour calculer la dimension effective du pro-blème. On pense cependant qu’elle dépend, entre autres, du processus que l’on considère, de la forme de la grille et de la distance entre deux de ses points ainsi que de la nature des observations. En effet on a déjà vu que si la fonction H est très régulière, voir injective, on récupère entièrement, grâce aux observations, les covariances entre les points de grille, ce qui diminuera la dimension effective. En outre, si la distance entre deux points grilles est très grande par rapport aux structures du processus, on pourra se ramener au cas où les observations sont en fait indépendantes et on aura une dimension effective égale à la dimension réelle.

Dans le cas des phénomènes de vents générés par notre modèle, il n’est pas évident que les observations contiennent bien des structures du processus réel. En effet, l’énergie cascadant entre les différentes échelles, il est assez difficile de mettre une barrière franche entre l’échelle de la grille et l’échelle sous-maille. On va donc vérifier, à travers une expéri-mentation, que les corrélations entre les observations correspondent bien à des structures du processus continu.