• Aucun résultat trouvé

Identification du déterminisme

C’est ce deuxième point, la recherche du déterminisme derrière l’apparent désordre des séries chronologiques, qui a plus particulièrement fait l’objet de recherches en hydrologie (Sivakumar et al., 2001; Sivakumar, 2000; Sivakumar et al., 1999a,b; Porporato & Ridolfi, 1996, 1997; Puente & Obregon, 1996; Jayawardena & Lai, 1994; Rodriguez-Iturbe et al., 1989b). L’idée générale est que si les séries chronologiques (trajectoires) ne sont pas aléa-toires mais déterministes et si l’on sait décrire ces trajecaléa-toires, alors une prévision à court terme2 est possible. C’est de ces travaux et de leurs résultats que nous allons parler dans ce qui suit. Place donc au concret.

6.2 Identification du déterminisme

Considérons un processus déterministe discret et ”isolé” au sens où l’état xi observé au pas de temps i est parfaitement déterminé par les états des D pas de temps précédents et ne dépend pas d’autres variables de forçage extérieures. Ce qui peut s’écrire :

xi= f (xi−1, xi−2, ..., xi−D) (6.1) La fonction f ainsi que l’entier D ne sont pas connus a priori. On peut contruire des vecteurs de trajectoires ~Xi,m= (xi, xi−1, xi−2, ..., xi−m+1) de dimension m (embedding dimension). Si la fonction f existe, et si m > D, alors les vecteurs trajectoires du processus considéré seront regroupés dans un sous-espace de dimension D de l’espace à m dimensions étudié (Takens, 1981). L’espace à m dimension dans lequel on étudie les trajectoires est appelé espace de phase (phase space). Le sous-espace dans lequel se trouvent les trajectoires, appelé attracteur, peut avoir une forme complexe dans le cas d’un processus chaotique, d’où le nom d’attracteurs étranges qui leur est parfois donné.

Prenons deux exemples à titre d’illustration : (i) un processus aléatoire correspondant au tirage de variables aléatoires indépendantes suivant une loi uniforme sur l’intervalle [0, 1] et (ii) une série de données générées par le modèle logistique dont l’expression est la suivante :

xi+1= axi(1 − xi) (6.2)

Ce modèle est connu pour avoir un comportement chaotique lorsque a = 4. Son attracteur

2

La prévision à long terme n’est pas possible puisque le processus générateur de la série chronologique étudiée est supposé chaotique.

est de dimension 1 (cf. équation 6.2). Les deux processus génèrent des séries chronologiques de valeurs comprises dans l’intervalle [0, 1]. Les deux séries de données semblent a priori assez similaires comme l’illustre la figure 6.1.

Fig. 6.1 – Séries chronologiques de données issues de tirages aléatoires indépendants dans une loi uniforme ou générées par un processus logistique a = 4 (Kolasinski, 2001).

En revanche, la représentation des trajectoires dans l’espace de phase de dimension deux révèle clairement la différence entre ces deux processus. L’ensemble de cet espace est couvert par les trajectoires du processus aléatoire, alors que ces trajectoires sont regroupés sur un attracteur de dimension D = 1 dont la forme est donnée par l’équation 6.2 dans le cas du processus logistique (cf. figure 6.2).

Fig. 6.2 – Trajectoires d’un processus logistique (a = 4) et d’une série de variables aléa-toires indépendantes uniformes dans l’espace de phase à deux dimensions (Kolasinski, 2001).

Les méthodes d’identification du chaos proposées dans la littérature (voir Sivakumar (2000) pour une revue complète) ont pour but de révéler l’existence d’un attracteur de dimension D limitée. Elles consistent soit à évaluer directement la dimension cet éventuel attracteur (Sivakumar et al., 2001; Porporato & Ridolfi, 1996; Grassberger & Procaccia, 1983a), soit à révéler indirectement son existence en évaluant les performances de modèles de prévision

6.2 Identification du déterminisme 105 basés sur la méthode des plus proches voisins : nonlinear prediction method (Sivakumar et al., 2001; Casdagli, 1987; Farmer & Sidorowich, 1987). L’efficacité des prévisions révèle en effet le caractère répétitif des trajectoires et donc la possible existence de l’attracteur. Deux méthodes principales ont été proposées pour évaluer directement la dimension d’un attracteur.

6.2.1 La méthode du comptage de boîtes

Il s’agit de la méthode la plus simple pour évaluer la dimension fractale (ou de Hausdorf) d’un objet géométrique. Elle consiste à découper l’espace à m dimensions considéré en hypercubes (boîtes) de côtés de longueur l et à compter le nombre d’hypercubes contenant au moins une donnée (une trajectoire dans notre cas). La relation entre le nombre de boîtes non vides et la longueur l est une fonction puissance dont l’exposant est la dimension de l’objet étudié. S’il existe un attracteur de dimension D, cette méthode doit retourner la valeur m si D > m et D(m) = D lorsque D ≤ m. En théorie, l’identification d’un attracteur, ou à tout le moins, la concentration des trajectoires dans un espace de dimension finie (cf. remarques ci-dessous) est très simple. On construit des vecteurs trajectoires de dimensions m croissantes et on évalue la dimension D(m) de l’espace dans lequel ces trajectoires se trouvent. Une saturation de la valeur D(m) lorsque m augmente révèlera la présence de l’attracteur. Et la valeur limite D sera la dimension de cet attracteur.

En pratique cependant, la méthode du comptage de boîtes est inutilisable pour des systèmes dynamiques ayant un attracteur de dimension D > 2 (Grassberger & Procaccia, 1983a). Il faut en effet choisir l de façon qu’il y ait suffisamment de boîtes (l doit être petit) mais aussi de façon qu’il y ait un nombre d’observations suffisant dans les boîtes non vides (l ne doit pas être trop petit). La gamme des valeurs possibles pour l se réduit drastiquement lorsque la dimension m de l’espace de phase augmente, ce qui est illustré dans la figure 6.3. Dans cet exemple, une série de variables aléatoires indépendantes et identiquement distri-buées (IID) suivant une loi Beta(0.3,0.3) a été étudiée. Ce processus purement aléatoire ne possède pas d’attracteur de dimension finie. La méthode du comptage de boîte doit évaluer une dimension proche de celle de l’espace de phase (cf. tableau 6.1).

Les limites de la méthode du comptage de boîtes ont amené Grassberger & Procaccia (1983a,b) à proposer une autre mesure de la dimension d’un attracteur - la dimension de corrélation (correlation dimension)- désormais largement utilisée dans les travaux portant sur le chaos. Notons qu’une version de la méthode de la dimension de corrélation permettant de tenir compte de variables de forçage a récemment été proposée (Sauer et al., 1991) et

Fig. 6.3 – Série de variables aléatoires IID suivant une loi Beta(0.3,0.3). Résultats de la méthode du comptage de boîtes : l longueur du côté des boîtes et M (l) nombre de boîtes non vides (Kolasinski, 2001).

m Slope Variance 1 0.99 0.02 2 1.93 0.05 3 2.81 0.07

Tab. 6.1 – Dimensions de l’attracteur : série de variables aléatoires IID suivant une loi Beta(0.3,0.3) (Kolasinski, 2001).

6.2 Identification du déterminisme 107 appliquée dans le cadre de la prévision des débits des cours d’eau (Porporato & Ridolfi, 2001; Casdagli, 1992). Cette méthode ne sera pas utilisée dans ce qui suit mais permet de lever l’hypothèse contraignante et contestable d’un processus isolé (cf. discussion ci-après).

6.2.2 La méthode de la dimension de corrélation

L’intégrale de corrélation est définie comme suit pour une dimension m et toute valeur positive r : C(r, m) = 2 N (N − 1) N X i=1 N X j=i+1 H(r − | ~Xi,m− ~Xj,m|) (6.3)

où les ~Xi,m sont les vecteurs trajectoires de dimension m, | ~Xi,m − ~Xj,m| est la distance euclidienne entre deux vecteurs dans l’espace de phase de dimension m, N est le nombre total de trajectoires et H est une fonction booléenne : H(x) = 0 si x ≤ 0 et H(x) = 1 si x > 0.

Notons que C(r, m) est tout simplement la fonction de répartition des inter-distances entre les vecteurs trajectoires. Le nombre de couples de trajectoires est quasiment indépendant de m. Grassberger & Procaccia (1983b) ont montré que la relation entre C(r, m) et r tend asymptotiquement vers une fonction puissance lorsque r tend vers zéro :

C(r, m)r→0 ∝ rν (6.4)

ν est l’exposant de corrélation (correlation exponent). C’est la pente asymptotique de la relation log(C(r, m)) versus log(r) lorsque r tend vers zéro. Si elle existe, la valeur limite de ν lorsque m tend vers l’infini est appelée dimension de corrélation (correlation dimension). Lorsque les observations sont réparties de manière uniforme sur l’attracteur, ν = D(m). Dans le cas contraire, ν ≤ D(m) (Grassberger & Procaccia, 1983b).

Les résultats obtenus pour deux processus aléatoires sont présentés dans la figure 6.4 : séries de variables aléatoires IID suivant une loi uniforme ou Beta sur l’intervalle [0, 1] (30000 valeurs ont été générées dans chaque cas). Dans les deux cas, la relation entre log(C(r, m)) et log(r) apparaît asymptotiquement linéaire. De plus, comme prévu, l’estimation de ν est très proche de la dimension de l’espace de phase dans le cas de la loi uniforme et est nettement inférieure dans le cas de la loi Beta (tableau 6.2).

(a) variables IID uniformes sur [0, 1] (b) variables IID Beta(0.3,0.3)

Fig. 6.4 – Intégrales de corrélation pour m compris entre 2 et 10 (Gaume et al., 2006b).

m ν Uniforme ν Beta(0.3,0.3) 1 0.99 0.54 2 1.98 1.08 3 2.70 1.62 5 4.72 2.66 10 9.46 5.00

6.3 Quelques réflexions et objections 109