• Aucun résultat trouvé

Dépendance aux paramètres de modélisation

Dans le document The DART-Europe E-theses Portal (Page 48-52)

2.3 Dépendances et précautions d’utilisation

2.3.1 Dépendance aux paramètres de modélisation

Notre but est ici de montrer que la méthode de titrage du bruit est fortement dépendante du type de modèle choisi, le type de modèle étant décrit par la « structure » du polynôme utilisé comme modèle, définie par les paramètres de modélisationd,M, etκ. Pour ce faire, nous utilisons deux dynamiques connues très différentes : la première — un bruit blanc, soit une dynamique stochastique — nous permet de mettre en évidence de « faux positifs » pour de faibles valeurs de paramètres, soit des couples de paramètres pour lesquels la détection de non-linéarité est illégitime-ment positive ; la seconde — le système de Rössler, soit une dynamique déterministe non-linéaire — nous permet de mettre en évidence de « faux négatifs » , pour de plus fortes valeurs de paramètres, soit des couples de paramètres pour lesquels la détection de la non-linéarité du système échoue par cette méthode.

Faux positifs

Nous avons testé la détection de non-linéarité, soit la « première étape » du titrage du bruit, sur une série temporelle produite par un processus de bruit blanc gaussien. Un bruit blanc est une réalisation d’un processus aléatoire conduisant à une série temporelle {εt}+∞t=−∞ dont l’ensemble des éléments présente une moyenne nulle

E(εt) = 0, (2.8)

une varianceσ2

E(ε2t) =σ2, (2.9)

et dont les éléments sont non corrélés dans le temps :

E(εtετ) = 0 pourt6=τ. (2.10) La fonction d’auto-corrélation correspondante est donc nulle en tout point sauf à l’origine. Un processus satisfaisant les conditions (2.8) et (2.10) est décrit comme un processus de bruit blanc.

Si on remplace la condition de non corrélation (2.10) par la condition, plus forte3, d’indépendance εt, ετ indépendants pourt6=τ, (2.11) on est alors en présence d’un processus de bruit blanc indépendant. Enfin, si le processus de bruit blanc indépendant remplit également la condition

εt∼N(0, σ2), (2.12)

il est qualifié de bruit blanc gaussien [20]. Le bruit blanc gaussien suit donc une loi normale de moyenne et de variance données, produisant une série temporelle{εt}+∞t=−∞dont les éléments sont de moyenne nulle, et totalement indépendants les uns des autres. La dynamique liée à ce processus est donc une dynamique stochastique, sans aucun déterminisme possible.

La probabilitépd’obtenir de meilleurs résultats avec un modèle non-linéaire qu’avec un modèle linéaire a été recherchée pour différentes valeurs des paramètresdet M, sur le même échantillon de 2000 points d’un bruit blanc gaussien. Cette probabilité fluctue de façon significative avec les paramètres (d,M) retenus pour l’estimation des modèles (Tab. 2.3). Nous rappelons ici qu’une valeur de p supérieure ou égale à 0,99 indique qu’une composante non-linéaire a été détectée

3. La condition d’indépendance (2.11) implique la condition de non corrélation (2.10) ; en revanche, l’inverse n’est pas vrai.

Table2.3 – Probabilitépd’obtenir une meilleure prédiction avec un modèle non-linéaire qu’avec un modèle linéaire pour un bruit blanc en fonction des paramètres (d, M) correspondant aux valeurs maximales autorisées, respectivement du degré de non-linéarité et du nombre de termes.

Les valeurs supérieures ou égales à 0,99 (engras) sont de faux positifs.

M/d 2 3 4 5 6 7 8 9 10

10 0,49 0,51 0,58 0,55 0,58 0,54 0,59 0,51 0,51 20 0,44 0,47 0,53 0,51 0,53 0,55 0,51 0,50 0,52 30 0,51 0,49 0,55 0,51 0,52 0,58 0,54 0,52 0,60 40 0,56 0,46 0,56 0,44 0,47 0,53 0,49 0,48 0,59 50 0,60 0,44 0,56 0,43 0,45 0,56 0,63 0,51 0,59 60 0,62 0,52 0,56 0,56 0,50 0,64 0,68 0,72 0,56 70 0,67 0,46 0,51 0,51 0,47 0,68 0,66 0,72 0,86 80 0,71 0,44 0,61 0,55 0,44 0,65 0,71 0,71 0,88 90 0,65 0,47 0,59 0,51 0,72 0,65 0,68 0,67 0,86 100 0,71 0,47 0,62 0,52 0,77 0,69 0,76 0,72 0,87 110 0,80 0,44 0,59 0,50 0,78 0,67 0,75 0,75 0,89 120 0,80 0,44 0,58 0,50 0,80 0,66 0,77 0,83 0,92 130 0,85 0,66 0,89 0,92 0,86 0,99 0,78 0,81 0,93 140 0,89 0,63 0,89 0,93 0,86 0,99 0,76 0,84 0,93 150 0,90 0,65 0,90 0,95 0,88 1,00 0,79 0,86 0,95 160 0,87 0,54 0,85 0,94 0,82 0,99 0,70 0,83 0,94 170 0,82 0,69 0,80 0,91 0,78 0,99 1,00 0,77 0,91 180 0,78 0,59 0,71 0,88 0,67 0,99 1,00 0,70 0,87 190 0,72 0,50 0,63 0,83 0,60 0,98 1,00 0,62 0,85 200 0,67 0,40 0,54 0,76 0,50 0,98 1,00 0,55 0,83

par les estimateurs polynomiaux utilisant ces paramètres, tandis qu’une valeur de probabilité p voisine de 0,50 indique que le choix entre un modèle linéaire et un modèle non-linéaire n’est pas évident. C’est ce que nous observons pour la plupart des valeurs des paramètres (d,M) testés. En principe, la probabilité ne devrait pas excéder 0,99, dans la mesure où il ne devrait y avoir aucun avantage à choisir un modèle non-linéaire plutôt qu’un modèle linéaire pour décrire la dynamique

— stochastique — sous-jacente à un bruit blanc gaussien. Aussi, il est plutôt surprenant de trouver un domaine de l’espace des paramètres pour lequel il y a un avantage évident à utiliser un modèle non linéaire, c’est-à-dire pour lequel on trouve p ≥ 0,99 (par exemple pour d=7 et M=130 à 180) : en d’autres termes, ceci reviendrait à dire qu’une composante non linéaire a été identifiée pour ces paramètres de modélisation, et nous amènerait à conclure quant à la présence d’une composante non-linéaire sous-jacente à un bruit blanc gaussien. Ces résultats correspondent, selon toute évidence, à de faux positifs. Ceci semble montrer que toute la gamme des paramètres n’est pas optimale, et, plus particulièrement, le domaine de l’espace des paramètres dans lequel les faux positifs sont observés est associé à un degré de non-linéarité ainsi qu’un nombre de termes relativement élevé. Nous pouvons supposer que la détection de non-linéarité est sensible à la sur-paramétrisation, connue pour réduire la qualité des modèles prédictifs [9]. D’ores et déjà, nous pouvons conclure que le nombre de termes retenus, tout comme le degré du polynôme, ne sont pas sans conséquences sur la pertinence des résultats, et peuvent induire des résultats erronés si leur valeur est trop grande.

Faux négatifs

L’exemple discuté dans la partie précédente, donnant de faux positifs après un mauvais choix de paramètres, nous montre que la détection de non-linéarité appliquée à un bruit blanc dépend de la structure des modèles, et que la probabilitépne doit pas être calculée pour des paramètres M etdde modélisation trop grands. Nous travaillerons donc àd≤5etM ≤100, puisqu’il semblerait que cette zone évite les conclusions biaisées par une sur-paramétrisation éventuelle. Notre objectif est maintenant de déterminer s’il existe de faux négatifs, et à quelles conditions, autrement dit de déterminer pour quels domaines de paramètres, s’ils existent, la technique échoue à détecter la composante non-linéaire effectivement présente dans la dynamique testée.

Pour cela, nous utilisons le système d’équations non-linéaires tridimensionnel décrit en 1976 par Otto E. Rössler [21] : dont les solutions dépendent des paramètres a, b et c [22]. Nous choisissons pour cette étude a = 0,398, b = 2 et c = 4, pour lesquels la solution est un attracteur chaotique (Fig. 2.3). La dynamique chaotique associée est donc déterministe, et fortement non-linéaire.

-6

Figure2.3 – Représentation de l’attracteur chaotique solution du système de Rössler (2.13), pour les paramètres(a, b, c) = (0,398,2,4).

Notre but est de vérifier l’efficacité de la détection de non-linéarité lorsqu’elle est appliquée au système de Rössler. Puisqu’il est connu que de nombreuses techniques, appliquées à une dynamique particulière, offrent des résultats qui dépendent du choix de l’observable utilisée, c’est-à-dire de la variable mesurée ou choisie pour suivre l’évolution temporelle du système [23, 24, 25], nous allons mener l’étude indépendamment sur les trois variables du système de Rössler, afin de vérifier si la détection de non-linéarité dépend ou non de la variable choisie. Pour cela, nous avons donc appliqué la détection de non-linéarité indépendamment sur les trois variables du système de Rössler, en faisant varier les paramètres de modélisation (d,M) de la même façon que précédemment. Les valeurs du degrédde non-linéarité sont prises entre 2 et 10 et varient par pas de 1, tandis que les valeurs du nombreM de termes du modèle s’étendent de 10 à 200 par pas de 10. Les résultats sont reportés Figs. 2.4, respectivement (a), (b) et (c) pour les variablesx,y etz.

Nous observons, pour chacune des trois variables, qu’il existe des valeurs de paramètres de modélisation pour lesquels le meilleur modèle non-linéaire ne donne pas de meilleures prédictions à un pas en avant que le meilleur modèle linéaire. Dans les trois cas, ceci se produit pour de faibles valeurs du degrédde non-linéarité et du nombreM de termes du modèle. Ainsi, lorsquedet/ouM est trop petit, le modèle non-linéaire n’est pas capable de reproduire fidèlement la dynamique sous-jacente au système de Rössler, et il n’y a alors pas plus d’intérêt à utiliser un modèle non-linéaire

20 40 60 80 100 120 140 160 180 200

Nombre de termes M

2 3 4 5 6 7 8 9 10

d

nx = 31

(a) Variablex:nx= 31

20 40 60 80 100 120 140 160 180 200

Nombre de termes M

2 3 4 5 6 7 8 9 10

d

ny = 26

(b) Variabley :ny = 26

20 40 60 80 100 120 140 160 180 200

Nombre de termes M

2 3 4 5 6 7 8 9 10

d

nz = 47

(c) Variablez: nz = 47

Figure 2.4 – Dépendance de la probabilité p à la structure des modèles (d,M) en fonction de l’observable x (a), y (b) ou z (c) du système de Rössler ((a, b, c) = (0,398,2,4)). Un carré noir représente une probabilitépinférieure au seuil de 0,99, c’est-à-dire un faux négatif. Le nombrens

de faux négatifs pour la variablesest d’autant plus faible que le coefficient d’observabilitéηs2 est grand.

plutôt qu’un modèle linéaire. C’est ainsi queppeut être inférieur à 0,99. Nous supposons que dans ce cas, les modèles non-linéaires ne sont pas suffisamment complexes pour capturer efficacement la dynamique associée au système de Rössler, et pour fournir de meilleurs résultats que les modèles linéaires : ceci correspond aux faux négatifs fournis par la technique de détection de non-linéarité.

Dans le document The DART-Europe E-theses Portal (Page 48-52)