ACCELERATION DE LA CONVERGENCE.
A)INTRODUCTION.
Soit l une constante réelle que l'on se propose d'évaluer à l'aide d'un algorithme adéquat.
On enclenche le processus qui au bout d'un certain temps nous fournit une première série d'approximations de l, soit : x1 ; x2 ; ...; xn
A ce stade des opérations il peut apparaître que la poursuite des calculs ne soit pas rentable et ceci pour diverses raisons :
Des causes mathématiques.
La structure de l'algorithme peut conduire à une convergence dite 'lente'.
C'est le cas par exemple lorsque l'écart xn l est équivalent au voisinage de + à un multiple de
n
1 ou pire à un multiple de ln(1n) .
Cette notion de lenteur est relative et se définit ici par comparaison au schéma géométrique classique.
On préférera en effet une majoration du type xn l K(q)n avec 0 q 1 à une convergence dictée par
n l K
xn avec 0 , car au voisinage de : ( )n ( 1a) o n
q et par suite le coût pour approcher l à près sera donc moins élevé.
Des causes liées à la machine utilisée.
Les erreurs d'arrondis peuvent conduire si la structure de l'Algorithme est trop instable, à des débordements notoires par rapport au comportement théorique prévu, et même amener à des divergences grossières.
Cette notion de stabilité est aussi délicate à définir proprement. Un schéma directif assez large consiste à faire des hypothèses simplifiées sur la propagation de l'erreur afin d'en déduire un modèle statistique que l'on teste ensuite sur des exemples.
Pour faire face aux faiblesses signalées on dispose alors essentiellement de deux stratégies fondamentales.
Modifier l'algorithme initial pour le rendre plus performant.
Combiner astucieusement les approximations déjà évaluées pour former )
,....,
( 1 n
n x x
y
approchant mieux l que xn.
Par exemple pour un procédé d'itérations successives à l'aide d'une fonction f on pourra chercher à remplacer f par g dont le contact avec la constante 'l ' est meilleur que celui de f ou bien après avoir obtenu un développement asymptotique de xn, on essaiera par un
barycentrage bien choisi d’éliminer les termes dont la convergence est la plus lente.
De premier abord ces deux techniques diffèrent.
La première est de type global, on agit sur le procédé, le cœur même de l'Algorithme.
C'est une refonte totale.
La deuxième est de type discret, on agit sur les fruits successifs de l'Algorithme.
C'est un affinage par retouches, sans changer le moule essentiel.
Le lecteur un peu averti ne sera pourtant pas surpris de découvrir que dans un bon nombre de cas les deux stratégies se rejoignent, venant ainsi renforcer le caractère universel de la
recherche Algorithmique.
Ainsi pour le cas des images répétées par une fonction f on sait que les valeurs des dérivées successives de f en l conditionnent le développement asymptotique de xn. f n(x0)
Dans ce qui suit nous nous proposons de développer ces idées à travers une approche progressive du mode d'accélération le plus classique : la méthode d'Aitken - Romberg.
B) LA METHODE D'AITKEN-ROMBERG.
L'Algorithme analysé est supposé fournir une suite de termes n xn convergent vers l et supposés tous distincts de l.
1 On suppose ici que le procédé est du type itératif : n N xn1 f(xn) , avec f satisfaisant aux hypothèses du schéma classique du point fixe. (Contractante sur un intervalle stable pour f ).
On sait alors que plus f est ' plate' au voisinage de l, plus rapide sera la convergence vers le point fixe l de f.
D'où l'idée, si k f(l) est non nul et connu , de remplacer f par g construite à partir de f et satisfaisant à g(l) l et g(l) 0.
La manière la plus simple est de chercher g dans le faisceau engendré par f et l'identité, c'est-à-dire du type : x g(x) Af(x)Bx
Si k 1 on obtient bien une solution définie par la formule :
k kx x x f
g
1
) ) (
(
Si k est connu donc et si la fonction f a fourni les images x1,....,xn1, la suite de terme général
k kx x x
g
yn n n n
) 1
( 1 va converger vers l plus rapidement que xn.
En effet :
k
l x
l x f k l
x l y
n n n
n ( )
1
1 et fxx l l f l k
n n
n
( ) ()
lim On a donc bien lim 0
l x
l y
n n
n , et donc ynlo(xnl)
On verra en annexe quelques exercices illustrant cette méthode élémentaire ne s'appliquant, insistons, que si la valeur de k f(l) est connue sans référence à l .
2 On suppose ici que l'Algorithme utilisé fait apparaître un développement asymptotique du type : xnla(q)no(qn) , avec a constante réelle non nulle et q 1
Par décalage, au rang n+1 il vient alors : xn1l a(q)n1o(qn) Puis par combinaison linéaire : 1 (1 ) ( )
n n
n qx q l o q
x
Ici encore donc, et si q est connu distinct de 1, la suite de terme général yn xn11qqxn va converger vers l plus rapidement que xn puisque yn lo(qn) et que xnl a(q)n
Cet équilibrage s'adapte bien aux suites du type n n
n q
f q A
x f( ( ) ) (0)
avec les
conditions suivantes : f deux fois dérivable en 0 ; f (0) 0; A 0 et q 1
En effet partant du développement d'ordre 2 : (0) ( ²)
2 ) ² 0 ( ) 0 ( )
(x 0 f xf x f o x
f , on
obtient aussitôt: n N : (0)( ) ( )
2 ) ² 0
( n n
n A f q o q
f A
x
D'où la convergence rapide de yn xn11qqxn vers Af(0)
(Comme exemple d'application on pourra voir le problème sur la formule de Viète .) 3 Plus généralement xn désigne simplement une suite convergente vers l, sans autre
indication que n N xn l.
On cherche alors à améliorer la convergence par un équilibrage du type :
n n
n Ax A x
y 1(1 ) , A désignant ici une constante non nulle choisie arbitrairement.
n N :
l x
l A x
A l
x l y
n n n
n ( ) (1 ) 1
On voit alors clairement que yn l ne peut être négligeable devant xnl au voisinage de + que si le rapport
l x
l x
n n
1
converge vers un réel k 1 et que si on prend A k
1
1
Le terme yn est alors donné par :
k kx yn xn n
1
1
Dans ces trois études dont le cadre s'élargit à chaque étape, la même formule apparaît, mais le regard porté sur la constante k s'est modifié. Au début c'est une simple constante dépendant de l'Algorithme donné, le nombre dérivé f(l). Puis son interprétation comme constante
asymptotique se dessine, k semble plus lié à la suite des approximations qu'à la méthode de création de celles-ci. La nuance est bien sûr faible, l'Algorithme conditionne toujours ce qu'il engendre, mais elle est d'importance pour ce qui va suivre:
Le nombre k s'inscrit dans la suite qui s'élabore.
Tout est maintenant en place pour franchir le principal écueil rencontré ci dessus : que faire lorsque la valeur de k nous est inconnue ?
La réponse repose dans le constat précédent: puisque k prend corps à travers la construction de la suite des valeurs approchées de l, on peut essayer d'utiliser les valeurs fournies par l'Algorithme pour approcher cette inconnue fondamentale. Entrons dans le détail.
Dans le premier cas des images successives par f, remarquons que si f est supposée de classe C1 au voisinage de l ou plus simplement si f est supposée continue en l, on aura en vertu du théorème des accroissements finis : f l k
x x
x f x f
n n
n n
n
( ) ( ) ( )
lim
1 1
On pourra donc approcher k par les rapports
1 1
n n
n n
n x x
x
k x convergent vers k en l'infini.
Si on pose
n n n n
n k
x k z x
1
1 on aura encore convergence de zn vers le point fixe l.
La condition k 1 assure en effet que les kn seront distincts de 1 pour n assez grand.
De plus la relation
n n
n n n
n k
l x
l x k l
x l
z 1
1
1 assure une convergence plus rapide que
celle de xn puisque n n
n n n n
n
n f l k k
l x
l f x f l
x l x
( ) ( ) ( ) lim
lim lim 1
On aura donc bien lim 0 l x
l z
n n
n puisque l'on est toujours sous l'hypothèse k 1
Dans le cadre de l'évaluation asymptotique de xn, soit : xnla(q)n o(qn) Remarquons que le quotient
1 1
n n
n n
n x x
x
k x s'écrit alors :
) ( )
1 (
) ( )
1 (
1
1
n n nn
n a q q o q
q o q q k a
On aura donc encore ici : kn q
n
lim 1. (Les kn sont donc distincts de 1 pour n assez grand).
De plus :
) (
)
( 1
1 1
n n
n n
n n
q o aq
q o aq l x
l x
q en + , ce qui montre qu'ici aussi la suite définie par la formule
n n n n
n k
x k z x
1
1 converge vers l plus vite que xn.
Enfin dans le cadre plus général d'une suite quelconque convergent vers l, nous utiliserons le résultat classique suivant obtenu dans la théorie des séries numériques et démontré plus loin en annexe:
l k x
l k x
x k x
x x
n n n n
n n n
n
1 1
1 avec 1 ,alors: lim lim
Si
Ce théorème assure que si on pose
n n n n
n k
x k z x
1
1 on aura encore: lim 0 l x
l z
n n n
Il suffit de reprendre le schéma :
n n
n n n
n k
l x
l x k l
x l
z 1
1 1
La Formule d'Aitken.
C'est l'explicitation de la suite auxiliaire accélérée
n n n n
n k
x k z x
1
1 , émergent dans les trois études précédentes, lorsqu'on remplace kn par son expression
1 1
n n
n n
n x x
x
k x .
Après simplifications il vient simplement :
n n
n
n n n
n x x x
x x z x
2
²
1 1
1 1
(
Aitken)
Expression à l'aide de l'opérateur des différences premières.
Rappelons la définition de l'opérateur agissant sur le R espace S des suites de réels:
u S , v(u) est la suite de terme général vn (u)n un1un
La composée ² transforme u en w telle que w ²(u) (u) (v) On en déduit que pour tout entier n: wn (v)n vn1vn un22un1un
Remarquons alors que zn peut s'exprimer aussi comme :
n n
n
n n n
n x x x
x x x
z 2
) (
1 1
2 1
1
D'où, en utilisant , la formule :
1 2 1
1 ( ² )
] ) [(
n n n
n x
x x z
Interprétation géométrique.
Dans le plan affine Euclidien muni du repère orthonormé (O ; i, j ) considérons la suite de points de coordonnées :
n n n
x A x
1Rappelons que les termes xn sont supposés distincts deux à deux! La droite )
( 1
n n
n A A
D admet alors comme équation cartésienne
1 1 1) avec
(
n n
n n n
n x x
x m x
x X m x Y
Remarquons que m n'est autre que le coefficient kn supposé toujours différent de 1.
L'intersection de cette droite avec la première bissectrice des axes d'équation Y X
est donc le point In d'abscisse : n
n n n n n
n n n n n
n z
k x k x k
x k x m mx
X x
1 1
1
1 1 1
La méthode d'accélération d'Aitken s'interprète donc géométriquement comme un procédé d'interpolation linéaire.
On retrouve cet éclairage dans la méthode dite de Steffensen (appelée aussi Aitken- diagonal) que l'on trouvera exposée un peu plus loin.
Théorème.
Toute suite de réels telle que xx xx kn n
n n
n
1
lim 1 avec k 1 converge vers un réel l et on a alors: xx ll k
n n
n
lim 1
La convergence est obtenue facilement avec le critère de Dallambert appliquée à la série de terme général un xn1xn.
Celui-ci, puisque uu k
n n
n
lim 1 avec k 1, assure la convergence absolue, donc la
convergence des sommes partielles 1 0
0 1
0
)
(x x x x
u
S k n n
k k k
n k
k k
n
Pour la formule donnant la limite des quotients des écarts avec l nous distinguerons trois cas.
Si 0 k 1
Choisissons deux réels k1 et k2 encadrant k et tels que 0k1kk2 1 Posons pour faciliter la rédaction
n n
n n
n x x
x q x
1
1 2
L'hypothèse implique l'existence d'un rang n0 à partir duquel tous ces rapports qn seront éléments de l'intervalle [k1, k2].
On en déduit par multiplications que n n0 et p N* :
p p
n n
n
p q q q k
k ) . ... ( )
( 1 1 1 2
Par sommations on en déduit facilement que n n0 et p N :
p n
n
n p
p n k k
x x
x k x
k ... ( ) 1 ... ( )
1 2 2
1 1 1
1
Laissons n fixe et faisons tendre p vers l'infini.
En explicitant les limites on obtient l'encadrement :
2 1
1 1
1 1
1
k x
x x l
k n n
n
On en déduit 2
1
1 1
1 k
x l
x k x
n n
n
, puis 2
1
1 k
l x
l k x
n
n
A partir d'un certain rang n0 on est donc sûr que les quotients
l x
l x
n n
1
vont rentrer dans l'intervalle [k1, k2]. Or vu le choix arbitraire de k1 et k2 encadrant k, ces intervalles constituent un système fondamental de voisinages de k.
On peut donc conclure conformément au schéma général de définition de limite, que l'on a bien l'égalité demandée : xx ll k
n n
n
lim 1 .
Si -1 k 0
Nous reprendrons la méthode et les notations de l'étude précédente. Les modifications viennent des inversion des inégalités dans les produits puisqu'ici les quotients considérés seront négatifs.
On part en effet de k1 et k2 encadrant k et tels que 1k1kk2 0 A partir d'un certain rang n0 on a encore 2 0
1 1 2
1
k
x x
x q x
k
n n
n n n
Lorsqu'on passe aux produits consécutifs et vu la balance des encadrements on aura donc:
_ Si p impair : p
n n
p n p
p n k
x x
x
k ) x ( )
( 2
1 1
1
_ Si p est pair : p
n n
p n p
p n k
x x
x
k ) x ( )
( 1
1 1
2
Par sommations il vient alors si n n0 et si p impair :
p p
n n
n p p n
p k k k k k
x x
x k x
k k
k
k ( )² ( ) .... ( ) ( ) 1 ( )² ( ) .... ( ) ( )
1 2 1 2 3 1 1 2
1 1 1
1 2 3
1 2
1
En fixant n et en faisant tendre p vers l'infini on en déduit l'encadrement aux limites:
)² ( 1
) ( )² ( 1 1 )²
( 1
) ( )² ( 1 1
1 2 1 2
2 1
2 2 2 1
1
k k k
k x
x x l k
k k
k
n n
n
Remarquons alors que les deux expressions encadrant
n n
n
x x
x l
1
ci dessus ont pour limite le même quotient
k 1
1 lorsque le couple (k1, k2) tend vers (k, k).
En effet
k k
k k k k
k k k
1 1
² 1
²
² 1
² 1
²
² 1 1
On pourra donc, vu l'encadrement en question, faire rentrer à partir d'un certain rang les quotients
n n
n
x x
x l
1 dans tout voisinage imposé de
k 1
1
Ceci se traduit simplement
k x
x x l
n n
n
n
1
lim 1
1
, dont on déduit facilement d'après les règles opératoires classiques : k
l x
l x
n n
n
lim 1
Si k=0
La stratégie diffère légèrement. Soit 0 donné et n0 un rang à partir duquel qn On a alors n n0 et p N p
n n
p n p n
x x
x
x
1 1
En sommant à partir de p =1 on en déduit : p
n n
n p n
x x
x
x
...
1 1 1
Supposons alors 1. En faisant tendre p vers l'infini il vient :
1 1
1 n n
n
x x
x l
Ceci pour tout n supérieur ou égal à n0.
Le réel étant choisi arbitrairement tel que 0 1, on peut donc écrire conformément au schéma classique de définition des limites, que
0
lim
1 1
n n
n
n x x
x l
On en déduit en passant à l'inverse que
1
lim
1 l
x l x
n n n
La translation par 1 suivie d'une dernière inversion donne enfin k l
x l x
n n
n
0
lim 1
Méthode de Steffensen.
C'est le schéma des itérations successives accéléré par le procédé d'Aitken.
On considère une fonction f contractante sur l'intervalle stable I, de point fixe l sur I.
Partant de x élément de I on commence par évaluer les images f(x) et f2(x) f f(x)
On arrête alors l'itération et on équilibre nos trois premières valeurs suivant la formule d'Aitken, ce qui nous donne :
) ( 2 )
(
)]² ( [ ) ( .
2 2
x f x x f
x f x f y x
.
Ceci bien sûr sous réserve d'un dénominateur non nul.
On redémarre les itérations à partir de y et on accélère comme précédemment et ainsi de suite tant que possible. L'algorithme peut donc se schématiser ainsi :
y x f
x f x
) (
) (
2
) ( ) (
2 y f z
y f y
) ( ) (
2 z f u
z f z
………..
D'où l'autre appellation de procédé diagonal d'Aitken.
On sait que la traduction géométrique est une simple interpolation linéaire.
Le réel y , si défini, est l'abscisse du point d'intersection de la corde joignant les points de la courbe de f d'abscisses respectives x et f(x) avec la première bissectrice des axes.
On pourra voir dans le problème intitulé 'méthode de Steffensen' que si f est décroissante et strictement convexe sur I, ce procédé diagonal peut se poursuivre à l'infini et converge toujours assez rapidement vers le point fixe l de f.
Pour étudier cette rapidité remarquons que l'on a encore un procédé d'images successives, la fonction initiale f étant ici remplacée par g définie par la formule :
) ( 2 )
²(
] ) ( [ )
( 2 )
(
)]
( [ ) ( ) .
(
2 2
2 2
x f x x f
x x x f
x f x x f
x f x f x x g
x
Or, on peut montrer facilement que si f est de classe C1sur I, la condition k f(l)1 suffit pour affirmer que g sera bien définie sur un voisinage de l privé de ce point.
En effet la dérivée de xd(x) f²(x)x2f(x), soit d(x) f(x)f(f(x))12f(x) prend au point l la valeur d(l) (k1)²0.
On en déduit qu'au voisinage de l : d(x)d(l) d(x) (k 1)²(xl) Ainsi il existe un réel 0 tel que : 0 xl d(x)0
Or sur cette zone on peut écrire :
) ( ) ( )
1 ( )
( 2
l d x d
l x l
x x x f l
x l x g
En passant à la limite on obtient alors facilement lim ( ) 0
x l
l x g
l x
La fonction g admet donc un prolongement continu et dérivable en l défini par g(l)=l
Le point l fixe pour g est donc remarquablement attractif vu que g(l) 0, ce qui justifie la rapidité de l'algorithme diagonal.
Variante d'Aitken dans un schéma de point fixe.
Les exemples suivants correspondent à un schéma récurrent classique xn1 f(xn) avec f contractante admettant l comme point fixe attractif ( f(l) 1) sur un intervalle I.
Cependant dans les situations examinées on peut expliciter facilement une fonction x (x) telle que lim (xn) k f (l)
n
.
La suite auxiliaire
) ( 1
)
1 (
n n n n
n x
x x y x
n
définie sûrement à partir d'un certain rang car le dénominateur à une limite non nulle en l'infini, converge alors encore vers l, et ceci plus rapidement que la suite initiale n xn.
En effet :
( )
) ( 1
1
n n
n n n
n x
l x
l x x
l l x
y et lim 1 ( ) limn ( n)
n n
n f l x
l x
l
x
On a donc bien au voisinage de l'infini : ynl o(xnl)
A)
x0 1 et n xn1 cos(xn)4. Montrer que I=[0, 1] est stable pour la fonction cosinus.
5. Montrer que la fonction cosinus admet un seul point fixe sur I, noté l.
6. Montrer que pour tout entier n : )
sin( 2 2 )
sin(
1 2
l x l l x
xn n n
7. Montrer que pour tout entier n : xn1l sin(1)xn l . Conclure la convergence de xn. 8. On pose alors pour tout n entier :
² 1 1
)
² 1
1 (
n n n n
n x
x x y x
Montrer que yn converge encore vers l plus rapidement que la suite xn.
B)
x0 1 et n xn1 ln(xn)21 Montrer que l'équation x ln(x)2 admet une et une seule solution notée l sur l'intervalle I=[3, 4]
2 Montrer que la suite n xn est croissante et que n 1 : 2 xn l
3 Montrer que n N
1 2
l l x
xn n . Conclure la convergence de xn.
4 On pose alors pour tout entier n :
1 ) 1
( 1
n n n
n x
x y x
Montrer que yn converge encore vers l plus rapidement que la suite xn.
C)
x0 1 et n xn1 exn2 Montrer que pour tout n 3 : 0.5 xn 0.65
3 Montrer que n 3 : xn l xnl 10
7
1 . Conclure la convergence de xn. 4 On pose alors pour tout entier n :
n n n
n x
x y x
1
1 ²
Montrer que yn converge encore vers l plus rapidement que la suite xn.
D)
0 1 et 1 12n n
n x
x x n x
1 Montrer que pour tout entier n :
2 1
2 1
avec 2
2 2
2
1 1
q
x q x x
x
n n n
n
Conclure la convergence de xn vers 2
2 On pose alors pour tout entier n : [ 1 ]
2
1 1
1
n n n
n
n x
x x x
y
Montrer que yn converge encore vers 2 plus rapidement que la suite xn.
Dans les schémas précédents, l'accélération s'effectue donc simplement à partir de deux termes successifs de la suite, xn et xn1 tandis que la méthode générale d'Aitken fait appel aux trois termes consécutifs xn1 ; xn ; xn1
Exemples d'accélération utilisant un développement à l'infini.
On considère ici la suite définie par : n N xn 2n(2n 21)
1 Montrer qu'au voisinage de l'infini : )
4 ( 1 )
4 ( 6
)) 2 (ln(
) 2 ( 2
)) 2 ) (ln(
2 ln(
3 2
n n
n n o
x
En déduire la convergence de xn.
2 On pose alors pour tout entier n : yn 2xn1xn
Montrer qu'au voisinage de + : yn - ln(2) n ) 4 ( 12
)) 2 (ln( 3
Conclure que la convergence de yn vers ln(2) est plus rapide que celle de xn.
On considère ici la suite définie par n N* : ) sin(2
2n n
xn