• Aucun résultat trouvé

5.3 Traitement de la self-consistence

5.3.2 Pathologies de convergence

Les problèmes de convergence SCF sont toujours liés à l’équilibrage entre les termes de saut (partie T) et les termes électrostatiques (intégrales U et J). Pour une illustration systématique des pathologies que nous avons rencontrées, nous avons introduit un modèle topologique ad hoc qui permet de s’affranchir de la complexité du notre, gouvernée par la géométrie réelle de la configuration des noyaux (qui n’a pas vraiment d’importance en soi pour les problèmes que nous traitons ici) et le rôle de l’hybridation (qui module un peu les résultats que nous présentons là, dans le sens d’une plus grande complexité).

Le modèle utilisé dans cette section et la suivante est un modèle SCF au niveau Hartree, construit sur n sites contribuant chacun une orbitale (s) susceptible d’accommoder 2 électrons, et 1 électron de valence, traité au niveau RHF, c’est-à-dire où toutes les orbitales sont occupées 2 fois sauf une si n est impair, où si on a chargé le système. En termes de matrice densité, l’énergie est donc donnée par

E = Tr(Tρ) +1 2 X i6=j Tij 6=0 J(ρii− 1)(ρjj− 1) + 1 2 X i U(ρii− 1)2

T est la matrice des termes de saut monoélectroniques : les énergies des orbitales ato- miques sont prises à 0, et les termes hors diagonaux sont ou bien nuls, ou bien égaux à t : le choix des termes nuls et des termes non-nuls correspondrait à celui de différentes géométries dans un système réel. L’égalité de tous les termes non-nuls met l’accent sur les situations symétriques dans les systèmes réels, c’est-à-dire l’apparition de dégénérescence, en particulier de la HOMO. On prendra t = −1, c’est-à-dire que t est notre référence pour l’ordre de grandeur des différents termes de l’énergie. On sera amené ponctuellement à bruiter la matrice T pour montrer comment la levée des dégénérescences fait disparaître les problèmes de convergence. Les éléments de matrice de l’opérateur de Fock sont donnés par : Fij = Tij + δij  U 2(ρii− 1) + J X k6=i Tij 6=0 (ρkk− 1) .

U est le terme de pénalisation de charge sur site. On le prendra égal à quelques 0.1. J est l’intégrale de coulomb entre sites, on la prend nulle ou inférieure à U en général, et on ne la fait jouer qu’entre les termes liés par T, ce qui rend la situation plus simple que dans nos systèmes, pour ce qui est de l’énergétique, mais pas pour ce qui est des problèmes de convergence.

Trois quantités pilotent la convergence SCF de cet hamiltonien. La première est une base d’orbitales moléculaires V0 qui correspond aux occupées et aux virtuelles du guess

initial. La seconde est le vecteur des populations p qui sélectionne, pour chaque calcul de nouveaux vecteurs et de la matrice densité, quelles orbitales sont occupées et comment (1, 2 ou un nombre fractionnaire). Les nombres d’occupation fractionnaires sont physiques en un sens faible (si la trace de ρ reste égale au nombre d’électrons m), mais non physiques au sens fort, dans la mesure où ils correspondent à une extension de l’espace variationel, assez mal contrôlée, puisqu’elle s’interprète comme un développement multiconfigurationnel

fixe dont on néglige les termes d’interférence dans les valeurs moyennes (voir le chapitre 2), mais où on relaxe les orbitales moléculaires. La dernière quantité qui gouverne la convergence est le coefficient α de la section précédente : on le prend à 0.1 ou 0.2. Pour les problèmes que nous présentons ici, il ne joue pas un très grand rôle : dans les systèmes réels, il gouverne la vitesse de la convergence (voir le chapitre suivant) et éventuellement le point d’arrivée (il permet de passer des barrières s’il est trop grand).

On compare les méthodes de la section précédente de la façon suivante. Pendant une étape initiale, on utilise (ici, en parallèle) ou bien NR, NF ou NV. Après un certain nombre d’itérations, on branche la méthode NP. On verra que dans les cas qui posent problème, celle-ci peut les résoudre, mais pas complètement. A quelques ajustements près, cette démarche est celle que nous avons utilisée pour nos calculs. Dans la mesure où des problèmes de convergence apparaissent, nous avons assez vite abandonné l’idée d’utiliser des méthodes d’accélération, sacrifiant ainsi la vitesse à une plus grande fiabilité.

La géométrie la plus simple pour laquelle des problèmes sont susceptibles d’apparaître est la suivante : T=   0 t t t 0 t t t 0  .

Les valeurs propres de cette matrice sont ǫ1 = 2t, ǫ2 = ǫ3 =−t associées aux vecteurs ϕ1 =

1/√3(1, 1, 1), ϕ2 = 1/

2(0, 1,−1) et ϕ3 = 1/

6(2,−1, −1), normés et mutuellement orthogonaux. Si on part d’un guess Hückel formé par l’occupation des orbitales les plus basses, on a la possibilité de partir de Ψa = |ϕ21ϕ2| ou de Ψb = |ϕ21ϕ3|. On obtient les

opérateurs de Fock suivants, Fa et Fb, exprimés dans la base des ϕ :

Ψa =|ϕ21ϕ2|, Fa=   2t 0 −1/√2(U− J) 0 −t + (U − J)/6 0 −1/√2(U− J) 0 −t − (U − J)/6   Ψb =|ϕ21ϕ3|, Fb =   2t 0 1/√2(U− J) 0 −t − (U − J)/6 0 1/√2(U − J) 0 −t + (U − J)/6  .

Dans la mesure où U − J est positif, on voit que l’orbitale du niveau −t occupée dans Ψa est déstabilisée dans Fa et que l’orbitale occupée dans Ψb est déstabilisée dans Fb. On

voit aussi que ϕ2 et ϕ3 n’ont pas le même statut, au sens où ϕ2 est propre pour F dans

les deux situations.

Les résultats de calculs de convergence sont présentés dans deux cas distincts : d’une part, on travaille sur une matrice T complètement uniforme (figures 5.6, 5.7 et 5.8) ou sur cette même matrice perturbée légérement, de manière à lever la dégénérescence de ϕ2 et ϕ3 (figures 5.9, 5.10 et 5.11). Les méthodes sont identifiées par une couleur et un

100 101 102 103 104 −3 −2.99 −2.98 −2.97 −2.96

nombre d’iterations (log)

energie (t)

Fig. 5.6 – Evolution de l’énergie to- tale pour le trimère complètement symé- trique. , rouge : NV ; ◦, bleu : NF ; △, vert : NR. 100 101 102 103 104 10−8 10−6 10−4 10−2 100

nombre d’iterations (log)

convergence (log)

Fig. 5.7 – Evolution de la convergence pour le trimère complètement symé- trique. 100 101 102 103 104 10−20 10−15 10−10 10−5 100

nombre d’iterations (log)

occupations entières (log)

Fig. 5.8 – Evolution du caractère phy- sique de ρ pour le trimère complètement symétrique. 100 101 102 103 −3 −2.95 −2.9 −2.85

nombre d’iterations (log)

energie (t)

Fig. 5.9 – Evolution de l’énergie to- tale pour le trimère légèrement dissymé- trique. 100 101 102 103 10−15 10−10 10−5 100

nombre d’iterations (log)

convergence (log)

Fig. 5.10 – Evolution de la conver- gence pour le trimère légèrement dissy- métrique. 100 101 102 103 10−20 10−15 10−10 10−5 100

nombre d’iterations (log)

occupations entières (log)

Fig. 5.11 – Evolution du caractère phy- sique de la matrice densité pour le tri- mère légèrement dissymétrique.

méthode NR. Dans les deux cas, on branche sur la méthode NP au bout d’un certain nombre d’itérations. On a pris t = 1, U = 0.3, J = 0. et α = 0.1 dans cet exemple.

Dans le cas complètement symétrique, la difficulté pour la convergence est illustrée sur la figure 5.7. La valeur de la norme du commutateur [F(ρ), ρ] reste constante pour les méthodes NF et NV, jusqu’à ce qu’on branche NP (ce qu’on voit par le décrochement). Dans le cas de NR, ce test est intéressant car il montre que l’interpolation des matrices densité, si elle conserve la trace et donc le nombre d’électrons, converge dans ce cas vers une solution à nombres d’occupation fractionnaires (0.5 dans ϕ2 et 0.5 dans ϕ3) corres-

pondant à un système localement neutre, d’énergie −3.. Le branchement d’une méthode de perturbation reprojette instantanément la fonction d’onde sur une solution à un seul déterminant, d’où le saut, dans l’énergie (figure 5.6), à une valeur supérieure (car l’énergie −3. n’est pas accessible dans l’espace des fonctions d’onde à un seul déterminant). On définit le caractère physique de ρ comme la somme des valeurs absolues des différences entre ses valeurs propres et leurs parties entières

X

r∈Sp(ρ)

|r − E(r)|.

Ce critère est illustré sur la figure 5.8, sur laquelle on a tracé la somme des différences entre les nombres d’occupation (les valeurs propres de la matrice densité) et leur partie entière : dans le cas de la méthode NR, cette quantité converge vers 0.5 + 0.5 = 1. On voit aussi que cette solution à nombre d’occupations fractionnaires n’est pas adaptée au critère de stationnarité (au sens HF) de la fonction d’onde : le commutateur sature à environ 0.01 en norme (figure 5.7). Enfin, le branchement de la méthode NP, on le voit, permet de résoudre ces problèmes en suivant l’une exclusivement des deux racines possibles, et les trois méthodes convergent finalement vers la même énergie (−2.9765 dans cet exemple).

On voit que la levée de la dégénerescence, sur les figures 5.9, 5.10 et 5.11, lève les pa- thologies de convergence, en tout cas pour les méthodes NF et NR, dont le comportement est ici similaire. Dans le cas de la méthode NV, des problèmes subsistent, et le contenu orbitalaire de la solution, obtenue à partir du même guess que les deux autres méthodes, est suffisamment différent pour que la partie finale de la convergence débouche sur une énergie différente : ces problèmes, ainsi que l’augmentation de l’énergie, qui peut paraître curieuse, sont liés au fait que pour NV, la convergence résulte de deux étapes, le mélange avec les orbitales couplées par F, et l’orthonormalisation des vecteurs obtenus, selon une procédure non-symétrique, donc relativement imprévisible vis-à-vis de critères variation- nels. Enfin, si les nombres d’itérations nécessaires pour converger peuvent paraître assez grands, il faut rappeler que d’une part, on n’utilise ici aucune méthode d’accélération, et que d’autre part, la levée de la dégénérescence est réalisée à quelques 0.01 près seulement. L’augmentation de U du même ordre de grandeur suffit à restaurer les difficultés : les problèmes de convergence que nous évoquons ici ne sont pas dus aux dégénérescences exactes, mais bien à des quasi-dégénérescences qui doivent être mesurées en termes de l’intensité de (U − J).

Il faut remarquer que la méthode NP ne suffit pas forcément à résoudre les problèmes. Sur les figures 5.12, 5.13 et 5.14, on présente les calculs réalisés sur le pentamère cyclique

complètement symétrique, soit pour T=       0 t t 0 0 t 0 0 t 0 t 0 0 0 t 0 t 0 0 t 0 0 t t 0       100 101 102 103 104 −5.855 −5.85 −5.845 −5.84 −5.835 −5.83 −5.825

nombre d’iterations (log)

energie (t)

Fig.5.12 – Evolution de l’énergie totale pour le pentamère cyclique. , rouge : NV ; ◦, bleu : NF ; △, vert : NR. 100 101 102 103 104 10−6 10−4 10−2 100

nombre d’iterations (log)

convergence (log)

Fig.5.13 – Evolution de la convergence pour le pentamère cyclique.

100 101 102 103 104 10−20 10−15 10−10 10−5 100

nombre d’iterations (log)

occupations entières (log)

Fig. 5.14 – Evolution du caractère phy- sique de ρ pour le pentamère cyclique.

Fig.5.15 – Géométrie du système.

Le comportement est très similaire à celui observé sur les figures 5.6, 5.7 et 5.8. Cepen- dant, on voit sur la figure 5.13 que la méthode de perturbation ne suffit pas à converger le système à mieux que 10−6 pour la norme du commutateur. Il nous est arrivé parfois

d’observer ce phénomène sur les systèmes que nous avons calculé. Une solution simple, dans la mesure où la convergence est presque réalisée, est d’être un peu moins exigeant sur le degré de convergence du système : encore faudra-t-il que la valeur de la norme du commutateur pour laquelle ce problème intervient soit suffisamment petite.

Enfin, nous voulons finir cette présentation par la présentation d’un cas où les choses se passent bien : les problèmes que nous discutons ne sont pas systématiques, mais se posent assez fréquemment dans certaines situations. Nous l’avons illustré en les reproduisant, dans des cadres méthodologiques similaires mais bien distincts, à travers deux implémen- tations différentes (dans deux languages et environnements différents) de méthodes qui, à notre sens, sont moins faciles à utiliser, dans certains cas, qu’on ne le voudrait. Cependant, un système comme celui présenté sur les figures 5.19, 5.16, 5.17, et 5.18 ne pose aucune des difficultés que nous avons mentionné. Dans les agrégats de carbone, cette situation correspond aux géométries assez éloignées à la fois des points symétriques de la surface de potentiel sur laquelle on travaille, et des points de rapprochement ou de croisement de celle-ci avec d’autres. Si l’on compare cette situation avec les précédentes, il faut au moins remarquer que la méthode la plus efficace n’est pas forcément la même selon les situations. 100 101 102 103 −6.6275 −6.627 −6.6265 −6.626 −6.6255 −6.625 −6.6245 −6.624

nombre d’iterations (log)

energie (t)

Fig.5.16 – Evolution de l’énergie totale pour un système non pathologique. , rouge : NV ; ◦, bleu : NF ; △, vert : NR.

100 101 102 103

10−15

10−10

10−5

100

nombre d’iterations (log)

convergence (log)

Fig.5.17 – Evolution de la convergence pour un système non pathologique.

100 101 102 103 10−20 10−15 10−10 10−5 100

nombre d’iterations (log)

occupations entières (log)

Fig. 5.18 – Evolution du caractère phy- sique de ρ pour un système non patho- logique.