EXPOSÉ ET MISE AU POINT BIBLIOGRAPHIQUE
CAUSALITÉ
ET RELATIONS DE KRAMERS-KRONIG(1)
Par N. G. VAN
KAMPEN,
Institut de
Physique théorique
de l’Université d’Utrecht.traduit par
FRANÇOIS LURÇAT
Institut de
Physique
de la Faculté des Sciences de Lille.Résumé. 2014 A l’aide
d’exemples empruntés
à diverses branches de laphysique (élasticité,
théoriedes
oscillations, optique, etc.)
l’auteur montre que les relations deKramers-Kronig (relations
entreles
parties
réelle etimaginaire
de l’indice de réfraction, ou d’unegrandeur analogue)
sont uneconséquence
duprincipe
decausalité,
selonlequel
l’effet nepeut
seproduire
avant la cause. Ilmontre ensuite comment ce
principe peut
êtreappliqué
à lamicrophysique
et donne des relationsentre les
parties
réelle etimaginaire
des éléments de la matrice S. Il discute la diffusion d’unchamp électromagnétique classique
et celle departicules
deSchrôdinger, puis
ilindique
comment cesrésultats
peuvent
être étendus au cas de la diffusion dechamps quantifiés.
Abstract 2014
Taking examples
in various fields ofphysics (elasticity, theory
ofoscillations, optics,...)
the author shows that theKramers-Kronig
relations between real andimaginary
parts of the index of refraction(or analogous quantity)
are a consequence of theprinciple of causality,
i.e. the
principle
that the effect cannot takeplace
before the cause. He then shows how thisprin- ciple
can beapplied
tomicroscopic physics, giving
relations between the real andimaginary
parts of the élements of the S matrix. Thescattering
of(classical) electromagnetic
field and ofSchrôdinger particles
are discussed, and theprinciple
ofgeneralization
to thescattering
of quan- tum fields isgiven.
PHYSIQUE 22, 1961,
1
1. Introduction. -
Quand
la lumière se propage dans unmilieu,
il y adispersion :
l’indice de réfrac- tion n varie avec lafréquence
w de la lumière. Une formulequi exprime n
en fonction de ws’appelle
uneformule
dedispersion.
En 1872 Sellmeier[1] écrivit
laformule de
dispersion suivante,
àpartir
del’hypo-
thèse que l’influence du milieu
peut
être attribuée à différentes sortes departicules élastiquement
liées :Les cor sont les
fréquences
propres desparticules qui
entrent en résonance. Au
voisinage
desfréquences
derésonance,
cette formule dedispersion
n’estplus
unebonne approximation. Chaque
constante ar estégale
au coefficient
d’absorption
totale dans la raie de réso-nance
correspondante.
Pour les rayonsX,
les réso-nances sont
trop
serrées pourqu’on puisse
les consi- dérerséparément ;
c’estpourquoi
vers 1927 Kramers etKronig [2] proposèrent
presque simultanément deremplacer
la formulede,
Sellmeier par :L’indice de réfraction est .donc déterminé dès que la fonction
a( 6)"),
c’est-à-direl’absorption
enfonction
dela
fréquence,
est connue. Pour quel’intégrale
dans(1) (1)
Article paru dans NederlandsTidschrift
voor Natuur-kunde,1958,
24, 1-14 et 29-42.ait un sens, on convient de
prendre
pour lasingul a-
rité 00 la valeur
principale (2).
Plus tard il
apparut
que la relation de Kramers etKronig (1)
est vraie dans des conditionsbeaucoup plus générales
que cequi précède
ne le laisse supposer. Elle est entièrementindépendante
de tout modèleparti-
culier pour l’interaction de la lumière avec le
milieu,
etpeut
s’obtenir d’unpoint
de vuegénéral
de lafaçon
suivante.
Supposons qu’un
court train d’ondes lumi-neuses tombe sur un milieu. Pour étudier la propa-
gation
à l’intérieur de cemilieu,
on doit sereprésenter
le train d’ondes comme formé d’ondes monochro-
matiques (composantes
deFourier) ; chaque
ondemonochromatique individuelle,
defréquence
cù, se pro-page avec sa propre vitesse
c/n( (0),
et subit un certainaffaiblissement,
caractérisé par un coefficientd’absorp-
tion
a(cù).
Ceci modifiera notablement la forme du traind’ondes ;
engénéral
il s’étaleraquelque
peu. Lesdétails de cette déformation
dépendent
de la formeprécise
des fonctionsn(cù)
eta(w) (donc
de la structuresdu milieu en
question),
mais il y a une condition àlaquelle
ils doivent nécessairement satisfaire : lefront
ne
peut
sedéplacer
avec une vitessesupérieure
à c. Onpeut
alors montrer defaçon purement mathématique qu’il
est nécessaire et suffisant que la relation(1)
soit-(2)
C’est-à-dire que l’on enlève d’abord du domained’intégration
un intervalle( w -
c, o +E) symétrique
parrapport
à w, etqu’après intégration
on passe à la limite c - 0.Article published online by EDP Sciences and available at http://dx.doi.org/10.1051/jphysrad:01961002203017900
180
vérifiée,
pour que cette « condition de causalité » soit satisfaite.Une condition de causalité
analogue
existe pour toutes sortes desystèmes physiques.
Une formationgénérale
et peuprécise
est :l’effet
nepeut
seproduire
avant la cause. Pour
chaque application,
cette formu-lation doit naturellement être
précisée.
Ces dernièresannées,
cesconditions,
et les relations de Kramers-Kronig qui
s’endéduisent,
se sontavérées
utiles dans des domaines très différents maissurtout
pourl’analyse
de l’interaction entre les nucléons et les mésons 7r
(3).
Comme dans ce dernier cas on
peut
àpeine
recon-naître les idées
parmi
les calculscompliqués, je
mon-trerai ici sur des
exemples simples
comment onparvient
aux relations de Kramers et
Kronig.
Auparagraphe 2,
à l’aide d’un
exemple
tiré de la théorie del’élasticité,
on montrera le lienmathématique
entre la causalité et relations de Kramers etKronig.
Auparagraphe
3 onénumèrera un certain nombre
d’applications
etd’extensions à d’autres domaines. Le
paragraphe
4 estconsacré à la
propagation
de la lumière dans unmilieu,
berceau des relations de Kramers et
Kronig.
Lesrésul-
tats seront utilisés au
paragraphe
5 pour obtenirdes renseignements
sur la diffusion de la lumière par les centres diffuseurs individuels du milieu diffusant. Auparagraphe
6 on étudiera cette diffusion individuelle à l’aided’une
autreméthode, qui
auparagraphe
7 seraappliquée
à la diffusion desparticules
par les noyaux.Au
paragraphe
8 onétudiera,
defaçon quelque
peusommaire,
la formulation de la condition de causalitéen théorie des
champs,
et sonapplication
à laphysique
des mésons.
2.
Exemple
tiré de la théorie de l’élasticité. -Supposons qu’un barreau,
sousl’action
d’une forceappliquée X(t),
subisse unallongement x(t). Supposons
en c’est-à-dire mais outre
qu’il
que sex(t) produise dépende
une nonhystérésis’
seulementélastique, de (t)
encore de « l’histoire antérieure » donc des valeurs
X(t’)
de la force aux instants antérieurs(t’ t).
Dansle cas de
petits allongements,
cette relation est encorelinéaire,
en sortequ’elle
est de la forme[3]
On a naturellement
C’est dans ce cas
particulier
la condition de causalité.La forme
triviale
queprend
ici la condition de causa-lité est
due,
non pas tant à lasimplicité
del’exemple choisi,
mais au fait que la causeX(t)
et l’effetx(t)
sontexprimés
en fonction dutemps.
Engénéral cependant
il sera
préférable
de décrire lesphénomènes
à l’aidedes
fréquences,
car la relation entre x et X seraplus simple.
C’est-à-dire
qu’au
lieu deG(t), X (t ), x(t)
on intro-(3)
Dans ce domaine onparle
habituellement de «rela-
tion de
dispersion
», cequi
crée souvent une confusionavec la notion définie ci-dessus de « formule de
disper-
sion)).
Ici j’utilise toujours
les mots « relations de Kramers- etKronig ».
duira leurs transformées de Fourier
6’(co), X(w), x (cù)
définies par
exemple
par :On obtient alors au lieu de l’ «
équation
de mouve-ment» (2)
-..La fonction
complexe G(w)
décrit lespropriétés élastiques
de latige,
de la manière suivante : si onapplique
à latige
une forcepériodique
defréquence
co,il s’établit une
oscillation,
dontl’amplitude
est donnéepar 1 G ( (ù) et
la différence dephase
parrapport
à laforce,
parl’argument
de6(û)).
Le travailproduit
parFm. 1. -
Tige viscoélastique.
la force dans l’unité de
temps
estégal
au carré del’amplitude
de laforce, multiplié
par un « coefficientd’absorption
»,I m
désigne
lapartie imaginaire.
Lapartie
réelleRe[G(w)]
n’a engénéral
pas designification directe ;
mais
lorsque l’énergie absorbée,
et parconséquent
ladifférence de
phase,
sontfaibles,
on adonc la
partie
réelle mesure l’élasticité(à
la fré-quence
w).
La
transformation de Fourier a sans doutepermis
de mettre
l’équation
de mouvement sous la formesimple (5),
mais la condition de causalité nepeut plus
s’écrire aussi
simplement
que(3).
Commentpeut-on exprimer,
à l’aide deG(w),
queG(t)
n’est pas une fonctionquelconque
’dans l’intervalle(-
oo +oo)
mais
qu’elle
doit vérifier la condition(3) ? Il y
a làune
question purement mathématique,
àlaquelle répond
le théorème 95 du livre de Titchmarsh sur lesintégrales
de Fourier[4].
Avant de formuler exac- tement cethéorème,
donnons d’abord une démons- tration sommaire :La
première étape
de la démonstration consiste àremplacer
dans(4)
la variable réelle W par un nombrecomplexe w
= u + iv. Cela est sûrementlégitime
pour v >
0,
car alorsl’intégrant
estmultiplié
par le facteur exp(- vt),
cequi
nepeut qu’améliorer
la con-vergence de
l’intégrale pour t
--> + oo.Evidemment pour t
--> - oo ce facteur serait engénéral désastreux,
mais
grâce
à(3)
il ne fera pas de tort. Onpeut
doncen
posant
étendre la définition de
G
à la moitiésupérieure
duplan complexe.
Comme(7)
convergeuniformément,
elle définit une fonction
analytique
sanssingularités (« holomorphe »).
Donc : par suite de la condition de causalité(3), G (w) possède
unprolongement holomorphe
dans la moitié
supérieur
duplan complexe.
Enoutre,
on v
peut
voir facilement que(7)
tend vers zérolorsque
-> oo.
Comme deuxième
étape
nous choisissons un chemind’intégration fermé, comprenant
l’intervalle(- R,
-f-
R)
sur l’axe réel et un demi-cercle de rayon R dans lédemi-plan complexe supérieur.
La théorie deCauchy
donne pour tout
point w
situé à l’intérieur du contour :ci on passe à la limite R -> oo, le second terme
s’annule,
et l’on obtientRéciproquement
cette formuleimplique
queG (w)
FIG. 2. - Le
plan complexe
w.’est
holomorphe
dans ledemi-plan supérieur
et nulle àl’infini.
Comme troisième
étape
nous mettrons(8)
sous uneforme utilisable
pratiquement.
Pour cela faisons tendre w = u + iv vers une valeurréelle,
c’est-à-direv --> + 0.
L’intégrant acquiert
alors unesingularité
pour w = u, et le chemin
d’intégration
doit passer en dessous de cepoint.
On obtient donc la moitié du résiduen ce
point, plus l’intégrale
sur le reste de l’axe réelqui
est une valeurprincipale.
Le résultat est :où P
signifie
que pour lasingularité
il fautprendre
la. valeur
principale.
Enséparant
lesparties
réelles etimaginaires,
on obtientCes relations ne concernent que les valeurs
prises
par. G
sur l’axeréel,
et relient parconséquent
desgrandeurs physiquement mesurables. D’après
notre
démonstration,
elles constituent des conditions néces-
saires pour qu’il
existe un prolongement holomorphe
de G(w), qui
satisfasse à(8). Réciproquement,
onpeut
montrer que chacune des relations
(9a), (9b)
est aussiune condition suffsante.
Le résultat
peut
être résumé dans le :THÉORÈME PRINCIPAL. - Les
quat’re
énoncéssuivants relatifs à une
fonction 6(co)
sont des formu-lations de la même
propriété :
(i)
La transformée de Fourier deG (ù)
vérifie(3).
(ii) 1 (m) possède
unprolongement holomorphe
dansla moitié
supérieure
duplan complexe, qui
vérifie(8).
(iii)
Lesparties
réelle etimaginaire
de1 (m)
sontliées par
(9a).
(iv)
Lesparties
réelle etimaginaire
sont liées par(9b).
La moitié
supérieure
duplan complexe
de lavariable w sera par la suite notée
I+.
La relation
(9)
estappelée
transformation de Hilbert:les fonctions
Re[’è ( c.ù)]
etIm[1 (m)]
sont chacune latransformée de Hilbert de l’autre. On
appelle
aussi(9)
formules de
Plemelj [5].
Enphysique
on les nommerelations de
Kramers-Kronig.
Ou utilise enparticulier (9a)
sous la forme :(qui
résulte de(9a)
parce queG (- w)
=G(w)).
Cetterelation
exprime
l’élasticité en fonction du coeflicientd’absorption (6).
Pour lesapplications pratiques
c’est
(10) qui
estutile,
mais enthéorie,
il vaut mieuxutiliser
(9).
Nous n’avons
jusqu’ici
- comme c’estl’usage
enphy- sique
-prêté
aucune attention auxpropriétés
mathé-matiques
que doitposséder
la fonctionG(t),
et enparti-
culier à son
comportement
pour t -> oo. Pour que le théo- rèmeprincipal
soitvalable,
il faut queG(t)
soit de carré sommable c’est-à-dire queCeci
garantit
l’existence desintégrales utilisées,
et destransformées de Fourier
[4].
L’étude desexemples
suivants(paragraphes
4, 6,7)
montrera que cette condition est souventphysiquement acceptable,
car elleexprime
le faitque
l’énergie
totale doit être finie. Dansl’exemple qui pré-
cède,cependant, l’intégrale (11)
n’a aucunesignification physique,
et la condition n’est donc pas naturelle. Elle n’est d’ailleurs pas vérifiée dans le cas leplus simple (x(t)
= cste XX(t)).
Sans doute il n’est pas difficile degénéraliser
la démonstration defaçon
à cequ’elle
com-prenne aussi ce cas là ; mais on ne
peut
pas être sûr de ne pas rencontrer de nouvellesexceptions.
La seule solution satisfaisante estd’adapter
la démonstration de tellefaçon qu’on n’impose
àG(t)
aucune autre condition que cellesqui
résultent de sasignification physique.
Mais pourl’exemple
considéré on n’a pas encore réussi à faire cela.
Une autre
propriété
de la fonctionG(w)
doit encore êtrementionnée, car elle est
indispensable
pour un traitementmathématique rigoureux.
Du fait que wG(w)
est holo-morphe
dans 1+ et queIm[eùG(eù)] >
0 sur l’axe réel(à
cause de sasignification physique
de coefficientd’absorp- tion),
il résulte queIm[w G(w)] >
0 dans tout I +.uv G(w)
appartient
donc à la classe des fonctions «quasi-bornées »
(et même à celle des fonctions «imaginaires positives »),
dont on connaît
beaucoup
depropriétés mathématiques [6].
Le fait que
l’énergie dissipée
soitpositive
résulte d’autre part de lathermodynamique,
donc de lamécanique
statis-tique.
Nous rencontrerons d’autresexemples
montrant le lien étroit de la causalité avec les considérationsstatistiques (cf. § 9).
3. Autres
applications.
- Bien quel’exemple
traitéau
paragraphe
2 soit très élémentaire il contient les traits essentiels que l’on retrouve danschaque appli-
cation de la
condition
de causalité. Onpeut
les for- muler ainsi. On donne d’abord une « cause » et un« effet », et la relation entre eux écrite sous forme
générale (cf. (2)).
La condition de causalité dit alors que cette relation doit être telle que l’effet nepeut
être influencé par lecomportement
de la cause auxtemps
ultérieurs. Tant que la cause et l’effet sont écritscomme des fonctions
de t,
la formulation de la conditionsera la
plupart
dutemps
triviale(pas
dans tous lescas
cependant) (cf. (3)).
Maislorsqu’on
passe aux trans-formées
deFourier,
c’est-à-direlorsqu’on
introduit lafréquence
comme variableindépendante,
la conditiondevient moins
simple.
Elleprend
alors la forme d’uneproposition.relative
auxpropriétés analytiques
de la«
réponse » ou «
admittance » pour desfréquences
com-plexes.
En dernièreanalyse
cetteproposition peut
êtreexprimée
comme une relation àlaquelle
doit satisfaire l’admittancepour
desfréquences
réelles. Cette relationexprime
lapartie
réelle de l’admittance comme uneintégrale portant
sur lapartie imaginaire
ou inver-sement : ce sont les relations de Kramers et
Kronig (9),
resp.
(10).
Pour choisir lesgrandeurs qui
seront consi-dérées comme cause et comme
effet,
et pour écrire la relationgénérale
entre cesgrandeurs,
il suffit de con-naître les
propriétés physique,
dusystème considéré ;
de même que pour choisir la forme de la condition de causalité dans la
représentation
en fonction dutemps.
Mais la traduction de cette condition dans la
repré-
sentation en fonction des
fréquences,
et la démons- tration des relations de Kramers etKronig
sont depures
mathématiques,
et sont à leurplace
dans untraité sur les
intégrales
de Fourier.Cette recette est
applicable
à toutsystème
linéairequi peut
être étudié à l’aide de la notion defréquence.
Un
exemple mécanique simple
est l’oscillateur amortiauquel
onapplique
la forceX(t). L’élongation x
vérifiel’équation
suivante(masse
=1, fréquence
propre cer, amortissementy) :
la
méthode habituelle
donne la solution :où
û)y = B/
-y2 -
wr. Ceci est la relation(2)
avec un
G(t) qui peut
dans ce cas être donnéexplici-
, tement. On en déduit
(1) :
(1)
Onpeut
aussi trouver ce résultatplus
directementen
prenant
dans(12)
une forcepériodique X(t) =
A cos mtet en cherchant la solution stationnaire
correspondante.
L’existençe de cette méthode
plus
directe est une desraisons pour
lesquelles
lelangage
desfréquences
est siIl est manifeste que
G (w)
estholomorphe
dans ledemi-plan supérieur,
et tend vers 0 à l’infini. Onpeut
aussi vérifier que les relations
(9)
sont satisfaites. Deplus G (w)
a deuxpôles
en dessous de l’axeréel,
auxpoints +
cor -iy.
Cespôles expriment
l’existence d’une résonance defréquence
wr et delargeur
à mi-hauteur
2y.
Lafigure
3représente
la variation deRe[ G (m)], Im[G(w)]
et1 G(cù) au voisinage
de wr.FIG. 3. - L’admittance
G(w)
au
voisinage
de la résonance.FIG. 4. - Les
pôles
de la fonctionG(w).
D’une
façon générale,
onpeut
dire que : unpôle
del’admittance en dessous de l’axe réel
représente
une réso-nance ; la
partie
réelle dupôle
est(approximativement)
lafréquence de résonance,
lapartie imaginaire
est lalargeur
de la courbe de résonance.
Un autre
exemple
est fourni par lapolarisation
diélec-trique.
Ici lechamp électrique appliqué joue
le rôle dela force
X ;
tandis que lapolarisation
est’l’effet. La constantediélectri ue E w (ou plutôt e:( Cùl.:- 1) est
l’admittance
1(m).
Elle doit donc êtreholomorphe
dans le
demi-plan complexe supérieur
dela variable w,
et les
parties
réelle etimaginaire
doivent vérifier la relation(10) [7].
Unexemple important
dans le casprésent
est donné par la fonction : ,Elle
représente
la relaxationdiélectrique
avec letemps
de relaxation T, .comme l’a montréDebye [8].
D’une
façon générale :
unpôle
sur lapartie négative
desouvent utilisé, en
mécanique classique
comme en méca-nique quantique.
Une autre raison estqu’en pratique
lesphénomènes rapidement
variablesse présentent
presquetoujours
sous forme d’oscillations stationnaires.l’axe
imaginaire représente
unphénomène
derelaxation ;
la distance à l’axe réel est l’inverse du temps de relaxation.
La fonction
citée, appelée
fonction deDebye,
a à peuprès
la même allure que les courbes de résonance de lafigure 3,
sauf que lesparties
réelle etimaginaire
sontinversées.
L’application
de la condition de causalité à la suscep- tibilitémagnétique (1)
y =X’
+ix"
est entièrementanalogue.
La relation de Kramers etKronig
s’écritalors
[9] (les
relations de Kramers etKronig
contenanttoujours
une valeurprincipale,
nous omettons désor-mais le
signe P) :
On a
ajouté
la constanteX(oo)
car X n’est pas néces- sairement nulle pour les hautesfréquences
co. Ilpeut
y avoir des
phénomènes
de résonance et de rela- xation[10].
Pour concrétiser les relations de Kramers etKronig,
onpeut
faireapparaître
les courbesrepré- sentant x’
etx"
directement sur unoscillographe [11].
D’ailleurs,
dans cesapplications
on n’utilise pas tou-jours
les relations sous formeexplicite,
mais on lessous-entend dans la mesure ou on n’admet pour
X’
+ix"
que des fonctionsanalytiques
de wqui
soientholomorphes
dansI+ .
On obtient une
généralisation
des relations de Kramers etKronig
en considérant un corpsélastique auquel
sontappliquées n
forcesXIX 2
...Xn.
Soientxi x2 ... Xn les
déplacements
despoints d’application :
l’admittance sera une matrice n X n,
Gap(w), qui
vérifie les relations de Kramers et
Kronig (2).
Lesrelations de Kramers et
Kronig
pour des fonctions matricielles interviennent souvent aussi dans d’autres cas ; enoutre,
onpeut
tenircompte
des effets ther-miques
enajoutant
des variablesXo (température)
et xo
(qualité
de chaleurfournie) [12].
Un cas
important
est celui des réseauxélectriques [13].
La tension
appliquée
à un «dipôle »
est considéréecomme la cause, le courant comme l’effet. L’admit- tance
1/Z(w) possède
donc lespropriétés qui
ont étédémontrées
plus
haut pourG(w).
Onpeut
démontrerdes
propriétés analogues
pour lesquadripôles
et lesréseaux
plus compliqués (pour lesquels
l’admittance est unematrice).
Cespropriétés analytiques de_ la
ma-trice admittance ont d’ailleurs été
déjà
démontréesd’une autre
façon,
enparticulier
par Foster[14] (3).
(1)
Pour être en accord avec lamécanique quantiqùe
nous avons
pris
pour facteur detemps
exp(-iwt)
et nonexp
(iWt).
C’estpourquoi
nos définitions desqualités
com-plexes
set x s’écartent des définitions usuelles s = e’ -ie",
resp x =
x - ix’.
Il en résulte aussi que les moitiéssupé-
rieure et inférieure du
plan complexe
sont interverties ; mais les relations de Kramers etKronig
ne sont pas modi- fiées(puisqu’elles
ne contiennent que desgrandeurs réelles).
(2)
Etqui
deplus’est symétrique
par suite des relationsd’Onsager.
’(3)
La démonstration de celui-ci repose sur le fait que tout réseaupeut
êtredécomposé
en éléments d’ontl’impé-
dance est de la forme R -
iwL -1 /iwC.
Lapropriété
dela
partie imaginaire
mentionnée à la fin duprécédent
para-graphe joue
ici un rôleindispensable.
On admetgénéra-
lement aussi la
possibilité
d’éléments sans résistanceohmique (ou plutôt
de résistancenégligeable).
Dans ce cas,certains
pôles, qui
autrement se trouveraient en dessous de l’axeréel, peuvent
être situés sur cet axe,La raison pour
laquelle on étudie
cespropriétés géné-
rales de l’admittance en théorie des réseaux est
qu’elles
permettent
derépondre
à laquestion : quelles
sont lesfonctions
admittances,
données apriera, qui peuvent
être réalisées à l’aide d’éléments convenablement choisis ?
Considérons maintenant un
exemple
élémentaire : la diffraction de la lumière par un réseau.Supposons
que tombe sur le réseau une courteimpulsion lumineuse,
c’est-à-dire une
superposition
d’ondesplanes
avec desamplitudes
et desphases
tellesqu’elles
forment un«
paquet
d’ondes » limité dansl’espace,
parexemple
une fonction a. Le
spectroscopiste qui
observe sousun
angle
6reçoit
une seulecomposante
deFourier,
donc une onde
sinusoïdale, qui
est par définition infinie.Ceci est manifestement en contradiction
flagrante
avecla causalité.
Pour résoudre ce
paradoxe,
il faut remarquer que la lumière reçue dans la direction 6 n’est pas strictementmonochromatique,
mais occupe une bande de fré- quences delargeur Av
==c(B
sin6)-1
où B est lalargeur
du réseau[15].
Lepaquet
d’ondes émis dans cette direction n’a donc pas de raison d’être infinimentlong ;
onpeut
voir facilement que salongueur
n’estpas inférieure à B sin 6. Mais un tel
élargissement
d’unpaquet
d’ondes incident en fonction 8 n’a rien deFIG. 5. - L’étalement d’un
paquet
d’ondesà la traversée d’un réseau.
paradoxal ;
salongueur
estprécisément
la différence des chemins parcourus par la lumièrequi
atteintl’oeil via le trait
supérieur
duréseau,
et par cellequi
est
passée
par le trait inférieur. D’unefaçon générale
on
peut
voir ainsi que dans un interféromètre depouvoir
de résolution Av il doit y avoir une différence de marche d’au moinscjOv.
Onpeut comparer
cerésultat
à la
relation d’incertitude de lamécanique quantique.
4.
Propagation
de la lumière dans un milieu. - Considérons uneplaque
formée d’un. milieu diélec-trique d’épaisseur
D. Unpaquet
d’ondes électroma-gnétiques
arrive de lagauche
et tombe sur laplaque
sous incidence normale.
Chaque composante
de Fouriersubit en traversant le milieu un affaiblissement dû à
l’absorption,
et undéphasage correspondant
au cheminoptique
parcouru dans le milieu. Parsuite, l’amplitude
de
chaque
ondemonochromatique
sera,après
sonpassage
dans
lamatière, multipliée par les
facteurs
exp D/ 2
et exp (iconD/c), où a(to) est le coef.
exp (- 0153D/2)
et exp(ioonDlc),
où0153(Cù)
est le coef.ficient
d’absorption
etn(w) l’indice
de réfraction. Cesgrandeurs peuvent
êtregroupées
en un nombre d’ondescomplexe
où
N(w)
=n(co)
+i(cj2Cù) cx(w)
est l’indice de réfrac- tioncomplexe
usuel. Si on écrit pour lechamp
élec-trique
incident sur la facegauche
de laplaque
on a pour le
champ
sur la face droiteFIG. 6. - Déformation d’un
paquet
d’ondesau passage dans un milieu.
La condition de causalité
exige
alors que exp(ix( Cù)D) possède
unprolongement analytique
dans1+.
Ceciconduit à la relation de Kramers et
Kronig
mentionnéeau
paragraphe
1 :La démonstration est la suivante
[16].
On doit doncexiger
que, siEin’t) = 0
pour t 0,Eout(t)
= 0 pourt
DJC.
Donc : siEin(w)
estholomorphe
dans 1+, doit l’êtreégalement. Donc exp i (iK(w)
-iwlc)D}
doitêtre
holomorphe
dans 1+. Il n’en résulte pas encore quex( êÕ).- w/c
doive êtreholomorphe,
car les zéros dedevraient conduire à des
singularités logarithmique
dex(w).
Mais ceci est
exclu,
car D est arbitraire. Deplus x(w) 2013 o/c
elle même n’est pas nulle à
l’infini ;
il faut diviser par o pour obtenir une fonction nulle à l’infini. Pour cette der- nièrefonction,
les formules dePlemelj
sontvalables,
d’oùrésulte
l’équation (15).
Il faut encore remarquer quef IEin( (0)/2 doo représente l’énergie totale du paquet
d’ondes incident,
que l’on peut
supposer finie ; la théorie
de la transformation de Hilbert peut
donc s’appliquer
ici
de
façon
tout à faitrigoureuse.
La
relation obtenue est satisfaite enparticulier
par les formules dedispersion
connues. Lorentz obtenaitpar sa, théorie
des
électrons[17]
(less
cor sont les différentesfréquences
derésonance ;
les
Nr
sont les nombres d’électronscorrespondants).
Lepremier
membre contient l’indice de réfraction com-plexe N(w),
en sorte que(16) exprime
aussi l’indice de réfraction ordinairen(w)
et le coefficientsd’absorp-
tion
ce(m)
en fonction degrandeurs
relatives au milieu.On
peut
vérifier que cesexpressions
den(co)
etoc(w)
vérifient la relation
(15),
mais il estplus simple
daremarquer que
(16)
estholomorphe
dansI+
et nulle àl’infini,
donc que l’on doit bien avoir(15).II
en résulteque dans un tel milieu aucun
paquet
d’ondes nepeut
se propager à une vitesse
supérieure
à c. Ceci a étévérifié
explicitement
autrefois par Sommerfeld et Brillouin[18]
pour résoudre leparadoxe
suivant. Auvoisinage
de mr, l’indice de réfraction n est une fonc- tion décroissante de ce(dispersion anomale),
etpeut
même être inférieur à
1 ;
la vitesse depropagation c/n
devrait être
supérieure
à c, en contradiction avec la théorie de la relativité. Un traitementapproximatif
duproblème
montre que laplus grande partie
dupaquet
d’ondes se propage en effet avec la vitesse
c/n ;
maisprécisément
cetteapproximation
n’estplus
valabledans le domaine ou
N(w)
estrapidement
variable.En même
temps
ilapparut
que le front d’unpaquet d’ondes,
dans un milieu pourlequel
est vérifiée la relation(16),
nepeut jamais
sedéplacer
à une vitessesupérieure
à c, cequi
est évident pour nousaujour-
d’hui.
Une
particularité
intéressante est que la théorie de Lorentz ne donne pas en fait un terme d’amortissementiy Cù2 r
00,mais
2013iyC03.
Pour toutes les valeurs raison- nables de w, cela revient au même, mais en touterigueur
il en résulte que
chaque
dénominateur dans(16) possède
untroisième zéro, voisin de ce =
i/y,
donc dans 1+. Parsuite la
propagation
de la lumière dans un milieu d’élec-trons de Lorentz n’est pas strictement
causale,
mais ilapparaît
un« précurseur » qui
est en avance d’unelongueur égale
au rayon de l’électron. Heureusement pour Sommer-’feld et
Brillouin,
ils utilisaient la formùleapprochée (16)
1Un tel
pôle
acausalapparaît
aussi pour un électron de Lorentzlibre ;
il est lié au fait quel’équation
de mouve-ment de Lorentz
possède
une solution anormale pourlaquelle (indépendamment
d’une éventuelle forceappliquée)
la vitesse de l’électron croît
exponentiellement
commeexp
(t/y) (solution
«auto-accélérée »).
Lorentz nes’inquié-
tait pas de cela parce
qu’il
considérait le termed’amortisse-
ment
simplement
comme uneapproximation,
valable seule- mentpur 1 cùl
«1 ly. Cependant
Dirac[20]
montra que les mêmes difficultés seproduisent
dans la théorie relati- visterigoureuse
desparticules chargées,
etqu’elles
sont fondamentalement liées àl’électrodynamique
de Maxwell- Lorentz. En cequi
concerne lamécanique quantique,
oncrut
longtemps qu’il
nepeut
yapparaître
de telles solutions.Celà parce que l’effet de l’interaction entre la
particule
et le ’champ
nepeut
être calculéqu’en
faisant undéveloppement
en série de
puissances
de lacharge
e ; il est clairqu’ainsi
onne
peut
trouver une solution où yfigure
au dénomina-teur
[21]. Cependant
dans un modèlesimplifié qui peut
êtretraité exactement, il
apparut qu’il
existe unanalogue
quan-tique
de la solution anomale[22].
Pauli trouva alors une anomalieanalogue
dans le modèlesimplifié
de Lee pour la théoriemésonique [23] ;
on soupçonneque
cette anomalie est liée aux dilflcultés fondamentales de la théorie deschamps
et c’estpourquoi
les « solutions fantômes » corres-pondantes
sont venues au centre de l’intérêt. Il est remar-quable
que Delsarte avait trouvé des solutions anormales de ce genre dans un cas très élémentaire, celui"du calcul duchamp électromagnétique
dans deux milieuxcontigus qui
,possèdent
des constantesdiélectriques
et desperméabilités
différentes,
maisindépendantes
de ce[24].
La formule de
dispersion
de Sellmeierpeut
s’obtenirà
partir
de(16)
commeapproximation,
ennégligeant
le terme d’amortissement au dénominateur. Mais alors les
pôles qui
se trouvaient dans la moitié inférieure duplan complexe
viennent sur l’axeréel,
et par suite la formule de Sellmeier ne vérifie pas les relations de Kramers etKronig (15) (bien qu’elle
ait amené à ladécouverte de ces relations
(1)).
La formule de dis-persion quantique
deKramers-Heisenberg
ne vérifiepas non
plus (15),
parcequ’elle
estégalement
endéfaut dans les
régions
de résonance. Mais si on intro- duit - avecWeisskopf
etWigner -
des termesd’amortissement convenables dans les dénominateurs de
résonance,
alors(15)
est satisfaite[25, 26].
Le mouvement des électrons dans un cristal
peut
êtretraité d’une
façon analogue.
Si une ondeélectronique
«
monochromatique » d’énergie
E tombe normalement surle
cristal,
elle se propage à l’intérieur du cristal commeune
paramètre
onde de Bloch etuk(x) Uk(X)
uneexp ikx
fonction- iE(k) périodique t 1,
où k est de mêmeunpériode
que le réseau. La fonctionE(k),
dont la forme exacte est déterminée par lespropriétés
ducristal,
àl’allure
générale indiquée
par lafigure
7[27].
La relationFIG. 7. - La formule de
dispersion
pour les électrons dans un réseau.entre l’onde incidente et l’onde
qui
sort par l’autre face du milieu sera donnée, exactement comme dans(14),
par le facteur exp(ik(E) D).
La causalité laisseprévoir
quek(E) possède
unprolongement holomorphe
dans la moitiésupé-
rieure du
plan
E. Apremière
vue cela sembleimpossible :
lafonction
k(E)
est formée de branchesséparées
par des bandes interdites telles que(El, E2)-
Mais une étude appro- fondie montrequ’on
a bien le résultat voulu ; dans les bandes interdites k estimaginaire
pur, et ces valeursimagi-
naires, avec les valeurs réellesindiquées
sur lafigure
7forment une fonction que l’on
peut prolonger.
Cette fonction estholomorphe
dans I+ etpossède
despoints
de bran-chement en El,
Es,
etc... Cecipeut
être démontré mathé-matiquement
àpartir
despropriétés
del’équation
de Schrô-dinger
pour les électrons dans unpotentiel périodique.
Dansce cas la condition de causalité ne nous
apprend
rien denouveau, car nous
disposons grâce
àl’équation
de Schrô-dinger
d’unedescription beaucoup plus
détaillée.5.
Processus
individuels de diffusion. - On sait que l’indice de réfraction n et le coefficientd’absorption
ced’un milieu
s’expliquent
par la diffusionmultiple
de lalumière par un
grand
nombre de centres diffuseurs(1)
En mêmetemps
que Kramers etKronig,
Kallmanet Marc
(Ann. Phys.,
1927,82, 585)
écrivirent aussi uneformule de
dispersion
pour le cas ou lesfréquences
derésonance sont
réparties
defaçon
continue. Ilspartaient également
de(16)
mais nenégligeaient
pas le terme d’amor- sement au dénominateur. C’estpourquoi
ils ne trouvaientpas
les relations de Kramers etKronig.
individuels contenus dans ce milieu. C’est
pourquoi
larelation
(15) peut
aussi êtreinterprétée
comme unepropriété
de ces processus de diffusion individuelle.C’est ce
point
de vue que nous allonsdévelopper.
Ladiffusion par un centre diffuseur donné
(que
nousappellerons
dans la suite «noyau ») peut
être décritecomme suit. L’onde incidente
(dans
la directionz)
serareprésentée,
en mettant àpart
le facteur detemps
, exp
(- iwt),
par exp(ikz),
où k =w/c.
L’onde diffuséeest,
du moins àgrande distance,
une ondesphérique
sortante
(1/r)
exp(ikr),
avec uneamplitude f qui dépend
de la direction. L’onde est doncasympto- tiquement
L’ «
amplitude
de diffusion »f(co, 0)
ainsi définie est une fonction dek,
et del’angle
0 avec la direction de l’onde incidente. Le module def
est une mesure(1)
de l’intensité de l’onde
diffusée,
etl’argument
def
est le
déphasage
dû à la diffusion[28].
La relation entre
l’amplitude
de diffusionf
et lespropriétés
de l’onde diffusée n’est toutefois valable que pour0 * 0 ;
dans la direction enavant,
0= 0, l’interprétation physique
de lagrandeur complexe f est
radicalement différente.
En.effet,
dansez cette directionl’interférence entre les deux termes de
(17)
devisentimportante,
en sortequ’une séparation
entre ondesincidente et diffusée n’a
plus
de sens. On constate queprécisément l’amplitude
de diffusion en avantf(k, 0)
est liée aux
grandeurs n(w)
etce(m) qui expriment
lespropriétés macroscopiques
dumilieu ;
on aN est le nombre de « noyaux » par unité de volume du milieu.
Pour donner une brève démonstration de
(18),
consi-dérons la situation
représentée
par lafigure
8 : une ondeFiG. 8. - Démonstration du théorème
optique.
plane monochromatique
exp(ikzj
tombe normalement surune couche de matière
d’épaisseur
très faible D.L’état
del’onde en un
point
situé à la distance zaprès
la couche estdonné par :
D’autre