Lorsqu’on fait des exp´eriences, il est bien rare que l’on n’utilise pas un logiciel d’acquisition et de traite-ment des donn´ees exp´eritraite-mentales. Ces logiciels proposent g´en´eralement des options intitul´ees par exemple smooth-ing20oucurve fitting21ouleast square fit22. L’objectif de ce chapitre est d’expliquer ce que font au juste ces options, comment ¸ca marche, et quelles sont leurs limites. En effet, il ne s’agit pas de magie, contrairement parfois `a ce qu’il paraˆıt, mais de bons vieux algorithmes bien p´edestres, faciles `a comprendre et dont il vaut mieux connaˆıtre les hypoth`eses sous-jacentes et les petites manies, faute de quoi on a vite fait de faire dire `a peu pr`es n’importe quoi aux r´esultats d’exp´erience !
4.8.1 Donn´ ees et moindres carr´ es.
4.8.1.1 Quel est le probl`eme ?
Lorsqu’on fait une exp´erience, on mesure une grandeur yen fonction d’une autre grandeurx, par exemple la pres-sion en fonction de la temp´erature p(T), l’intensit´e lu-mineuse en fonction de sa fr´equence ou de sa pulsation I(ω), la position d’un objet en fonction du tempsr(t). . . On peut aussi bˆatir une th´eorie qui pr´edise la loiy=f(x) et l’on veut savoir si la th´eorie est juste : cette th´eorie re-pose sur des hypoth`eses physiques qui sont ainsi valid´ees ou non. C’est ce qu’on appelle la mod´elisation, on fait en-trer une exp´erience dans le cadre d’un mod`ele.
En g´en´eral, la loi issue de la th´eorie d´epend aussi de param`etres dits ≪ ajustables ≫. Par exemple, on peut imaginer que si l’on mesure une pression de vapeur saturante, la pression puisse s’´ecrire en fonction de la temp´erature de la fa¸con suivante :
P(T) =P0 e−∆EkT
une loi d’Arrhenius o`u ∆E est l’´energie qu’il faut fournir pour arracher un atome `a la surface de l’´echantillon.
Ainsi, cette th´eorie, si elle est juste, donne potentiellement
´egalement une information de type microscopique sur l’´echantillon ´etudi´e : on aimerait bien savoir ´evidemment quelle est la valeur de ∆E qui est la plus en accord avec les r´esultats exp´erimentaux : ∆E (ainsi que P0) est donc un param`etre ajustable de la th´eorie parce qu’on n’en con-nait pas la valeur a priori et l’on tentera donc d’ajuster
∆E aux donn´ees exp´erimentales.
Ainsi, il est important de comprendre que l’on est en train de poser, non pas une, mais deux questions dis-tinctes :
1. est-ce la th´eorie marche ?
2. quelles sont les valeurs (et les incertitudes) des param`etres ajustables ?
Il se trouve que les logiciels courants r´epondent pra-tiquement toujours `a la seconde question, mais pas `a la premi`ere : cela vaut donc la peine de regarder d’un peu plus pr`es comment ¸ca marche !
20. Lissage.
21. Ajustement de courbe.
22. Ajustement de moindre carr´e.
4.8.1.2 L’hypoth`ese de d´epart.
En pratique, l’on rel`eve, pour n points de mesures {xi, i = 1, n}, les n valeurs {yi, i = 1, n} correspon-dantes. Mettons que l’on ait une th´eorie qui donne y en fonction dexet d’un certain nombre de param`etres ajusta-blesp1, . . . , pm:
y=f(x, p1, . . . , pm) =f(x,{pj})
Ce qui nous int´eresse, ce sont les ´ecarts entre lesyimesur´es et lesf(xi,{pj}) calcul´es `a l’aide de la th´eorie. On d´efinit ainsi :
χ2({pj}) = Xn i=1
(f(xi,{pj})−yi)2
On cherchera alors l’ensemble de param`etres {pj} qui rendra χ2 le plus petit possible : c’est pour cela que la m´ethode s’appelle ≪ m´ethode de moindres carr´es ≫, puisqueχ2est la somme des carr´es des ´ecarts entre th´eorie et mesures.
On aurait pu choisir autre chose que la somme des carr´es des ´ecarts, par exemple la somme des valeurs absolues ou le sup des carr´es. . . Le choix fait ici, ainsi que dans la quasi-totalit´e des programmes, repose sur une hypoth`ese qu’il faut expliciter.
Imaginons que l’on fasse un grand nombre de fois la mesure dey pour une mˆeme valeur dex: on ne trouvera pas la mˆeme valeur de y pour toutes les mesures mais une distribution parce que la mesure n’est pas parfaite, il y a des incertitudes, il y a des vibrations dans le sol, le d´etecteur utilis´e produit du bruit, l’´electronique produit
´egalement du bruit. . .
L’hypoth`ese qui m`ene `a l’expression deχ2ci-dessus est que cette distribution est gaussienne, centr´ee autour dey0
avec un ´ecart-typeσ:
p(y) = e−(y−y0 )
2 2σ2
`
a un coefficient de normalisation pr`es23. Il se trouve que pour un tr`es grand nombre d’exp´eriences, le th´eor`eme de la limite centrale (valable pour les grands nombres) impose que cette condition soit v´erifi´ee. Toutefois, il faut faire attention que des d´etecteurs tr`es sensibles peuvent ˆetre capables de r´epondre `a un nombre de≪coups≫tr`es faible pour lequel ce genre de th´eor`eme n’est plus valable. Les m´ethodes d´ecrites ici ne sont alors plus en toute rigueur directement utilisables.
4.8.2 Ajustement d’une fonction lin´ eaire.
4.8.2.1 Sans les incertitudes.
Prenons pour commencer le cas le plus simple : y = ax+b o`u les deux param`etres ajustables sont aet b. On cherche doncaet btels que
χ2= Xn i=1
(axi+b−yi)2
23. 1
σ√ 2π.
soit minimum. Il faut donc que les d´eriv´ees deχ2par rap-port aux deux param`etres soient nulles :
Quelques lignes de calculs sans difficult´e donnent :
Lire dans un fichier lesnvaleurs dexet deyet faire ce calcul pour obtenir l’´equation de la droite est extrˆemement simple (c’est d’ailleurs un petit exercice de programmation conseill´e24) : on comprend que les ´editeurs de logiciels ne se privent pas de l’inclure dans leurs productions.
4.8.2.2 Avec les incertitudes.
Il y a une faiblesse criante dans ce que nous avons fait jusqu’`a pr´esent : on ne voit nulle part d’incertitude ! Ad-mettons donc que chaque mesure (xi, yi) soit affect´ee d’une incertitudeσi. On doit alors red´efinirχ2 de fa¸con qu’une mesure≪ compte≫ d’autant plus que son incertitude est petite :
Dans le cas de la fonction lin´eaire cela s’´ecrit ´evidemment : χ2=
Xn i=1
(axi+b−yi)2 σ2i
Un calcul `a peine plus compliqu´e que pr´ec´edemment donne de la mˆeme fa¸con les expressions deaet deb.
On peut alors introduire le ≪ facteur de confiance pond´er´e≫ ouweighed reliability factor :
Rw=
c’est un ´ecart quadratique ramen´e `a la moyenne des carr´es de la fonction. Il s’exprime en g´en´eral en % : siRwvaut par exemple 10%, cela signifie en gros que la fonction th´eorique est ´eloign´ee de 10% des valeurs exp´erimentales, en unit´es deσ.
Ce que l’on aimerait avoir, c’est l’incertitude sur aetb puisque ce sont les r´esultats de tous ces calculs. Posons :
ei=f(xi,{pj})−yi
24. Il est prudent de travailler en double pr´ecision `a cause des d´enominateurs.
c’est l’´ecart entre th´eorie et exp´erience pour le pointi. Si l’on estime que cet ´ecart est enti`erement dˆu au param`etre n˚1, on obtient
une majoration de l’incertitude δp1 sur le premier param`etre, or
et en g´en´eralisant ceci `a tous les param`etrespj : δpj=
C’est ce que l’on appelle ≪ d´eviations standards es-tim´ees ≫ (estimated standard deviations ou esd) et ce sont des estimations de majorants aux incertitudes sur les param`etres.
Dans le cas d’une fonction lin´eaire, ´evidemment, ces for-mules se simplifient ais´ement, mais elles s’appliquent25 aux autres cas aussi.
4.8.2.3 Exercice pratique et divertissant.
-´Etape n˚1 : remplir une coupelle en plastique ou un pot de yaourt ou de petit suisse vide avec un peu d’eau.
-´Etape n˚2 : poser la coupelle ou le pot de yaourt sur un p`ese-lettres et l’ensemble (pr´ecautionneusement) sur un radiateur.
-´Etape n˚3 : pendant une semaine ou plus, relever plusieurs fois par jour le temps ´ecoul´e depuis le d´ebut de l’exp´erience et la masse indiqu´ee par le p`ese-lettre. Mettre ces donn´ees exp´erimentales dans un fichier.
-´Etape n˚4 : faire une hypoth`ese physique. Puisque la temp´erature du radiateur peut ˆetre consid´er´ee en premi`ere approximation comme constante, la vitesse d’´evaporation de l’eau peut ˆetre consid´er´ee comme constante et donc la masse d’eau restante s’exprimer comme une fonction lin´eaire du temps :
m(t) = ˙m t+m0
o`u, donc, ˙met m0 sont des constantes.
-´Etape n˚5 : d´eterminer ˙m et m0 selon les m´ethodes ci-dessus, ainsi que les d´eviations standards. Tracer les courbes exp´erimentale et th´eorique sur un mˆeme graphe ainsi que les ´ecarts entre courbe th´eorique et exp´erimentale.
-´Etape n˚6 : s’interroger sur les r´esultats obtenus.
-´Etape n˚7 : changer la valeur affich´ee sur le thermostat et recommencer l’exp´erience.
-´Etape n˚8 : tracer la courbe ˙m(T) pour 253< T <333K.
4.8.2.4 Une g´en´eralisation possible.
Ces m´ethodes qui ont le grand m´erite d’ˆetre simples et faciles `a programmer ne sont pas limit´ees strictement aux
25. On n’ose parler devalidit´e!
68 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan
fonctions lin´eaires. Reprenons l’exemple de la loi d’Arrhe-nius :
P =P0e−∆EkT Si l’on fait les changements de variable :
y= lnP x=− 1 kT on obtient
y= ∆E x+ lnP0
o`u ∆E et lnP0tiennent le rˆole deaetbdans le probl`eme pr´ec´edent. Ainsi, si l’on peut exprimer le probl`eme de la fa¸con suivante :
g(y) =a h(x) +b
o`u g et h sont des fonctions connues sans param`etre ajustable (ici, k est la constante de Boltzmann, connue), tout ce qui est ci-dessus est utilisable sans difficult´e.
4.8.2.5 Un caveat.
Figure 4.19 – L’ajustement d’une fonction lin´eaire `a des donn´ees al´eatoires donne un r´esultat. Ici : 0.79875− 0.24841×x. Quel sens donner `a ces nombres ? Aucun !
Malheureusement, tout ceci est un peu trop beau. En effet il suffit de consid´erer les ´equations de ce chapitre pour constater que ces m´ethodes donneront toujours un r´esultat, si absurde soit-il. La figure 4.19 montre l’ajuste-ment d’une droite sur un nuage de points al´eatoires.
On obtient des nombres.
Ces nombres n’ont, bien sˆur, aucun sens.
Moralit´e : ce n’est pas parce qu’un programme d’ajuste-ment donne un r´esultat que le mod`ele est valid´e et que les param`etres qu’il donne sont bons.
Il ne faut pas oublier d’ˆetre physicien : quand on ajuste un mod`ele, c’est qu’on pense qu’il est adapt´e, puis on doit discuter les valeurs obtenues pour les param`etres en les consid´erant comme des grandeurs physiques et en se posant par exemple la question des cons´equences qu’entraˆınent les valeurs obtenues. Si, par exemple, dans le cas de la loi d’Arrhenius, on trouve ∆E ∼ 106 joules (au lieu de quelques eV), on est en droit de se demander si l’on a bien mesur´e de la sorte l’´energie pour arracher un atome d’une surface comme on le pensait initialement.
4.8.3 Ajustement d’un polynˆ ome.
On peut g´en´eraliser facilement les ´equations du para-graphe 4.8.2.1 au cas d’un polynˆome de degr´ep:
P(x) =c0+c1x+c2x2+. . .+cpxp= Xp j=0
cjxj On cherche, bien sˆur, lesp+ 1 coefficientscj, et donc,
∂χ2
∂cj
= ∂
∂cj
Xn i=1
Xp k=0
ckxki −yi
!2
σi2
= 0
Il est ais´e de se rendre compte que si l’on pose :
Ajk = Xn i=1
xj+ki σi2 Bj =
Xn i=1
yixji σi2
le probl`eme se ram`ene `a la r´esolution d’un syst`eme lin´eaire (p+ 1)×(p+ 1) :
A·C=B avec des notations ´evidentes. De plus :
Rw= vu uu ut
χ2 Xn i=1
P(xi)2 σ2 et :
δck= s
χ2 Akk
Les g´en´eralisations du type : g(y) =P(h(x))
o`u g et h sont des fonctions connues sont ´evidemment possibles.
A condition de disposer d’un sous-programme de` r´esolution de syst`emes lin´eaires, tout ceci est tr`es simple `a programmer, ¸ca marche tr`es bien et c’est rapide car il n’y a pas `a converger plus ou moins laborieusement vers une solution.
Alors, s’agit-il du programme ≪ r´esout tout probl`eme, marche `a tout coup≫? Poser la question est ´evidemment un d´ebut de r´eponse.
Revenons au pot de yaourt du paragraphe 4.8.2.3.
Il est probable que l’ajustement d’une fonction lin´eaire laissera des ´ecarts entre cette fonction et les donn´ees exp´erimentales : faut-il alors prendre un polynˆome de degr´e plus ´elev´e ? Il est clair que l’ajustement en sera meilleur : `a la limite, si l’on prend un degr´e ´egal au nombre de points moins un,p=n−1, on obtiendra un polynˆome passant par tous les points exp´erimentaux ! Mais les coef-ficients ainsi introduits ont-ils un sens physique ? Non !
Il faut d’abord se poser des questions physiques. Par exemple, y a-t-il une raison pour laquelle le mod`ele choisi ne conviendrait pas ? Comme le thermostat a un cycle de 24 heures car on chauffe moins la nuit, ne pourrait-on pas
plutˆot introduire cette p´eriodicit´e dans le probl`eme ? On pourrait tenter quelque chose comme
˙
m= ¯˙m+µsin 2πt τ
Evidemment, c’est plus difficile parce qu’il ne s’agit plus´ d’un polynˆome et il faudra recourir aux m´ethodes du para-graphe 4.8.6, mais c’est peut-ˆetre plus r´ealiste, puisque ¯˙m devient alors la vitesse moyenne d’´evaporation et µ l’am-plitude des variations p´eriodiques. On peut mˆeme aller un peu plus loin en remarquant que ˙mest sans doute propor-tionnel `a la pression laquelle ob´eit probablement `a une loi d’Arrhenius en fonction de la temp´erature. . .
4.8.4 D´ eriv´ ee locale d’une courbe exp´ erimentale.
On peut aussi prendre la question diff´eremment : l’in-connue ≪ int´eressante ≫ de l’exp´erience est la vitesse d’´evaporation ˙m : c’est cela que l’on cherche `a mesurer.
On voudrait calculer la d´eriv´ee locale de la mesure et c’est
`
a cette grandeur l`a que l’on tentera d’appliquer quelque th´eorie.
Il suffit d’ajuster localement une fonction lin´eaire : f(x) =c1ix+c0i
`a condition de rester proche de xi. Le χ2 devient local autour du pointxi :
χ2i = X+q k=−q
(c1ixk+i+c0i−yi+k)2
o`uqd´etermine la largeur de l’intervalle autour dexio`u ce calcul est fait. Le coefficient c1i est donc la d´eriv´ee locale recherch´ee : un calcul sans difficult´e donne :
c1i = 3
δxq(q+ 1)(2q+ 1) X+q k=−q
k yi+k
dans le cas o`u xi =x0+iδx26. ´Evidemment, le r´esultat que l’on trouve d´epend de q : si l’on choisit une valeur de q petite, le r´esultat risque d’ˆetre sensible au bruit, en revanche, si q est trop grand, on perdra les fluctuations rapides (voir la figure 4.20). Il faut choisir autant que pos-sibleqδx<∆xl’ordre de grandeur des variations que l’on cherche `a d´etecter.
Exercice : essayer de calculer ˙m(t) `a partir des donn´ees de mesure. On constatera qu’il faut choisir un intervalle de mesure sensiblement plus court que la dur´ee des vari-ations quotidiennes de la temp´erature : l’id´eal ´etant un enregistrement toutes les heures par exemple.
4.8.5 Lissage : a dirty trick !
Il arrive que les informations int´eressantes d’une exp´erience soient difficilement visibles sur la courbe exp´erimentale obtenue `a cause du bruit. La plupart des logiciels d’acquisition offrent des options desmoothing ou lissage visant `a r´eduire le bruit. Il s’agit d’ajuster locale-ment un polynˆome comme pr´ec´edemment, par exemple un polynˆome d’ordre 2 :
26. Il faut se rappeler au passage queP+q
−qk2=q(q+1)(2q+1)
3 .
Figure4.20 – Un cosinus bruit´e, sa d´eriv´ee calcul´ee avec q= 3 et avecq= 10.
Lij =c2iδx2j2+c1iδxj+c0i
mais seul la valeur en xi de l’ajustement local nous int´eresse :
Li0=c0i
car on remplacera les xi par les valeurs liss´ees Li0. `A la suite de calculs sans difficult´e, on obtient, toujours par les mˆemes m´ethodes :
Li0=c0i = J4yi+
Xq k=1
(J4−J2k2)(yi+k+yi−k)
J0J4−J22 (4.20) o`u
Jℓ= Xq j=−q
jℓ soit :
J0= 2q+ 1, J2=q(q+ 1)(2q+ 1)
3 ,
J4= q(q+ 1)(2q+ 1)(3q2+ 3q−1) 15
(lesJℓ pourℓ impair sont bien sˆur tous nuls) et J0J4−J22=q(q+ 1)(2q+ 1)2(4q2+ 4q−3)
45
C’est encore extrˆemement facile `a programmer et rapide
`
a l’ex´ecution. Il faut cependant r´ealiser que 1˚ le r´esultat d´epend deq et 2˚ il ne s’agit en fait que d’une moyenne pond´er´ee de points voisins. Il y a ici une hypoth`ese sous-jacente tr`es importante : c’est que les variations int´eressantes sont de longueur d’onde ou de dimension car-act´eristique grande par rapport aux fluctuations dues au bruit et donc `a l’intervalle balay´e dans l’´equation (4.20).
C’est pour cela qu’il vaut g´en´eralement mieux, sauf pour des raisons≪cosm´etiques≫ ne pas faire de lissage, et, au contraire, ajuster une fonction physiquement justifi´ee aux r´esultats non liss´es : si l’information int´eressante est l`a et si le mod`ele choisi est susceptible de la r´ev´eler, l’ajustement devrait la faire apparaˆıtre.
70 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan
4.8.6 Ajustement non-lin´ eaire.
Ce qui rend l’ajustement de polynˆomes si simple, c’est que la d´ependance d’un polynˆome par rapport aux param`etres, c’est-`a-dire aux coefficients, est lin´eaire :ax2+ bx+c est une fonction lin´eaire de a, b et c, mˆeme si ce n’est pas une fonction lin´eaire de x. En revanche, on peut vouloir chercher `a ajuster une fonction comme :
L(x) = L0
1 +
x−x0
γ 2
C’est une lorentzienne comme sur la figure 4.21 o`u, comme le montre une analyse ´el´ementaire, L0 est la hauteur de la courbe, x0 la position de son maximum et γ sa demi-largeur `a mi-hauteur. Il est facile de montrer que la lorentzienne est le module au carr´e de la transform´ee de Fourier de eiωt−τt et donc la r´eponse spectrale des oscilla-tions amorties, ce qui en fait une courbe tr`es r´epandue en spectroscopie, par exemple optique : la position du som-met de la courbe donne la fr´equence de l’oscillateur et sa largeur, l’amortissement.
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
−5 0 5 10
Figure 4.21 – Lorentzienne avecL0= 1,γ= 0.5 etx0= 2.
Les param`etres que l’on veut ajuster sont L0, x0 et γ, or L n’est lin´eaire ni en x0 ni en γ; alors on lin´earise le probl`eme en sachant que le r´esultat ne sera pas correct mais en esp´erant qu’il sera moins mauvais que le point de d´epart et l’on r´ep`ete l’op´eration jusqu’`a ce qu’une so-lution acceptable soit trouv´ee. Il s’agit donc, une fois de plus, de rechercher un minimum de χ2 en fonction de ses param`etres, seulement, il n’y a plus de solution simple, il faut utiliser une m´ethode du type Newton ou gradient conjugu´e avec les pr´ecautions qu’imposent ces m´ethodes : ce n’est pas parce que cela fait partie d’un logiciel tout fait que ces m´ethodes deviennent infaillibles, elles con-servent les d´efauts d´ej`a vus. Si le point de d´epart de la recherche, les param`etres initiaux, est trop ´eloign´e d’une solution, le r´esultat obtenu risque d’ˆetre absurde, si le mod`ele comporte un trop grand nombre de param`etres ajustables (chaque param`etre ajoute une dimension `a l’es-pace de recherche) la signification du r´esultat final risque d’ˆetre assez discutable. . .
Ainsi, lorsqu’on ajuste un mod`ele th´eorique `a une exp´erience, on est donc confront´e `a deux types de diffi-cult´es :
– la recherche du minimum deχ2, il est parfois difficile
de se convaincre que le minimum trouv´e est bien le minimum de la fonction
– le fait que d’avoir trouv´e le minimum deχ2ne valide en aucun cas le mod`ele utilis´e.
Ces mises en garde ne doivent toutefois pas ˆetre vues comme devant dissuader d’utiliser ces outils : il faut les utiliser, ils sont d’une grande puissance ! Parfois, un ajustement difficile ou qui paraˆıt donner des r´esultats dou-teux est une indication qu’un autre mod`ele (pas forc´ement plus compliqu´e, d’ailleurs) serait peut-ˆetre meilleur. Il faut simplement se rappeler que l’ordinateur qui fait le calcul est un serviteur puissant mais. . . stupide ! Au physicien de faire son m´etier et de garder un regard critique.
Il existe, au reste, de bonnes habitudes qui peuvent aider `a ´eviter des m´esaventures. La premi`ere est de tracer sur un mˆeme graphe la courbe th´eorique et les r´esultats exp´erimentaux pour voir si ¸ca ressemble ! L’œil humain est un bon juge en la mati`ere. On peut pousser un peu plus loin en tra¸cant la courbe des ´ecarts entre fonction th´eorique et exp´erience : en principe, on ne devrait voir que du bruit, c’est-`a-dire un signal al´eatoire, sym´etrique
Il existe, au reste, de bonnes habitudes qui peuvent aider `a ´eviter des m´esaventures. La premi`ere est de tracer sur un mˆeme graphe la courbe th´eorique et les r´esultats exp´erimentaux pour voir si ¸ca ressemble ! L’œil humain est un bon juge en la mati`ere. On peut pousser un peu plus loin en tra¸cant la courbe des ´ecarts entre fonction th´eorique et exp´erience : en principe, on ne devrait voir que du bruit, c’est-`a-dire un signal al´eatoire, sym´etrique