• Aucun résultat trouvé

Mod´elisation de donn´ees exp´erimentales

Dans le document Licence de physique L3 PHYTEM (Page 66-71)

Lorsqu’on fait des exp´eriences, il est bien rare que l’on n’utilise pas un logiciel d’acquisition et de traite-ment des donn´ees exp´eritraite-mentales. Ces logiciels proposent g´en´eralement des options intitul´ees par exemple smooth-ing20oucurve fitting21ouleast square fit22. L’objectif de ce chapitre est d’expliquer ce que font au juste ces options, comment ¸ca marche, et quelles sont leurs limites. En effet, il ne s’agit pas de magie, contrairement parfois `a ce qu’il paraˆıt, mais de bons vieux algorithmes bien p´edestres, faciles `a comprendre et dont il vaut mieux connaˆıtre les hypoth`eses sous-jacentes et les petites manies, faute de quoi on a vite fait de faire dire `a peu pr`es n’importe quoi aux r´esultats d’exp´erience !

4.8.1 Donn´ ees et moindres carr´ es.

4.8.1.1 Quel est le probl`eme ?

Lorsqu’on fait une exp´erience, on mesure une grandeur yen fonction d’une autre grandeurx, par exemple la pres-sion en fonction de la temp´erature p(T), l’intensit´e lu-mineuse en fonction de sa fr´equence ou de sa pulsation I(ω), la position d’un objet en fonction du tempsr(t). . . On peut aussi bˆatir une th´eorie qui pr´edise la loiy=f(x) et l’on veut savoir si la th´eorie est juste : cette th´eorie re-pose sur des hypoth`eses physiques qui sont ainsi valid´ees ou non. C’est ce qu’on appelle la mod´elisation, on fait en-trer une exp´erience dans le cadre d’un mod`ele.

En g´en´eral, la loi issue de la th´eorie d´epend aussi de param`etres dits ajustables . Par exemple, on peut imaginer que si l’on mesure une pression de vapeur saturante, la pression puisse s’´ecrire en fonction de la temp´erature de la fa¸con suivante :

P(T) =P0 e∆EkT

une loi d’Arrhenius o`u ∆E est l’´energie qu’il faut fournir pour arracher un atome `a la surface de l’´echantillon.

Ainsi, cette th´eorie, si elle est juste, donne potentiellement

´egalement une information de type microscopique sur l’´echantillon ´etudi´e : on aimerait bien savoir ´evidemment quelle est la valeur de ∆E qui est la plus en accord avec les r´esultats exp´erimentaux : ∆E (ainsi que P0) est donc un param`etre ajustable de la th´eorie parce qu’on n’en con-nait pas la valeur a priori et l’on tentera donc d’ajuster

∆E aux donn´ees exp´erimentales.

Ainsi, il est important de comprendre que l’on est en train de poser, non pas une, mais deux questions dis-tinctes :

1. est-ce la th´eorie marche ?

2. quelles sont les valeurs (et les incertitudes) des param`etres ajustables ?

Il se trouve que les logiciels courants r´epondent pra-tiquement toujours `a la seconde question, mais pas `a la premi`ere : cela vaut donc la peine de regarder d’un peu plus pr`es comment ¸ca marche !

20. Lissage.

21. Ajustement de courbe.

22. Ajustement de moindre carr´e.

4.8.1.2 L’hypoth`ese de d´epart.

En pratique, l’on rel`eve, pour n points de mesures {xi, i = 1, n}, les n valeurs {yi, i = 1, n} correspon-dantes. Mettons que l’on ait une th´eorie qui donne y en fonction dexet d’un certain nombre de param`etres ajusta-blesp1, . . . , pm:

y=f(x, p1, . . . , pm) =f(x,{pj})

Ce qui nous int´eresse, ce sont les ´ecarts entre lesyimesur´es et lesf(xi,{pj}) calcul´es `a l’aide de la th´eorie. On d´efinit ainsi :

χ2({pj}) = Xn i=1

(f(xi,{pj})−yi)2

On cherchera alors l’ensemble de param`etres {pj} qui rendra χ2 le plus petit possible : c’est pour cela que la m´ethode s’appelle m´ethode de moindres carr´es , puisqueχ2est la somme des carr´es des ´ecarts entre th´eorie et mesures.

On aurait pu choisir autre chose que la somme des carr´es des ´ecarts, par exemple la somme des valeurs absolues ou le sup des carr´es. . . Le choix fait ici, ainsi que dans la quasi-totalit´e des programmes, repose sur une hypoth`ese qu’il faut expliciter.

Imaginons que l’on fasse un grand nombre de fois la mesure dey pour une mˆeme valeur dex: on ne trouvera pas la mˆeme valeur de y pour toutes les mesures mais une distribution parce que la mesure n’est pas parfaite, il y a des incertitudes, il y a des vibrations dans le sol, le d´etecteur utilis´e produit du bruit, l’´electronique produit

´egalement du bruit. . .

L’hypoth`ese qui m`ene `a l’expression deχ2ci-dessus est que cette distribution est gaussienne, centr´ee autour dey0

avec un ´ecart-typeσ:

p(y) = e(y−y0 )

2 2

`

a un coefficient de normalisation pr`es23. Il se trouve que pour un tr`es grand nombre d’exp´eriences, le th´eor`eme de la limite centrale (valable pour les grands nombres) impose que cette condition soit v´erifi´ee. Toutefois, il faut faire attention que des d´etecteurs tr`es sensibles peuvent ˆetre capables de r´epondre `a un nombre decoupstr`es faible pour lequel ce genre de th´eor`eme n’est plus valable. Les m´ethodes d´ecrites ici ne sont alors plus en toute rigueur directement utilisables.

4.8.2 Ajustement d’une fonction lin´ eaire.

4.8.2.1 Sans les incertitudes.

Prenons pour commencer le cas le plus simple : y = ax+b o`u les deux param`etres ajustables sont aet b. On cherche doncaet btels que

χ2= Xn i=1

(axi+b−yi)2

23. 1

σ .

soit minimum. Il faut donc que les d´eriv´ees deχ2par rap-port aux deux param`etres soient nulles :

 Quelques lignes de calculs sans difficult´e donnent :



Lire dans un fichier lesnvaleurs dexet deyet faire ce calcul pour obtenir l’´equation de la droite est extrˆemement simple (c’est d’ailleurs un petit exercice de programmation conseill´e24) : on comprend que les ´editeurs de logiciels ne se privent pas de l’inclure dans leurs productions.

4.8.2.2 Avec les incertitudes.

Il y a une faiblesse criante dans ce que nous avons fait jusqu’`a pr´esent : on ne voit nulle part d’incertitude ! Ad-mettons donc que chaque mesure (xi, yi) soit affect´ee d’une incertitudeσi. On doit alors red´efinirχ2 de fa¸con qu’une mesure compte d’autant plus que son incertitude est petite :

Dans le cas de la fonction lin´eaire cela s’´ecrit ´evidemment : χ2=

Xn i=1

(axi+b−yi)2 σ2i

Un calcul `a peine plus compliqu´e que pr´ec´edemment donne de la mˆeme fa¸con les expressions deaet deb.

On peut alors introduire le facteur de confiance pond´er´e ouweighed reliability factor :

Rw=

c’est un ´ecart quadratique ramen´e `a la moyenne des carr´es de la fonction. Il s’exprime en g´en´eral en % : siRwvaut par exemple 10%, cela signifie en gros que la fonction th´eorique est ´eloign´ee de 10% des valeurs exp´erimentales, en unit´es deσ.

Ce que l’on aimerait avoir, c’est l’incertitude sur aetb puisque ce sont les r´esultats de tous ces calculs. Posons :

ei=f(xi,{pj})−yi

24. Il est prudent de travailler en double pr´ecision `a cause des enominateurs.

c’est l’´ecart entre th´eorie et exp´erience pour le pointi. Si l’on estime que cet ´ecart est enti`erement dˆu au param`etre n˚1, on obtient

une majoration de l’incertitude δp1 sur le premier param`etre, or

et en g´en´eralisant ceci `a tous les param`etrespj : δpj=

C’est ce que l’on appelle d´eviations standards es-tim´ees (estimated standard deviations ou esd) et ce sont des estimations de majorants aux incertitudes sur les param`etres.

Dans le cas d’une fonction lin´eaire, ´evidemment, ces for-mules se simplifient ais´ement, mais elles s’appliquent25 aux autres cas aussi.

4.8.2.3 Exercice pratique et divertissant.

-´Etape n˚1 : remplir une coupelle en plastique ou un pot de yaourt ou de petit suisse vide avec un peu d’eau.

-´Etape n˚2 : poser la coupelle ou le pot de yaourt sur un p`ese-lettres et l’ensemble (pr´ecautionneusement) sur un radiateur.

-´Etape n˚3 : pendant une semaine ou plus, relever plusieurs fois par jour le temps ´ecoul´e depuis le d´ebut de l’exp´erience et la masse indiqu´ee par le p`ese-lettre. Mettre ces donn´ees exp´erimentales dans un fichier.

-´Etape n˚4 : faire une hypoth`ese physique. Puisque la temp´erature du radiateur peut ˆetre consid´er´ee en premi`ere approximation comme constante, la vitesse d’´evaporation de l’eau peut ˆetre consid´er´ee comme constante et donc la masse d’eau restante s’exprimer comme une fonction lin´eaire du temps :

m(t) = ˙m t+m0

o`u, donc, ˙met m0 sont des constantes.

-´Etape n˚5 : d´eterminer ˙m et m0 selon les m´ethodes ci-dessus, ainsi que les d´eviations standards. Tracer les courbes exp´erimentale et th´eorique sur un mˆeme graphe ainsi que les ´ecarts entre courbe th´eorique et exp´erimentale.

-´Etape n˚6 : s’interroger sur les r´esultats obtenus.

-´Etape n˚7 : changer la valeur affich´ee sur le thermostat et recommencer l’exp´erience.

-´Etape n˚8 : tracer la courbe ˙m(T) pour 253< T <333K.

4.8.2.4 Une g´en´eralisation possible.

Ces m´ethodes qui ont le grand m´erite d’ˆetre simples et faciles `a programmer ne sont pas limit´ees strictement aux

25. On n’ose parler devalidit´e!

68 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan

fonctions lin´eaires. Reprenons l’exemple de la loi d’Arrhe-nius :

P =P0e∆EkT Si l’on fait les changements de variable :

y= lnP x=− 1 kT on obtient

y= ∆E x+ lnP0

o`u ∆E et lnP0tiennent le rˆole deaetbdans le probl`eme pr´ec´edent. Ainsi, si l’on peut exprimer le probl`eme de la fa¸con suivante :

g(y) =a h(x) +b

o`u g et h sont des fonctions connues sans param`etre ajustable (ici, k est la constante de Boltzmann, connue), tout ce qui est ci-dessus est utilisable sans difficult´e.

4.8.2.5 Un caveat.

Figure 4.19 – L’ajustement d’une fonction lin´eaire `a des donn´ees al´eatoires donne un r´esultat. Ici : 0.79875− 0.24841×x. Quel sens donner `a ces nombres ? Aucun !

Malheureusement, tout ceci est un peu trop beau. En effet il suffit de consid´erer les ´equations de ce chapitre pour constater que ces m´ethodes donneront toujours un r´esultat, si absurde soit-il. La figure 4.19 montre l’ajuste-ment d’une droite sur un nuage de points al´eatoires.

On obtient des nombres.

Ces nombres n’ont, bien sˆur, aucun sens.

Moralit´e : ce n’est pas parce qu’un programme d’ajuste-ment donne un r´esultat que le mod`ele est valid´e et que les param`etres qu’il donne sont bons.

Il ne faut pas oublier d’ˆetre physicien : quand on ajuste un mod`ele, c’est qu’on pense qu’il est adapt´e, puis on doit discuter les valeurs obtenues pour les param`etres en les consid´erant comme des grandeurs physiques et en se posant par exemple la question des cons´equences qu’entraˆınent les valeurs obtenues. Si, par exemple, dans le cas de la loi d’Arrhenius, on trouve ∆E ∼ 106 joules (au lieu de quelques eV), on est en droit de se demander si l’on a bien mesur´e de la sorte l’´energie pour arracher un atome d’une surface comme on le pensait initialement.

4.8.3 Ajustement d’un polynˆ ome.

On peut g´en´eraliser facilement les ´equations du para-graphe 4.8.2.1 au cas d’un polynˆome de degr´ep:

P(x) =c0+c1x+c2x2+. . .+cpxp= Xp j=0

cjxj On cherche, bien sˆur, lesp+ 1 coefficientscj, et donc,

∂χ2

∂cj

= ∂

∂cj





 Xn i=1

Xp k=0

ckxki −yi

!2

σi2







= 0

Il est ais´e de se rendre compte que si l’on pose :









Ajk = Xn i=1

xj+ki σi2 Bj =

Xn i=1

yixji σi2

le probl`eme se ram`ene `a la r´esolution d’un syst`eme lin´eaire (p+ 1)×(p+ 1) :

A·C=B avec des notations ´evidentes. De plus :

Rw= vu uu ut

χ2 Xn i=1

P(xi)2 σ2 et :

δck= s

χ2 Akk

Les g´en´eralisations du type : g(y) =P(h(x))

o`u g et h sont des fonctions connues sont ´evidemment possibles.

A condition de disposer d’un sous-programme de` r´esolution de syst`emes lin´eaires, tout ceci est tr`es simple `a programmer, ¸ca marche tr`es bien et c’est rapide car il n’y a pas `a converger plus ou moins laborieusement vers une solution.

Alors, s’agit-il du programme r´esout tout probl`eme, marche `a tout coup? Poser la question est ´evidemment un d´ebut de r´eponse.

Revenons au pot de yaourt du paragraphe 4.8.2.3.

Il est probable que l’ajustement d’une fonction lin´eaire laissera des ´ecarts entre cette fonction et les donn´ees exp´erimentales : faut-il alors prendre un polynˆome de degr´e plus ´elev´e ? Il est clair que l’ajustement en sera meilleur : `a la limite, si l’on prend un degr´e ´egal au nombre de points moins un,p=n−1, on obtiendra un polynˆome passant par tous les points exp´erimentaux ! Mais les coef-ficients ainsi introduits ont-ils un sens physique ? Non !

Il faut d’abord se poser des questions physiques. Par exemple, y a-t-il une raison pour laquelle le mod`ele choisi ne conviendrait pas ? Comme le thermostat a un cycle de 24 heures car on chauffe moins la nuit, ne pourrait-on pas

plutˆot introduire cette p´eriodicit´e dans le probl`eme ? On pourrait tenter quelque chose comme

˙

m= ¯˙m+µsin 2πt τ

Evidemment, c’est plus difficile parce qu’il ne s’agit plus´ d’un polynˆome et il faudra recourir aux m´ethodes du para-graphe 4.8.6, mais c’est peut-ˆetre plus r´ealiste, puisque ¯˙m devient alors la vitesse moyenne d’´evaporation et µ l’am-plitude des variations p´eriodiques. On peut mˆeme aller un peu plus loin en remarquant que ˙mest sans doute propor-tionnel `a la pression laquelle ob´eit probablement `a une loi d’Arrhenius en fonction de la temp´erature. . .

4.8.4 D´ eriv´ ee locale d’une courbe exp´ erimentale.

On peut aussi prendre la question diff´eremment : l’in-connue int´eressante de l’exp´erience est la vitesse d’´evaporation ˙m : c’est cela que l’on cherche `a mesurer.

On voudrait calculer la d´eriv´ee locale de la mesure et c’est

`

a cette grandeur l`a que l’on tentera d’appliquer quelque th´eorie.

Il suffit d’ajuster localement une fonction lin´eaire : f(x) =c1ix+c0i

`a condition de rester proche de xi. Le χ2 devient local autour du pointxi :

χ2i = X+q k=q

(c1ixk+i+c0i−yi+k)2

o`uqd´etermine la largeur de l’intervalle autour dexio`u ce calcul est fait. Le coefficient c1i est donc la d´eriv´ee locale recherch´ee : un calcul sans difficult´e donne :

c1i = 3

δxq(q+ 1)(2q+ 1) X+q k=q

k yi+k

dans le cas o`u xi =x0+iδx26. ´Evidemment, le r´esultat que l’on trouve d´epend de q : si l’on choisit une valeur de q petite, le r´esultat risque d’ˆetre sensible au bruit, en revanche, si q est trop grand, on perdra les fluctuations rapides (voir la figure 4.20). Il faut choisir autant que pos-sibleqδx<∆xl’ordre de grandeur des variations que l’on cherche `a d´etecter.

Exercice : essayer de calculer ˙m(t) `a partir des donn´ees de mesure. On constatera qu’il faut choisir un intervalle de mesure sensiblement plus court que la dur´ee des vari-ations quotidiennes de la temp´erature : l’id´eal ´etant un enregistrement toutes les heures par exemple.

4.8.5 Lissage : a dirty trick !

Il arrive que les informations int´eressantes d’une exp´erience soient difficilement visibles sur la courbe exp´erimentale obtenue `a cause du bruit. La plupart des logiciels d’acquisition offrent des options desmoothing ou lissage visant `a r´eduire le bruit. Il s’agit d’ajuster locale-ment un polynˆome comme pr´ec´edemment, par exemple un polynˆome d’ordre 2 :

26. Il faut se rappeler au passage queP+q

qk2=q(q+1)(2q+1)

3 .

Figure4.20 – Un cosinus bruit´e, sa d´eriv´ee calcul´ee avec q= 3 et avecq= 10.

Lij =c2iδx2j2+c1iδxj+c0i

mais seul la valeur en xi de l’ajustement local nous int´eresse :

Li0=c0i

car on remplacera les xi par les valeurs liss´ees Li0. `A la suite de calculs sans difficult´e, on obtient, toujours par les mˆemes m´ethodes :

Li0=c0i = J4yi+

Xq k=1

(J4−J2k2)(yi+k+yik)

J0J4−J22 (4.20) o`u

J= Xq j=q

j soit :

J0= 2q+ 1, J2=q(q+ 1)(2q+ 1)

3 ,

J4= q(q+ 1)(2q+ 1)(3q2+ 3q−1) 15

(lesJ pourℓ impair sont bien sˆur tous nuls) et J0J4−J22=q(q+ 1)(2q+ 1)2(4q2+ 4q−3)

45

C’est encore extrˆemement facile `a programmer et rapide

`

a l’ex´ecution. Il faut cependant r´ealiser que 1˚ le r´esultat d´epend deq et 2˚ il ne s’agit en fait que d’une moyenne pond´er´ee de points voisins. Il y a ici une hypoth`ese sous-jacente tr`es importante : c’est que les variations int´eressantes sont de longueur d’onde ou de dimension car-act´eristique grande par rapport aux fluctuations dues au bruit et donc `a l’intervalle balay´e dans l’´equation (4.20).

C’est pour cela qu’il vaut g´en´eralement mieux, sauf pour des raisonscosm´etiques ne pas faire de lissage, et, au contraire, ajuster une fonction physiquement justifi´ee aux r´esultats non liss´es : si l’information int´eressante est l`a et si le mod`ele choisi est susceptible de la r´ev´eler, l’ajustement devrait la faire apparaˆıtre.

70 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan

4.8.6 Ajustement non-lin´ eaire.

Ce qui rend l’ajustement de polynˆomes si simple, c’est que la d´ependance d’un polynˆome par rapport aux param`etres, c’est-`a-dire aux coefficients, est lin´eaire :ax2+ bx+c est une fonction lin´eaire de a, b et c, mˆeme si ce n’est pas une fonction lin´eaire de x. En revanche, on peut vouloir chercher `a ajuster une fonction comme :

L(x) = L0

1 +

x−x0

γ 2

C’est une lorentzienne comme sur la figure 4.21 o`u, comme le montre une analyse ´el´ementaire, L0 est la hauteur de la courbe, x0 la position de son maximum et γ sa demi-largeur `a mi-hauteur. Il est facile de montrer que la lorentzienne est le module au carr´e de la transform´ee de Fourier de eiωtτt et donc la r´eponse spectrale des oscilla-tions amorties, ce qui en fait une courbe tr`es r´epandue en spectroscopie, par exemple optique : la position du som-met de la courbe donne la fr´equence de l’oscillateur et sa largeur, l’amortissement.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

−5 0 5 10

Figure 4.21 – Lorentzienne avecL0= 1,γ= 0.5 etx0= 2.

Les param`etres que l’on veut ajuster sont L0, x0 et γ, or L n’est lin´eaire ni en x0 ni en γ; alors on lin´earise le probl`eme en sachant que le r´esultat ne sera pas correct mais en esp´erant qu’il sera moins mauvais que le point de d´epart et l’on r´ep`ete l’op´eration jusqu’`a ce qu’une so-lution acceptable soit trouv´ee. Il s’agit donc, une fois de plus, de rechercher un minimum de χ2 en fonction de ses param`etres, seulement, il n’y a plus de solution simple, il faut utiliser une m´ethode du type Newton ou gradient conjugu´e avec les pr´ecautions qu’imposent ces m´ethodes : ce n’est pas parce que cela fait partie d’un logiciel tout fait que ces m´ethodes deviennent infaillibles, elles con-servent les d´efauts d´ej`a vus. Si le point de d´epart de la recherche, les param`etres initiaux, est trop ´eloign´e d’une solution, le r´esultat obtenu risque d’ˆetre absurde, si le mod`ele comporte un trop grand nombre de param`etres ajustables (chaque param`etre ajoute une dimension `a l’es-pace de recherche) la signification du r´esultat final risque d’ˆetre assez discutable. . .

Ainsi, lorsqu’on ajuste un mod`ele th´eorique `a une exp´erience, on est donc confront´e `a deux types de diffi-cult´es :

– la recherche du minimum deχ2, il est parfois difficile

de se convaincre que le minimum trouv´e est bien le minimum de la fonction

– le fait que d’avoir trouv´e le minimum deχ2ne valide en aucun cas le mod`ele utilis´e.

Ces mises en garde ne doivent toutefois pas ˆetre vues comme devant dissuader d’utiliser ces outils : il faut les utiliser, ils sont d’une grande puissance ! Parfois, un ajustement difficile ou qui paraˆıt donner des r´esultats dou-teux est une indication qu’un autre mod`ele (pas forc´ement plus compliqu´e, d’ailleurs) serait peut-ˆetre meilleur. Il faut simplement se rappeler que l’ordinateur qui fait le calcul est un serviteur puissant mais. . . stupide ! Au physicien de faire son m´etier et de garder un regard critique.

Il existe, au reste, de bonnes habitudes qui peuvent aider `a ´eviter des m´esaventures. La premi`ere est de tracer sur un mˆeme graphe la courbe th´eorique et les r´esultats exp´erimentaux pour voir si ¸ca ressemble ! L’œil humain est un bon juge en la mati`ere. On peut pousser un peu plus loin en tra¸cant la courbe des ´ecarts entre fonction th´eorique et exp´erience : en principe, on ne devrait voir que du bruit, c’est-`a-dire un signal al´eatoire, sym´etrique

Il existe, au reste, de bonnes habitudes qui peuvent aider `a ´eviter des m´esaventures. La premi`ere est de tracer sur un mˆeme graphe la courbe th´eorique et les r´esultats exp´erimentaux pour voir si ¸ca ressemble ! L’œil humain est un bon juge en la mati`ere. On peut pousser un peu plus loin en tra¸cant la courbe des ´ecarts entre fonction th´eorique et exp´erience : en principe, on ne devrait voir que du bruit, c’est-`a-dire un signal al´eatoire, sym´etrique

Dans le document Licence de physique L3 PHYTEM (Page 66-71)