Modélisation de données expérimentales

Lorsqu’on fait des expériences, il est bien rare que l’on n’utilise pas un logiciel d’acquisition et de traite-ment des données expéritraite-mentales. Ces logiciels proposent généralement des options intitulées par exemple smooth-ing²⁰oucurve fitting²¹ouleast square fit²². L’objectif de ce chapitre est d’expliquer ce que font au juste ces options, comment ¸ca marche, et quelles sont leurs limites. En effet, il ne s’agit pas de magie, contrairement parfois à ce qu’il paraˆıt, mais de bons vieux algorithmes bien pédestres, faciles à comprendre et dont il vaut mieux connaˆıtre les hypothèses sous-jacentes et les petites manies, faute de quoi on a vite fait de faire dire à peu près n’importe quoi aux résultats d’expérience !

4.8.1 Donn´ ees et moindres carr´ es.

4.8.1.1 Quel est le probl`eme ?

Lorsqu’on fait une expérience, on mesure une grandeur yen fonction d’une autre grandeurx, par exemple la pres-sion en fonction de la température p(T), l’intensité lu-mineuse en fonction de sa fréquence ou de sa pulsation I(ω), la position d’un objet en fonction du tempsr(t). . . On peut aussi bâtir une théorie qui prédise la loiy=f(x) et l’on veut savoir si la théorie est juste : cette théorie re-pose sur des hypothèses physiques qui sont ainsi validées ou non. C’est ce qu’on appelle la modélisation, on fait en-trer une expérience dans le cadre d’un modèle.

En général, la loi issue de la théorie dépend aussi de paramètres dits ^≪ ajustables ^≫. Par exemple, on peut imaginer que si l’on mesure une pression de vapeur saturante, la pression puisse s’écrire en fonction de la température de la fa¸con suivante :

P(T) =P0 e⁻^∆E^kT

une loi d’Arrhenius où ∆E est l’énergie qu’il faut fournir pour arracher un atome à la surface de l’échantillon.

Ainsi, cette th´eorie, si elle est juste, donne potentiellement

également une information de type microscopique sur l’échantillon étudié : on aimerait bien savoir évidemment quelle est la valeur de ∆E qui est la plus en accord avec les résultats expérimentaux : ∆E (ainsi que P0) est donc un paramètre ajustable de la théorie parce qu’on n’en con-nait pas la valeur a priori et l’on tentera donc d’ajuster

∆E aux donn´ees exp´erimentales.

Ainsi, il est important de comprendre que l’on est en train de poser, non pas une, mais deux questions dis-tinctes :

1. est-ce la th´eorie marche ?

2. quelles sont les valeurs (et les incertitudes) des param`etres ajustables ?

Il se trouve que les logiciels courants répondent pra-tiquement toujours à la seconde question, mais pas à la première : cela vaut donc la peine de regarder d’un peu plus près comment ¸ca marche !

20. Lissage.

21. Ajustement de courbe.

22. Ajustement de moindre carr´e.

4.8.1.2 L’hypoth`ese de d´epart.

En pratique, l’on relève, pour n points de mesures {xi, i = 1, n}, les n valeurs {yi, i = 1, n} correspon-dantes. Mettons que l’on ait une théorie qui donne y en fonction dexet d’un certain nombre de paramètres ajusta-blesp1, . . . , pm:

y=f(x, p1, . . . , pm) =f(x,{pj})

Ce qui nous intéresse, ce sont les écarts entre lesyimesurés et lesf(xi,{pj}) calculés à l’aide de la théorie. On définit ainsi :

χ²({pj}) = Xn i=1

(f(xi,{pj})−yi)²

On cherchera alors l’ensemble de paramètres {pj} qui rendra χ² le plus petit possible : c’est pour cela que la méthode s’appelle ^≪ méthode de moindres carrés ^≫, puisqueχ²est la somme des carrés des écarts entre théorie et mesures.

On aurait pu choisir autre chose que la somme des carrés des écarts, par exemple la somme des valeurs absolues ou le sup des carrés. . . Le choix fait ici, ainsi que dans la quasi-totalité des programmes, repose sur une hypothèse qu’il faut expliciter.

Imaginons que l’on fasse un grand nombre de fois la mesure dey pour une même valeur dex: on ne trouvera pas la même valeur de y pour toutes les mesures mais une distribution parce que la mesure n’est pas parfaite, il y a des incertitudes, il y a des vibrations dans le sol, le détecteur utilisé produit du bruit, l’électronique produit

´egalement du bruit. . .

L’hypothèse qui mène à l’expression deχ²ci-dessus est que cette distribution est gaussienne, centrée autour dey0

avec un ´ecart-typeσ:

p(y) = e⁻^(y−y^{0 )}

2 2σ2

a un coefficient de normalisation près²³. Il se trouve que pour un très grand nombre d’expériences, le théorème de la limite centrale (valable pour les grands nombres) impose que cette condition soit vérifiée. Toutefois, il faut faire attention que des détecteurs très sensibles peuvent être capables de répondre à un nombre de^≪coups^≫très faible pour lequel ce genre de théorème n’est plus valable. Les méthodes décrites ici ne sont alors plus en toute rigueur directement utilisables.

4.8.2 Ajustement d’une fonction lin´ eaire.

4.8.2.1 Sans les incertitudes.

Prenons pour commencer le cas le plus simple : y = ax+b o`u les deux param`etres ajustables sont aet b. On cherche doncaet btels que

χ²= Xn i=1

(axi+b−yi)²

23. ¹

σ√ 2π.

soit minimum. Il faut donc que les dérivées deχ²par rap-port aux deux paramètres soient nulles :

 Quelques lignes de calculs sans difficult´e donnent :



Lire dans un fichier lesnvaleurs dexet deyet faire ce calcul pour obtenir l’équation de la droite est extrêmement simple (c’est d’ailleurs un petit exercice de programmation conseillé²⁴) : on comprend que les éditeurs de logiciels ne se privent pas de l’inclure dans leurs productions.

4.8.2.2 Avec les incertitudes.

Il y a une faiblesse criante dans ce que nous avons fait jusqu’à présent : on ne voit nulle part d’incertitude ! Ad-mettons donc que chaque mesure (xi, yi) soit affectée d’une incertitudeσi. On doit alors redéfinirχ² de fa¸con qu’une mesure^≪ compte^≫ d’autant plus que son incertitude est petite :

Dans le cas de la fonction linéaire cela s’écrit évidemment : χ²=

Xn i=1

(axi+b−yi)² σ²_i

Un calcul à peine plus compliqué que précédemment donne de la même fa¸con les expressions deaet deb.

On peut alors introduire le ^≪ facteur de confiance pond´er´e^≫ ouweighed reliability factor :

Rw=

c’est un écart quadratique ramené à la moyenne des carrés de la fonction. Il s’exprime en général en % : siRwvaut par exemple 10%, cela signifie en gros que la fonction théorique est éloignée de 10% des valeurs expérimentales, en unités deσ.

Ce que l’on aimerait avoir, c’est l’incertitude sur aetb puisque ce sont les r´esultats de tous ces calculs. Posons :

ei=f(xi,{pj})−yi

24. Il est prudent de travailler en double précision à cause des dénominateurs.

c’est l’écart entre théorie et expérience pour le pointi. Si l’on estime que cet écart est entièrement dû au paramètre n˚1, on obtient

une majoration de l’incertitude δp1 sur le premier param`etre, or

et en généralisant ceci à tous les paramètrespj : δpj=

C’est ce que l’on appelle ^≪ déviations standards es-timées ^≫ (estimated standard deviations ou esd) et ce sont des estimations de majorants aux incertitudes sur les paramètres.

Dans le cas d’une fonction linéaire, évidemment, ces for-mules se simplifient aisément, mais elles s’appliquent²⁵ aux autres cas aussi.

4.8.2.3 Exercice pratique et divertissant.

-´Etape n˚1 : remplir une coupelle en plastique ou un pot de yaourt ou de petit suisse vide avec un peu d’eau.

-Étape n˚2 : poser la coupelle ou le pot de yaourt sur un pèse-lettres et l’ensemble (précautionneusement) sur un radiateur.

-Étape n˚3 : pendant une semaine ou plus, relever plusieurs fois par jour le temps écoulé depuis le début de l’expérience et la masse indiquée par le pèse-lettre. Mettre ces données expérimentales dans un fichier.

-Étape n˚4 : faire une hypothèse physique. Puisque la température du radiateur peut être considérée en première approximation comme constante, la vitesse d’évaporation de l’eau peut être considérée comme constante et donc la masse d’eau restante s’exprimer comme une fonction linéaire du temps :

m(t) = ˙m t+m0

o`u, donc, ˙met m0 sont des constantes.

-Étape n˚5 : déterminer ˙m et m0 selon les méthodes ci-dessus, ainsi que les déviations standards. Tracer les courbes expérimentale et théorique sur un même graphe ainsi que les écarts entre courbe théorique et expérimentale.

-´Etape n˚6 : s’interroger sur les r´esultats obtenus.

-Étape n˚7 : changer la valeur affichée sur le thermostat et recommencer l’expérience.

-´Etape n˚8 : tracer la courbe ˙m(T) pour 253< T <333K.

4.8.2.4 Une g´en´eralisation possible.

Ces méthodes qui ont le grand mérite d’être simples et faciles à programmer ne sont pas limitées strictement aux

25. On n’ose parler devalidit´e!

68 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan

fonctions lin´eaires. Reprenons l’exemple de la loi d’Arrhe-nius :

P =P0e⁻^∆E^kT Si l’on fait les changements de variable :

y= lnP x=− 1 kT on obtient

y= ∆E x+ lnP0

où ∆E et lnP0tiennent le rôle deaetbdans le problème précédent. Ainsi, si l’on peut exprimer le problème de la fa¸con suivante :

g(y) =a h(x) +b

où g et h sont des fonctions connues sans paramètre ajustable (ici, k est la constante de Boltzmann, connue), tout ce qui est ci-dessus est utilisable sans difficulté.

4.8.2.5 Un caveat.

Figure 4.19 – L’ajustement d’une fonction linéaire à des données aléatoires donne un résultat. Ici : 0.79875− 0.24841×x. Quel sens donner à ces nombres ? Aucun !

Malheureusement, tout ceci est un peu trop beau. En effet il suffit de considérer les équations de ce chapitre pour constater que ces méthodes donneront toujours un résultat, si absurde soit-il. La figure 4.19 montre l’ajuste-ment d’une droite sur un nuage de points aléatoires.

On obtient des nombres.

Ces nombres n’ont, bien sˆur, aucun sens.

Moralité : ce n’est pas parce qu’un programme d’ajuste-ment donne un résultat que le modèle est validé et que les paramètres qu’il donne sont bons.

Il ne faut pas oublier d’être physicien : quand on ajuste un modèle, c’est qu’on pense qu’il est adapté, puis on doit discuter les valeurs obtenues pour les paramètres en les considérant comme des grandeurs physiques et en se posant par exemple la question des conséquences qu’entraˆınent les valeurs obtenues. Si, par exemple, dans le cas de la loi d’Arrhenius, on trouve ∆E ∼ 10⁶ joules (au lieu de quelques eV), on est en droit de se demander si l’on a bien mesuré de la sorte l’énergie pour arracher un atome d’une surface comme on le pensait initialement.

4.8.3 Ajustement d’un polynˆ ome.

On peut généraliser facilement les équations du para-graphe 4.8.2.1 au cas d’un polynôme de degrép:

P(x) =c0+c1x+c2x²+. . .+cpx^p= Xp j=0

cjx^j On cherche, bien sˆur, lesp+ 1 coefficientscj, et donc,

∂χ²

∂cj

= ∂

∂cj





 Xn i=1

Xp k=0

ckx^k_i −yi

σ_i²







= 0

Il est ais´e de se rendre compte que si l’on pose :











Ajk = Xn i=1

x^j+k_i σ_i² Bj =

Xn i=1

yix^j_i σ_i²

le problème se ramène à la résolution d’un système linéaire (p+ 1)×(p+ 1) :

A·C=B avec des notations ´evidentes. De plus :

Rw= vu uu ut

χ² Xn i=1

P(xi)² σ² et :

δck= s

χ² Akk

Les g´en´eralisations du type : g(y) =P(h(x))

o`u g et h sont des fonctions connues sont ´evidemment possibles.

A condition de disposer d’un sous-programme de` résolution de systèmes linéaires, tout ceci est très simple à programmer, ¸ca marche très bien et c’est rapide car il n’y a pas à converger plus ou moins laborieusement vers une solution.

Alors, s’agit-il du programme ^≪ résout tout problème, marche à tout coup^≫? Poser la question est évidemment un début de réponse.

Revenons au pot de yaourt du paragraphe 4.8.2.3.

Il est probable que l’ajustement d’une fonction linéaire laissera des écarts entre cette fonction et les données expérimentales : faut-il alors prendre un polynôme de degré plus élevé ? Il est clair que l’ajustement en sera meilleur : à la limite, si l’on prend un degré égal au nombre de points moins un,p=n−1, on obtiendra un polynôme passant par tous les points expérimentaux ! Mais les coef-ficients ainsi introduits ont-ils un sens physique ? Non !

Il faut d’abord se poser des questions physiques. Par exemple, y a-t-il une raison pour laquelle le mod`ele choisi ne conviendrait pas ? Comme le thermostat a un cycle de 24 heures car on chauffe moins la nuit, ne pourrait-on pas

plutôt introduire cette périodicité dans le problème ? On pourrait tenter quelque chose comme

m= ¯˙m+µsin 2πt τ

Evidemment, c’est plus difficile parce qu’il ne s’agit plus´ d’un polynôme et il faudra recourir aux méthodes du para-graphe 4.8.6, mais c’est peut-être plus réaliste, puisque ¯˙m devient alors la vitesse moyenne d’évaporation et µ l’am-plitude des variations périodiques. On peut même aller un peu plus loin en remarquant que ˙mest sans doute propor-tionnel à la pression laquelle obéit probablement à une loi d’Arrhenius en fonction de la température. . .

4.8.4 D´ eriv´ ee locale d’une courbe exp´ erimentale.

On peut aussi prendre la question différemment : l’in-connue ^≪ intéressante ^≫ de l’expérience est la vitesse d’évaporation ˙m : c’est cela que l’on cherche à mesurer.

On voudrait calculer la d´eriv´ee locale de la mesure et c’est

a cette grandeur l`a que l’on tentera d’appliquer quelque th´eorie.

Il suffit d’ajuster localement une fonction lin´eaire : f(x) =c1ix+c0i

`a condition de rester proche de xi. Le χ² devient local autour du pointxi :

χ²_i = X+q k=−q

(c1ixk+i+c0i−yi+k)²

oùqdétermine la largeur de l’intervalle autour dexioù ce calcul est fait. Le coefficient c1i est donc la dérivée locale recherchée : un calcul sans difficulté donne :

c1i = 3

δxq(q+ 1)(2q+ 1) X+q k=−q

k yi+k

dans le cas où xi =x0+iδx26. Évidemment, le résultat que l’on trouve dépend de q : si l’on choisit une valeur de q petite, le résultat risque d’être sensible au bruit, en revanche, si q est trop grand, on perdra les fluctuations rapides (voir la figure 4.20). Il faut choisir autant que pos-sibleqδx<∆xl’ordre de grandeur des variations que l’on cherche à détecter.

Exercice : essayer de calculer ˙m(t) à partir des données de mesure. On constatera qu’il faut choisir un intervalle de mesure sensiblement plus court que la durée des vari-ations quotidiennes de la température : l’idéal étant un enregistrement toutes les heures par exemple.

4.8.5 Lissage : a dirty trick !

Il arrive que les informations intéressantes d’une expérience soient difficilement visibles sur la courbe expérimentale obtenue à cause du bruit. La plupart des logiciels d’acquisition offrent des options desmoothing ou lissage visant à réduire le bruit. Il s’agit d’ajuster locale-ment un polynôme comme précédemment, par exemple un polynôme d’ordre 2 :

26. Il faut se rappeler au passage queP+q

−qk²=q(q+1)(2q+1)

3 .

Figure4.20 – Un cosinus bruité, sa dérivée calculée avec q= 3 et avecq= 10.

Lij =c2iδx²j²+c1iδxj+c0i

mais seul la valeur en xi de l’ajustement local nous int´eresse :

Li0=c0i

car on remplacera les xi par les valeurs lissées Li0. À la suite de calculs sans difficulté, on obtient, toujours par les mêmes méthodes :

Li0=c0i = J4yi+

Xq k=1

(J4−J2k²)(yi+k+yi−k)

J0J4−J₂² (4.20) o`u

Jℓ= Xq j=−q

j^ℓ soit :

J0= 2q+ 1, J2=q(q+ 1)(2q+ 1)

3 ,

J4= q(q+ 1)(2q+ 1)(3q²+ 3q−1) 15

(lesJℓ pourℓ impair sont bien sˆur tous nuls) et J0J4−J₂²=q(q+ 1)(2q+ 1)²(4q²+ 4q−3)

C’est encore extrˆemement facile `a programmer et rapide

a l’exécution. Il faut cependant réaliser que 1˚ le résultat dépend deq et 2˚ il ne s’agit en fait que d’une moyenne pondérée de points voisins. Il y a ici une hypothèse sous-jacente très importante : c’est que les variations intéressantes sont de longueur d’onde ou de dimension car-actéristique grande par rapport aux fluctuations dues au bruit et donc à l’intervalle balayé dans l’équation (4.20).

C’est pour cela qu’il vaut généralement mieux, sauf pour des raisons^≪cosmétiques^≫ ne pas faire de lissage, et, au contraire, ajuster une fonction physiquement justifiée aux résultats non lissés : si l’information intéressante est là et si le modèle choisi est susceptible de la révéler, l’ajustement devrait la faire apparaˆıtre.

70 Licence de physique L3 : PHYTEM, Universit´e Pierre et Marie Curie Paris-6 & ENS-Cachan

4.8.6 Ajustement non-lin´ eaire.

Ce qui rend l’ajustement de polynômes si simple, c’est que la dépendance d’un polynôme par rapport aux paramètres, c’est-à-dire aux coefficients, est linéaire :ax²+ bx+c est une fonction linéaire de a, b et c, même si ce n’est pas une fonction linéaire de x. En revanche, on peut vouloir chercher à ajuster une fonction comme :

L(x) = L0

1 +

x−x0

γ 2

C’est une lorentzienne comme sur la figure 4.21 où, comme le montre une analyse élémentaire, L0 est la hauteur de la courbe, x0 la position de son maximum et γ sa demi-largeur à mi-hauteur. Il est facile de montrer que la lorentzienne est le module au carré de la transformée de Fourier de eîωt⁻^τ^t et donc la réponse spectrale des oscilla-tions amorties, ce qui en fait une courbe très répandue en spectroscopie, par exemple optique : la position du som-met de la courbe donne la fréquence de l’oscillateur et sa largeur, l’amortissement.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

−5 0 5 10

Figure 4.21 – Lorentzienne avecL0= 1,γ= 0.5 etx0= 2.

Les paramètres que l’on veut ajuster sont L0, x0 et γ, or L n’est linéaire ni en x0 ni en γ; alors on linéarise le problème en sachant que le résultat ne sera pas correct mais en espérant qu’il sera moins mauvais que le point de départ et l’on répète l’opération jusqu’à ce qu’une so-lution acceptable soit trouvée. Il s’agit donc, une fois de plus, de rechercher un minimum de χ² en fonction de ses paramètres, seulement, il n’y a plus de solution simple, il faut utiliser une méthode du type Newton ou gradient conjugué avec les précautions qu’imposent ces méthodes : ce n’est pas parce que cela fait partie d’un logiciel tout fait que ces méthodes deviennent infaillibles, elles con-servent les défauts déjà vus. Si le point de départ de la recherche, les paramètres initiaux, est trop éloigné d’une solution, le résultat obtenu risque d’être absurde, si le modèle comporte un trop grand nombre de paramètres ajustables (chaque paramètre ajoute une dimension à l’es-pace de recherche) la signification du résultat final risque d’être assez discutable. . .

Ainsi, lorsqu’on ajuste un modèle théorique à une expérience, on est donc confronté à deux types de diffi-cultés :

– la recherche du minimum deχ², il est parfois difficile

de se convaincre que le minimum trouv´e est bien le minimum de la fonction

– le fait que d’avoir trouvé le minimum deχ²ne valide en aucun cas le modèle utilisé.

Ces mises en garde ne doivent toutefois pas être vues comme devant dissuader d’utiliser ces outils : il faut les utiliser, ils sont d’une grande puissance ! Parfois, un ajustement difficile ou qui paraˆıt donner des résultats dou-teux est une indication qu’un autre modèle (pas forcément plus compliqué, d’ailleurs) serait peut-être meilleur. Il faut simplement se rappeler que l’ordinateur qui fait le calcul est un serviteur puissant mais. . . stupide ! Au physicien de faire son métier et de garder un regard critique.

Il existe, au reste, de bonnes habitudes qui peuvent aider à éviter des mésaventures. La première est de tracer sur un même graphe la courbe théorique et les résultats expérimentaux pour voir si ¸ca ressemble ! L’œil humain est un bon juge en la matière. On peut pousser un peu plus loin en tra¸cant la courbe des écarts entre fonction théorique et expérience : en principe, on ne devrait voir que du bruit, c’est-à-dire un signal aléatoire, symétrique

Dans le document Licence de physique L3 PHYTEM (Page 66-71)