• Aucun résultat trouvé

Erreur

N/A
N/A
Protected

Academic year: 2022

Partager "Erreur"

Copied!
14
0
0

Texte intégral

(1)

Note : Le texte qui suit est un résumé du fascicule : Le calcul des erreurs de Claude Allain, Département de physique, Collège Lionel Groulx.

À la suite de toute mesure physique, on doit exprimer le résultat sous une forme permet- tant d’en apprécier la précision. Pour améliorer cette précision, il est nécessaire de bien comprendre d’où peuvent provenir les erreurs, quelles relations elles ont entre elles et com- ment elles se propagent lors d’un calcul complexe.

Ce petit guide renferme des notions de base relatives au calcul d’erreur. En consultant les références énumérées à la fin vous pourrez vous familiariser avec des méthodes beaucoup plus sophistiquées que celles qui seront présentées ici.

1 Types d’erreurs

Lors de la prise des données, deux types d’erreurs sont susceptibles de se produire : les erreurs systématiques et les erreurs aléatoires.

1.1 Erreurs systématiques

Ces erreurs sont généralement dues à des causes identifiables. Elles mènent à des valeurs mesurées qui sont systématiquement toujours trop grandes ou trop petites. Elles sont de quatre types :

a) Erreurs instrumentales

Un instrument mal calibré comme un voltmètre indiquant 1.2 volts alors que la tension à ses bornes n’est que de 1 volt. Ce genre de voltmètre fournit une erreur systématique sur les tensions mesurées.

b) Erreurs d’observation

Une erreur de parallaxe lors de la lecture sur une règle.

(2)

c) Erreurs dues à l’environnement

Une défaillance du niveau de la tension du secteur peut affecter la stabilité et le bon fonctionnement de certains appareils.

d) Erreurs théoriques

La simplification de modèles où certains des paramètres ont été négligés.

1.2 Erreurs aléatoires

Les erreurs aléatoires sont des fluctuations positives et négatives qui font que 50% des valeurs mesurées sont trop grandes et 50% sont trop faibles. Les sources de ces erreurs sont souvent difficiles à identifier. On peut cependant diviser ce type d’erreur en deux catégories soient :

a) Erreurs d’observation

Par exemple, les erreurs de jugement d’un observateur prenant des lectures sur un instrument de mesure.

b) Erreurs environnementales

Les fluctuations imprévisibles d’une source de tension, de la température ou des vibrations des appareils de mesure.

Ces erreurs aléatoires peuvent cependant être quantifiées par une analyse mathématique appropriée.

2 Erreur absolue

L’erreur absolue sur une mesure est la différence entre la valeur approchée adoptée comme résultat et la valeur exacte. Dans la majorité des cas, la valeur exacte est inconnue. On peut alors prendre un grand nombre de mesures et calculer la moyenne. On supposera que plus le nombre de mesures effectuées sera grand, plus la moyenne s’approchera de la valeur exacte.

2.1 Rappel sur la distribution normale

On peut monter qu’en présence d’une ou plusieurs sources d’erreurs fortuites, la distri- bution des résultats d’une expérience ressemble à ceci :

(3)

x x

Figure 1: Distribution Gaussienne.

Mathématiquement, on peut montrer[1] que pour un très grand nombre de mesures, on obtient une distribution normale (ou Gaussienne) donnée par l’équation

N(x) =N0e−b(x−¯x)2

On remarque que pour un très grand nombre de mesures, les valeurs obtenues ont tendance à se regrouper symétriquement autour de la moyenne arithmétique de toutes les valeurs (¯x). Il convient donc d’adopter cette moyenne arithmétique comme meilleure valeur de la quantité mesurée.

2.2 L’écart-type et sa signification

Afin d’évaluer l’incertitude sur une moyenne, nous pouvons utiliser différentes méthodes.

Supposons le cas où le nombre de mesures est très petit et que l’on obtient la distribution suivante :

nbre de fois qu’une quantité x

x est mesurée

x

Figure2: Distribution incomplète.

nous devrions prendre les valeurs extrêmes pour définir notre incertitude sur ¯x.

Dans le cas où le nombre de mesures est très grand, et que l’on s’approche d’une distribution normale, les valeurs extrêmes ne constituent plus une bonne approximation de l’incertitude.

Si tel était le cas, nous pourrions constater que plus le nombre de mesures augmente, plus les valeurs extrêmes risquent de s’éloigner de la moyenne ; cela signifierait alors que la précision diminuerait quand le nombre de mesures augmente, ce qui n’est pas cohérent.

(4)

La distribution normale est caractérisée par deux grandeurs : sa valeur moyenne ¯x, par laquelle passe l’axe de symétrie de la courbe, et l’écart-type σ qui indique l’étalement de la courbe autour de la valeur de ¯x.

σ

> 1 σ2 σ1

x

Figure 3: Distributions Gaussiennes.

On peut démontrer que les valeurs comprises entre ¯xσ et ¯x+σ englobent 68% de la surface sous la courbe. De même les valeurs comprises entre et ¯x−2σet ¯x+ 2σ en englobent 95.5%.

x 68%

95% x+σ x-σ x+2σ x-2σ

Figure 4: Signification de l’écart-type.

Il semble donc raisonnable, lorsqu’on dispose d’un ensemble de mesures qui suivent une distribution normale, de prendre la valeur de σ comme incertitude. Cela revient à dire que si nous effectuons une seule mesure de la quantitéx, nous avons 68% des chances que cette mesure soit comprise entre xσ etx+σ .

Exemple :

Supposons que l’on veuille mesurer l’accélération gravitationnelleg au moyen d’un pen- dule simple de longueur L. On mesure un grand nombre de fois la longueur et on constate que toutes les valeurs sont comprises entre 39.40 et 39.52 cm. On mesure ensuite un grand

(5)

nombre de fois la période T d’oscillation et on constate que toutes les valeurs se situent entre 1.257 et 1.265 seconde. On a éliminé les erreurs systématiques, ou du moins on le croit, et on veut, à partir de ces deux résultats, calculer g. On sait que T = 2πqLg, donc que g = T22L. Les questions sont : comment évaluer les erreurs sur L et T, et comment combiner les résultats de ces deux opérations distinctes pour obtenir l’erreur surg? Nous allons supposer que l’erreur sur chaque mesure est purement aléatoire et qu’il y a autant de chances que, de toutes les mesures, 50% soient plus grandes et 50% plus petites que la valeur exacte. Nous supposerons également que la courbe du nombre de fois que l’on rencontre la même période suit une distribution Gaussienne.

1.000 1.500 200

400

période T (sec) fréquence

Tmoy = 1.2605

Figure5: Fréquence des événements en fonction de la période.

Nous calculerons l’écart-type qui mesure la précision de l’appareil et nous ajouterons un facteur qui dépendera du nombre restreint de mesures effectuées et de la justesse des appa- reils utilisés. Cet écart-type corrigé sera notéS. On écrira doncT = 1.2605±SS pourra être, comme dans l’exemple précédent, égal à±0.0013 seconde. DoncT = (1.2605±0.0013) seconde.

3 Erreur relative

L’erreur relative est le quotient du nombre qui exprime l’erreur absolue par le nombre qui exprime la valeur exacte. Cette erreur est habituellement donnée en pourcentage. Encore ici, si on ne connaît pas la valeur exacte, on prendra la valeur moyenne qui résulte d’un grand nombre de mesures. Dans l’exemple précédent, on a trouvéTmoy = 1.2605 sec. et son erreur absolue S = ∆T =±0.0013 sec. Ceci veut dire que, statistiquement parlant, si le nombre de mesures est grand, on a 68.3% des chances pour que la période exacte soit comprise entre (1.2605−0.0013) sec. et (1.2605 + 0.0013) sec. Nous dirons que l’erreur relative sur la période est :

(6)

S

T = ∆T

T = 0.0013

1.2605×100 = 0.10%

Vous remarquerez que l’erreur absolue, comme l’erreur relative, est indiquée avec au plus deux chiffres significatifs. Ordinairement, on n’en mettra qu’un pour la bonne raison que ces erreurs sont évaluées à partir des statistiques basées sur un nombre limité de mesures et qu’écrire 0.11% ou 0.12% au lieu de 0.10% ne change pas grand chose à l’appréciation du résultat ; cela indique seulement que pour un très grand nombre de mesures, le fait de passer d’une erreur de 0.0013 sec. à 0.0026 sec. fait passer la chance de 68.3% à 95.5% pour que la valeur moyenne±cette erreur absolue doublée contienne la valeur exacte.

Note : Dans le cas où le nombre de mesures est très restreint, on parle de l’incertitude absolue comme étant la valeur la plus grande que peut avoir l’erreur absolue, et de l’incertitude relative comme étant le rapport de l’incertitude absolue à la valeur exacte.

4 Calcul de l’erreur absolue S

4.1 Moyenne arithmétique x¯

Supposons que la quantité x a été mesuréen fois (x1, x2, ...xn) ; alors la moyenne arithmé- tique xest donnée par

x¯= x1+x2+...+xn

n ou encore x¯= Pn i=1

xi

n (1)

Cette moyenne s’approchera d’autant plus de la valeur exacte que le nombren sera grand.

4.2 Écart-type (σ)

L’écart-type est lui aussi d’autant mieux évalué que le nombre n de mesures est grand et que la courbe des fréquences est gaussienne. Il donne une appréciation de la précision de la mesure de la moyenne x à partir des mesures individuelles xi.

σ=

"

(x1x)¯ 2+ (x2x)¯ 2+...+ (xnx)¯ 2 n

#1/2

(2) ou encore

σ =

n

P

i=1

(xix)¯ 2 n

1/2

(3) Par contre, pour donner une bonne appréciation de ¯xquandnest petit,σ n’est pas adéquat, car si n= 1, alors xi =x1 =x etσ= 0. Or on sait bien qu’une seule mesure comporte des erreurs aléatoires et qu’elle peut être relativement différente de la véritable valeur expéri- mentale. Par conséquent,σ ne peut être nul. On devra donc définir un écart type ajusté qui tiendra compte du nombre restreint de mesures.

(7)

4.3 Écart-type ajusté S

σ =

n

P

i=1

(xix)¯ 2 n−1

1/2

(4) On voit ici que si n est très grand, S tend vers σ. S sera la meilleure estimation de la précision de la mesure de la moyenne x à partir des mesures individuelles xi pour les cas normaux où nn’est pas tellement grand.

Sin= 1, alorsS = 0/0 et il est indéterminé, ce qui correspond davantage à la réalité.

4.4 Erreur sur la valeur moyenne (écart-type d’une moyenne)

Nous avons vu précédemment comment calculer l’écart-type d’une population (ensemble de résultats). Cet écart-type nous donne une idée de la précision obtenue sur l’évaluation de la valeur moyenne. Cependant, ceci ne réflète pas l’erreur sur la moyenne ! Prenons le cas où l’on effectue 50 ensembles de 20 mesures chacun. Les distributions de la population (des résultats obtenus) et des valeurs moyennes (obtenues pour chaque groupe de mesure) sont présentées cidessous.

σ

x

50 mesures de 20 échantillons

distribution des populations

distribution des moyennes

100 mesures de 20 échantillons

x

σm

σ

Figure 6: Effets du nombre de mesures.

Supposons maintenant que l’on augmente le nombre de séries de mesures à 100. La distri- bution de la population ne changera presque pas, de même que la valeur de l’écart-type.

Par contre, la distribution des moyennes va se resserrer autour de ¯x. C’est-à-dire que l’er- reur sur la moyenne va diminuer au fur et à mesure que le nombre de données augmente.

Mathématiquement, ceci s’exprime de la façon suivante.

Pour un échantillon de n mesures d’une population caractérisée par σ, l’écart-type des

(8)

moyennesσn (ou l’erreur sur la moyenne) est donné par la relation

σn=

Pn i=1

(xix)¯ 2 n2

1/2

5 Propagation des erreurs

Essayons maintenant de calculer la valeur de l’accélération gravitationnelle g à partir de mesures de la longueur L et de la périodeT d’un pendule simple. On sait que

g= 4π2L T2

Si l’on effectue, dans les mêmes conditions, plusieurs mesures deL et deT, on trouvera les valeurs moyennes L et T . L’expression pour calculer g peut être développée en série de Taylor puisque, pour une petite variation sur L, ∆L et surT, ∆T, correspond une petite variation surg, ∆g. Donc,

g+ ∆g=g+∂L∂g∆L+∂T∂g∆T+12h(∆L)2 ∂L2g2 + 2∆L∆T∂L∂T2g + (∆T)2 ∂T2g2

i +

1 6

h

(∆L)3∂L3g3 + 3 (∆L)2∆T∂L23∂Tg + 3∆L(∆T)2∂L∂T3g2 + (∆T)3∂T3g3

i

+... (5)

Or comme ∆Let ∆T sont petits, tous les termes (∆L)2, (∆T)2, (∆L)3, (∆T)3, ..., ∆L∆T, (∆L)2∆T, ∆L(∆T)2, ..., sont plus petits que les termes ∆L et ∆T, ou contiennent des quantités qui ont autant de chances d’être positives que négatives et qui, en moyenne, tendent à s’annuler. L’expression précédente revient, dans le pire des cas, à la suivante :

∆g=

∂g

∂L∆L

+

∂g

∂T∆T

(6) Sans entrer dans les développements statistiques[[2]], on peut montrer que la probabilité que toutes les erreurs s’additionnent pour donner la valeur la plus grande de g est faible et que l’expression correcte est

(∆g)2= ∂g

∂L∆L 2

+ ∂g

∂T∆T 2

(7)

∂L∂g signifie qu’on dérive g par rapport à L en considérant alors T comme constante.

Même remarque pour ∂T∂gT est alors considérée comme constante.

Important : C’est l’expression (7) qui est l’expression correcte pour calculer l’erreur totale. On utilise fréquemment l’expression (6), qui est très rapide à calculer, pour avoir une idée de la borne supérieure à la marge d’erreur anticipée.

En règle générale, si on veut calculer ∆Goù G est une fonction deM1, M2, ..., Mr, alors, on montre que

(9)

∆G=

" ∂G

∂M1∆M1

2

+ ∂G

∂M2∆M2

2

+...+ ∂G

∂Mr∆Mr

2#1/2

(8) Ceci est l’équation de base utilisée pour calculer la propagation des erreurs.

5.1 Addition et soustraction de mesures

Supposons que l’on veuille obtenir, à partir des mesures dex,y etz, la valeur deW

W =ax+by+cz (9)

a,betc sont des constantes positives ou négatives. On calcule alors

∆W = q

(a∆x)2+ (b∆y)2+ (c∆z)2 (10)

Exemple 1 : Supposons que l’on désire calculer l’erreur associée à la quantitéL suivante : L=l1+l2+l3

où l’on a que

l1±∆l1 = 23.5±0.1 cm l2±∆l2 = 17.8±0.2 cm l2±∆l3 = 93.9±0.2 cm alors à l’aide de l’équation (8) on trouve que

L±∆L= 135.2±0.3 cm Exemple 2 : Supposons les deux intervalles de temps suivants :

t1±∆t1 = 0.743 sec. ±0.005 sec.

t2±∆t2 = 0.384 sec. ±0.005 sec.

Si le temps total t est défini par

t= 2t1+ 5t2 alors on trouve que

t±∆t= 3.406±0.013 sec.

5.2 Multiplication et division de mesures Soit la fonction suivante :

W =kxaybzc (11)

k,a,betc sont des constantes. Afin de trouver l’erreur ∆W, on utilise l’équation (8) :

∆W =

kaxa−1ybzc2(∆x)2+kxabyb−1zc2(∆y)2+kxaybczc−12(∆z)2 1/2

(12)

(10)

Cette équation devient plus facile à utiliser si l’on divise chaque côté par W et que l’on remplaceW parkxaybzcdans le membre de doite, ce qui donne

∆W

W = 1

kxaybzc

kaxa−1ybzc2(∆x)2+kxabyb−1zc2(∆y)2+kxaybczc−12(∆z)2 1/2

En portant 1/kxaybzc au carré, et en le mettant sous le radical, on obtient après simplifi- cation que

∆W

W =

s a∆x

x 2

+ b∆y

y 2

+ c∆z

z 2

(13) Et finalement,

∆W =W s

a∆x x

2

+ b∆y

y 2

+ c∆z

z 2

(14) On remarque que chacun des termes sous le radical de (14) est sans dimension. Au laboratoire, on peut rapidement faire une estimation rapide de ∆W dans le cas où une des erreurs fractionnelles. Supposons que b∆yy est beaucoup plus grande que les autres ; dans ce cas,

∆W ≈W b∆y

y (15)

Exemple 1 : Supposons que l’on doive calculer la force gravitationnelle F = Gmr12m2

à partir des données suivantes :

m1±∆m1= 19.7±0.2 kg m2±∆m2= 9.4±0.2 kg r±∆r= 0.641±0.009m Alors,

F = 3.0×10−8N et

∆F =F s

∆m1 m1

2

+

∆m2 m2

2

+

−2∆r r

2

(16)

= 1.10×10−9N

Le résultat complet est donc F±∆F = (3.0±0.1)×10−8N.

Exemple 2 : Supposons que l’on doive utiliser la formule de Snell-Descartes pour calculer l’indice de réfraction du verreng.

ng = sinθ1

sinθ2 (17)

(11)

On utilise les valeurs suivantes : n1= indice de réfraction de l’air = 1.000 θ1±∆θ1 = 61±2o

θ2±∆θ2 = 36±1o

Alors on trouve ng = 1.5 et comme ng ne peut pas être exprimé directement sous la forme d’une somme ou d’un produit, on utilisera l’équation (8) directement :

∆ng = s

∂ng

∂θ1∆θ1 2

+ ∂ng

∂θ2∆θ2 2

(18)

∆ng = s

n1cosθ1 sinθ2

∆θ1

2

+

n1sinθ1cosθ2 sin2θ2

∆θ2

2

(19) où ∆θ1 et ∆θ2 se doivent d’être des quantités sans dimensions (radians). En divisant de chaque côté parng et en substituant du côté droitng parn1sinθ1/sinθ2 , on trouve que

∆ng ng

= s

cosθ1 sinθ1

∆θ1 2

+

cosθ2 sinθ2

∆θ2 2

(20) En évaluant cette expression, on obtient le résultat suivant :

∆ng = 0.0490 En arrondissant correctement, on obtient le résultat final :

ng±∆ng = 1.5±0.1

6 La régression linéaire

6.1 Technique de calcul

Cette technique permet de trouver, à partir des mesures dexi etyi, la meilleure droite qui obéit à l’équation :

y=ax+b (21)

et qui représente le mieux tous les points provenant de l’expérience. Cette technique est basée sur le principe des moindres carrés, qui accorde beaucoup moins d’importance aux points éloignés de la droite à tracer qu’aux points rapprochés. Elle permet d’établir des équations qui nous permettent de calculer les valeurs des meilleures estimations pour a et b, ainsi que des écarts-types de ces estimationsS(a) etS(b).

Simplifions le problème en supposant que toutes les valeurs des mesures des xi sont plus précises que celles des yi. Par la méthode des moindres carrés, la somme des distances verticales au carré des pointsyi à la ligne qu’on veut tracer doit être un minimum.

(12)

Y

i=1 i

n 2

A1 A2

X A3

Σ A = minimum

Figure7: Méthode des moindres carrés.

On peut montrer que[2]

a=

n

n

P

i=1

xiyiPn

i=1

xi n

P

i=1

yi

nPn

i=1

x2i n

P

i=1

xi

2 =

n

P

i=1

(xix)(y¯ iy)¯ Pn

i=1

(xix)¯ 2

(22)

b= n

P

i=1

x2i Pn

i=1

yiPn

i=1

xi n

P

i=1

xiyi

n

n

P

i=1

x2i n

P

i=1

xi

2 = 1 n

n

X

i=1

yia

n

X

i=1

xi

!

(23)

S(a) =

n

n

P

i=1

yi2 n

P

i=1

yi

2

nPn

i=1

x2i n

P

i=1

xi

2a2

1 (n−2)

(24)

S(b) =

n

P

i=1

x2i n

1/2

· S(a) (25)

Une fois les valeurs deaetbcalculées, la droite obtenue correspond à la droite de régression linéaire.

Note : Lors du calcul d’une régression linéaire, il est important de conserver beaucoup de chiffres et de ne pas se préoccuper des règles d’opérations arithmétiques avec les chiffres significatifs car plusieurs termes des équa- tions précédentes sont très petits.

(13)

6.2 Coefficient de corrélation : r

Lors du calcul de la régression linéaire, vous êtes généralement intéressés à savoir s’il existe réellement une relation entre x et y qui soit linéaire. C’est le coefficient de corrélation qui nous confirme si la relation entre x et y peut être linéaire (y=ax+b) ou non, et avec quelle limite d’assurance. Ce coefficient est généralement disponible quand vous utilisez une calculatrice de poche ou un chiffrier électronique. Nous nous contenterons de donner le résultat final. Le coefficient de corrélation r est défini par

r=

nPn

i=1

xiyiPn

i=1

xi Pn

i=1

yi

"

n

n

P

i=1

x2i n

P

i=1

xi

2#1/2"

n

n

P

i=1

y2i n

P

i=1

yi

2#1/2 (26) Sir = 1 ou -1, la corrélation est parfaite et la relation entrexetyest de la formey=ax+b, sans aucun doute. Si r ≈0, il n’y a aucune relation linéaire entrex et y.

Attention : L’exemple suivant montre deux graphiques pour lesquels la technique de régression linéaire donne la même valeur du coefficientr. Dans le cas du premier graphique, la relation entre x et y n’est pas une droite. Par contre, la courbe obtenue sur le graphique (b) est bien représentée par une droite. Il faut donc être très vigilant lors de l’analyse des résultats et éviter de se fier aveuglément aux chiffres obtenus.

X

(a)

Y

0 2 4 6 8 10 14 12 16

5 10 15 20

X

(b)

Y

r = 0.9866 r = 0.9866

0 5

5 10

10 15

15

20 20

25

Figure8: Coeficient de corrélation.

Références

[1] Tremblay L.M. & Chassé Y. Introduction à la méthode expérimentale. Centre éducatif et Culturel Inc., 1970.

[2] Barford N.C. Experimental measurements : Precision error and truth. Addison-Wesley, 1967.

(14)

[3] Green J.R. & Margerison. Statistical Treatment of Experimental Data. Elsevier, 1978.

[4] Taylor J. An introduction to error analysis : the study of uncertainties. University Science Books, 1997.

Références

Documents relatifs

Quelle est la probabilité que l’éolienne soit détruite au cours de sa première année de fonctionnement.. Quelle est l’espérance du montant des sinistres au cours de la

Nous déterminons également les domaines où les probabilités cumulées données par les lois de Bernouilli et de Poisson dans des intervalles de 1, 2 ou 3 écart-types

Pour que les composantes d’un vecteur gaussien soient indépendantes il suffit qu’elles soient

L'estimation du paramètre de distortion dans le cas des pertes non-négatives à queue lourde a été évaluée dans l'article de Brahimi et al (2011) [Estimating the distortion

Considérations propres à fournir, dans un grand nombre de cas, des limites extrêmes, très-approchées, des racines des équations numériques.. Annales de Mathématiques pures

Donc comme la moyenne, la plus grande valeur dans ces cas très généraux donne des informations sur une variable aléatoire mais les choses sont moins simples.. « En gros » la

Mill partage avec les utilitaristes le même refus de penser l’être humain à partir d’une morale transcendante ou a priori (intuitionniste). Il n’y a pas de phénomènes moraux en

De plus, dans ces séances de calcul mental on peut introduire progressivement le produit de deux décimaux comme ci-dessous avant d’en arriver au chapitre..