1 Loi normale Exemple :
On rassemble 1000 garçons de 16 ans, choisis au hasard et on forme des rangs par taille.
Ce groupe, vu de haut aurait une forme semblable au diagramme ci-contre.
La forme obtenue est proche d’une « courbe en cloche » ou « courbe de Gauss ».
On obtient le même type de représentation à partir des filles du même âge.
Ce phénomène est fréquent lorsque la variable (ici la taille) dépend de plusieurs causes indépendantes.
Une loi mathématique décrit ces phénomènes : c’est la loi normale.
Cette loi fournit un bon modèle dans de nombreux domaines (biologie, contrôle
On dit qu’une telle variable suit une loi normale ou qu’elle est gaussienne.
La comparaison graphique des effectifs des tailles des garçons avec les effectifs théoriques calculés avec la loi normale associée montre une très grande similitude.
2 Variance et écart-type
Pour mesurer la dispersion des valeurs d’une série, on peut procéder ainsi : calculer la moyenne x de la série,
calculer tous les écarts entre les valeurs de la série et x , élever ces écarts au carré et en faire la moyenne.
Le résultat obtenu est la variance V de la série.
La racine carrée de la variance est appelée écart-type de la série.
Exemple : débits mensuels de l’Hérault et de la Somme
J F M A M J J A S O N D moyenne Débit 39 38 79 53 33 16 8 5 27 37 72 85 41 Ecart avec la moyenne -2 -3 38 12 -8 -25 -33 -36 -14 -4 31 44 0 Ecart au carré 4 9 1444 144 64 62
5
1089 1296 196 16 961 1936 648,7
Ici la variance V est environ : 648,7.
L’écart-type s = V est environ : 25,47 m3/s
On peut calculer également la variance et l’écart-type pour les débits de la Somme à partir du tableau des effectifs.
débit (xi) 38 39 41 42 43 44 46 moyenne
effectif (ni) 2 3 2 2 1 1 1
ni xi 76 117 82 84 43 44 46 41
écart avec la moyenne au carré
18 12 0 2 4 9 25 5,83
Dans ce cas, pour calculer la variance on utilise la formule : V = 2x(38-41)² + 3x(39-41)² + ... + 1x(46-41)²
12 = 70
12 ≈ 5,83 L’écart type correspondant est s = V ≈ 2,42 m3/s
Plus la série est dispersée, plus les écarts sont grands, et plus l’écart-type est important.
Ainsi, la Somme ayant un débit plus régulier que l’Hérault, sa série correspondante a un écart type plus petit.
Remarque :
La calculatrice donne le calcul de l’écart-type. avec la variable σx ou x
σ
n3 Ecart-type et loi normale
Reprenons l’exemple de la taille des filles et des garçons.
taille
moyenne m
écart- type s
intervalle [m-s ;m+s]
effectif dans [m- s ;m+s]
pourcentage de
l’effectif total Filles 162,30 cm 5,60 cm [156,7 ;167,9] 681 68,1%
Garçons 170,85 cm 6,21 cm [164,64 ;177 ;06] 677 67,7%
Dans les deux cas, l’intervalle [m – s ;m + s] contient des pourcentages très voisins.
Plus le nombre de valeurs est grand, plus la moyenne observée m et l’écart-type associé s sont proches de certaines valeurs théoriques, notéesµ et σ
µet σ sont les paramètres qui définissent la loi normale associée.
Pour toutes les séries gaussiennes, la répartition est proche de la suivante :
Intervalle de centre
µ [µ-σ ; µ+σ ] [µ-2σ ; µ+2σ ] [µ-3σ ; µ+3σ] Fréquence à 0,1 %
près
68,3 % 95,4 % 99,7 %
4 Données non gaussiennes
De nombreuses données fluctuantes ne sont pas pour autant gaussiennes, et la loi normale n’en serait pas un bon modèle.
Exemple : Les temps de 60 coureurs du marathon de Paris.
Sur le graphique, on a tracé la courbe de Gauss définie par la moyenne (2 :21 :40) et l’écart-type (5 :01) des 60 temps.
L’ajustement est visiblement mauvais et la loi normale est ici inutilisable.
5 Intervalles de fluctuation
Soit une variable suivant une loi normale de moyenne µet d’écart-typeσ. On appelle intervalle de fluctuation au niveau de confiance de 95 %, l’intervalle de centre µ dans lequel on peut s’attendre à trouver 95 % des
observations.
Pour toutes les variables gaussiennes, il s’agit de l’intervalle I95% = [µ-2σ ; µ+2σ ]
Exemples :
Moyenne
µ Ecart-type σ I95% = [µ-2σ ; µ+2σ] Taille (cm) des filles de 16
ans
162 5,5 [151 ;173]
Poids des bébés de 9 mois 8,45 1,01 [6,43 ;10,47]
Nombre d’élèves présents à la cantine les lundis
648 22 [604 ;692]
L’histogramme ci-dessous est valable pour chacune des trois distributions précédentes.
Il s’applique à toute série de données gaussiennes.
6 Plages de normalité Exemple 1 :
L’étude d’un très grand nombre de poids d’enfants de 6 mois a montré que : la distribution des poids est gaussienne
la moyenne est égale à 7,35 kg et l’écart-type est égal à 0,925 kg.
On choisit comme plage de normalité du poids l’intervalle de centre 7,35 qui contient 95 % des cas, c’est donc :
I95% = [7,35-2x0,925 ;7,35+2x0,925] = [5,5;9,2]
La plage de normalité la plus utilisée est l’intervalle [µ-2σ ; µ+2σ ].
Exemple 2 :
Les résultats d’analyses biologiques sont souvent accompagnés de cette plage de normalité :
Hémogrammes Résultats Normales µ σ Commentaires
Hématocrites 45,8% 41 à 53 47 3 Taux normal
Hématies 4,63 M/mm3 4,6 à 6,2 5,4 0,4 Taux bas mais normal Hémoglobine 19,8 g/ 100
ml
14 à 18 16 1 Taux anormalement
élevé.