• Aucun résultat trouvé

3.1.- Utilité et signification

Les tests d'hypothèses sont conçus pour répondre aux questions que se posent les chercheurs lorsqu'ils analysent les données issues d'expériences ou de relevés. Les statisticiens ont développé un arsenal impressionnant de tests qui s'adaptent chacun à des situations bien particulières. Nous allons ci-après en évoquer deux des plus utiles (et des plus simples). Le test dit du “t de Student” et le test du “chi-carré”. Le premier permet de mesurer l'impact d'un paramètre sur une expérience et l'autre d'évaluer l'accord entre des prédictions d'un modèle et des mesures expérimentales. La conclusion d'un test d'hypothèse est habituellement une probabilté#: la probabilité que l'hypothèse avancée soit (ou ne soit pas) vérifiée. On considère généralement qu'une hypothèse est significative si la probabilité qu'elle soit vraie est supérieure à 95%. On considère également que l'hypothèse est parfaitement confirmée si la pro- babilité d'un accord "par hasard" est de moins de 1%.

Notons ici que l'on utilise souvent le fait que la probabilité de l'hypothèse opposée vaut 1 moins celle de l'hypothèse directe. Par exemple, si la probabilité que deux valeurs puissent être égales "par hasard" est très faible cela implique que les deux valeurs sont significativement différentes.

3.2.- t de Student

La stratégie habituelle pour étudier l'influence d'un paramètre particulier sur une ex- périence est de réaliser deux séries de mesures pour des valeurs différentes de ce paramètre. Pour chacune de ces deux séries, on peut calculer une moyenne (et l'er- reur sur cette moyenne). Si les moyennes diffèrent fortement d'une série à l'autre, on peut immédiatement conclure que le paramètre influence l'expérience. Cependant, si les moyennes sont seulement légèrement différentes, il devient délicat de conclure. C'est alors qu'il faut faire appel au test statistique dit du “t de Student” qui permet de vérifier si deux séries de mesures sont “significativement” différentes.

L'application du test impose certaines contraintes qui sont généralement satisfaites si les mesures ont été réalisées avec le même appareillage et si l'effet du paramètre que l'on fait varier est faible.

3.2.1.- Calcul numérique du t de Student a) Deux groupes distincts de mesures

Pour appliquer le test, il faut calculer t qui est défini comme la différence des moyen- nes divisée par l'écart type sur cette différence (qui est calculé comme la racine car- rée de la somme des carrés des écarts types).

Si l'on dispose de deux séries de mesures évaluées indépendamment l'une de l'au- tre, les ai (ma mesures) et les bi (mb mesures), on peut calculer t à partir des moyen- nes et des erreurs de chaque série par la relation!:

t

=



¯a − ¯b

σ

2

μa

+ σ

μb2

A partir d'une formule mathématique compliquée, on peut alors calculer la probabilité que la différence observée entre les deux moyennes soit significative (et non pas due simplement à la dispersion des mesures).

Cette formule fait intervenir le “nombre de degrés de liberté” du système qui est égal au nombre total de mesures moins deux.

ν = ma+ mb− 2

b) Mesures pairées

Si les mesures ont été réalisées par paires, c'est-à-dire que, pour un même échan- tillon, on a réalisé m paires (ai;bi) de mesures en changeant chaque fois les condi- tions expérimentales, on peut calculer t à partir des différences di = ai-bi .

Soit la moyenne de ces différences et l'écart type sur cette moyenne. On a alors

t

=

σ

μd"

Chapitre 11 : Analyse des données

avec

ν

= m − 1

Attention, le degré de liberté à considérer est m-1 (non pas m-2!).

c) Echantillon unique

Le test de Student peut aussi être utilisé pour comparer une unique série de mesu- res réalisées sur un échantillon dont on connaît parfaitement bien la moyenne. Dans ce cas, il suffit de remplacer la moyenne du second groupe de mesures par cette valeur et de considérer que sa dispersion est nulle (!=0). Le degré de liberté à con- sidérer est encore le nombre de mesures moins 2.

3.2.2.- Estimation numérique du t de Student

Si l'on connaît t et , le programme suivant (en Pascal) calcule la probabilité (entre 0 et 1) de ne pas obtenir "par hasard" la valeur calculée de t. Donc si cette probabilité est grande, cela signifie que la valeur de t qu'on a déduite des observations ne peut pas être simplement due au hasard. On a bien une différence significative entre les groupes de mesures et, par exemple, si la probabilité dépasse 0.95, on peut con- clure qu'on observe une différence très significative.

Le calcul repose sur l'évaluation numérique d'un développement en série. (Réf. Hand- book of mathematical Functions, Abramowitz & Stegun, National Bureau of Standards, 1968).

En Pascal

function Student(t: real; nu:integer): real; var a,s,x:real; begin t:=arctan(abs(t)/sqrt(nu)); s:=0; a:=nu-3; x:=sqr(cos(t)); while a > 0 do begin s:=(s + 1) * (a/(a + 1)) * x; a:=a-2; end; if nu <> 1 then s:=(s+1) * sin(t);

if odd(nu) then s :=(s*cos(t)+ t)* 2/pi; Student := s; end; En JavaScript function Student(t,nu){ t=Math.atan(Math.abs(t)/Math.sqrt(nu)); nu=Math.round(nu); s=0; a=nu-3; x=Math.cos(t);x=x*x; while (a > 0){s=(s + 1)*(a/(a+1))*x;a=a-2;} if (nu != 1) {s=(s+1) * Math.sin(t)};

if ((nu % 2) !=0) {s=(s*Math.cos(t)+ t)* 2/Math.PI}; return(s)

};

3.2.3.- Exemples numériques

a) Deux groupes de valeurs non pairées

(Ex!: Influence de la température sur la croissance d'une plante) On mesure deux groupes de valeurs!:

___________________________________________________ Situation A Situation B 12 19 15 17 8 12 14 17 12 20 10 13 16 18 18 10 ___________________________________________________ Moyenne 12.43 15.78 ±sigma 1.07 1.13 t = 2.158 nu = 14

Probabilité d'une différence = 95.12% (significatif)

___________________________________________________ b) Un groupe de valeurs pairées

(Ex!: Variation de poids des mêmes animaux soumis à des régimes différents) On mesure les valeurs suivantes!:

___________________________________________________

Echantillon Situation A Situation B Différence

N°1 25 29 4 N°2 12 13 1 N°3 17 18 1 N°4 21 20 -1 N°5 9 15 6 ___________________________________________________

Moyenne des différences 2.2

±Sigma 1.24

t = 1.77 nu = 4

Probabilité d'une différence = 84.8% (pas vraiment significatif) ___________________________________________________

Chapitre 11 : Analyse des données

c) Un groupe de mesures comparées à une moyenne bien connue

(Ex!: légère modification d"un appareil qui produit en moyenne un certain nombre de pièces.)

La moyenne "bien connue" est de 45. On modifie légèrement un paramètre et on mesure les valeurs suivantes!:

___________________________________________________ 46 47 48 47 47 ___________________________________________________ Moyenne 47 ±Sigma 0.32 t = 6.32 nu = 3

Probabilité d'une différence = 99.2% (vraiment significatif)

___________________________________________________