• Aucun résultat trouvé

Chapitre 14 : statistiques

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre 14 : statistiques"

Copied!
8
0
0

Texte intégral

(1)

STATISTIQUES DESCRIPTIVES I – Statistiques à une variable

1o) Description Définition 1 :

En statistiques, l’ensemble que l’on étudie s’appelle population, chaque élément de cet ensemble étant appeléindividu. Sur cette population, on étudie une propriété particulière que l’on nommeca- ractère(ouvariable). Un caractère peut être de deux types :quantitatifs’il est mesurable (au sens où il peut être représenté par un nombre), etqualitatifdans le cas contraire. Un caractère quantitatif peut êtrediscrets’il prend un nombre fini de valeurs, etcontinus’il peut (théoriquement) prendre toutes les valeurs d’un intervalle.

Remarque :

– Pour un caractère quantitatif x associé à une population de taille p, l’observation conduit à un p-uplet (x1,x2, ... ,xp), que l’on appelle série statistique.

– Pour un caractère quantitatif continu, l’usage est de regrouper les valeurs par intervalles que l’on appelle classes.

Exemple 1 : Dans tous les cas de dénombrement, la variable obtenue est discrète (nombre de pétales par fleur dans un échantillon de fleurs de même type, nombre d’enfants par famille, etc...

Lorsque des valeurs se répètent plusieurs fois, on les regroupe en précisant le nombre de fois que chacune apparaît (ce qui conduit à la notion d’effectif) :

Définition 2 :

On considère une série statistique dont les valeurs sont notées (xi)1≤i≤p, d’effectifscorrespondants (ni)1≤i≤p.

On noten=

p

X

i=1

ni l’effectif totalet on définit les fréquences (fi)1≤i≤passociées à chaque valeur par

i∈££ 1,p¤¤

, fi=ni

n Remarque : On a

p

X

i=1

fi=1.

Exemple 2 : Lors de l’étude d’une population de gélinotte huppée (la perdrix très répandue en Amérique du Nord), on mesure la longueur de la rectrice centrale (plume de la queue). Les résultats (en mm) pour un échan- tillon de 50 individus sont les suivants :

153 165 160 150 159 151 163 160 158 149 154 153 163 140 158 150 158 155 163 159 157 162 160 152 164 158 153 162 166 162 165 157 174 158 171 162 155 156 159 162 152 158 164 164 162 158 156 171 164 158 Regrouper ces valeurs par classes d’amplitude 5 mm, pour obtenir :

Intervalle [140,145[ [145,150[ [150,155[ [155,160[ [160,165[ [165,170[ [170,175[

Effectif 1 1 9 17 16 3 3

Définition 3 :

On considère une série statistique de valeurs (xi)1ipet de fréquences correspondantes (fi)1ip. Lesfréquences cumulées croissantessont les valeurs (Ci)1ip définies par∀i∈££

1,p¤¤ , Ci=

i

X

k=1

fk .

Lesfréquences cumulées décroissantessont les valeurs (Di)1ipdéfinies par∀i∈££1,p¤¤, Di=

p

X

k=i

fk . Remarque : La dernière fréquence cumulée croissante vautCp=1, la première fréquence cumulée décroissante

(2)

Exemple 3 : L’exemple précédent.

2o) Représentations graphiques Définition 4 :

Undiagramme en bâtonsest un graphique permettant de représenter un caractère quantitatif ou qua- litatif, dans lequel la hauteur de chaque bâton est proportionnelle à l’effectif (ou à la fréquence) de chaque valeur.

Définition 5 :

Unhistogrammeest un graphique permettant de représenter un caractère quantitatif continu (ou éventuellement discret), dans lequel l’aire de chaque rectangle est proportionnelle à l’effectif (ou à la fréquence) de chaque classe (ou valeur).

Exemple 4 : L’exemple des gélinottes.

3o) Caractéristiques de position Définition 6 :

Lamoyennede la série est le nombre, notéx, défini par x= 1 n

p

X

i=1

nixi . On a également x=

p

X

i=1

fixi . Définition 7 :

Lamédianede la série est un nombre, noté Me, tel que 50 % des valeurs de la série rangées par ordre croissant sont inférieures à Me.

Remarque : Cette définition n’assure pas l’unicité, lorsque la médiane se situe entre deux valeurs, l’usage est de choisir le milieu de l’intervalle délimité par ces deux valeurs.

Définition 8 :

Lemodede la série est la valeur correspondant à l’effectif (ou à la fréquence) le plus élevé.

Remarque : Lorsque le caractère est quantitatif continu et regroupé en classes, l’usage est de choisir le milieu de l’intervalle contenant le plus de valeurs de la série.

Exemple 5 : Sur l’exemple des gélinottes, on trouve (avec interpolations linéaires) : Moyenne Médiane Mode

Avec les données brutes 158,9 158,5

Après regroupement par classes 159,2 159,4 157,5

Exemple 6 : Sur un groupe de 10 personnes, un enquêteur demande à chacun combien ils ont d’argent sur eux, cela donne le résultat suivant : 5, 5, 10, 10, 10, 10, 15, 15, 20 et 500e. Il s’agit de fixer ensuite un prix d’achat pour un produit donné, suite à cette enquête.

On constate que la médiane est bien plus efficace ici : en fixant le prix à la médiane, la moitié des personnes du groupe pourra acheter le produit. Alors qu’en se basant sur la moyenne (60e), une seule personne le pourra ! 4o) Caractéristiques de dispersion

On cherche à mesurer l’écart entre les valeurs de la série et la moyenne. Pour mesurer l’écart entre une valeur xet les valeurs de la série, on peut partir de|xxi|qui mesure la distance entrexetxi, et faire une moyenne : D(x)= 1

n

p

X

i=1

ni|xxi|. On cherche ensuite pour quelle valeur dexcette distance est minimum : on peut montrer quex=Me est une valeur qui minimiseD. Cependant la mesure n’est pas utilisée car elle n’est pas assez sensible à la dispersion des données.

On va partir du carré de la distance : on posteV(x)= 1 n

p

X

i=1

ni|xxi|2. On montre (trinôme du second degré !) que la valeur qui minimiseV est la moyennex: la moyenne est la valeur qui est la moins éloignée des données, si l’on se réfère au carré de la distance (ce qui justifie a posteriori l’intérêt d’un tel choix pour résumer la série). On définit la variance comme la valeur minimum de cette distance :

(3)

Définition 9 :

Lavariancede la série est le nombre positif, notés2x, défini par s2x=1 n

p

X

i=1

ni¯

¯x−xi¯

¯

2 . On a également

s2x=1 n

p

X

i=1

nix2ix2 .

L’inconvénient de la variance est qu’elle ne possède pas de signification concrète par rapport aux données (voir le problème des unités). Voilà pourquoi un tour de racine carrée s’impose :

Définition 10 :

L’écart-typede la série est la racine carrée de la variance : sx= v u u t 1 n

p

X

i=1

nix2ix2 .

Exemple 7 : Toujours le même : pour les données brutes, on trouvesx=6,04 mm, et pour les données groupées sx=5,97 mm.

Lorsque la mesure de position à laquelle on se réfère est la médiane, l’écart-type n’est plus adapté : on s’inté- resse dans le cas à l’écart interquartile :

Définition 11 :

Le1erquartilede la série est la plus petite valeur de la série, notéeQ1, telle qu’au moins 25 % des valeurs de la série rangées par ordre croissant sont inférieures ou égales àQ1. Le3equartilede la série est la plus petite valeur de la série, notéeQ3, telle qu’au moins 75 % des valeurs de la série rangées par ordre croissant sont inférieures ou égales àQ3.

Définition 12 :

On appelle écart interquartile le réel positifI=Q3Q1.

Remarque : Iest l’amplitude de l’intervalle [Q1,Q3], intervalle qui contient 50 % des valeurs de la série.

On résume une série statistique par un couple, soit le couple moyenne-écart type, soit le couple médiane-écart interquartile.

Pour préciser davantage la répartition des valeurs, on peut s’intéresser aux déciles : Définition 13 :

Pour toutk∈££ 1,9¤¤

, lek-ièmedécilede la série est la plus petite valeur de la série, notéeDk, telle qu’au moins 10k% des valeurs de la série rangées par ordre croissant sont inférieures ou égales àDk. Exemple 8 : Toujours le même, on trouveQ1=155,3 mm,Q3=163 mm, doncI=7,7 mm.

II – Statistiques à deux variables

1o) Définition et description

On étudie cette fois simultanément deux variables sur une même population : cela conduit à une série statis- tique double, dont les valeurs sont notées (xi,yi)1≤i≤n, d’effectif totaln. On notexetyleurs moyennes respectives, etsxetsyleurs écart-types respectifs. Dans ce cas, l’observation conduit à unp-uplet deR2:¡(x1,y1) , (x2,y2) , ... ,(xn,yn

, que l’on appelle série statistique double.

Définition 14 :

Lenuage de pointsassocié à la série statistique est l’ensemble des pointsMi(xi,yi) pour 1≤in.

Définition 15 :

Lepoint moyenassocié à la série statistique est le pointG(x,y).

(4)

Exemple 9 : Longueur d’un ressort en fonction de la masse appliquée.

Masse (en g) Longueur (en cm)

7 8,5

10 9

18 10,5

20 11

5 8

24 11,8

12 9,4

3 7,5

Un joli nuage, et un calcul de point moyen qui donneG(12,38 , 9,46).

2o) Corrélation

L’objectif de l’étude d’une série statistique à 2 variables est de chercher une corrélation entre les deux variables.

Selon la forme du nuage, on peut chercher une corrélation linéaire, polynômiale, etc... Pour cela on va avoir besoin de la notion de covariance :

Définition 16 :

Lacovariancede la série double est le réel sx y= 1 n

n

X

i=1

(xix)(yiy) . On a aussi sx y=1 n

n

X

i=1

xiyix y . Dans le cas où la forme nuage est « proche » (mesure à définir...) de celle d’une droite, on cherche à approcher la série par une droiteDd’équationy=ax+b. Le but est de trouver la « meilleure » droite possible, celle qui est la plus « proche » (mesure à définir...) du nuage. La méthode des moindres carrés est la méthode la plus couramment employée.

On noteNi(xi,axi+b) les points de la droiteD, et on va chercher à minimiser l’écart en ordonnée entre ces points et ceux du nuage : il s’agit pour cela de minimiser 1

n

n

X

i=1

MiNi2, c’est-à-dire de trouver les réelsaetbmini- misant la quantité 1

n

n

X

i=1

¡yi−(axi+b)¢2. On peut montrer que le minimum est obtenu pour la droite suivante : Définition 17 :

La droiteDd’équationy=ax+bavec a=sx y

s2x et b=yax est appeléedroite de régression dey enx.

Remarque : Le point moyenGappartient à cette droite.

Exemple 10 : Sur l’exemple précédent, on trouvesx y ≈10,03,s2x≈44,65, d’oùa≈0,20 etb≈7. Le tracé de la droite nous confirme la qualité de l’approximation réalisée. De plus, on en déduit que l’allongement du ressort est approximativement proportionnel à la masse appliquée, ce qui est rassurant car cohérent avec nos connaissances de mécanique.

La droite de régression deyenxpermet d’estimer des valeursycorrespondant à des valeursxqui ne font pas partie de la série. Si l’on souhaite faire le contraire, il faut utiliser la droite de régression dexeny (on minimise dans ce cas les écarts en abscisses) :

Définition 18 :

La droiteD0d’équationx=a0y+b0avec a0=sx y

s2y et b0=xa0y est appeléedroite de régression de xeny.

(5)

Ces équations nous fournissent les meilleures droites possibles, sans pour autant préciser la qualité de l’ap- proximation. Afin d’apprécier la pertinence d’un ajustement affine, on cherche à introduire une mesure de la précision de l’approximation :

Définition 19 :

On appellecoefficient de corrélation linéairele réelrx ydéfini par rx y= sx y sxsy . Propriété 1 :

1o) rx y∈[−1,1].

2o) rx y, a, a0et sx ysont du même signe.

3o) rx y∈©

−1,1ª

ssi les points Misont alignés.

Remarque : Le coefficient de corrélation linéaire ne dépend pas des unités choisies. Le signe derx y,a,a0etsx y donne une indication de croissance ou décroissance dans la relation qui liexety: il est positif si l’augmentation de l’une des variables a tendance à faire augmenter l’autre, et négatif dans le cas contraire. D’autre part, plus¯

¯rx y¯

¯ est proche de 1, plus la corrélation est forte entre les deux séries. D’un secteur technologique ou économique à un autre, les exigences surrx y varient : on choisit un seuil à partir duquel la corrélation est jugée suffisante pour permettre un ajustement affine par la méthode des moindres carrés. On trouve fréquemment la valeur de rx y2 comme indicateur de la qualité de la régression :rx y2 ∈[0,1] peut être vu comme le pourcentage d’influence de la variablex dans les variations de la variable y. Enfin, profitons-en pour signaler une erreur fréquemment commise : corrélation ne signifie pas lien de causalité.

Exemple 11 : Sur l’exemple précédent, on trouvesx y≈10,03,sx≈7,09,sy ≈1,42, d’oùrx y≈0,996 : quelle jolie approximation, la personne qui a réalisé les mesures a été très consciencieuse (ou malhonnête?).

Lorsque la forme du nuage suggère un autre type d’approximation, un changement de variable permet de se ramener à un ajustement affine.

Exemple 12 : Deux élèves consciencieux et motivés partent mesurer, pour leur TIPE, les effectifs d’une popu- lation de coléoptères dans un bois bien délimité, tous les ans (les élèves sont tellement consciencieux qu’ils se donnent 5 ans pour peaufiner leur TIPE). Ils obtiennent la série de données suivante : 85, 225, 345, 692, 1412.

La forme du nuage ne suggère pas un ajustement affine, mais plutôt un ajustement exponentiel deXen fonc- tion deY. On calcule alors ln(Y), et on tente une régression linéaire : on obtient la série 4,44, 5,42, 5,84, 6,54, 7,26.

Une régression linéaire nous donne comme équation ln(Y)=0,676X−4,548 avec un coefficient (excellent, cela valait le coup d’attendre...) de 0,994. D’oùY =e0,676X−4,548≈0,011e0,676X, ce qui s’écrit encoreY =0,011×1,97X (régression exponentielle).

III – Compléments de statistiques

1o) Échantillonnage et estimation de paramètres

Lorsque une population est trop importante, on ne peut l’étudier que sur un échantillon. L’étude d’un échan- tillon permet d’estimer des propriétés sur la population globale, mais il faut toujours garder à l’esprit que toute conclusion ne repose que sur un échantillon. L’idéal est que cet échantillon soit représentatif (s’il possède les mêmes caractéristiques que la population globale), mais ceci n’est pas forcément facile à vérifier, étant donné qu’on n’a pas de référence pour la population globale.

En l’absence d’information particulière, il faut qu’il soit le plus important possible pour limiter les risques de tomber sur un échantillon dit biaisé. Plus la taille de l’échantillon augmente, plus il va avoir tendance à se comporter comme la population globale, mais il faut trouver un compromis entre la quantité de données à relever et la précision souhaitée.

L’objectif de ce paragraphe est de donner quelques rudiments de statistiques inférentielles, branche des sta- tistiques qui permet l’estimation de paramètres à partir d’un échantillon. Nous partons des notations suivantes :

Effectif Moyenne Écart-type

Population N m σ

(6)

a) Estimation ponctuelle

Il s’agit de donner une valeur estimée de la moyennem et de l’écart-typeσ(inconnus) à partir des valeurs mesuréesxets. Pour la moyenne, ce n’est pas très compliqué :

Propriété 2 :

Une estimation ponctuelle de m est x.

Pour l’écart-type, il faut tenir compte du fait que si la taille de l’échantillon est trop petite, l’écart-type mesuré risque d’être sous-estimé par rapport à la valeur correspondant à la population :

Propriété 3 :

Une estimation ponctuelle deσest s r n

n−1. Remarque : Plusnest grand, pluss

r n

n−1est proche des. Dans le cas extrême oùn=2, l’écart-type est doublé (mais qui aurait l’idée de faire une estimation à partir d’un échantillon de taille 2, à part un homme politique particulièrement malhonnête – si tant est qu’il en existe?).

b) Estimation par intervalle de confiance

L’estimation précédente paraît très estimable, puisqu’elle a l’avantage inestimable de donner une valeur pré- cise. Seul hic : la probabilité que la moyennemsoit exactement égale à xest nulle... et il en est de même pour l’écart-type ! Cette propriété ne doit pas être oubliée lors de la lecture de tout sondage, particulièrement à l’ap- proche d’élections.

Pour obtenir des estimations un peu plus fiables, il faut accepter de revoir ses ambitions à la baisse concernant la précision : plutôt que de donner une valeur précise dont on sait qu’elle n’a aucune chance d’être exacte, on donne un encadrement de la valeur cherchée, en fournissant en plus un indicateur de la confiance à apporter à ce résultat (ce qu’aucun institut de sondage ne fait bien évidemment...).

Tout part de la fameuse loi normale, qui est au centre de tout en probabilités : si l’échantillon est suffisamment grand, on peut montrer que la distribution des valeurs mesurées s’approche de la distribution correspondant à une loi normale, dont la densité de probabilité est définie par la jolie fonctionx7−→ 1

σp

2πe12¡x−mσ ¢2 et sa jolie courbe en cloche (voir figure 1).

On fixe un risque d’erreur à l’avance, par exemple 5 %, et on cherche donc un intervalle qui ait 95 % (la confiance) de chances de contenir la moyennem cherchée. Cela correspond graphiquement à déterminer un intervalle centré enmtel que l’aire sous la courbe (qui correspond à la probabilité dans le cas de lois continues) soit égale à 0,95 (voir figure 2).

0 1 2 3 4 5 6 7 8

−1

−2

−3

−4

−5

0 0.1

0.2 Casm=σ=2

FIG. 1 –Exemple de gaussienne.

0 1 2 3 4 5

−1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

Casn=10

95% de l’aire totale

FIG. 2 –Intervalle de confiance à 95 %.

Le résultat suivant donne l’intervalle de confiance au seuil de risqueα, en fonction de la taillen de l’échan- tillon, de la moyennexde l’échantillon, et de l’écart-typeσde la population :

Propriété 4 :

Un intervalle de confiance de la moyenne m au seuil de risqueαest

· xt σ

pn;x+t σ pn

¸ .

Tout cela est bien joli, mais il nous manquet:t est directement lié àα, et il s’obtient à l’aide de la table de la loi normale centrée réduite (loi normale de référence, pour laquellem=0 etσ=1). Les valeurs usuelles sont :

(7)

Risqueα 0,01 0,05 0,1 Valeur det 2,58 1,96 1,645

Remarque : L’écart-typeσqui est inconnu peut être estimé à partir desgrâce à une estimation ponctuelle (voir propriété 3).

Notons que l’intervalle est réduit sitest faible, siσest faible, ou sinest grand.

2o) Comparaison de moyennes

Lors de vos expériences de TIPE, amenées à révolutionner l’histoire des sciences, vous aurez probablement besoin de comparer les moyennes d’échantillons : une première expérience servant de base, on la répète en mo- difiant certains paramètres (un seul à la fois évidemment...), et on souhaite déterminer si la modification de ce paramètre a influé de manière significative sur la moyenne. Plutôt que de sempiternellement parler de chevau- chement des intervalles de confiance, argument visuel et très approximatif, une méthode plus systématique et précise repose sur les tests d’hypothèse.

Nous partons des notations suivantes :

Effectif Moyenne Écart-type

PopulationP1 inconnu m1 σ1

PopulationP2 inconnu m2 σ2

Échantillon deP1 n1 x1 s1

Échantillon deP2 n2 x2 s2

L’objectif est donc de déterminer s’il y a une différence significative entre les moyennes des populationsP1et P2, à partir de leurs échantillons.

La construction d’un test d’hypothèses commence par la définition de deux hypothèses :

– l’hypothèse nulle notéeH0: icim1=m2. Dans ce cas il n’y a pas de différence significative entre les moyennes des deux populations (et donc cette hypothèse n’est pas si nulle que ça...).

– l’hypothèse alternative notéeH1: icim16=m2. Dans ce cas les moyennes des deux populations sont signifi- cativement différentes.

On se donne ensuite un seuil de risqueα: c’est la probabilité de rejeter H0 alors que H0 est vraie (valeur courante : 5 %).

a) Cas idéal : grands échantillons (n1≥30etn2≥30) :

Sans entrer dans les détails, sous l’hypothèseH0, le théorème de la limite centrée assure que la moyenne des échantillons suit une loi normale (pour laquellem=0) lorsque la taille de l’échantillon tend vers l’infini. Au seuil de risqueα, la loi normale nous permet de déterminer un intervalle (de la même façon que pour les intervalles de confiance) où, siH0est vraie, on a une probabilité 1−αde trouver l’écartx1x2entre les moyennes des deux échantillons.

En pratique, le résultat suivant donne le critère de décision : Propriété 5 :

Au seuil de risqueα, l’intervalle d’acceptation de H0est Iα=[−σt ,σt] oùσ= sσ21

n1+σ22 n2. Remarque :

ts’obtient à l’aide du tableau précédemment donné (il vaut 1,96 pourα=5 %).

σ1 et σ2 étant inconnus, on peut les obtenir par une estimation ponctuelle à l’aide de la propriété 3 : σ1s1

r n1

n1−1etσ2s2 r n2

n2−1.

Concrètement, six1x2Iα,H0est acceptée, et six1x2Iα,H0est refusée (avec un risqueαde se tromper).

Remarque : Ne pas oublier l’interprétation probabiliste : au seuil de risqueα=5 % par exemple, siH0est vraie alors il y a 95 % des échantillons des deux populations dont l’écart entre les moyennes se situent dans l’intervalle

(8)

Iα. Notons que plusαdiminue (risque de plus en plus faible), plus l’intervalle d’acceptation grandit (on a de moins en moins de chances de rejeterH0).

Exemple 13 : Les élèves de biosup de deux lycées prestigieux, qu’on notera anonymement A et B, subissent une épreuve de mathématiques. On prélève un échantillon de 35 notes dans le lycée A, et de 30 notes dans le lycée B.

On obtientxA=10,5,sA=2,5,xB=11,sB=2,8 : peut-on affirmer que les lycées A et B ont des étudiants de niveau différent? (vous devriez trouver Iα=[−1,32 ; 1,32]).

b) Cas plus gênant mais plus réaliste : petits échantillons (n1<30oun2<30) :

Ça se complique, la petite taille des échantillons étant un obstacle à l’utilisation du théorème de la limite centrée. Dans le cas où les variances des deux populations sont égales, les choses s’arrangent. On commence donc par tester l’égalité de ces variances, toujours grâce à un test d’hypothèse où les deux hypothèses sont les suivantes :

– hypothèse nulleH0:σ21=σ22. – hypothèse alternativeH1:σ216=σ22.

Sous l’hypothèseH0, une autre loi que la loi normale intervient (loi de Fisher). Retenons uniquement la mé- thode concrète :

1o) on calcule le quotient des variances, à partir d’une estimation ponctuelle, soitF=s21nn1

1−1

s22nn2

2−1

.

2o) on lit dans la table de la loi de Fisher (donnée sur http://www.agro-montpellier.fr/cnam-lr/statnet/tables.htm par exemple) les valeurs de l’intervalle d’acceptationIα=[sα,Sα], au seuil de risque choisiα. La loi de Fisher possède 2 paramètres (appelés degrés de liberté, l’ordre a une importance) : poursα, on utilise la loi avec pour paramètres (n2−1,n1−1) etα

2 comme seuil, etsαestl’inversede la valeur lue dans la table. PourSα, on utilise la loi avec pour paramètres (n1−1,n2−1) etα

2 comme seuil, etSαest la valeur lue dans la table.

3o) siFIα, alors on accepteH0. SiFIα, alors on rejetteH0(toujours avec un risqueαde se tromper).

Si le test précédent conduit à valider l’hypothèseH0d’égalité des variances, il est alors possible de comparer les deux moyennes par un nouveau test d’hypothèse, pour lequelH0est à nouveaum1=m2. Dans ce cas, sous l’hypothèseH0, le théorème de la limite centrée permet de rapprocher la moyenne des échantillons d’une loi de Student (encore une nouvelle loi...), et le critère de décision s’obtient grâce au résultat suivant :

Propriété 6 :

Au seuil de risqueα, l’intervalle d’acceptation de H0est Iα=[−σt,σt] oùσ=

sn1s21+n2s22 n1+n2−2

µ 1 n1+ 1

n2

. Remarque : ts’obtient à l’aide de la table de la loi de Student, loi qui admet un paramètre (appelé aussi degré de liberté) ici égal àn1+n2−2.

Concrètement, six1x2Iα,H0est acceptée, et six1x2Iα,H0est refusée (avec un risqueαde se tromper).

Exemple 14 : On étudie l’influence du type d’atmosphère sur la durée de vie (en jours) de drosophiles femelles : à température constante, on teste une atmosphère normale et une atmosphère enrichie en dioxyde de carbone.

Les résultats sont les suivants :

Atmosphère normale 864 768 912 804 924 984 888 816 840 936 792 876

Atmosphère enrichie en CO2 840 948 936 1032 912 948 1020 936 1056 876 1032 918 Peut-on dire que la différence entre les deux types d’atmosphère est significativement différente au seuil de risque 5 % (pour l’égalité des variances, vérifiez que vous trouvezIα=[0,29 ; 3,47], puist=2,0739)?

Si le test des variances conduit à rejeterH0, les variances sont significativement différentes, et les tailles d’échan- tillon trop petites, les choses se compliquent nettement, les outils statistiques ne seront pas développés ici.

Références

Documents relatifs

rouleau/cartes Ø Tuyau (mm) Symbole Marqueurs en rouleau - Type 2: dont le diamètre est inférieur à 70 mm.. 100,00 mm x 60 mm 8,30 mm 505 Inférieur à

Bien que l’enquête ait recensé 356 organismes en patrimoine, y com- pris les arts de la scène œuvrant dans ce secteur, le rapport Arpin est l’un des derniers documents à

Une des premières choses à faire consiste à créer un environnement de travail afin de pouvoir récupérer le travail effectué lors d’une session ultérieure. Dans le menu

On veut connaître le poids moyen de ce corps dans la population avec un niveau de confiance de 95%. On veut connaître la variance de ce corps dans la population avec un coefficient

Vivre une telle expérience, dans laquelle le Soi se transcende lui-même pendant quelques instants, puis revient à lui-même, mais cette fois avec la conviction d’avoir vécu

4) Si le trait de jauge est dépassé, un prélèvement à la pipette du liquide excédentaire permet-il de rectifier l'erreur et de préparer avec précision la solution demandée

Les résultats de tests sur la qualité des générateurs de nombres aléatoires sont aussi

i Il est présent dans des produits destinés à être ingérés, fumés, vapotés ou à être appliqués sur la peau, sans que son taux soit réglementé. Seul celui de THC doit