• Aucun résultat trouvé

Constitution du G.R.E.S. au 1 janvier 1999 EDITORIAL

N/A
N/A
Protected

Academic year: 2022

Partager "Constitution du G.R.E.S. au 1 janvier 1999 EDITORIAL"

Copied!
46
0
0

Texte intégral

(1)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 0

EDITORIAL

Constitution du G.R.E.S. au 1 janvier 1999

ANGELIQUE Françoise LEGTA de NANCY

DESESQUELLES René LEGTA d’AMIENS

FAGES Jean ENFA TOULOUSE

GAUMET Jean-Pascal LEGTA LE ROBILLARD

PARNAUDEAU Jean-Marie LEGTA de VENOURS

PAVY Jacques LEGTA LE ROBILLARD

PRADIN Jean LEGTA de MOULINS

QUET Guillaume LEGTA d’AUBENAS

URDAMPILLETTA Vincent LEGTA de SURGERES

VARLOT Chantal LEGTA de CHALONS SUR MARNE

(2)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 1 Jean PRADIN

Tout d’abord une amicale pensée pur notre collègue André MELLAN qui vient de prendre sa retraite. André a beaucoup fait pur l’enseignement de la statistique dans les filières TS de l’enseignement agricole. Ceux qui le connaissent ou qui ont travaillé avec lui savent la force de ses convictions statistiques qu’il a défendues avec passion. Il a pris une part active à la mise en place et au fonctionnement du GRES. Ses positions, souvent tranchées, ont contribué à alimenter et éclairer les discussions du groupe et ont fait progresser sa réflexion.

Le GRES travaille ! La sortie du bulletin n° 7 en témoigne. Pour autant répond-il à vos attentes ?

Cette question est au centre des préoccupations du groupe et a pesé sur l’élaboration et le contenu de ce bulletin.

Une réflexion sur l’activité du GRES depuis sa création, s’appuyant sur l’analyse du contenu des 6 premiers bulletins, fait apparaître que si le groupe a toujours eu le souci de présenter des outils pédagogiques simples et directement utilisables dans une classe de TS, il y a eu aussi une certaine propension à produire des articles plus difficiles. Il y a volonté dans ce bulletin de ne pas présenter d’article de ce type mais au contraire des activités, exercices, TD tout de suite exploitables.

Y sommes-nous parvenus ? Seuls nos lecteurs peuvent nous le dire. N’hésitez pas à prendre vos plumes et à nous faire part de vos critiques y compris et surtout des plus irrévérencieuses.

- apporter une aide aux jeunes collègues débutant dans le métier et dont certaines découvrent la statistique à l’occasion de leur premier année d’exercice,

- apporter un soutien à tous les collègues en proposant des outils pédagogiques clé en main utilisés et testés par d’autres, permettant à chacun d’alléger le travail de préparation et de renouveler son enseignement,

- aider à la formation de tous en proposant dans le bulletin des références d’ouvrages de statistique, des articles plus théoriques e en participant à l’animation de stages de formation.

Tenir ces trois objectifs de façon équilibrée et transparente n’est pas chose facile. Seule la rubrique « Le coin des débutants » est parfaitement ciblée encore qu’elle fasse la part belle à la probabilité au détriment de la statistique. Par contre l’objectif de bon nombre d’articles du bulletin, outils directement utilisables dans une classe ou outils de formation, n’est pas toujours évident. Un effort de clarification est donc nécessaire.

Dans tous les cas, il n’est peut-être pas utile de rappeler que le bulletin est à l’usage des collègues qui ont à enseigner la statistique mais pas à celui des étudiants ; Si certains articles

(3)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 2 peuvent être utilisés dans une classe en l’état, il en est d’autres qu’il ne faut surtout pas proposer à nos élèves, notamment ceux destinés à alimenter notre réflexion d’enseignant sur quelques points délicats de la statistique.

Bonnes fêtes de fin d’année à tous, bonne lecture et rendez-vous au prochain bulletin.

(4)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 3

GALTON, sir Francis

(1822 Sparbrook près de Birmingham–1911 Haslemere près de Londres ). Anobli en 1909.

Issu d'une famille de scientifiques. Après des études de médecine, il explore en 1844 le Nil blanc en Egypte et en 1850 le sud-ouest africain. Il s'intéresse à la géographie et rédige deux livres : « Narrative of an Explorer in Tropical South Africa » (1853) et « Art of Tra- vel » (1855).

En 1860 il est élu membre de la Royal Society, pour ses travaux en géographie. Il étudie la météorologie afin de déterminer les parcours les plus rapides pour les navires à voile, ce qui l’amène à rédiger un ouvrage sur les méthodes de cartographie du temps : « Meteoro- graphica » (1863). Il est d’ailleurs le créateur du mot «anticyclone» et c’est lui qui en fait une étude théorique.

Il aborde divers sujets avec une volonté permanente de quantifier tout ce qu'il étudie.

Il est ainsi un des pionniers en statistique. Séduit par la théorie de l’évolution construite par son cousin, Charles Darwin, qui porte essentiellement sur les animaux et les végétaux, il veut la transposer à l’espèce humaine. Il est attiré vers l’étude de l’hérédité par son intérêt pour le «génie» héréditaire qu’il croit percevoir dans sa propre famille !, il étudie des li- gnées de «génies» : Bach, Bernoulli ou Darwin et en 1869 il publie «Hereditary Genius»

dans lequel apparaît le concept de corrélation et sa mesure par le coefficient de corrélation, sans toutefois en donner une définition précise.

Il porte son attention sur les différences entre les individus. Il pense que les attributs humains sont distribués normalement autour de la moyenne. Et à propos de la loi normale (loi de fréquence des erreurs), il écrit : «Je ne connais presque rien d'aussi impressionnant que la merveilleuse forme de l'ordre cosmique exprimée par la Loi de fréquence des er- reurs... Elle règne sereinement et avec retenue au milieu de la plus folle confusion.». Il range les individus selon des critères ordonnés et pour décrire ces distributions il construit de nouveaux objets : la médiane, les quartiles, permettant de bâtir un nouvel indicateur de dispersion : l’écart interquartile. Il mesure la performance d’un individu au pourcentage de ceux qui le dépassent. Ainsi naît l’étalonnage des tests (psychologiques).

Galton s’intéresse également à la disparition des noms de famille de certains hom- mes : nobles, juges... à l’époque on pense que les familles nobles sont peu fécondes et que, pour cette raison, la perte du nom est normale. Galton n’a pas ce point de vue et dans la revue «Educational Times» il pose en 1873 ce problème de l’extinction des lignées.

Le nom de famille n’est transmis qu’aux descendants de sexe masculin.

Soient p0, p1, p2... les probabilités pour qu’un homme ait 0, 1, 2,... fils. Chacun de ses fils a, à son tour...

Quelle est la probabilité pour que le nom de famille ait disparu au bout de n généra- tions ?

Ce problème est à l’origine de la théorie des processus généalogiques (dits aussi des rami- fications) qui débouchent sur de nombreuses applications en physique, chimie, biologie, sociologie...

(5)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 4

C’est Henry William Watson (1827–1903), mathématicien, qui publie en 1873 dans la même revue une solution du problème.

En 1874, il entreprend des expériences sur les pois de senteur. Il constate que lorsque les graines parentales s’éloignent de la taille moyenne de la population, l’ensemble des des- cendants a une moyenne plus proche de la moyenne générale. Il constate également que le taux de cette réversion (en biologie un retour au type primitif) est constant. Pour compren- dre et faire comprendre ce problème il invente un appareil, le crible, la planche ou quin- conce de Galton.

Des billes tombent verticalement sur un assemblage de clous placés en quinconce sur des lignes horizontales et équidistants de leurs voisins immédiats. Le diamètre des billes est égal à la distance entre les clous. Chaque fois qu'une bille tape un clou, elle a la même probabilité (p=0.5) de continuer sa chute à gauche ou à droite. En bas du crible se trouvent des bacs séparés dans lesquels tombent les billes. Si nous réalisons l'expérience un très grand nombre de fois, la répartition des billes s’approche d’une

«loi normale» limite de la distribution binomiale.

Puis il complique sa machine en interrompant la chute des billes à un niveau inter- médiaire qu’il recueille dans une première série de bacs, elles dessinent une première forme normale, de dispersion D1. Ensuite il rouvre les bacs séparément. Il constate deux choses : d’une part, chacun des bacs engendre une distribution normale, de mê- me dispersion D2, et d’autre part, la réunion de toutes ces petites distributions conduit à une grande distribution normale de dispersion D > D1.

En 1877 il publie l’article, «typical laws of heredity» dans lequel il précise la notion de «réversion» et il indique qu’il observe bien une décomposition de variance dans ses ex- périences sur les pois analogue à celle décrite par sa machine.

En 1884 il crée un laboratoire d’anthropométrie au sein de l’exposition internationale de médecine. Il y procède à diverses mesures sur les visiteurs, il a l’idée qu’il faut étudier un grand nombre de cas pour dégager des lois. En 1885 dans un article «Regression towards mediocrity in heredity stature» il publie les résultats de son étude sur les tailles des enfants comparées à celles de leurs parents, dans 928 familles (cf bulletin du GRES n°6). Il étudie la relation entre la taille des enfants, prise en écart par rapport à la moyenne de leur généra- tion, et celle des parents, prise aussi en écart, il constate que cet écart à la moyenne dimi- nue, c’est à dire régresse. C’est l’introduction d’une mesure numérique de la régression, et c’est notre coefficient de régression. Poursuivant cette étude avec l’aide du mathématicien J.-D. Hamilton Dickson, il exprime cette liaison en terme de loi normale bivariée. Les courbes d’égale densité sont des ellipses, il en détermine les axes (on peut y voir les prémi- ces de l’analyse en composantes principales).

En faisant l’étude des relations entre les mesures de diverses parties d’un même corps humain il constate que les coefficients de la régression de y en x et de x en y sont les mê- mes si les variables sont normalisées en terme de variabilité. Il appelle alors ce paramètre coefficient de co-relation (ou corrélation) qu’il note r (régression). Il faut noter que Galton ne calcule pas r en normant ses variables par leur écart-type, mais par l’écart interquartile.

Son champ d’étude est vaste ; il se pose la question de savoir si les femmes de Lon- dres sont les plus belles d’Angleterre, et donc du monde ! il crée un test pour décider de l’efficacité ou non d’une prière !

(6)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 5

Il consacre une attention particulière aux empreintes digitales et il met au point une métho- de d’identification des individus : la dactyloscopie, chère à qui vous savez ! «Finger Prints»

(1892).

Il crée un laboratoire qui fusionnera avec celui de biométrie de Karl Pearson pour devenir le laboratoire Galton.

Il finance la création, en 1901, de la revue Biometrika qu’il fonde avec Karl Pearson.

Il rédige 300 publications dont 17 ouvrages.

L’appareil de Galton dans «Typical laws of Heredity »(1877).

Sur internet, on peut trouver une Applet Java qui simule un crible de Galton : http://stad.dsl.nl/~berrie1/index.html

Une autre, cloudor, est un jeu :

http://perso.wanadoo.fr/becker/francois/publications/cloudor.htm

Loi Log-Normale ou loi de Galton

La loi normale modélise le cas où une variable aléatoire mesure un phénomène qui dépend d’un grand nombre de causes indépendantes dont les effets s’additionnent. Lorsque les cau- ses sont multiplicatives, par un changement de variable, avec la fonction logarithme, on obtient la loi log-normale ou loi de Galton.

La densité de probabilité est :

m 2 ) x ln(

2 1

2 e x ) 1 x ( f

σ

π

= σ

(7)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 6

Bibliographie :

1. Histoire de la statistique, Droesbeke J.J. et Tassi QSJ 2527.

2. Les fondements de l’eugénisme, J.P. Thomas QSJ 2953.

3. L’enseignement des probabilités et de la statistique Arthur Engel Cédic 4. Statistique, dictionnaire encyclopédique Yadolah Dodge Dunod.

5. La politique des grands nombres Alain Desrosières Ed la découverte.

6. L’enseignement des statistiques et des probabilités en STS Irem de Besançon.

**********

(8)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 7

A PROPOS DES TABLES DE NOMBRES AU HASARD

Dans les bulletins n°3 et n°5, nous avons publié dans le courrier des lecteurs deux exemples de séances de travaux dirigés durant lesquelles les étudiants devaient utiliser une table de nombres au hasard. Suite à vos courriers, nous allons donner, dans cet article, quelques informations sur ces tables et leur usage. Bien entendu, si vous possédez des informations supplémentaires, faites les nous parvenir, nous les publierons avec plaisir.

Compte tenu des ordinateurs et des calculatrices disponibles aujourd'hui, on peut considérer comme désuète l’utilisation des tables de nombres au hasard (et des tables de probabilités par la même occasion). Toutefois, l’apprentissage de l’utilisation de tables est (encore) éducatif, et de plus, pour faire de la simulation, pour faire comprendre ce qu’est l’échantillonnage, il est important de manipuler (au sens "faire à la main"). Une fois cet apprentissage maîtrisé, on accepte alors plus facilement le phénomène "boîte noire" que représente l’ordinateur. L’utilisation d’une table de nombres au hasard est une façon de manipuler.

1. POUR COMMENCER, QUELQUES QUESTIONS ANODINES ...

De même que le bulletin du GRES est le seul magazine à tirage aléatoire dont la seule constante est d’arriver par la poste, donner une définition d’une table de nombres au hasard n’est pas chose facile.

La traduction de « table of random numbers » est « table de nombres au hasard », on disait, il y a encore peu de temps, « table de nombres fortuits ».

D’abord, une table de nombres au hasard ne comporte qu’un nombre fini de chiffres (d'ailleurs, pourquoi ne dit-on pas "table de chiffres au hasard", ou "suite de chiffres aléatoires" ?).

De plus, que signifie "au hasard" dans l’expression "table de nombres au hasard" ?

Certains affirment : "une table de chiffres au hasard est une simulation de la loi équirépartie sur l’ensemble des chiffres".

Oui, mais dans ce cas, la suite 0, 0, 0, 1, 1, 1, 2, 2, 2... est une suite de chiffres au hasard ...

(9)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 8

Comment tester qu’une table de chiffres est une table de chiffres au hasard ? (est-ce même possible ?) A ce sujet, on pourra consulter [1] ou [2].

Est-ce que la suite des 100 000 premières décimales du nombre π peut être considérée comme une suite de chiffres aléatoires ?

Bref, tout cela n’est pas aussi simple qu’il y paraît.

2. UN PEU D’HISTOIRE ...

Dans la littérature, on trouve de nombreuses tables de nombres au hasard. Parmi les plus connues, on peut citer :

Table de TIPPETT, 1927

C’est la table la plus ancienne ; elle est constituée de 10400 nombres de 4 chiffres

« extraits des archives de recensements britanniques du 19ème siècle ».

Table de FISHER et YATES, 1943

Cette table est constituée de 7500 nombres de deux chiffres, ces chiffres provenant des décimales de rang 15 à 19 des nombres contenus dans les tables de logarithmes de A. J.

JOHNSON. Ces nombres ont ensuite été modifiés car le chiffre 6 y figurait trop souvent.

Table de la RAND CORPORATION, 1955

Cette table est composée de 1 000 000 chiffres. Ces chiffres ont été obtenus à l’aide d’une machine type « roulette électronique ». Cette table a été « ajustée » ; certains nombres apparaissant plus souvent que d’autres.

Table de KENDALL et B.B. SMITH, 1939

Cette table contient 100000 chiffres. Elle est composée de 100 feuilles de 1000 chiffres regroupés par deux ou quatre. Chaque feuille de 1000 chiffres a été testée statistiquement et peut être considérée comme approximativement satisfaisante.

Ces chiffres ont été obtenus avec une machine construite spécialement pour élaborer ces tables.

Un observateur était placé devant une machine comportant un disque divisé en 10 secteurs égaux (superposables) ; sur ces secteurs étaient inscrits les chiffres de 0 à 9.

Ce disque tournait à grande vitesse et, de temps en temps, un éclair jaillissait et éclairait ( ! ) le disque. L’observateur regardait alors le disque et notait le chiffre se trouvant devant un point fixe. Pour plus de détails voir [3].

La table ainsi obtenue a ensuite été "ajustée" car les nombres 1, 3 et 9 étaient sous- représentés.

Dans certains cas particuliers, on utilise des tables adaptées à un dispositif expérimental.

Par exemple, en agronomie, pour mettre en place un essai en carré latin, il existe des tables de plans de carrés latins (d’ordre 3, 4, ... et même jusqu'à 12), des tables de plans d’essais pour des dispositifs en blocs, des tables de permutations (pour de la "randomisation totale") etc...

Pour mettre en place un tel essai, on tire au hasard un plan dans la table des plans.

(10)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 9

Ceux (ou celles) qui sont intéressé(e)s, pourront consulter par exemple [4] ou certaines publications de l’ITCF.

Bien entendu, vous pouvez fabriquer votre table de nombres au hasard. Soit avec une calculatrice, soit avec un ordinateur. Par exemple, avec le tableur EXCEL5, la fonction ENT(100* ALEA()) renvoie (au hasard) un nombre entier naturel inférieur ou égal à 99.

3. COMMENT UTILISER UNE TABLE DE NOMBRES AU HASARD ? Selon les auteurs, les méthodes différent. Toutefois la règle générale est la suivante :

On choisit, au hasard, un point d’entrée dans la table, puis on choisit un sens de parcours de la table pour prélever les chiffres et on respecte ce sens de parcours.

Le sens de parcours peut être :

Soit à partir du point d’entrée, lire les nombres de la gauche vers la droite et du haut vers le bas.

Soit à partir du point d’entrée, lire les nombres vers le haut et de droite à gauche.

Soit à partir du point d’entrée, lire les nombres en diagonale, vers le bas et de gauche à droite...

Pour des exemples, on pourra consulter [5], [6] ou [7].

(11)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 10

EXEMPLES D’UTILISATION :

Nous prendrons un extrait des tables de Kendall et Babington Smith.

TABLE DE KENDALL ET BABINGTON SMITH

5 10 15 20 25 30 35 40 45 50

5

13407 50230 84980 22116 68645

62899 63237 62458 33646 15068

78937 94083 09703 17545 56898

90525 93634 78397 31321 84021

25033 71652 66179 65772 40115

56358 02656 46982 86506 27524

78902 57532 67619 09811 42221

47008 60307 39254 82848 88293

72488 91619 90763 92211 67592

57949 48916 74056 51178 06430

10

26518 36493 77402 83679 71802

39122 41666 12994 97154 39356

96561 27871 59892 40341 02981

56004 71329 85581 84741 89107

50260 69212 70823 08967 79788

68648 57932 53338 73287 51330

85596 65281 34405 94952 37129

83979 57233 67080 59008 31898

09041 07732 16568 95774 34011

62350 58439 00854 44927 43304

1°) On veut prélever, de façon aléatoire, 8 individus dans une population de 850 individus.

Il s'agit donc ici de 8 tirages successifs au hasard sans remise.

La première opération consiste à numéroter les 850 individus de 1 à 850.

Ensuite, on prend une table de nombres au hasard et on décide de la façon de l’utiliser.

Première méthode Par exemple :

On part de la ligne 10 et de la colonne 6 (point d'entrée dans la table).

On va de la gauche vers la droite.

On prend les chiffres par "paquets" de 3.

Dans la table, on lit les nombres suivants : 393, 560, 298, 189, 107, 797, 885, 133, 037, 129, 318, 983, 401...

On ne retient dans cette liste que les 8 premiers nombres inférieurs ou égaux à 850.

Les 8 individus constituant l’échantillon sont donc les individus respectivement numérotés : 393, 560, 298, 189, 107, 797, 133 et 037.

En effet, le nombre 885 n’est pas retenu, car il ne correspond à aucun individu.

(12)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 11

Deuxième méthode Par exemple :

On part de la ligne 1 et de la colonne 31.

On parcourt la table de haut en bas et de la gauche vers la droite.

On prélève les nombres par "paquets" de 5 (la table s’y prête).

On ne conserve dans chaque "paquet" que les trois premiers chiffres.

Dans la table, on lit :

78902 57532 67619 09811 42221 85596 65281 34405 94952 37129 Dans ce cas, les individus prélevés sont les individus respectivement numérotés : 789, 575, 676, 98, 422, 652, 344, 371 (855 et 949 étant supérieurs à 850 ne sont pas retenus).

Remarques :

Si le numéro 789, par exemple, était sorti une deuxième fois, comme il s'agissait d'un tirage "sans remise", nous n'aurions pas tenu compte du deuxième 789.

Si on avait du prélever 10 individus, les individus prélevés seraient les individus respectivement numéros : 789, 575, 676, 98, 422, 652, 344, 371, 470, 603. Le nombre 470 provient de 47008 et 603 de 60307.

Troisième méthode

On peut envisager des déplacements particuliers, par exemple celui indiqué sur le tableau ci-dessous ; les nombres choisis sont soulignés.

5 10 15 20 25 30 35 40 45 50

5

13407 50230 84980 22116 68645

62899 63237 62458 33646 15068

78937 94083 09703 17545 56898

90525 93634 78397 31321 84021

25033 71652 66179 65772 40115

56358 02656 46982 86506 27524

78902 57532 67619 09811 42221

47008 60307 39254 82848 88293

72488 91619 90763 92211 67592

57949 48916 74056 51178 06430

10

26518 36493 77402 83679 71802

39122 41666 12994 97154 39356

96561 27871 59892 40341 02981

56004 71329 85581 84741 89107

50260 69212 70823 08967 79788

68648 57932 53338 73287 51330

85596 65281 34405 94952 37129

83979 57233 67080 59008 31898

09041 07732 16568 95774 34011

62350 58439 00854 44927 43304 Les nombres ainsi prélevés sont : 502, 624, 175, 840, 502, 579, 344, 590, 340.

(13)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 12

Le nombre 502 n'est pas retenu une deuxième fois car ...

Dans ce cas, les individus retenus sont les individus respectivement numérotés : 502, 624, 175, 840, 579, 344, 590, 340.

2°) Comment simuler une variable aléatoire X de loi binomiale de paramètres n = 8 et p = 0,3 ?

Les valeurs possibles de la variable X sont les nombres entiers de 0 à 8.

On décide par exemple, de prélever dans la table de Kendall et B.B Smith les chiffres par paquets de 8.

Si on obtient le 0, le 1 ou le 2 on considère que c'est un « succès » si on obtient un autre chiffre, on considère que c'est un « échec ».

Pour chaque paquet de 8 chiffres, la valeur simulée de X est le nombre de « succès ».

Par exemple, si on choisit comme point d’entrée dans la table la deuxième ligne et la première colonne, et que l’on parcourt la table de gauche à droite et du haut vers le bas.

Les valeurs simulées de X sont présentées dans le tableau ci-dessous dans lequel S et E désignent respectivement « succès » et « échec » :

Chiffres extraits Résultat X

50230632 37940839

36347165 20265657 53260307

...

(E, S, S, E, S, E, E, S) (E, E, E, E, S, E, E, E) (E, E, E, E, E, S, E, E) (S, S, S, E, E, E, E, E) (E, E, S, E, S, E, S, E)

...

4 1 1 3 3 ...

Bien entendu, on pourrait simuler cette variable X par un autre procédé.

Par exemple :

On dispose d’une urne contenant 3 boules vertes et 7 boules rouges, les boules étant indiscernables au toucher. On effectue 8 tirages successifs d’une boule au hasard et avec remise entre les tirages.

La valeur simulée de X est, par exemple, le nombre de fois que l’on tire une boule verte.

Pour d'autres exemples de simulation voir [8].

(14)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 13

Bibliographie :

[1] APMEP Hasardons-nous brochure N° 17

[2] A. ENGEL Les certitudes du hasard ALEAS Editeur 1990 (ou l’enseignement des probabilités et des statistiques Tome 1 CEDIC).

[3] M.G. KENDAL et A.S. STUART The advanced theory of statistics Vol 1 Ed GRIFFIN [4] COX et COCHRAN Experimental design

[5] A. PASQUIER Eléments de calcul des probabilités et de théories des sondages Dunod économie 1969.

[6] P. DAGNELIE Théorie et méthodes statistiques Tome 1 Presses agronomiques de GEMBLOUX.

[7] G. BAILLARGEON Méthodes statistiques Volume 1 édition SMG 1984.

[8] N. BOULEAU Probabilités de l'ingénieur Hermann1986.

[9] V. GIARD Statistique appliquée à la gestion Economica 1995.

~≈≈≈≈≈≈≈≈≈≈~

(15)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 14

RESUME SUR LES LOIS DE PROBABILITE

UTILISEES EN STATISTIQUE INFERENTIELLE

(à l'usage du professeur)

(les lois normales et binomiales étant supposées connues)

1. Notations

On prélève un échantillon aléatoire et simple (tirages équiprobables et indépendants) de taille n dans une population dans laquelle on étudie une variable quantitative de moyenne μ et d'écart-type σ. Les observations sont alors des variables aléatoires X1, X2...,Xn indépendan- tes et de même loi que la variable parente X (de moyenne μ et d'écart-type σ).

On note :

X n X et S

n X X

i i

n

i i

= = n

= =

1 1

1

2 2

1

( )

x et s sont lesvaleursobservées de X et deS sur un échantillonde taille n donné² ² . 2. Loi de X

- Si X est de loi normale, X est de loi normale de moyenne μ et d'écart-type σ n.

- Si n est grand, la loi de X peut être approchée par la loi normale de moyenne μ et d'écart-type σ

n (quelle que soit la loi de X) d'après le théorème "central-limite".

3. Loi de χ² (khi-deux)

Définition : Une variable aléatoire K suit la loi de χ² à ν degrés de liberté si elle est la somme des carrés de ν variables aléatoires normales, centrées, réduites et indépendantes :

ν

=

=

1 i

2

Ui

K On a E(K)= ν et V(K)= 2ν

Cas particulier : Si U suit la loi N (0, 1), alors U² suit la loi de χ² à 1 ddl.

Exemple : si X est de loi normale la variable aléatoire

( )

= =

σ

μ

= μ σ

n

1 i

2 i

n

1 i

2 2 i

X X

1 suit la loi de χ² à n degrés de liberté.

(16)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 15

Propriété : La somme de deux variables de χ² indépendantes suit la loi de χ² dont le nombre de degrés de liberté est égal à la somme des nombres de d.d.l de ces deux variables.

On démontre que, si X est de loi normale,

²

² K nS

= σ suit la loi de χ² à n-1 degrés de liberté,

² ) SCE X X

² ( K 1

n

1 i

2

i = σ

=σ

=

Conséquence : estunestimateursansbiaisde ².

1 n

² donc nS 1

² n

²

E nS σ

=

σ 4. Loi de Student

Définition : Une variable aléatoire T suit la loi de Student à ν degrés de liberté si elle peut s'écrire :

T U

= K ν

où U est de loi N(0,1) et K de loi de χ² à ν degrés de liberté, U et K

étant indépendantes.

On démontre que si X est de loi normale, X et S² sont indépendantes.

T

X n nS n

X S n

=

=

σμ

σ

μ

²

( 1) ² 1

suit donc la loi de Student à n-1 degrés de liberté (si X est

de loi normale).Cette variable aléatoire est utilisée pour l'estimation par intervalle de confiance ou les tests de conformité d'une moyenne lorsque l'écart type de la population est inconnu.

Application à la comparaison de deux moyennes :

Soient deux populations distribuées normalement de moyennes μ1 et μ2 et d'écarts types σ1 et σ2. On extrait de la première population un échantillon de taille n1 et de la deuxième un échantillon de taille n2, ces 2 échantillons étant indépendants.

E X X et

V X X

n n donc

( )

( )

1 2 1 2

1 2 1

2 1

2 2 2

=

= +

μ μ

σ σ

U X X

n n

=

+

1 2 1 2

1 2 1

2 2 2

(μ μ )

σ σ est de loi normale N(0, 1).

Lorsque σ1 et σ2 sont connus on utilise U.

(17)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 16

Cas de deux populations distribuées normalement et de même variance σ² (cas déjà étudié dans le bulletin n°2):

D'après le paragraphe 3, la variable aléatoire K n S n S n S n S

= 1 12 + = + 1

2

2 22 2 2

1 12

2 22

σ σ σ2 suit la loi

de χ² à n1+n2 2 d.d.l.

La loi de T U K

n n

=

+

1 2 2

est alors la loi de Student à n1 + n2 - 2 ddl.

( ) ( )

( )

( ) ( )

(n n 2)

S n S n n

1 n

1 X X

2 n n

S n S n

n 1 n

1 X X

T

2 1 2

2 2 2 2 1 1 2

1 2

2 2 1

1

2 1 2

2 2 2 2 1 1

2 1 2

2 2 1

1

+ σ

⎟⎟ +

⎜⎜

+ σ

μ

μ

=

+ σ

+

⎟⎟

⎜⎜

+ σ

μ

μ

=

en simplifiant par σ² (il n'est donc pas nécessaire de connaître la valeur commune des deux variances) on obtient :

⎟⎟

⎜⎜

+

+

+

μ

μ

=

2 1 2

1

2 2 2 2 1 1

2 1 2

1

n 1 n

1 2 n n

S n S n

) (

) X X

T ( . Si

⎟⎟

⎜⎜

+

+

+

= μ

= μ

2 1 2

1

2 2 2 2 1 1

2 1 2

1

n 1 n

1 2 n n

S n S n

X T X

a on

, .

Remarque: n n 2

² S n S

E n 1 2

2 2 2 2 1

1 ⎟⎟= +

⎜⎜

σ

+ donc

2 n n

S n S n

2 1

2 2 2 2 1 1

+

+ est un estimateur sans biais de la variance commune σ².

5. Loi de Fisher-Snedecor

Définition : Une variable aléatoire F suit la loi de Fisher-Snedecor à n1 et n2 d.d.l si elle peut s'écrire :

. l . d . d n et n ment respective à

de loi de et

tes indépendan sont

K et K n K

n K F

2 1 2

2 1

2 2 1

1

χ

=

(18)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 17

Cas particulier : Si T suit la loi de Student à k ddl alors T² suit la loi de Fisher-Snedecor à 1 et k ddl.

Application à la comparaison de variances : si on extrait deux échantillons indépendants de tailles respectives n1 et n2 de deux populations distribuées normalement (moyennesμ1 et μ2, variances σ12 et σ22) alors la variable aléatoire

F

n S n n S

n

=

1 12 1 2 1

2 22 2 2 2

1

1 σ

σ

( )

( )

suit la loi de Fisher-Snedecor à n11et n2 1d d l. . .

ce qui donne, lorsque σ12 =σ22, :

2 2 2 1

2 2 2 2 1

2 1 1

1 n

S n

1 n

S n

F =

= .

Application à l'analyse de variance à un facteur :

On extrait de p populations distribuées normalement p échantillons indépendants de tailles respectives n1, n2,..., np (un échantillon par population). Les moyennes des p populations sont notées μ μ1, 2,...,μp et on suppose que les variances des p populations sont égales à σ².

On note :

X la iable aléatoire moyennedu i échantillon et

X n n X n n

i ième

i i i

p

i i

p

var

( )

= =

= =

1

1 1

( ) ( ) ( )

F R

T

p

1 i

ni

i j

2 i

p

1 i

ni

1 j

2 i ij p

1 i

ni

1 j

2 ij

E . C . S E

. C . S E

. C . S

X X X

X X

X

: totale iabilité

var la de ion décomposit de

égalité '

l rappelle On

+

=

+

=

∑∑ ∑∑

∑∑= = = = = =

(19)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 18

On a :

S C E n X X

S C E n S

F i i

i p

R i i

i p

. . ( )

. .

=

=

=

=

2 1

2 1 On démontre que :

2

.R

E . C . S

σ suit la loi de χ² à n - p d.d.l. (démonstration facile à réaliser à l'aide des résultats du paragraphe 3)

et que, si µ1 = µ2 = …. = µp,

2

.F

E . C . S

σ suit la loi de χ² à p - 1 d.d.l.

De plus on démontre que ces deux variables aléatoires sont indépendantes, il en résulte (après simplification par σ²) que, si les p moyennes sont égales , la variable aléatoire

F

S C E p S C E

n p

C M C M

F R

F R

=

= . .

( )

. .

( )

. .

1 suit la loi de Fisher-Snedecor à p-1 et n-p degrés de liberté.

~≈≈≈≈≈≈≈≈≈≈~

(20)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 19

TEST DE CONFORMITE POUR UNE VARIANCE ET INTERVALLE DE CONFIANCE

Exemple :

On extrait d’une fabrication, dont le caractère masse est distribué selon le modèle normal, un échantillon aléatoire simple de taille 18.

Les masses, exprimées en grammes, des 18 éléments de cet échantillon sont les suivantes : 304 334 307 309 330 314 310 316 309

314 299 311 348 290 311 309 326 278.

La moyenne de la fabrication est supposée inconnue.

Est-il possible, au seuil de 5% de conclure que la variance de la fabrication est différente de 605 ?

Proposition de corrigé :

Notations :

Soit X le caractère masse d’un élément de la fabrication.

Soit σ2 la variance de X.

Soit respectivement n et s2 la taille et la variance de l’échantillon extrait.

1) Méthode usuelle :

La variance σ2 de la population est une valeur certaine mais inconnue. Afin de répondre à la question posée dans l'énoncé ci-dessus, mettons en œuvre un test relativement à cette variance.

Formulation des hypothèses du test : H1 : σ2 ≠ 605 ; H0 : σ2 = 605.

D’après la formulation de H1 le test est bilatéral.

La variable aléatoire d’échantillonnage de la fabrication est S2, variance des échantillons aléatoires simples de taille 18 extraits de la fabrication.

La loi de probabilité de la variable aléatoire nS2

σ2 est une loi du χ2 à n − 1 degrés de liberté.

Sous l’hypothèse H0, la loi de probabilité de la variable aléatoire 605

S 18 2

est la loi du χ2 à 17 degrés de liberté.

Représentation graphique du seuil de signification du test, mise en évidence des valeurs critiques et de la région de rejet de H0 :

(21)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 20 Seuil de signification : α = 0,05

χ α

17 2 2

;

χ α

17 1 2 2

; χ2

⎯⎯⎯+⎯⎯⎯⎯⎯⎯⎯⎯+⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯

rejet de H0 non rejet de H0 rejet de H0

Les valeurs critiques χ α

17 2 2

;

et χ α

17 1 2 2

; , c’est-à-dire χ172 ;0,025 et χ172 ;0,975, sont respectivement définies par les relations :

025 , 0 nS )

( Prob et

025 , 0 nS )

(

Prob 172 ;0,975

2 2 2

025 , 0

; 2 17

2 χ =

= σ χ

σ

A l’aide d’une table de la fonction de répartition d’une variable aléatoire du χ2 à 17 degrés de liberté, on obtient :

2

025 , 0

;

χ17 = 7,56 à 10-2 près et χ172 ;0,975= 30,19 à 10-2 près.

Règle de décision :

Pour la variable aléatoire nS2

605 , la région de rejet de H0 au seuil de 5% est [0 ;7,56] ∪ [30,19; +∞ [.

Décision :

La variance s2 de l’échantillon extrait est égale à 18

5 ,

4254 soit 236,36 à 10-2 près.

Pour cet échantillon, la valeur de la variable aléatoire nS2 605 est

18 236 36 605

× ,

soit 7,03 à 10-2 près. Cette valeur appartient à la région de rejet de H0.

Donc, au seuil de 5%, au vu des observations, on rejette l’hypothèse H0.

Au seuil de 5%, au vu des observations, on peut conclure que la variance de la fabrication est différente de 605.

α/2 α/2

0

(22)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 21 2) Autre méthode :

La variance σ2 de la population est une valeur certaine mais inconnue. Afin de répondre à la question posée dans l'énoncé ci-dessus, nous allons déterminer, pour σ2, un intervalle de confiance à 95% et regarder s'il contient ou non le nombre 605.

Pour la mise en œuvre de cette méthode, nous conservons les cinq premières étapes de la méthode usuelle, la différence par rapport à cette dernière apparaissant au niveau de l’énoncé de la règle de décision.

A partir des relations équivalentes suivantes :

025 , 0 S )

(18 Prob et

025 , 0 S )

(18

Prob 172 ;0,975

2 2 2

025 , 0

; 2 17

2 χ =

= σ χ

σ

95 , 0 S )

( 18

Prob 2 172 ;0,975

2 2

025 , 0

;

17 <χ =

< σ χ

95 , 0 S )

18 S

( 18

Prob 2

025 , 0

; 17

2 2

2 975 , 0

; 17

2 =

<χ σ χ <

on établit que 18S [

S ; ] 18

2 025 , 0

; 17

2 2

975 , 0

; 17

2

χ

χ est un intervalle de confiance aléatoire de la variance σ2 au niveau de confiance 0,95.

La variance s2 de l’échantillon extrait est égale à 236,36 à 10-2 près.

. près 10

à 8 , s 562

et 18 près 10

à 9 , s 140

18 1

2 025 , 0

; 17

2 1

2 975 , 0

; 17

2 =

= χ χ

]140,9 ; 562,8[ est une estimation par intervalle de confiance à 95% de la variance σ2. On peut alors énoncer :

Règle de décision :

Au seuil de 5%, on rejette H0 si 605 n’appartient pas à l’intervalle de confiance de la variance σ2 déterminé à partir de l’échantillon extrait.

Décision :

605 n’appartient pas à]140,9 ; 562,8[.

Donc, au seuil de 5%, au vu des observations, on rejette l’hypothèse H0.

(23)

ENFA - Bulletin du GRES n°7 – janvier 1999 page 22 Remarque :

Pour le test de conformité d’une moyenne μ, on aurait pu faire de même, c'est-à-dire regarder si l'intervalle de confiance de μ déterminé à partir des observations contenait ou non la valeur proposée.

~≈≈≈≈≈≈≈≈≈≈~

Références

Documents relatifs

En cause : la question préjudicielle relative à l'article 3 de la loi du 17 juillet 1991 modifiant les lois sur les pensions de réparation, coordonnées le 5 octobre 1948, en ce

Tout arrive. Ainsi, la distribution du courrier, que je croyais maîtriser parfaitement dans mon établissement, était aléatoire et c’est seulement le n° 4 de votre bulletin qui

Une réflexion sur l’activité du GRES depuis sa création, s’appuyant sur l’analyse du contenu des 6 premiers bulletins, fait apparaître que si le groupe a toujours eu le souci de

Nous avons des idées, bon disons quelques idées, pour poursuivre dans l’esprit de ce qu’a fait le GRES jusqu’à maintenant, mais nous voulons avoir du temps pour mettre en

Nous faisons donc appel aux nombreux lecteurs du bulletin de France et d'Amérique (en effet en plus de nos collègues des Antilles qui reçoivent régulièrement le bulletin du GRES,

Une opération « Pygmalion 2 » devrait suivre et nous permettre de continuer notre réflexion et notre travail dans des conditions qui, nous l’espérons, ne seraient plus basées sur

- Toutefois, Ysengrin étant sot, il se peut qu’il ait une pièce non truquée et donc, en refusant de jouer (si avec mon essai j’obtiens un nombre de Piles trop grand), je prends

L'objet de cet article est, au travers d'un exercice somme toute banal, de se poser quelques questions sur nos pratiques et aussi d'apporter quelques réponses. Voici un