• Aucun résultat trouvé

Statistiques inférentielles

N/A
N/A
Protected

Academic year: 2021

Partager "Statistiques inférentielles"

Copied!
5
0
0

Texte intégral

(1)

Partie I : Intervalle de confiance au niveau 0,95 (estimation d'une proportion)

Dans cette partie, on ne connaît pas la proportion p du caractère étudié dans la population totale et on cherche à l'estimer à partir de la proportion observée fobs du caractère dans un échantillon de taille n.

On doit d'abord vérifier les conditions d'utilisation de l'intervalle de confiance IC au niveau de confiance

0,95 :

{

n⩾25

0,2⩽ fobs⩽0,8

Si ces conditions sont vérifiées, la probabilité que p appartienne à IC=

[

fobs− 1

n; f obs+ 1

n

]

est proche de 0,95.

Exercice 1 : Une bouteille opaque contient des billes noires et blanches, non discernables au toucher. On ne peut pas sortir les billes de la bouteille. La seule chose qu’on peut faire est de retourner la bouteille et observer la couleur d’une bille par le goulot. Sur 250 essais on a vu 150 billes noires. Donner une fourchette d’estimation de la proportion de billes noires dans la bouteille.

Exercice 2 (fait réel) : Dimanche dernier, 22 avril 2012, a eu lieu le premier tour des élections présidentielles françaises.

François Hollande et Nicolas Sarkozy arrivent en tête, le premier avec 28,63 % des suffrages pour le premier et 27,18 % pour le second.

Ils s'affronteront donc lors du second tour, le dimanche 6 mai.

Dès la publication des résultats du premier tour, BVA réalisait pour le Parisien et Aujourd'hui en France une enquête auprès d’un échantillon de 802 Français (interrogés par téléphone ou recrutés par téléphone et interrogés par Internet le 22 avril de 20h15 à 21h30). BVA assure que la représentativité de l’échantillon est assurée par la méthode des quotas appliqués aux variables suivantes : sexe, âge, profession du chef de famille et profession de l’interviewé après stratification par région et catégorie d’agglomération.

Voici la conclusion de l'enquête : « A l’annonce des résultats du 1er tour, les Français sont 53% à avoir l’intention de voter pour François Hollande au second tour, soit 4 points de moins que mercredi et jeudi dernier. Ils sont maintenant, au contraire, 47% à penser voter pour Nicolas Sarkozy (+4 points). »

1. D'après cette enquête, et après avoir déterminé les fourchettes de sondages pour les deux candidats, compléter, pour chacun d'entre eux la phrase suivante : « D'après l'enquête, (préciser le nom du candidat) a 95 % de

chance d'obtenir au second tour entre ... % et ... % des suffrages. »

2. Le résultat de cette enquête est repris dans un article du Point publié le 22 avril après les résultats du premier tour : « François Hollande remporterait le second tour de l'élection présidentielle française par 53,0 % à 56,0 % des voix, montrent les résultats de cinq sondages réalisés dimanche après l'annonce des

estimations des résultats du premier tour. Le candidat socialiste est crédité d'un score de 53,0 % par BVA, 54,0 % par Ipsos et Harris Interactive, de 54,5 % par l'Ifop et de 56,0 % par CSA. »

Que peut-on penser de cet extrait de journal ?

(2)

3. La théorie vue en classe de seconde sur la fluctuation d'échantillonnage est très simplifiée. Pour estimer les marges d'erreur d'un sondage, les statisticiens prennent en compte de nombreux paramètres. Voici une explication donnée en entête du compte rendu de BVA.

Comme pour toute enquête quantitative, cette étude présente des résultats soumis aux marges d'erreur inhérentes aux lois statistiques. Le tableau ci-dessous présente les valeurs des marges d’erreur suivant le résultat obtenu et la taille de l’échantillon considéré :

Exemple de lecture : Dans le cas d’un échantillon de 1 000 personnes, pour un pourcentage obtenu par

enquête de 20%, la marge d’erreur est égale à 2,5. Le pourcentage a donc 95% de chance d’être compris entre 17,5% et 22,5%.

a. D'après ce tableau, quelle est en fait la marge d'erreur dans le cas de l'enquête effectuée par BVA ? b. Comparer ce résultat à celui obtenu grâce à la théorie vue en classe.

(3)

Partie II : Intervalle de fluctuation au seuil de 95 % (prise de décision) Dans cette partie :

1 - Soit on connaît la proportion p du caractère étudié dans la population totale et on s'interroge sur la conformité d'un échantillon au regard de la population.

On émet l'hypothèse que l'échantillon est conforme à la population totale.

On doit d'abord vérifier les conditions d'utilisation de l'intervalle de fluctuation IF au seuil de 95 % :

{

n⩾25

0,2⩽ p⩽0,8

Dans ces conditions, au moins 95 % des échantillons prélevés, conformes à la population, sont tels que la fréquence du caractère étudié est dans IF=

[

p−

1

n; p + 1

n

]

.

Soit f obs la fréquence observée du caractère dans l'échantillon auquel on s'intéresse.

Si f obs ∈ IF, on ne peut pas réfuter l'hypothèse et remettre en cause la conformité de l'échantillon.

Si f obs ∉ IF, on peut réfuter l'hypothèse et remettre en cause la conformité de l'échantillon, avec un risque

d'erreur inférieur à 5 %.

2 - Soit on a une information sur la proportion p du caractère étudié dans la population totale et on s'interroge sur la validité de cette information.

On émet l'hypothèse que l'information est correcte.

Si les conditions d'utilisation de l'ntervalle de fluctuation au seuil de 95 % sont vérifiées, au moins 95 % des échantillons prélevés, conformes à la population, sont tels que la fréquence du caractère étudié est dans

IF=

[

p− 1

n; p + 1

n

]

.

Si f obs ∈ IF, on ne peut pas réfuter l'hypothèse et remettre en cause l'information sur p.

Si f obs ∉ IF, on peut réfuter l'hypothèse et remettre en cause l'information sur p, avec un risque d'erreur inférieur à 5 %.

Exercice 3 : Afin de tester un dé tétraédrique, on l'a lancé. On a obtenu les résultats suivants :

Face k 1 2 3 4

Nombre de sorties de la face k 58 49 52 41

1. a) Quelle est, dans le cas d'un dé équilibré, la probabilité p d'apparition de chaque face ?

b) Déterminer, après avoir justifié qu'il est possible d'utiliser la théorie du cours, l'intervalle de fluctuation au seuil de 95 %.

2. a) Calculer et reporter dans un tableau les fréquences d'apparition des différentes faces du dé testé précédemment.

b) Il faut maintenant prendre une décision concernant le dé testé... Va-t-on décider de le considérer comme correctement équilibré ou comme pipé ?

Exercice 4 (fait réel) : Woburn est une petite ville industrielle du Massachusetts, au Nord-Est des États-Unis. Du milieu à la fin des années 1970, la communauté locale s’émeut d’un grand nombre de leucémies infantiles survenant dans certains quartiers de la ville. Les familles se lancent alors dans l’exploration des causes et constatent la présence de décharges et de friches industrielles ainsi que l’existence de polluants.

Dans un premier temps, les experts gouvernementaux concluent qu’il n’y a rien d’étrange. Mais les familles s’obstinent et saisissent leurs propres experts.

Les statistiques sont les suivantes :

Enfants entre

0 et 14 ans Population de Woburn selon lerecensement de 1970 observés à Woburn entre 1969 et 1979Nombre de cas de leucémie infantile Fréquence des leucémies auxÉtats-Unis

Filles 5779 3 0,00038

Garçons 5969 9 0,00052

Les conditions d'utilisation de l'intervalle de fluctuation vu en cours n'étant pas respectées, il faut ici trouver un intervalle de fluctuation par simulation, à l'aide de l'implémentation d'un algorithme dans un langage de programmation, ou d'un tableur.

Peut-on alors effectivement considérer la situation comme étrange (ce qui doit être fait officiellement avant que ne soient cherchées les raisons d'une éventuelle anomalie) ?

(4)

Exercice 5 : En Syldavie, il y a autant d'hommes que de femmes.

Chaque premier dimanche du mois, le Roi invite un certain nombre (toujours le même) de ses sujets à sa table (autour de laquelle 20 personnes au maximum peuvent s'asseoir).

La constitution exige que le Roi choisisse lui-même les convives par tirage au sort dans la population.

Pourtant, depuis le début de son règne, alors que 731 personnes ont profité de l'invitation du roi Baugos II, seulement 339 hommes ont participé aux festivités.

La colère du peuple grandit (surtout chez les hommes, il faut bien l'avouer) et une partie des Syldaviens exigent que Baugos II abdique !

Le juge Seconda, réputé impartial, est appelé à la cours pour trancher : s'il estime que cette situation peut être due au simple hasard, le Roi gardera sa couronne, sinon il sera démis de ses fonctions.

1. a. Carluis, assistant du juge, fait l'hypothèse que Baugos II a procédé en toute honneteté en choisissant effectivement les convives au hasard. Montrer que les conditions sont réunies pour utiliser l'intervalle IF

de fluctuation au seuil de 95 %.

b. Donner IF (bornes exactes dans un premier temps puis approchées à 10−4 près).

c. Quelle décision peut suggérer Carluis au juge Seconda ?

2. a. Le juge Seconda met en doute la précision de l'intervalle proposé par son assistant, d'autant qu'il lui paraît que le résultat n'est pas probant et mérite d'être confronté à une autre méthode.

Il construit alors l'algorithme fourni en annexe, dont la première partie sert à simuler N prélèvements au hasard de 731 personnes dans une population comportant autant d'hommes que de femmes : les proportions d'hommes obtenues dans chacun de ces échantillons sont rangées dans une liste L.

Compléter, sur l'annexe II, la première partie de l'algorithme

b. La deuxième partie de l'algorithme permet d'obtenir en sortie l'intervalle de fluctuation au seuil de 95 % obtenu grâce à cette simulation.

Voici les résultats qu'il obtient après avoir implémenter cet algorithme en Python 3, et mis le programme en œuvre plusieurs fois :

Au risque de planter son ordinateur, il essaie même :

Et enfin, il prend une décision définitive. Laquelle ?

(5)

ANNEXE Variables : N, h, alea, effectif : entiers

rayon, taux : réels L : liste

début Entrée : saisir N

Traitement : pour i allant de 1 à N faire L[i] ← 0

fin pour

pour i allant de 1 à N faire h ← …..

pour j allant de 1 à ….. faire

alea ← nombre pseudo-aléatoire dans {0 ; 1} h ← …... finpour L[i] ← ... finpour rayon ← 0 taux ← 0

tant que taux < 0,95 faire effectif ← 0

pour i allant de 1 à N faire

si 0,5 – rayon  L[i]  0,5 + rayon alors faire effectif ← effectif + 1 finsi finpour taux ← effectif/N rayon ← rayon + 0,000 1 fintantque

Sortie : afficher la valeur minimum de la liste L afficher la valeur maximum de la liste L afficher l'intervalle [0,5 – rayon ; 0,5 + rayon] fin

première partie

Références

Documents relatifs

En France, François Hollande semble avoir lu notre chronique de la semaine dernière intitulée « Ce que François Hollande aurait du dire si sa conférence de presse avait

Avec la non prise en compte politique de ce résultat par les pouvoirs publics nationaux, sous François Hollande, puis sous le président Macron, l'avis des citoyens, exprimé dans

Pour le moyen terme, compte tenu du caractère transversal des questions régionales et locales, l’ensemble de nos propositions a été repris dans le corps du projet d’avis

A la présidentielle de 2012, François Hollande remporte le deuxième tour de l'élection face à Nicolas Sarkozy avec 51,62 % des suffrages exprimés.. On a simulé les résultats de

A la présidentielle de 2012, François Hollande remporte le deuxième tour de l'élection face à Nicolas Sarkozy avec 51,62 % des suffrages exprimés.. On a simulé les résultats de

A la présidentielle de 2012, François Hollande remporte le deuxième tour de l'élection face à Nicolas Sarkozy avec 51,62 % des suffrages exprimés.. On a simulé les résultats de

A la présidentielle de 2012, François Hollande remporte le deuxième tour de l'élection face à Nicolas Sarkozy avec 51,62 % des suffrages exprimés.. On a simulé les résultats de

A la présidentielle de 2012, François Hollande remporte le deuxième tour de l'élection face à Nicolas Sarkozy avec 51,62% des suffrages exprimés?. On a simulé les résultats de