• Aucun résultat trouvé

L’échantillon est-il représentatif de la population ?

N/A
N/A
Protected

Academic year: 2022

Partager "L’échantillon est-il représentatif de la population ? "

Copied!
2
0
0

Texte intégral

(1)

Douine – Terminale S – Travail à distance 45 - CORRECTION

Page 1

D’un intervalle de fluctuation asymptotique vers un intervalle de confiance

On souhaite estimer la prévalence du surpoids dans une ville, c’est-à-dire la proportion de personnes ayant une masse trop importante par rapport à leur taille. Pour cela 460 personnes ont été sélectionnées de manière aléatoire à partir de la liste des logements connue par la municipalité, c’est-à-dire que le fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au hasard. On admet que cette procédure permet d’assimiler la sélection des personnes interrogées à un schéma de Bernoulli. Un enquêteur s’est déplacé au sein de chaque logement après avoir convenu d’un rendez-vous afin de recueillir les informations nécessaires à l’enquête.

L’échantillon est-il représentatif de la population ?

Dans un premier temps, l’enquêteur va s’assurer que l’échantillon est représentatif de la population qu’on étudie sur des informations qu’on peut vérifier et qui sont en lien avec le critère étudié. Dans le cas présent on peut connaître par exemple la proportion d’hommes et de femmes dans la population de la ville, ainsi que la répartition selon l’âge en demandant à la municipalité qui se référera aux informations du recensement.

Ainsi on sait que dans la population il y a 46%

d’hommes et 20% de personnes de plus de 60.

Parallèlement on peut comptabiliser le nombre d’hommes et de femmes dans l’échantillon ainsi que la répartition selon l’âge.

Homme Femme Total échantillon 200 260 460

<60ans >60ans Total échantillon 352 108 460

1. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion de femmes » dans un échantillon aléatoire de taille 460.

2. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion des plus de 60 ans » dans un échantillon aléatoire de taille 460.

3. Si pour chacune de ces variables aléatoires, genre et âge, l’intervalle de fluctuation asymptotique contient la valeur de l’échantillon, on considère que l’échantillon est représentatif de la population pour ces informations. Quelle conclusion peut-on tirer ici ?

 

460 0,54

0, 494; 0,586 260 0,565

obs

460

n

p I

f I

  

On peut en déduire que l’échantillon est représentatif pour la proportion de femme.

 

460 0, 2

0,163; 0, 237 108 0, 235

obs

460

n

p I

f I

  

On peut en déduire que l’échantillon est représentatif pour la proportion de + de 60 ans.

(2)

Douine – Terminale S – Travail à distance 45 - CORRECTION

Page 2

La première étape de ce travail a donc été de sélectionner un échantillon qui soit accepté comme

« représentatif » de la population. Ainsi les informations qui seront obtenues à partir de cet échantillon seront généralisables, avec un certain nombre de précautions, à l’ensemble de la population dont il est extrait.

Dans le cas de l’étude présentée ici, on souhaite estimer la proportion de personnes en surpoids ; pour cela il est tout d’abord important de définir le surpoids. La définition du surpoids donnée par l’OMS (Organisation Mondiale de la Santé) est la suivante : une personne est considérée en surpoids si son IMC (Indice de masse corporelle) est supérieur à 25. L’IMC se calcule de la manière suivante : masse en kg/(taille en m)².

Intervalle de confiance d’une probabilité

La proportion de personnes en surpoids dans l’échantillon étudié est de 29,5%. Comme il s’agit

d’un calcul réalisé à partir des données d’un échantillon on sait que cette valeur ne correspond

pas exactement à la valeur de la prévalence du surpoids dans la population, car si nous avions pris

un autre échantillon nous aurions obtenu une autre valeur. Pour cette raison il est nécessaire de

communiquer un intervalle qui sera obtenu à partir des informations observées et pour lequel on

puisse dire avec un « niveau de confiance » supérieur à 0,95 qu’il contient la vraie valeur de la

prévalence du surpoids dans la ville. Déterminer graphiquement cet intervalle de confiance.

Références

Documents relatifs

Déterminer le nombre minimal de clients qu’il faut interroger pour estimer la proportion p de clients qui trouvent le temps d’attente aux caisses raisonnable avec une

Combien de pi` eces doit-on contrˆ oler pour que la proportion observ´ ee soit correcte ` a 1% pr` es au risque de 5%.. On consid` ere 10 sujets pris comme leurs propres

Remarque : Le problème qui se pose ici est de nature très différente de celui qui se pose pour l'intervalle de confiance d'une moyenne lorsque l'écart type de la population n'est

Donner un intervalle de fluctuation au seuil de 95% de la fr´ equence de personnes satisfaits de la qualit´ e des produits commercialis´ es par son entreprise2. Parmi les

On cherche ` a d´ eterminer un intervalle de confiance pour p au niveau de confiance 99% (1% de risque) 1.. Je pense donc que oui.. a) D i est la diff´ erence du nombre de p` eche

paramètre θ à l’aide d’un estimateur sans biais de θ Soit X une v.a.r... Ainsi, une marge d’erreur faible produit un niveau de risque élevé et un niveau de

Il s'agit d'une suite de 100 intervalles de confiance au niveau de confiance 0,95, dont chacun a été calculé sur un échantillon de taille 1000 simulé à partir de ce que fut le score

Pour cela, elle souhaite obtenir, à partir d’un échantillon aléatoire, une estimation de la proportion de clients satisfaits au niveau 0,95 avec un intervalle de confiance