• Aucun résultat trouvé

L’échantillon est-il représentatif de la population ?

N/A
N/A
Protected

Academic year: 2022

Partager "L’échantillon est-il représentatif de la population ? "

Copied!
2
0
0
En savoir plus ( Page)

Texte intégral

(1)

Douine – Terminale S – Travail à distance 45

Page 1

D’un intervalle de fluctuation asymptotique vers un intervalle de confiance

On souhaite estimer la prévalence du surpoids dans une ville, c’est-à-dire la proportion de personnes ayant une masse trop importante par rapport à leur taille. Pour cela 460 personnes ont été sélectionnées de manière aléatoire à partir de la liste des logements connue par la municipalité, c’est-à-dire que le fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au hasard. On admet que cette procédure permet d’assimiler la sélection des personnes interrogées à un schéma de Bernoulli. Un enquêteur s’est déplacé au sein de chaque logement après avoir convenu d’un rendez-vous afin de recueillir les informations nécessaires à l’enquête.

L’échantillon est-il représentatif de la population ?

Dans un premier temps, l’enquêteur va s’assurer que l’échantillon est représentatif de la population qu’on étudie sur des informations qu’on peut vérifier et qui sont en lien avec le critère étudié. Dans le cas présent on peut connaître par exemple la proportion d’hommes et de femmes dans la population de la ville, ainsi que la répartition selon l’âge en demandant à la municipalité qui se référera aux informations du recensement.

Ainsi on sait que dans la population il y a 46%

d’hommes et 20% de personnes de plus de 60.

Parallèlement on peut comptabiliser le nombre d’hommes et de femmes dans l’échantillon ainsi que la répartition selon l’âge.

Homme Femme Total échantillon 200 260 460

<60ans >60ans Total échantillon 352 108 460

1. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion de femmes » dans un échantillon aléatoire de taille 460.

2. Déterminer l’intervalle de fluctuation asymptotique au seuil de 95% de la variable aléatoire « proportion des plus de 60 ans » dans un échantillon aléatoire de taille 460.

3. Si pour chacune de ces variables aléatoires, genre et âge, l’intervalle de fluctuation

asymptotique contient la valeur de l’échantillon, on considère que l’échantillon est

représentatif de la population pour ces informations. Quelle conclusion peut-on tirer ici ?

(2)

Douine – Terminale S – Travail à distance 45

Page 2

La première étape de ce travail a donc été de sélectionner un échantillon qui soit accepté comme

« représentatif » de la population. Ainsi les informations qui seront obtenues à partir de cet échantillon seront généralisables, avec un certain nombre de précautions, à l’ensemble de la population dont il est extrait.

Dans le cas de l’étude présentée ici, on souhaite estimer la proportion de personnes en surpoids ; pour cela il est tout d’abord important de définir le surpoids. La définition du surpoids donnée par l’OMS (Organisation Mondiale de la Santé) est la suivante : une personne est considérée en surpoids si son IMC (Indice de masse corporelle) est supérieur à 25. L’IMC se calcule de la manière suivante : masse en kg/(taille en m)².

Intervalle de confiance d’une probabilité

La proportion de personnes en surpoids dans l’échantillon étudié est de 29,5%. Comme il s’agit

d’un calcul réalisé à partir des données d’un échantillon on sait que cette valeur ne correspond

pas exactement à la valeur de la prévalence du surpoids dans la population, car si nous avions pris

un autre échantillon nous aurions obtenu une autre valeur. Pour cette raison il est nécessaire de

communiquer un intervalle qui sera obtenu à partir des informations observées et pour lequel on

puisse dire avec un « niveau de confiance » supérieur à 0,95 qu’il contient la vraie valeur de la

prévalence du surpoids dans la ville. Déterminer graphiquement cet intervalle de confiance.

Références

Documents relatifs

Pour le Sénat dans la proposition de loi du 14 févier 2010 sur les sondages : « Un sondage est une enquête statistique visant à donner une indication quantitative, à une

On cherche ` a d´ eterminer un intervalle de confiance pour p au niveau de confiance 99% (1% de risque) 1.. Je pense donc que oui.. a) D i est la diff´ erence du nombre de p` eche

1 Utilisez n'importe quels numéros de téléphone qui requièrent de répondre en tapant ses réponses sur les touches du téléphone. Pratiquez jusqu'à ce que vous puissiez

Les nombres sur l’axe des abscisses représentent les numéros des simulations et les nombres sur l’axe des ordonnées représentent les fréquences (simulées) d’animaux

Remarque : Le problème qui se pose ici est de nature très différente de celui qui se pose pour l'intervalle de confiance d'une moyenne lorsque l'écart type de la population n'est

Pour un apprentissage utile de la correction / révision de l’écrit, les utilisateurs doivent absolument être initiés au fonctionnement des correcticiels (bien comprendre

Nous restons consciente que les interactions verbales analysées ici dépendent étroitement de la nature du logiciel sur lequel travaillent les apprenants, mais c'est justement ce

Face aux volontés d’un alignement défavorable du public vers le privé, le SNES-FSU, attaché au code des pensions, au droit pour le public comme pour le privé à la retraite dès 60

Conclusion : Pour comparer les résultats d’un modèle de régression avec un modèle théorique, il faut considérer simultanément tous les coefficients du modèle et donc

Pour cette raison il est nécessaire de communiquer un intervalle qui sera obtenu à partir des informations observées et pour lequel on puisse dire avec un « niveau de

Si on considère 577 personnes françaises tirées aléatoirement avec remise, à quel intervalle appartiendra la proportion de femmes parmi ces 577 personnes avec une probabilité

Sous l’hypothèse que l’échantillon est issu d’un tirage aléatoire correspondant à un schéma de Bernoulli (tirage avec remise ou s’y apparentant), la

Un échantillon de taille 200 a été réalisé pour estimer le nombre moyen d’appels par minute ; c’est un échantillon de taille 50 pour la variable précédente (nombre

Combien de pi` eces doit-on contrˆ oler pour que la proportion observ´ ee soit correcte ` a 1% pr` es au risque de 5%.. On consid` ere 10 sujets pris comme leurs propres

Supposer que c’est un échantillon simple et utiliser les caractéristiques suivantes pour construire un intervalle de confiance à 95% de l’écart type pour les

[r]

Déterminer le nombre minimal de clients qu’il faut interroger pour estimer la proportion p de clients qui trouvent le temps d’attente aux caisses raisonnable avec une

paramètre θ à l’aide d’un estimateur sans biais de θ Soit X une v.a.r... Ainsi, une marge d’erreur faible produit un niveau de risque élevé et un niveau de

Il s'agit d'une suite de 100 intervalles de confiance au niveau de confiance 0,95, dont chacun a été calculé sur un échantillon de taille 1000 simulé à partir de ce que fut le score

Pour cela, elle souhaite obtenir, à partir d’un échantillon aléatoire, une estimation de la proportion de clients satisfaits au niveau 0,95 avec un intervalle de confiance

Il s'agit d'une suite de 100 intervalles de confiance au niveau de confiance 0,95, dont chacun a été calculé sur un échantillon de taille 1000 simulé à partir de ce que fut le score

Le

Donner un intervalle de fluctuation au seuil de 95% de la fr´ equence de personnes satisfaits de la qualit´ e des produits commercialis´ es par son entreprise2. Parmi les