SONDAGES D’INTENTION
« M
1 Université de Bordeaux 2, CNRS, UMR
Résumé. Déterminer et publier les marges d’erreur associées aux résultats d’un sondage politique est, pour le Sénat une nécessité
réside dans le fait que, pour un échantillonnage par quotas, comme pour un échantillonnage probabiliste, le défaut de couverture, le taux de non
réponses sont autant de paramètres qui sont clairement susceptibles d’introduire des biais dans les estimations des intentions de vote.
réalisés (quotas, redressement, reconstitution de votes antérieurs…) pour essayer de les minimiser conduisent les instituts de sondage à considérer ces biais comme négligeables. En conséquence chaque marge d’erreur est alors estimée par la célèbre formule « universelle » :
En attendant 2012, on observait en 2007 (sans évoquer 2002), sur les sondages (particulièrement stables) du mois précédant le premier tour de l’élection présidentielle, que
d’intentions de votes publiées par les 6 principaux instituts de sondage français surestimaient (resp.
sous-estimaient) jusqu’à 5% le résultat de Jean
Ecarts entre les estimations des intentions
Le calcul de la marge d’erreur (demi inte d’une proportion p, issue d’un échantillon de la loi normale (raisonnable quand
On montre que l’estimation de la absolue de son biais (noté B) et du
ˆn(1 ˆn)
E
p p
M z
n
≈ − , avec z tel que
où Φ est la fonction de répartition de la loi normale standard
Cette communication développera l’analyse statistique des sondages d’intention de vote de 2007 et 2012 ainsi que la démonstration du calcul de la marge d’erreur
présentée pour 2012, sur la base de 2007. Les biais de 2012 poseront alors des bases de 2017.
Bibliographie
Portelli H., Sueur JP. (2010), Rapport d’informat
D’INTENTION DE VOTE : L’ESTIMATION MARGES D’ERREUR »
Léo Gerville-Réache1
Université de Bordeaux 2, CNRS, UMR 5251, Bordeaux, F-33000 – leo.gerville@u
miner et publier les marges d’erreur associées aux résultats d’un sondage politique est, pour le Sénat une nécessité de transparence scientifique (Portelli
réside dans le fait que, pour un échantillonnage par quotas, comme pour un échantillonnage obabiliste, le défaut de couverture, le taux de non-réponse, les indécis ou encore l’honnêteté des réponses sont autant de paramètres qui sont clairement susceptibles d’introduire des biais dans les estimations des intentions de vote. L’apparente impossibilité d’estimer ces biais et les efforts réalisés (quotas, redressement, reconstitution de votes antérieurs…) pour essayer de les minimiser conduisent les instituts de sondage à considérer ces biais comme négligeables. En conséquence
aque marge d’erreur est alors estimée par la célèbre formule « universelle » :
En attendant 2012, on observait en 2007 (sans évoquer 2002), sur les sondages (particulièrement stables) du mois précédant le premier tour de l’élection présidentielle, que
d’intentions de votes publiées par les 6 principaux instituts de sondage français surestimaient (resp.
estimaient) jusqu’à 5% le résultat de Jean-Marie Le Pen (resp. Nicolas Sarkozy).
entre les estimations des intentions de vote et les résultats du 1er tour de 2007 (sur les
Le calcul de la marge d’erreur (demi intervalle de confiance au niveau (1−α
d’un échantillon de n personnes est basé sur le théorème centrale limite et la loi normale (raisonnable quand n p× dépasse quelques unités).
estimation de la marge d’erreur (ME) dépend de pˆn, de son écart
) et du niveau de confiance (1−α), par la formule approximative
tel que : ˆ (1 ˆ ) ˆ (1 ˆ )
/ pn pn / pn pn 1
B z B z
n n
− −
Φ + − Φ − = −
ion de la loi normale standard.
Cette communication développera l’analyse statistique des sondages d’intention de vote de 2007 et démonstration du calcul de la marge d’erreur avec biais. Une application sera
de 2007. Les biais de 2012 poseront alors des bases de 2017.
Portelli H., Sueur JP. (2010), Rapport d’information de Sénat n°54 sur les sondages politiques.
L’ESTIMATION DES
leo.gerville@u-bordeaux2.fr miner et publier les marges d’erreur associées aux résultats d’un sondage Portelli, 2010). Le problème réside dans le fait que, pour un échantillonnage par quotas, comme pour un échantillonnage réponse, les indécis ou encore l’honnêteté des réponses sont autant de paramètres qui sont clairement susceptibles d’introduire des biais dans les L’apparente impossibilité d’estimer ces biais et les efforts réalisés (quotas, redressement, reconstitution de votes antérieurs…) pour essayer de les minimiser conduisent les instituts de sondage à considérer ces biais comme négligeables. En conséquence aque marge d’erreur est alors estimée par la célèbre formule « universelle » : 1, 96 pˆ(1−pˆ) /n . En attendant 2012, on observait en 2007 (sans évoquer 2002), sur les sondages (particulièrement stables) du mois précédant le premier tour de l’élection présidentielle, que les estimations d’intentions de votes publiées par les 6 principaux instituts de sondage français surestimaient (resp.
Marie Le Pen (resp. Nicolas Sarkozy).
(sur les 30 derniers jours).
α)), de l’estimation pˆn personnes est basé sur le théorème centrale limite et
, de son écart-type, de la valeur ormule approximative:
ˆ (1 ˆ ) ˆ (1 ˆ )
/ pn pn / pn pn 1
B z B z
n n α
− −
Φ + − Φ − = −
,
Cette communication développera l’analyse statistique des sondages d’intention de vote de 2007 et biais. Une application sera de 2007. Les biais de 2012 poseront alors des bases de 2017.
ion de Sénat n°54 sur les sondages politiques.