Sondages d'intention de vote : l'estimation des " marges d'erreur "

(1)

SONDAGES D’INTENTION

« M

1 Université de Bordeaux 2, CNRS, UMR

Résumé. Déterminer et publier les marges d’erreur associées aux résultats d’un sondage politique est, pour le Sénat une nécessité

réside dans le fait que, pour un échantillonnage par quotas, comme pour un échantillonnage probabiliste, le défaut de couverture, le taux de non

réponses sont autant de paramètres qui sont clairement susceptibles d’introduire des biais dans les estimations des intentions de vote.

réalisés (quotas, redressement, reconstitution de votes antérieurs…) pour essayer de les minimiser conduisent les instituts de sondage à considérer ces biais comme négligeables. En conséquence chaque marge d’erreur est alors estimée par la célèbre formule « universelle » :

En attendant 2012, on observait en 2007 (sans évoquer 2002), sur les sondages (particulièrement stables) du mois précédant le premier tour de l’élection présidentielle, que

d’intentions de votes publiées par les 6 principaux instituts de sondage français surestimaient (resp.

sous-estimaient) jusqu’à 5% le résultat de Jean

Ecarts entre les estimations des intentions

Le calcul de la marge d’erreur (demi inte d’une proportion p, issue d’un échantillon de la loi normale (raisonnable quand

On montre que l’estimation de la absolue de son biais (noté B) et du

ˆ_n(1 ˆ_n)

E

p p

M z

n

≈ − , avec z tel que

où Φ est la fonction de répartition de la loi normale standard

Cette communication développera l’analyse statistique des sondages d’intention de vote de 2007 et 2012 ainsi que la démonstration du calcul de la marge d’erreur

présentée pour 2012, sur la base de 2007. Les biais de 2012 poseront alors des bases de 2017.

Bibliographie

Portelli H., Sueur JP. (2010), Rapport d’informat

D’INTENTION DE VOTE : L’ESTIMATION MARGES D’ERREUR »

Léo Gerville-Réache¹

Université de Bordeaux 2, CNRS, UMR 5251, Bordeaux, F-33000 – leo.gerville@u

miner et publier les marges d’erreur associées aux résultats d’un sondage politique est, pour le Sénat une nécessité de transparence scientifique (Portelli

réside dans le fait que, pour un échantillonnage par quotas, comme pour un échantillonnage obabiliste, le défaut de couverture, le taux de non-réponse, les indécis ou encore l’honnêteté des réponses sont autant de paramètres qui sont clairement susceptibles d’introduire des biais dans les estimations des intentions de vote. L’apparente impossibilité d’estimer ces biais et les efforts réalisés (quotas, redressement, reconstitution de votes antérieurs…) pour essayer de les minimiser conduisent les instituts de sondage à considérer ces biais comme négligeables. En conséquence

aque marge d’erreur est alors estimée par la célèbre formule « universelle » :

En attendant 2012, on observait en 2007 (sans évoquer 2002), sur les sondages (particulièrement stables) du mois précédant le premier tour de l’élection présidentielle, que

d’intentions de votes publiées par les 6 principaux instituts de sondage français surestimaient (resp.

estimaient) jusqu’à 5% le résultat de Jean-Marie Le Pen (resp. Nicolas Sarkozy).

entre les estimations des intentions de vote et les résultats du 1^er tour de 2007 (sur les

Le calcul de la marge d’erreur (demi intervalle de confiance au niveau (1−α

d’un échantillon de n personnes est basé sur le théorème centrale limite et la loi normale (raisonnable quand n p× dépasse quelques unités).

estimation de la marge d’erreur (M_E) dépend de pˆ_n, de son écart

) et du niveau de confiance (1−α), par la formule approximative

tel que : ˆ (1 ˆ ) ˆ (1 ˆ )

/ pⁿ pⁿ / pⁿ pⁿ 1

B z B z

n n

 −   − 

Φ + − Φ − = −

   

ion de la loi normale standard.

Cette communication développera l’analyse statistique des sondages d’intention de vote de 2007 et démonstration du calcul de la marge d’erreur avec biais. Une application sera

de 2007. Les biais de 2012 poseront alors des bases de 2017.

Portelli H., Sueur JP. (2010), Rapport d’information de Sénat n°54 sur les sondages politiques.

L’ESTIMATION DES

[email protected] miner et publier les marges d’erreur associées aux résultats d’un sondage Portelli, 2010). Le problème réside dans le fait que, pour un échantillonnage par quotas, comme pour un échantillonnage réponse, les indécis ou encore l’honnêteté des réponses sont autant de paramètres qui sont clairement susceptibles d’introduire des biais dans les L’apparente impossibilité d’estimer ces biais et les efforts réalisés (quotas, redressement, reconstitution de votes antérieurs…) pour essayer de les minimiser conduisent les instituts de sondage à considérer ces biais comme négligeables. En conséquence aque marge d’erreur est alors estimée par la célèbre formule « universelle » : 1, 96 pˆ(1−pˆ) /n . En attendant 2012, on observait en 2007 (sans évoquer 2002), sur les sondages (particulièrement stables) du mois précédant le premier tour de l’élection présidentielle, que les estimations d’intentions de votes publiées par les 6 principaux instituts de sondage français surestimaient (resp.

Marie Le Pen (resp. Nicolas Sarkozy).

(sur les 30 derniers jours).

α)), de l’estimation pˆ_n personnes est basé sur le théorème centrale limite et

, de son écart-type, de la valeur ormule approximative:

ˆ (1 ˆ ) ˆ (1 ˆ )

/ pⁿ pⁿ / pⁿ pⁿ 1

B z B z

n n α

 −   − 

Φ + − Φ − = −

    ^,

Cette communication développera l’analyse statistique des sondages d’intention de vote de 2007 et biais. Une application sera de 2007. Les biais de 2012 poseront alors des bases de 2017.

ion de Sénat n°54 sur les sondages politiques.