L3 É
CONOMIE- M
ODULE2 S
TATISTIQUES ETA
NALYSE DED
ONNÉES3
Julie Scholler - Bureau B246
janvier 2021
.
Contenu de l’enseignement
• Discussion autour de l’utilisation de la statistique fréquentiste, principalement lors de tests d’hypothèses
• Estimation bayésienne
• loi a priori et a posteriori discrète
• estimation d’une proportion avec loi a priori continue
• estimation d’une moyenne
• autres exemples d’estimation ponctuelle
• utilisation de la loi a posteriori
• choix de la loi a priori
• Théorie bayésienne des tests
.
Prérequis
• Probabilités de L1
• Statistique inférentielle de L2
Structure
• 9 séances de cours magistraux de 2h dont deux contrôles continus
• 4 séances de travaux dirigés de 2h
.
Planning prévisionnel
Semaine CM - Thème TD - Thème
25/01 CM1 - C1 Regard critique sur la statistique fréquentiste
01/02 CM2 - Fin C1 + début du C2 Introduction à l’estimation bayésienne
08/02 CM3 - fin C2 + C3 Estimation bayésienne d’une proportion
TD1 G1
15/02 CM4 - C3 suite et fin TD1 G2
22/02 TD2 G1 TD2 G2
01/03 Pause Pause
08/03 CC1 - C1, C2 et C3
15/03 CM5 - C4 Estimation bayésienne : cas d’une vraisemblance continue
22/03 CM6 - C4 TD3 G1
29/03 CM7 - C5 - Tests bayésiens TD3 G2
05/04 TD4 G1 et TD4 G2
12/04 CC2 19/04
Le placement des TD est sujet à modification.
.
Deux paradigmes
Paradigme Fréquentiste
• probabilités dites objectives
• tendance des dispositifs aléatoires à produire certains résultats avec des fréquences stables
• fréquence à long terme
• « théorie de la nature » Paradigme Bayésien
• probabilités dites subjectives
• degré de certitude/croyance/connaissance a priori (éventuellement basé sur des éléments de preuve)
• traduction chiffrée de l’état de la connaissance
• « théorie de la connaissance »
.
En théorie de l’estimation
Statistique Fréquentiste
• paramètre θ inconnu considéré comme déterministe
• estimation menée en considérant que l’on ignore tout de θ à part son support
• sur le long terme notre estimation tend à être bonne Statistique Bayésienne
• paramètre θ inconnu considéré comme aléatoire
• estimation menée en prenant en compte toutes les informations que l’on a au préalable sur θ
• expériences similaires
• avis d’expert du phénomène
• mise à jour de nos croyances suite à l’observation de données
.
En théorie des tests
Randall Munroe : https: // www. xkcd. com/ 1132/
C1. R
EGARD CRITIQUE SUR LA STATISTIQUE FRÉQUENTISTEJulie Scholler - Bureau B246
janvier 2021
I. Rappels
I. Rappels
Test d’hypothèses
Mécanisme permettant de trancher entre deux hypothèses à la vue des résultats d’un échantillon, en quantifiant le risque associé à la prise de décision
Hypothèses • H0 (hypothèse de référence, hypothèse nulle)
• H1 (hypothèse alternative) Décision choix entre H0 et H1
Toute décision comporte un risque.
I. Rappels
Type d’erreurs
Erreur de première espèce décision de rejeter H0 alors que H0 est vraie, risque associé : α
Erreur de seconde espèce décision de ne pas rejeter H0 alors que H0 est fausse, risque associé : β
H0 vraie H1 vraie Ne pas rejeter H0 1− α β
Rejeter H0 α 1−β
I. Rappels
Types d’erreur
Allison Horst
I. Rappels
Types d’erreur
Allison Horst
I. Rappels
Test en statistique fréquentiste
Approche de Neyman–Pearson
• Statistique de test : T
• Zone de rejet W telle que PH0(T ∈ W) = α
• Règle de décision : si tobs ∈ W, alors on rejette H0 Justification
Sur le long terme, on ne rejettera H0 à tort que dans une proportion α des cas.
P-value
PH0 (observer des données aussi extrèmes que tobs) Point de vue de Fisher
• p-value : mesure de crédibilité de H0, nous dit à quel point nos données sont surprenantes si on suppose que H0 est vraie
I. Rappels
Quelques critiques
• La p-value ne nous donne pas la probabilité que l’on veut P(H0 soit vraie | les données observées)
• si p < 0.05, on n’a pas 95% de chance que H1 soit vraie.
• si p > 0.05, les données sont considérées comme non surprenantes. Cela ne signifie pas que H0 est vraie.
• Sur beaucoup d’études où H0 est vraie, dans environ 5%
d’entre elles, les données nous amènent à rejeter H0
II. Erreurs de première et second espèces
• Taux d’erreur : concept fréquentiste
• Objectif : ne pas se tromper trop souvent sur le long terme
• « Why Most Published Research Findings Are False » John Ioannides (2005)
Proba. condi. H0 vraie H1 vraie Ne pas rejeter H0 1− α β
Rejeter H0 α 1− β
II. Erreurs de première et second espèces
• Taux d’erreur : concept fréquentiste
• Objectif : ne pas se tromper trop souvent sur le long terme
• « Why Most Published Research Findings Are False » John Ioannides (2005)
Cas où P(H0 vraie) = 0.5 et P(H1 vraie) = 0.5 avec α = 0.05 et 1− β = 0.8
Probabilités H0 vraie H1 vraie Ne pas rejeter H0 0.475 0.100
Rejeter H0 0.025 0.400
P(la conclusion est correcte | on a rejeté H0) = 0.4
0.425 ' 0.94
II. Erreurs de première et second espèces
Applicaton Shiny avec R
II. Erreurs de première et second espèces
• Sur beaucoup d’études où H0 est vraie, environ 5% nous amènent à rejeter H0
• « Un résultat sur 20 dans la littérature sont des erreurs de première espèce »
Non car les résultats publiés sont ceux ayant amené à rejeter H0 et non ceux où H0 est vraie
• Sur beaucoup d’études où H0 est vraie, environ 5% nous amènent à rejeter H0 → p-hacking ou data-dredging
II. Erreurs de première et second espèces
p-hacking
Randall Munroe : https: // www. xkcd. com/ 882/
II. Erreurs de première et second espèces
II. Erreurs de première et second espèces
p-hacking
Randall Munroe : https: // www. xkcd. com/ 882/
III. À quelle p-value s’attendre ?
À quelle p-value s’attendre si H1 est vraie ?
À quelle p-value s’attendre si H0 est vraie ?
III. À quelle p-value s’attendre ?
Simulation de 100 000 expériences avec H
1vraie
Répartition des p-values pour une puissance de 50 %
P-values
Effectifsdesp-values
0.0 0.2 0.4 0.6 0.8 1.0
0 10000 20000 30000 40000 50000
III. À quelle p-value s’attendre ?
Simulation de 100 000 expériences avec H
1vraie
Répartition des p-values pour une puissance de 74.3 %
P-values
Effectifsdesp-values
0.0 0.2 0.4 0.6 0.8 1.0
0 20000 40000 60000
III. À quelle p-value s’attendre ?
Si H
1est vraie
• la proportion de p-value inférieures à α correspond à 1− β
• plus la puissance du test est élevée plus on observe des p-value petites si H1 est vraie
III. À quelle p-value s’attendre ?
Si H
0est vraie
III. À quelle p-value s’attendre ?
Simulation de 100 000 expériences avec H
0vraie
Répartition des p-values
P-values
Effectifsdesp-values
0.0 0.2 0.4 0.6 0.8 1.0
0 1000 2000 3000 4000 5000 6000
III. À quelle p-value s’attendre ?
Simulation de 100 000 expériences avec H
0vraie
Répartition des p-values
P-values
Fréquencesdesp-values
0.0 0.2 0.4 0.6 0.8 1.0
0.0 0.2 0.4 0.6 0.8 1.0 1.2
III. À quelle p-value s’attendre ?
• Si H0 est vraie, les p-value se répartissent uniformément entre 0 et 1.
• Si H0 est vraie, on a autant de chances d’avoir une p-value entre 0.8 et 0.85 qu’entre 0.1 et 0.15 ou entre 0 et 0.05.
Attention
Si l’échantillon est très grand, la puissance du test est très élevée.
On aura
P(p-value ∈ [0.04; 0.05]|H0 vraie) > P(p-value ∈ [0.04; 0.05]|H1 vraie)
III. À quelle p-value s’attendre ?
IV. Alternatives
• Intervalles de confiance
• Taille d’effet et analyse de puissance
• Rapport de vraisemblance
• Statistique bayésienne
IV. Alternatives
Intervalle de confiance - Exemple
X suit une loi à densité dépendant d’un paramètre θ (inconnu) vérifiant E(X) = θ + 1 et V(X) = 1.
On a observé 30 valeurs :
9.1 9.2 9.2 9.2 9.2 9.3 9.4 9.4 9.5 9.5 9.6 9.7 9.8 9.9 9.9 10.0 10.1 10.5 10.6 10.6 10.6 10.7 10.9 11.0 11.2 11.2 12.3 13.5 13.7 17.7 On souhaite une estimation par intervalle de confiance du θ.
Avec θb ∼
approx N
θ; 1
√n
, on a IC95%approx =
X − 1±1.96× 1
√n
. On obtient [9.19 ; 9.91].
Comment interpréter le résultat ?
• Shiny app : Explorer les intervalles de confiance
• Seeing Probability and Statistics
IV. Alternatives
Niveau de confiance 1 − α
Si on réalise plein de sondages notre méthode nous assure qu’une proportion 1−α des intervalles de confiance construits contiendront la vraie valeur à estimer.
Un statisticien fréquentiste doit dire
« il y a 95% de chance que, quand je calcule un intervalle de confiance à partir de données selon cette procédure, l’intervalle
obtenu contienne la vraie valeur de θ » et ne peut rien dire sur l’intervalle numérique obtenu.
IV. Alternatives
Exemple
X suit une loi à densité dépendant d’un paramètre θ (inconnu) vérifiant E(X) = θ + 1 et V(X) = 1.
On a observé 30 valeurs :
9.1 9.2 9.2 9.2 9.2 9.3 9.4 9.4 9.5 9.5 9.6 9.7 9.8 9.9 9.9 10.0 10.1 10.5 10.6 10.6 10.6 10.7 10.9 11.0 11.2 11.2 12.3 13.5 13.7 17.7 et on a obtenu l’intervalle de confiance suivant :
[9.19 ; 9.91]
Précision sur la loi de X
fX(x) = eθ−x1[θ;+∞[(x) Commentaires ?
IV. Alternatives
Jamais d’inférence sans
• une analyse descriptive des données
• représentation graphique
• cerveau en marche