• Aucun résultat trouvé

1 Illustrations de la L.F.G.N.

N/A
N/A
Protected

Academic year: 2021

Partager "1 Illustrations de la L.F.G.N."

Copied!
4
0
0

Texte intégral

(1)

Universit´e des Sciences et Technologies de Lille U.F.R. de Math´ematiques Pures et Appliqu´ees

IS-Math314 Ann´ee 2004-2005

T.P no1, th´eor`emes limites

1 Illustrations de la L.F.G.N.

1.1 Convergence des fr´equences

Une application importante de la loi forte des grands nombres est la convergence des fr´equences de succ`es dans une suite d’´epreuves r´ep´et´ees de Bernoulli ind´ependantes.

Ex´ecutez plusieurs fois1 le script cvfreqIS.sce en donnant diff´erentes valeurs `a n et p. Zoomez sur les trajectoires obtenues.

1.2 L.F.G.N. pour diverses lois de X

A faire plus tard. En s’inspirant du script sur la convergence des fr´` equences, illustrer la L.F.G.N. pour des Xi de loi facile `a simuler, par exemple loi uniforme sur [a, b], loi exponentielle de param`etre a,. . .

1.3 Th´eor`eme de Glivenko-Cantelli

Le script GlvkCanIS.sceillustre le th´eor`eme de Glivenko-Cantelli pour la f.d.r. em- pirique construite sur un ´echantillon de taille n de la gaussienne N(m, σ).

1.4 L.F.G.N. et loi de Cauchy

Le script CauchylfgnIS.sce montre le comportement asymptotique des moyennes arithm´etiquesSn/n, o`uSn =X1+· · ·+Xn, les Xi´etant des v.a. ind´ependantes de mˆeme loi de Cauchy de densit´e

f :t7−→ 1 π(1 +t2).

Faites le tourner plusieurs fois, en n’h´esitant pas `a prendre de tr`es grandes valeurs de n.

Qu’observez-vous ? Interpr´etation.

1. Pour charger ce script en m´emoire, utiliser le menuFile->File operations de Scilab et cliquer sur Exec apr`es avoir s´electionn´e le nom du fichier, ici cvfreqIS.sce. Scilab r´epond en affichant la ligne;exec(...avec le nom de chemin adapt´e `a votre machine. Pour les ex´ecutions suivantes, il suffit d’utiliser le rappel des commandes avec la touche .

(2)

U.S.T. Lille I U.F.R. Math´ematiques

2 Illustrations du T.L.C.

2.1 Approximations d’une loi binomiale

Contrairement `a tous les autres scripts de ce T.P., les scripts BinPoissIS.sce et BinGaussIS.sce n’effectuent aucune simulation. Ils se contentent de calculer des pro- babilit´es et de les repr´esenter graphiquement (diagrammes en bˆatons), afin de visualiser la comparaison avec la loi limite.

Etudiez exp´´ erimentalement la validit´e de l’approximation par une loi de Poisson en fonction des valeurs denp.

Le deuxi`eme script illustre le th´eor`eme de de Moivre Laplace, ou plus exactement un r´esultat plus fort : un th´eor`eme de limite locale qui donne la convergence des proba- bilit´es binomiales renormalis´ees vers la densit´e gaussienne. ´Etudiez exp´erimentalement l’influence des valeurs dep sur la vitesse de cette convergence. Essayez avec p= 1/2 ou proche de 1/2, puis avec p proche de 0 ou de 1.

2.2 Le «peigne » des intervalles de confiance

Une application directe du th´eor`eme de de Moivre-Laplace est la construction d’inter- valles de confiance pour l’estimation d’une probabilit´e inconnue p`a partir de l’observa- tion d’un´echantillon den variables de Bernoulli ind´ependantes de param`etre p. Consi- d´erons pour t >0 l’´ev´enement

An,t:=

ω ∈Ω; −t≤ rn

pq

Sn(ω) n −p

≤t

.

Le th´eor`eme de de Moivre-Laplace nous dit que pour n assez grand, on peut utiliser l’approximation :

P An,t

'Φ(t)−Φ(−t) = 2Φ(t)−1.

Ceci peut se r´e´ecrire P

Sn

n −t rpq

n ≤p≤ Sn

n +t rpq

n

= 2Φ(t)−1 +εn. On ignore la valeur de p, donc a fortiori celle de √

pq. Heureusement, il est possible de la majorer carp(1−p) est maximal pour p= 1/2. D’o`u

√pq≤ r1

4 = 1

2, (1)

de sorte qu’en notant Bn,t :=

ω ∈Ω; Sn(ω)

n − t

2√

n ≤p≤ Sn(ω)

n + t

2√ n

,

l’inclusion An,t⊂Bn,t nous donne : P Bn,t

≥2Φ(t)−1 +εn. (2)

2

(3)

Licence I.S. 2004–05

En pratique, n est fix´e et on a observ´e des valeurs num´eriques explicites x1, . . . , xn que l’on interpr`ete comme les valeurs de X1(ω), . . . , Xn(ω) pour un mˆeme ω tir´e au sort (suivant P). On est donc en pr´esence d’une valeur num´erique explicite, Sn(ω)/n= (x1+· · ·+xn)/n, disons pour fixer les id´eesSn(ω)/n= 0,53. Proposer pour le param`etre inconnu p l’intervalle de confiance

In,t=

0,53− t 2√

n; 0,53 + t 2√

n

,

c’est faire le pari que leω observ´e est bien dansBn,t. La probabilit´e de gagner ce pari est minor´ee par 2Φ(t)−1 +εn. On dit queIn,t est un intervalle de confiance pourp avec un niveau d’au moins 2Φ(t)−1 +εn. En pratique, on laisse tomber leεn et on d´etermine t de fa¸con approch´ee grˆace `a la tabulation de Φ. Par exemple pour un niveau de confiance de 95%, on est ramen´e `a la r´esolution de l’´equation Φ(t) = 1,95/2 = 0,975 d’o`ut'1,96, ce qui nous donne l’intervalle

In=

Sn(ω)

n − 1,96 2√

n; Sn(ω)

n + 1,96 2√

n

, au niveau de confiance 95%.

En fait les statisticiens pr´ef`erent une variante de cette m´ethode pour obtenir des intervalles de confiance plus ´etroits, notamment quand p n’est pas trop proche de 1/2.

L’id´ee est de remplacer la variance inconnue pq de X1 par un estimateur au lieu de la majorer de fa¸con certaine par (1). Ainsi en estimant pqparMn(1−Mn) o`uMn:=Sn/n, on obtient au niveau de confiance 95% l’intervalle

Jn=

Mn(ω)−1,96

rMn(ω)(1−Mn(ω))

n ; Mn(ω) + 1,96

rMn(ω)(1−Mn(ω)) n

. Le scriptPeigneIS.scesimule 100 ´echantillons et calcule les intervalles de confiance du typeI,i.e.avec majoration dep(1−p) par 1/4. Les intervalles contenant effectivement la vraie valeur de psont repr´esent´es verticalement en vert, les autres en rouge. Le script retourne en outre les num´eros d’´echantillons pour lesquels p /∈I.

Le script Peigne2IS.sce simule 100 ´echantillons et calcule pour chacun l’intervalle de confiance du type I et celui du type J. On obtient ainsi deux «peignes», ce qui permet de comparer les deux m´ethodes pour diverses valeurs de p.

2.3 Vitesse de convergence dans le T.L.C. et lois de Par´eto

La vitesse de convergence dans la T.L.C. est en O(n−1/2) si E|X1|3 < +∞ et en O(n−δ/2) si on a seulement E|X1|2+δ < +∞ pour un δ ∈]0,1[. On illustre ces r´esultats avec les lois de Pareto. La v.a. X suit la loi de Pareto de param`etre p si :

P(X > x) =

1 six≤1, x−p six >1.

L’esp´erance existe pour p >1, la variance pour p > 2. Elles valent respectivement : EX = p

p−1, VarX = p

(p−1)2(p−2).

3

(4)

U.S.T. Lille I U.F.R. Math´ematiques

Le script ParetoTLCIS.sce g´en`ere N ´echantillons de taille n de la loi de Par´eto de param`etre p et calcule pour chacun la somme centr´ee r´eduite (Sn). Il trace ensuite l’histogramme de ces N sommes centr´ees r´eduites (classes de longueur 1/2 entre −4 et +4) ainsi que la courbe de la densit´e gaussienne standard. ´Etudier l’influence du param`etre p sur la qualit´e de l’approximation gaussienne. L’int´erˆet de la loi de Par´eto dans ce contexte est que E|X|r est fini pour tout r´eel r tel que 0≤r < p et infini pour tout r≥p.

Question subsidiaire : allez voir dans le code Scilab comment est g´en´er´e l’´echantillon de la loi de Par´eto et ´etudiez l’influence de psur la valeur maximale de l’´echantillon.

3 Sondages et deuxi` eme tour

En guise de contribution au th`eme Statistique et Citoyennet´e, terminons par une pe- tite ´etude empirique de la difficult´e de pronostiquer les noms des deux candidats restant au second tour d’une ´election pr´esidentielle lorsqu’il y a beaucoup de candidats. Ex´ecutez une dizaine de fois le script presidentielle1.sce qui simule le sondage d’un ´echan- tillon de 500 personnes avant le premier tour d’un ´election pr´esidentielle o`u concourent 12 candidats d´esign´es par une lettre A, B,. . ., L dans l’ordre alphab´etique correspondant

`

a leur pourcentage de voix dans la population totale.

On voit quelques erreurs de pronostic du deuxi`eme tour pr´evoyant un duel A-C au lieu de A-B. Pour en savoir plus sur la fr´equence de ce type d’erreurs, on r´ealise grˆace au script presidentielle2.sce 1 000 simulations d’un tel sondage de premier tour et on regarde la fr´equence d’erreur de pronostic du second tour (i.e. pr´evision de pr´esence au second tour d’au moins un candidat autre que A ou B).

4

Références

Documents relatifs

[r]

A l’équivalence les réactifs ont été introduits dans les proportions stœchiométriques, tous les ions hydroxyde présents ont réagi avec les ions oxonium versés.. Avantages :

marge brute – remise – prix d’achat net – prix de vente hors taxe – coût d’achat prix de vente toute taxe comprise – prix d’achat net – frais d’achat – prix

Le promoteur du Salon peut résilier en tout temps ce contrat en remboursant intégralement le paiement lui ayant été versé par l'exposant en guise de loyer ou par le partenaire en

In [BBF15], we used projection complexes to embed M CG(Σ) in a finite product of hyperbolic spaces where the Masur–Minsky distance formula was a key ingredient.. We would like to

[r]

Elaborer un plan de simulations explicitant le nombre d’´ echantillons g´ en´ er´ es not´ e M , la taille requise pour l’´ echantillon que l’on a not´ e n et les diff´

Ce partenariat avec l’association « la Monnaie autrement », adoptée par le dernier conseil municipal de Chambéry vise à soutenir l’économie locale, en favorisant une démarche