Principes de grandes d´eviations - Mathématiques Assistées par Ordinateur

Pour une suite(X_n)de variables aléatoires i.i.d. réelles intégrables, le théorème central limite implique que la moyenne empiriqueX¯_nconverge p.s. versm=E[X₁].

Les principes de grandes déviations ont pour objectif d’évaluer la probabilité d’événements rares, du type{X¯_n∈A}oùA⊂Rne contient pasm.

Exercice 42 On consid`ere la partieA= [x,+∞)o`ux > m.

1. Soitt >0Montrer en utilisant une in´egalit´e de Markov surexp(tSn)que P( ¯Xn≥x)≤exp (−n(xt−φ(t)))

o`uφ:R→]− ∞,∞]est la log-Laplace deX₁: φ(t) = logE[exp(tX₁)].

2. En d´eduire que

3. Dans le cas suivants, expliciter la fonctionφpuis la fonctionI (attention aux valeurs potentiellement infinies qu’elles peuvent prendre) :

(a) X1∼ B(p), (b) X₁∼ P(λ), (c) X₁∼ E(λ).

L’exercice précédent montre qu’on peut s’attendre à ce que ces probabilités d’événements rares soient majorées par une exponentielle décroissante enn. Le théorème suivant², très général et s’appliquant même quandX1n’est pas intégrable, montre que c’est le cas et fournit également une borne inférieure.

Théorème 3.4.1 (Cramér-Chernov) Soient(X_n)des variables réelles i.i.d, etX¯_n=

Remarque 3.4.2 La fonctionIs’appellefonction de tauxoutransformée de Cramér associée àX1. Elle est positive, semi-continue inférieurement, convexe.

Exercice 43 Soient (X_n) des variables i.i.d réelles intégrables, de moyenne m = E[X₁]. Déduire du Théorème 3.4.1 que pour toutx > m, entrepet1. Rappelons dans ce cas la fonctionI(x)calculée dans l’exercice 42 :

I(x) =xlog

2. Pour une preuve, voir par exemple le livreLarge deviations techniques and applicationsde Dembo et Zeitouni

Grands th´eor`emes de convergence

pourx∈ [0,1], et+∞ailleurs. Combien d’essais faut-il effectuer pour estimer cor-rectement la probabilitéP( ¯X_n ≥x)? Tracer la fonctionIet dire pourquoi cette pro-babilité est difficile à estimer empiriquement, à part pour desxtrès proches dep.

Universit´e Paris-Saclay Master 1 math´ematiques et applications

Chapitre 4

Tests et estimateurs classiques

4.1 Estimateurs

Nous commençons par rappeler les définitions générales. Tout au long du chapitre on garde la notationX¯npour la moyenne empirique ^X¹^+···+X_n ⁿd’une suite de variables aléatoires.

4.1.1 D´efinitions

Définition 4.1.1 Un modèle paramétrique est une famille de probabilités indexées par un paramètreθ∈Θ, oùΘ⊂R^d:P ={Pθ, θ∈Θ}. Le modèle est dit identifiable si θ7→Pθest injective.

SiXest une variable aléatoire dont la loi appartient à un tel modèle paramétriqueP, unestatistiqueZest une variableX-mesurable (donc de la formeϕ(X)) ; cette statis-tique est unestimateurd’un paramètreg(θ)si presque-sûrementZ ∈g(Θ).

Souvent, le modèle dépendra d’un paramètren: il s’agira souvent d’un modèle den réalisations i.i.d. (il sera alors notéP^⊗n car ses élements sont de la formeP^⊗n_θ ) mais pas forcément, voir l’exemple ci-après.

Exemple 1

• SiX₁, . . . , X_nest unn-échantillon de loi normaleN(m, σ²)avecm,σ² incon-nus, alors le modèle naturel associé est

P^⊗n={P^⊗n_m,σ2|(m, σ²)∈R×R+} o`uPm,σ²est la loi normaleN(m, σ²)surR.

• On considère lesn+ 1premiers pas(X_k)ⁿ_k=0d’une chaˆıne de Markov sur un espace d’état finiE, de loi initialeµet de matrice de transitionP. Le modèle associé est l’ensemble des loisP⁽ⁿ⁾µ,P :

P⁽ⁿ⁾_µ,P(x0, . . . , xn) =µ(x0)Px₀,x₁. . . Px_n−1,x_n, qui n’est pas de la formeP^⊗n.

Etre un estimateur n’est pas une propriété intéressante : par exemple, n’importeˆ quelle constante deΘest un estimateur. On va donc définir plusieurs qualités possibles pour un estimateur. On commence par définir le biais et le risque quadratique :

Définition 4.1.2 SoitP un modèle paramétrique, etZun estimateur deg(θ). On sup-pose que pour toutθ∈Θ,Eθ(kZk)<∞. On définit

b(θ) =Eθ(Z)−g(θ) r(θ) =Eθ (Z−g(θ))²

(où, dans les deux cas,E^θest l’espérance par rapport àP^θ) qui sont appelés respecti-vement lebiaisdeZet sonrisque quadratique.

Différentes qualités éventuelles d’un estimateurZ deg(θ), ouZn(lorsque le modèle dépend d’un paramètrenmais queΘest fixe) seront les suivantes :

• ˆetresans biais, c’est-`a-dire avoir un biaisb(θ)nul pour toutθ;

• avoir un risque quadratique faible (mais toute comparaison du risque de deux estimateurs n’a de sens que si elle est vraie pour toutθ) ;

• êtreasymptotiquement sans biais, c’est-à-dire vérifier,lim_n→∞b_n(θ) = 0,

• êtrefortement consistantc’est-à-dire vérifier que pour toutθon aZ_n^p.s.→g(θ),

• être(faiblement) consistant, c’est-à-dire vérifier que pour toutθon aZn P

→g(θ).

Une autre qualité recherchée d’une suite d’estimateurs est l’existence d’une loi asymptotique, c’est-à-dire le fait qu’il existe une suite(an)navecan → ∞, telle que a_n Z_n−g(θ)

converge en loi, vers une loi non triviale. On dit dans ce cas que la suite d’estimateurs(Z_n)_nest devitesse(a_n)_n. Lorsquea_n=√

net que la loi limite est une normale centr´ee, on parle denormalit´e asymptotique.

Exercice 44 Soitθ >0. On consid`ereU1, . . . , Ununn-´echantillon de loiU([0, θ]).

1. Montrez queZ1= 2 ¯Unest un estimateur sans biais, consistant et asymptotique-ment normal deθ.

2. Montrez queZ₂= max(U₁, . . . , U_n)est un estimateur consistant deθet quen(Z₂− θ)converge en loi vers une loi que l’on identifiera.

3. Pour unθ quelconque, simulez un100-échantillonU1, . . . , Unet définissez les estimateursZ1etZ2correspondant aux100valeurs den. Tracez les trajectoires deZ1etZ2. Lequel des deux estimateurs semble converger le plus vite versθ? Exercice 45 Soit(X1, . . . , Xn)un échantillon de loi admettant un moment d’ordre deux. On propose l’estimateur suivant pour la variance :

Montrer qu’il est fortement consistant mais biais´e. Montrer que _n−1ⁿ sˆ²_nest sans biais.

4.1.2 M´ethode des moments

Une manière de construire des estimateurs est la méthode des moments. Si g(θ) est une fonction des moments, on l’estime par la même fonction mais évaluée en les moments empiriques.

Tests et estimateurs classiques

La m´ethode des moments sugg`ere donc comme estimateurs

Ces estimateurs sont fortement consistants d’apr`es la loi des grands nombres.

Exercice 46

• Montrez queZ1dans l’exercice 44 ci-dessus aurait pu être trouvé par la méthode des moments.

• SoitP1, . . . , Pnunn-échantillon de loi de Poisson de paramètreλ. En utilisant les formules pour l’espérance et la variance de cette loi, proposer deux esti-mateurs deλdifférents. Ces estimateurs sont-ils biaisés ? Sont-ils consistants ? Tenter de les comparer par simulation (on pourra se limiter àλ∈Λ = [1,3]).

4.1.3 M´ethode par insertion

La méthode par insertion est similaire : sig(θ)s’écrit comme une fonction d’un autre paramètreh(θ), par exempleg(θ) =ψ h(θ)

, et que l’on connaˆıt un estimateur Zhdeh(θ), on proposeψ(Zh)pour estimateur deg(θ).

4.1.4 M´ethode du maximum de vraisemblance

La méthode du maximum de vraisemblance est la plus complexe mathématiquement mais aussi la plus universelle, et elle possède souvent de bonnes propriétés. On suppose que toutes les loisP^θsont absolument continues par rapport à une mesure commune µ. On note alorsfθla densité dePθpar rapport àµ; une réalisationX de loiPθ étant donnée, on propose comme estimation deθla valeur (si elle est unique) deθqui maxi-mise lavraisemblanceV :θ7→fθ(X).

En général on travaillera avec unn-échantillonX1, . . . , Xn, de sorte que la densité

`a consid´erer sera

Vn:θ7→fθ(X1). . . fθ(Xn),

Exemple 4 On considère le modèle{P^⊗n_m,σ2|(m, σ²)∈R×R⁺}. La fonction à maxi-miser est

θ7→

i=1

√ 1

2πσ²e⁻

(Xi−m)2 2σ2 .

En passant au log, on obtient

logV_n(θ) =−nX²−2mX+m²

2σ² + logσ

+ constante.

Quel que soitσ², lemmaximiseur estX. En r´einjectant ce r´esultat dans l’expression on trouve que leσ²maximiseur estX²−X².

Exercice 47 Dans le mod`ele de l’exercice 44, quel est l’estimateur du maximum de vraisemblance ?

Dans le document Mathématiques Assistées par Ordinateur - Probabilités et Statistiques (Page 33-40)