• Aucun résultat trouvé

Licence 3 Mathématiques

N/A
N/A
Protected

Academic year: 2022

Partager "Licence 3 Mathématiques"

Copied!
7
0
0

Texte intégral

(1)

Licence 3 Mathématiques

TD Modélisation Statistique

Ex 1. Soit X une variable aléatoire réelle de densitéf et de fonction répartition F.

1. Calculer la fonction de répartition deY =αX+β pourα, β ∈R, et celle deZ =eX. En déduire leurs densités (pourα6= 0).

2. Retrouver les densités deY etZ en utilisant la formule du changement de variable.

Ex 2. Soient Y1 etY2 deux variables aléatoires réelles de densités respectivesf1 etf2, etX une variable de Bernoulli de paramètre pindépendante deY1 etY2. Déterminer la densité de la variable aléatoire

Y =Y1X+Y2(1−X).

Ex 3. Soient f et g deux densités de probabilité, M un réel positif tel que 0 < f ≤ M g, (Yn)n≥1 une suite de variables aléatoires indépendantes de densité g et (Un)n≥1 une suite de variables aléatoires indépendantes de loi uniforme sur[0,1] (et indépendantes desYi).

1. Justier que M ≥1. Dans quel cas a-t-onM = 1? 2. Calculer la loi deWi :=1

M g(Yi)Ui ≤f(Yi) . 3. En déduire la loi de T := inf

i≥1 :M g(Yi)Ui≤f(Yi) . 4. Montrer queX :=YT est une variable aléatoire de densitéf.

Ex 4. Un vecteur Gaussian standard deR2 est un vecteur aléatoire de densité f(x, y) = 1

2πexp

−x2+y2 2

, x, y ∈R.

1. On considère les coordonnées polaires du vecteur (X, Y) en posant X =Rcos(T) etY = Rsin(T) avec R ≥ 0 et T ∈ [0,2π[. Montrer que les variables aléatoires R et T sont indépendantes et préciser leurs lois.

2. Soit (U, V) un couple de variables aléatoires indépendantes uniformes sur [0,1]. Déduire de la question précédente que le couple

(X, Y) =p

−2 ln(U) cos(2πV),p

−2 ln(U) sin(2πV) , est un vecteur Gaussien standard deR2.

Ex 5. Soit X une variable aléatoire réelle de densitéf et de fonction répartition F. 1. Montrer queP(X≤x) =P F(X)≤F(x)

.

2. En utilisant la continuité de F, en déduire la loi de F(X).

3. Soit U1, ..., Un un échantillon iid de loi uniforme sur ]0,1[ etX1, ..., Xn un échantillon iid de même loi queX. Montrer que les variables aléatoires

sup

x∈

1 n

n

X1{Xi ≤x} −F(x)

et sup

u∈]0,1[

1 n

n

X1{Ui≤u} −u

(2)

Ex 6. SoitF une fonction de répartition etU une variable aléatoire de loi uniforme sur]0,1[. 1. Déterminer la loi de Y =−log(U) etZ= tan(πU).

2. Montrer dans le cas général que la variable aléatoire

X :=F(U) = inf{x∈R:F(x)≥U} a pour fonction de répartition F.

Ex 7. Soit X1, ..., Xn un échantillon de variables aléatoires réelles iid de fonction de répar- titionF.

1. Rappeler la dénition de la fonction de répartition empirique Fn. 2. Soitx∈R, quelle est la loi deFn(x)?

3. Soientx, y deux réels, calculer la covariancecov(Fn(x), Fn(y)).

4. En utilisant le théorème central limite vectoriel, donner la loi asymptotique de

√n

Fn(x)−F(x) Fn(y)−F(y)

.

Ex 8. On observe n réalisationsx1, ..., xn d'un échantillon de variables aléatoires réelles iid de densitéf.

1. Rappeler l'expression de l'estimateur à noyaux fnde f obtenu avec le noyau Gaussien K(s) = 1

√2πexp

−s2 2

, s∈R,

et la fenêtre h >0. 2. CalculerR

Rxfn(x)dx. Que représente cette intégrale.

3. Soit Y une variable aléatoire de loi uniforme sur {x1, ..., xn} et une variable aléatoire indépendante deY de loiN(0, h2). Calculer la densité deZ :=Y +. Commenter.

4. Proposer une méthode pour simuler une variable aléatoire dont la densité est l'histogramme mobile

gn(x) = 1 2nh

n

X

i=1

1{xi ∈]x−h, x+h]}.

Ex 9. Soit X une variable aléatoire de fonction de répartitionF quelconque.

1. Rappeler la dénition d'un quantile d'ordreα∈]0,1[. 2. Montrer queF(α) est bien un quantile d'ordreα.

3. Donner un exemple de fonction de répartition pour laquelle la médianeq0.5n'est pas unique.

4. Donner un exemple pour lequel le premier quartileq0.25vérie simultanément les inégalités strictes

P(X≤q0.25)>0.25 et P(X≥q0.25)>0.75.

(3)

Ex 10. Soit X1, ..., Xn un échantillon de variables aléatoires réelles iid de fonction de répar- titionF et de densitéf. On considère les variables ordonnées X(1) ≤...≤X(n).

1. Montrer que presque sûrement,X(1) < ... < X(n).

2. Soienta1, ..., an des réels diérents, montrer que pour >0 susamment petit P

n

\

i=1

{ai< X(i) ≤ai+}

= 0

si lesai ne sont pas ordonnées dans l'ordre croissant.

3. SoitS l'ensemble des permutations de {1, ..., n}, montrer que si a1< ... < an, alors pour susamment petit,

P n

\

i=1

{ai < X(i)≤ai+}

=X

σ∈S

P n

\

i=1

{ai < Xσ(i)≤ai+}

.

4. En déduire la densité fX(1),...,X(n) du n-uplet(X(1), ..., X(n)) par la formule fX(1),...,X(n)(a1, ..., an) = lim

→0

1

n P X(1)∈]a1, a1+], ..., X(n)∈]an, an+] . 5. Calculer la fonction de répartition de X(n), puis celle deX(1).

6. Montrer que sif est à support compact [a, b], alorsX(1) etX(n) convergent en probabilité versa etbrespectivement quand n→ ∞.

Ex 11. Soit U1, ..., Un un échantillon de variables aléatoires iid de loi uniforme sur ]0,1[. On s'intéresse au comportement asymptotique du quantile empirique d'ordre α∈]0,1[,U(dnαe).

1. Calculer la densité de lak-ième statistique d'ordre U(k).

2. Soit X1, ..., Xn+1 des variables aléatoires indépendantes de loi exponentielle de paramètre 1, montrer que pour tout k = 1, ..., n+ 1, Sk =Pk

i=1Xi suit une loi Gamma Γ(k,1) de densité

γk(x) = xk−1

(k−1)!e−x, x >0.

3. Montrer queSk/Sn+1 a même loi queU(k). 4. Déterminer la limite en loi de Sdnαe− dnαe

/p dnαe. 5. En remarquant que

n→∞lim dnαe

n =α et lim

n→∞

√ndnαe n −α

= 0, montrer d'après la question précédente que

√n Sdnαe

n −α loi

−−−→n→∞ N(0, α) et √ n

Sn+1−Sdnαe

n −(1−α) loi

−−−→n→∞ N(0,1−α).

6. En déduire que

√n

α Sn+1−Sdnαe

n −(1−α) Sdnαe n

loi

−−−→n→∞ N 0, α(1−α) , puis que

√ Sn+1−Sdnαe loi 1−α

(4)

7. En remarquant que U(dnαe)

loi= α/(1 +Yn/√

n) (cf. question 3), montrer qu'il existe ξn

compris entre 0etYn/√

ntel que

U(dnαe)=α− α (1 +ξn)2

Yn

√n.

8. En conclure que

Zn:=√

n U(dnαe)−α loi

−−−→n→∞ N(0, α(1−α)).

9. SoitF une fonction de répartition. Justier queF(U(dnαe))a même loi que la statistique d'ordreX(dnαe) d'un échantillon iid X1, ..., Xn ayant pour fonction de répartitionF. 10. On suppose maintenant que F admet un unique quantile d'ordreα, notéqα, et que F est

strictement croissante et continuement diérentiable sur un voisinage de qα. Montrer que

√n X(dnαe)−qα

loi

−−−→n→∞ N

0,α(1−α) F0(qα)2

.

Ex 12. Soient X etY deux variables aléatoires non constantes de carré intégrable.

1. Rappeler la dénition decov(X, Y) etcor(X, Y).

2. Montrer que pour toutα, β ∈R,cov(αX+β, Y) =αcov(X, Y).

3. Calculercor(αX+β, Y) en fonction decor(X, Y) pourα6= 0.

Ex 13. On considère deux échantillons de nvariables (X1, . . . , Xn) et (Y1, . . . , Yn). On note (R1, . . . , Rn) (resp. (S1, . . . , Sn)) les rangs des variables Xi (resp. Yi) dans chaque échantillon.

On suppose que les Xi et les Yi sont tous diérents, de telle sorte que les rangs vont de 1 à n. On rappelle que le coecient de corrélation de Spearmanγnentre les échantillons (X1, . . . , Xn) et(Y1, . . . , Yn) correspond à la corrélation linéaire entre leurs rangs.

1. Donner la formule dénissant γn.

2. Montrer que la moyenne empirique de l'échantillon (R1, . . . , Rn) vaut (n+ 1)/2 et que sa variance empirique vaut (n2−1)/12.

3. En déduire que

γn= 12 n(n2−1)

n

X

i=1

RiSi−3n+ 1 n−1. 4. SoitDi =Ri−Si. Montrer que 12Pn

i=1RiSi=n(n+ 1)(2n+ 1)−6Pn i=1D2i. 5. En déduire que

γn= 1−6Pn i=1D2i n(n2−1).

Ex 14. Soit (X, Y) un couple de variables aléatoires de variances nies.

1. Rappeler la dénition de la meilleure approximation linéaire L(Y|X) =aX+b.

2. Montrer que E(aX +b) = E(Y) et cov(Y −(aX+b), X) = 0 si et seulement si (a, b) = (a, b).

(5)

Ex 15. Soit(X1, Y1), ...,(Xn, Yn)des réalisations indépendantes d'un couple de variables aléa- toires(X, Y) non constantes et de variances nies.

1. Donner la dénition de la droite des moindres carrés y =anx+bn et rappeler les valeurs de an etbn.

2. Montrer quean etbn convergent presque sûrement en précisant leurs limites.

Ex 16. Soit(Xi, Yi),i= 1, ..., n(n≥2) des réalisations indépendantes d'un vecteur aléatoire (X, Y). On suppose queY =aX+b+où est centré et indépendant deX et on note

Y=

 Y1

...

Yn

∈Rn et W =

X1 1 ... ...

Xn 1

∈Rn×2.

1. Ecrire sous forme matricielle la relation: ∀i = 1, ..., n, Yi = aXi +b +i, en posant θ = (a, b)>.

2. On suppose maintenant queXa pour densitéfX. Montrer queW>West presque sûrement inversible.

3. Donner une expression matricielle du minimiseur θˆde

θ7→ kY−Wθk2 = (Y−Wθ)>(Y−Wθ), θ∈R2.

4. Exprimer les valeursθˆ1 etθˆ2 en fonction deXn, Yn,σ(X, Yˆ ) etc...

Ex 17. On dénit la variance conditionnelle par

var(Y|X) =E(Y2|X)−E(Y|X)2. Montrer l'égalité var(Y) = var E(Y|X)

+E var(Y|X) .

Ex 18. Soit X etdeux variables aléatoires indépendantes de variances nies. On dénit Y =g(X) +

où gest une fonction continue bornée.

1. On suppose que E() = 0, montrer queE(Y|X) =g(X).

2. Que vaut E(Y|X)si E() =m6= 0?

Ex 19. Soit (X, Y) un couple de variables aléatoires de densité jointe fXY(x, y) =

p1−ρ2 2π exp

−1

2 x2+y2+ 2ρxy

, x, y ∈R, avec ρ∈]−1,1[.

1. Montrer que fXY est une densité (poser (u, v) = p

1−ρ2 x, y+ρx

, puis passer en coordonnées polaires).

2. Justier que E|X|k<∞ pour tout k∈N. CalculerE(X)etvar(X).

3. Donner une condition nécessaire et susante pour que X etY soient indépendantes.

(6)

Ex 20. Soit(X1, Y1), ...,(Xn, Yn)des réalisations indépendantes d'un couple de variables aléa- toires (X, Y) de densité jointe fXY continue et de densités marginales fX et fY. On suppose quefX(x)>0 pour tout x∈R.

1. Soit >0, exprimerP |X−x| ≤

sous la forme d'une intégrale, puis en fonction deFX, la fonction de répartition de X. Justier que P |X−x| ≤

>0. 2. Proposer un estimateur deP |X−x| ≤

. 3. Proposer un estimateur deE Y1{|X−x| ≤}

.

4. SoitA un événement de probabilité strictement positive. Rappeler la formule deE(Y|A). 5. En déduire un estimateur deE(Y| |X−x| ≤). Montrer qu'il correspond à un estimateur

de Nadaraya-Watson particulier, en précisant les valeurs du noyau et de la fenêtre.

6. Calculerlim→0 E(Y| |X−x| ≤). Commenter.

Ex 21. Pour calibrer un radar, on relève les erreurs de mesure sur 70essais. La moyenne des erreurs vaut0,27 et l'écart-type 0.35.

1. Proposer un moyen de tester au niveauα= 0.05asymptotiquement si les erreurs de mesure sont centrées.

2. Comment est calculée la p-value du test?

Ex 22. On eectue 100lancés de dé et on obtient les résultats suivant

1 2 3 4 5 6

15 23 16 20 14 12

1. Proposer un moyen de tester au niveauα= 0.05 si le dé est pipé.

2. Comment est calculée la p-value du test?

Ex 23. SoientX, Y deux variables aléatoires indépendantes de loi de Poisson de paramètre 1. 1. Calculer la loi deX sachant X+Y =n pourn≥1.

2. Proposer une méthode pour tester expérimentalement ce résultat pour n= 4.

Ex 24. Soit X1, ..., Xn un échantillon.

1. Rappeler la dénition de la statistique de Spearman Sn utilisée pour le test H0 :"les Xi

sont indépendants" contre H1:"les Xi sont stochastiquement croissants".

2. Donner une autre expression de la statistique en utilisant l'exercice 14. Commenter.

Ex 25. Soit (X, Y) un couple de variables aléatoires continues de densité fXY sur R2 et tel queX est stochastiquement supérieure àY.

1. Exprimer les fonctions de répartitionFX etFY en fonction de la densité jointefXY. Quelle inégalité ces fonctions vérient-elles?

2. Montrer que si X etY sont indépendantes alorsP(Y ≤X)≥ 12. 3. Montrer (sans supposer l'indépendance) que pour tout z∈R,

P(Y ≤z)≤P(Y −X≤0) +P(X≤z).

En déduire que P(X≥Y)≥ kFY −FXk.

(7)

Ex 26. Soit X1, ..., Xn des variables aléatoires iid. Montrer que les suites suivantes sont stochastiquement croissantes:

1. Si =Pi

j=1Xj2,i= 1, ..., n 2. Yi =Xi+ log(i),i= 1, ..., n 3. Zi =iXi2,i= 1, ..., n.

Ex 27. SoitX1, ..., Xn des variables aléatoires iid de densité f. Le tau de Kendall est déni par

τn= 4 n(n−1)

n−1

X

i=1 n

X

j=i+1

1{Xi < Xj} −1.

1. Montrer que lesXi sont presque sûrement tous diérents et rappeler la dénition des rangs Ri de l'échantillon dans ce cas.

2. Exprimer la statistiqueτnen fonction de R1, ..., Rn.

3. Donner la loi du vecteur R= (R1, ..., Rn). En déduire que la loi deτn ne dépend pas def.

Références

Documents relatifs

[r]

5) En observant pendant 24 mois le rendement de l'action X, un analyste nancier obtient une moyenne de 1.2% avec un ecart-type centre de 4.9%.. Le rendement de l'action Y,

On veut évaluer la probabilité de rejeter H 0 si elle est fausse (la puissance du test) au niveau α = 0.053. Représenter graphiquement la puissance du test pour n = 50 et θ variant

Les observations sont donc traitées comme des réalisations de variables aléatoires de loi inconnue, dont on cherche à retrouver certaines caractéristiques (ex: espérance,

Résultat de l'étape : Le système retourne à votre page de commande et affiche le message de notification qui vous informe que vous avez correctement ajouté les éléments à

Dans le canton de Ge- nève en particulier, l'étude d'approfondissement du SRED (Amos et al., 2006) montre que près de 50% des adultes entre 16 et 65 ans possèdent des

Quels sont les ´el´ements n´ecessaire pour transf´erer un fichier entre deux ordinateurs connect´es sur un r´eseau.. Afin que le transfert soit valide, il est n´ecessaire

[r]