Tests non paramétriques Feuille d’exercices
L3 EURIA
30 mars 2018
Exercice 1.
En utilisant R, simuler un échantillon x de taille 1000 d’une loiN(0,1).
1. Tracer sur un même graphique la fonction de répartition empirique de l’échantillon simulé (on pourra utiliser la fonction ecdf) et la fonction de répartition de la loi N(0,1).
2. Réaliser un qqplot permettant de comparer les quantiles empiriques de x (on pourra utiliser la fonction quantile) à ceux d’une loiN(0,1).
(a) Réaliser un qqplot permettant de comparer les quantiles de la loiN(0,1)à ceux d’une loi N(5,10).
(b) Retrouver par le calcul que les quantiles des lois N(0,1)etN(µ, σ) sont liés par une relation linéaire. Quelle est la pente de la droite ? Quelle est l’intercept de la droite ? (c) Il existe des commandes spécifiques pour réaliser un QQ-plot dans le cas gaussien
("droite de Henry"). Taper les commandes suivantes et interpréter :
> qqnorm(x)
> qqline(x)
3. Tracer sur un même graphique un histogramme (normalisé) de l’échantillon simulé et la densité de la loiN(0,1).
4. Refaire les graphiques des question précédentes en simulant x en utilisant une loi de Student à 3 degrés de liberté. Discuter les résultats obtenus.
5. Taper les commandes suivantes et interpéter.
> x=rnorm(1000000)
> y=rt(1000,df=5)
> qqplot(x,y)
> qqnorm(y) Exercice 2.
Soit(X1, ..., Xn)n variables aléatoires i.i.d. de fonction de répartitionF etFn la fonction de répartition empirique associée. Pourx∈R fixé,
1. Calculer l’espérance et la variance deFn(x).
2. Quelle est la loi denFn(x)?
1
3. Etudier les propriétés asymptotiques (convergence, normalité asymptotique) de Fn(x) lorsque n→ ∞.
4. On suppose de plus dans cette question queXi suit une loi uniforme sur l’intervalle[0,1].
Soitx1< x2... < xk∈Rk et
Bn=
Fn(x1) ... Fn(xk)
.
Calculer l’espérance et la matrice de variance-covariance du vecteur aléatoireBn. Exercice 3.
On considère l’échantillon suivant :
61; 14; 99; 56; 66; 77; 74; 97; 82; 98; 8; 41.
et on veut tester si il provient d’une loiU([0,100]).
1. Sans utiliser R, tracer la fonction de répartition empirique et la fonction de répartition de la loi uniforme sur [0,100](notée U([0,100]) dans la suite) sur un même graphique.
2. Recommencer en utilisant R. On pourra utiliser la fonction ecdf.
3. On vérifiera sur le graphique de la question 1. que
Dn=supx∈R|Fˆn(x)−F(x)|=maxi∈N(max(|Fˆn(Xi)−F(Xi)|,|Fˆn(Xi−)−F(Xi−)|)) et on admettra ce résultat dans la suite. En déduire la valeur de la statistiquedobs du test de Kolmogorv-Smirnov.
4. Simuler 1000 échantillons de taille 12 selon une loiU([0,100])et calculer la statistique du test de Kolmogorv-Smirnov pour chacun de ces 1000 échantillons. Quelle est la proportion d’échantillons simulés pour lesquels la statistique de test a une valeur supérieure àdobs? Conclusion ?
5. Recommencer la question précédente en remplaçant la loi U([0,100]) par la loi U([0,1]) puisN(0,1). Discuter.
6. Réaliser le test avec la fonctionR ks.test. Discuter.
7. Réaliser un test duχ2 afin de vérifier si l’échantillon provient d’une loi U([0,100]).
Exercice 4. (Examen 2015-2016, 6 points)
Le jeu de donnéesEuStockMarkets disponible dansRcontient les cours de clôture de plusieurs indices boursiers. On propose dans cet exercice de travailler sur les variations du CAC40. Plus précisément on considérera l’échantillonx obtenu en tapant les commandes suivantes sousR :
> d=diff(EuStockMarkets[,3])
> x=(d-mean(d))/sd(d)
La première commande calcule la variation du cours de CAC40 entre les jours successifs et la deuxième commande centre puis réduit les observations. Vous devez obtenir un échantillon x de longueur 1859 (contactez le surveillant en cas de problème).
Une hypothèse classique dans les modèles financiers est que l’échantillon x est la réalisation d’un échantillon de la loi normale centrée-réduire (loiN(0,1)). Cette hypothèse vous paraît-elle réaliste ? Répondez en utilisant les différents outils (graphiques et test adapté) vus dans le cours.
On donnera toutes les commandesR utilisées, on reproduira schématiquement les graphiques et on donnera les valeurs numériques obtenues sur la copie.
2
Exercice 5. (Examen 2015-2016, 8 points)
Dans cet exercice (X1, ..., Xn) désigne un échantillon iid de variables aléatoires réelles de fonction de répartition F et de densité f. Le test de Cramer-Von Mises est une alternative classique au test de Kolmogorov-Smirnov vu dans le cours. Il est basé sur la statistique suivante
I =
∫
R|Fn(x)−F(x)|2f(x)dx avec Fn la fonction de répartition empirique de l’échantillon.
Les deux parties de l’exercice sont largement indépendantes.
Partie 1.
1. On note(X(1), ..., X(n)) l’échantillon trié par ordre croissant de telle manière que X(1) = min(X1, ..., Xn) et X(n) = max(X1, ..., Xn). Montrer que Fn(x) = i/n si X(i) ≤ x <
X(i+1) pouri∈ {1, ..., n−1}. Quelle est la valeur deFn(x) pourx < X(1)? Quelle est la valeur deFn(x)pour x > X(n)?
2. Montrez quenI = 12n1 +∑n
i=1
(2i−1
2n −F(X(i)))2
.
3. Quelle est la loi deF(Xi)? Montrer que la loi deI ne dépend pas de la loi de l’échantillon F. Pourquoi cette propriété est intéressante pour construire un test statistique ?
Partie 2.
1. Proposez et implémentez une méthode permettant de simuler des réalisations de la variable aléatoireI pour une valeur de nquelconque. On pourra utiliser le résultat de la question 2. de la partie précédente et la fonction R sort. On détaillera toutes les commandes R utilisées sur la copie.
2. Proposez et implémentez une méthode permettant de tester si l’échantillon x de l’exer- cice 2 provient d’une loi N(0,1) en utilisant la statistique I. On détaillera toutes les commandes R utilisées sur la copie.
3