• Aucun résultat trouvé

Licence 3 Mathématiques TP Ingénierie Mathématique: Statistique

N/A
N/A
Protected

Academic year: 2022

Partager "Licence 3 Mathématiques TP Ingénierie Mathématique: Statistique"

Copied!
4
0
0

Texte intégral

(1)

Licence 3 Mathématiques

TP Ingénierie Mathématique: Statistique

Ex 1. Méthode d'inversion

SoitX une variable aléatoire à valeurs dans]a, b[et de fonction de répartition F inversible. On admet que siU ∼ U[0,1], alors F−1(U) est une variable aléatoire de fonction de répartitionF.

1. Rappeler l'expression de le fonction de répartition de la loi exponentielle de paramètre λ >0, puis calculer son inverseF−1.

2. A partir de la fonction runif() qui permet des générer des variables aléatoires uniformes, simuler un échantillon de taille 100de loi exponentielle de paramètreλ= 2.

3. Utiliser le même principe pour simuler un échantillon de taille 100 de loi de Cauchy, de densitéf(x) = π(1+x1 2), x∈R.

Ex 2. Loi des grands nombres

1. Générer une matrice X de taille 5×1000 dont les entrées sont des variables aléatoires uniformes sur[0,2]indépendantes (chaque ligne correspond à un échantillon de taille1000).

2. A l'aide de la commande apply(X,1,cumsum) qui calcule les sommes cumulées sur chaque ligne, calculer les moyennes deskpremières valeurs de chaque échantillon pourkallant de 1 à1000.

3. Représenter sur le même graphique l'évolution des cinq moyennes empiriques avec la fonc- tion matplot(), en précisant type='l' en argument. Commenter.

4. Répéter la procédure pour des échantillons de loi de Cauchy. Commenter.

Ex 3. Théorème central limite

1. Simuler 1000échantillons de taille n= 100de variables aléatoires iid de loi exponentielle de paramètre1.

2. Calculer le vecteur S de taille1000des statistiques√

n(Xn−1)obtenues sur chaque échan- tillon.

3. Superposer l'histogramme de S à la densité limite théorique (utiliser la fonction hist() en précisant proba=TRUE, puis la commande lines(x,dnorm(x)) où x est une discrétisation de l'espace, par exemple x=seq(-4,4,0.01)).

Ex 4. Théorème de Glivenko-Cantelli

1. Simuler un échantillon X1, ..., Xn de taille n= 1000 de variables aléatoires indépendantes de loi exponentielle.

2. Représenter la fonction de répartition empirique Fn de l'échantillon et superposer la vraie fonction de répartition F (utiliser la commande ecdf).

1

(2)

3. Pourk allant de1 à1000, calculer la variable aléatoire Yk=kFk−Fk= sup

x∈R

|Fk(x)−F(x)|,

obtenue à partir des kpremières valeurs de l'échantillons. Commenter.

Ex 5. Théorème de Donsker

1. Simuler1000réalisations de la variable aléatoireYndénie dans l'exercice précédent, issue d'un échantillon de taillen= 20de variables aléatoires indépendantes de loi exponentielle.

Tracer l'histogramme.

2. Faire de même avec un échantillon de loi de Cauchy puis de loi uniforme (utiliser la com- mande par(mfrow=c(a,b)) qui permet de représenter les graphiques simultanément sur un tableau de a lignes et b colonnes). Que constate-t-on?

3. Refaire la même chose pour des variablesYncalculées sur un échantillon de taille n= 200. Ex 6. Histogramme

Simuler un échantillon X de taillen= 50de loi normale standard.

1. Représenter les histogrammes obtenus avec k = 5,10 et 20 classes en faisant varier les valeurs de l'argument breaks de la fonction hist, et superposer à chaque fois la vraie densité (on pourra calibrer les abcisses et ordonnées du graphique en spéciant par exemple xlim=c(-4,4),ylim=c(0,0.5)). Quelle nombre de classes semble le plus adapté?

2. Refaire la même chose avec un échantillon de taille n= 500, puisn= 5000. Commenter.

Ex 7. Estimation à noyaux

Simuler un échantillon X de taillen= 50de loi normale standard.

1. A l'aide de la commande density(X), représenter l'estimateur à noyau de la densité.

Changer le noyau avec l'argument kernel (utiliser l'aide en tapant ?density pour voir les diérents noyaux possibles). A quel noyau correspond l'histogramme mobile?

2. Comparer les estimateurs en faisant varier la taille de la fenêtre avec l'argument bw et superposer à chaque fois la vraie densité (d'une autre couleur). Autour de quelle valeur la fenêtre semble la mieux adaptée?

3. Refaire l'exercice avec un échantillon de taille n= 500, puisn= 5000. Commenter.

Ex 8. Quantiles empiriques

1. Générer 1000échantillons de taillen= 200de loi uniforme sur]0,1[et créer un vecteur M de taille1000contenant les médianes Mn(commande median()) de chaque échantillon.

2. Illustrer graphiquement la convergence en loi de√

n(Mn12)vers une loi normaleN(0,14). 3. A l'aide de la fonction quantile, calculer le quantile d'ordre α = 0.10 des échantillons

précédents et montrer graphiquement la convergence vers une loi normale.

2

(3)

Ex 9. Coecient de corrélation

SoitX une variable aléatoire uniforme sur[0,3]etY =X3+où∼ N(0,1/4)est indépendante de X.

1. Calculercov(X, Y)puis cor(X, Y).

2. Générer un échantillon de taillen= 1000de variables (Xi, Yi)iid de même loi que (X, Y). A l'aide de la fonction cor(), calculer le coecient de corrélation de Pearsonρkdes échan- tillons(Xi, Yi)i=1,...,k pourkallant de 2àn. Représenter graphiquement l'évolution deρk. Commenter.

3. Répéter l'expérience 5fois et superposer les 5 graphiques.

4. Refaire les questions 2 et 3 pour le coecient de Spearman. Commenter.

Ex 10. Régression linéaire simple

Soit X1, ..., X50 un échantillon iid de loi uniforme sur [0,30], on dénit Yi = 2Xi+ 1 +i pour i= 1, ...,50 où lesi sont des variables aléatoires iid de loi N(0,1), indépendantes des Xi.

1. Générer l'échantillon des (Xi, Yi) et tracer le nuage de points.

2. A l'aide de la fonction lm(), calculer les coecients de la droite des moindres carrés.

Superposer la droite de régression au nuage de point.

3. Tracer l'histogramme des résidusˆiet calculer leurs moyenne et variance empiriques. Com- menter.

4. Refaire l'exercice pour un échantillon de taillen= 1000. Commenter.

Ex 11. Régression non-paramétrique

Générer un échantillon de taille n= 200 de variables aléatoires Xi de loi normale N(0,2). On dénitYi= sin(Xi) +i où lesi sont des variables aléatoires iid de loiN(0,0.2), indépendantes desXi.

1. Tracer le nuage de points puis superposer la droite de régression. Calculer les coecients de corrélation de Pearson et de Spearman. Commenter.

2. Que vaut ici la fonction de régressionφ(x) =E(Y|X=x)?

3. A l'aide de la fonction ksmooth(), calculer l'estimateur de Nadaraya-Watson φn de φ. 4. Représenterφn etφ sur un même graphique.

5. Tracer l'histogramme des résidusˆiet calculer leurs moyenne et variance empiriques. Com- menter.

6. Répéter l'expérience pourn= 2000. Commenter.

Ex 12. Test du signe

On rappelle que la densité de la loi Gamma Γ(k,1)est donnée par γk(x) = xk−1

(k−1)!e−x, x >0.

1. Générer un échantillon de taillen= 100de loi Gamma de paramètresΓ(10,1). Calculer la moyenne empirique X et la variance empiriqueσˆ2 et comparer avec les valeurs théoriques m etσ2.

3

(4)

2. Construire le test de l'hypothèse H0:m= 10contreH1 :m6= 10au niveau asymptotique α= 0.05.

3. Reproduire l'expérience1000fois et calculer la fréquence de rejet de H0. Commenter.

4. Construire le test de l'hypothèseH0 :m= 9.5contreH1 :m6= 9.5au niveau asymptotique α= 0.05.

5. Reproduire l'expérience1000fois et calculer la fréquence de rejet de H0. Commenter.

Ex 13. Test sur la médiane

1. Générer un échantillonX1, ..., Xn de taillen= 10de loi χ2(20).

2. On notem la médiane théorique du χ2(20). Quelle est la loi deSn=Pn

i=11{Xi> m}? 3. Avec la commande pbinom qui donne la fonction de répartition d'une loi binomiale, calculer

numériquementP(Sn>7).

4. Proposer un test non asymptotique de l'hypothèseH0 :m= 19de niveauα≈0.05contre H1:m >19.

5. Répéter la procédure 10000fois pour évaluer la puissance du test.

Ex 14. Text d'adéquation du χ2

On souhaite vérier la qualité du générateur de nombres aléatoires d'une calculatrice scientique.

Pour cela, on procède à250tirages dans l'ensemble{0, ...,9}et on obtient les résultats suivants:

x 0 1 2 3 4 5 6 7 8 9

N(x) 28 32 23 26 23 31 18 10 19 31 Tester au niveauα = 0,05 si le générateur produit des entiers uniformément.

Ex 15. Test de Kolmogorov-Smirnov

1. Générer deux échantillons X1, ..., Xn etY1, ..., Yn de loi gammaΓ(3,4).

2. Faire un test de Kolmogorov-Smirnov pour savoir si les variablesZi =Xi/(Xi+Yi)suivent une loi bêtaB(3,4)(commande ks.test() en spéciant y=pbeta(3,4) en argument).

4

Références

Documents relatifs

Détermine le nombre total de visiteurs pendant cette semaine puis écris ce nombre dans le

Selon la théorie du biorythme, il y a trois cycles (trois biorythmes) qui influent sur la vie d’une personne et qui font qu’elle a de bonnes et de mauvaises journées. Le cycle

➔ identifie les couleurs, chaque couleur est une DONNEE, l’ensemble des données est une SERIE STATISTIQUE, le nombre par couleur est l’EFFECTIF, la somme des effectifs

Proposer un moyen de tester au niveau α = 0.05 asymptotiquement si les erreurs de mesure sont centrées.. Comment est calculée la p-value

On veut évaluer la probabilité de rejeter H 0 si elle est fausse (la puissance du test) au niveau α = 0.053. Représenter graphiquement la puissance du test pour n = 50 et θ variant

Pour la régression logistique multinomiale (la variable y plus de 2 modalités), utiliser la fonction multinom du package

Cette approche peut créer un biais si pour une variable donnée, la probabilité que la donnée soit manquante dépend des valeurs des variables (cas des données missing at random

ƒ J'ai été confronté à des problèmes techniques (-l'utilisation de Pleiad n'est pas facile, surtout pour les discussions, où écrire son message … - un petit mode d'emploi