• Aucun résultat trouvé

Quelques méthodes de rééchantillonnage

N/A
N/A
Protected

Academic year: 2022

Partager "Quelques méthodes de rééchantillonnage"

Copied!
3
0
0

Texte intégral

(1)

td8_simu_mapi3_17

March 9, 2017

0.0.1 Université Paul Sabatier 2016-2017, M1 MAPI3 Simulation aléatoire - TP8

Quelques méthodes de rééchantillonnage

En tête pour charger les fonctions nécessaires au TP.

In [ ]: %matplotlib inline

# coding: utf8

from matplotlib.pyplot import * from math import *

from numpy import *

from numpy.random import * from numpy.linalg import * from scipy.misc import *

import numpy as np, pandas as pd

#from scipy import *

Méthodes du bootstrap Soit (ε n ) n≥0 une suite de variables aléatoires indépendantes et de même loi possédant un moment d’ordre 1 fini. Soit

ε n := ε 0 + ε 1 + · · · + ε n .

On souhaite comprendre la distribution de ε n en utilisant des méthodes de rééchantillonnage.

Les codes Python suivant permettent le rééchantillonage avec et sans remise de le moyenne empirique et de la variance empirique de variables i.i.d. de loi exponenetielle de paramètre 1.

Comparer les deux méthodes d’échantillonage

Modifier les programmes pour que la loi des variables soit la loi gaussienne standard. Puis comparer graphiquement avec les densités théoriques des estimateurs

Consider maintenant la loi de Cauchy. Que se passe t-il?

In [ ]: def bootstrap_withresample(X, n=None):

if n == None:

n = len(X)

resample_i = np.floor(np.random.rand(n) * len(X)).astype(int)

1

(2)

X_resample = X[resample_i]

return X_resample

In [ ]: def bootstrap_withoutresample(X, n=None):

if n == None:

n = len(X)-1

indices = np.random.permutation(len(X)) X_resample=X[indices[0:n]]

return X_resample In [ ]: print('Avec remise')

N=int(input('Quel est la taille de l\'echantillon'));

l=int(input('Taille du rééchantillonnages ?'));

m=int(input('Combien de rééchantillonnages?'));

X = -log(rand(N,1)) moy=zeros([m,1]) vari=zeros([m,1])

for i in range(1, m+1):

X_resample = bootstrap_withresample(X, l);

mea=X_resample.mean();

v=X_resample.var() moy[i-1,0]=mea;

vari[i-1,0]=v;

mmin=float(min(moy));

mmax=float(max(moy));

bibin=int(sqrt(m));

hist(moy, bins = linspace(mmin,mmax,bibin), normed = True);

figure()

vmin=float(min(vari));

vmax=float(max(vari));

hist(vari, bins = linspace(vmin,vmax,bibin), normed = True);

In [ ]: print('Sans remise')

N=int(input('Quel est la taille de l\'échantillon'));

l=int(input('Taille du rééchantillonnages ?'));

m=int(input('Combien de rééchantillonnages?'));

X = -log(rand(N,1)) moy=zeros([m,1]) vari=zeros([m,1])

for i in range(1, m+1):

X_resample = bootstrap_withoutresample(X, l);

mea=X_resample.mean();

v=X_resample.var() moy[i-1,0]=mea;

vari[i-1,0]=v;

mmin=float(min(moy));

mmax=float(max(moy));

2

(3)

bibin=int(sqrt(m));

hist(moy, bins = linspace(mmin,mmax,bibin), normed = True);

figure()

vmin=float(min(vari));

vmax=float(max(vari));

hist(vari, bins = linspace(vmin,vmax,bibin), normed = True);

Modèle linéaire gaussien Pour i = 1, · · · , 50, on considère le modèle de régression quadratique Y i = 3X i 2 + 2X i + 1 + ε i . Avec

(X i ) est une suite de variables i.i.d. de densité e

−|x|

2 , (ε i ) est une suite de variables i.i.d. de loi N (0, 1).

Simuler les 50 couples P i := (X i , Y i ).

Représenter sur une même figure les 50 points P i et la courbe représentative de la fonction f (x) = 3x 2 + 2x + 1.

Calculer l’estimateur des moindres carrés.

Représenter graphiquement la courbe prédite par l’estimation du modèle.

Ecrire un programme permmettant de représenter la fluctuation induite sur la courbe prédite.

Test Bootstrap Soit X i un N -echantillon d’une loi F . On souhaite tester H 0 F est une loi centrée contre H 1 F n’est pas une loi centrée . Mettre en place un test bootstrap bâti sur une statistique de Student. Evaluer les performances de ce test sur les modèles suivant:

La loi gaussienne de variance 1 et de moyenne m ∈ [0, 1]

La loi exponentielle double de densité exp −|x−m| 2 , (m ∈ [0, 1]) La loi triangualire décentrée.

In [ ]:

3

Références

Documents relatifs

Exercice 3 Supposons que le fait qu’il pleuve ou pas aujourd’hui soit dé- terminé par le temps qu’il a fait les deux jours précédents.. Dans ce qui suit

[r]

2- Sachant que la consommation journalière moyenne observée dans l’échantillon est de 12 cigarettes, donner un intervalle de con…ance bilatéral à 90% pour m:?. 3- Quelle est

Caluler la probabilité pour ette mahine de tomber en panne plus d'une fois au ours d'un mois de trente jours2. Le par est omposé de n = 200 mahines et la probabilité pour une de

et suffisantes pour les déviations modérées par rapport aux ensembles fermés des sommes de variables aléatoires vectorielles indépendantes de..

Démontrer que la somme de n variables aléatoires indépendantes deux à deux suivant la loi de Poisson de paramètre λ est une loi de Poisson dont on précisera le

Si on demande de vérifier que c’est une loi de couple de variables il faut vérifier ces deux conditions:.. Méthode pour trouver les lois marginales quand on connait la loi du

La fonction g est le résultat d'opérations et de composition de fonctions usuelles C ∞ dans leurs domaines... L'inégalité précédente est valable pour tous