• Aucun résultat trouvé

5 : Modèle de régression non-paramétrique

N/A
N/A
Protected

Academic year: 2022

Partager "5 : Modèle de régression non-paramétrique"

Copied!
1
0
0

Texte intégral

(1)

Université de Caen M2

TP n

o

5 : Modèle de régression non-paramétrique

Exercice 1. Le fichier "NP.txt" disponible ici :

https://chesneau.users.lmno.cnrs.fr/NP.txt

contient un tableau de deux colonnes : la première donne1000valeurs (générées indépendamment) d’une variable explicative X et la seconde celles de la variable à expliquer Y. Nous considérons que les 800 premières lignes sont celles dont nous disposons pour faire des estimations alors que les 200 dernières lignes contiennent les abscisses pour lesquelles nous voudrions avoir une estimation de la précision de la fonction de régression (les valeurs de Y correspondantes ne seront donc pas utilisées dans les estimations, et ne sont pas censées être connues dans un premier temps).

1. Créer deux tables,AppetVal, contenant respectivement les800premières et les200dernières lignes du tableau.

2. ReprésenterY en fonction de X. Un modèle de régression linéaire semble-t-il adapté ?

3. En utilisant npregbw de la librairie np, déterminer la taille optimale de la fenêtre si l’on travaille avec un noyau d’Epanechnikov.

4. En utilisant un tel noyau ainsi que la fenêtre obtenue, donner les valeurs estimées de l’espérance conditionnelle de Y pour les 200valeurs de X contenues dans la table Val, sans utilisernpreg (on fera donc des boucles).

5. Représenter les valeurs obtenues sur un graphique, avec les valeurs deXen abscisse. Inclure dans ce graphique les vraies valeurs deY. Le résultat semble-t-il satisfaisant ? Même si la prévision est une application importante, l’objectif était d’estimer l’espérance conditionnelle. Ici, la vraie espérance conditionnelle est donnée par

E(Y | {X =x}) =xcos x 150

.

(On ne dispose évidemment pas de cette information en pratique). Représenter sur un même graphique, avec les valeurs de X en abscisse, la vraie valeur de l’espérance conditionnelle et son estimation.

6. Faire un graphique identique au précédent, mais présentant en plus les estimations obtenues en utilisantnpreg avec un noyau gaussien. Avec quel noyau a-t-on visuellement un meilleur résultat ? Comparer numériquement ces deux estimateurs : on pourra comparer à partir de la connaissance que nous avons de la vraie fonction de régression, mais aussi faire une comparaison plus réaliste (par rapport aux conditions normales d’évaluation) qui n’utilise que les données de la table initiale.

C. Chesneau 1 TP no 5

Références

Documents relatifs

Nous obtenons une repr´ esentation asymptotique de notre statistique de test se rap- prochant de celle obtenue sous des hypothses plus restrictives par Lopez et Patilea (2009)

Si l'on se donne une droite A et des plans tangents passant par A et correspondant homographiquemenlaux points de contact, la transformation d'Ampère leur fera correspondre une

Les jeux visuels proposés aux enfants peuvent être beaucoup plus économes et reposer sur le seul dessin, comme dans Loup y-es-tu 19 de Delphine Chedru ou Grands Prix 20 de Loïc

In particular, Biau, Cadre and Pelletier (2007) use an estimator of the level sets of the density function to determine the number of clusters.. The same applications are possible

Eubank et Spiegel- man (1990) construisent un test de lin´earit´e de f dans le cas d’un mod`ele normal en se ramenant `a tester la nullit´e de la partie non lin´eaire. Mohdeb

Des avancées récentes en lissage non-paramétrique [1] ont montré qu'une simple correction itérative du biais permet au lisseur de s'adapter à la vraie fonction de régression.

Le SNES a fait acter un certain nombre de choses (refus de la bivalence en collège, pas de zonage des vacances d’été, redéfinition du socle dès 2013, conception de

L’estimation de la fonction régression ainsi que prévision spatiale sont des problèmes importants dans de nombreuses applications où l’influence d’un vecteur de covariables