• Aucun résultat trouvé

Statistiques non-paramétriques M2 CEE Pr. Philippe Polomé, Université Lumière Lyon 2 2018 – 2019

N/A
N/A
Protected

Academic year: 2022

Partager "Statistiques non-paramétriques M2 CEE Pr. Philippe Polomé, Université Lumière Lyon 2 2018 – 2019"

Copied!
11
0
0

Texte intégral

(1)

Statistiques non-paramétriques

M2 CEE

Pr. Philippe Polomé, Université Lumière Lyon 2

2018 – 2019

(2)

Table des matières

Motivation

Organisation

(3)

Definitions

I

En stat, le terme "non-paramétrique" a plusieurs significations :

1. Des

stats

dites non-paramétriques

I Qui ne s’appuient pas sur un paramètre

I p.e. les stat d’ordre, qui s’appuient sur le rang des observations dans l’échantillon

I En particulier, la médiane

2. Des techniques qui ne s’appuient pas sur une distribution en particulier

I Dites “libre de distribution” [distribution free]

I p.e. le test t-stat ne peut être obtenu que si∼n(., .)

3. Des techniques qui ne supposent pas que le modèle est fixe dans tout l’échantillon

I Le nombre de paramètres du modèle grandit avec la taille de l’échantillon

(4)

Applications

I

2 grands domaines

I Régressions

I lorsque la forme fonctionnelle de la relation n’est pas établie I Tests

I lorsque les données sont des classements

I

Avantages

I Moins d’hypothèses, donc + robustes I

Inconvénient

I Plus d’observations sont nécessaires pour atteindre la même puissance

I C’est la monnaie de la pièce d’avoir moins d’hypothèses

(5)

Table des matières

Motivation

Organisation

(6)

Plan par Ch

1. Tests non-paramétriques classiques et randomisation 2. Bootstrap

3. Graphe & Régressions

3.1 Histogramme 3.2 Régression à kernel

3.3 Semi-paramétrique à kernel I Type Klein-Spady ou Ichimura I Modèles à coefficients aléatoires I Modèles partiellement linéaires

3.4 LOESS “locally weighted scatterplot smoothing”

I une technique classique

(7)

1. Tests

I

Il s’agit souvent de tests d’indépendance

I Entre un éch. & une distribution théorique I Entre 2 ou + éch.

I

Ces tests sont anciens

I Correspondant à des usages assez cadrés I dans un tableau

I Des implémentations modernes facilitent/généralisent les traitements

I Permutations / randomisations

(8)

2. Bootstrap

I

Les techniques de tests en np utilisent le bootstrap

I

La randomisation peut être vue comme un bootstrap

I

Le bootstrap est une technique de test fondamentalement np

I Nous verrons une application en contexte de régression

(9)

3. Régressions np

I

Il n’y a pas un traitement unifié de np

I Au contraire de MC p.e.

I En général, np basé sur une approche graphique I graphes sont des représentations des données I S’appuyant sur des approximations locales

I Sur le fond, traçant une courbe dans un nuage de points...

I

Privilégier une approche

I opérationnelle : on peut estimer plusieurs modèles I moderne

I relativement unifiée

I

On suit un auteur principalement : J. Racine

I Méthodes présentées dans un livre opérationnel assez simple I Nonparametric Econometrics : A Primer (2008)

I Dispo en ligne (google) I Suivant un package R “np”

I npRmpi pour la parallélisation (pas utilisé dans ce cours) I crs (Categorical data Regression Spline)

(10)

Évaluation

I

Examen final écrit

I Ça n’est pas idéal

I Mais je n’ai pas assez de recul pour faire autre chose

(11)

Biblio principale

I

Sidney Siegel “Non-parametric Statistics for the Behavioural Sciences” – nombreuses éditions

I

Racine, Nonparametric Econometrics : A Primer (2008)

I R code to replicate examples in this primer

I http ://socserv.mcmaster.ca/racine/primer_code.zip

I

Package np & associés

I Site http ://socserv.mcmaster.ca/racinej/Gallery/Home.html I np package manual

I http ://cran.r-project.org/web/packages/np/vignettes/np.pdf I crs package manual

I http ://cran.r-project.org/web/packages/crs/vignettes/crs.pdf

I

+ les réf sur R données dans le cours de Programmation dans

R

Références

Documents relatifs

La crise financière mondiale mène à une baisse du volume des flux financiers, qui touche particulièrement certains pays émergents pour lesquels les investisseurs

Dans la présente recherche, le terme récidive sexuelle est défini comme étant toutes nouvelles condamnations de nature sexuelle inscrite à la fiche criminelle de l’individu (fiche

Furthermore, Groh and her colleagues (2014) found in a sample of 825 participants modest but significant association between disorganized attachment at fifteen

Mais depuis 1975, la formation brute de capital fixe (FBCF) connaît en agriculture, un retournement de tendance prononcé, et plus encore pour le matériel que pour les bâtiments..

The behavior of supercritical models is dominated by the study of finite infected sets with infinite closure (a single infected site in the East model), while subcritical ones are

Si vous avez ouvert le fichier .R du cours que vous travaillez, vous pouvez voir dans le bandeau jaune qui apparaît en haut du script dans l’éditeur que des packages sont

Des techniques qui ne supposent pas que le modèle est fixe dans tout l’échantillon. I Le nombre de paramètres du modèle grandit avec la taille

The power of tests based on symmetric and equal-tail bootstrap P values against certain alternatives may be quite different, as is shown in Section 8... these tests may have