• Aucun résultat trouvé

Lissageet estimation fonctionnelle avec R SEMIN­

N/A
N/A
Protected

Academic year: 2022

Partager "Lissageet estimation fonctionnelle avec R SEMIN­"

Copied!
37
0
0

Texte intégral

(1)

   

SEMIN­

Lissage

et estimation fonctionnelle avec R

Christophe POUZAT

Laboratoire de Physiologie Cérébrale

CNRS ULR 8118, Université Paris­Descartes

SEMIN­R du MNHN | 12 Février 2009

(2)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Lissage et estimation fonctionnelle avec R

Christophe Pouzat

Laboratoire de Physiologie C´ er´ ebrale, CNRS UMR 8118, Universit´ e Paris-Descartes

e-mail: christophe.pouzat@gmail.com web:

http://www.biomedicale.univ-paris5.fr/physcerv/C_Pouzat.html

12 F´ evrier 2009

(3)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

De quoi va-t-on parler ?

Pr´ eliminaires : les donn´ ees

Caract´ erisation des r´ eponses aux odeurs Le probl` eme

Homog´ en´ eit´ e et stabilisation de la variance Splines de lissage

General Smoothing Spline

La fonction smooth.spline

Retour aux donn´ ees

La suite

(4)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Enregistrement in vivo dans le premier relais olfactif d’un insecte

Une blatte (Periplaneta americana) “en position” avec la

sonde d’enregistrement. Photos par Laurent Moreaux et

Antoine Chaffiol.

(5)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Donn´ ees brutes et d´ etection

Vue de l’ext´ erieur, l’activit´ e des neurones se manifeste par

l’´ emission d’impulsions ´ electriques tr` es br` eves : les potentiels

d’actions. Enregistrements par Nicole Lindemann et Antoine

Chaffiol.

(6)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

D’autres techniques sont aussi applicables ` a ce syst` eme

Un exemple d’enregistrement de patch-clamp coupl´ e ` a l’imagerie calcique. Ici une cellule unique est enregistr´ ee.

Donn´ ees obtenues par Moritz Paehler et Peter Kloppenburg

(Universit´ e de Cologne).

(7)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Propri´ et´ es des d´ echarges ”brutes”

Sur des temps courts (ici 5 s) les d´ echarges sont bien

approxim´ ees par des processus de Poisson.

(8)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs

Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Un exemple de r´ eponse ` a une stimulation olfactive

Il est difficile de distinguer quoi que ce soit avec ce type de

repr´ esentation (la valve controllant l’arriv´ ee de l’odeur est

ouverte dans la partie gris´ ee).

(9)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs

Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Estimation de la fr´ equence de d´ echarge instantan´ ee par moyennage des r´ eponses

En “moyennant” les r´ eponses des 20 stimulations et en

discr´ etisant le temps on obtient quelque chose de plus clair

(taille de la fenˆ etre de discr´ etisation : 10 ms).

(10)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs

Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Estimation de la fr´ equence de d´ echarge instantan´ ee par moyennage des r´ eponses

En “moyennant” les r´ eponses des 20 stimulations et en

discr´ etisant le temps on obtient quelque chose de plus clair

(taille de la fenˆ etre de discr´ etisation : 50 ms).

(11)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs

Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Estimation de la fr´ equence de d´ echarge instantan´ ee par moyennage des r´ eponses

En “moyennant” les r´ eponses des 20 stimulations et en

discr´ etisant le temps on obtient quelque chose de plus clair

(taille de la fenˆ etre de discr´ etisation : 250 ms).

(12)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme

Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Le probl` eme : quelle taille de bin choisir ?

D´ echarge du r´ eseau entre 5.5 et 8.5 s en r´ eponse au m´ elange.

(13)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme

Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Un peu de formalisme

I Toutes les fonctions de R que nous allons voir

consid` erent (au moins dans leur version de base) que les observations, Y i , et le pr´ edicteur (variable ind´ epenante), x i (i = 1, . . . , n) sont reli´ es par le mod` ele de r´ egression :

Y i = η(x i ) + i , i = 1, . . . , n

I Les i sont suppos´ es ˆ etre des variables al´ eatoires

ind´ ependantes et identiquement distribu´ ees (IID) de

moyenne 0 et de variance σ 2 .

(14)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance

Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Homog´ en´ eit´ e de la variance

I Avant d’aller plus loin il peut-ˆ etre utile de v´ erifier que l’hypoth` ese IID pour les i est raisonnable.

I On peut le faire avec un Bootstrap en r´ e-´ echantillonnant les 20 stimulations.

I Commen¸cons par calculer le nombre total d’´ ev´ enements par bin :

> citronC <- sapply(allCitron, + function(l) {

+ hist(l,seq(1,14,0.05),plot=FALSE)$counts + } )

> citronC.hat <- apply(citronC,1,sum)

(15)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance

Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Homog´ en´ eit´ e de la variance

I L’estimateur de bootstrap du nombre total d’´ ev´ enements par bin est alors :

> citronC.boot <- sapply(1:1000, + function(idx) {

+ myCol <- sample(1:20,20,replace=TRUE) + bootD <- citronC[,myCol]

+ apply(bootD,1,sum) + }

+ )

> citronC.hat.var <- apply(citronC.boot,1,var)

(16)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance

Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Homog´ en´ eit´ e de la variance

Ici les i d´ ependent clairement des η(x i ).

(17)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance

Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Stabilisation de la variance

I On se souvient que les d´ echarges spontan´ ees

correspondent approximativement ` a des processus de Poisson (homog` enes).

I On peut alors penser que les r´ eponses aux odeurs correspondent approximativement ` a des processus de Poisson inhomog` ene.

I On se souvient aussi qu’une distribution de Poisson de param` etre ≥ 15 est approximativement gaussienne avec une variance ´ egale ` a la moyenne.

I On se souvient peut-ˆ etre que la racine carr´ ee d’une

variable al´ eatoire de Poisson (de param` etre ≥ 15) est

approximativement gaussienne de variance 0.25 quelque

soit la valeur du param` etre.

(18)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance

Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Stabilisation de la variance

> citronSC.hat <- sqrt(apply(citronC,1,sum))

> citronSC.hat.var <- apply(sqrt(citronC.boot),

+ 1,var)

(19)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance

Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Stabilisation de la variance

Ici les i d´ ependent nettement moins des p

η(x i ).

(20)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance

Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Distribution des p η(x i )

Graphes quantiles-quantiles des p

η(x i ) obtenus par

bootstrap (r´ eponse au citronellal, bin de 50 ms).

(21)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 1

Given data :

Y i = η(x i ) + i , i = 1, . . . , n

where x i ∈ [0, 1] and i ∼ N(0, σ 2 ), we want to find η λ

minimizing : 1 n

n

X

i=1

(Y i − η λ (x i )) 2 + λ Z 1

0

d 2 η λ dx 2

2

dx

(22)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 2

● ●

●●

● ●

● ●

●●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

A simple example with simulated data

x

y

(23)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 3

It can be shown (but it’s not exactly trivial) that, for a given λ, the solution of the functional minimization problem can be expressed on a finite basis :

η λ (x) =

m−1

X

ν=0

d ν φ ν (x) +

n

X

i=1

c i R 1 (x i , x)

where the functions, φ ν (), and R 1 (x i , ), are known.

(24)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 4

0.0 0.2 0.4 0.6 0.8 1.0

−0.6−0.4−0.20.00.20.4

Cst. unpenalized term

x

0.0 0.2 0.4 0.6 0.8 1.0

−0.6−0.4−0.20.00.20.4

Linear unpenalized term

x

0.0 0.2 0.4 0.6 0.8 1.0

−0.6−0.4−0.20.00.20.4

Penalized basis fct # 20

x

0.0 0.2 0.4 0.6 0.8 1.0

−0.6−0.4−0.20.00.20.4

Penalized basis fct # 40

x

0.0 0.2 0.4 0.6 0.8 1.0

−0.6−0.4−0.20.00.20.4

Penalized basis fct # 60

x

0.0 0.2 0.4 0.6 0.8 1.0

−0.6−0.4−0.20.00.20.4

Penalized basis fct # 80

x

(25)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 5 : What about λ ?

●●

●●

●●●

●●

● ●

●●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

λλ ==0.5

x

y

●●

●●

●●

● ●

●●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

λλ ==0.05

x

y

●●

●●

●●

●●

● ●

●●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

λλ ==0.005

x

y

●●

●●

●●●

●●

● ●

●●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

λλ ==5e−04

x

y

●●

●●

●●

● ●

●●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

λλ ==5e−05

x

y

●●

●●

●●

●●

● ●

●●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

λλ ==5e−06

x

y

(26)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 6 : Cross-Validation

Ideally we would like λ such that : 1

n

n

X

i=1

λ (x i ) − η(x i )) 2

is minimized... but we don’t know the true η. So we choose λ minimizing :

V 0 (λ) = 1 n

n

X

i=1

[i] λ (x i ) − Y i ) 2

where η [k] λ is the minimizer of the “delete-one” functional : 1

n X

i 6=k

(Y i − η λ (x i )) 2 + λ Z 1

0

d 2 η λ dx 2

2

dx

(27)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 7

●●

0.20 0.25 0.30 0.35 0.40

−4−3−2−10

λλ ==0.5

x

y

●●

0.20 0.25 0.30 0.35 0.40

−4−3−2−10

λλ ==0.05

x

y

●●

0.20 0.25 0.30 0.35 0.40

−4−3−2−10

λλ ==0.005

x

y

●●

●●

●●

0.20 0.25 0.30 0.35 0.40

−4−3−2−10

λλ ==5e−04

x

y

●●

●●

●●

0.20 0.25 0.30 0.35 0.40

−4−3−2−10

λλ ==5e−05

x

y

●●

0.20 0.25 0.30 0.35 0.40

−4−3−2−10

λλ ==5e−06

x

y

(28)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 8

−14 −12 −10 −8 −6 −4

1.21.41.61.8

log((λλ))

rss

GCV Exact

●●

●●

● ●

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

λλ ==0.001581139

x

y

(29)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage

gss smooth.spline Retour aux donn´ees La suite

Smoothing Splines 9 : The Theory (worked out by Grace Wahba) also gives us confidence bands

0.0 0.2 0.4 0.6 0.8 1.0

−4−2024

Data, Conf. Band, Actual ηη

x

y

● ●

●●

● ●

● ●

●●

(30)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

General Smoothing Spline

I La m´ ethodologie des splines de lissage avec param` etre de lissage estim´ e par validation crois´ ee est mise en oeuvre dans le paquet gss (General Smoothing Spline) d´ evelopp´ e par Chong Gu (Universit´ e de Purdue).

I Nous utilisons d’abord la fonction ssanova0 :

> XX <- seq(1.025,13.975,0.05)

> GF1 <- ssanova0(citronSC.hat ~ XX)

(31)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Ajustement avec ssanova0

Les intervalles de confiance sont obtenus avec :

> estGF1 <- predict(GF1,

+ newdata=data.frame(XX=XX),se=TRUE)

(32)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Variation autour de ssanova0

I Avec ssanova0 il est possible de fixer la variance des i

au moment de la validation crois´ ee :

> s2 <- mean(citronSC.hat.var)

> GF2 <- ssanova0(citronSC.hat ~ XX,

+ method="u",varht=s2)

(33)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Variation autour de ssanova0

Il n’y a pas grande diff´ erence.

(34)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Fonction smooth.spline

I Le paquet stats contient la fonction smooth.spline similaire ` a ssanova0 mais “moins puissante”.

I smooth.spline ne g´ en` ere pas d’intervalles de confiance.

> SF <- smooth.spline(XX,citronSC.hat,

+ all.knots=TRUE)

(35)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Fonction smooth.spline

Les intervalles de confiance sont ceux de ssanov0.

(36)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

Retour aux donn´ ees

(37)

Lissage et estimation fonctionnelle avec

R Christophe Pouzat

Pr´eliminaires : les donn´ees R´eponses aux odeurs Le probl`eme Variance Splines de lissage gss

smooth.spline Retour aux donn´ees La suite

La suite

I On peut “jouer” avec d’autres arguments de

smooth.spline, mais globalement, l’essentiel a ´ et´ e couvert.

I ssanova0 peut-ˆ etre utilis´ ee avec plusieurs pr´ edicateurs.

I Le paquet gss met en oeuvre des tests pour ´ evaluer le rˆ ole de diff´ erents pr´ edicateurs.

I Avec gss, les i peuvent avoir une distribution

binomiale, Poisson, inverse gaussienne, etc. Il faut alors

utiliser la fonction gssanova0.

Références

Documents relatifs

Perdre ses photos de vacances : ¸ca n’a pas de

Programme des enseignements – Syst` emes d’information et conception d’entrepˆ ots de donn´ ees – Les principes et la d´ emarche du Data Mining (fouille de donn´ ees)

— Sinon on place la taille de la ligne de commande dans DI et comme premier octet du tampon COMBUF, on appelle la sous-routine GETBATBYT pour ´ecarter le second caract`ere de passage

Une exp´ erience par coloration a montr´ e qu’une rivi` ere souterraine alimente une r´ esurgence dans la vall´ ee. La rivi` ere souterraine a un d´ ebit tr` es sensible aux

Statistique descriptive mono-vari´ e Bases de R Donn´ ees bi-vari´ ees Tests statistiques.. Objectifs

b - Le fichier ruban-3 initial final.csv contient la longueur de la trajectoire suivie par la pro- cession au d´ ebut (lorsque la tˆ ete atteint le point d’arriv´ e) et ` a la fin de

Ecrire en Java la gestion d’un tas, repr´esent´e par un tableau : cr´eer, ins´erer, minimum, supprimer (le minimum), modifier une valeur.. Vous programmerez ceci en TP, et

On fixe une cat´ egorie C et on prend comme objets les couples (R, M ) d’une monade R sur C et d’un R-module M. Que peut-on prendre comme morphismes pour faire une cat´