• Aucun résultat trouvé

kg−g

m

k

2

+ 4m

n + 16E[Y

2 1

]m

3

n

+ 2

1−a

1 +a

N

kfk

2

.

Ce r´esultat fait l’objet de la Proposition 6.2.9. Les constantes de cette borne ne sont pas tr`es

grandes, elles d´ependent du param`etre a suppos´e connu. Les ordres du majorant obtenu sont

ceux des mod`eles de bruit multiplicatif. Le terme suppl´ementaire d´ependant de kfk tend

ex-ponentiellement vite vers 0 lorsque N devient grand. Enfin, nous s´electionnons la dimension

optimale de l’espace de projection par une proc´edure de p´enalisation. La p´enalit´e est de l’ordre

du terme de variance. Mais ici elle est al´eatoire car nous rempla¸cons E[Y

2

1

] par son estimateur

empirique. Nous obtenons une in´egalit´e de type oracle pour notre estimateur s´electionn´e au

Th´eor`eme 6.2.4, `a l’aide de l’in´egalit´e de Talagrand et de l’in´egalit´e de Rosenthal (voir Annexe

B). Dans un second temps nous estimons la fonction de survieF en int´egrant la relation entref

etgsur l’intervalle (0,+∞[, ce qui donne une relation entreF etG. L’estimateur est le suivant :

˘

F

N,m

= 2a

1 +a

N−1

X

k=0

1−a

1 +a

k

˘

G

m

1 +a

1−a

k

(1 +a)x

!

.

En suivant les mˆemes ´etapes et en supposant queE[X

12

] est finie et queFest de carr´e int´egrable, il

d´ecoule une in´egalit´e de type oracle, non-asymptotique, pour l’estimateur de la fonction de survie

construit, donn´ee au Th´eor`eme 6.2.7. Les vitesses obtenues sont les vitesses optimales au sens

minimax dans le cadre multiplicatif pour un bruit uniforme sur [0,1]. La vitesse d’estimation

de f est en n

s/(s+3)

lorsque f ∈ W

s

(R

+

, L). Pour la fonction de survie la vitesse est en

n

s/(s+1)

(vitesse qui reste moins bonne que la vitesse de l’estimateur empirique de la fonction

de r´epartition, qui converge `a vitesse 1/n).

Lors de l’´etude sur simulation, nous comparons l’estimateur construit par projection avec

l’estimateur naturel construit par d´econvolution. En effet, rappelons que si nous prenons le

loga-rithme dans le mod`ele (1.3.8) nous obtenons un mod`ele avec bruit additif, cependant l’estimateur

construit ainsi n’est pas d´efini au voisinage de 0. Cet estimateur fournit des MISE empiriques

moins bons que notre nouvel estimateur dans tous les cas.

De plus, pour chacune des estimations (de la densit´ef et de la survieF) nous comparons nos

estimateurs aux estimateurs de r´ef´erence obtenus sur les observations directes X

j

, lorsqu’elles

sont disponibles. Pour la densit´e on trace l’estimateur par projection issu de l’´echantillon (X

j

)

j

,

´etudi´e par exemple dans Belomestny et al. (2016) o`u une borne inf´erieure est donn´ee lorsque

f ∈W

s

(R

+

, L). Pour la survie, notre estimateur de r´ef´erence est l’estimateur empirique. L’´etude

montre que notre proc´edure d’estimation donne des r´esultats th´eoriques satisfaisants et que les

r´esultats num´eriques le sont ´egalement. Il apparait que lorsque le param`etre a est sup´erieur

`

a 0.15, le bruit multiplicatif a un r´eel impact sur les donn´ees, alors estimer la densit´e f

Y

en

esp´erant approcherf n’est plus une strat´egie possible (de mˆeme pourF

Y

etF). Notre m´ethode

d’estimation est alors efficace, tant pour la densit´e que pour la survie.

Enfin nous pr´esentons un exemple d’application pratique de notre m´ethode pour la

protec-tion de donn´ees. Nous proposons de transmettre des donn´ees confidentielles bruit´ees par un

bruit multiplicatif uniforme de param`etrea, transmis ´egalement. Alors, le receveur peut extraire

l’information n´ecessaire de l’´echantillon de d´epart grˆace `a notre m´ethode.

1.4 Etude de donn´´ ees neuronales

L’´etude de donn´ees neuronales constitue une motivation au travail du Chapitre 3 de cette

th`ese. Elles seront ´etudi´ees plus pr´ecis´ement dans le Chapitre 5 notamment avec les m´ethodes

d´evelopp´ees au Chapitre 4. Mais d´etaillons d’abord ce que sont ces donn´ees.

Figure 1.6– Gauche : potentiel de membrane d’un neurone. Droite : 240 trajectoires entre les spikes

Les neurones sont des cellules nerveuses qui envoient constamment des signaux `a notre

cer-veau, nos muscles et nos glandes. Quand un neurone re¸coit un signal, il r´eagit en se chargeant

en ions. Le potentiel de membrane est la diff´erence entre le potentiel ´electrique int´erieur et ext´

e-rieur de la cellule, il est entre -40 mVet -80mV. Le potentiel de membrane croˆıt jusqu’`a ce que le

neurone envoie son signal (c’est la d´epolarisation). Alors on voit un pic sur le potentiel (spike)

puis il d´ecroit en dessous de son potentiel de repos (c’est la repolarisation et l’hyperpolarisation)

pour finalement y revenir lorsqu’il re¸coit un nouveau signal. Ce que l’on vient de d´ecrire s’appelle

potentiel d’action. Un des buts de la mod´elisation math´ematique de ce ph´enom`ene est de trouver

un mod`ele pour d´ecrire le potentiel de membrane `a partir de mesures intracellulaires en dessous

de seuil d’´emission (les trajectoires inter-spike).

Un autre enjeu est de d´ecrire la trajectoire compl`ete. Ce second objectif fait appel `a des

mod`eles plus complexes, ´egalement non-homog`ene en temps, qui ne seront pas trait´es dans cette

th`ese mais quelques perspectives sont donn´ees Partie IV.

La famille des mod`eles LIF (leaky-intergate and fire) a ´et´e introduite par Lapicque (1907)

pendant ces travaux sur l’excitabilit´e nerveuse humaine par un courant ´electrique, en faisant

le parall`ele entre la membrane du neurone et un circuit ´electrique. Ce sont des mod`eles `a une

´

equation diff´erentielle ordinaire `a une dimension (voir Izhikevich, 2003). Puis des versions

sto-chastiques de ces mod`eles sont apparues pour int´egrer le bruit induit par la pr´esence d’autres

neurones, en ajoutant un bruit stochastique. En effet des enregistrements de potentiels dans des

exp´eriences diff´erentes sugg`erent la pr´esence de variables al´eatoires dans le mod`ele prenant ainsi

en compte le caract`ere stochastique de l’activit´e neuronale (voir Burkitt, 2006). Notamment

les mod`eles OU et CIR qui sont simples et bien compris, permettent une ´etude math´ematique

approfondie. Cette mod´elisation est une mod´elisation na¨ıve d’un ph´enom`ene complexe mais qui

peut n´eanmoins apporter de nouvelles informations. Lesspikes ne sont pas intrins`eques au

mo-d`ele mais sont g´en´er´es d`es que le potentiel d´epasse un certain seuil. Puis le processus est remis

`

a son potentiel de repos. D’autre part, les temps entre deux impulsions ont ´et´e tr`es ´etudi´es dans

la litt´erature (e.g. Tuckwell & Richter, 1978; Ditlevsen & Lansky, 2005) car ils contiennent de

l’information importante.

Il y a actuellement une grande demande de mod`eles robustes et de nouvelles m´ethodes

d’es-timation des param`etres d´ecrivant les donn´ees neuronales. On s’int´eresse aux donn´ees

intracel-lulaires qui sont `a haute fr´equence, et sp´ecialement aux trajectoires entre deuxspikes (elles sont

d´elimit´ees par Lansky et al., 2006). Elles sont classiquement d´ecrites par un mod`ele OU (sans

effet al´eatoire) lorsque les impulsions sont spontan´ees et bien d´ecrites par un mod`ele de Feller

(sans effet al´eatoire) lorsqu’il y a une stimulation ext´erieure ´electrique du neurone. On verra

rapidement dans la Partie IV que l’on peut coupler plusieurs mod`eles pour d´ecrire les donn´ees.

Le param`etre α

j

des mod`eles (1.3.4) et (1.3.6) repr´esente alors l’intensit´e du signal ´electrique

re¸cu par le neurone. C’est naturellement ce param`etre que l’on suppose al´eatoire en premier.

Ensuite le param`etre β

j

(strictement positif) est appel´e constante de temps du neurone, et σ

caract´erise le niveau de bruit. Les coefficients de d´erive des mod`eles OU et CIR expriment que

le processusX

j

oscille autour de la valeur α

j

β

j

avec une vitesseα

j

.

Dans le Chapitre 3 nous proposons une premi`ere mod´elisation avec un mod`ele OU `a un

effet al´eatoire additif. Nous comparons nos r´esultats `a ceux de Picchiniet al.(2008) et Picchini

et al. (2010), qui supposent que cet effet al´eatoire est gaussien. Nous concluons qu’il semble y

avoir une queue `a gauche sur la densit´e, non d´etect´ee par une mod´elisation param´etrique par

une gaussienne et d´etect´ee par l’estimateur `a noyau non-param´etrique. Puis, dans le Chapitre

5, nous ´etudions les donn´ees avec les mod`eles OU (1.3.4) et CIR (1.3.6) avec d= 1 ou d= 2. Il

ressort de cette ´etude, et de la comparaison des m´ethodes param´etriques et non-param´etriques

propos´ees dans le packagemixedsde, que le mod`ele OU avec un effet additif est le meilleur pour

mod´eliser ces donn´ees. L’estimation non-param´etrique par noyau semble ˆetre celle qui d´ecrit le

mieux la r´epartition des donn´ees et l’on trouve une valeur du param`etreβ qui fournit un mod`ele

final plus satisfaisant que les mod`eles pass´es. Pour poursuivre l’´etude il serait int´eressant de voir

les r´esultats lorsque l’on suppose que l’effet al´eatoire suit un m´elange de gaussiennes, l’article

Delattreet al. (2015b) fournit une m´ethode que l’on pourra ajouter au package.

Mod`ele lin´eaire mixte

Nouvelles strat´egies d’estimation

non-param´etrique dans des mod`eles

lin´eaires mixtes

Dans ce chapitre nous ´etudions un mod`ele lin´eaire mixte `a deux effets al´eatoires. Il permet

de mod´eliser N individus ayant le mˆeme comportement, pourK diff´erents temps d’observations

t

k

=k∆, identiques pour tous les individus. Il s’´ecrit :

Y

j,k

j

j

t

k

j,k

, j ∈ {1, . . . , N}, k∈ {0, . . . ,K}.

Les coefficientsα

j

, β

j

sont deux param`etres al´eatoires chacun suppos´ei.i.d.de densit´e respective

f

α

etf

β

. Les suites (ε

j,k

)

j,k

et (α

j

, β

j

)

j

sont ind´ependantes et les variables de bruitε

j,k

sonti.i.d.

de densit´ef

ε

. L’objet de ce chapitre est d’estimer la fonction densit´ef

β

`a partir des observations

Y

j,k

, lorsque la densit´e f

ε

est connue, dans un premier temps. Un travail pr´ec´edent de Comte

& Samson (2012) propose un estimateur non-param´etrique de la densit´e f

β

construit par une

m´ethode de d´econvolution. Nous allons comparer nos r´esultats `a cette m´ethode pr´eexistante.

Nous proposons deux m´ethodes d’estimation par d´econvolution, qui permettent d’obtenir de

bonnes vitesses de convergence avec peu d’hypoth`eses sur la densit´e f

ε

. Elles s’appuient sur les

variablesZ

j,k

= (Y

j,k

−Y

j,0

)/(k∆) pour approcherβ

j

. Dans un premier temps nous construisons

un estimateurfb

β,m

qui a la particularit´e de d´ependre d’un param`etre decut-off mqui est aussi

l’indice de temps des observations. Nous calculons ensuite le risque quadratique int´egr´e pour cet

estimateur. Cette double d´ependance en le param`etre `a s´electionner nous m`ene `a adapter une

m´ethode de type Goldenshluger et Lepski dans ce cadre particulier de d´econvolution.

Puis de ce premier estimateur nous d´eduisons un nouvel estimateur fb

β,mK

bas´e seulement sur

les variables (Z

j,K

)

j

. Cette fois le cut-off m et le temps d’observation ne sont plus reli´es. Le

choix du param`etre m final est r´ealis´e par minimisation d’un crit`ere p´enalis´e (proche de celui

utilis´e pour les m´ethodes de projection).

Les deux estimateurs finaux utilisent 2N observations. Les m´ethodes originales que nous

proposons fournissent des r´esultats th´eoriques et num´eriques satisfaisants. Il est possible de

d´efinir un cadre d’utilisation pour chaque estimateur. En effet, si le nombre d’observationsK est

faible l’estimateurfb

β,m

semble conseill´e. Dans le cas contraire l’estimateurfb

β,mK

est naturellement

celui `a utiliser. Ce second estimateur est souvent le plus performant.

Nous exposons ici ces m´ethodes d’estimation ainsi que leurs r´esultats th´eoriques, prouv´es

en d´etail `a la fin du chapitre. Puis nous menons une ´etude approfondie sur simulation o`u nous

comparons nos estimateurs et le pr´ec´edent, pour diff´erents choix de param`etres.

Ce chapitre est issu de l’article Dion (2014) publi´e dansJournal of Statistical Planning and

Inference.

Sommaire

2.1 Introduction . . . 39

Documents relatifs