kg−g
mk
2+ 4m
n + 16E[Y
2 1]m
3n
+ 2
1−a
1 +a
Nkfk
2.
Ce r´esultat fait l’objet de la Proposition 6.2.9. Les constantes de cette borne ne sont pas tr`es
grandes, elles d´ependent du param`etre a suppos´e connu. Les ordres du majorant obtenu sont
ceux des mod`eles de bruit multiplicatif. Le terme suppl´ementaire d´ependant de kfk tend
ex-ponentiellement vite vers 0 lorsque N devient grand. Enfin, nous s´electionnons la dimension
optimale de l’espace de projection par une proc´edure de p´enalisation. La p´enalit´e est de l’ordre
du terme de variance. Mais ici elle est al´eatoire car nous rempla¸cons E[Y
21
] par son estimateur
empirique. Nous obtenons une in´egalit´e de type oracle pour notre estimateur s´electionn´e au
Th´eor`eme 6.2.4, `a l’aide de l’in´egalit´e de Talagrand et de l’in´egalit´e de Rosenthal (voir Annexe
B). Dans un second temps nous estimons la fonction de survieF en int´egrant la relation entref
etgsur l’intervalle (0,+∞[, ce qui donne une relation entreF etG. L’estimateur est le suivant :
˘
F
N,m= 2a
1 +a
N−1X
k=01−a
1 +a
k˘
G
m1 +a
1−a
k(1 +a)x
!
.
En suivant les mˆemes ´etapes et en supposant queE[X
12] est finie et queFest de carr´e int´egrable, il
d´ecoule une in´egalit´e de type oracle, non-asymptotique, pour l’estimateur de la fonction de survie
construit, donn´ee au Th´eor`eme 6.2.7. Les vitesses obtenues sont les vitesses optimales au sens
minimax dans le cadre multiplicatif pour un bruit uniforme sur [0,1]. La vitesse d’estimation
de f est en n
−s/(s+3)lorsque f ∈ W
s(R
+, L). Pour la fonction de survie la vitesse est en
n
−s/(s+1)(vitesse qui reste moins bonne que la vitesse de l’estimateur empirique de la fonction
de r´epartition, qui converge `a vitesse 1/n).
Lors de l’´etude sur simulation, nous comparons l’estimateur construit par projection avec
l’estimateur naturel construit par d´econvolution. En effet, rappelons que si nous prenons le
loga-rithme dans le mod`ele (1.3.8) nous obtenons un mod`ele avec bruit additif, cependant l’estimateur
construit ainsi n’est pas d´efini au voisinage de 0. Cet estimateur fournit des MISE empiriques
moins bons que notre nouvel estimateur dans tous les cas.
De plus, pour chacune des estimations (de la densit´ef et de la survieF) nous comparons nos
estimateurs aux estimateurs de r´ef´erence obtenus sur les observations directes X
j, lorsqu’elles
sont disponibles. Pour la densit´e on trace l’estimateur par projection issu de l’´echantillon (X
j)
j,
´etudi´e par exemple dans Belomestny et al. (2016) o`u une borne inf´erieure est donn´ee lorsque
f ∈W
s(R
+, L). Pour la survie, notre estimateur de r´ef´erence est l’estimateur empirique. L’´etude
montre que notre proc´edure d’estimation donne des r´esultats th´eoriques satisfaisants et que les
r´esultats num´eriques le sont ´egalement. Il apparait que lorsque le param`etre a est sup´erieur
`
a 0.15, le bruit multiplicatif a un r´eel impact sur les donn´ees, alors estimer la densit´e f
Yen
esp´erant approcherf n’est plus une strat´egie possible (de mˆeme pourF
YetF). Notre m´ethode
d’estimation est alors efficace, tant pour la densit´e que pour la survie.
Enfin nous pr´esentons un exemple d’application pratique de notre m´ethode pour la
protec-tion de donn´ees. Nous proposons de transmettre des donn´ees confidentielles bruit´ees par un
bruit multiplicatif uniforme de param`etrea, transmis ´egalement. Alors, le receveur peut extraire
l’information n´ecessaire de l’´echantillon de d´epart grˆace `a notre m´ethode.
1.4 Etude de donn´´ ees neuronales
L’´etude de donn´ees neuronales constitue une motivation au travail du Chapitre 3 de cette
th`ese. Elles seront ´etudi´ees plus pr´ecis´ement dans le Chapitre 5 notamment avec les m´ethodes
d´evelopp´ees au Chapitre 4. Mais d´etaillons d’abord ce que sont ces donn´ees.
Figure 1.6– Gauche : potentiel de membrane d’un neurone. Droite : 240 trajectoires entre les spikes
Les neurones sont des cellules nerveuses qui envoient constamment des signaux `a notre
cer-veau, nos muscles et nos glandes. Quand un neurone re¸coit un signal, il r´eagit en se chargeant
en ions. Le potentiel de membrane est la diff´erence entre le potentiel ´electrique int´erieur et ext´
e-rieur de la cellule, il est entre -40 mVet -80mV. Le potentiel de membrane croˆıt jusqu’`a ce que le
neurone envoie son signal (c’est la d´epolarisation). Alors on voit un pic sur le potentiel (spike)
puis il d´ecroit en dessous de son potentiel de repos (c’est la repolarisation et l’hyperpolarisation)
pour finalement y revenir lorsqu’il re¸coit un nouveau signal. Ce que l’on vient de d´ecrire s’appelle
potentiel d’action. Un des buts de la mod´elisation math´ematique de ce ph´enom`ene est de trouver
un mod`ele pour d´ecrire le potentiel de membrane `a partir de mesures intracellulaires en dessous
de seuil d’´emission (les trajectoires inter-spike).
Un autre enjeu est de d´ecrire la trajectoire compl`ete. Ce second objectif fait appel `a des
mod`eles plus complexes, ´egalement non-homog`ene en temps, qui ne seront pas trait´es dans cette
th`ese mais quelques perspectives sont donn´ees Partie IV.
La famille des mod`eles LIF (leaky-intergate and fire) a ´et´e introduite par Lapicque (1907)
pendant ces travaux sur l’excitabilit´e nerveuse humaine par un courant ´electrique, en faisant
le parall`ele entre la membrane du neurone et un circuit ´electrique. Ce sont des mod`eles `a une
´
equation diff´erentielle ordinaire `a une dimension (voir Izhikevich, 2003). Puis des versions
sto-chastiques de ces mod`eles sont apparues pour int´egrer le bruit induit par la pr´esence d’autres
neurones, en ajoutant un bruit stochastique. En effet des enregistrements de potentiels dans des
exp´eriences diff´erentes sugg`erent la pr´esence de variables al´eatoires dans le mod`ele prenant ainsi
en compte le caract`ere stochastique de l’activit´e neuronale (voir Burkitt, 2006). Notamment
les mod`eles OU et CIR qui sont simples et bien compris, permettent une ´etude math´ematique
approfondie. Cette mod´elisation est une mod´elisation na¨ıve d’un ph´enom`ene complexe mais qui
peut n´eanmoins apporter de nouvelles informations. Lesspikes ne sont pas intrins`eques au
mo-d`ele mais sont g´en´er´es d`es que le potentiel d´epasse un certain seuil. Puis le processus est remis
`
a son potentiel de repos. D’autre part, les temps entre deux impulsions ont ´et´e tr`es ´etudi´es dans
la litt´erature (e.g. Tuckwell & Richter, 1978; Ditlevsen & Lansky, 2005) car ils contiennent de
l’information importante.
Il y a actuellement une grande demande de mod`eles robustes et de nouvelles m´ethodes
d’es-timation des param`etres d´ecrivant les donn´ees neuronales. On s’int´eresse aux donn´ees
intracel-lulaires qui sont `a haute fr´equence, et sp´ecialement aux trajectoires entre deuxspikes (elles sont
d´elimit´ees par Lansky et al., 2006). Elles sont classiquement d´ecrites par un mod`ele OU (sans
effet al´eatoire) lorsque les impulsions sont spontan´ees et bien d´ecrites par un mod`ele de Feller
(sans effet al´eatoire) lorsqu’il y a une stimulation ext´erieure ´electrique du neurone. On verra
rapidement dans la Partie IV que l’on peut coupler plusieurs mod`eles pour d´ecrire les donn´ees.
Le param`etre α
jdes mod`eles (1.3.4) et (1.3.6) repr´esente alors l’intensit´e du signal ´electrique
re¸cu par le neurone. C’est naturellement ce param`etre que l’on suppose al´eatoire en premier.
Ensuite le param`etre β
j(strictement positif) est appel´e constante de temps du neurone, et σ
caract´erise le niveau de bruit. Les coefficients de d´erive des mod`eles OU et CIR expriment que
le processusX
joscille autour de la valeur α
jβ
javec une vitesseα
j.
Dans le Chapitre 3 nous proposons une premi`ere mod´elisation avec un mod`ele OU `a un
effet al´eatoire additif. Nous comparons nos r´esultats `a ceux de Picchiniet al.(2008) et Picchini
et al. (2010), qui supposent que cet effet al´eatoire est gaussien. Nous concluons qu’il semble y
avoir une queue `a gauche sur la densit´e, non d´etect´ee par une mod´elisation param´etrique par
une gaussienne et d´etect´ee par l’estimateur `a noyau non-param´etrique. Puis, dans le Chapitre
5, nous ´etudions les donn´ees avec les mod`eles OU (1.3.4) et CIR (1.3.6) avec d= 1 ou d= 2. Il
ressort de cette ´etude, et de la comparaison des m´ethodes param´etriques et non-param´etriques
propos´ees dans le packagemixedsde, que le mod`ele OU avec un effet additif est le meilleur pour
mod´eliser ces donn´ees. L’estimation non-param´etrique par noyau semble ˆetre celle qui d´ecrit le
mieux la r´epartition des donn´ees et l’on trouve une valeur du param`etreβ qui fournit un mod`ele
final plus satisfaisant que les mod`eles pass´es. Pour poursuivre l’´etude il serait int´eressant de voir
les r´esultats lorsque l’on suppose que l’effet al´eatoire suit un m´elange de gaussiennes, l’article
Delattreet al. (2015b) fournit une m´ethode que l’on pourra ajouter au package.
Mod`ele lin´eaire mixte
Nouvelles strat´egies d’estimation
non-param´etrique dans des mod`eles
lin´eaires mixtes
Dans ce chapitre nous ´etudions un mod`ele lin´eaire mixte `a deux effets al´eatoires. Il permet
de mod´eliser N individus ayant le mˆeme comportement, pourK diff´erents temps d’observations
t
k=k∆, identiques pour tous les individus. Il s’´ecrit :
Y
j,k=α
j+β
jt
k+ε
j,k, j ∈ {1, . . . , N}, k∈ {0, . . . ,K}.
Les coefficientsα
j, β
jsont deux param`etres al´eatoires chacun suppos´ei.i.d.de densit´e respective
f
αetf
β. Les suites (ε
j,k)
j,ket (α
j, β
j)
jsont ind´ependantes et les variables de bruitε
j,ksonti.i.d.
de densit´ef
ε. L’objet de ce chapitre est d’estimer la fonction densit´ef
β`a partir des observations
Y
j,k, lorsque la densit´e f
εest connue, dans un premier temps. Un travail pr´ec´edent de Comte
& Samson (2012) propose un estimateur non-param´etrique de la densit´e f
βconstruit par une
m´ethode de d´econvolution. Nous allons comparer nos r´esultats `a cette m´ethode pr´eexistante.
Nous proposons deux m´ethodes d’estimation par d´econvolution, qui permettent d’obtenir de
bonnes vitesses de convergence avec peu d’hypoth`eses sur la densit´e f
ε. Elles s’appuient sur les
variablesZ
j,k= (Y
j,k−Y
j,0)/(k∆) pour approcherβ
j. Dans un premier temps nous construisons
un estimateurfb
β,mqui a la particularit´e de d´ependre d’un param`etre decut-off mqui est aussi
l’indice de temps des observations. Nous calculons ensuite le risque quadratique int´egr´e pour cet
estimateur. Cette double d´ependance en le param`etre `a s´electionner nous m`ene `a adapter une
m´ethode de type Goldenshluger et Lepski dans ce cadre particulier de d´econvolution.
Puis de ce premier estimateur nous d´eduisons un nouvel estimateur fb
β,mKbas´e seulement sur
les variables (Z
j,K)
j. Cette fois le cut-off m et le temps d’observation ne sont plus reli´es. Le
choix du param`etre m final est r´ealis´e par minimisation d’un crit`ere p´enalis´e (proche de celui
utilis´e pour les m´ethodes de projection).
Les deux estimateurs finaux utilisent 2N observations. Les m´ethodes originales que nous
proposons fournissent des r´esultats th´eoriques et num´eriques satisfaisants. Il est possible de
d´efinir un cadre d’utilisation pour chaque estimateur. En effet, si le nombre d’observationsK est
faible l’estimateurfb
β,msemble conseill´e. Dans le cas contraire l’estimateurfb
β,mKest naturellement
celui `a utiliser. Ce second estimateur est souvent le plus performant.
Nous exposons ici ces m´ethodes d’estimation ainsi que leurs r´esultats th´eoriques, prouv´es
en d´etail `a la fin du chapitre. Puis nous menons une ´etude approfondie sur simulation o`u nous
comparons nos estimateurs et le pr´ec´edent, pour diff´erents choix de param`etres.
Ce chapitre est issu de l’article Dion (2014) publi´e dansJournal of Statistical Planning and
Inference.
Sommaire
2.1 Introduction . . . 39
Dans le document
Estimation non-paramétrique de la densité de variables aléatoires cachées
(Page 35-41)