Estimation statistique dans une population structurée branchante
Aline Marguet
En collaboration avec M. Hoffmann
29 janvier 2017
1 / 32
Décrire la dynamique d’une population de cellules
Modèle individu-centré où chaque cellule est caractérisée par un trait (âge, taille, nombre de parasites, ...).
I Comprendre le rôle de certaines caractéristiques dans la division cellulaire.
I Étudier le mécanisme de vieillissement cellulaire.
I Inférence statistique.
2 / 32
Étude de la prolifération d’une infection
Figure:Image : Soifer, Robert & Amir, 2016.
I Division asymétrique : répartition asymétrique des parasites
I Stratégie pour éliminer l’infection ?
3 / 32
Modèle probabiliste
Estimation non-paramétrique
Estimation paramétrique du taux de division
4 / 32
Description du modèle
I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :
dφx(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,
où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.
I Chaque individu se divise au temps t à un tauxB(φx(t)),
I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a. de densité associéeκ(θ) symétrique.
I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.
5 / 32
Description du modèle
I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :
dφx(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,
où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.
I Chaque individu se divise au tempst à un tauxB(φx(t)),
I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a. de densité associéeκ(θ) symétrique.
I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.
5 / 32
Description du modèle
I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :
dφx(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,
où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.
I Chaque individu se divise au tempst à un tauxB(φx(t)),
I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a.
de densité associéeκ(θ) symétrique.
I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.
5 / 32
Description du modèle
I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :
dφx(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,
où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.
I Chaque individu se divise au tempst à un tauxB(φx(t)),
I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a.
de densité associéeκ(θ) symétrique.
I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.
5 / 32
Exemple de trajectoire
0.0 0.1 0.2 0.3 0.4 0.5 0.6
time 0.0
0.2 0.4 0.6 0.8
trait
X∅
X1
X0
X11
X10
X01
X00
;
00 01
1
10 11
0
6 / 32
Temps généalogique
Thèse A. Olivier 2015.
7 / 32
Chaîne de Markov bifurcante
On considère les notations de Ulam-Harris-Neveu, pourn,m≥0, on note :
T= [
m∈N
{0,1}m, Tn=
n
[
m=0
{0,1}m, T?n=Tn\ {∅}.
On note Xu le trait à la naissance d’un individu u∈T. On suppose que l’on dispose des observations
Xn= (Xu)u∈Tn.
Le processus (Xu,u ∈T) est alors une chaîne de Markov bifurcante de noyau de transition P deRdans R×R tel que :
E Y
u∈Gm
ψu(Xu,Xu0,Xu1) Fm
= Y
u∈Gm
Pψu(Xu),
pour tout m≥0.
Guyon 2007.
8 / 32
Exemple de trajectoire
0.0 0.1 0.2 0.3 0.4 0.5 0.6
time 0.0
0.2 0.4 0.6 0.8
trait
X∅
X1
X0
X11
X10
X01
X00
;
00 01
1
10 11
0
9 / 32
Exemple de trajectoire
0.0 0.1 0.2 0.3 0.4 0.5 0.6
time 0.0
0.2 0.4 0.6 0.8
trait
X∅
X1
X0
X11
X10
X01
X00
;
00 01
1
10 11
0
9 / 32
Processus de la cellule étiqueté
Soit Y la chaîne de Markov correspondant au trait de la cellule étiquetée.
Force topology is enabled!
Branch lengths do not represent real values.
La transition de Y est donnée par , avec
P1(x,dy) = ˆ
R
P(x,dydy2) =P2(x,dy) = ˆ
R
P(x,dy1dy), car κ est symétrique.
10 / 32
Processus de la cellule étiqueté
Soit Y la chaîne de Markov correspondant au trait de la cellule étiquetée.
Force topology is enabled!
Branch lengths do not represent real values.
La transition de Y est donnée parQ= (P1+P2)/2, avec P1(x,dy) =
ˆ
R
P(x,dydy2) =P2(x,dy) = ˆ
R
P(x,dy1dy), car κ est symétrique.
10 / 32
Processus de la cellule étiqueté
Soit Y la chaîne de Markov correspondant au trait de la cellule étiquetée.
Force topology is enabled!
Branch lengths do not represent real values.
La transition de Y est donnée parQ=P1, avec P1(x,dy) =
ˆ
R
P(x,dydy2) =P2(x,dy) = ˆ
R
P(x,dy1dy), car κ est symétrique.
10 / 32
Objectifs
À partir de(Xu,u∈Tn),
I estimerν(dx) (mesure invariante),
I estimerQ(dx),
I estimerB.
11 / 32
Hypothèses
Hypothèses sur la dynamique du flot Il exister1, σ1, σ2 >0, tels que
|r(x)| ≤r1(1+|x|), σ1 ≤σ(x)≤σ2, ∀x∈ X. De plus, il exister2>0, tel que
sgn(x)r(x)<0, ∀|x| ≥r2, avec sgn(x) =1{x>0}−1{x≤0}.
12 / 32
Hypothèses
Hypothèses sur les divisions
La fonctionx 7→B(x) est continue et il existeb1,b2 >0 et γ≥0, tels que
b1 ≤B(x)≤b2|x|γ+b1, ∀x∈ X.
Hypothèses sur la fragmentation
κ(z) =κ(1−z) pour tout z ∈[0,1], supp(κ)⊂[ε,1−ε]avec 0< ε <1/2, infz∈[ε,1−ε]κ(z)≥δ.
13 / 32
Hypothèses
Hypothèses sur les divisions
La fonctionx 7→B(x) est continue et il existeb1,b2 >0 et γ≥0, tels que
b1 ≤B(x)≤b2|x|γ+b1, ∀x∈ X.
Hypothèses sur la fragmentation
κ(z) =κ(1−z) pour tout z ∈[0,1], supp(κ)⊂[ε,1−ε]avec 0< ε <1/2, infz∈[ε,1−ε]κ(z)≥δ.
13 / 32
Convergence de la chaîne étiquetée
On note
|ϕ|V =sup
x∈R
|ϕ(x)| 1+V(x).
Théorème
Sous les hypothèses précédentes, Q admet une mesure invarianteν.
De plus, il existe C >0 etρ∈(0,1) tels que pour tout x ∈Ret m∈N:
Qmϕ−ν(ϕ)
V ≤Cρm
ϕ−ν(ϕ) V
pour toute fonction mesurableϕ:R→Rtelle que |ϕ|V <∞, avec V(x) =x2.
14 / 32
Comportement asymptotique de la mesure empirique
Mn(ψ) = 1
|T?n| X
u∈T?n
ψ(Xu−,Xu).
Théorème
Soit µ∈ MP(R) telle que µ(V2)<∞ etψ:R×R→Rbornée telle que ψ? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a
Eµ
(Mn(ψ)−ν(Qψ))2
.|Tn|−1C(ψ), ∀n∈N, où .signifie à une constante près dépendant de Qet supp(ψ?)et
C(ψ) = ψ2
µ+ν+|ψ?ψ|µ+
1+µ(V2)1/2
|ψ?|1|ψ|ν.
|ψ|µ= ˆ
R×R
|ψ(x,y)|µ(dx)dy+|ψ?|1∧ |ψ|∧1, ψ?(x) =sup
y∈R
|ψ(x,y)|
|ψ|∧1= ˆ
X ×X
|ψ(x,y)|dxdy^
|ψ?(y)|1, ψ?(y) =sup
x∈R
|ψ(x,y)|.
15 / 32
Comportement asymptotique de la mesure empirique
Mn(ψ) = 1
|T?n| X
u∈T?n
ψ(Xu−,Xu).
Théorème
Soit µ∈ MP(R) telle que µ(V2)<∞et ψ:R×R→Rbornée telle que ψ? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a
Eµ
(Mn(ψ)−ν(Qψ))2
.|Tn|−1C(ψ), ∀n∈N, où .signifie à une constante près dépendant de Qet supp(ψ?)et
C(ψ) = ψ2
µ+ν+|ψ?ψ|µ+
1+µ(V2)1/2
|ψ?|1|ψ|ν.
|ψ|µ= ˆ
R×R
|ψ(x,y)|µ(dx)dy+|ψ?|1∧ |ψ|∧1, ψ?(x) =sup
y∈R
|ψ(x,y)|
|ψ|∧1= ˆ
X ×X
|ψ(x,y)|dxdy^
|ψ?(y)|1, ψ?(y) =sup
x∈R
|ψ(x,y)|.
15 / 32
Comportement asymptotique de la mesure empirique
Mn(ψ) = 1
|T?n| X
u∈T?n
ψ(Xu−,Xu).
Théorème
Soit µ∈ MP(R) telle que µ(V2)<∞et ψ:R×R→Rbornée telle que ψ? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a
Eµ
(Mn(ψ)−ν(Qψ))2
.|Tn|−1C(ψ), ∀n∈N, où .signifie à une constante près dépendant de Qet supp(ψ?)et
C(ψ) = ψ2
µ+ν+|ψ?ψ|µ+
1+µ(V2)1/2
|ψ?|1|ψ|ν.
|ψ|µ= ˆ
R×R
|ψ(x,y)|µ(dx)dy+|ψ?|1∧ |ψ|∧1, ψ?(x) =sup
y∈R
|ψ(x,y)|
|ψ|∧1= ˆ
X ×X
|ψ(x,y)|dxdy^
|ψ?(y)|1, ψ?(y) =sup
x∈R
|ψ(x,y)|.
15 / 32
Plan
Modèle probabiliste
Estimation non-paramétrique
Estimation paramétrique du taux de division
16 / 32
Noyau
Définition
Une fonction G :R→R est un noyau d’ordrek si elle satisfait
´
RxlG(x)dx =1{l=0} pour tout l =0, . . . ,k.
Exemples :
- x →1{x≤1} est un noyau d’ordre 0, - x →1/√
2πe−x2/2 est un noyau d’ordre 1,
- on peut construire des noyaux de tout ordre à l’aide des polynômes de Legendre.
17 / 32
Estimateur à noyau de la mesure invariante
Soit G un noyau d’ordrek eth >0 un paramètre de lissage. On pose Gh(y) =h−1G(h−1y), ∀y ∈R.
Comme Mn(ϕ) converge versν(ϕ) (pour ϕ:R→R), on a Mn(Gh(· −x0))−−−→n→∞
ˆ
R
Gh(x−x0)ν(x)dx.
Un estimateur deν(x0), pourx0∈Rest donc donné par
bνn(x0) =Mn(Gh(· −x0)).
18 / 32
Estimateur à noyau de la mesure invariante
Soit G un noyau d’ordrek eth >0 un paramètre de lissage. On pose Gh(y) =h−1G(h−1y), ∀y ∈R.
Comme Mn(ϕ) converge versν(ϕ) (pour ϕ:R→R), on a Mn(Gh(· −x0))−−−→n→∞
ˆ
R
Gh(x−x0)ν(x)dx.
Un estimateur deν(x0), pourx0∈Rest donc donné par
bνn(x0) =Mn(Gh(· −x0)).
18 / 32
Estimateur à noyau de la densité
De la même façon, on considère G un noyau d’ordre k eth1,h2 >0 deux paramètres de lissage. On pose
Gh⊗2
1,h2(x,y) =h−11 h2−1G(h1−1x)G(h−12 y), ∀x,y∈R. On a alors la convergence suivante :
Mn(Gh⊗2
1,h2(· −x0,· −y0))
−−−→n→∞
ˆ
R×R
Gh⊗21,h2(x−x0,y−y0)q(x,y)ν(x)dydx.
Un estimateur de la densité q(x0,y0), pour x0,y0 ∈Rest alors donné par
qbn(x0,y0) = Mn(Gh⊗21,h2(· −x0,· −y0) Mn(Gh(· −x0))∨$ .
19 / 32
Estimateur à noyau de la densité
De la même façon, on considère G un noyau d’ordre k eth1,h2 >0 deux paramètres de lissage. On pose
Gh⊗2
1,h2(x,y) =h−11 h2−1G(h1−1x)G(h−12 y), ∀x,y∈R. On a alors la convergence suivante :
Mn(Gh⊗2
1,h2(· −x0,· −y0))
−−−→n→∞
ˆ
R×R
Gh⊗21,h2(x−x0,y−y0)q(x,y)ν(x)dydx.
Un estimateur de la densité q(x0,y0), pour x0,y0 ∈Rest alors donné par
qbn(x0,y0) = Mn(Gh⊗21,h2(· −x0,· −y0) Mn(Gh(· −x0))∨$ .
19 / 32
Convergence des estimateurs
Soit α, β >0 etG un noyau d’ordrek >max(α, β). On pose
h =|Tn|2β+1−1 , h1 =|Tn|(α∧β)(2s(α,β)+1)−s(α,β) , h2 =|Tn|β(2s(α,β)+1)−s(α,β) , $n→0.
Théorème
Sous des hypothèses assurant l’ergodicité de la chaîneY, on a
E
bνn(x0)−ν(x0)21/2
.|Tn|−β/(2β+1),
E
qbn(x0,y0)−q(x0,y0)21/2
.$n−1|Tn|−s(α,β)/(2s(α,β)+1)
,
avecs(α, β)−1 = (α∧β)−1+β−1, uniformément enQ pour Qdans une certaine classe de régularité de Hölder dépendant de α et β.
20 / 32
Plan
Modèle probabiliste
Estimation non-paramétrique
Estimation paramétrique du taux de division
21 / 32
Estimation du taux de division
La dépendance en B de la transition est complexe mais explicite :
q(x,y) = ˆ 1
0
κ(z)
z B(y/z)σ(y/z)−2E hˆ ∞
0
e−´0tB(φx(s))dsdLy/zt (φx)i dz, avecLyt(φx) le temps local au tempst au pointy de(φx(t),t≥0).
→ Contraste de vraisemblance dans un cadre paramétrique avec (r, σ, κ) connus.
22 / 32
Estimation du taux de division
La dépendance en B de la transition est complexe mais explicite :
q(x,y) = ˆ 1
0
κ(z)
z B(y/z)σ(y/z)−2E hˆ ∞
0
e−´0tB(φx(s))dsdLy/zt (φx)i dz, avecLyt(φx) le temps local au tempst au pointy de(φx(t),t≥0).
→ Contraste de vraisemblance dans un cadre paramétrique avec (r, σ, κ) connus.
22 / 32
Diffusion réfléchie
On se place dans le cas d’un trait évoluant dans un compact[0,L]⊂R
dφx(t) =r(φx(t))dt+σ(φx(t))dWt+d`t, avec`t=´t
0 1{Xs=0}+1{Xs=L}
d`s et (Wt)t≥0 est un mouvement brownien standard.
23 / 32
Modèle paramétrique
On suppose que le taux de division B appartient à une classe
B=
B: [0,L]→R,B(x) =B0(ϑ,x),x∈[0,L], ϑ∈Θ , où x7→B0(x, ϑ) est connu à un paramètreϑ∈Θprès, et Θ⊂Rd est compact.
But
Estimer ϑà partir de(Xu,u∈Tn).
24 / 32
Identifiabilité du modèle
Définition
Une classeB de fonctions de [0,L]dans[0,∞) est ordonnée si ϕ1, ϕ2 ∈ B entraine soitϕ1(x)≤ϕ2(x)pour tout x ∈[0,L]ou ϕ2(x)≤ϕ1(x) pour tout x∈[0,L].
Exemples :
- {x→ϑ, ϑ∈Θ}, - {x→1+ϑx, ϑ∈Θ}.
0.0 0.2 0.4 0.6 0.8 1.0
−2
−1 0 1 2 3 4 5 6
25 / 32
Contraste de vraisemblance
Un contraste de vraisemblance est donné par :
Ln ϑ,(Xu,u ∈Tn)
= Y
u∈T?n
qϑ(Xu−,Xu),
où Xu− correspond au trait de l’ancêtre deu. On considère alors l’estimateur de ϑdonné par :
ϑbn∈argmax
ϑ∈Θ
1 T?n
X
u∈T?n
log(qϑ(Xu−,Xu))
.
26 / 32
Consistance
Théorème
Sous des hypothèses de régularité du taux de division,ϑbn converge en probabilité versϑlorsque n tend vers l’infini.
27 / 32
Normalité asymptotique
On définitΨ(ϑ) la matrice d’information de Fisher dont les coefficients sont donnés pour tout 1≤i,j ≤d par :
Ψ(ϑ)i,j =νϑQ(ϑ)
∂ϑiqϑ∂ϑjqϑ
qϑ2
.
Théorème
Sous des hypothèses de régularité et siΨ(ϑ) est inversible, pour toutϑ dans l’intérieur de Θ, on a:
T1/2n
ϑbn−ϑ
→ N 0,Ψ(ϑ)−1 , en loi lorsque n tend vers l’infini, oùN 0,Ψ(ϑ)−1
désigne la loi normale d-dimensionnelle de moyenne 0 et de matrice de covariance l’inverse de la matrice de Fisher ψ(ϑ).
28 / 32
Simulations
0.0 0.2 0.4 0.6 0.8 1.0
Trait at birth of the ancestor 0.0
0.2 0.4 0.6 0.8 1.0
Trait at birth
ϑ= 2
0.0 0.2 0.4 0.6 0.8 1.0
Trait at birth of the ancestor 0.0
0.2 0.4 0.6 0.8 1.0
Trait at birth
ϑ= 15
Figure:Données simulées avec B(x, ϑ)≡ϑ,φx(t) =Wt.
29 / 32
Protocole
Pour chaqueϑdans une grille fixée,
I simulation de données avec le paramètre ϑ,
I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,
30 / 32
Protocole
Pour chaqueϑdans une grille fixée,
I simulation de données avec le paramètre ϑ,
I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,
30 / 32
Protocole
Pour chaqueϑdans une grille fixée,
I simulation de données avec le paramètre ϑ,
I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,
30 / 32
Protocole
Pour chaqueϑdans une grille fixée,
I simulation de données avec le paramètre ϑ,
I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,
0.0 0.2 0.4 0.6 0.8 1.0
Trait at birth of the ancestor 0.0
0.2 0.4 0.6 0.8 1.0
Trait at birth
ϑ= 1.1
1 2 3 4 5
0.0 0.2 0.4 0.6 0.8 1.0
Trait at birth of the ancestor 0.0
0.2 0.4 0.6 0.8 1.0
Trait at birth
ϑ= 2
1 2 3 4 5 6
0.0 0.2 0.4 0.6 0.8 1.0
Trait at birth of the ancestor 0.0
0.2 0.4 0.6 0.8 1.0
Trait at birth
ϑ= 2.8
1 2 3 4 5 6
Figure:Densité de la transition pourB(x, ϑ)≡ϑ.
30 / 32
Résultats
I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,
I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.
31 / 32
Résultats
I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,
I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.
31 / 32
Résultats
I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,
I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.
1.25 1.50 1.75 2.00 2.25 2.50 2.75
ϑ
0.559 0.560 0.561 0.562 0.563 0.564
Ln(ϑ,X)
31 / 32
Résultats
I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,
I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.
B ϑ Mean Std Dev. ϑmin ϑmax ∆ϑ
B0 2 1.9908 0.0845 1.8 2.2 0.05
15 15.029 0.4763 14 16 0.25
B1 2 2.1392 0.3485 1.375 3 0.125
15 15.023 0.6425 13.75 16.5 0.25
31 / 32
13.82
Merci pour votre attention !
32 / 32