Estimation statistique dans une population structurée branchante

(1)

Estimation statistique dans une population structurée branchante

Aline Marguet

En collaboration avec M. Hoffmann

29 janvier 2017

1 / 32

(2)

Décrire la dynamique d’une population de cellules

Modèle individu-centré où chaque cellule est caractérisée par un trait (âge, taille, nombre de parasites, ...).

I Comprendre le rôle de certaines caractéristiques dans la division cellulaire.

I Étudier le mécanisme de vieillissement cellulaire.

I Inférence statistique.

2 / 32

(3)

Étude de la prolifération d’une infection

Figure:Image : Soifer, Robert & Amir, 2016.

I Division asymétrique : répartition asymétrique des parasites

I Stratégie pour éliminer l’infection ?

3 / 32

(4)

Modèle probabiliste

Estimation non-paramétrique

Estimation paramétrique du taux de division

4 / 32

(5)

Description du modèle

I Le trait (φx(t))_t≥0 de chaque individu évolue suivant une diffusion d’équation :

dφx(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,

où r, σ:R→Rsont des fonctions mesurables et(W_t)t≥0 est un mouvement brownien standard.

I Chaque individu se divise au temps t à un tauxB(φ_x(t)),

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a. de densité associéeκ(θ) symétrique.

I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.

5 / 32

(6)

Description du modèle

I Chaque individu se divise au tempst à un tauxB(φ_x(t)),

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a. de densité associéeκ(θ) symétrique.

5 / 32

(7)

Description du modèle

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a.

de densité associéeκ(θ) symétrique.

5 / 32

(8)

Description du modèle

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a.

de densité associéeκ(θ) symétrique.

5 / 32

(9)

Exemple de trajectoire

0.0 0.1 0.2 0.3 0.4 0.5 0.6

time 0.0

0.2 0.4 0.6 0.8

trait

X_∅

X1

X0

X11

X10

X01

X00

;

00 01

1

10 11

0

6 / 32

(10)

Temps généalogique

Thèse A. Olivier 2015.

7 / 32

(11)

Chaîne de Markov bifurcante

On considère les notations de Ulam-Harris-Neveu, pourn,m≥0, on note :

T= [

m∈N

{0,1}^m, Tn=

n

[

m=0

{0,1}^m, T^?n=Tn\ {∅}.

On note X_u le trait à la naissance d’un individu u∈T. On suppose que l’on dispose des observations

Xⁿ= (X_u)u∈Tn.

Le processus (X_u,u ∈T) est alors une chaîne de Markov bifurcante de noyau de transition P deRdans R×R tel que :

E Y

u∈Gm

ψ_u(X_u,X_u0,X_u1) Fm

= Y

u∈Gm

Pψ_u(X_u),

pour tout m≥0.

Guyon 2007.

8 / 32

(12)

Exemple de trajectoire

0.0 0.1 0.2 0.3 0.4 0.5 0.6

time 0.0

0.2 0.4 0.6 0.8

trait

X_∅

X1

X0

X11

X10

X01

X00

;

00 01

1

10 11

0

9 / 32

(13)

Exemple de trajectoire

0.0 0.1 0.2 0.3 0.4 0.5 0.6

time 0.0

0.2 0.4 0.6 0.8

trait

X_∅

X1

X0

X11

X10

X01

X00

;

00 01

1

10 11

0

9 / 32

(14)

Processus de la cellule étiqueté

Soit Y la chaîne de Markov correspondant au trait de la cellule étiquetée.

Force topology is enabled!

Branch lengths do not represent real values.

La transition de Y est donnée par , avec

P¹(x,dy) = ˆ

R

P(x,dydy2) =P²(x,dy) = ˆ

R

P(x,dy1dy), car κ est symétrique.

10 / 32

(15)

Processus de la cellule étiqueté

La transition de Y est donnée parQ= (P1+P2)/2, avec P¹(x,dy) =

ˆ

R

10 / 32

(16)

Processus de la cellule étiqueté

La transition de Y est donnée parQ=P1, avec P¹(x,dy) =

ˆ

R

10 / 32

(17)

Objectifs

À partir de(X_u,u∈Tn),

I estimerν(dx) (mesure invariante),

I estimerQ(dx),

I estimerB.

11 / 32

(18)

Hypothèses

Hypothèses sur la dynamique du flot Il exister1, σ1, σ2 >0, tels que

|r(x)| ≤r1(1+|x|), σ1 ≤σ(x)≤σ2, ∀x∈ X. De plus, il exister2>0, tel que

sgn(x)r(x)<0, ∀|x| ≥r₂, avec sgn(x) =1_{x>0}−1_{x≤0}.

12 / 32

(19)

Hypothèses

Hypothèses sur les divisions

La fonctionx 7→B(x) est continue et il existeb1,b2 >0 et γ≥0, tels que

b₁ ≤B(x)≤b₂|x|^γ+b₁, ∀x∈ X.

Hypothèses sur la fragmentation

κ(z) =κ(1−z) pour tout z ∈[0,1], supp(κ)⊂[ε,1−ε]avec 0< ε <1/2, inf_{z∈[ε,1−ε]}κ(z)≥δ.

13 / 32

(20)

Hypothèses

Hypothèses sur les divisions

La fonctionx 7→B(x) est continue et il existeb1,b2 >0 et γ≥0, tels que

b₁ ≤B(x)≤b₂|x|^γ+b₁, ∀x∈ X.

Hypothèses sur la fragmentation

κ(z) =κ(1−z) pour tout z ∈[0,1], supp(κ)⊂[ε,1−ε]avec 0< ε <1/2, inf_{z∈[ε,1−ε]}κ(z)≥δ.

13 / 32

(21)

Convergence de la chaîne étiquetée

On note

|ϕ|V =sup

x∈R

|ϕ(x)| 1+V(x).

Théorème

Sous les hypothèses précédentes, Q admet une mesure invarianteν.

De plus, il existe C >0 etρ∈(0,1) tels que pour tout x ∈Ret m∈N:

Q^mϕ−ν(ϕ)

V ≤Cρ^m

ϕ−ν(ϕ) V

pour toute fonction mesurableϕ:R→Rtelle que |ϕ|V <∞, avec V(x) =x².

14 / 32

(22)

Comportement asymptotique de la mesure empirique

Mn(ψ) = 1

|T^?n| X

u∈T^?n

ψ(X_u⁻,X_u).

Théorème

Soit µ∈ MP(R) telle que µ(V²)<∞ etψ:R×R→Rbornée telle que ψ_? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a

Eµ

(Mn(ψ)−ν(Qψ))²

.|Tn|⁻¹C(ψ), ∀n∈N, où .signifie à une constante près dépendant de Qet supp(ψ_?)et

C(ψ) = ψ²

µ+ν+|ψ^?ψ|µ+

1+µ(V²)^1/2

|ψ_?|1|ψ|ν.

|ψ|µ= ˆ

R×R

|ψ(x,y)|µ(dx)dy+|ψ?|1∧ |ψ|∧1, ψ^?(x) =sup

y∈R

|ψ(x,y)|

|ψ|∧1= ˆ

X ×X

|ψ(x,y)|dxdy^

|ψ?(y)|1, ψ?(y) =sup

x∈R

|ψ(x,y)|.

15 / 32

(23)

Comportement asymptotique de la mesure empirique

Mn(ψ) = 1

|T^?n| X

u∈T^?n

ψ(X_u⁻,X_u).

Théorème

Soit µ∈ MP(R) telle que µ(V²)<∞et ψ:R×R→Rbornée telle que ψ_? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a

Eµ

C(ψ) = ψ²

µ+ν+|ψ^?ψ|µ+

1+µ(V²)^1/2

|ψ_?|1|ψ|ν.

|ψ|µ= ˆ

R×R

y∈R

|ψ(x,y)|

|ψ|∧1= ˆ

X ×X

|ψ(x,y)|dxdy^

|ψ?(y)|1, ψ?(y) =sup

x∈R

|ψ(x,y)|.

15 / 32

(24)

Comportement asymptotique de la mesure empirique

Mn(ψ) = 1

|T^?n| X

u∈T^?n

ψ(X_u⁻,X_u).

Théorème

Soit µ∈ MP(R) telle que µ(V²)<∞et ψ:R×R→Rbornée telle que ψ_? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a

Eµ

C(ψ) = ψ²

µ+ν+|ψ^?ψ|µ+

1+µ(V²)^1/2

|ψ_?|1|ψ|ν.

|ψ|µ= ˆ

R×R

y∈R

|ψ(x,y)|

|ψ|∧1= ˆ

X ×X

|ψ(x,y)|dxdy^

|ψ?(y)|1, ψ?(y) =sup

x∈R

|ψ(x,y)|.

15 / 32

(25)

Plan

16 / 32

(26)

Noyau

Définition

Une fonction G :R→R est un noyau d’ordrek si elle satisfait

´

Rx^lG(x)dx =1_{l_=0} pour tout l =0, . . . ,k.

Exemples :

- x →1_{x≤1} est un noyau d’ordre 0, - x →1/√

2πe^−x²^/2 est un noyau d’ordre 1,

- on peut construire des noyaux de tout ordre à l’aide des polynômes de Legendre.

17 / 32

(27)

Estimateur à noyau de la mesure invariante

Soit G un noyau d’ordrek eth >0 un paramètre de lissage. On pose G_h(y) =h⁻¹G(h⁻¹y), ∀y ∈R.

Comme Mn(ϕ) converge versν(ϕ) (pour ϕ:R→R), on a Mn(G_h(· −x0))−−−→_n→∞

ˆ

R

G_h(x−x0)ν(x)dx.

Un estimateur deν(x0), pourx0∈Rest donc donné par

bνn(x0) =Mn(Gh(· −x0)).

18 / 32

(28)

Estimateur à noyau de la mesure invariante

Soit G un noyau d’ordrek eth >0 un paramètre de lissage. On pose G_h(y) =h⁻¹G(h⁻¹y), ∀y ∈R.

Comme Mn(ϕ) converge versν(ϕ) (pour ϕ:R→R), on a Mn(G_h(· −x0))−−−→_n→∞

ˆ

R

G_h(x−x0)ν(x)dx.

Un estimateur deν(x0), pourx0∈Rest donc donné par

bνn(x0) =Mn(G_h(· −x0)).

18 / 32

(29)

Estimateur à noyau de la densité

De la même façon, on considère G un noyau d’ordre k eth1,h2 >0 deux paramètres de lissage. On pose

G_h^⊗2

1,h2(x,y) =h⁻¹₁ h₂⁻¹G(h₁⁻¹x)G(h⁻¹₂ y), ∀x,y∈R. On a alors la convergence suivante :

Mn(G_h^⊗2

1,h2(· −x0,· −y0))

−−−→_n→∞

ˆ

R×R

G_h^⊗2₁_,h₂(x−x0,y−y0)q(x,y)ν(x)dydx.

Un estimateur de la densité q(x0,y0), pour x0,y0 ∈Rest alors donné par

qbn(x0,y0) = Mn(G_h^⊗2₁_,h₂(· −x0,· −y0) Mn(G_h(· −x0))∨$ .

19 / 32

(30)

Estimateur à noyau de la densité

De la même façon, on considère G un noyau d’ordre k eth1,h2 >0 deux paramètres de lissage. On pose

G_h^⊗2

1,h2(x,y) =h⁻¹₁ h₂⁻¹G(h₁⁻¹x)G(h⁻¹₂ y), ∀x,y∈R. On a alors la convergence suivante :

Mn(G_h^⊗2

1,h2(· −x0,· −y0))

−−−→_n→∞

ˆ

R×R

G_h^⊗2₁_,h₂(x−x0,y−y0)q(x,y)ν(x)dydx.

Un estimateur de la densité q(x0,y0), pour x0,y0 ∈Rest alors donné par

qbn(x0,y0) = Mn(G_h^⊗2₁_,h₂(· −x0,· −y0) Mn(G_h(· −x0))∨$ .

19 / 32

(31)

Convergence des estimateurs

Soit α, β >0 etG un noyau d’ordrek >max(α, β). On pose

h =|Tn|^2β+1⁻¹ , h1 =|Tn|(α∧β)(2s(α,β)+1)^−s(α,β) , h2 =|Tn|β(2s(α,β)+1)^−s(α,β) , $n→0.

Théorème

Sous des hypothèses assurant l’ergodicité de la chaîneY, on a

E

bνn(x0)−ν(x0)21/2

.|Tⁿ|^{−β/(2β+1)},

E

qbn(x0,y0)−q(x0,y0)21/2

.$_n⁻¹|Tn|−s(α,β)/(2s(α,β)+1)

,

avecs(α, β)⁻¹ = (α∧β)⁻¹+β⁻¹, uniformément enQ pour Qdans une certaine classe de régularité de Hölder dépendant de α et β.

20 / 32

(32)

Plan

21 / 32

(33)

Estimation du taux de division

La dépendance en B de la transition est complexe mais explicite :

q(x,y) = ˆ ₁

0

κ(z)

z B(y/z)σ(y/z)⁻²E hˆ ∞

0

e⁻^´⁰^t^B(φ^x^(s))dsdL^y/z_t (φ_x)i dz, avecL^y_t(φ_x) le temps local au tempst au pointy de(φ_x(t),t≥0).

→ Contraste de vraisemblance dans un cadre paramétrique avec (r, σ, κ) connus.

22 / 32

(34)

Estimation du taux de division

La dépendance en B de la transition est complexe mais explicite :

q(x,y) = ˆ ₁

0

κ(z)

z B(y/z)σ(y/z)⁻²E hˆ ∞

0

e⁻^´⁰^t^B(φ^x^(s))dsdL^y/z_t (φ_x)i dz, avecL^y_t(φ_x) le temps local au tempst au pointy de(φ_x(t),t≥0).

→ Contraste de vraisemblance dans un cadre paramétrique avec (r, σ, κ) connus.

22 / 32

(35)

Diffusion réfléchie

On se place dans le cas d’un trait évoluant dans un compact[0,L]⊂R

dφ_x(t) =r(φ_x(t))dt+σ(φ_x(t))dW_t+d`_t, avec`t=´_t

0 1_{X_s_=0}+1_{X_s_=L}

d`s et (W_t)t≥0 est un mouvement brownien standard.

23 / 32

(36)

Modèle paramétrique

On suppose que le taux de division B appartient à une classe

B=

B: [0,L]→R,B(x) =B0(ϑ,x),x∈[0,L], ϑ∈Θ , où x7→B₀(x, ϑ) est connu à un paramètreϑ∈Θprès, et Θ⊂R^d est compact.

But

Estimer ϑà partir de(X_u,u∈Tn).

24 / 32

(37)

Identifiabilité du modèle

Définition

Une classeB de fonctions de [0,L]dans[0,∞) est ordonnée si ϕ₁, ϕ₂ ∈ B entraine soitϕ₁(x)≤ϕ₂(x)pour tout x ∈[0,L]ou ϕ2(x)≤ϕ1(x) pour tout x∈[0,L].

Exemples :

- {x→ϑ, ϑ∈Θ}, - {x→1+ϑx, ϑ∈Θ}.

0.0 0.2 0.4 0.6 0.8 1.0

−2

−1 0 1 2 3 4 5 6

25 / 32

(38)

Contraste de vraisemblance

Un contraste de vraisemblance est donné par :

Ln ϑ,(Xu,u ∈Tn)

= Y

u∈T^?n

qϑ(X_u⁻,Xu),

où X_u⁻ correspond au trait de l’ancêtre deu. On considère alors l’estimateur de ϑdonné par :

ϑb_n∈argmax

ϑ∈Θ





 1 T^?n

X

u∈T^?n

log(q_ϑ(X_u⁻,X_u))





 .

26 / 32

(39)

Consistance

Théorème

Sous des hypothèses de régularité du taux de division,ϑbn converge en probabilité versϑlorsque n tend vers l’infini.

27 / 32

(40)

Normalité asymptotique

On définitΨ(ϑ) la matrice d’information de Fisher dont les coefficients sont donnés pour tout 1≤i,j ≤d par :

Ψ(ϑ)_i,j =ν_ϑQ(ϑ)

∂ϑiqϑ∂ϑjqϑ

q_ϑ²

.

Théorème

Sous des hypothèses de régularité et siΨ(ϑ) est inversible, pour toutϑ dans l’intérieur de Θ, on a:

T^1/2n

ϑbn−ϑ

→ N 0,Ψ(ϑ)⁻¹ , en loi lorsque n tend vers l’infini, oùN 0,Ψ(ϑ)⁻¹

désigne la loi normale d-dimensionnelle de moyenne 0 et de matrice de covariance l’inverse de la matrice de Fisher ψ(ϑ).

28 / 32

(41)

Simulations

0.0 0.2 0.4 0.6 0.8 1.0

Trait at birth of the ancestor 0.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 2

0.0 0.2 0.4 0.6 0.8 1.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 15

Figure:Données simulées avec B(x, ϑ)≡ϑ,φx(t) =Wt.

29 / 32

(42)

Protocole

Pour chaqueϑdans une grille fixée,

I simulation de données avec le paramètre ϑ,

I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,

30 / 32

(43)

Protocole

30 / 32

(44)

Protocole

30 / 32

(45)

Protocole

0.0 0.2 0.4 0.6 0.8 1.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 1.1

1 2 3 4 5

0.0 0.2 0.4 0.6 0.8 1.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 2

1 2 3 4 5 6

0.0 0.2 0.4 0.6 0.8 1.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 2.8

1 2 3 4 5 6

Figure:Densité de la transition pourB(x, ϑ)≡ϑ.

30 / 32

(46)

Résultats

I simulation 300 jeux de données de taille 2¹⁵−1=32765 avec le paramètreϑ₀,

I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.

31 / 32

(47)

Résultats

31 / 32

(48)

Résultats

I simulation 300 jeux de données de taille 2¹⁵−1=32765 avec le paramètreϑ0,

1.25 1.50 1.75 2.00 2.25 2.50 2.75

ϑ

0.559 0.560 0.561 0.562 0.563 0.564

Ln(ϑ,X)

31 / 32

(49)

Résultats

B ϑ Mean Std Dev. ϑmin ϑmax ∆ϑ

B₀ 2 1.9908 0.0845 1.8 2.2 0.05

15 15.029 0.4763 14 16 0.25

B1 2 2.1392 0.3485 1.375 3 0.125

15 15.023 0.6425 13.75 16.5 0.25

31 / 32

(50)

13.82

Merci pour votre attention !

32 / 32