• Aucun résultat trouvé

Estimation statistique dans une population structurée branchante

N/A
N/A
Protected

Academic year: 2022

Partager "Estimation statistique dans une population structurée branchante"

Copied!
50
0
0

Texte intégral

(1)

Estimation statistique dans une population structurée branchante

Aline Marguet

En collaboration avec M. Hoffmann

29 janvier 2017

1 / 32

(2)

Décrire la dynamique d’une population de cellules

Modèle individu-centré où chaque cellule est caractérisée par un trait (âge, taille, nombre de parasites, ...).

I Comprendre le rôle de certaines caractéristiques dans la division cellulaire.

I Étudier le mécanisme de vieillissement cellulaire.

I Inférence statistique.

2 / 32

(3)

Étude de la prolifération d’une infection

Figure:Image : Soifer, Robert & Amir, 2016.

I Division asymétrique : répartition asymétrique des parasites

I Stratégie pour éliminer l’infection ?

3 / 32

(4)

Modèle probabiliste

Estimation non-paramétrique

Estimation paramétrique du taux de division

4 / 32

(5)

Description du modèle

I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :

x(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,

où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.

I Chaque individu se divise au temps t à un tauxB(φx(t)),

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a. de densité associéeκ(θ) symétrique.

I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.

5 / 32

(6)

Description du modèle

I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :

x(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,

où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.

I Chaque individu se divise au tempst à un tauxB(φx(t)),

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a. de densité associéeκ(θ) symétrique.

I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.

5 / 32

(7)

Description du modèle

I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :

x(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,

où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.

I Chaque individu se divise au tempst à un tauxB(φx(t)),

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a.

de densité associéeκ(θ) symétrique.

I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.

5 / 32

(8)

Description du modèle

I Le trait (φx(t))t≥0 de chaque individu évolue suivant une diffusion d’équation :

x(t) =r(φx(t))dt+σ(φx(t))dWt, φx(0) =x,

où r, σ:R→Rsont des fonctions mesurables et(Wt)t≥0 est un mouvement brownien standard.

I Chaque individu se divise au tempst à un tauxB(φx(t)),

I À sa mort, un individu de trait x est remplacé par 2 descendants de traits à la naissanceθx et(1−θ)x, où θ∈[0,1]est une v.a.

de densité associéeκ(θ) symétrique.

I Conditionnellement au trait de leur ancêtre, les descendants évoluent indépendamment les uns des autres.

5 / 32

(9)

Exemple de trajectoire

0.0 0.1 0.2 0.3 0.4 0.5 0.6

time 0.0

0.2 0.4 0.6 0.8

trait

X

X1

X0

X11

X10

X01

X00

;

00 01

1

10 11

0

6 / 32

(10)

Temps généalogique

Thèse A. Olivier 2015.

7 / 32

(11)

Chaîne de Markov bifurcante

On considère les notations de Ulam-Harris-Neveu, pourn,m≥0, on note :

T= [

m∈N

{0,1}m, Tn=

n

[

m=0

{0,1}m, T?n=Tn\ {∅}.

On note Xu le trait à la naissance d’un individu u∈T. On suppose que l’on dispose des observations

Xn= (Xu)u∈Tn.

Le processus (Xu,u ∈T) est alors une chaîne de Markov bifurcante de noyau de transition P deRdans R×R tel que :

E Y

u∈Gm

ψu(Xu,Xu0,Xu1) Fm

= Y

u∈Gm

u(Xu),

pour tout m≥0.

Guyon 2007.

8 / 32

(12)

Exemple de trajectoire

0.0 0.1 0.2 0.3 0.4 0.5 0.6

time 0.0

0.2 0.4 0.6 0.8

trait

X

X1

X0

X11

X10

X01

X00

;

00 01

1

10 11

0

9 / 32

(13)

Exemple de trajectoire

0.0 0.1 0.2 0.3 0.4 0.5 0.6

time 0.0

0.2 0.4 0.6 0.8

trait

X

X1

X0

X11

X10

X01

X00

;

00 01

1

10 11

0

9 / 32

(14)

Processus de la cellule étiqueté

Soit Y la chaîne de Markov correspondant au trait de la cellule étiquetée.

Force topology is enabled!

Branch lengths do not represent real values.

La transition de Y est donnée par , avec

P1(x,dy) = ˆ

R

P(x,dydy2) =P2(x,dy) = ˆ

R

P(x,dy1dy), car κ est symétrique.

10 / 32

(15)

Processus de la cellule étiqueté

Soit Y la chaîne de Markov correspondant au trait de la cellule étiquetée.

Force topology is enabled!

Branch lengths do not represent real values.

La transition de Y est donnée parQ= (P1+P2)/2, avec P1(x,dy) =

ˆ

R

P(x,dydy2) =P2(x,dy) = ˆ

R

P(x,dy1dy), car κ est symétrique.

10 / 32

(16)

Processus de la cellule étiqueté

Soit Y la chaîne de Markov correspondant au trait de la cellule étiquetée.

Force topology is enabled!

Branch lengths do not represent real values.

La transition de Y est donnée parQ=P1, avec P1(x,dy) =

ˆ

R

P(x,dydy2) =P2(x,dy) = ˆ

R

P(x,dy1dy), car κ est symétrique.

10 / 32

(17)

Objectifs

À partir de(Xu,u∈Tn),

I estimerν(dx) (mesure invariante),

I estimerQ(dx),

I estimerB.

11 / 32

(18)

Hypothèses

Hypothèses sur la dynamique du flot Il exister1, σ1, σ2 >0, tels que

|r(x)| ≤r1(1+|x|), σ1 ≤σ(x)≤σ2, ∀x∈ X. De plus, il exister2>0, tel que

sgn(x)r(x)<0, ∀|x| ≥r2, avec sgn(x) =1{x>0}−1{x≤0}.

12 / 32

(19)

Hypothèses

Hypothèses sur les divisions

La fonctionx 7→B(x) est continue et il existeb1,b2 >0 et γ≥0, tels que

b1 ≤B(x)≤b2|x|γ+b1, ∀x∈ X.

Hypothèses sur la fragmentation

κ(z) =κ(1−z) pour tout z ∈[0,1], supp(κ)⊂[ε,1−ε]avec 0< ε <1/2, infz∈[ε,1−ε]κ(z)≥δ.

13 / 32

(20)

Hypothèses

Hypothèses sur les divisions

La fonctionx 7→B(x) est continue et il existeb1,b2 >0 et γ≥0, tels que

b1 ≤B(x)≤b2|x|γ+b1, ∀x∈ X.

Hypothèses sur la fragmentation

κ(z) =κ(1−z) pour tout z ∈[0,1], supp(κ)⊂[ε,1−ε]avec 0< ε <1/2, infz∈[ε,1−ε]κ(z)≥δ.

13 / 32

(21)

Convergence de la chaîne étiquetée

On note

|ϕ|V =sup

x∈R

|ϕ(x)| 1+V(x).

Théorème

Sous les hypothèses précédentes, Q admet une mesure invarianteν.

De plus, il existe C >0 etρ∈(0,1) tels que pour tout x ∈Ret m∈N:

Qmϕ−ν(ϕ)

V ≤Cρm

ϕ−ν(ϕ) V

pour toute fonction mesurableϕ:R→Rtelle que |ϕ|V <∞, avec V(x) =x2.

14 / 32

(22)

Comportement asymptotique de la mesure empirique

Mn(ψ) = 1

|T?n| X

u∈T?n

ψ(Xu,Xu).

Théorème

Soit µ∈ MP(R) telle que µ(V2)<∞ etψ:R×R→Rbornée telle que ψ? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a

Eµ

(Mn(ψ)−ν(Qψ))2

.|Tn|−1C(ψ), ∀n∈N, où .signifie à une constante près dépendant de Qet supp(ψ?)et

C(ψ) = ψ2

µ+ν+|ψ?ψ|µ+

1+µ(V2)1/2

?|1|ψ|ν.

|ψ|µ= ˆ

R×R

|ψ(x,y)|µ(dx)dy+?|1∧ |ψ|∧1, ψ?(x) =sup

y∈R

|ψ(x,y)|

|ψ|∧1= ˆ

X ×X

|ψ(x,y)|dxdy^

?(y)|1, ψ?(y) =sup

x∈R

|ψ(x,y)|.

15 / 32

(23)

Comportement asymptotique de la mesure empirique

Mn(ψ) = 1

|T?n| X

u∈T?n

ψ(Xu,Xu).

Théorème

Soit µ∈ MP(R) telle que µ(V2)<∞et ψ:R×R→Rbornée telle que ψ? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a

Eµ

(Mn(ψ)−ν(Qψ))2

.|Tn|−1C(ψ), ∀n∈N, où .signifie à une constante près dépendant de Qet supp(ψ?)et

C(ψ) = ψ2

µ+ν+|ψ?ψ|µ+

1+µ(V2)1/2

?|1|ψ|ν.

|ψ|µ= ˆ

R×R

|ψ(x,y)|µ(dx)dy+?|1∧ |ψ|∧1, ψ?(x) =sup

y∈R

|ψ(x,y)|

|ψ|∧1= ˆ

X ×X

|ψ(x,y)|dxdy^

?(y)|1, ψ?(y) =sup

x∈R

|ψ(x,y)|.

15 / 32

(24)

Comportement asymptotique de la mesure empirique

Mn(ψ) = 1

|T?n| X

u∈T?n

ψ(Xu,Xu).

Théorème

Soit µ∈ MP(R) telle que µ(V2)<∞et ψ:R×R→Rbornée telle que ψ? soit à support compact. Sous les hypothèses précédentes et si ρ <1/2, on a

Eµ

(Mn(ψ)−ν(Qψ))2

.|Tn|−1C(ψ), ∀n∈N, où .signifie à une constante près dépendant de Qet supp(ψ?)et

C(ψ) = ψ2

µ+ν+|ψ?ψ|µ+

1+µ(V2)1/2

?|1|ψ|ν.

|ψ|µ= ˆ

R×R

|ψ(x,y)|µ(dx)dy+?|1∧ |ψ|∧1, ψ?(x) =sup

y∈R

|ψ(x,y)|

|ψ|∧1= ˆ

X ×X

|ψ(x,y)|dxdy^

?(y)|1, ψ?(y) =sup

x∈R

|ψ(x,y)|.

15 / 32

(25)

Plan

Modèle probabiliste

Estimation non-paramétrique

Estimation paramétrique du taux de division

16 / 32

(26)

Noyau

Définition

Une fonction G :R→R est un noyau d’ordrek si elle satisfait

´

RxlG(x)dx =1{l=0} pour tout l =0, . . . ,k.

Exemples :

- x →1{x≤1} est un noyau d’ordre 0, - x →1/√

2πe−x2/2 est un noyau d’ordre 1,

- on peut construire des noyaux de tout ordre à l’aide des polynômes de Legendre.

17 / 32

(27)

Estimateur à noyau de la mesure invariante

Soit G un noyau d’ordrek eth >0 un paramètre de lissage. On pose Gh(y) =h−1G(h−1y), ∀y ∈R.

Comme Mn(ϕ) converge versν(ϕ) (pour ϕ:R→R), on a Mn(Gh(· −x0))−−−→n→∞

ˆ

R

Gh(x−x0)ν(x)dx.

Un estimateur deν(x0), pourx0∈Rest donc donné par

n(x0) =Mn(Gh(· −x0)).

18 / 32

(28)

Estimateur à noyau de la mesure invariante

Soit G un noyau d’ordrek eth >0 un paramètre de lissage. On pose Gh(y) =h−1G(h−1y), ∀y ∈R.

Comme Mn(ϕ) converge versν(ϕ) (pour ϕ:R→R), on a Mn(Gh(· −x0))−−−→n→∞

ˆ

R

Gh(x−x0)ν(x)dx.

Un estimateur deν(x0), pourx0∈Rest donc donné par

n(x0) =Mn(Gh(· −x0)).

18 / 32

(29)

Estimateur à noyau de la densité

De la même façon, on considère G un noyau d’ordre k eth1,h2 >0 deux paramètres de lissage. On pose

Gh⊗2

1,h2(x,y) =h−11 h2−1G(h1−1x)G(h−12 y), ∀x,y∈R. On a alors la convergence suivante :

Mn(Gh⊗2

1,h2(· −x0,· −y0))

−−−→n→∞

ˆ

R×R

Gh⊗21,h2(x−x0,y−y0)q(x,y)ν(x)dydx.

Un estimateur de la densité q(x0,y0), pour x0,y0 ∈Rest alors donné par

qbn(x0,y0) = Mn(Gh⊗21,h2(· −x0,· −y0) Mn(Gh(· −x0))∨$ .

19 / 32

(30)

Estimateur à noyau de la densité

De la même façon, on considère G un noyau d’ordre k eth1,h2 >0 deux paramètres de lissage. On pose

Gh⊗2

1,h2(x,y) =h−11 h2−1G(h1−1x)G(h−12 y), ∀x,y∈R. On a alors la convergence suivante :

Mn(Gh⊗2

1,h2(· −x0,· −y0))

−−−→n→∞

ˆ

R×R

Gh⊗21,h2(x−x0,y−y0)q(x,y)ν(x)dydx.

Un estimateur de la densité q(x0,y0), pour x0,y0 ∈Rest alors donné par

qbn(x0,y0) = Mn(Gh⊗21,h2(· −x0,· −y0) Mn(Gh(· −x0))∨$ .

19 / 32

(31)

Convergence des estimateurs

Soit α, β >0 etG un noyau d’ordrek >max(α, β). On pose

h =|Tn|2β+1−1 , h1 =|Tn|(α∧β)(2s(α,β)+1)−s(α,β) , h2 =|Tn|β(2s(α,β)+1)−s(α,β) , $n→0.

Théorème

Sous des hypothèses assurant l’ergodicité de la chaîneY, on a

E

n(x0)−ν(x0)21/2

.|Tn|−β/(2β+1),

E

qbn(x0,y0)−q(x0,y0)21/2

.$n−1|Tn|−s(α,β)/(2s(α,β)+1)

,

avecs(α, β)−1 = (α∧β)−1−1, uniformément enQ pour Qdans une certaine classe de régularité de Hölder dépendant de α et β.

20 / 32

(32)

Plan

Modèle probabiliste

Estimation non-paramétrique

Estimation paramétrique du taux de division

21 / 32

(33)

Estimation du taux de division

La dépendance en B de la transition est complexe mais explicite :

q(x,y) = ˆ 1

0

κ(z)

z B(y/z)σ(y/z)−2E hˆ

0

e´0tB(φx(s))dsdLy/ztx)i dz, avecLytx) le temps local au tempst au pointy de(φx(t),t≥0).

→ Contraste de vraisemblance dans un cadre paramétrique avec (r, σ, κ) connus.

22 / 32

(34)

Estimation du taux de division

La dépendance en B de la transition est complexe mais explicite :

q(x,y) = ˆ 1

0

κ(z)

z B(y/z)σ(y/z)−2E hˆ

0

e´0tB(φx(s))dsdLy/ztx)i dz, avecLytx) le temps local au tempst au pointy de(φx(t),t≥0).

→ Contraste de vraisemblance dans un cadre paramétrique avec (r, σ, κ) connus.

22 / 32

(35)

Diffusion réfléchie

On se place dans le cas d’un trait évoluant dans un compact[0,L]⊂R

x(t) =r(φx(t))dt+σ(φx(t))dWt+d`t, avec`tt

0 1{Xs=0}+1{Xs=L}

d`s et (Wt)t≥0 est un mouvement brownien standard.

23 / 32

(36)

Modèle paramétrique

On suppose que le taux de division B appartient à une classe

B=

B: [0,L]→R,B(x) =B0(ϑ,x),x∈[0,L], ϑ∈Θ , où x7→B0(x, ϑ) est connu à un paramètreϑ∈Θprès, et Θ⊂Rd est compact.

But

Estimer ϑà partir de(Xu,u∈Tn).

24 / 32

(37)

Identifiabilité du modèle

Définition

Une classeB de fonctions de [0,L]dans[0,∞) est ordonnée si ϕ1, ϕ2 ∈ B entraine soitϕ1(x)≤ϕ2(x)pour tout x ∈[0,L]ou ϕ2(x)≤ϕ1(x) pour tout x∈[0,L].

Exemples :

- {x→ϑ, ϑ∈Θ}, - {x→1+ϑx, ϑ∈Θ}.

0.0 0.2 0.4 0.6 0.8 1.0

−2

−1 0 1 2 3 4 5 6

25 / 32

(38)

Contraste de vraisemblance

Un contraste de vraisemblance est donné par :

Ln ϑ,(Xu,u ∈Tn)

= Y

u∈T?n

qϑ(Xu,Xu),

où Xu correspond au trait de l’ancêtre deu. On considère alors l’estimateur de ϑdonné par :

ϑbn∈argmax

ϑ∈Θ

 1 T?n

X

u∈T?n

log(qϑ(Xu,Xu))

 .

26 / 32

(39)

Consistance

Théorème

Sous des hypothèses de régularité du taux de division,ϑbn converge en probabilité versϑlorsque n tend vers l’infini.

27 / 32

(40)

Normalité asymptotique

On définitΨ(ϑ) la matrice d’information de Fisher dont les coefficients sont donnés pour tout 1≤i,j ≤d par :

Ψ(ϑ)i,jϑQ(ϑ)

ϑiqϑϑjqϑ

qϑ2

.

Théorème

Sous des hypothèses de régularité et siΨ(ϑ) est inversible, pour toutϑ dans l’intérieur de Θ, on a:

T1/2n

ϑbn−ϑ

→ N 0,Ψ(ϑ)−1 , en loi lorsque n tend vers l’infini, oùN 0,Ψ(ϑ)−1

désigne la loi normale d-dimensionnelle de moyenne 0 et de matrice de covariance l’inverse de la matrice de Fisher ψ(ϑ).

28 / 32

(41)

Simulations

0.0 0.2 0.4 0.6 0.8 1.0

Trait at birth of the ancestor 0.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 2

0.0 0.2 0.4 0.6 0.8 1.0

Trait at birth of the ancestor 0.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 15

Figure:Données simulées avec B(x, ϑ)ϑ,φx(t) =Wt.

29 / 32

(42)

Protocole

Pour chaqueϑdans une grille fixée,

I simulation de données avec le paramètre ϑ,

I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,

30 / 32

(43)

Protocole

Pour chaqueϑdans une grille fixée,

I simulation de données avec le paramètre ϑ,

I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,

30 / 32

(44)

Protocole

Pour chaqueϑdans une grille fixée,

I simulation de données avec le paramètre ϑ,

I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,

30 / 32

(45)

Protocole

Pour chaqueϑdans une grille fixée,

I simulation de données avec le paramètre ϑ,

I estimation non-paramétrique deqϑ à partir de ces données sur une grille de taille 200×200,

0.0 0.2 0.4 0.6 0.8 1.0

Trait at birth of the ancestor 0.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 1.1

1 2 3 4 5

0.0 0.2 0.4 0.6 0.8 1.0

Trait at birth of the ancestor 0.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 2

1 2 3 4 5 6

0.0 0.2 0.4 0.6 0.8 1.0

Trait at birth of the ancestor 0.0

0.2 0.4 0.6 0.8 1.0

Trait at birth

ϑ= 2.8

1 2 3 4 5 6

Figure:Densité de la transition pourB(x, ϑ)ϑ.

30 / 32

(46)

Résultats

I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,

I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.

31 / 32

(47)

Résultats

I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,

I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.

31 / 32

(48)

Résultats

I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,

I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.

1.25 1.50 1.75 2.00 2.25 2.50 2.75

ϑ

0.559 0.560 0.561 0.562 0.563 0.564

Ln(ϑ,X)

31 / 32

(49)

Résultats

I simulation 300 jeux de données de taille 215−1=32765 avec le paramètreϑ0,

I pour chaque jeu de données, calcul du contraste de vraisemblance pour les différentes valeurs de ϑà partir des densités estimées.

B ϑ Mean Std Dev. ϑmin ϑmax ∆ϑ

B0 2 1.9908 0.0845 1.8 2.2 0.05

15 15.029 0.4763 14 16 0.25

B1 2 2.1392 0.3485 1.375 3 0.125

15 15.023 0.6425 13.75 16.5 0.25

31 / 32

(50)

13.82

Merci pour votre attention !

32 / 32

Références

Documents relatifs

On utilise l'histogramme pour des séries à caractère quantitatif continu ( quand chaque modalité peut être à priori n'importe quel nombre réel d'un intervalle ).. Les valeurs

Effectuer la division euclidienne (quotient et

Ceci nous paraît éclairer le faux débat sur la « taille » de O à partir de laquelle un problème serait non paramétrique. S’il. admet une limite projective avec

La taille jouant un rôle important dans la dynamique des cellules, Gyllenberg et Webb ont introduit dans [65] le premier modèle de population structurée en taille (et en âge), avec

En effet, des liaisons chimiques peuvent s’établir entre les acides aminés de la protéine ce qui entraîne un repliement dans l’espace de la protéine. Si la position des

Sur un même graphique, observer et tracer la caractéristique P = f(U) , puissance électrique en fonction de la tension aux bornes de la cellule, pour chaque éclairement. Appeler

médiane : Soit une population ordonnée selon les valeurs croissantes d'un caractère quantitatif, la médiane de cette série statistique est la valeur qui sépare la population en

Pour la représentation graphique d’un caractère continu, on utilise généralement un histogramme : dans un repère orthogonal on porte en abscisse les valeurs des bornes des