Mise en place d’une m´ ethode symbolique - Analyse probabiliste, étude combinatoire et estimati

L’objectif de cette section est de mettre en place une méthode symbolique permettant de calculer la distribution associée au nombre d’occurrences d’une famille de mots dans un texte généré aléatoirement par un 0L-système stochastique L = ha, πi après N étapes de production.

N.B. 4.9 Afin de simplifier l’écriture des équations qui suivent, nous ne considérons que des familles réduites à un seul mot u ∈ W⁺ (c’est-à-dire U = {u}). L’extension à des familles de plusieurs mots ne pose pas de problème particulier.

Pour résoudre ce problème, on se propose de déterminer ΨL

N la fonction génératrice de LN associée à U = {u} avec LN le 0L-système correspondant à la N -ième étape de production. En effet, nous avons vu dans la section 4.2.2 que cette fonction génératrice peut se mettre sous la forme d’une série entière :

Ψ^L_N(z) = ^X w∈W (P^N)_a,wz^c(w,u) =^X k∈N P c(wN^L, u) = k zk avec wL n

n≥0la chaˆıne de Markov générée par L. La suite des coefficients P c(w_N^L, u) = k

k≥0

correspond à la distribution qui nous intéresse. Le problème est que, la plupart du temps, ΨL

N ne peut pas être calculée directement à cause de la complexité des structures engen-drées par L. Nous mettons en place une méthode symbolique permettant alors d’obtenir Ψ^L_N de fa¸con récursive.

Nous commen¸cons cette section par quelques rappels de combinatoire et nous pr´ e-sentons ensuite les fondements de la m´ethode symbolique.

4.3.1 Rappels de combinatoire

Tous les concepts mentionnés dans cette annexe sont détaillés dans Flajolet and Sedgewick (2009). Soit A une classe combinatoire et |.| une fonction taille. Soit A la fonction génératrice de A munie de s :

A(z) =^X

t∈A

z^|t| =^X

n∈N

A_nzⁿ

avec A_n le nombre d’éléments de A ayant une taille n. La suite (A_n)_n∈N est appelée suite de comptage de A (counting sequence en anglais).

Définition 4.3.1 (Construction admissible) Soit B(1), . . . , B(m) une collection de classes combinatoires munies d’une fonction taille |.| et B(1), . . . , B(m) les fonctions génératrices correspondantes. Soient (Bn⁽¹⁾)_n∈N, . . . , (Bn^(m))_n∈N les suites de comptage associées. Soit Φ une construction qui, pour toute collection de classes B(1), . . . , B(m), associe une nou-velle classe

4.3. Mise en place d’une m´ethode symbolique 77

La construction Φ est admissible si la suite de comptage (A_n)_n∈N de A ne dépend que des suites de comptage (Bn⁽¹⁾)_n∈N,. . .,(Bn^(m))_n∈N de B(1), . . . , B(m). Pour une telle construc-tion admissible, il existe un opérateur Ψ bien défini agissant sur les fonctions gén´ era-trices correspondantes B(1)(z), . . . , B(m)(z) :

A(z) = Ψ[B⁽¹⁾(z), . . . , B^(m)(z)].

Définition 4.3.2 (Spécification) Une spécification pour un r-uplet (A(1), . . . , A(r)) de classes combinatoires est une collection de r équations,

       A(1) = Φ₁(A(1), . . . , A(r)) A(2) = Φ₂(A(1), . . . , A(r)) · · · A(r) = Φ_r(A⁽¹⁾, . . . , A^(r)) (4.3)

o`u Φ1, Φ2, . . ., Φr sont des constructions admissibles.

Formellement, le système (4.3) est une spécification itérative si celui-ci est strictement triangulaire inférieur, c’est-à-dire que A(1) peut être exprimée uniquement à partir de classes combinatoires de bases et, pour tout k ∈ {1, . . . , r − 1}, la construction de A^(k+1) ne dépend que de A(1), . . ., A(k) et de classes combinatoires de base.

4.3.2 Principe, constructions admissibles et th´eor`emes de d´

e-composition

La méthode symbolique est très utilisée en analyse combinatoire, voir Flajolet and Sedgewick (2009). Elle permet de calculer des fonctions génératrices associées à des classes d’intérêt. Le principe de base consiste à transformer un système d’équations combinatoires faisant intervenir les classes d’intérêt en un système d’équations fonction-nelles impliquant les fonctions génératrices correspondantes.

Nous présentons ici cette méthode dans le cadre des textes générés aléatoirement par des 0L-systèmes stochastiques. La première étape de la méthode consiste à écrire une spécification itérative appropriée pour l’ensemble des classes combinatoires stochastiques

{WL

n | n ∈ {0, . . . , N }} sous la forme d’un système d’équations combinatoires reposant sur des constructions admissibles. Ensuite, en utilisant des règles de transformation, ces équations combinatoires sont transformées en équations fonctionnelles faisant intervenir ΨL

n pour n ∈ {0, . . . , N }. Finalement, les coefficients de ΨL

N sont extraits `a partir de ces ´equations fonctionnelles.

Le point crucial de la méthode symbolique est l’écriture de la spécification. Dans cette optique, les classes WL

n sont décomposées algébriquement en faisant intervenir les classes W_k^L avec k ≤ n mais aussi des classes de structure combinatoire simple. Cette décomposition doit reposer sur des constructions admissibles. Pour ce faire, nous allons utiliser la structure de semi-anneau établie dans la section 4.1.2 pour l’ensemble W des ensembles de mots pondérés contruits sur W . En effet, sous certaines conditions, les opérateurs union et concaténation sont des constructions admissibles :

Définition 4.3.3 (Concaténation non génératrice) Soit u ∈ W+ et G et H deux sous-ensembles de W . La concaténation de G et de H est dite non génératrice par rapport à u si la condition suivante est vérifiée :

∀(w, v) ∈ G × H, c(w.v, u) = c(w, u) + c(v, u).

Dans le cas contraire, la concaténation de G et de H est dite génératrice par rapport à u.

Par définition, la concaténation de G = {(w, p_w) | w ∈ G} et de H = {(v, q_v) | v ∈ H} est dite non génératrice par rapport à u si la concaténation de G et de H l’est. Dans ce cas :

Théorème 4.3.1 (Constructions admissibles) Soient G, H et I trois éléments de W. Soit u ∈ W+ et α,β et γ les fonctions génératrices respectives de G, H et I associées `

a U = {u}. Alors, l’op´erateur union ‘ + ’ est une construction admissible avec la r`egle de transformation suivante :

I = G + H =⇒ γ(z) = α(z) + β(z).

Supposons de plus que la concaténation de G et H est non génératrice par rapport à u. Dans ce cas, l’opérateur concaténation ‘ . ’ est aussi une construction admissible avec la règle de transformation suivante :

I = G.H =⇒ γ(z) = α(z)β(z).

Preuve Supposons que G = {(w, p_w) | w ∈ G} et que H = {(v, q_v) | v ∈ H}. 1) Si I = G + H. Alors, `a partir des d´efinitions 4.1.8 et 4.1.9 :

γ(z) = ^X x∈G\H p_xz^c(x,u)+ ^X x∈H\G q_xz^c(x,u)+ ^X x∈G∩H (p_x+ q_x)z^c(x,u) = ^X w∈G p_wz^c(w,u)+^X v∈H q_vz^c(v,u) = α(z) + β(z).

2) Si I = G.H. Alors, `a partir des d´efinitions 4.1.8 et 4.1.10 :

γ(z) = ^X

(w,v)∈G×H

(p_wq_v)z^c(w.v,u).

Etant donné que la concaténation de G et H est non génératrice par rapport à u, alors, pour (w, v) ∈ G × H, c(w.v, u) = c(w, u) + c(v, u). Ainsi,

γ(z) = ^X (w,v)∈G×H pwz^c(w,u) qvz^c(v,u) = ^X w∈G pwz^c(w,u) ! X v∈H qvz^c(v,u) ! = α(z).β(z). N.B. 4.10 Contrairement à l’opérateur union classique ∪, il n’y a pas besoin d’imposer que G ∩ H = {} pour faire de l’opérateur ‘ + ’ une construction admissible.

4.3. Mise en place d’une m´ethode symbolique 79

Bien que la structure de semi-anneau donne un cadre algébrique pour l’écriture de la spécification, elle ne fournit pas de méthode de décomposition pour W_n^L avec n ∈ {0, . . . , N }. Pour obtenir une telle décomposition, nous pouvons utiliser les théorèmes 4.3.2 et 4.3.3 suivants :

Théorème 4.3.2 (Décomposition générale) Soit L = hW⁺, πi un F0L-système sto-chastique. Alors :

∀a ∈ W+

, ∀n ∈ N, W_n+1^L[a] = ^X

w∈W

{(, π_a,w)}.W_n^L[w].

Preuve Soit P le noyau de transition associé à L. Soit x ∈ W_n+1^L[a]. Alors, il existe s ∈ W tel que x = (s, (Pⁿ⁺¹)a,s). En utilisant le théorème de Chapman-Kolmogorov, nous avons : (Pⁿ⁺¹)_a,s = ^X w∈W P_a,w(Pⁿ)_w,s = ^X w∈W π_a,w(Pⁿ)_w,s. (4.4) Ainsi : {x} = {(s, ^X w∈W π_a,w(Pⁿ)_w,s)} = ^X w∈W {(s, π_a,w(Pⁿ)_w,s)} = ^X w∈W {(, π_a,w)}.{(s, (Pⁿ)_w,s)}.

Or (s, (Pⁿ)_w,s) ∈ Wn^L[w] pour tout w ∈ W . Nous en d´eduisons que, pour tout x ∈ W_n+1^L[a],

x ∈ ^X w∈W {(, π_a,w)}.W_n^L[w] et donc : W_n+1^L[a] ⊂ ^X w∈W {(, π_a,w)}.W_n^L[w]. R´eciproquement, soit x = (s, p_s) ∈ ^X w∈W

{(, π_a,w)}.W_n^L[w]. Alors, il existe une suite

{(r_w, (Pn)_w,r_w)}_w∈W de Wn^L[w] telle que : {x} = {(s, p_s)} = ^X w∈W {(, π_a,w)}.{(r_w, (Pⁿ)_w,r_w)} = ^X w∈W {(r_w, π_a,w(Pⁿ)_w,r_w)}.

Cette dernière équation impose s = r_w pour tout w ∈ W . Ainsi, en utilisant l’équation de Chapman-Kolmogorov (4.4), nous obtenons :

{x} = ^X

w∈W

{(s, π_a,w(Pⁿ)_w,s)} = {(s, ^X

w∈W

π_a,w(Pⁿ)_w,s)} = {(s, (Pⁿ⁺¹)_a,s)}.

Nous en d´eduisons que, pour tout x ∈ ^X

w∈W

{(, π_a,w)}.W_n^L[w], x ∈ W_n+1^L[a] et donc :

X w∈W {(, π_a,w)}.W_n^L[w] ⊂ W_n+1^L[a]. Finalement : W_n+1^L[a] = ^X w∈W {(, πa,w)}.W_n^L[w].

Théorème 4.3.3 (Indépendance d’évolution) Soit L = hW+, πi un F0L-système stochastique. Soient w₁, w₂,. . ., w_k, k mots de W+. Alors :

∀n ∈ N, W^L[w1.w2.··· .wk]

n = W^L[w1]

n .W^L[w2]

n . · · · .W^L[wk] n .

Preuve Soit k = 2. Soient m₁ et m₂ le nombre de lettres de w₁ et de w₂ respec-tivement. Dans ce cas, il existe (v1

1, . . . , v1 m1) ∈ Vm1 et (v2 1, . . . , v2 m2) ∈ Vm2 tels que w₁ = v1 1. · · · .v1 m1 et w₂ = v2 1. · · · .v2

m2. Etant donné que les lettres d’un mot évoluent de fa¸con indépendante, nous avons :

W^L[w1.w2] n = W^L[v 1 1.··· .v1 m1^.v1².··· .v2 m2^] n = W^L[v¹1] n . · · · .W^L[v 1 m1^] n .W^L[v²1] n . · · · .W^L[v 2 m2^] n . De la mˆeme fa¸con, pour j ∈ {1, 2} :

W^L[wj] n = W^L[v j 1.··· .v^j_mj] n = W^L[v1^j] n . · · · .W^L[v j mj^] n . Ainsi, W^L[w1.w2] n = W^L[w1] n .W^L[w2] n .

Le résultat du théorème se démontre par une récurrence immédiate sur k ≥ 2.

Les théorèmes 4.3.2 et 4.3.3 procurent des équations combinatoires qui apparaissent comme des décompositions naturelles des classes W_n^L. Cependant, leur utilisation n’abou-tit pas toujours sur des constructions admissibles (voir l’exemple 4.4.2). Dans ce cas, d’autres méthodes moins systématiques doivent être employées pour obtenir une sp´ eci-fication appropriée.

4.3.3 Enonc´e de la m´ethode

Soit L = hA, πi un F0L-système stochastique. La méthode symbolique peut être résumée par les points suivants :

• Déterminer l’objectif : calculer la distribution associée au nombre d’occurrences d’un mot u ∈ W⁺ dans un texte généré aléatoirement par le système composant L[a] après N étapes de production et a ∈ A.

• Ecrire la fonction génératrice de W_N^L[a] associée à U = {u} : Ψ^L[a]_N . Les coefficients de Ψ^L[a]_N (écrite sous la forme d’une série entière) donnent la distribution d’intérêt. • Ecrire une spécification itérative pour les ensembles de mots pondérés {Wn^L[a] | n ∈ {0, . . . , N }} en utilisant des constructions admissibles obtenues à partir des op´ e-rateurs union ‘ + ’ et concaténation ‘ . ’. Les théorèmes 4.3.2 et 4.3.3 permettent en général d’aboutir au résultat.

• Utiliser les règles de transformation du théorème 4.3.1 et écrire un système fermé d’équations fonctionnelles impliquant Ψ^L[a]_N pour n ∈ {0, . . . , N }.

• Résoudre directement le système précédent ou bien trouver un ensemble d’équa-tions récursives vérifiées par les coefficients de Ψ^L[a]_N pour n ∈ {0, . . . , N }.

Dans le document Analyse probabiliste, étude combinatoire et estimation paramétrique pour une classe de modèles de croissance de plantes avec développement stochastique (Page 77-82)