• Aucun résultat trouvé

L’objectif de cette section est de mettre en place une m´ethode symbolique permettant de calculer la distribution associ´ee au nombre d’occurrences d’une famille de mots dans un texte g´en´er´e al´eatoirement par un 0L-syst`eme stochastique L = ha, πi apr`es N ´etapes de production.

N.B. 4.9 Afin de simplifier l’´ecriture des ´equations qui suivent, nous ne consid´erons que des familles r´eduites `a un seul mot u ∈ W+ (c’est-`a-dire U = {u}). L’extension `a des familles de plusieurs mots ne pose pas de probl`eme particulier.

Pour r´esoudre ce probl`eme, on se propose de d´eterminer ΨL

N la fonction g´en´eratrice de LN associ´ee `a U = {u} avec LN le 0L-syst`eme correspondant `a la N -i`eme ´etape de production. En effet, nous avons vu dans la section 4.2.2 que cette fonction g´en´eratrice peut se mettre sous la forme d’une s´erie enti`ere :

ΨLN(z) = X w∈W (PN)a,wzc(w,u) =X k∈N P c(wNL, u) = k zk avec wL n 

n≥0la chaˆıne de Markov g´en´er´ee par L. La suite des coefficients P c(wNL, u) = k

k≥0

correspond `a la distribution qui nous int´eresse. Le probl`eme est que, la plupart du temps, ΨL

N ne peut pas ˆetre calcul´ee directement `a cause de la complexit´e des structures engen-dr´ees par L. Nous mettons en place une m´ethode symbolique permettant alors d’obtenir ΨLN de fa¸con r´ecursive.

Nous commen¸cons cette section par quelques rappels de combinatoire et nous pr´ e-sentons ensuite les fondements de la m´ethode symbolique.

4.3.1 Rappels de combinatoire

Tous les concepts mentionn´es dans cette annexe sont d´etaill´es dans Flajolet and Sedgewick (2009). Soit A une classe combinatoire et |.| une fonction taille. Soit A la fonction g´en´eratrice de A munie de s :

A(z) =X

t∈A

z|t| =X

n∈N

Anzn

avec An le nombre d’´el´ements de A ayant une taille n. La suite (An)n∈N est appel´ee suite de comptage de A (counting sequence en anglais).

D´efinition 4.3.1 (Construction admissible) Soit B(1), . . . , B(m) une collection de classes combinatoires munies d’une fonction taille |.| et B(1), . . . , B(m) les fonctions g´en´eratrices correspondantes. Soient (Bn(1))n∈N, . . . , (Bn(m))n∈N les suites de comptage associ´ees. Soit Φ une construction qui, pour toute collection de classes B(1), . . . , B(m), associe une nou-velle classe

4.3. Mise en place d’une m´ethode symbolique 77

La construction Φ est admissible si la suite de comptage (An)n∈N de A ne d´epend que des suites de comptage (Bn(1))n∈N,. . .,(Bn(m))n∈N de B(1), . . . , B(m). Pour une telle construc-tion admissible, il existe un op´erateur Ψ bien d´efini agissant sur les fonctions g´en´ era-trices correspondantes B(1)(z), . . . , B(m)(z) :

A(z) = Ψ[B(1)(z), . . . , B(m)(z)].

D´efinition 4.3.2 (Sp´ecification) Une sp´ecification pour un r-uplet (A(1), . . . , A(r)) de classes combinatoires est une collection de r ´equations,

       A(1) = Φ1(A(1), . . . , A(r)) A(2) = Φ2(A(1), . . . , A(r)) · · · A(r) = Φr(A(1), . . . , A(r)) (4.3)

o`u Φ1, Φ2, . . ., Φr sont des constructions admissibles.

Formellement, le syst`eme (4.3) est une sp´ecification it´erative si celui-ci est strictement triangulaire inf´erieur, c’est-`a-dire que A(1) peut ˆetre exprim´ee uniquement `a partir de classes combinatoires de bases et, pour tout k ∈ {1, . . . , r − 1}, la construction de A(k+1) ne d´epend que de A(1), . . ., A(k) et de classes combinatoires de base.

4.3.2 Principe, constructions admissibles et th´eor`emes de d´

e-composition

La m´ethode symbolique est tr`es utilis´ee en analyse combinatoire, voir Flajolet and Sedgewick (2009). Elle permet de calculer des fonctions g´en´eratrices associ´ees `a des classes d’int´erˆet. Le principe de base consiste `a transformer un syst`eme d’´equations combinatoires faisant intervenir les classes d’int´erˆet en un syst`eme d’´equations fonction-nelles impliquant les fonctions g´en´eratrices correspondantes.

Nous pr´esentons ici cette m´ethode dans le cadre des textes g´en´er´es al´eatoirement par des 0L-syst`emes stochastiques. La premi`ere ´etape de la m´ethode consiste `a ´ecrire une sp´ecification it´erative appropri´ee pour l’ensemble des classes combinatoires stochastiques

{WL

n | n ∈ {0, . . . , N }} sous la forme d’un syst`eme d’´equations combinatoires reposant sur des constructions admissibles. Ensuite, en utilisant des r`egles de transformation, ces ´equations combinatoires sont transform´ees en ´equations fonctionnelles faisant intervenir ΨL

n pour n ∈ {0, . . . , N }. Finalement, les coefficients de ΨL

N sont extraits `a partir de ces ´equations fonctionnelles.

Le point crucial de la m´ethode symbolique est l’´ecriture de la sp´ecification. Dans cette optique, les classes WL

n sont d´ecompos´ees alg´ebriquement en faisant intervenir les classes WkL avec k ≤ n mais aussi des classes de structure combinatoire simple. Cette d´ecomposition doit reposer sur des constructions admissibles. Pour ce faire, nous allons utiliser la structure de semi-anneau ´etablie dans la section 4.1.2 pour l’ensemble W des ensembles de mots pond´er´es contruits sur W . En effet, sous certaines conditions, les op´erateurs union et concat´enation sont des constructions admissibles :

D´efinition 4.3.3 (Concat´enation non g´en´eratrice) Soit u ∈ W+ et G et H deux sous-ensembles de W . La concat´enation de G et de H est dite non g´en´eratrice par rapport `a u si la condition suivante est v´erifi´ee :

∀(w, v) ∈ G × H, c(w.v, u) = c(w, u) + c(v, u).

Dans le cas contraire, la concat´enation de G et de H est dite g´en´eratrice par rapport `a u.

Par d´efinition, la concat´enation de G = {(w, pw) | w ∈ G} et de H = {(v, qv) | v ∈ H} est dite non g´en´eratrice par rapport `a u si la concat´enation de G et de H l’est. Dans ce cas :

Th´eor`eme 4.3.1 (Constructions admissibles) Soient G, H et I trois ´el´ements de W. Soit u ∈ W+ et α,β et γ les fonctions g´en´eratrices respectives de G, H et I associ´ees `

a U = {u}. Alors, l’op´erateur union ‘ + ’ est une construction admissible avec la r`egle de transformation suivante :

I = G + H =⇒ γ(z) = α(z) + β(z).

Supposons de plus que la concat´enation de G et H est non g´en´eratrice par rapport `a u. Dans ce cas, l’op´erateur concat´enation ‘ . ’ est aussi une construction admissible avec la r`egle de transformation suivante :

I = G.H =⇒ γ(z) = α(z)β(z).

Preuve Supposons que G = {(w, pw) | w ∈ G} et que H = {(v, qv) | v ∈ H}. 1) Si I = G + H. Alors, `a partir des d´efinitions 4.1.8 et 4.1.9 :

γ(z) = X x∈G\H pxzc(x,u)+ X x∈H\G qxzc(x,u)+ X x∈G∩H (px+ qx)zc(x,u) = X w∈G pwzc(w,u)+X v∈H qvzc(v,u) = α(z) + β(z).

2) Si I = G.H. Alors, `a partir des d´efinitions 4.1.8 et 4.1.10 :

γ(z) = X

(w,v)∈G×H

(pwqv)zc(w.v,u).

Etant donn´e que la concat´enation de G et H est non g´en´eratrice par rapport `a u, alors, pour (w, v) ∈ G × H, c(w.v, u) = c(w, u) + c(v, u). Ainsi,

γ(z) = X (w,v)∈G×H  pwzc(w,u)  qvzc(v,u)  = X w∈G pwzc(w,u) ! X v∈H qvzc(v,u) ! = α(z).β(z).  N.B. 4.10 Contrairement `a l’op´erateur union classique ∪, il n’y a pas besoin d’imposer que G ∩ H = {} pour faire de l’op´erateur ‘ + ’ une construction admissible.

4.3. Mise en place d’une m´ethode symbolique 79

Bien que la structure de semi-anneau donne un cadre alg´ebrique pour l’´ecriture de la sp´ecification, elle ne fournit pas de m´ethode de d´ecomposition pour WnL avec n ∈ {0, . . . , N }. Pour obtenir une telle d´ecomposition, nous pouvons utiliser les th´eor`emes 4.3.2 et 4.3.3 suivants :

Th´eor`eme 4.3.2 (D´ecomposition g´en´erale) Soit L = hW+, πi un F0L-syst`eme sto-chastique. Alors :

∀a ∈ W+

, ∀n ∈ N, Wn+1L[a] = X

w∈W

{(, πa,w)}.WnL[w].

Preuve Soit P le noyau de transition associ´e `a L. Soit x ∈ Wn+1L[a]. Alors, il existe s ∈ W tel que x = (s, (Pn+1)a,s). En utilisant le th´eor`eme de Chapman-Kolmogorov, nous avons : (Pn+1)a,s = X w∈W Pa,w(Pn)w,s = X w∈W πa,w(Pn)w,s. (4.4) Ainsi : {x} = {(s, X w∈W πa,w(Pn)w,s)} = X w∈W {(s, πa,w(Pn)w,s)} = X w∈W {(, πa,w)}.{(s, (Pn)w,s)}.

Or (s, (Pn)w,s) ∈ WnL[w] pour tout w ∈ W . Nous en d´eduisons que, pour tout x ∈ Wn+1L[a],

x ∈ X w∈W {(, πa,w)}.WnL[w] et donc : Wn+1L[a]X w∈W {(, πa,w)}.WnL[w]. R´eciproquement, soit x = (s, ps) ∈ X w∈W

{(, πa,w)}.WnL[w]. Alors, il existe une suite

{(rw, (Pn)w,rw)}w∈W de WnL[w] telle que : {x} = {(s, ps)} = X w∈W {(, πa,w)}.{(rw, (Pn)w,rw)} = X w∈W {(rw, πa,w(Pn)w,rw)}.

Cette derni`ere ´equation impose s = rw pour tout w ∈ W . Ainsi, en utilisant l’´equation de Chapman-Kolmogorov (4.4), nous obtenons :

{x} = X

w∈W

{(s, πa,w(Pn)w,s)} = {(s, X

w∈W

πa,w(Pn)w,s)} = {(s, (Pn+1)a,s)}.

Nous en d´eduisons que, pour tout x ∈ X

w∈W

{(, πa,w)}.WnL[w], x ∈ Wn+1L[a] et donc :

X w∈W {(, πa,w)}.WnL[w] ⊂ Wn+1L[a]. Finalement : Wn+1L[a] = X w∈W {(, πa,w)}.WnL[w].

 Th´eor`eme 4.3.3 (Ind´ependance d’´evolution) Soit L = hW+, πi un F0L-syst`eme stochastique. Soient w1, w2,. . ., wk, k mots de W+. Alors :

∀n ∈ N, WL[w1.w2.··· .wk]

n = WL[w1]

n .WL[w2]

n . · · · .WL[wk] n .

Preuve Soit k = 2. Soient m1 et m2 le nombre de lettres de w1 et de w2 respec-tivement. Dans ce cas, il existe (v1

1, . . . , v1 m1) ∈ Vm1 et (v2 1, . . . , v2 m2) ∈ Vm2 tels que w1 = v1 1. · · · .v1 m1 et w2 = v2 1. · · · .v2

m2. Etant donn´e que les lettres d’un mot ´evoluent de fa¸con ind´ependante, nous avons :

WL[w1.w2] n = WL[v 1 1.··· .v1 m1.v12.··· .v2 m2] n = WL[v11] n . · · · .WL[v 1 m1] n .WL[v21] n . · · · .WL[v 2 m2] n . De la mˆeme fa¸con, pour j ∈ {1, 2} :

WL[wj] n = WL[v j 1.··· .vjmj] n = WL[v1j] n . · · · .WL[v j mj] n . Ainsi, WL[w1.w2] n = WL[w1] n .WL[w2] n .

Le r´esultat du th´eor`eme se d´emontre par une r´ecurrence imm´ediate sur k ≥ 2.

 Les th´eor`emes 4.3.2 et 4.3.3 procurent des ´equations combinatoires qui apparaissent comme des d´ecompositions naturelles des classes WnL. Cependant, leur utilisation n’abou-tit pas toujours sur des constructions admissibles (voir l’exemple 4.4.2). Dans ce cas, d’autres m´ethodes moins syst´ematiques doivent ˆetre employ´ees pour obtenir une sp´ eci-fication appropri´ee.

4.3.3 Enonc´e de la m´ethode

Soit L = hA, πi un F0L-syst`eme stochastique. La m´ethode symbolique peut ˆetre r´esum´ee par les points suivants :

• D´eterminer l’objectif : calculer la distribution associ´ee au nombre d’occurrences d’un mot u ∈ W+ dans un texte g´en´er´e al´eatoirement par le syst`eme composant L[a] apr`es N ´etapes de production et a ∈ A.

• Ecrire la fonction g´en´eratrice de WNL[a] associ´ee `a U = {u} : ΨL[a]N . Les coefficients de ΨL[a]N (´ecrite sous la forme d’une s´erie enti`ere) donnent la distribution d’int´erˆet. • Ecrire une sp´ecification it´erative pour les ensembles de mots pond´er´es {WnL[a] | n ∈ {0, . . . , N }} en utilisant des constructions admissibles obtenues `a partir des op´ e-rateurs union ‘ + ’ et concat´enation ‘ . ’. Les th´eor`emes 4.3.2 et 4.3.3 permettent en g´en´eral d’aboutir au r´esultat.

• Utiliser les r`egles de transformation du th´eor`eme 4.3.1 et ´ecrire un syst`eme ferm´e d’´equations fonctionnelles impliquant ΨL[a]N pour n ∈ {0, . . . , N }.

• R´esoudre directement le syst`eme pr´ec´edent ou bien trouver un ensemble d’´equa-tions r´ecursives v´erifi´ees par les coefficients de ΨL[a]N pour n ∈ {0, . . . , N }.