Au sujet de la complexité k-binomiale

(1)

http://lib.uliege.ac.be http://matheo.uliege.be

Au sujet de la complexité k-binomiale

Auteur : Lejeune, Marie Promoteur(s) : Rigo, Michel Faculté : Faculté des Sciences

Diplôme : Master en sciences mathématiques, à finalité spécialisée en informatique Année académique : 2017-2018

URI/URL : http://hdl.handle.net/2268.2/5007

Avertissement à l'attention des usagers :

Tous les documents placés en accès ouvert sur le site le site MatheO sont protégés par le droit d'auteur. Conformément aux principes énoncés par la "Budapest Open Access Initiative"(BOAI, 2002), l'utilisateur du site peut lire, télécharger, copier, transmettre, imprimer, chercher ou faire un lien vers le texte intégral de ces documents, les disséquer pour les indexer, s'en servir de données pour un logiciel, ou s'en servir à toute autre fin légale (ou prévue par la réglementation relative au droit d'auteur). Toute utilisation du document à des fins commerciales est strictement interdite.

Par ailleurs, l'utilisateur s'engage à respecter les droits moraux de l'auteur, principalement le droit à l'intégrité de l'oeuvre et le droit de paternité et ce dans toute utilisation que l'utilisateur entreprend. Ainsi, à titre d'exemple, lorsqu'il reproduira un document par extrait ou dans son intégralité, l'utilisateur citera de manière complète les sources telles que

mentionnées ci-dessus. Toute utilisation non explicitement autorisée ci-avant (telle que par exemple, la modification du document ou son résumé) nécessite l'autorisation préalable et expresse des auteurs ou de leurs ayants droit.

(2)

Faculté des Sciences

Département de Mathématique

Au sujet de la complexité k -binomiale

Mémoire de n d'études présenté en vue de l'obtention du grade de Master en Sciences Mathématiques à nalité informatique Promoteur : Michel Rigo

réalisé par

Marie Lejeune

Année Académique 20172018

(3)

(4)

(5)

(6)

Remerciements

Je tiens tout d'abord à remercier mon promoteur, Michel Rigo, pour m'avoir enca- drée tout au long de ces deux dernières années. J'aimerais tout particulièrement souligner sa disponibilité, notamment pour répondre aux questions qui ont forcément jailli lors de la rédaction d'un travail de ce genre.

Ce mémoire a été pour moi la première véritable occasion de m'insérer dans l'équipe des mathématiques discrètes du département. Il s'agit donc d'une bonne occasion pour remercier ici les divers membres de l'unité de recherche qui m'ont, tout au long de mon parcours académique, donné le goût de cette branche des mathématiques.

Je remercie également l'ensemble de ma famille, et plus particulièrement mes pa- rents, mon frère et Babcia, qui ont toujours été un soutien indéfectible à la bonne réali- sation de mes études et n'ont jamais cessé de croire en moi.

Je désire évidemment remercier Laurent Loosveldt qui a été et est toujours un pilier central dans ma vie. Je lui suis extrêmement reconnaissante de m'avoir soutenue durant ces cinq années, d'avoir cru en moi et de m'avoir réconfortée dans les moments faibles. Sa relecture précise et ses nombreuses remarques ont contribué à une amélioration notable de ce présent travail. Merci également à Brigitte et Jean pour l'accueil qu'ils m'ont toujours réservé ; cela a sans aucun doute été un facteur décisif dans mes études.

Finalement, last but not least, je ne doute pas que mon parcours universitaire aurait été bien moins plaisant s'il n'avait pas été le fruit de rencontres inoubliables. Je tiens donc à remercier notre bande de "Parisiennes" du B37 et en particulier Célia Cisternino, devenue une condisciple de travail au soutien infaillible ainsi qu'une amie au grand coeur.

i

(7)

(8)

Introduction

La combinatoire des mots est une branche des mathématiques discrètes étudiant les mots (nis ou innis), c'est-à-dire les suites à valeurs dans un ensemble ni appelé alphabet, et leurs propriétés. Elle est proche de l'informatique théorique vu ses applications à cette dernière, comme par exemple la recherche de motifs dans un texte ou une séquence d'ADN. L'un des sous-champs les plus étudiés est la complexité combinatoire de mots, comme par exemple la complexité factorielle d'un mot inni x qui compte, pour tout naturel n, le nombre de facteurs distincts de longueur n présents dansx. Cette fonction est couramment notée p_x(n). L'un des théorèmes les plus connus en combinatoire des mots est celui de Morse-Hedlund, établissant l'équivalence entre les mots ayant une complexité factorielle bornée et les mots ultimement périodiques.

Il existe cependant d'autres fonctions de complexité. Au lieu de chercher le nombre de facteurs distincts, on pourrait décider de les regarder à permutation des lettres près, tout comme l'a suggéré Erdös dans les années soixante. Cette relation est appelée la relation d'équivalence abélienne. Par exemple, les mots aba et baa sont abéliennement équivalents. De là, Juhani Karhumäki et al. ont déni l'équivalence k-abélienne de deux mots dans [13] : deux mots u et v sont k-abéliennement équivalents si chaque mot de longueur inférieure ou égale à k apparait le même nombre de fois comme facteur de u et de v.

Partant de cette dénition, Michel Rigo et Pavel Salimov ont déni l'équivalence k-binomiale, qui est similaire à la relation précédente dans le sens où on regarde à présent les sous-mots et non plus les facteurs (qui sont en fait des sous-mots formés de lettres consécutives). On appelle coecient binomial des mots u et x le nombre de fois que le mot x apparait comme sous-mot dans le mot u et cette quantité est notée ^u_x

. Cette notion avait déjà été introduite par Imre Simon et Jacques Sakarovitch dans [16].

Ce travail a pour but d'étudier l'équivalencek-binomiale dénie ci-dessus et la fonction de complexité associée, comptant pour un motx donné, le nombre de classes d'équi- valence partitionnant l'ensemble de ses facteurs d'une longueur donnée. Celle-ci est notée b^(k)x . Les fonctions de complexités k-binomiales se trouvent en quelque sorte à mi-chemin entre les complexités abélienne et factorielle, puisque, pour un mot x donné,

ρ^ab_x (n)≤b^(k)x (n)≤p_x(n) ∀n∈N,

où ρ^ab_x est la complexité abélienne du mot x comptant le nombre de facteurs de x non- abéliennement équivalents et de même longueur.

Ce mémoire se base essentiellement, pour les quatre premiers chapitres, sur les ar- ticles [18] et [23] écrits par Michaël Rao, Michel Rigo et Pavel Salimov. Le cinquième est

iii

(9)

iv

quant à lui basé sur un travail de Dominik Freydenberger et al. (voir [11]) et les preuves manquantes ont été adaptées de l'article [24] rédigé par Wen-Guey Tzeng.

Le premier chapitre de ce mémoire présente les notions essentielles à notre travail, dont notamment l'équivalence k-binomiale et la complexité portant le même nom. On y présente également une borne asymptotique polynomiale sur le nombre de classes d'équi- valence partitionnant l'ensemble des mots d'une longueur donnée. Il s'agit d'une amélio- ration de la borne de Prateek Karandikar et al. présentée dans [12] qui était exponentielle en les données.

Le deuxième chapitre a pour but d'étudier la complexiték-binomiale des mots sturmiens, qui sont les mots innis non périodiques de complexité factorielle minimale. Nous étudions tout d'abord quelques propriétés de ces mots avant d'en présenter un exemple connu : le mot de Fibonacci. Enn, nous montrons que tout mot sturmien a une com- plexité k-binomiale égale à sa complexité factorielle (pour tout k ≥2). Nous remarquons également que tout mot périodique doit avoir une complexité k-binomiale bornée.

Le chapitre suivant prouve que la condition énoncée ci-dessus n'est pas susante.

Il présente une famille de mots qui sont les mots obtenus par un morphisme Parikh- constant, c'est-à-dire pour lequel les images de chaque lettre sont identiques à permutation près. Nous montrons que les mots obtenus via un tel morphisme ont une complexité k- binomiale bornée par une constante. Ceci contraste avec le cadre classique dans lequel les mots sturmiens ont la complexité la plus faible parmi les mots non périodiques. Nous particularisons ensuite ce résultat au mot de Thue-Morse en décrivant brièvement les idées qui permettraient de calculer explicitement la complexité de ce mot particulier. Ce calcul est par ailleurs le sujet d'un travail conjoint avec Julien Leroy et Michel Rigo dans le cadre du cours Research Problems in Discrete Mathematics.

Lorsqu'on étudie une relation d'équivalence en combinatoire des mots, certaines questions se posent naturellement. Parmi elles, peut-on trouver un mot inni ne contenant aucun carré, c'est-à-dire aucun mot de la forme uv où u et v sont équivalents ? Si oui, de combien de lettres diérentes a-t-on besoin au minimum ? On peut également se poser la question pour les cubes de mots, ou d'autres motifs divers et variés. Dans le cas de la relation d'égalité, le mot de Thue-Morse a la propriété d'être sans cube. Il existe également des mots innis construits sur un alphabet ternaire et ne contenant pas de carré. La taille des alphabets est minimale. La question a également été résolue par Frederik Dekking et Veikko Keränen dans le cadre de la relation k-abélienne. Il est possible d'éviter les carrés sur un alphabet à 4lettres et les cubes sur un alphabet à 3lettres. Les résultats peuvent être trouvés dans [7] et [14]. Dans le quatrième chapitre de ce mémoire, nous présentons une réponse aux deux premières questions concernant les carrés et les cubes 2-binomiaux.

Enn, le dernier chapitre présente un aspect plus calculatoire puisqu'on se demande s'il est possible de trouver un algorithme testant quand deux mots sont équivalents. A priori, tester si deux mots construits sur un alphabetA sontk-binomialement équivalents nécessite le calcul de (#A)^k coecients binomiaux. On pourrait donc se demander s'il existe des algorithmes plus ecaces. Nous présentons dans ce travail un algorithme dé- terministe et polynomial faisant intervenir des automates à multiplicités. Nous associons

(10)

v un automate à chacun des deux mots uetv, tels que le nombre de chemins d'acceptation labellisés par le mot x (de longueur inférieure ou égale à k) dans l'automate associé à u (resp. v) correspond au coecient binomial ^u_x

(resp. ^v_x

). Il reste ensuite à vérier si les deux automates possèdent les mêmes chemins d'acceptation ou non. Cela se fait via un algorithme adapté de [24] qui fait intervenir des notions d'algèbre linéaire.

(11)

(12)

Table des matières

Remerciements i

Introduction iii

1 Dénitions de base et équivalence k-binomiale 1

1.1 Alphabet et mots . . . 1

1.2 Coecients binomiaux de mots . . . 3

1.3 Relation d'équivalence k-binomiale . . . 5

1.4 Premières propriétés . . . 7

1.5 Nombre de classes d'équivalence k-binomiale . . . 9

1.6 Complexiték-binomiale d'un mot inni . . . 16

2 Complexité k-binomiale des mots sturmiens 19 2.1 Dénition des mots sturmiens et premières propriétés . . . 19

2.1.1 Dénition . . . 19

2.1.2 Dénitions équivalentes . . . 20

2.1.3 Facteurs récurrents et mots sturmiens . . . 25

2.2 Exemple de mot sturmien : le mot de Fibonacci . . . 25

2.3 Complexiték-binomiale des mots sturmiens . . . 30

3 Complexité k-binomiale des mots points xes de morphismes Parikh- constants. 39 3.1 Dénitions de base . . . 39

3.1.1 Distance entre mots et convergence . . . 39

3.1.2 Morphismes . . . 41

3.1.3 Morphismes Parikh-constants . . . 42

3.2 Complexité bornée . . . 43

3.3 Cas particulier du mot de Thue-Morse . . . 46

3.3.1 Complexités 1 et2-binomiales . . . 46

3.3.2 Complexités k-binomiales pour k ≥3 . . . 52

4 Eviter les carrés et cubes 2-binomiaux sur des alphabets minimaux 55 4.1 Dénitions . . . 56

4.2 Eviter les carrés 2-binomiaux sur un alphabet ternaire . . . 56

4.2.1 Résultats préliminaires . . . 57

4.2.2 Lemmes pratiques . . . 59 vii

(13)

viii Table des matières

4.2.3 Démonstration de l'absence de carré 2-binomial dans x . . . 65

4.3 Eviter les cubes2-binomiaux sur un alphabet binaire . . . 66

4.3.1 Lemmes pratiques . . . 66

4.3.2 Théorème principal . . . 71

5 Calcul en temps polynomial de l'équivalence k-binomiale 75 5.1 Dénitions et présentation du problème . . . 75

5.2 Construction de l'automate associé à un mot . . . 78

5.3 Algorithme décidant si deux automates sont équivalents . . . 83

5.4 Exactitude de l'algorithme . . . 87

5.5 Complexité temporelle . . . 92

5.5.1 Test de l'équivalence de deux automates . . . 92

5.5.2 Test de l'équivalence k-binomiale . . . 93

A Dénition géométrique des mots sturmiens 95 A.1 Mots sturmiens et mots mécaniques . . . 95

A.2 Justication du Théorème 2.3.4 . . . 96

Bibliographie 99

(14)

(15)

(16)

Chapitre 1

Dénitions de base et équivalence k -binomiale

Le but de ce premier chapitre est tout d'abord d'introduire et de présenter les notions usuelles relatives à la combinatoire des mots qui seront nécessaires dans notre travail.

Bien qu'elles soient tirées de plusieurs ouvrages diérents, le lecteur pourra trouver toutes les dénitions présentées de manière équivalente dans [4, Ch. 1]. Ensuite, ce chapitre a pour but d'introduire les coecients binomiaux de mots, l'équivalence et la complexité k-binomiales qui sont des concepts discutés dans [23]. Quelques premières propriétés sont démontrées dans la suite de ce chapitre. Une borne sur le nombre de classes d'équivalence est également établie.

1.1 Alphabet et mots

Dénition 1.1.1. Un alphabet (ni) est un ensemble ni d'éléments, appelés lettres. On dénote souvent un alphabet par une lettre majuscule. Nous supposons jusqu'à la n de ce chapitre, sauf mention explicite du contraire, que A dénote un alphabet ni quelconque.

Un mot ni sur l'alphabet A est une suite nie de lettres de A. Le mot vide est le mot composé de zéro lettre, il est dénoté par ε. On note A^∗ l'ensemble des mots nis sur l'alphabet A et A⁺ = A^∗\ {ε}. Par convention, aⁿ représente le mot composé de n occurrences de la lettre a∈A.

Similairement, un mot inni sur l'alphabet A est une suite innie de lettres de A. L'ensemble des mots innis sur l'alphabet A est noté A^N, tandis que l'ensemble de tous les mots de A (nis ou innis) est noté A^∞.

On peut également dénir une opération binaire sur A^∗ de la façon suivante :

·:A^∗×A^∗ →A^∗ : (u, v)7→u·v,

où, si uetv sont respectivement construits avec les suites nies de lettres(u₀, . . . , u_m)et (v₀, . . . , v_n), le mot u·v (que l'on peut également noter uv) est la suite nie des lettres (u₀, . . . , u_m, v₀, . . . , v_n). Cette opération binaire est appelée la concaténation des mots u et v.

Si z est un mot ni, nous noterons z^ω le mot de A^N composé d'une innité de concaténations du mot z.

1

(17)

2 Chapitre 1. Dénitions de base et équivalence k-binomiale Remarque 1.1.2. Remarquons que l'ensemble A^∗ muni de l'opération de concaténation forme un monoïde dont le neutre est ε.

Dénition 1.1.3. La longueur du mot u ∈ A^∗ est le nombre de lettres le composant, ce que l'on note |u|. La longueur du mot vide est 0. Pour tout naturel n, l'ensemble Aⁿ est l'ensemble de tous les mots de longueur n sur l'alphabet A. De plus, A^≤n dénote l'ensemble de tous les mots de A^∗ de longueur inférieure ou égale à n.

Remarque 1.1.4. L'application

| · |:A^∗ →N:u7→ |u|

est un homomorphisme de monoïdes¹. Il s'agit d'un isomorphisme si et seulement si l'alphabet A ne comporte qu'une lettre.

Dans ce travail, nous utiliserons des morphismes de mots, que nous appellerons plus simplement morphismes.

Dénition 1.1.5. Un morphisme est une application ϕ:A^∗ →B^∗ telle que

ϕ(uv) = ϕ(u)ϕ(v)

pour tous u, v ∈A^∗. Si A=B, on parle parfois d'endomorphisme.

Remarque 1.1.6. Un morphisme est entièrement déterminé par les images de ses lettres.

En eet, d'une part nous avons toujours ϕ(ε) = ε et d'autre part, pour tout mot u=u₀· · ·u_m ∈A⁺,

ϕ(u) =ϕ(u₀)· · ·ϕ(u_m).

Dénition 1.1.7. Soitu=u₀· · ·u_m ∈A^∗ un mot sur l'alphabetA. Un sous-mot (ou une sous-séquence) du mot uest une sous-suite de la suite(u0, . . . , um). On parle en particulier de facteur du mot usi la sous-suite en question est composée d'éléments consécutifs, c'est- à-dire si elle est de la forme (u_k, u_k+1, . . . , u_k+`), où k ∈ {0, . . . , m} et`∈ {0, . . . , m−k}. Si k= 0, on a aaire à un préxe tandis qu'il s'agit d'un suxe si k+`=m.

Par convention, ε est à la fois préxe et suxe de tout mot.

De la même façon, on peut dénir les sous-mots, facteurs et préxes d'un mot inni sur l'alphabet A.

Notation 1.1.8. On notera |u|_x le nombre de fois que le mot x apparait comme facteur dans le mot u. En particulier, si a est une lettre, la notation |u|a compte le nombre d'occurrences de la lettre a dans le mot u.

1. En eet, nous avons|u.v|=|u|+|v|pour tous motsu, v∈A^∗.

(18)

1.2. Coecients binomiaux de mots 3 Dénition 1.1.9. Soient v ∈A^∗ eta∈A. Alors, si le motupeut s'écrire va, la notation ua⁻¹ désigne simplement le mot u dont on retire la dernière lettre² a. Ainsi, ua⁻¹ = v. De la même façon, si w = av, alors a⁻¹w = v. Cette notation s'étend facilement au cas oùane représente plus une lettre mais un mot (et il faut alors, pour que la notationuy⁻¹ (resp. y⁻¹u) ait un sens, que y soit un suxe (resp. préxe) du mot u).

Exemple 1.1.10. Soit A={0,1,2} un alphabet. Considérons les mots suivants : u= 01212210 et v = 0112212010201.

Dès lors, |u|₁₂ = 2 =|v|₁₂, |u|₀₁ = 1 mais |v|₀₁= 3.

Les préxes de u sont ε,0,01,012,0121,01212,012122,0121221,01212210.

De plus, 0⁻¹u = 1212210, v1⁻¹ = 011221201020, (0112)⁻¹v = 212010201 mais (012)⁻¹v n'a pas de sens !

1.2 Coecients binomiaux de mots

Comme pour les nombres naturels, il est possible de dénir le coecient binomial de deux mots, comptant le nombre de façons que l'on peut retrouver un mot donné dans l'autre mot donné. Cette notion a été premièrement introduite par Imre Simon et Jacques Sakarovitch dans [16, Chap. 6].

Dénition 1.2.1. Soient u etv deux mots de A^∗. Le coecient binomial de u et v, noté

u v

, est le naturel représentant le nombre de fois que v apparait comme sous-mot de u. Autrement dit, c'est le nombre de fois que la suite de lettres composant v peut être vue comme sous-suite de la suite de lettres composant u.

On pose ^u_ε

= 1.

Exemple 1.2.2. Soient A={a, b} etu=aababaaba. Nous avons alors u

a

= 6, u

b

= 3, u

ab

= 10, u

abb

= 7.

Nous utiliserons dans la suite de ce travail le symbole de Kronecker appliqué à deux lettres. Nous en rappelons la dénition.

Dénition 1.2.3. Soient a, b∈A deux lettres. Le symbole de Kronecker des lettres a et b est la notation suivante :

δ_a,b=

1 sia=b 0 sinon.

La proposition suivante montre le lien entre les coecients binomiaux de mots et les coecients binomiaux de nombres naturels.

2. Cette notation n'a de sens que siaest eectivement la dernière lettre du motu.

(19)

4 Chapitre 1. Dénitions de base et équivalence k-binomiale Proposition 1.2.4. Soient a, b deux lettres de A et u, v deux mots de A^∗.

1. Nous avons

u a

=|u|_a; 2. Pour tous naturels p, q, nous avons

a^p a^q

= p

q

,

où le second membre est le coecient binomial classique de deux naturels³; 3. Si |u|<|v|, alors ^u_v

= 0; 4. Nous avons

ua vb

= u

vb

+δ_a,b u

v

et

au bv

= u

bv

+δ_a,b u

v

; 5. Pour tout ` ∈N,

u a^`

= |u|_a

`

,

où le second membre est encore une fois le coecient binomial classique.

Démonstration. Les trois premiers points découlent directement des dénitions énoncées jusqu'à présent. Justions la première égalité du quatrième point, la seconde se démon- trant de façon analogue.

Tout d'abord, si a 6= b, u et ua contiennent exactement le même nombre de fois le sous-mot vb. Si maintenant a = b, nous pouvons séparer notre raisonnement en deux étapes :

Nous cherchons une sous-séquence va se terminant en le dernier a du mot ua. Il sut alors de chercher toutes les fois où le mot v apparait comme sous-mot du mot u. Il y a, par dénition, ^u_v

telles occurrences.

Nous cherchons maintenant une sous-séquencevb ne prenant pas en compte le dernier a de ua. Dans ce cas, on compte exactement le nombre de sous-séquences vb apparaissant dans u; celles-ci sont au nombre de _vb^u

.

Il nous reste à prouver le cinquième point. Il sut en fait de se rendre compte qu'il y a autant de sous-mots a^` dans u que de façons de choisir ` fois la lettre a parmi toutes les occurrences de a dans u, ce qui est exactement ^|u|_`^a

.

Remarque 1.2.5. Le quatrième point de la proposition précédente est l'équivalent, pour les mots, de la propriété

n m

=

n−1 m−1

+

n−1 m

, ∀m, n∈N0

3. Où nous avons posé que ^p_q

= 0sip < q.

(20)

1.3. Relation d'équivalence k-binomiale 5 permettant de construire le triangle de Pascal des nombres naturels. Remarquons que si l'alphabet A n'est composé que d'une seule lettre, les points 2 et 4 de la proposition précédente permettent de reconstruire le triangle de Pascal classique. Si |A| > 1, il est possible, vu le point 4, de construire un triangle de Pascal généralisé. Le lecteur intéressé peut consulter [15].

1.3 Relation d'équivalence k -binomiale

Le but de cette section est d'introduire une relation d'équivalence dénie sur les mots composés de lettres provenant d'un même alphabet. Celle-ci a été introduite par Michel Rigo et Pavel Salimov dans [23]. Cependant, avant d'aborder cette notion, nous allons introduire la relation d'équivalence abélienne, et plus particulièrementk-abélienne, où k est un naturel non nul. Cette dernière est plus étudiée et présente des similitudes avec la relationk-binomiale dans sa dénition. Nous aurons l'occasion, au l de ce travail, de comparer les deux relations.

Considérons dès à présent, et jusqu'à la n du chapitre, un naturel non nul k. Dénition 1.3.1. Deux motsuetvsur l'alphabetAsont ditsk-abéliennement équivalents si, pour tout mot x de longueur inférieure ou égale à k,

|u|_x =|v|_x. On notera alors u∼_ab,k v.

Remarque 1.3.2. Il est évident, au vu de la dénition, que u∼_ab,k+1 v ⇒ u∼_ab,k v. Introduisons maintenant la notion d'équivalence k-binomiale.

Dénition 1.3.3. Deux mots u et v sur l'alphabet A sont dits k-binomialement équiva- lents si, pour tout mot x de longueur inférieure ou égale à k,

u x

= v

x

.

On notera alors u∼_bin,k v ou, de manière plus concise,u∼_k v.

Remarque 1.3.4. Imre Simon avait auparavant introduit la congruence qui porte son nom et qui suit la même idée : deux mots x etysont k-équivalents au sens de Simon s'ils ont exactement les mêmes sous-mots de longueur inférieure ou égale à k. La relation ∼_k est donc un ranement de la congruence de Simon, car dans cette première on y compte le nombre d'apparitions de chacun des sous-mots de longueur inférieure ou égale à k tandis que, dans la seconde, on ne regarde que leur présence éventuelle.

Remarque 1.3.5. Nous avons aussi u ∼_k+1 v ⇒u ∼_k v. Ainsi, si u ∼_k v, alors u ∼_` v pour tout `∈N0 tel que `≤k.

De plus, vu le premier point de la Proposition 1.2.4, u∼_ab,1 v ⇔u∼₁ v.

(21)

6 Chapitre 1. Dénitions de base et équivalence k-binomiale Exemple 1.3.6. Considérons l'alphabet A = {a, b} et les mots u =bbaabb, v =babbab. Ils sont 2-binomialement équivalents car

u a

= 2 = v

a

, u

b

= 4 = v

b

, u

aa

= 1 = v

aa

, u

bb

= 6 = v

bb

, u

ab

= 4 = v

ab

, u

ba

= 4 = v

ba

.

Cependant, ils ne sont pas 3-binomialement équivalents car u

bab

= 8 et v

bab

= 6.

De plus, ces mots sont 1-abéliennement équivalents (vu qu'en particulieru∼₁ v) mais ne sont pas 2-abéliennement équivalents car |u|_ba = 1 et|v|_ba = 2.

Considérons à présent les mots u⁰ = abaab et v⁰ = aabab sur le même alphabet A. Ils sont 2-abéliennement équivalents car

|u⁰|_a= 3 =|v⁰|_a, |u⁰|_b = 2 =|v⁰|_b, |u⁰|_aa = 1 =|v⁰|_aa

|u⁰|bb= 0 =|v⁰|bb, |u⁰|ab = 2 =|v⁰|ab, |u⁰|ba = 1 =|v⁰|ba

mais ils ne sont pas 2-binomialement équivalents puisque u⁰

ab

= 4 et v⁰

ab

= 5.

Au travers de ces deux exemples, nous illustrons le fait qu'il n'y a pas de dépendance évidente entre les relationsk-abéliennes etk-binomiales. En général, si u, v ∈A^∗ etk ≥2,

u∼_kv 6⇒u∼_ab,k v et u∼_ab,k v 6⇒u∼_k v.

Remarque 1.3.7. Comme son nom l'indique, la relation d'équivalence k-binomiale est évidemment une relation d'équivalence ; cela découle de la dénition et du fait que la relation d'égalité entre deux naturels est une relation d'équivalence.

Nous décidons de noter, pour tout mot u ∈A^∗, B^(k)(u) la classe d'équivalence des mots k-binomialement équivalents à u.

Remarque 1.3.8. On rencontre parfois dans la littérature (voir [22] par exemple) la notion de k-spectre d'un mot w qui est le polynôme formel

Specw,k = X

u∈A^≤k

w u

u.

Deux mots sont k-binomialement équivalents si et seulement s'ils ont le mêmek-spectre.

(22)

1.4. Premières propriétés 7

1.4 Premières propriétés

Nous allons énoncer et démontrer quelques propriétés assez utiles lors de démons- trations moins directes. Commençons par une formule nous permettant de décomposer le coecient binomial de deux mots en une expression plus simple à calculer, puisqu'elle fait intervenir des coecients binomiaux de mots plus courts.

Lemme 1.4.1. Soient u, v etx=x0· · ·xm des mots sur l'alphabet A, où x0, . . . , xm sont des lettres. Nous avons

uv x

=

m+1

X

j=0

u x₀· · ·xj−1

v x_j· · ·x_m

, où nous posons que x₀· · ·x−1 =x_m+1· · ·x_m =ε.

Démonstration. Pour voir apparaitre le mot x comme sous-suite du mot uv, il sut de voir apparaitre la première partie de x (composée de ses j premières lettres, où j ∈ {0, . . . , m+1}) dansuet la seconde partie du motxdansv. Aj xé, il y a exactement

u x0···xj−1

_v

xj···xm

possibilités de trouverxcomme sous-suite de uv de cette façon. Comme j varie entre 0 etm+ 1, nous obtenons la formule énoncée.

La proposition suivante permet de montrer que ∼_k est une relation de congruence sur A^∗. Nous avions déjà remarqué qu'il s'agissait d'une relation d'équivalence dans la Remarque 1.3.7.

Proposition 1.4.2. Soient u, v, u⁰, v⁰ ∈ A^∗ et k ∈ N0. Si u ∼_k v et u⁰ ∼_k v⁰, alors uu⁰ ∼_k vv⁰.

Démonstration. Soit x=x0· · ·xm un mot de A^≤k. Nous avons uu⁰

x

=

m+1

X

j=0

u x₀· · ·xj−1

u⁰ x_j· · ·x_m

vu le Lemme 1.4.1

=

m+1

X

j=0

v x0· · ·xj−1

v⁰ xj· · ·xm

par hypothèse

= vv⁰

x

.

Il existe une relation liant tous les coecients binomiaux entre un mot donné u et des mots v semblables, c'est-à-dire pour lesquels seule une lettre a changé de place.

Proposition 1.4.3. Soient x=x₀· · ·x_m un mot et c∈A. Nous avons

m+1

X

j=0

u

x0· · ·xj−1cxj· · ·xm

+

x c

u x

= u

x u

c

où nous posons que x₀· · ·x−1 =x_m+1· · ·x_m =ε.

(23)

8 Chapitre 1. Dénitions de base et équivalence k-binomiale Démonstration. Commençons par traiter le cas où la lettre cn'apparait pas dansx. Dans ce cas, ^x_c

= 0 et nous devons prouver que

m+1

X

j=0

u

x₀· · ·xj−1cx_j· · ·x_m

= u

x u

c

.

Pour sélectionner un mot formé des lettres de x dans le bon ordre parmi lesquelles s'est intercalé cà une position arbitraire, il sut de choisir dans uune occurrence dex et une occurrence de c. Nous avons ^u_x _u

c

tels choix. C'est pourquoi le nombre d'occurrences de tous les mots formés des lettres dexdans le bon ordre et de cintercalé à n'importe quelle position est ^u_x _u

c

.

Pour le cas général, il sut de remarquer que sicest une lettre dex, sélectionner dans uune occurrence de xet une occurrence decmène parfois au cas oùcest l'une des lettres composant l'occurrence de x choisie. Ainsi, en calculant le produit ^u_x _u

c

, on compte parfois la lettre c alors qu'elle fait partie d'une occurrence de x choisie simultanément.

C'est pourquoi nous devons ajouter dans le membre de gauche le terme dû à ce cas particulier, à savoir le nombre de fois que la lettre c apparait dans x, et ce pour chaque occurrence de x dans u.

Nous énonçons et démontrons ici une petite propriété nous étant nécessaire quelques chapitres plus loin, mais pouvant s'avérer utile pour se familiariser avec les notions évo- quées jusqu'à présent.

Proposition 1.4.4. Soient x, y ∈ {0,1}^∗ des mots tels que x0 ∼₂ y0. Dans ce cas, 0x∼₂ 0y. De même, si 1x∼₂ 1y, alors x1∼₂ y1.

Démonstration. Démontrons la première partie de la preuve, la seconde suivant exactement le même raisonnement. Nous avons évidemment

0x 0

=|0x|0 = 1 +|x|0 =|x|0+ 1 =|x0|0 =|y0|0 =|y|0+ 1 = 1 +|y|0 =|0y|0 = 0y

0

De même,

0x 1

=|0x|1 =|x0|1 =|y0|1 =|0y|1 = 0y

1

.

De plus, utilisant le dernier point de la Proposition 1.2.4, nous avons 0x

00

=

|0x|₀ 2

=

|x0|₀ 2

= x0

00

= y0

00

=

|y0|₀ 2

=

|0y|₀ 2

= 0y

00

et

0x 11

= x0

11

= y0

11

= 0y

11

.

(24)

1.5. Nombre de classes d'équivalence k-binomiale 9 Enn, il nous reste à établir deux égalités. Remarquons que puisquex0∼₂ y0, nous avons

|x|₁ =|y|₁. Alors, vu le quatrième point de la Proposition 1.2.4, 0x

01

= x

01

+ x

1

= x0

01

+|x|₁ = y0

01

+|y|₁ = 0y

01

et de même,

0x 10

= x0

10

− |x|1 = y0

10

− |y|1 = 0y

10

.

1.5 Nombre de classes d'équivalence k -binomiale

Le but de cette section est d'établir une borne supérieure sur le nombre de classes d'équivalence k-binomiale, pour unk xé. Cette borne va dépendre de la taille de l'alpha- betAutilisé. Les bornes supérieures trouvées permettront de caractériser le comportement de la fonction de complexité k-binomiale qui sera dénie dans la section suivante.

Lemme 1.5.1. Soient u un mot sur l'alphabet A, a ∈A et ` ∈ N. L'égalité suivante est vériée :

X

v∈A^`

u v

= |u|

`

.

Démonstration. Si on additionne les nombres d'occurrences dans u de tous les mots de A^`, on obtient le nombre total de sous-mots à ` lettres que l'on peut voir dans u et ce nombre est égal au nombre de possibilités de choisir ` lettres parmi les |u|lettres de u. Proposition 1.5.2. Soient A={a, b}un alphabet binaire et n∈N. Le nombre de classes d'équivalence de l'ensemble Aⁿ pour la relation d'équivalence ∼2 vaut

n

X

j=0

((n−j)j+ 1) = n³+ 5n+ 6

6 .

Démonstration. Remarquons que l'ensemble Aⁿ se divise en n+ 1 classes d'équivalence pour la relation ∼_ab,1 : la classe des mots comportant respectivement 0 ou 1 ou . . .ou n occurrences de la lettre a. Chacune de ces classes va être partitionnée en diérentes sous- classes pour la relation ∼₂. Vu que si deux mots ne sont pas abéliennement équivalents, ils ne sont pas 2-binomialement équivalents, deux sous-classes provenant de deux classes [·]∼_ab,1 diérentes seront bien disjointes.

Soient j ∈ {0, . . . , n} et u∈Aⁿ tels que |u|_a =j. Notons [u]_∼_ab,1 la classe d'équiva- lence deupour la relation∼_ab,1et montrons que cette classe possède exactement(n−j)j+1 classes d'équivalence pour la relation ∼₂.

Soit w ∈ [u]_∼_ab,1. Dès lors, _ab^w

∈ {0, . . . , j(n−j)}, les cas extrêmes correspondant aux mots w=b^n−ja^j etw=a^jb^n−j.

(25)

10 Chapitre 1. Dénitions de base et équivalence k-binomiale Montrons d'abord que pour toute valeur ` ∈ {0, . . . , j(n−j)}, on peut trouver un mot w∈[u]∼_ab,1 tel que _ab^w

=`.

Si j = 0, [u]_∼_ab,1 = {bⁿ} et ce mot possède bien 0 occurrences de ab. Si j = n, [u]∼_ab,1 = {aⁿ} et nous avons à nouveau 0 occurrences de ab. Considérons à présent j ∈ {1, . . . , n−1}.

Le cas ` = j(n − j) est facile à traiter puisque le mot w = a^jb^n−j convient. Sinon,

` < j(n−j)et en utilisant l'algorithme de division euclidienne, on peut écrire` =qj+d, où0≤d < j et où 0≤q < n−j. Dans ce cas, le motw=b^{n−j−q−1}a^dba^j−db^q convient car

w ab

=d(q+ 1) + (j−d)q =d+jq =`.

Ainsi, l'ensemble [u]∼_ab,1 comporte au moins j(n−j) + 1 classes d'équivalence pour ∼₂. Montrons à présent que cet ensemble n'en contient pas plus : xons

` ∈ {0, . . . , j(n − j)} et prenons deux mots quelconques w, w⁰ ∈ [u]∼_ab,1 tels que

w ab

=`= ^w_ab⁰

. Alors w

a

=j = w⁰

a

et w

b

=n−j = w⁰

b

car w∼_ab,1 u∼_ab,1 w⁰, w

aa

= j

2

= w⁰

aa

vu le dernier point de la Proposition 1.2.4, w

bb

=

n−j 2

= w⁰

bb

par cette même justication, w

ab

=`= w⁰

ab

par hypothèse.

De plus, utilisant le Lemme 1.5.1 et les égalités ci-dessus, nous avons w

ba

= n

2

− w

aa

− w

bb

− w

ab

= n

2

− w⁰

aa

− w⁰

bb

− w⁰

ab

= w⁰

ba

. Ainsi, w ∼₂ w⁰, ce qui prouve qu'il y a au plus j(n−j) + 1 classes d'équivalences dans [u]∼_ab,1.

Au total, il y en a donc exactement ce nombre et c'est pourquoi nous obtenons

#(Aⁿ/∼2) =

n

X

j=0

((n−j)j+ 1)

=nn(n+ 1)

2 − n(n+ 1)(2n+ 1)

6 + (n+ 1)

= n+ 1

6 3n²−2n²−n+ 6

= n³+ 5n+ 6

6 .

(26)

1.5. Nombre de classes d'équivalence k-binomiale 11 Nous souhaitons maintenant calculer le nombre de classes d'équivalence pour la relation ∼_k partitionnant Aⁿ, où k est un naturel quelconque supérieur à 2. Avant d'y arriver, nous avons besoin de formules techniques démontrées dans les deux lemmes qui suivent.

Lemme 1.5.3. Pour tous naturels n≥m ≥2, nous avons (n+ 1)^m−1 ≤n^m.

Démonstration. Procédons par double récurrence ; d'abord sur m et ensuite sur n. Pour le cas de base de la récurrence sur m, considérons que m = 2. Dès lors,n+ 1≤n² pour tout n ≥2 car le polynôme n²−n−1 a pour racines ¹⁺₂^√⁵ et ¹⁻₂^√⁵. Passons maintenant à l'induction sur m : prenons m ≥2, supposons que la formule

(n+ 1)^k−1 ≤n^k ∀n ≥k (1.1)

soit vériée pour tout 2≤k ≤m et montrons que

(n+ 1)^m ≤n^m+1 ∀n ≥m+ 1, en procédant par récurrence sur n.

Pour le cas de base, montrons que(m+ 2)^m ≤(m+ 1)^m+1. Nous avons

(m+ 2)^m = 1 +

m−1

X

`=1

m

`

(m+ 1)^`+ (m+ 1)^m

par la formule du binôme de Newton

≤m+

m−1

X

`=1

m

`

m^`+1+ (m+ 1)^m

en appliquant m−1 fois l'hypothèse de récurrence sur m, énoncée par la formule (1.1). Pour chaque ` ∈ {1, . . . , m−1}, nous appliquons cette inégalité, et cela est licite car les conditions `+ 1 ∈ {2, . . . , m} etm ≥`+ 1 sont respectées. Ainsi, (m+ 2)^m ≤

m

X

`=0

m

`

m^`+1+ (m+ 1)^m

en ajoutant le dernier terme de la somme

≤m(m+ 1)^m+ (m+ 1)^m

≤(m+ 1)^m+1.

Passons à présent à l'induction sur n et supposons que

(n+ 1)^m ≤n^m+1, (1.2)

où n≥m+ 1.

(27)

12 Chapitre 1. Dénitions de base et équivalence k-binomiale Montrons que cette formule reste vraie pour n+ 1. Nous avons

(n+ 2)^m = 1 +

m−1

X

`=1

m

`

(n+ 1)^`+ (n+ 1)^m par la formule du binôme de Newton

≤n+

m−1

X

`=1

m

`

n^`+1+n^m+1

où nous avons appliqué m−1 fois l'hypothèse de récurrence sur m, en utilisant la formule (1.1) qui est licite car les hypothèses `+ 1 ∈ {2, . . . , m} et n ≥ `+ 1 sont vériées. Nous majorons également (n+ 1)^m par n^m+1 et cela est dû à l'hypothèse de récurrence sur n qui nous permet d'appliquer l'inégalité (1.2). Finalement,

(n+ 2)^m ≤

m

X

`=0

m

`

n^`+1 ≤n(n+ 1)^m ≤(n+ 1)^m+1.

Lemme 1.5.4. Pour tous naturels k, m≥2, nous avons

k

X

`=1

`m^` = m

(m−1)²(1 +m^k(km−k−1)).

Démonstration. Soit m≥2et procédons par récurrence sur k.

Supposons pour le cas de base quek = 2. Dans ce cas, le membre de gauche devient m+ 2m² tandis que le membre de droite vaut

m

(m−1)²(1 +m²·(2m−2−1)) = m

(m−1)²(2m³−3m²+ 1)

= m

(m−1)²(1 + 2m)(m−1)²

=m+ 2m².

Supposons à présent que la thèse est vraie pour k≥2 et montrons-la pour k+ 1.

k+1

X

`=1

`m^` = (k+ 1)m^k+1+ m

(m−1)²(1 +m^k(km−k−1))

par hypothèse de récurrence sur k

= m

(m−1)² (k+ 1)m^k(m−1)²+ 1 +m^k(km−k−1)

= m

(m−1)²(1 +m^k((k+ 1)(m−1)²+km−k−1))

= m

(m−1)²(1 +m^k+1(km−2k+m−2 +k))

= m

(m−1)²(1 +m^k+1((k+ 1)m−(k+ 1)−1)) qui est le résultat attendu.

(28)

1.5. Nombre de classes d'équivalence k-binomiale 13 Introduisons la notation suivante.

Notation 1.5.5. Soient A un alphabet à m lettres, k ≥2et `≤ k. Notons (v₁, . . . , v_m^`) les mots de A^` que nous avons ordonné (par exemple suivant l'ordre lexicographique).

Alors si u∈A^∗,Ψ_`(u)désigne le vecteur u

v1

, . . . ,

u v_m^`

des coecients binomiaux de u avec tous les mots de longueur `. Remarque 1.5.6. Au vu de la notation précédente,

u∼_k v ⇔ Ψ_`(u) = Ψ_`(v) ∀`≤k.

Nous allons maintenant établir un théorème similaire à la Proposition 1.5.2 mais concernant l'équivalence k-binomiale, où k est un naturel quelconque supérieur ou égal à2. Une diérence par rapport à la proposition précédente est que nous donnions le nombre exact de classes d'équivalence, tandis qu'ici, nous allons fournir une borne supérieure. La preuve du théorème suivant a été faite dans [23] pour un alphabet à deux lettres. Nous l'avons généralisée dans ce mémoire à un alphabet quelconque d'au moins deux lettres.

Les deux lemmes que nous venons de démontrer vont être utiles dans la démonstration.

Théorème 1.5.7. Soient A un alphabet à m ≥ 2 lettres et k un naturel supérieur ou égal à 2. Une borne supérieure asymptotique pour le nombre de classes d'équivalence de l'ensemble Aⁿ (pour la relation ∼k) est donnée par

n

m

(m−1)2(1+m^k.(km−k−1))

. Celle-ci est valable lorsque n ≥m.

Démonstration. Soitu∈Aⁿ un mot de longueurn. Pour décrire à quelle classe appartient le mot u, il faut déterminer ^u_x

pour tout mot x de longueur inférieure ou égale à k. Compter le nombre de classes d'équivalence parmi les mots de longueurn revient à déterminer combien de valeurs diérentes chacun des vecteurs Ψ1(u), . . . ,Ψk(u) pourrait prendre. Soit`∈ {1, . . . , k}et étudionsΨ_`(u). Il s'agit d'un vecteur composé dem^`entiers naturels dont la somme vaut ⁿ_`

, puisque le mot u contient ⁿ_`

sous-mots.

Utilisons un argument de "points et barres"⁴ pour trouver cette quantité : consi- dérons ⁿ_`

points (alignés horizontalement), chacun d'entre eux représentant une unité, que nous souhaitons partitionner en m^` sous-ensembles (éventuellement vides) qui repré- sentent, eux, les valeurs des composantes du vecteur Ψ_`(u).

Pour créer ces ensembles, nous allons placer m^`+ 1 barres entre ces points an de construire cette partition. Il doit y avoir une barre à gauche du premier point et une barre à droite du dernier point. Les m^`−1barres restantes peuvent être placées à ⁿ_`

+ 1 endroits possibles (n'importe où entre deux points, ou à une des extrémités).

4. Il s'agit d'une astuce souvent utilisée en combinatoire des mots, par exemple dans [5].

(29)

14 Chapitre 1. Dénitions de base et équivalence k-binomiale Considérons le cas particulier où l'alphabet A comporte 2 lettres (m = 2), où le mot u est de longueur 6 (n = 6) et où nous regardons tous ses sous-mots de longueur 4 (` = 4). Dans ce cas, le vecteur Ψ₄(u) possède 16 composantes dont la somme vaut 15. Pour trouver toutes les valeurs possibles de ce vecteur, nous considérons 15 points que nous devons séparer en 16ensembles au moyen de17barres. Nous avons représenté l'une des séparations possibles :

| •• ||| • || • • • || • • •• ||| • | • | • | •• |||. Celle-ci correspond au vecteur

Ψ₄(u) = ( 2 0 0 1 0 3 0 4 0 0 1 1 1 2 0 0 ) dont la somme des éléments vaut bien 15.

En utilisant cet argument, certaines congurations peuvent être répétées mais nous savons qu'il y a au maximum ⁿ_`

+ 1m^`−1

valeurs possibles pour Ψ_`(u). Cela nous indique, considérant tous les naturels `≤k, que le nombre de classes d'équivalences deAⁿ pour la relation ∼_k est inférieur ou égal au produit

k

Y

`=1

n

`

+ 1 m^`−1

.

Or, nous savons d'une part que, si ` >1 alors n

`

= 1

`!(n−`+ 1)· · ·n < n^`

`! < n^` et ainsi ( ⁿ_`

+ 1)^m^`⁻¹ ≤ (n^`)^m^`⁻¹ ≤ (n^`)^m^`, tandis que si ` = 1, nous avons par le Lemme 1.5.3

(n+ 1)^m−1 ≤n^m si n≥m. Dès lors,

k

Y

`=1

n

`

+ 1 m^`−1

≤

k

Y

`=1

n^`m^`

≤n^P^k^`=1^`m^`.

Le Lemme 1.5.4 nous donne alors le résultat escompté lorsque n≥m.

Remarque 1.5.8. Lorsque nous regardons le résultat précédent avec k = 2 et m = 2, nous voyons que

#(Aⁿ/∼₂)∈ O(n¹⁰),

ce qui est moins précis que le Lemme 1.5.2. Cela est normal, vu que le résultat de la Proposition 1.5.7 est plus général.

(30)

1.5. Nombre de classes d'équivalence k-binomiale 15 Nous pouvons tirer du résultat précédent que le nombre de classes d'équivalence est toujours polynomial en m et k. Cependant, il s'agit rapidement d'une haute puissance : pour k= 2, m= 3, la borne devientn²¹.

Notons également que dans [12], une borne sur le nombre de classes de lak-congruence de Simon pour les mots de longueurnsur un alphabet àmlettres était donnée :2^Θ(n^m−1^logⁿ⁾. Puisque, vu la Remarque 1.3.4, la relationk-binomiale est un ranement de lak-congruence de Simon, notre borne est une amélioration de celle-ci.

Exemple 1.5.9. Considérons l'alphabet A={a, b}et la relation d'équivalence ∼₂. Nous allons étudier le nombre de classes d'équivalence pour les mots de longueur 2,3,4 et 5. Remarquons que pour déterminer la classe d'un motu, il sut de connaitre ^u_a

=|u|_a et

u ab

puisque, en utilisant la Proposition 1.2.4 et le Lemme 1.5.1, u

b

=|u| − u

a

, u

aa

= |u|_a

2

, u

bb

= |u|_b

2

, u

ba

= |u|

2

− u

aa

− u

bb

− u

ab

.

Il y a4 mots de longueur2 : aa, ab, ba, bb et ils sont trivialement non 2-équivalents.

Regardons ensuite les mots de longueur 3 que nous classons en fonction de leur nombre de a et leur nombre de ab:

hhhhhhhhh

Nombre de ab

Nombre dea

0 1 2 3

0 bbb bba baa aaa

1 bab aba

2 abb aab

Regardons à présent les mots de longueur 4:

hhhhhh

Nombre deab

Nombre dea

0 1 2 3 4

0 bbbb bbba bbaa baaa aaaa

1 bbab baba abaa

2 babb abba, baab aaba

3 abbb abab aaab

4 aabb

(31)

16 Chapitre 1. Dénitions de base et équivalence k-binomiale Faisons de même pour les mots de longueur5 :

hhhhhhhhh

Nombre de ab

Nombre de a

0 1 2 3 4 5

0 bbbbb bbbba bbbaa bbaaa baaaa aaaaa

1 bbbab bbaba babaa abaaa

2 bbabb babba, bbaab abbaa, baaba aabaa

3 babbb abbba, babab ababa, baaab aaaba

4 abbbb abbab, baabb aabba, abaab aaaab

5 ababb aabab

6 aabbb aaabb

Nous voyons donc que le nombre de classes d'équivalence pour les mots de longueur 2est4. Elle est8pour les mots de longueur3,15pour les mots de longueur4et26pour les mots de longueur 5. Nous obtenons bien le résultat annoncé par la Proposition 1.5.2. Par contre, appliquant le Théorème 1.5.7 à notre cas particulier, nous en tirons simplement qu'il y a au plus 2¹⁰ classes pour les mots de longueur 2, 3¹⁰ classes pour les mots de longueur 3 etc. Le résultat précédent ne fournit donc pas une borne intéressante sur le nombre de classes, mais il permet de s'assurer que le nombre de classes d'équivalence est polynomial en la longueur des mots regardés.

1.6 Complexité k -binomiale d'un mot inni

Lorsqu'un mot inni est étudié, l'une des premières questions qui est posée est de déterminer sa fonction de complexité (factorielle), c'est-à-dire de trouver, pour chaque natureln, le nombre de facteurs de longueurn diérents apparaissant dans ce mot. Cette fonction de complexité peut apporter beaucoup d'informations sur le mot étudié. Par exemple, le théorème de Morse-Hedlund arme qu'un mot inni est périodique si et seulement si sa fonction de complexité p est bornée (voir Théorème 2.1.3). Grâce à ce résultat ont été dénis les mots sturmiens, mots non périodiques de complexité minimale (ce sujet sera abordé plus en détails dans le chapitre suivant).

Nous allons dénir dans cette section la notion de complexité k-binomiale d'un mot inni. Un de nos buts tout au long de ce travail sera de l'étudier pour diérentes familles de mots, essayant de voir si certaines propriétés peuvent s'en dégager. Nous étudierons entre autres les mots sturmiens et les mots qui sont points xes de morphismes Parikh- constants.

Considérons un mot innixconstruit sur l'alphabetAet notons Facx(n)l'ensemble de ses facteurs de longueur n ∈ N. De même, Facx représente l'ensemble de tous les facteurs de x, peu importe leur longueur.

Dénition 1.6.1. Sik est un naturel non nul, la complexité k-binomiale du mot inni x est une fonction comptant pour chaque naturel n le nombre de classes d'équivalence dans Facx(n) pour la relation ∼_k : il s'agit donc de l'application

b^(k)_x :N→N:n 7→#(Facx(n)/∼_k).

(32)

1.6. Complexité k-binomiale d'un mot inni 17 Remarque 1.6.2. Vu que les relations ∼₁ et ∼_ab,1 sont identiques, la fonction de com- plexité b⁽¹⁾x est la fonction de complexité abélienne comptant le nombre de classes d'équi- valence dans Facx(n) pour la relation ∼_ab,1. Cette fonction de complexité est notée ρ^ab_x .

On note égalementp_x(n)la fonction de complexité factorielle px(n) :N→N:n 7→#Facx(n),

qui peut être vue comme la fonction de complexité associée à la relation d'équivalence

"égalité".

Proposition 1.6.3. Pour tout mot inni x sur l'alphabet A et pour tout naturel k non nul, b^(k)x (n)≤b^(k+1)x (n) et ρ^ab_x (n)≤b^(k)x (n)≤p_x(n) ∀n ∈N.

Démonstration. La première partie de l'énoncé provient du fait que si u et v sont deux facteurs de xtels queu∼_k+1 v, alorsu∼_kv (comme nous l'avions déjà mentionné dans la Remarque 1.3.2). Ainsi, lorsque Facx(n) est partitionné en ses classes d'équivalence pour la relation∼_k, nous savons qu'une des classes peut éventuellement être divisée en plusieurs sous-classes pour la relation ∼_k+1 mais deux classes [·]∼_k diérentes ne fusionnent pas en une seule classe pour ∼_k+1. Ainsi,

#(Facx(n)/∼_k)≤#(Facx(n)/∼_k+1) et la première inégalité est démontrée.

Pour la seconde partie de l'énoncé, il sut de raisonner de manière similaire en remarquant que si deux facteurs u et v de x sont égaux, alors ils sont k-binomialement équivalents (et donc b^(k)_x (n) ≤ p_x(n)) et s'ils sont k-binomialement équivalents, alors en particulier ils sont1-binomialement équivalents et donc abéliennement équivalents, ce qui donne ρ^ab_x (n)≤b^(k)x (n).

Remarque 1.6.4. Vu le Théorème 1.5.7, nous savons que la complexité k-binomiale est toujours bornée par un polynôme. Cela n'est pas le cas avec la complexité factorielle. Par exemple, le mot de Champernowne

c= 011011100101· · ·

obtenu en concaténant les représentations en base2de tous les naturels a une complexité factorielle égale à 2ⁿ.

(33)

(34)

Chapitre 2

Complexité k -binomiale des mots sturmiens

Nous allons commencer notre étude de la complexité k-binomiale sur une famille de mots bien connus : les mots sturmiens. Ils ont été nommés ainsi en l'honneur du mathématicien français Jacques Sturm et sont beaucoup étudiés car ils ont la complexité factorielle la plus faible parmi tous les mots non périodiques construits sur un alphabet binaire. La première section de ce chapitre rappelle les dénitions et quelques propositions relatives à ces mots. Nous présentons ensuite un exemple concret de mot sturmien. La troisième section calcule quant à elle la complexité k-binomiale de n'importe quel mot sturmien, utilisant les résultats établis au début de ce chapitre.

2.1 Dénition des mots sturmiens et premières proprié- tés

Nous allons commencer par dénir les mots sturmiens et rappeler des résultats classiques. Le lecteur familier avec ces notions peut directement se rendre à la section 2.2. Dans tout ce chapitre, sauf mention explicite du contraire, nous allons nous xer l'alphabet A ={0,1}. La majorité des dénitions et résultats présentés ici sont tirés de [10] et [17].

2.1.1 Dénition

Dénition 2.1.1. Un mot sturmien est un mot inni construit sur A et de complexité factorielle p(n) =n+ 1 pour tout n∈N.

Nous allons énoncer, après avoir rappelé la dénition de mots périodiques, un théo- rème permettant de qualier les mots sturmiens de mots apériodiques de complexité factorielle minimale. La démonstration s'écartant du sujet de ce mémoire, elle ne sera pas présentée. Cependant, le lecteur peut la trouver dans [17].

Dénition 2.1.2. Un mot inni x construit sur un alphabet quelconque B est dit (pu- 19

(35)

20 Chapitre 2. Complexiték-binomiale des mots sturmiens rement) périodique s'il existe z ∈B^∗ tel que

x=z^ω.

Il est dit ultimement périodique s'il existe y, z ∈B^∗ tels que w=y·z^ω.

Si le mot n'est pas ultimement périodique, il est dit apériodique.

Théorème 2.1.3. (Morse-Hedlund) Soit x un mot inni construit sur un alphabet à

` lettres. Les quatre armations suivantes sont équivalentes.

(i) Le mot x est ultimement périodique ;

(ii) Il existe un naturel n pour lequel p_x(n) = p_x(n+ 1); (iii) Il existe un naturel n pour lequel p_x(n)< n+`−1;

(iv) La fonction px est bornée.

Remarque 2.1.4. Le théorème précédent nous permet d'armer que les mots sturmiens sont les mots apériodiques de complexité factorielle minimale. En eet, si l'on considère un mot innixconstruit surA de complexité plus petite, cela veut dire qu'il existen ∈N tel que p_x(n)< n+ 1. Vu que` = 2, le point (iii)de la proposition précédente est vérié et dans ce cas le mot x est ultimement périodique.

2.1.2 Dénitions équivalentes

Nous allons établir deux dénitions équivalentes permettant de dénir la famille des mots sturmiens. La première fait intervenir la notion de facteur spécial d'un mot, que nous dénissons ci-dessous.

Dénition 2.1.5. Soit x un mot inni sur l'alphabetA. Le mot u∈Facx est un facteur spécial (à droite) du mot x siu0∈Facx et u1∈Facx. Dans le cas contraire,u est appelé un facteur conservatif (à droite) du mot x.

Nous pouvons dès lors établir la première dénition équivalente.

Proposition 2.1.6. Soit x un mot inni construit sur l'alphabet A. Il est sturmien si et seulement si, pour tout naturel n, il possède exactement un facteur spécial (à droite) de longueur n.

Démonstration. La condition est nécessaire.

Fixonsn ∈N. Commexest sturmien, il possède exactementn+ 1facteurs de longueurn. Chacun de ces facteurs est prolongeable à droite au moins par une des deux lettres de A, vu que xest un mot inni. De plus, nous savons que xpossèden+ 2facteurs de longueur n + 1. Donc un seul des facteurs de longueur n est prolongé par les deux lettres dans x. Ainsi, il s'agit de l'unique facteur spécial de longueur n, dont l'existence et l'unicité viennent d'être prouvées.

(36)

2.1. Dénition des mots sturmiens et premières propriétés 21 La condition est susante.

Procédons par récurrence sur n, en utilisant le fait que tous les facteurs de xde longueur n+ 1 ont été obtenus en prolongeant par la droite l'un des facteurs de x de longueur n. Puisque le mot vide est l'unique facteur de x de longueur 0, p_x(0) = 1.

Passons maintenant au cas inductif et supposons que p_x(n) = n + 1 pour un certain naturel n. Nous allons montrer que p_x(n+ 1) =n+ 2. Notons u l'unique facteur spécial de longueur n. Il se prolonge de deux façons, donnant deux facteurs de longueur n+ 1. Tous les autres facteurs de longueur n se prolongent d'une seule façon. Ainsi,

p_x(n+ 1) =p_x(n) + 1 =n+ 2.

Passons maintenant à la seconde dénition équivalente. Celle-ci nécessite que nous introduisions la notion de mots équilibrés.

Dénition 2.1.7. Un mot inni x construit sur l'alphabet A est dit équilibré si, pour tous facteurs u et v dex de même longueur,

||u|1− |v|1| ≤1,

c'est-à-dire que le nombre d'occurrences de la lettre 1 peut diérer au plus d'une unité entre deux facteurs u etv de même longueur issus de x.

Le but de cette sous-section va être de montrer qu'un mot est sturmien si et seulement s'il est équilibré et apériodique. Nous allons avoir besoin de deux lemmes an d'éta- blir le résultat convoité.

Lemme 2.1.8. Soit x un mot inni équilibré construit sur l'alphabet A. Alors, p_x(n)≤n+ 1 ∀n∈N.

Démonstration. Procédons par récurrence sur n. Considérons les cas de base n= 0,1. Sin = 0,εest le seul facteur dexet nous avons bienpx(0)≤1. Sin= 1, les facteurs de x à une lettre ne peuvent qu'être 0et 1 etp_x(1)≤2.

Procédons maintenant à l'induction : supposons que la thèse est démontrée pourn−1 et essayons de la prouver pour n (avec n ≥ 2). Pour ce faire, procédons par l'absurde et supposons que p_x(n)> n+ 1. Ainsi,

p_x(n−1)≤n et p_x(n)≥n+ 2

et nous pouvons trouver deux mots diérents y, y⁰ ∈ Facx(n − 1) tels que 0y,1y,0y⁰,1y⁰ ∈ Facx(n). Notons p le préxe commun à y et y⁰, de longueur maximale.

Puisquey6=y⁰,|p|< n−1. Nous pouvons supposer, quitte à inverser les rôles deyety⁰, que p0est un préxe de y tandis que p1est un préxe de y⁰. Ainsi, les mots 0p0,0p1,1p0,1p1 sont facteurs du motx. Cela est absurde car le mot xest équilibré et||0p0|₁− |1p1|₁|= 2.