W. F ERNANDEZ DE LA V EGA A. G UENOCHE
Construction de mots circulaires aléatoires uniformément distribués
Mathématiques et sciences humaines, tome 58 (1977), p. 25-29
<http://www.numdam.org/item?id=MSH_1977__58__25_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1977, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
CONSTRUCTION DE MOTS CIRCULAIRES ALEATOIRES UNIFORMEMENT DISTRIBUES x
W. FERNANDEZ DE LA VEGA xx A. GUENOCHE xx
INTRODUCTION
Soient n et r deux entiers. On
désigne
par[n] l’ensemble
des npremiers
en-tiers
naturels:On
appelle
mot circulaireéquilibré
detype (n,r)
uneséquence
circulaireorientée
delongueur
L =nr construite
surl’alphabet n
telleque
chacun desnr r-uplets
de n yfigure
unefois (et
donc uneseure).
Nousreprésenterons chaque séquence
circulaire A comme un motsimple
en lecoupant
en unpoint
ar-bitraire :
bien
que cettereprésentation
ne soit pasunivoque.
Par
exemple
le mot 11121222 est un mot circulaireéquilibré
detype (2,3).
Les mots
circulaires équilibrés
detype (n,r)
ont été dénombrés par deBruijn.
_
r-1
Il y en a
n r (n!)n
. Ils ont de nombreusesapplications,
enpsychologie expérimentale
notamment : àl’ensemble [n] correspond
un ensemblede
stimuli
et les mots circulaireséquilibrés coupés
en unpoint
arbitraireservent à définir des
séquences
deprésentation
des stimuli(cf.Barbut
1966a,b,c
etDurup 1967).
~ Les auteurs ont bénéficié pour cette recherche
d’une
aide duC.N.R.S.,
dansle cadre de
l’A.T.P. "Informatique".
~x Laboratoire
d’Informatique
pour les Sciences del’Homme.
C.N.R.S.de mots
circulaires
aléatoiresuniformément
distribués.Cet
algorithme
utilise lacorrespondance classique
entre motscirculaires équilibrés
et circuits eulériens.MOTS CIRCULAIRES
EQUILIBRES
ET CIRCUITS EULERIENS.
Soit
Sl’ensemble
des(r-1) uplets
deet soit G le
graphe
dont S estl’ensemble
des sommets et danslequel
deuxsommets s =
(al a2... a r- )
ets’ - (a’1 a’2...
sont reliés par un arcorienté
de s vers s’ si et seulement si on aa’i
pourl~’i~’r-2~
Un circuit eulérien de G est un circuit
qui parcourt
unefois
et une seulechaque
arc de G. Ces circuits eulériens sont encorrespondance
biuni-voque avec les mots
circulaires équilibrés
detype (n,r).
En effet onpeut
associer àchaque
circuit eulérien de G le motcirculaire
formé par les der-nières
lettres de chacun des r-1uplets,
sommets ducircuit, disposées
dansl’ordre
danslequel
ces sommets sont parcourus.Réciproquement
un mot circu-laire
équilibré
detype (n,r)
définit le circuiteulérien
de G dont les som- mets sont les r-1uplets qui
en sont facteurs.Il existe
aussi
unecorrespondance
entrel’ensemble
des circuits eulériens de G etl’ensemble
des arborescences ascendantes(arborescences
dontles arcs sont orientés vers la
racine)
de sommet fixés 0 qui
recouvrent G.Définissons d’abord
uncodage
descircuits
eulériens de G.Choisissons
un som-met
sI
tel que(s , s1)
soit un arc de G. Achaque
circuiteulérien
C de Gfaisons correspondre
la suite de ses sommets dansl’ordre
danslequel
ilsapparaissent
dans ce circuit et enchoisissant
de commencer parsa puis sl
((so, s1)é
Cpuisque
C esteulérien)
Ayant
choisiSo
ets1
cettereprésentation
estévidemment unique.
Pour toutsommet r
distinct
de s0
appelons
arc desortie
de C ledernier
arc du circuitissu de r. On vérifie alors que
l’ensemble
des arcs desortie
forment une ar-borescence ascendante de sommet
s . Réciproquement
àchaque
arborescence ascen- odante de sommet
so
onpeut
associer tous lescircuits eulériens
dontl’ensem-
ble des arcs desortie coincide
avecl’ensemble
des arcs de cette arborescence.r-1
n
Il y en a
(n-1)!
,puisque
les arcs desorties
étantfixés
il y a(n-1)!
choix
possibles
pour les ordres danslequels apparaissent
dans lareprésenta-
tion
considérée
les autres arcsissus
dechaque
sommet de G.Cette
correspondance
entre motscirculaires équilibrés
et cir-cuits
eulériens
est décrite dansBerge (1958).
UNE PROCEDURE DE
CONSTRUCTION
DE MOTS CIRCULAIRESEQUILIBRES
ALEATOIRES., Cette
correspondance suggère
deprocèder
en deuxétapes
pour tirerau hasard un
circuit
eulérien de G(et
le motcirculaire équilibré associé)
1 - tirer au hasard une arborescence T de
racine
s fixéeo
2 -
tirer
au hasard uncircuit eulérien parmi
ceuxassociés
àl’arborescence
T obtenue.En effet cette
procédure n’est
pasbiaisée puisque
le nombre decircuits eulériens associés
àchaque
arborescence de racines 0
est constant.L’étape
2 esttriviale.
Il estpossible
deréaliser
1directement
en
tirant
au hasard successivement les arcs de Tmais
celanécessite d’intro- duire
lesprobabilités conditionnelles
dontl’expression
estcompliquée.
La mé-thode
indirecte
suivante estplus performante.
l’- Tirer
au hasard ungraphe partiel
de G dedemi degré
exté-rieur
égal
à 1 enS-s ,à
o 0 ens .
o Effectuer cetirage
autant defois qu’il
estnécessaire pour que le
graphe partiel
obtenusoit
une arborescence.l’ -
estsimple
à exécuterpuisqu’il suffit
detirer
au hasarden
chaque
sommetdistinct
des 0
un arcparmi
les arcsincidents
à ce sommetet de tester la
présence
decycles
dans legraphe
obtenu.La
probabilité
Pd’obtenir
une arborescence donnée dans untirage
est
égale
auproduit
desprobabilités d’obtenir
enchaque
sommetdistinct
deso
l’arc
incident à ce sommetappartenant
à cette arborescence.Ainsi
ce
qui justifie
laprocédure proposée.
Notons que la
procédure
estégalement
valable pour tirer auhasard une arborescence de racine s recouvrant les sommets
d’un graphe quel-
0
On obtient ce nombre en effectuant le
quotient
du nombre degraphes partiels
de G de demidegré
extérieurégal
à 1 surS-s ,
o à 0 enso,
osoit
n ,
~ au nombred’arborescences
de racineSo
recouvrantG,
soit(De Bruijn 1946). Ainsi
-
où L
désigne
lalongueur
des mots circulaires cherchés. Ainsi le nombre moyend’itérations
estd’un
ordre degrandeur
tout-à-faitacceptable,
et donne lieuà un
algorithme
decomplexité polynominale
en L.Description
du programme.Un programme Fortran
d’une
centained’instructions
a étéécrit, qui
réalisesuccessivement
lesprocédures 1’ et
2. Pour tester si ungraphe
est une arborescence on efface tout arc dont le sommet initial
n’est
sommetterminal
d’aucun
autre arc. T est une arborescencesi
et seulement sil’appli-
cation
répétée
de cetteprocédure permet
desupprimer
tous les arcs de T.En ce
qui
concernel’étape
2 onobtient
aisément unepermutation
aléatoire de
degré
m en ordonnant m nombrestirés
au hasard entre 0 et 1.Le nombre moyen
d’opérations
exécutées par le programme pour construire un motcirculaire équilibré
aléatoire detype (n,r)
est del’ordre
de
n3 r2n - 2
.BIBLIOGRAPHIE
1.BARBUT
M., "Un
exercice de combinatoire des mots circulaires etéquilibrés"
Math. et Sc.
Hum., 14, (1966a)
2.BARBUT
M., "Mots
circulaires etéquilibrés",
Mat. et Sc.Hum., 16, (1966b).
3.BARBUT
M., "Mots circulaires
etéquilibrés.
Histoire duproblème
vu à traversla
bibliographie" Math.
et Sc. Hum.17, (1966c).
4.BERGE, La théorie des graphes et
sesapplications ,Dunod, 1958.
5. BOVET, "Generation automatique
de motscirculaires
etéquilibrés" Math.
et Sc.Hum.
49,
29-42(1975).
6.BOVET, Communication verbale.
7.DE BRUIJN, "A Combinational Problem", Indag. Math.8, 416-417 (1946) .
8.DURUP H., "Graphes
etplans temporels,
motscirculaires
etplans toriques"
Math. et Sc. Hum.