HAL Id: hal-00793910
https://hal-upec-upem.archives-ouvertes.fr/hal-00793910
Submitted on 24 Feb 2013
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires
Les automates finis
Dominique Perrin
To cite this version:
Dominique Perrin. Les automates finis. Revue des Sciences et Technologies de l’Information - Série
TSI : Technique et Science Informatiques, Lavoisier, 2000, 19 (3), pp.395-402. �hal-00793910�
DominiquePerrin
15 septembre 1999
Abstrat
Wepresentsomereentappliationsusingniteautomataintheelds
oftextompression,oding,naturallanguageproessingandgames.
1 Introdution
Latheoriedesautomates agardedepuissesdebuts undoubleaspetde
theoriemathematiqueetdeataloguedemethodespourdiversproblemes
d'informatique omme l'analyse lexiale, le traitement de textes, ou la
speiation de proessus. Onpourra trouveren[9℄ unepresentation a
araterehistoriquedetousesaspetsremontantlaha^nedesevenements
depuislesannees40eten[8℄ unepresentationgenerale desaspets on-
temporains.
Letexte i-dessous ontient quelquesexemples de lavarietedes do-
mainesd'appliationsdesautomatesnisallantdutraitementdulangage
naturela latheorie desjeux. Ils'agit d'un hoixpersonneldequelques
sujetsparmibeauoupd'autrespossibles.
Dupointdevuemathematique,latheoriedesautomatesnisontinue
et,amonavis,ontinueraasusiterdesreherhesinteressantes. Jepense
que ei est lie a la onjontion de plusieurs fateurs favorables parmi
lesquelsjeiterai :
L'existenedenombreusesonjeturesnonenoreresoluesainsique
lasolutiondeertainesd'entreellesdanslepassereent.
Les liensaved'autres theories mathematiques dont ladynamique
symbolique,latheoriedesnombresoulaombinatoirealgebrique.
L'existeneennd'unegrandevarieted'appliations, donte texte
donneunaperu.
2 Compression de textes
La transmission (oul'arhivage) dedonneesutilise defaon maintenant
tresfrequentedesmethodesdeompression. Ellespermettentdegagner
un fateurimportantdansle debitdes transmissions. Les methodesles
plusourantespourlaompressiondetextessontleodage de Human
(logiielsompatetpak)ouleodagedeZiv-Lempel(logiielsompress
nistransformantuntexteenuntexteplusourtsansperted'information.
Une nouvelle methode basee elle aussi surles automates a ete pro-
poseereemmentparM.Crohemore,F.Mignosi,A.RestivoetS.Salemi
[4 ℄. Son prinipeest d'utiliserun antiditionnaire, 'esta direuneliste
des mots quin'apparaissent pas dansle texte. La methode supposeun
alphabet binaire, disons fa;bg. L'idee est tres simpleet onsiste a ex-
ploitersystematiquementl'informationfournieparl'antiditionnaire. Si,
parexemple,l'antiditionnaireestfbb;aaa;bababg,onauraleodage
a b a a b a b a a b a a b a b a a b a b a
a b a b a b b
detellefaonqueletextebinaire originaldelongueur 21estodeparle
ouple (abababb;21) (on doitgarder lalongueur dela soure). La om-
pressionfontionneainsi: onpartd'unelettrex=aoubdutextesoure
etonontinuetantqu'il n'yaqu'unepossibilitepourlalettre suivante,
ompte tenudes mots interdits. Onode tout le blo par sa premiere
lettre. Onreommenealalettresuivante. Ledeodageutiliselem^eme
prinipeal'envers. Leodageetledeodagepeuvent^etrederitsparun
transduteurommesurlaFigure1.
a /a a /a
a /a b /b
b /b b /b b /- a /-
a /- a /-
a/
a/ b/
a/ b/
a/
b/
a/ b/
b/
aabaa aabab
bab ab
aa b
b a
baa a
Figure1: Codeuretdeodeur
Lamethodeestasymptotiquementoptimaleentauxdeompression.
L'undesesavantagesparrapportauxautresmethodesonnuesestlefait
que leodageestune fontionloale, i.e. sans propagation deserreurs.
Cela permetde faire de lareherhe de motifs diretement sur le texte
ompresse.
3 Codage
Lessystemesdeodagebasessurdesautomatesnissontnombreuxdans
ledomaine duodagepour anauxontraints. Le livre deMarie-Pierre
Bealpresentenombrede esmethodes ainsique des exemples deodes
utilisesdansdiversontextes(dontleodagepourl'erituresursupport
magnetique)[2 ℄.
automate ni du theoreme de Kraft-MMillan. Ce dernier aÆrme que
l'onpeutrealiserunodagesurunalphabetaklettresdemotsayantune
distribution delongueurs u= (u
n )
n1
ssi lasuite usatisfait l'inegalite
bienonnue
X
n1 u
n k
n
1
'estadire enore silaserie u(z)= P
n1 u
n z
n
verieu(1=2) 1. On
montredans[1 ℄quel'onpeutdeplusrealiserleodageparunautomate
nissilasuiteuestladistributiondelongueursd'unlangagereonnaiss-
able par automate ni. La preuve utilise une nouvelle notion appelee
automatedessuper-etats.
OntrouverasurlaFigure3unexempled'appliationdeettemethode.
Onpart d'un automate repr'esente a gauhe etdont ladistribution de
longueursapourserie u(z)=3z 2
=(1 z 2
) desortequeu(1=2)=1. On
obtientd'abordl'arbreinniindique
droitequidonneleodeprexesur
unalphabetX =(aa)
(ab+ba+bb).
i
Figure2: Codageparunodeprexebinaire.
Ceproblemeestlieauodagepouranauxontraintset,notamment
autheoremedeodaged'Adler,HassneretCoppersmith(voir[6℄).
4 Langage naturel
Lesautomatesnisfournissentunadrepourladesriptiondenombreux
phenomenes liesau langage naturel,aux niveaux phonetique, lexialou
m^emesyntaxique. Unouvragereent,editeparEmmanuelRoheetYves
Shabes[10 ℄ donneunpanoramadeepointdevue. Denouvellesappli-
ationsdesautomates autraitement delangues naturellessontmotivees
parl'ameliorationdesmoteursdereherhesurinternet.
L'un des hapitres de [10 ℄ derit le logiiel INTEX realise par Max
Silberztein [11 ℄. Ilonstitueuneimplementationd'un grandnombrede
methodesd'analysedetextesbaseessurdesautomatesnis. Ilutilisele
systemededitionnairesdu LADLquirepertoriedansplusieurslangues
de faon exhaustive les formes de base ou ehies de mots simples ou
omposes(voir[5 ℄). Ilontientdesoutilspermettantd'utiliseroud'editer
ungrandnombredegrammairesommeelle quiappara^tsurlaFigure
4 et qui derit les limites de phrases du point de vue de la forme de
l'alphabetetdelapontuation.
Lesfontionsainsirealiseessonttresnombreuses,depuisl'analysesyn-
taxiquejusqu'alareherhedoumentaire. Lelogiielestnotammentu-
tilisepourl'enseignementdeslangues. Ilsertaussial'indexationdeorpus
eta permis reemment d'indexer ompletement l'ensemble des resumes
d'artilesonstituantlabasededonneesduNIH(del'ordreduGo).
Un autre domaine d'appliation des automates nis est elui de la
phonetique. Mehryar Mohri,Fernando PereiraetMihael Rileyont mis
aupointunelibrairied'automatesderivantpardestransduteurs,omme
surlaFigure4,unvoabulairephonetise[7 ℄.
5 Jeux et automates
Undesdomaines tresatifsdelareherhesurles automatesdurantles
dernieresanneesaeteeluides jeux. Un ompte-renduassezompleta
ete realise parWolfgangThomas [12 ℄. Lesjeux onsideressont des jeux
1 2 3
Figure5: Jeusurungraphe
a deuxjoueurs a information parfaite (ne faisant don pas intervenir le
hasard). Ungrandnombredeesjeux,omprenantbienentenduleelebre
jeudeNim,sontderitsdanslelivredeGuy,ConwayetBerlekamp([3 ℄).
DesproblemesdedeisiontresdiÆilesapparaissentlorsquel'onon-
sideredesjeuxinnis(Conwaydistinguelesjeuxindenisdesjeuxeternels).
Pourtant esjeux apparaissent naturellement dansles modeles de om-
portementdeproessus. Ondenitdansesjeuxlespartiesgagnantesen
speiantl'ensembledesetatsappara^ssantinnimentsouvent. Celaper-
metd'exprimerdesonditionssurlesproessusditsd'equite(fairness):
sil'evenementU seproduitinnimentsouvent,alorsl'evenementV doit
aussiseproduireinnimentsouvent.
Un exemple simplede tels jeux appara^t surla Figure 5. Les deux
joueurs jouent sur le graphe en hoisissant suessivement les sommets
d'unhemin.Lapositiondedepartestlesommet2.LejoueurIommene
enhoisissantlesommet1oulesommet3. LejoueurIIn'a auunhoix
puisqu'il doitrevenirau sommet2 etlam^emesituation estreproduite.
LejoueurIgagnesileheminpasseinniment souventparlesommet1
etparle sommet3. Ainsi, lejoueur Igagne toujoursaondition dene
pastoujoursjouerlem^emesommetauboutd'unertaintemps.
Le resultat le plusmarquant dee point de vue est le theoreme de
Gurevith et Harrington qui dit essentiellement que pour un jeu joue
sur un graphe ni, l'un des deux joueurs a une strategie gagnante ne
neessitant qu'unememoirenie,i.e. alulableparunautomateni.
Dansl'exemplepreedent, lejoueur I a unetelle strategie gagnante
onsistantajouerunefoissurdeuxlessommets1ou3.
Uneseriedetravaux,d^usenpartiulieraR.MNaughton,W.Zielonka
etN.Klarlundontpermisdedegagerl'importanedelanotiondeha^ne
alternante. Ils'agitd'ensemblesdelaforme
X=X1 X2+X3 :::
ou les X
n
forment uneha^nederoissanteX
1
X
2
X
3
::: . On
aainsimontreenpartiulier qu'unjeu admetpourl'un desjoueurs un-
e strategie gagnantesans memoire ssi l'ensemble des parties gagnantes
pourlui peut^etrederitparuneha^nealternanted'ensemblessimples.
Dansl'exemplepreedent,lejoueurIn'a pasdestrategiegagnantesans
memoire.
diÆiles,yomprisletheoremedeRabinsurladeidabilitedelalogique
monadiqueduseondordredesdeuxsuesseurs(voir[12 ℄).
Referenes
[1℄ Frederique Bassino, Marie-Pierre Beal, and Dominique Perrin.
A nite-state version of the Kraft-MMillan theorem. 1999.
(www-igm.univ-mlv.fr/ beal/Reherhe/Publiations).
[2℄ Marie-PierreBeal. CodageSymbolique. Masson,1993.
[3℄ ElwinR.Berlekamp,JohnH.Conway,andRihardK.Guy.Winning
Ways. AademiPress,1982.
[4℄ Maxime Crohemore, Filippo Mignosi, Antonio Restivo, and Ser-
gio Salemi. Data ompression using antiditionnaries. Teh-
nial Report IGM-98-10, Universite de Marne la Vallee, 1998.
(www-igm.univ-mlv.fr/ ma/DCA.html).
[5℄ MaurieGrossandDominiquePerrin,editors. EletroniDitionar-
ies and Automata in Computational Linguistis. Leture Notes in
ComputerSiene,377. Springer,1989.
[6℄ Brian H. Marus, Ron M. Roth, and Paul H. Siegel. Constrained
systems and oding for reording hannels. In Handbook of oding
theory,volume2,pages1635{1764. NorthHolland,1998.
[7℄ Mehriar Mohri. Finite state transduers in language and
speeh proessing. Computational linguistis, 23, 1997.
(www.researh.att.om/sw/tools /fsm ).
[8℄ DominiquePerrin. Finite automata. In JanVanLeeuwen, editor,
Handbook of Theoretial ComputerSiene, pages1{53. NorthHol-
land,1990.
[9℄ DominiquePerrin.Lesdebutsdelatheoriedesautomates.Tehnique
etSieneInformatique,14:409{4033, 1995.
[10℄ EmmanuelRoheandYvesShabes. Finite-StateLanguageProess-
ing. MITPress,1997.
[11℄ Max Silberztein. Ditionnaires eletroniques et analyse au-
tomatique de textes : le systeme INTEX. Masson, 1993.
(www.ladl.jussieu.fr).
[12℄ Wolfgang Thomas. Languages, automata and logi. In Gregorz
Rosenberg and Arto Salomaa, editors, Handbook of Formal Lan-
guages,volume3,pages389{449.Springer-Verlag,1997.