• Aucun résultat trouvé

Les automates finis

N/A
N/A
Protected

Academic year: 2021

Partager "Les automates finis"

Copied!
7
0
0

Texte intégral

(1)

HAL Id: hal-00793910

https://hal-upec-upem.archives-ouvertes.fr/hal-00793910

Submitted on 24 Feb 2013

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires

Les automates finis

Dominique Perrin

To cite this version:

Dominique Perrin. Les automates finis. Revue des Sciences et Technologies de l’Information - Série

TSI : Technique et Science Informatiques, Lavoisier, 2000, 19 (3), pp.395-402. �hal-00793910�

(2)

DominiquePerrin

15 septembre 1999

Abstrat

Wepresentsomereentappliationsusingniteautomataintheelds

oftextompression,oding,naturallanguageproessingandgames.

1 Introdution

Latheoriedesautomates agardedepuissesdebuts undoubleaspetde

theoriemathematiqueetdeataloguedemethodespourdiversproblemes

d'informatique omme l'analyse lexiale, le traitement de textes, ou la

speiation de proessus. Onpourra trouveren[9℄ unepresentation a

araterehistoriquedetousesaspetsremontantlaha^nedesevenements

depuislesannees40eten[8℄ unepresentationgenerale desaspets on-

temporains.

Letexte i-dessous ontient quelquesexemples de lavarietedes do-

mainesd'appliationsdesautomatesnisallantdutraitementdulangage

naturela latheorie desjeux. Ils'agit d'un hoixpersonneldequelques

sujetsparmibeauoupd'autrespossibles.

Dupointdevuemathematique,latheoriedesautomatesnisontinue

et,amonavis,ontinueraasusiterdesreherhesinteressantes. Jepense

que ei est lie a la onjontion de plusieurs fateurs favorables parmi

lesquelsjeiterai :

L'existenedenombreusesonjeturesnonenoreresoluesainsique

lasolutiondeertainesd'entreellesdanslepassereent.

Les liensaved'autres theories mathematiques dont ladynamique

symbolique,latheoriedesnombresoulaombinatoirealgebrique.

L'existeneennd'unegrandevarieted'appliations, donte texte

donneunaperu.

2 Compression de textes

La transmission (oul'arhivage) dedonneesutilise defaon maintenant

tresfrequentedesmethodesdeompression. Ellespermettentdegagner

un fateurimportantdansle debitdes transmissions. Les methodesles

plusourantespourlaompressiondetextessontleodage de Human

(logiielsompatetpak)ouleodagedeZiv-Lempel(logiielsompress

(3)

nistransformantuntexteenuntexteplusourtsansperted'information.

Une nouvelle methode basee elle aussi surles automates a ete pro-

poseereemmentparM.Crohemore,F.Mignosi,A.RestivoetS.Salemi

[4 ℄. Son prinipeest d'utiliserun antiditionnaire, 'esta direuneliste

des mots quin'apparaissent pas dansle texte. La methode supposeun

alphabet binaire, disons fa;bg. L'idee est tres simpleet onsiste a ex-

ploitersystematiquementl'informationfournieparl'antiditionnaire. Si,

parexemple,l'antiditionnaireestfbb;aaa;bababg,onauraleodage

a b a a b a b a a b a a b a b a a b a b a

a b a b a b b

detellefaonqueletextebinaire originaldelongueur 21estodeparle

ouple (abababb;21) (on doitgarder lalongueur dela soure). La om-

pressionfontionneainsi: onpartd'unelettrex=aoubdutextesoure

etonontinuetantqu'il n'yaqu'unepossibilitepourlalettre suivante,

ompte tenudes mots interdits. Onode tout le blo par sa premiere

lettre. Onreommenealalettresuivante. Ledeodageutiliselem^eme

prinipeal'envers. Leodageetledeodagepeuvent^etrederitsparun

transduteurommesurlaFigure1.

a /a a /a

a /a b /b

b /b b /b b /- a /-

a /- a /-

a/

a/ b/

a/ b/

a/

b/

a/ b/

b/

aabaa aabab

bab ab

aa b

b a

baa a

Figure1: Codeuretdeodeur

Lamethodeestasymptotiquementoptimaleentauxdeompression.

L'undesesavantagesparrapportauxautresmethodesonnuesestlefait

que leodageestune fontionloale, i.e. sans propagation deserreurs.

Cela permetde faire de lareherhe de motifs diretement sur le texte

ompresse.

3 Codage

Lessystemesdeodagebasessurdesautomatesnissontnombreuxdans

ledomaine duodagepour anauxontraints. Le livre deMarie-Pierre

Bealpresentenombrede esmethodes ainsique des exemples deodes

utilisesdansdiversontextes(dontleodagepourl'erituresursupport

magnetique)[2 ℄.

(4)

automate ni du theoreme de Kraft-MMillan. Ce dernier aÆrme que

l'onpeutrealiserunodagesurunalphabetaklettresdemotsayantune

distribution delongueurs u= (u

n )

n1

ssi lasuite usatisfait l'inegalite

bienonnue

X

n1 u

n k

n

1

'estadire enore silaserie u(z)= P

n1 u

n z

n

verieu(1=2) 1. On

montredans[1 ℄quel'onpeutdeplusrealiserleodageparunautomate

nissilasuiteuestladistributiondelongueursd'unlangagereonnaiss-

able par automate ni. La preuve utilise une nouvelle notion appelee

automatedessuper-etats.

OntrouverasurlaFigure3unexempled'appliationdeettemethode.

Onpart d'un automate repr'esente a gauhe etdont ladistribution de

longueursapourserie u(z)=3z 2

=(1 z 2

) desortequeu(1=2)=1. On

obtientd'abordl'arbreinniindique

droitequidonneleodeprexesur

unalphabetX =(aa)

(ab+ba+bb).

i

Figure2: Codageparunodeprexebinaire.

Ceproblemeestlieauodagepouranauxontraintset,notamment

autheoremedeodaged'Adler,HassneretCoppersmith(voir[6℄).

4 Langage naturel

Lesautomatesnisfournissentunadrepourladesriptiondenombreux

phenomenes liesau langage naturel,aux niveaux phonetique, lexialou

m^emesyntaxique. Unouvragereent,editeparEmmanuelRoheetYves

Shabes[10 ℄ donneunpanoramadeepointdevue. Denouvellesappli-

ationsdesautomates autraitement delangues naturellessontmotivees

parl'ameliorationdesmoteursdereherhesurinternet.

L'un des hapitres de [10 ℄ derit le logiiel INTEX realise par Max

Silberztein [11 ℄. Ilonstitueuneimplementationd'un grandnombrede

methodesd'analysedetextesbaseessurdesautomatesnis. Ilutilisele

systemededitionnairesdu LADLquirepertoriedansplusieurslangues

de faon exhaustive les formes de base ou ehies de mots simples ou

omposes(voir[5 ℄). Ilontientdesoutilspermettantd'utiliseroud'editer

(5)

ungrandnombredegrammairesommeelle quiappara^tsurlaFigure

4 et qui derit les limites de phrases du point de vue de la forme de

l'alphabetetdelapontuation.

Lesfontionsainsirealiseessonttresnombreuses,depuisl'analysesyn-

taxiquejusqu'alareherhedoumentaire. Lelogiielestnotammentu-

tilisepourl'enseignementdeslangues. Ilsertaussial'indexationdeorpus

eta permis reemment d'indexer ompletement l'ensemble des resumes

d'artilesonstituantlabasededonneesduNIH(del'ordreduGo).

Un autre domaine d'appliation des automates nis est elui de la

phonetique. Mehryar Mohri,Fernando PereiraetMihael Rileyont mis

aupointunelibrairied'automatesderivantpardestransduteurs,omme

surlaFigure4,unvoabulairephonetise[7 ℄.

5 Jeux et automates

Undesdomaines tresatifsdelareherhesurles automatesdurantles

dernieresanneesaeteeluides jeux. Un ompte-renduassezompleta

ete realise parWolfgangThomas [12 ℄. Lesjeux onsideressont des jeux

(6)

1 2 3

Figure5: Jeusurungraphe

a deuxjoueurs a information parfaite (ne faisant don pas intervenir le

hasard). Ungrandnombredeesjeux,omprenantbienentenduleelebre

jeudeNim,sontderitsdanslelivredeGuy,ConwayetBerlekamp([3 ℄).

DesproblemesdedeisiontresdiÆilesapparaissentlorsquel'onon-

sideredesjeuxinnis(Conwaydistinguelesjeuxindenisdesjeuxeternels).

Pourtant esjeux apparaissent naturellement dansles modeles de om-

portementdeproessus. Ondenitdansesjeuxlespartiesgagnantesen

speiantl'ensembledesetatsappara^ssantinnimentsouvent. Celaper-

metd'exprimerdesonditionssurlesproessusditsd'equite(fairness):

sil'evenementU seproduitinnimentsouvent,alorsl'evenementV doit

aussiseproduireinnimentsouvent.

Un exemple simplede tels jeux appara^t surla Figure 5. Les deux

joueurs jouent sur le graphe en hoisissant suessivement les sommets

d'unhemin.Lapositiondedepartestlesommet2.LejoueurIommene

enhoisissantlesommet1oulesommet3. LejoueurIIn'a auunhoix

puisqu'il doitrevenirau sommet2 etlam^emesituation estreproduite.

LejoueurIgagnesileheminpasseinniment souventparlesommet1

etparle sommet3. Ainsi, lejoueur Igagne toujoursaondition dene

pastoujoursjouerlem^emesommetauboutd'unertaintemps.

Le resultat le plusmarquant dee point de vue est le theoreme de

Gurevith et Harrington qui dit essentiellement que pour un jeu joue

sur un graphe ni, l'un des deux joueurs a une strategie gagnante ne

neessitant qu'unememoirenie,i.e. alulableparunautomateni.

Dansl'exemplepreedent, lejoueur I a unetelle strategie gagnante

onsistantajouerunefoissurdeuxlessommets1ou3.

Uneseriedetravaux,d^usenpartiulieraR.MNaughton,W.Zielonka

etN.Klarlundontpermisdedegagerl'importanedelanotiondeha^ne

alternante. Ils'agitd'ensemblesdelaforme

X=X1 X2+X3 :::

ou les X

n

forment uneha^nederoissanteX

1

X

2

X

3

::: . On

aainsimontreenpartiulier qu'unjeu admetpourl'un desjoueurs un-

e strategie gagnantesans memoire ssi l'ensemble des parties gagnantes

pourlui peut^etrederitparuneha^nealternanted'ensemblessimples.

Dansl'exemplepreedent,lejoueurIn'a pasdestrategiegagnantesans

memoire.

(7)

diÆiles,yomprisletheoremedeRabinsurladeidabilitedelalogique

monadiqueduseondordredesdeuxsuesseurs(voir[12 ℄).

Referenes

[1℄ Frederique Bassino, Marie-Pierre Beal, and Dominique Perrin.

A nite-state version of the Kraft-MMillan theorem. 1999.

(www-igm.univ-mlv.fr/ beal/Reherhe/Publiations).

[2℄ Marie-PierreBeal. CodageSymbolique. Masson,1993.

[3℄ ElwinR.Berlekamp,JohnH.Conway,andRihardK.Guy.Winning

Ways. AademiPress,1982.

[4℄ Maxime Crohemore, Filippo Mignosi, Antonio Restivo, and Ser-

gio Salemi. Data ompression using antiditionnaries. Teh-

nial Report IGM-98-10, Universite de Marne la Vallee, 1998.

(www-igm.univ-mlv.fr/ ma/DCA.html).

[5℄ MaurieGrossandDominiquePerrin,editors. EletroniDitionar-

ies and Automata in Computational Linguistis. Leture Notes in

ComputerSiene,377. Springer,1989.

[6℄ Brian H. Marus, Ron M. Roth, and Paul H. Siegel. Constrained

systems and oding for reording hannels. In Handbook of oding

theory,volume2,pages1635{1764. NorthHolland,1998.

[7℄ Mehriar Mohri. Finite state transduers in language and

speeh proessing. Computational linguistis, 23, 1997.

(www.researh.att.om/sw/tools /fsm ).

[8℄ DominiquePerrin. Finite automata. In JanVanLeeuwen, editor,

Handbook of Theoretial ComputerSiene, pages1{53. NorthHol-

land,1990.

[9℄ DominiquePerrin.Lesdebutsdelatheoriedesautomates.Tehnique

etSieneInformatique,14:409{4033, 1995.

[10℄ EmmanuelRoheandYvesShabes. Finite-StateLanguageProess-

ing. MITPress,1997.

[11℄ Max Silberztein. Ditionnaires eletroniques et analyse au-

tomatique de textes : le systeme INTEX. Masson, 1993.

(www.ladl.jussieu.fr).

[12℄ Wolfgang Thomas. Languages, automata and logi. In Gregorz

Rosenberg and Arto Salomaa, editors, Handbook of Formal Lan-

guages,volume3,pages389{449.Springer-Verlag,1997.

Références

Documents relatifs

◮ le fini dans l’infini : exemple de r´eels, triadique de Cantor (si cela passe). D´ecalages : notation fonction et somme (un peu de dualit´e sous forme de

◮ le fini dans l’infini : exemple de r´eels, triadique de Cantor (si cela passe).. D´ecalages : notation fonction et somme (un peu de dualit´e sous forme de

◮ Matrice(s) de transition, pb des arˆetes multiples avec diff´erentes.. ´etiquettes, avec

Nouveaux exemples d’automates des d´ecalages (exemples finis et infinis) sur des langages s’exprimant avec des conditions (mots avec pr´efixe impos´e, avec facteur impos´e).. Tous

Nouveaux exemples d’automates des d´ecalages (exemples finis et infinis) sur des langages s’exprimant avec des conditions (mots avec pr´efixe impos´e, avec facteur

En utilisant le Nullstellensatz, montrer qu’il existe un ensemble fini E de nombres premiers tel que pour tout p / ∈ E, pour tout corps F de caract´ eristique p, les (P i )

En utilisant le Nullstellensatz, montrer qu’il existe un ensemble fini E de nombres premiers tel que pour tout p / ∈ E, pour tout corps F de caract´ eristique p, les (P i )

En utilisant le Nullstellensatz, montrer qu’il existe un ensemble fini E de nombres premiers tel que pour tout p / ∈ E, pour tout corps F de caract´ eristique p, les (P i )