Dans le tableauI, nous présentons les symboles graphiques utilisés pour schématiser
les grammaires locales (lg
s) et les grammaires locales étendues (elg
s) décrites dans
les chapitres 3 et 4respectivement. Plus précisément, en plus de la représentation
des fonctions étendues, que nous introduisons dans cette thèse, nous adoptons les
conventions popularisées d’abord par Intex(Silberztein,1994) et ensuite étendues par
Unitex (Paumier,2016) pour construire des graphes syntaxiques. Nous représentons
alors ces grammaires par des graphes orientés, lus de gauche à droite
1, avec des nœuds
étiquetés dénommés «boîtes», dont une est désignée comme boîte de départ
2et une
autre comme boîte d’arrivée. En outre, lorsqu’il est pertinent, nous spécifions le lien
qui existe entre le symbole décrit et la notation par des diagrammes d’états-transitions
(c.f 2.2.1).
Tableau I– Symboles pour représenter les lgs et les elgs sous forme de graphes syntaxiques
Symbole Nom Description
Boîte2
Les étiquettes des transitions de l’automate qui mo-délise la grammaire sont représentées à l’intérieur (étiquettes d’entrée) ou en dessous (étiquettes de
sortie) des rectangles (appelésboîtes).
Arc
Des arcs relient les boîtes du graphe. Contrairement à la notation par des diagrammes d’états-transitions, les arcs ne représentent pas les transitions de l’auto-mate sous-jacent (déjà symbolisées par les boîtes), mais servent à décrire quelles sont les transitions entrantes (signalées par des arcs dirigés) et sortantes des états implicitement représentés.
Boîte de départ
L’entrée du graphe (l’état initial de l’automate sous-jacent), communément le premier symbole à gauche, est représenté par un arc direct vers un carré aux contours en gras.
Boîte d’arrivée
La fin du graphe (l’état final de l’automate sous-jacent), communément le dernier symbole à droite, est noté par un arc direct vers un double carré.
1. En général, un graphe peut être conçu en accord avec le système d’écriture employé. Par exemple, pour les systèmes qui utilisent un sens droite à gauche, tel que l’arabe, il est plus propice de construire des graphes pouvant être lus dans le même sens.
2. Il est commun de parler desétatsd’une grammaire en faisant rapport aux états d’un diagramme
d’états-transitions(cf. section2.2). Dans ce cas, il est possible de dire que les états de la grammaire sont représentés par des carrés et que, mis à part l’état initial et l’état terminal, les autres états, intermédiaires, ne sont pas explicitement affichés. Cependant, afin de permettre une distinction claire entre la représentation par des graphes et celle par des diagrammes d’états-transitions, nous réservons
le termeétatpour ces dernières. De cette manière, pour se référer à un graphe, nous employons les
II.
Représen
tation
des
grammaires
lo
cales/étendues
Tableau I (suite de la page précédente)
Symbole Nom Description
σ
EntréeLes étiquettes d’entrée non vides (σ) des
transi-tions de l’automate sont explicitement affichées à l’intérieur des boîtes.
Entrée vide
Les transitions qui sont étiquetées en entrée
unique-ment par lemot videepsilon (ε) sont symbolisées
par un carré noir de taille réduite.
γ
σ
Entrée/SortieLes étiquettes de sortieγdes transitions sont placées
en dessous des boîtes. Elles sont indiquées en gras. Sauf mention contraire, une boîte sans contenu en dessous désigne une transition qui n’a pas d’étiquette de sortie.
γ Entrée vide/Sortie
Les transitions qui sont étiquetées en entrée
unique-ment par lemot vide(ε) et qui cependant ont une
étiquette de sortie (γ ∈Γ), sont symbolisées avec
l’étiquette de sorti placée en dessous du symbole d’entrée vide.
. . .
σt1
σtn Entrées multiples
L’ensemble des étiquettes d’entrée des transitions qui partent d’un état source pour arriver à un même état de destination, soitσt = {σt1, . . . , σtn}, sont explicitement affichées à l’intérieur des boîtes. La convention graphique consiste à faire correspondre chaque ligne à une nouvelle étiquette d’entrée.
σ
BoucleUne boucle sur une ou plusieurs boîtes, symbolisée par an arc dirigé les reliant, indique que les étiquettes en entrée, du chemin formé par la boucle, peuvent être reconnues plusieurs fois en séquence.
%
Sous-grapheLes symboles d’entrée non-terminaux des transitions sont des appels à d’autres graphes appelés
sous-graphes (%). Les noms des sous-graphes attachés
aux transitions d’une grammaire sont représentés entourés d’un fond gris foncé. Ils sont explicitement affichés à l’intérieur des boîtes.
i i
σ
Variable d’entréeLes contenus des étiquettes d’entrée d’un ensemble de boîtes entourées par des parenthèses est assignée à un registre local du même nom que celui placé en haut de chaque parenthèse, soiti=σ(i..σi).
o
σ
γ o Variable de sortieLe contenu des étiquettes de sortie entourées par des parenthèses est assignée à un registre local du même nom que celui placé en bas de chaque parenthèse, soito=γ(o..γo).
Notations
et
sym
b
oles
xxxi
Tableau I (suite de la page précédente)
Symbole Nom Description
σ
Mode morphologiqueUn ensemble de boîtes délimitées par un chevron
ou-vrant et un chevron fermant se trouve enmode
mor-phologique. Le mode morphologique affecte l’unité minimale d’analyse des étiquettes d’entrée, tan-dis que par défaut l’analyse se réalise en prenant chaque étiquette d’entrée comme une unité indi-visible, lorsque la grammaire se trouve en mode morphologique, l’analyse des étiquettes d’entrée s’ef-fectue lettre par lettre.
σ
Contexte gaucheUn contexte gauche, représenté par une étoile, in-dique que pour un chemin réussi, la sortie du graphe sera produite en tenant juste en compte les entrées et sorties des boîtes qui se trouvent à gauche de l’étoile. Autrement dit, la partie à droite de la sé-quence reconnue ne sera pris en compte dans le résultat.
σ
Contexte droitUn ensemble de boîtes délimitées par un crochet ou-vrant et un crochet fermant représente un contexte droit. Lorsque la grammaire se trouve dans un contexte droit les symboles d’entrée sont lus mais pasconsommés. Si la lecture ne peut pas atteindre la fin du contexte, le chemin n’est pas réussi.
σ
Contexte droit négatifUn ensemble de boîtes délimitées par un point d’ex-clamation immédiatement suivi d’un crochet ouvrant et un crochet fermant représente un contexte droit négatif. Lorsque la grammaire se trouve dans un contexte droit négatif les symboles d’entrée sont lus
mais pasconsommés. Si la lecture peut atteindre la
fin du contexte, le chemin n’est pas réussi.
ϕ(∆)
σ
Sortie étendue
Les symboles de sortie non-terminaux des transi-tions sont des appels à des fonctransi-tions externes à la
grammaire que nous appelons fonctions étendues
et qui ont la forme ϕ(∆), où ϕ est le nom de la
fonction et ∆ unn–upletd’arguments en entrée. Les
appels aux fonctions étendues attachés aux transi-tions d’une grammaire sont placés en dessous des boîtes et entourés d’un fond gris foncé.