c) La relation d'intention
3.3 Relations entre les structures
3.3.1 Structure Syntaxique
Un document textuel quelconque peut ^etre decrit selon sa structure linguistique et/ou sa structure logique. Des caracteristiques similaires apparaissent a travers les formalisation de ces deux structures. Ainsi les relations decrivant l'organisation des structures logiques et linguistiques sont semblables et les caracterisations des elements reposent sur un typage avec des notions de sous-types et super-types pour contraindre les compositions selon des regles de construction syntaxique. Nous denissons la structure syntaxique de la maniere suivante:
Denition 1 (Structure Syntaxique)
La structure syntaxique est l'organisation des sym-boles du document textuel qui repose sur la composition des symsym-boles formant une arborescence et sur l'encha^nement sequentiel des symboles fournissant l'ordonnancement et donc le sens de la lecture.La structure linguistique decrit l'agregation et l'encha^nement des symboles du document textuel. Elle represente une arborescence d'elements linguistiques dont l'element racine re-presente le document complet et dont les autres elements rere-presentent des symboles de plus faibles granularites. A un niveau d'abstraction dierent, la structure logique du document textuel decrit l'organisation d'entites dont la granularite est plus grande que celle des ele-ments linguistiques. La encore, il s'agit d'une arborescence dont l'element racine represente le document complet et dont les autres elements representent les entites logiques. Le type de ces entites est contraint par le type du document.
Les relations d'organisation des elements sont similaires dans les deux structures, elles ont les m^emes fonctionnalites et les m^emes proprietes. Ces structures se dierencient par le fait que la structure linguistique est generique alors que la structure logique est contrainte par le type du document considere. Une autre dierence provient de la granularite des elements logiques et linguistiques. On peut en eet considerer que les entites logiques sont composes de symboles du document textuel, c'est a dire qu'un element logique est compose d'elements linguistiques. Nous montrons ceci dans la gure 3.4, en denissant la structure logique du document comme une vue etendue de l'element racine de la structure linguistique.
Dans la gure 3.4, on combine les deux structures linguistiques et logiques. Dans cette arborescence, la racine de la structure linguistique a ete remplacee par l'arborescence de la structure logique. L'element racine linguistique representait le document complet qui est
do-Structure Linguistique Structure Logique Intégration Relation de composition logique Relation de sequence logique Relation de sequence de transition Relation de composition de transition Relation de sequence linguistique Relation de composition linguistique
oling2 oling3 oling4 oling5
oling1
oling12
oling11 oling31 oling32 oling51 oling52
olog2
olog12
olog11
oracine log olog1
oling2 oling3 oling4 oling5
oling1
oling12
oling11 oling31 oling32 oling51 oling52
olog12 olog11 oracine log olog2 olog1 o racineling
Figure 3.4.
Lien entre structure linguistique et logique: structure syntaxiquerenavant represente par l'element racine logique. D'autre part, les elements logiques feuilles sont mis en relation avec les elements linguistiques qui etaient ls directs de la racine linguis-tique. Les relations de sequence entre ces elements ont ete modiees par rapport a celles de la structure linguistique originale puisqu'ils ne sont plus ls d'un m^eme element dans cette nouvelle arborescence.
Par exemple, les elements linguistiques
o
ling 2 eto
ling 3 avaient m^eme pere dans la struc-ture linguistique et la relation de sequence linguistique entre ces deux elements existait. Dans la structure syntaxique complete, ces deux elements ne sont plus freres et ne peuvent donc plus admettre de relation de sequence m^eme si leur disposition dans le document textuel n'a pas ete modiee. Le fait qu'ils se succedent dans le document est etabli par les relations provenant de leurs parents.Il appara^t donc que la combinaison des structures linguistiques et logiques pour former la structure syntaxique du document textuel requiert la denition de nouvelles relations:
1. Denition d'un nouvel ensemble d'elements linguistiques excluant la racine.
2. Possibilite de composition d'elements logiques par des elements linguistiques de ce nou-vel ensemble.
3. Nouvelle denition des relations de sequences sur les elements linguistiques ls directs de l'element racine linguistique.
4. Denition de la compatibilite des types des elements logiques feuilles avec des types linguistiques.
Nous reprenons chacun de ces points en denissant les elements qui permettent d'etablir la combinaison des structures linguistiques et logiques et qui permettent de construire la structure syntaxique du document.
1. Nous redenissons donc l'ensemble des elements linguistiques de la structure syntaxique comme un sous-ensemble de l'ensemble des elements linguistiques. Nous notons cet ensemble
OS
ling.
OS
ling =
OS
ling,fo
racine lingg2. La relation de composition linguistique permet uniquement des compositions d'elements linguistiques avec des elements linguistiques. De m^eme, la relation de composition lo-gique permet de composer des elements lolo-giques avec d'autres elements lolo-giques. Nous denissons donc une relation de composition, que nous notons comp trans et que nous appelons relation de composition de transition, qui permet la composition des elements feuilles de la structure logique par des elements linguistiques provenant de l'ensemble
OS
racine ling. Cet ensemble decrit l'ensemble des elements racines de
OS
ling.
Cette relation de composition est donc denie sur les ensembles
OS
f logetOS
racine ling
et a les proprietes de non re exivite, de non transitivite et d'asymetrie.:
comp trans
OS
f logOS
racine ling
La structure logique est une extension de la structure linguistique. Donc chaque element logique feuille doit ^etre rattache a au moins un element linguistique:
8
o
2OS
f log,9o
i 2OS
racine ling tel que
o
comp transo
i3. Considerons maintenant l'ensemble
OS
ling. La non prise en compte de la racine
o
racine lingentra^ne la non validite des relations de sequence sur ses elements ls. En eet, une relation de sequence existe entre deux elements si ces deux elements sont freres dans l'arborescence linguistique. Comme nous avons supprime leur pere de l'ensemble
OS
ling,
les relations de sequence entre ces elements n'existent pas lorsqu'on applique la relation
seq ling sur
OS
ling.
Nous introduisons une relation de sequence denie sur leselements de l'ensemble
OS
racine ling,
appelee relation de sequence de transition et noteeseq trans. La contrainte des elements freres se fera avec la relation de composition que nous venons de denir entre entites lo-giques feuilles et elements linguistiques de l'ensemble
OS
racine ling. La relationseq trans
se denit par:
seq trans
OS
racine ling
OS
Cette relation est deduite de la relation de sequence linguistique sur l'ensemble
OS
ling, c'est-a-dire que si deux elements linguistiques ls de la racine linguistique sont mis en relation par la relation de sequence linguistique, notee seq ling, et qu'ils ont le m^eme pere parmi les elements logiques feuilles alors ces deux elements sont des successeurs directs selon la relation de sequence notee seq trans.o
i seq transo
jsi
8 > > > > > > < > > > > > > :o
iseq lingo
jet
9
o
log 2OS
f log tel que8 > <
> :
o
log comp transo
iet
o
log comp transo
j4. La relation seq trans doit prendre en compte des contraintes liees aux types des ele-ments qui sont mis en relation, c'est-a-dire que nous ne pouvons pas mettre en relation n'importe quel type d'entite logique avec n'importe quel type d'element linguistique. Nous devons donc introduire une relation decrivant le sous-typage des types logiques feuilles par des types linguistiques.
Du fait de la prise en compte de l'ensemble
OS
ling, l'ensemble des types linguistiques est reduit a un ensemble, note
TY PE
ling deni par:
TY PE
ling =
TY PE
ling,ft
racine linggCette relation de sous-typage, notee t lien et appelee relation de sous-typage de tran-sition, se denit de la maniere suivante:
t lien
TY PE
max logTY PE
ling
La notation
t
i t lient
j avect
i 2TY PE
max log ett
j 2TY PE
ling signie que le type logiquet
i est un super-type du type linguistiquet
j, c'est-a-dire qu'un element logique de typet
i peut ^etre compose d'un element linguistique de typet
j.Tout comme les relations t ling et t log denies respectivement sur les ensembles