• Aucun résultat trouvé

c) La relation d'intention

3.3 Relations entre les structures

3.3.1 Structure Syntaxique

Un document textuel quelconque peut ^etre decrit selon sa structure linguistique et/ou sa structure logique. Des caracteristiques similaires apparaissent a travers les formalisation de ces deux structures. Ainsi les relations decrivant l'organisation des structures logiques et linguistiques sont semblables et les caracterisations des elements reposent sur un typage avec des notions de sous-types et super-types pour contraindre les compositions selon des regles de construction syntaxique. Nous de nissons la structure syntaxique de la maniere suivante:

De nition 1 (Structure Syntaxique)

La structure syntaxique est l'organisation des sym-boles du document textuel qui repose sur la composition des symsym-boles formant une arborescence et sur l'encha^nement sequentiel des symboles fournissant l'ordonnancement et donc le sens de la lecture.

La structure linguistique decrit l'agregation et l'encha^nement des symboles du document textuel. Elle represente une arborescence d'elements linguistiques dont l'element racine re-presente le document complet et dont les autres elements rere-presentent des symboles de plus faibles granularites. A un niveau d'abstraction di erent, la structure logique du document textuel decrit l'organisation d'entites dont la granularite est plus grande que celle des ele-ments linguistiques. La encore, il s'agit d'une arborescence dont l'element racine represente le document complet et dont les autres elements representent les entites logiques. Le type de ces entites est contraint par le type du document.

Les relations d'organisation des elements sont similaires dans les deux structures, elles ont les m^emes fonctionnalites et les m^emes proprietes. Ces structures se di erencient par le fait que la structure linguistique est generique alors que la structure logique est contrainte par le type du document considere. Une autre di erence provient de la granularite des elements logiques et linguistiques. On peut en e et considerer que les entites logiques sont composes de symboles du document textuel, c'est a dire qu'un element logique est compose d'elements linguistiques. Nous montrons ceci dans la gure 3.4, en de nissant la structure logique du document comme une vue etendue de l'element racine de la structure linguistique.

Dans la gure 3.4, on combine les deux structures linguistiques et logiques. Dans cette arborescence, la racine de la structure linguistique a ete remplacee par l'arborescence de la structure logique. L'element racine linguistique representait le document complet qui est

do-Structure Linguistique Structure Logique Intégration Relation de composition logique Relation de sequence logique Relation de sequence de transition Relation de composition de transition Relation de sequence linguistique Relation de composition linguistique

oling2 oling3 oling4 oling5

oling1

oling12

oling11 oling31 oling32 oling51 oling52

olog2

olog12

olog11

oracine log olog1

oling2 oling3 oling4 oling5

oling1

oling12

oling11 oling31 oling32 oling51 oling52

olog12 olog11 oracine log olog2 olog1 o racineling

Figure 3.4.

Lien entre structure linguistique et logique: structure syntaxique

renavant represente par l'element racine logique. D'autre part, les elements logiques feuilles sont mis en relation avec les elements linguistiques qui etaient ls directs de la racine linguis-tique. Les relations de sequence entre ces elements ont ete modi ees par rapport a celles de la structure linguistique originale puisqu'ils ne sont plus ls d'un m^eme element dans cette nouvelle arborescence.

Par exemple, les elements linguistiques

o

ling 2 et

o

ling 3 avaient m^eme pere dans la struc-ture linguistique et la relation de sequence linguistique entre ces deux elements existait. Dans la structure syntaxique complete, ces deux elements ne sont plus freres et ne peuvent donc plus admettre de relation de sequence m^eme si leur disposition dans le document textuel n'a pas ete modi ee. Le fait qu'ils se succedent dans le document est etabli par les relations provenant de leurs parents.

Il appara^t donc que la combinaison des structures linguistiques et logiques pour former la structure syntaxique du document textuel requiert la de nition de nouvelles relations:

1. De nition d'un nouvel ensemble d'elements linguistiques excluant la racine.

2. Possibilite de composition d'elements logiques par des elements linguistiques de ce nou-vel ensemble.

3. Nouvelle de nition des relations de sequences sur les elements linguistiques ls directs de l'element racine linguistique.

4. De nition de la compatibilite des types des elements logiques feuilles avec des types linguistiques.

Nous reprenons chacun de ces points en de nissant les elements qui permettent d'etablir la combinaison des structures linguistiques et logiques et qui permettent de construire la structure syntaxique du document.

1. Nous rede nissons donc l'ensemble des elements linguistiques de la structure syntaxique comme un sous-ensemble de l'ensemble des elements linguistiques. Nous notons cet ensemble

OS



ling.

OS



ling =

OS

ling,f

o

racine lingg

2. La relation de composition linguistique permet uniquement des compositions d'elements linguistiques avec des elements linguistiques. De m^eme, la relation de composition lo-gique permet de composer des elements lolo-giques avec d'autres elements lolo-giques. Nous de nissons donc une relation de composition, que nous notons comp trans et que nous appelons relation de composition de transition, qui permet la composition des elements feuilles de la structure logique par des elements linguistiques provenant de l'ensemble

OS



racine ling. Cet ensemble decrit l'ensemble des elements racines de

OS



ling.

Cette relation de composition est donc de nie sur les ensembles

OS

f loget

OS



racine ling

et a les proprietes de non re exivite, de non transitivite et d'asymetrie.:

comp trans

OS

f log

OS



racine ling

La structure logique est une extension de la structure linguistique. Donc chaque element logique feuille doit ^etre rattache a au moins un element linguistique:

8

o

2

OS

f log,9

o

i 2

OS



racine ling tel que

o

comp trans

o

i

3. Considerons maintenant l'ensemble

OS



ling. La non prise en compte de la racine

o

racine ling

entra^ne la non validite des relations de sequence sur ses elements ls. En e et, une relation de sequence existe entre deux elements si ces deux elements sont freres dans l'arborescence linguistique. Comme nous avons supprime leur pere de l'ensemble

OS



ling,

les relations de sequence entre ces elements n'existent pas lorsqu'on applique la relation

seq ling sur

OS



ling.

Nous introduisons une relation de sequence de nie sur leselements de l'ensemble

OS



racine ling,

appelee relation de sequence de transition et noteeseq trans. La contrainte des elements freres se fera avec la relation de composition que nous venons de de nir entre entites lo-giques feuilles et elements linguistiques de l'ensemble

OS



racine ling. La relationseq trans

se de nit par:

seq trans

OS



racine ling

OS



Cette relation est deduite de la relation de sequence linguistique sur l'ensemble

OS

ling, c'est-a-dire que si deux elements linguistiques ls de la racine linguistique sont mis en relation par la relation de sequence linguistique, notee seq ling, et qu'ils ont le m^eme pere parmi les elements logiques feuilles alors ces deux elements sont des successeurs directs selon la relation de sequence notee seq trans.

o

i seq trans

o

j

si

8 > > > > > > < > > > > > > :

o

iseq ling

o

j

et

9

o

log 2

OS

f log tel que

8 > <

> :

o

log comp trans

o

i

et

o

log comp trans

o

j

4. La relation seq trans doit prendre en compte des contraintes liees aux types des ele-ments qui sont mis en relation, c'est-a-dire que nous ne pouvons pas mettre en relation n'importe quel type d'entite logique avec n'importe quel type d'element linguistique. Nous devons donc introduire une relation decrivant le sous-typage des types logiques feuilles par des types linguistiques.

Du fait de la prise en compte de l'ensemble

OS



ling, l'ensemble des types linguistiques est reduit a un ensemble, note

TY PE



ling de ni par:

TY PE



ling =

TY PE

ling,f

t

racine lingg

Cette relation de sous-typage, notee t lien et appelee relation de sous-typage de tran-sition, se de nit de la maniere suivante:

t lien

TY PE

max log

TY PE



ling

La notation

t

i t lien

t

j avec

t

i 2

TY PE

max log et

t

j 2

TY PE

ling signi e que le type logique

t

i est un super-type du type linguistique

t

j, c'est-a-dire qu'un element logique de type

t

i peut ^etre compose d'un element linguistique de type

t

j.

Tout comme les relations t ling et t log de nies respectivement sur les ensembles

TY PE

ling et

TY PE

log, cette relation est non re exive, non transitive et asymetrique. Pour etablir la structure syntaxique du document textuel nous avons considere la structure logique comme une extension de la structure linguistique et nous avons de ni les relations permettant d'etablir la transition entre les arborescences logiques et linguistiques.