• Aucun résultat trouvé

3.3 Méta-modèles proposés

3.3.2 Notre méta-modèle de Topic Maps

Notre méta-modèle de Topic Map (figure 3.8) est une extension du modèle de Topic

Map déjà défini, il présente l‟originalité d‟intégrer trois nouvelles notions qui n‟étaient pas

explicitement présentes dans le modèle des Topic Maps [Ellouze et al. 2009a] [Ellouze et al.

2009c], les principes de base de notre méta-modèle se résument comme suit :

- Préciser et enrichir la sémantique des liens d’une Topic Map. En plus des

liens d‟occurrences déjà existants dans le modèle des Topic Maps, nous séparons

la définition des associations eu deux types : les liens ontologiques et les liens

d‟usage ;

- Définir des méta-propriétés associées aux Topics. Une méta-propriété qui

renseigne sur l‟importante du Topic au cours du temps et une méta-propriété qui

indique le niveau auquel appartient un Topic. En effet, notre idée consiste à

classifier et organiser la Topic Map en niveaux : en plus des deux niveaux

(niveau Topic et niveau ressources) déjà défini dans le modèle, nous séparons la

couche Topic en deux sous couches, la première du niveau le plus haut contenant

les Topics thèmes et les Topics questions et la deuxième sous couche contenant

les Topics concepts du domaine, des instances de Topics, des sous Topics, des

synonymes de Topics, ou des synonymes d‟instances de Topics ou de sous

Topics ;

- Indexer un Topic par un fragment de document au lieu du document en entier

100

méta-modèle du référentiel que nous définissons dans la section suivante et la

segmentation thématique des documents sources.

T o p ic M ap C o n st r u ct C h ar a c t er i st i c M ap I t e m T o p i c M a p T o p i c A ss o ci a t io n * * * H as Lo c a t o r * A ss o ci a t io n R o l e T o p ic N am e O c c u r e n c e V a r i a n te N am e * R es so u r c e 1 Su b je ct I de nt i fi er * T o p ic M ap C o n st r u ct C h ar a c t er i st i c M ap I t e m T o p i c M a p T o p i c A ss o ci a t io n * * * H as Lo c a t o r * A ss o ci a t io n R o l e T o p ic N am e O c c u r e n c e V a r i a n te N am e * R es so u r c e 1 Su b je ct I de nt i fi er *

Metapropterty Ontological association Usage association Thematic segment

1

*

Layer 1 Topic Layer 3 Topic Layer 2 Topic

Figure 3.8 Notre méta-modèle de Topic Maps

3.3.2.1 Classification des liens dans la Topic Map

Le modèle des Topic Maps ne permet pas de faire la différence entre les liens dans une

Topic Map, ils sont tous représentés comme des associations (« est un », « réalisé par », « a

un effet sur », « partie de »…). Tel qu‟il est mentionné dans [Pepper, 2008], il n‟y a pas de

limitation dans la définition des liens dans une Topic Map, ils sont spécifiés par le créateur de

la Topic Map selon les besoins en information, les connaissances véhiculées par la Topic Map

ainsi que l‟application à laquelle elle est destinée.

Pour répondre à nos objectifs liés à l‟organisation des documents pour en améliorer la

recherche, nous proposons de classifier les liens dans la Topic Map.

Dans le cas général, la classification de liens sémantiques entre concepts ou termes a

fait l‟objet de plusieurs résultats de recherche. A titre d‟exemple, nous citons la classification

proposée par le ANSI (American National Standards Institute) dans le ANSI/NISO

Z39.19-2005. Cette dernière considère trois catégories de liens : (1) les liens « d‟équivalence » telles

que la synonymie et la quasi-synonymie ; (2) les liens hiérarchiques telles que la

spécialisation et la généralisation et (3) les autres liens (nommés «associatifs ») tels que le lien

« cause/effet » et le lien « action/cible ». Comme autre exemple de classification, nous citons

l‟ontologie proposée dans [Storey et Sandeep, 2004] pour la catégorisation des relations

représentées par les verbes dans les phrases d‟un texte.

Dans notre méta-modèle de Topic Map, nous catégorisons les liens entre Topics en

deux catégories [Ellouze et al. 2009a] :

101

a) les liens ontologiques et structurels qui regroupent les liens de spécialisation,

les liens de composition ainsi que les liens associatifs, tels que ceux définis dans

le standard (ANSI/NISO Z39.19-2005), que nous identifions suite à l‟analyse des

documents à organiser ;

b) les liens d’usage définis comme des hyper liens de type « répond à » (hyper lien

questions/réponses) entre la question représentée comme un Topic et les

réponses associées, c'est-à-dire les Topics référençant les documents qui

permettent de répondre à la question. Nous proposons dans ce contexte de relier

la question à chacun des mots clés la constituant via un hyper lien de type « est

composé de » qui lui aussi est considéré comme un lien d‟usage.

3.3.2.2 Organisation de la Topic Map en niveaux

Dans le modèle des Topic Maps, tel qu‟il a été conçu, tout peut être représenté comme

un Topic (un concept du domaine, un terme, une instance d‟un concept). Ces Topics sont très

souvent mélangés et mal organisés, le modèle des Topic Maps propose d‟organiser la Topic

Map en deux couches, une couche Topic qui contient les connaissances du domaine et une

couche ressources, des travaux tels que [Dicheva et Dichev, 2006] proposent en plus de la

couche ressource, de différencier le niveau Topic en deux sous niveaux, les Topics

représentant les concepts du domaine et les Topics représentant les instances.

Dans notre méta-modèle de Topic Map, nous proposons d‟organiser la Topic Map en

trois niveaux :

- Le niveau 1 contient les Topics thèmes représentant les thèmes du domaine et

les Topics questions représentant les questions types et éventuellement les

réponses adéquates identifiées à partir de l‟analyse d‟un ensemble de sources

d‟interrogation, pour notre cas, nous avons choisi les FAQ ;

- Le niveau 2 englobe les Topics qui représentent les concepts du domaine, les

Topics instances de ces concepts, les sous Topics ainsi que les Topics

synonymes d‟un concept ou synonyme d‟une instance d‟un concept ;

- Le niveau 3 contient les ressources c'est-à-dire l‟ensemble des documents

textuels disponibles en différentes langues ainsi que les sources d‟interrogation

représentées par les FAQ.

102

Figure 3.9 Architecture générale de la Topic Map selon notre méta-modèle

3.3.2.3 Les métadonnées d’un Topic

Pour l‟implémention des différentes couches (layers) de la Topic Map, nous proposons

de définir une première métadonnée attribuée aux Topics qui renseigne sur le niveau

auquel appartient le Topic en question, c'est-à-dire si le Topic est un thème ou une question,

alors ce dernier appartient au premier niveau sinon, si le Topic est un concept du domaine,

une instance ou un synonyme d‟un Topic alors ce dernier appartient au deuxième niveau de la

Topic Map.

Nous définissions également dans notre méta-modèle une deuxième métadonnée qui

renseigne sur le degré de popularité ou l’usage du Topic c'est-à-dire si le Topic est peu

demandé, moyennement demandé ou trop demandé par les utilisateurs, cette métadonnée nous

servira particulièrement dans le processus d‟élagage évolutif de la Topic Map et entre autres

pour la mesure de la qualité de la Topic Map, elle est définie comme la note du Topic qui peut

augmenter ou diminuer au cours du temps. Nous explicitons cette idée dans le chapitre 5

consacré à la qualité de la Topic Map.

Actuellement, dans nos travaux de recherche, nous avons défini deux types de

métadonnées, dans nos travaux futurs, nous étudierons la possibilité de généraliser la notion

de métadonnée aux autres concepts tels que le concept d‟association.

103

3.3.2.4 Indexation de Topic par un fragment de document

Le modèle des Topic Maps tel qu‟il a été défini ne permet pas d‟indexer un Topic par

un fragment de document. Or, dans le cas de document de grande taille, lorsque l‟utilisateur

accède à ce document, il doit alors parcourir la totalité du document pour retrouver le sujet ou

le thème qu‟il recherche. Pour cela, nous proposons un méta-modèle pour la représentation

du contenu textuel multilingue sous la forme d‟un référentiel de documents pour compléter le

méta-modèle de Topic Map. En effet, les documents du référentiel sont segmentés

thématiquement et puis indexés par une liste de termes et de concepts représentatifs de leur

contenu. Nous aurons alors, en plus des documents, leurs segments thématiques et grâce au

méta-modèle du référentiel, un Topic peut être relié à un fragment du document au lieu du

document en entier.

En résumé, comme le montre la figure 3.9, les principaux éléments de notre Topic Map

fondée sur le méta-modèle de Topic Map que nous avons défini sont :

- Les nœuds qui représentent les Topics (thèmes, questions, concepts du domaine,

instances de Topics, sous Topics), les documents et les segments de documents ;

- Les arcs typés et pondérés qui représentent les liens ou associations, ces liens

sont de différents types :

Des liens ontologiques qui regroupent : (i) Des liens entre deux Topics,

ces liens peuvent être de type « est un », « partie de » ou un lien associatif

tel que le lien « réalisé par » entre « chauffage solaire » et « capteur

solaire » identifié suite à l‟analyse linguistique des documents sources ; (ii)

Des liens entre un Topic et ses instances ; et des liens de similarité entre les

Topics ;

Des liens d’usage qui regroupent : L‟hyper lien « répond à » entre le Topic

qui représente la question et les Topics réponses à cette question, extraites

à partir des FAQ et l‟hyper lien « composé de » entre le Topic qui

représente une question et les Topics qui représentent les mots clés qui la

compose ;

Des liens d’occurrences qui regroupent : (i) Des liens reliant un Topic aux

documents ou aux segments de documents qu‟il indexe. Ces liens sont

étiquetés par le degré de pertinence (tof×idf) du Topic dans le document

(ou segment de document) ; (ii) Des liens entre termes et documents ou

104

segments de documents. Ces liens sont étiquetés par le degré de pertinence

(tf×idf) de chaque terme dans le document (ou segment de document).

Dans le chapitre 4, nous expliquons en détail les démarches et les techniques que nous

proposons pour implémenter les différents composants de notre méta-modèle en particulier les

mesures (tof×idf) et (tf×idf). Dans la section suivante, nous décrivons notre méta-modèle de

référentiel de documents.