3.3 Méta-modèles proposés
3.3.2 Notre méta-modèle de Topic Maps
Notre méta-modèle de Topic Map (figure 3.8) est une extension du modèle de Topic
Map déjà défini, il présente l‟originalité d‟intégrer trois nouvelles notions qui n‟étaient pas
explicitement présentes dans le modèle des Topic Maps [Ellouze et al. 2009a] [Ellouze et al.
2009c], les principes de base de notre méta-modèle se résument comme suit :
- Préciser et enrichir la sémantique des liens d’une Topic Map. En plus des
liens d‟occurrences déjà existants dans le modèle des Topic Maps, nous séparons
la définition des associations eu deux types : les liens ontologiques et les liens
d‟usage ;
- Définir des méta-propriétés associées aux Topics. Une méta-propriété qui
renseigne sur l‟importante du Topic au cours du temps et une méta-propriété qui
indique le niveau auquel appartient un Topic. En effet, notre idée consiste à
classifier et organiser la Topic Map en niveaux : en plus des deux niveaux
(niveau Topic et niveau ressources) déjà défini dans le modèle, nous séparons la
couche Topic en deux sous couches, la première du niveau le plus haut contenant
les Topics thèmes et les Topics questions et la deuxième sous couche contenant
les Topics concepts du domaine, des instances de Topics, des sous Topics, des
synonymes de Topics, ou des synonymes d‟instances de Topics ou de sous
Topics ;
- Indexer un Topic par un fragment de document au lieu du document en entier
100
méta-modèle du référentiel que nous définissons dans la section suivante et la
segmentation thématique des documents sources.
T o p ic M ap C o n st r u ct C h ar a c t er i st i c M ap I t e m T o p i c M a p T o p i c A ss o ci a t io n * * * H as Lo c a t o r * A ss o ci a t io n R o l e T o p ic N am e O c c u r e n c e V a r i a n te N am e * R es so u r c e 1 Su b je ct I de nt i fi er * T o p ic M ap C o n st r u ct C h ar a c t er i st i c M ap I t e m T o p i c M a p T o p i c A ss o ci a t io n * * * H as Lo c a t o r * A ss o ci a t io n R o l e T o p ic N am e O c c u r e n c e V a r i a n te N am e * R es so u r c e 1 Su b je ct I de nt i fi er *
Metapropterty Ontological association Usage association Thematic segment
1
*
Layer 1 Topic Layer 3 Topic Layer 2 Topic
Figure 3.8 Notre méta-modèle de Topic Maps
3.3.2.1 Classification des liens dans la Topic Map
Le modèle des Topic Maps ne permet pas de faire la différence entre les liens dans une
Topic Map, ils sont tous représentés comme des associations (« est un », « réalisé par », « a
un effet sur », « partie de »…). Tel qu‟il est mentionné dans [Pepper, 2008], il n‟y a pas de
limitation dans la définition des liens dans une Topic Map, ils sont spécifiés par le créateur de
la Topic Map selon les besoins en information, les connaissances véhiculées par la Topic Map
ainsi que l‟application à laquelle elle est destinée.
Pour répondre à nos objectifs liés à l‟organisation des documents pour en améliorer la
recherche, nous proposons de classifier les liens dans la Topic Map.
Dans le cas général, la classification de liens sémantiques entre concepts ou termes a
fait l‟objet de plusieurs résultats de recherche. A titre d‟exemple, nous citons la classification
proposée par le ANSI (American National Standards Institute) dans le ANSI/NISO
Z39.19-2005. Cette dernière considère trois catégories de liens : (1) les liens « d‟équivalence » telles
que la synonymie et la quasi-synonymie ; (2) les liens hiérarchiques telles que la
spécialisation et la généralisation et (3) les autres liens (nommés «associatifs ») tels que le lien
« cause/effet » et le lien « action/cible ». Comme autre exemple de classification, nous citons
l‟ontologie proposée dans [Storey et Sandeep, 2004] pour la catégorisation des relations
représentées par les verbes dans les phrases d‟un texte.
Dans notre méta-modèle de Topic Map, nous catégorisons les liens entre Topics en
deux catégories [Ellouze et al. 2009a] :
101
a) les liens ontologiques et structurels qui regroupent les liens de spécialisation,
les liens de composition ainsi que les liens associatifs, tels que ceux définis dans
le standard (ANSI/NISO Z39.19-2005), que nous identifions suite à l‟analyse des
documents à organiser ;
b) les liens d’usage définis comme des hyper liens de type « répond à » (hyper lien
questions/réponses) entre la question représentée comme un Topic et les
réponses associées, c'est-à-dire les Topics référençant les documents qui
permettent de répondre à la question. Nous proposons dans ce contexte de relier
la question à chacun des mots clés la constituant via un hyper lien de type « est
composé de » qui lui aussi est considéré comme un lien d‟usage.
3.3.2.2 Organisation de la Topic Map en niveaux
Dans le modèle des Topic Maps, tel qu‟il a été conçu, tout peut être représenté comme
un Topic (un concept du domaine, un terme, une instance d‟un concept). Ces Topics sont très
souvent mélangés et mal organisés, le modèle des Topic Maps propose d‟organiser la Topic
Map en deux couches, une couche Topic qui contient les connaissances du domaine et une
couche ressources, des travaux tels que [Dicheva et Dichev, 2006] proposent en plus de la
couche ressource, de différencier le niveau Topic en deux sous niveaux, les Topics
représentant les concepts du domaine et les Topics représentant les instances.
Dans notre méta-modèle de Topic Map, nous proposons d‟organiser la Topic Map en
trois niveaux :
- Le niveau 1 contient les Topics thèmes représentant les thèmes du domaine et
les Topics questions représentant les questions types et éventuellement les
réponses adéquates identifiées à partir de l‟analyse d‟un ensemble de sources
d‟interrogation, pour notre cas, nous avons choisi les FAQ ;
- Le niveau 2 englobe les Topics qui représentent les concepts du domaine, les
Topics instances de ces concepts, les sous Topics ainsi que les Topics
synonymes d‟un concept ou synonyme d‟une instance d‟un concept ;
- Le niveau 3 contient les ressources c'est-à-dire l‟ensemble des documents
textuels disponibles en différentes langues ainsi que les sources d‟interrogation
représentées par les FAQ.
102
Figure 3.9 Architecture générale de la Topic Map selon notre méta-modèle
3.3.2.3 Les métadonnées d’un Topic
Pour l‟implémention des différentes couches (layers) de la Topic Map, nous proposons
de définir une première métadonnée attribuée aux Topics qui renseigne sur le niveau
auquel appartient le Topic en question, c'est-à-dire si le Topic est un thème ou une question,
alors ce dernier appartient au premier niveau sinon, si le Topic est un concept du domaine,
une instance ou un synonyme d‟un Topic alors ce dernier appartient au deuxième niveau de la
Topic Map.
Nous définissions également dans notre méta-modèle une deuxième métadonnée qui
renseigne sur le degré de popularité ou l’usage du Topic c'est-à-dire si le Topic est peu
demandé, moyennement demandé ou trop demandé par les utilisateurs, cette métadonnée nous
servira particulièrement dans le processus d‟élagage évolutif de la Topic Map et entre autres
pour la mesure de la qualité de la Topic Map, elle est définie comme la note du Topic qui peut
augmenter ou diminuer au cours du temps. Nous explicitons cette idée dans le chapitre 5
consacré à la qualité de la Topic Map.
Actuellement, dans nos travaux de recherche, nous avons défini deux types de
métadonnées, dans nos travaux futurs, nous étudierons la possibilité de généraliser la notion
de métadonnée aux autres concepts tels que le concept d‟association.
103
3.3.2.4 Indexation de Topic par un fragment de document
Le modèle des Topic Maps tel qu‟il a été défini ne permet pas d‟indexer un Topic par
un fragment de document. Or, dans le cas de document de grande taille, lorsque l‟utilisateur
accède à ce document, il doit alors parcourir la totalité du document pour retrouver le sujet ou
le thème qu‟il recherche. Pour cela, nous proposons un méta-modèle pour la représentation
du contenu textuel multilingue sous la forme d‟un référentiel de documents pour compléter le
méta-modèle de Topic Map. En effet, les documents du référentiel sont segmentés
thématiquement et puis indexés par une liste de termes et de concepts représentatifs de leur
contenu. Nous aurons alors, en plus des documents, leurs segments thématiques et grâce au
méta-modèle du référentiel, un Topic peut être relié à un fragment du document au lieu du
document en entier.
En résumé, comme le montre la figure 3.9, les principaux éléments de notre Topic Map
fondée sur le méta-modèle de Topic Map que nous avons défini sont :
- Les nœuds qui représentent les Topics (thèmes, questions, concepts du domaine,
instances de Topics, sous Topics), les documents et les segments de documents ;
- Les arcs typés et pondérés qui représentent les liens ou associations, ces liens
sont de différents types :
Des liens ontologiques qui regroupent : (i) Des liens entre deux Topics,
ces liens peuvent être de type « est un », « partie de » ou un lien associatif
tel que le lien « réalisé par » entre « chauffage solaire » et « capteur
solaire » identifié suite à l‟analyse linguistique des documents sources ; (ii)
Des liens entre un Topic et ses instances ; et des liens de similarité entre les
Topics ;
Des liens d’usage qui regroupent : L‟hyper lien « répond à » entre le Topic
qui représente la question et les Topics réponses à cette question, extraites
à partir des FAQ et l‟hyper lien « composé de » entre le Topic qui
représente une question et les Topics qui représentent les mots clés qui la
compose ;
Des liens d’occurrences qui regroupent : (i) Des liens reliant un Topic aux
documents ou aux segments de documents qu‟il indexe. Ces liens sont
étiquetés par le degré de pertinence (tof×idf) du Topic dans le document
(ou segment de document) ; (ii) Des liens entre termes et documents ou
104
segments de documents. Ces liens sont étiquetés par le degré de pertinence
(tf×idf) de chaque terme dans le document (ou segment de document).
Dans le chapitre 4, nous expliquons en détail les démarches et les techniques que nous
proposons pour implémenter les différents composants de notre méta-modèle en particulier les
mesures (tof×idf) et (tf×idf). Dans la section suivante, nous décrivons notre méta-modèle de
référentiel de documents.
Dans le document
Approche de recherche intelligente fondée sur le modèle des Topic Maps : application au domaine de la construction durable
(Page 100-105)