• Aucun résultat trouvé

Limites de la construction d’ontologies à partir de textes

Comme nous l’avons vu dans les sections précédentes, les approches à partir de textes fournissent une grande quantité d’informations différentes, pas nécessairement pertinentes ou structurées. Le prix à payer des approches à partir de textes est de définir des moyens de sélectionner et d’exploiter ce volume d’informations jusqu’à obtenir une ontologie. De plus, l’enchaînement nécessaire de ces outils est encore mal défini et produit un « effet tunnel » qui rend le processus difficilement itératif. La maintenance des ontologies construites à partir de textes pose alors un problème de cohérence entre les besoins applicatifs courants et les modèles.

1.5.1 Efforts et raffinement du produit résultant

A cause du contenu des corpus, les ontologies construites à partir de textes ne constituent pas un produit fini et raffiné. En effet, les structures obtenues sont beaucoup plus riches sur le plan terminologique, mais malheureusement moins bien formalisées. On parle alors de brouillon d’ontologie ou d’ontology kick-off [Sure et al., 2003]. Cela justifie la présence de phases de normalisation (où l’on sélectionne les éléments pertinents pour l’application et améliore la structuration) et de formalisation (où l’on traduit le réseau sémantique obtenu dans un langage formel comme OWL) [Aussenac-Gilles et Condamines, 2003] en aval du travail d’extraction de connaissances à proprement parler.

De plus, même si une quantité intéressante de connaissances peut être retrouvée dans les textes, ils ne contiennent pas l’ensemble des connaissances manipulées dans un domaine. Par exemple, beaucoup de définitions sont implicites, et la connaissance générale n’est habi- tuellement pas présente dans les documents. Cette connaissance peut être intégrée dans la phase de formalisation, en raccrochant les connaissances apprises des textes à une ontologie formelle générale. Il s’agit là d’un des principaux atouts des ontologies formelles telles que DOLCE [Gangemi et al., 2002]. En effet, ces ontologies disposent de concepts d’un très haut niveau d’abstraction qui ne sont généralement pas présents dans les textes, et donc dans une ontologie construite à partir de textes. Les utiliser lors de la formalisation permet de corriger cet aspect et d’améliorer la réutilisation.

1.5. Limites de la construction d'ontologies à partir de textes

domaine qui pourront critiquer ce qui a été produit ou aider à interpréter les informations tirées des textes. Ainsi, l’intervention d’un expert permet d’enrichir, corriger et améliorer la structure de connaissances. Il est donc important d’adopter une approche incrémentale même pendant l’extraction de connaissances afin de pouvoir compléter progressivement la structure avant même les phases de normalisation et de formalisation.

1.5.2 La maintenance : un problème mal géré

Un des arguments en faveur de la construction d’ontologies à partir de textes est d’améliorer la maintenance des modèles obtenus [Aussenac-Gilles et Condamines, 2003]. En effet, lorsque le modèle conserve un lien vers les textes utilisés, ceux-ci fournissent des informations qui justifient la manière dont les connaissances ont été modélisées. Ils servent de documentation du modèle et, a priori, facilitent la maintenance. D’autres éléments importants à conserver sont les critères et principes d’organisation des concepts ainsi que la justification de la sémantique des relations définies.

Même lorsque le modèle est documenté, la maintenance n’en reste pas moins délicate [Aussenac-Gilles et Condamines, 2003] : il est souvent difficile de retrouver la logique de l’analyste qui a choisi d’organiser les concepts d’une certaine façon, ou encore de savoir comment une évolution du domaine ou des besoins liés à l’application doivent se répercu- ter sur l’ontologie. Si on se réfère aux textes comme indicateurs de l’évolution des connais- sances ou de la terminologie du domaine, le problème revient à savoir comment prendre en compte de nouveaux textes, comment les traiter (séparément ou avec les premiers textes), puis comment intégrer les connaissances extraites de ces textes dans la structure existante.

Aujourd’hui, les ontologies sont vues comme des structures figées, relativement stables, décrivant des définitions consensuelles et fixées. Implicitement, on s’attendrait donc à ce qu’elles nécessitent une maintenance réduite. Or pratiquement, en particulier dans les cas de domaines spécialisés innovants et évoluant rapidement, certaines ontologies doivent régulièrement être revues, surtout au niveau terminologique. On peut aussi expliquer cette nécessité par le fait que beaucoup d’ontologues ne respectent pas de critères ontologiques et construisent plutôt des réseaux sémantiques hiérarchisés. Dans ce contexte, le scénario de construction de l’ontologie et celui de maintenance gagneraient à être envisagés de manière cohérente [Horrocks, 2005]. Ainsi, on peut se demander si les mêmes outils sont utilisables pour ces deux phases, et le prévoir dès la construction de l’ontologie.

Dans ce même objectif de cohérence, une vision alternative commence à émerger en s’ap- puyant sur des logiciels de traitement automatique des langues et de techniques d’appren- tissage. Cette tendance vise à construire le plus automatiquement possible des structures plus proches de réseaux terminologiques et donc moins complexes à élaborer [Maedche et Staab, 2000a; Maedche, 2002]. Ces structures, moins formelles, sont souvent suffisantes pour des applications comme la recherche d’information, l’indexation de documents ou la gestion des connaissances (contrairement à la communication entre agents, par exemple). Dans ce cas, la construction devrait sûrement être envisagée comme un cas particulier de mainte- nance. En effet, cela revient à effectuer la maintenance d’une structure initialement vide. À

Vers les ontologies dynamiques

notre connaissance, aucun outil n’a été développé dans cette optique.