• Aucun résultat trouvé

Perspectives dans le domaine de l’ingénierie des connaissances

4.1.1 Le dossier médical

Comme nous l’avons vu précédemment (cf.. chap. 3, § 2.4), le dossier médical en tant que tel nécessite la mise en perspectives d’un certain nombre de réflexions. Nous allons les reprendre ici :

Une sémantique hypertextuelle. Alors que la sémantique textuelle étudie le sens des mots au regard de leur position dans une unité textuelle – e.g. la phrase –, la sémantique hypertextuelle va étudier le sens des documents au regard de leur position dans le réseau hypertextuel. Les balises SGML définissant une syntaxe pour cette sémantique, la sémantique hypertextuelle définit quelles sont les trans- formations structurelles qui ont du sens. Par exemple, construire dynamiquement une table de tous les éléments balisés « facteur de risque » dans un dossier médical peut avoir du sens. C’est en suivant cette direction qu’un premier travail a été fait sur les documents de navigation.

Des annotations. Les capacités d’annotation sont d’une importance primordiale et donc disponibles dans la plupart des logiciels traitant des textes. En effet, et c’est vrai pour les hypertextes, ces significations – i.e. lectures – personnelles sont la condi- tion de la légitimité qu’acquiert le système vis-à-vis de son utilisateur et de la tâche pour laquelle il est prévu. Comme pour les documents de synthèse précé- dents, mais ici à la destination d’un seul utilisateur, il faut savoir quelles transfor- mations structurelles (organisations hiérarchiques, agrégation d’annotations, etc.) sont légitimes. Ces transformations sont théorisées dans dans le cadre d’une sé-

mantique hypertextuelle annotationnelle et rejoignent la question des annotations

pour le Web sémantique.

Le lien avec le TALM Le traitement automatique du langage médical (TALM) est, comme nous l’avons déjà vu, le compagnon naturel de l’approche documentaire : interve- nant, dans ce contexte, pour identifier des portions de texte ayant des significa- tions spécifiques, il est le moyen de passer de connaissances contextuelles non formalisées, les textes, à des connaissances formelles, par exemple les ontologies. Nous avons aussi vu qu’il permet d’envisager de nouveaux modes de navigation dans les documents mais de nombreux travaux restent à lancer pour mettre en œuvre ce qui n’est aujourd’hui que des perspectives de recherche.

4.1.2 Les ontologies

Nous avons longuement développé les tenants et les aboutissants des ontologies. Mais pour que celles-ci soient pleinement opérationnelles, un certain nombre de re- cherches sont encore nécessaires. Citons :

L’intégration globale d’une méthodologie de construction. Nous avons vu une mé- thodologie de construction des ontologies fondée sur des réflexions épistémolo- giques. En amont, nous avons défendu, dans une première étape, l’intérêt d’outils de TAL pour analyser les corpus nécessaires à l’élaboration des ontologies. En aval, nous avons abordé la questions des outils formels de spécification des onto- logies. Ces étapes sont cohérentes les unes par rapport aux autres et il existe des outils prenant chacune d’elles en charge. Mais il n’existe pas d’outils les prenant en charge de façon globale et cohérente, en particulier entre les analyses de corpus produisant des réseaux terminologiques et les éditeurs d’ontologies supportant les méthodologies de construction. Ils restent encore à développer et font l’objet de projets en soumission à ce jour.

La maintenance et la fusion d’ontologies. Le Web sémantique est demandeur d’in- teropérabilité mais la médecine aussi. Or, il est bien possible qu’on ne puisse pas se mettre d’accord sur des ontologies couvrant des domaines entiers, que ce soit pour la médecine ou d’autres domaines. Par ailleurs, et particulièrement en méde- cine, les ontologies représentent des connaissances stabilisées dans des domaines évoluant rapidement. La question de l’évolution, la comparaison ou la fusion d’on- tologies doit être posée dans le but de ramener des réponses satisfaisantes. Thésaurus sémantiques et serveurs de terminologie. Les thésaurus sémantiques et

les serveurs de terminologie qui associent thésaurus et ontologie, le second étant le squelette conceptuel du premier, partagent les mêmes buts, à savoir fournir une représentation normalisées des documents textuels impliqués dans le processus. Dans le domaine de la RI, cela est fait dans un but d’indexation. Dans le domaine

médical14, un des usages importants est de fournir une représentation normalisée

des données d’un patient à partir d’une description textuelle faisant déjà usage des termes du thésaurus. En collaboration avec des techniques du TALM (cf. 4.1.3), il permet de construire cette représentation pour des tâches de codage ou d’ex- trait de données cliniques. Si les technologies sont maintenant au point, les outils n’en sont, encore ici, qu’à leurs balbutiements. L’avenir et la diffusion de telles recherche passe probablement par le développement d’une plate-forme « serveur de terminologie » : à destination des professionnels des domaines dans lesquels elle serait développée – e.g. médecine ou droit – elle permettrait de leur fournir un certain nombre de services terminologiques et servirait aux chercheurs en retour à tester et valider leur recherche.

Langages de description et raisonneurs. Pour représenter les ontologies et raisonner avec, les principaux langages sont les graphes conceptuels et les logiques de des- cription. Ces dernières semblant prendre le dessus en raison du choix des ins- tances pilotant le développement du Web sémantique, grand pourvoyeur de projets ontologiques et de propositions de normes. Mais les choses ne sont pas si simple ; une ontologie contient une organisation hiérarchique des concepts mais aussi les propriétés associées qui doivent s’hériter ainsi que des connaissances inféren- tielles. Un ensemble un peu complexe n’est, si on n’y prend garde, pas calculable. Le choix d’un langage de représentation des ontologies puis d’un raisonneur qui agit dessus est la recherche d’un délicat équilibre entre puissance d’expression et calculabilité. Bien que ces choix puissent être de notre ressort, les travaux de nor- malisation autour des langages du Web sémantique vont probablement s’imposer à nous.

4.1.3 La représentation des connaissances médicales

Nous avons développé dans ce mémoire l’intérêt d’approches textuelles semi-structurées permettant de conserver le contexte d’expression des connaissances. À l’opposé, des ob- jets formels sont nécessaires pour automatiser un certain nombre de tâches. Le noyau de cette formalisation étant les ontologies.

Par rapport à l’accès aux connaissances semi-structurées et le travail avec le dos- sier hypertextuel, nous avons déjà souligné la nécessité de réflexions autour d’une

sémantique hypertextuelle et le possible outillage des réponses dans le contexte du

Web sémantique avec ce que nous avons appelé des métadonnées objectives et des

métadonnées subjectives. D’autres travaux nous ont aussi amener à réfléchir à l’appré-

hension des documents textuels en lien avec les images (projet HOSPIMAGE – <http:

//www.biomath.jussieu.fr> / « projets ») mais beaucoup reste à faire dans ce do- maine.

4 – Des perspectives de recherche 103 Quant au nécessaire lien entre une représentation semi-structurée et une représen- tation formelle (ontologie) il est du ressort de travaux en TALM (cf. § 4.1.1). Dans ce contexte, il s’agit d’être en mesure de mettre en relation la forme externe des énoncés (texte libre) et une représentation de leur contenu.

4.1.4 À propos du Web sémantique

Le Web sémantique n’est pas une solution à tous les problèmes de la gestion des connaissances médicales mais on a pu constater (cf. les chap.-§ 3-5, 4-7 et 5-6.2) que les problématiques abordées jusqu’ici pour les différentes composantes de la gestion des connaissances médicales rencontraient le Web sémantique dans la plupart de ses dimensions. Ainsi, la plupart des thèmes de travail de l’action spécifique « Web séman- tique » (cf. note11, p. 41) – les langages, les ontologies, les métadonnées, l’intégration de sources d’information, les services – ont des résonances en médecine.

Ceci étant, s’il n’est pas question de rechercher dans le Web sémantique toutes les solutions à nos problèmes, nous pouvons profiter, en médecine, à la fois des effets sur la normalisation d’un certain nombre de langages et des recherches plus fondamentales qui s’y développeront dans de nombreux champs thématiques (cf. supra). Les bénéfices attendus sont symétriques : d’un côté, le développement d’une vue globale de la gestion des connaissances médicales au sein du paradigme du Web sémantique, d’un autre côté, une participation de l’informatique médicale à la réalisation de ce même Web sémantique en médecine (Kamel Boulos et al., 2001).