• Aucun résultat trouvé

Comme le montre le tableau 4.1, les syntagmes extraits des corpus constituent un ensemble très hétérogène. Par conséquent, nous avons choisi de n’examiner que les noms et les syntagmes nominaux car nous pensons qu’ils véhiculent les connaissances nécessaires à l’identification des objets du domaine. Nous choisissons donc d’ignorer, pour l’instant, la sémantique portée par les autres catégories grammaticales.

SYNTEX extrait 54 547 syntagmes nominaux sur l’ensemble de nos deux corpus de référence.

La quantité, sans être énorme, est suffisamment conséquente pour qu’un premier tri s’impose. Ainsi, nous allons éliminer un certain nombre de syntagmes inappropriés :

1. les syntagmes contenant des chiffres : 1 cp x3, Température à 37 ˚, 4ème cure . . .

2. les syntagmes qui contiennent des caractères qui ne font pas partie de l’alphabet : air à %, Saturation à 97 %, météorisme +++ . . .

11Il s’agit de la présence d’air ou de gaz dans la cavité pleurale qui peut être spontanée ou provoquée artificielle-

ment.

12Il s’agit d’un épanchement de chyle dans la cavité pleurale, à la suite de la perforation traumatique ou tumorale

du canal thoracique.

13Il s’agit de la difficulté de respirer accompagnée d’une sensation d’oppression ou de gêne.

14La spirométrie est une méthode servant à mesurer la fonction ou la capacité pulmonaire et à la comparer à la

fonction pulmonaire moyenne d’une personne de race, de taille, de poids et d’âge identiques. Sur base de cette com- paraison, on déterminera si le patient présente une affection pulmonaire et de quel type d’affection il est question.

Adj Adjectif veineux

Adv Adverbe totalement

Ppa Participe passé diagnostiqué

NomPr Nom propre TAXOTERE

Nom Nom dilatation

V Verbe hospitaliser

SAdj Syntagme adjectival favorable sous antibiothérapie

SNom Syntagme nominal auscultation pulmonaire

SPpa Syntagme participial observé à l’échographie

SV Syntagme verbal débuter un traitement

TAB. 4.1 – Exemples de syntagmes extraits par SYNTEXsur le corpus [CRH].

3. les termes vides : point de vue, date, probabilité . . . Ce sont des termes qui apparaissent dans les corpus de référence avec une certaine fréquence et qui ne sont pas des termes du domaine. Ils n’apportent pas d’informations intéressantes pour la modélisation.

4. les syntagmes contenant plusieurs lettres en majuscules sont examinés manuellement avec soin : les syntagmes comme par exemple Unité du Service de Médecine Interne ne nous intéressent pas, par contre, nous souhaitons garder les noms de médicaments comme dans cure de TAXOTEREet les abréviations comme dans mesure de la CPT.

Nous obtenons une liste réduite de syntagmes nominaux. Des expérimentations ont été menées dans (Lame, 2002) pour différencier les syntagmes nominaux susceptibles d’être des termes du domaine de ceux qui ne le seraient pas. Ces expériences reposent sur la mise en œuvre de techniques statistiques fondées sur les indices classiques de pondération de termes. Comme le dit G. Lame, ces expérimentations se sont soldées par des échecs. On peut ainsi en conclure que l’identification des termes du domaine doit se faire manuellement.

En pratique, nous distinguons deux étapes dans la sélection des candidats termes du domaine. Nous étudions les sorties de SYNTEX-UPERY sur le corpus [CRH]. Le travail est manuel et s’appuie sur les fonctionnalités de TERMONTO.

1. Nous parcourons l’ensemble des résultats fournis par l’analyse syntaxique et choisissons d’étudier, en premier lieu, les syntagmes nominaux dont la fréquence d’apparition en cor- pus est supérieure à 12 (2 % du corpus). Nous repérons les grands axes conceptuels ty- piques du corpus et donc du domaine représenté. À chaque candidat terme, nous associons un critère de validité qui agit comme un filtre dans TERMONTO. Ce critère, comme le montre la figure 4.7, est compris dans un intervalle allant de 1 à 6, correspondant à l’un des axes conceptuels :

– 1 : permet de regrouper les candidats termes non pertinents appartenant à l’axe Autres, – 2 : est réservé aux candidats termes déjà modelisés dans l’ontologie,

– 3 : permet de regrouper les candidats termes appartenant à l’axe Signes/Symptômes, – 4 : permet de regrouper les candidats termes appartenant à l’axe Pathologies, – 5 : permet de regrouper les candidats termes appartenant à l’axe Qualificatif,

5 – Mise en œuvre des principes différentiels 97

Descendants en tête Descendants en expansion Voisins en tête Voisins en expansion Épanchement pleural

droit

Lame d’épanchement pleural Lésions Liquide Épanchement pleural liquidien Récidive d’épanchement pleural Infection Infiltrats Épanchement pleural de la grande cavité

Lier la dyspnée à l’épanche- ment pleural

Signes Décompensation

TAB. 4.2 – Exemple de résultats du rapprochement contextuel pour le syntagme nominal Epan- chement pleural.

– 6 : permet de regrouper les candidats termes appartenant à l’axe Traitements/Examens. Par exemple, nous fixons à 6 le critère de validité pour tous les candidats termes de ce dernier axe - e.g. examen, doppler, radiographie, etc. Au début du processus, tous les can- didats termes ont un critère de validité égale à 1 et à la fin égale à 2 car ils sont, en principe, tous définis dans l’ontologie. Les critères de validité 3, 4, 5 et 6 sont utilisés temporaire- ment durant la phase de construction. Ces regroupements permettent une première phase de travail sur les rapprochements des candidats termes par contexte. La sélection par cri- tère de validité laisse 35 % des candidats termes sur lesquels élaborer le cœur de notre ontologie.

2. Rappelons que l’analyse distributionnelle rapproche deux à deux les termes partageant les mêmes contextes (descendants en tête et en expansion). Comme cette analyse est sy- métrique, elle rapproche également les contextes en fonction des termes qu’ils partagent (voisins en tête et en expansion). Dans le tableau 4.2 épanchement est la tête du syn- tagme nominal épanchement pleural et pleural est son expansion. Les descendants en tête donnent des informations sur ce qui pourraient être des concepts fils ou des concepts défi- nis. Les descendants en expansion donnent des informations sur la place du concept dans la hiérarchie, sur le concept père. Les voisins en tête et en expansion nous permettent de constituer des regroupements de candidats termes sémantiquement proches du candidat terme étudié. Ces regroupements sont d’une grande aide pour élaborer la structure hiérar- chique de l’ontologie, aussi bien l’axe horizontal que vertical. L’exemple suivant montre un premier rapprochement possible : nous pouvons mettre en rapport le groupe A {épanche- ment, lésion, infection, décompensation}avec {signes}. Les candidats termes du groupe A partagent un même contexte sémantique, la première hypothèse est donc qu’il peut s’agir de concepts frères dont signes est possiblement le concept père.

5

Mise en œuvre des principes différentiels

La méthodologie de construction d’ontologies différentielles utilisée est constructive, elle permet de placer de manière précise chaque concept dans la structure hiérarchique. Donc, pour

étape en précisant les principes différentiels qui les définissent. Par exemple, le concept Ultra- sonographie et le concept ExamenIsotopique sont des concepts frères dont le concept père est ImagerieParRayonnement (cf. figure 4.9). Le principe de communauté avec le concept père est la projection ou l’injection d’une substance artificielle dans le but d’effectuer des mesures. Le principe de communauté entre les concepts frères est lié au média d’injection. Le principe diffé- rentiel entre les concepts frères est relatif au type de média artificiel mis en œuvre : un isotope dans le cas de l’examen isotopique (la scintigraphie est un exemple d’examen isotopique) et les ultrasons pour l’ultrasonographie. L’ensemble des candidats termes regroupés sous les axes conceptuels présentés à la section 4.2, est défini selon ces principes. Nous pensons que la com-

FIG. 4.9 – Extrait d’OntoPneumo sous DOE.

paraison des résultats obtenus (1) par l’analyse distributionnelle sur le corpus [CRH] et (2) par le repérage d’énoncés définitoires à l’aide de patrons lexico-syntaxiques sur le corpus [LIVRE], va

enrichir la démarche cognitive de l’ingénieur des connaissances dans la phase de mise en œuvre des principes différentiels.

5 – Mise en œuvre des principes différentiels 99

Type Nb Exemple

Termes identiques, à la nor- malisation terminologique près

3 Asthme[CRH] vs asthme[LIVRE],

Emphyseme[CRH] vs emphysème[LIVRE]

Variantes lexicales compa- rables

3 SaturationEnAir[CRH] vs saturation en oxy- gène[LIVRE]

Niveaux de granularité diffé- rents

18 Adenopathie[CRH] vs Adénopathies médiastinales [LIVRE]

TAB. 4.3 – Comparaison des termes issus des deux hiérarchies terminologiques.