• Aucun résultat trouvé

Quelques ontologies fondationnelles

2.3 Ontologies locales et Ontologies Fondationnelles

2.3.2 Quelques ontologies fondationnelles

Nous appuierons cette section sur le recensement de six des principales ontologies fondationnelles proposé par (Mascardi, Cordì et Rosso 2007) tout en actualisant ces informations pour tenir compte du progrès des ces projets sur ces dernières années.57

2.3.2.1 Basic Formal Ontology (BFO)

La Basic Formal Ontology est un projet d’ontologie de haut niveau initié par Barry Smith et Pierre Grenon à la fin des années 90. Entre autre développée au sein de l’Institute for Formal Ontology and Medical Information Science (IFOMIS) ainsi que le NCOR, les motivations bio-médicales initiales de cette ontologie expliquent sans peine sa bonne représentation au sein de nombreuses ontologies biomédicales telles que celles hébergée par l’OBO foundry. Toutefois, si BFO joue un rôle fondationnel pour nombres ontologies spécialisées, elle n’en demeure pas moins une ontologie for- melle, indépendante d’un domaine et, selon ses développeurs, une ontologie réaliste en de nombreux points comparable aux ontologies philosophiques inspirées par la science (B. Smith 2008b). BFO exploite trois dichotomies fondamentales :

• Continuants VS Occurents

56Il s’agit en effet d’une parenté intellectuelle revendiquée par des auteurs aussi différents que

Smith, Guizzardi, Guarino et bien d’autres. Voir en particulier (Guarino 1995)

57(Mascardi, Cordì et Rosso 2007) incluait en outre la présentation de deux ontologies – La

Global Formal Ontology (Herre 2010) et “l’ontology de Sowa” (Sowa 1999) – aujourd’hui tombées

• Dependant VS Indépendant • Type VS Instance

Continuants VS Occurrents L’existence en BFO de deux modes de descriptions

respectivement tri-dimentionel (SPAN) et quadri-dimentionnel (SNAP) est l’un des points reconnaissables et souvent mis en avant par ses contributeurs (Grenon et B. Smith 2004). Ce choix d’intégrer deux sous ontologies en BFO répond à l’impé- ratif de réconcilier deux sensibilités antagonistes au sein de la philosophie formelle. Pour le tri-dimensionnaliste, la primauté ontologique revient aux objets ou autres entités tri-dimentionnelles capable de perdurer dans le temps. A titre d’illustration intuitive, n’importe quel objet ou personne (e.g. Bill Clinton) occupe en chaque ins- tant une région de l’espace et conserve une relative identité dans le temps. Pour le quadri-dimensionnaliste, ces mêmes objets ne sont que l’hypostase d’une succession d’instants (on parle aussi de snapshot ontology). Dans cette perspective, Bill Clinton ne serait jamais plus qu’une succession d’événements clintoniens.

Explicitement inspiré des recherches formelles de (Zemach 1970), (Grenon 2003b ; B. Smith et Grenon 2004) adoptent une position perspectivialiste selon laquelle ces différents points de vue ontologiquement inconciliables sur la réalité peuvent cohabiter en cas d’expressivité mutuelle de leurs catégories. 58 Dans l’im-

plémentation actuelle de BFO (OWL ), cette dichotomie revient à la distinction primitive des Continuants (entités qui persistent dans le temps) vis-à-vis des Occur-

rents (entités indexées dans le temps) – Cf fig.2.7.

Dependant VS Independant La version actuelle (BFO2.0) compte 36 types

d’entités, 78 relations entre ces entités ainsi que 130 axiomes.59Son expressivité cor-

respond à celle des logiques de description de la famille ALC. 60 Au sein des conti-

nuants, BFO distingue primitivement des continuants dépendants de continuants indépendants. Cette distinction s’apparente à une version généralisée de la distinc- tion traditionnelle des objets (e.g. ce livre) et de leurs qualités (e.g. la couleur du livre), l’existence des secondes dépendant de celle des premières. BFO innove en outre en distinguant des continuants spécifiquement dépendants (CSD) de conti- 58Nous reviendrons à cette question en sec.5.4.2 p.259. Pour anticiper quelque peu, l’existence

de relations ontologiques formelles (Formal-Ontological Relations) – identité, partie, dépendance – entre des entités de SPAN et celles de SNAP.

59105 axiomes de sous-classes, 14 axiomes d’équivalence de classe et 11 axiomes de disjonction

de classes.

Figure 2.7 – BFO v2 : Principales catégories. La figure n’inclut qu’une portion des 78 relations : est une sous-classe de (mauve), est réalisé par, en tout temps base matérielle de et occupe une région spatiale à un certain instant

nuants génériquement dépendant (CGD). Si la couleur du livre dépend d’un livre

spécifique, un certain PDF du Sweet Dreams de Daniel Dennett ne dépend pas de la

copie précise que je possède sur mon ordinateur pour la simple et bonne raison que ce PDF continuerait à exister sans cette suite spécifique de 01 situés sur mon disque dur : il s’agit, en conséquence, d’un CGD.

Figure 2.8 – BFO : Processus et dispo- sition

Les occurrents peuvent être des pro- cessus ou des régions temporelles. D’une manière intéressante, tout processus dé- pend spécifiquement d’une entité maté- rielle, soit d’un continuant indépendant – e.g. le processus d’augmentation de la température revient à dire que la tempé- rature de quelque chose (l’air d’une pièce) augmente. Pour donner une idée du degré de précision qu’offre BFO, il peut être ins- tructif d’expliciter la différence entre les

processus et les dispositions – Cf fig.2.8. Si un processus est ce qui réalise une entité réalisable, dont les dispositions ne sont qu’une forme particulière, et qu’une dispo-

Figure2.9 – DOLCE-Lite : Principales catégories. La figure n’inclue qu’une portion des relations.

sition possède une base matérielle, cela n’implique en aucun cas que dispositions et processus entretiennent le même type de relation avec les entités matérielles. En tant qu’il s’agit d’un occurrent, un processus dépend spécifiquement d’une entité matérielle à un certain instant (i.e. celui durant lequel il se produit) alors qu’une disposition, qui est un continuant, soit une entité qui perdure dans le temps, possède à tout instant une base matérielle. 61

On peut clarifier cette nuance au moyen de l’exemple canonique de la fragilité du vase (disposition). Cette dernière dépend d’une base physique (la structure de la glaise) et est susceptible d’être actualisée par un processus (e.g. celui de laisser tomber le vase). D’une manière intéressante, le processus de casser le vase dépend également de la structure physique du vase. Ainsi, dans cet exemple, on peut voir que ce qui distingue les dispositions des processus ne dépend pas tant des relata de leurs relations avec une entité matérielle que des relations elles-mêmes : les dispositions ont une base matérielle à tout instant, les processus dépendent d’une base matérielle au moment où ils se produisent.

2.3.2.2 Descriptive Ontology for Linguistic and Cognitive Engineering (DOLCE)

DOLCE est un projet d’ontologie de haut niveau dévelopé depuis le debut des années 2000 au sein du Laboratory for Applied Ontology (LAO) sous l’influence notable de Nicolas Guarino qui soutint très tôt la légitimité d’une approche fondationnelle reposant la description de catégories de méta-niveaux (meta-level categories).62Bien

61BFO est neutre vis-à-vis de la question de la réalisabilité multiple des dispositions.

62On trouve notamment cette idée clairement exprimée en (Guarino, Carrara et Giaretta

que DOLCE n’hérite qu’indirectement de cette notion, formulée bien avant même la généralisation du balisage XML, il n’apparaît pas inutile d’illustrer cette notion concrétisée dans son architecture. Ces distinctions catégoriques dépendent de quatre propriétés fondamentales (Guarino, Carrara et Giaretta 1994a) :

comptabilité L’entité peut-elle être dénombrée ? (e.g. les objets peuvent être dé-

nombrés mais non les liquides) 63

réidentifiabilité L’entité possède-t-elle une identité telle que nous puissions la re-

connaître ?

stabilité temporelle L’entité demeure-t-elle, toute proportion gardée, la même en

dépit de changements (e.g. si le livre devant moi serait toujours le même livre si sa couverture venait à changer de couleur, cette couleur, mettons bleu clair, ne saurait demeurer la même si elle venait à tirer vers le bleu foncé)

rigidité Pour deux entités A et B en relation l’une avec l’autre, l’identité de A

dépend-elle de B ? (e.g. une certaine pomme resterait la même pomme si elle venait à changer de couleur mais non si elle perdait sa forme de pomme) Assez proche de l’opinion majoritaire au sein des philosophes de la connais- sance d’inspiration formelle selon laquelle ces distinctions constituent le cœur d’une connaissance fondamentale indépendante du domaine, l’on retrouve en DOLCE ces propriétés fondamentales dans l’opposition des endurants et perdurants.

Endurants et perdurants Le coeur abstrait et domaine général de DOLCE

(DOLCE-Lite), auquel peuvent se greffer divers modules plus spécifiques, 64 dis-

tingue de manière primitive deux types de particuliers : les particuliers abstraits à l’instar des propositions, régions ou ensembles et les particuliers concrets – Cf fig.2.9. L’on retrouve au sein de ces derniers l’équivalent des continuants et occurrents de BFO – appelés ici endurants et perdurants – ainsi que les qualités, distinctes des perdurants. Analogue à la dépendance en BFO, l’une des relations les plus fonda- mentales qui articule endurants et perdurants est la relation de participation. Ainsi, 63Bien qu’elle présente des similitudes avec la distinction sortals non-sortals déjà mise en avant

en (Strawson 1959), ces distinction ne se confondent pas exactement en ce qu’être un sortal suppose en outre d’être réidentifiable.

64A titre de liste non exhaustive, nous citerions en particulier les modules de connaissance modale,

de raisonnements sociaux et agentifs ainsi qu’un extensif module de représentation des relations spatiales.

de la même manière qu’une conversation (perdurant) n’existe qu’en présence de lo- cuteurs (endurants), de même une oxydoréduction nécessite-t-elle que de l’oxygène et un métal participent à cette réaction.

Dans sa version actuelle (2.1) implémentée en OWL-DL, l’ensemble des modules constitue une ontologies regroupant 205 classes, 311 propriétés d’objets, 4 proprié- tés de types de données ainsi que 39 individus. L’expressivité de cette ontologie correspond à la logique de description SHION (D).65

Quale et qualités A titre de particularités remarquables de DOLCE, nous vou-

drions tout d’abord rappeler que, en raison de sa perspective éminemment descrip- tiviste, DOLCE, ne serait-ce que par son nom, assume pleinement son biais cognitif et/ou linguistique – nuance sur laquelle nous reviendrons en chap.4. 66 Pour cette

raison précise, ainsi que le fait remarquer (Gangemi, Guarino, Masolo, Oltra- mari et Schneider 2002), DOLCE se présente comme une ontologie des types de particuliers les plus spontanés de la cognition humaine et choisit de ne capturer qu’indirectement la distinction entre les universaux et particuliers par le biais de la relation d’instanciation ; primitive – les particuliers n’étant, à la différence des universaux, jamais plus que des entités sans instanciation. 67

Figure 2.10 – DOLCE : Qualités et quale

Dans cette «métaphysique cognitive» (cognitive metaphysics), les relations spa- tiales jouent un rôle prépondérant quoique d’après une logique différente de BFO. Un peu à la manière d’une théorie du lieu naturel d’Aristote, DOLCE pense fonda- mentalement la spatialité en termes de lieux davantage qu’en termes de positions d’objets dans l’espace. Ainsi, point remar- quable, les qualités possèdent une spatialité propre distincte de la spatialité des ob-

65Voir sec.3.2.2 p.100.

66«As reflected by its acronym, DOLCE has a clear cognitive bias, in the sense that it aims

at capturing the ontological categories underlying natural language and human commonsense. We believe that such bias is very important for the Semantic Web (especially if we recognize its in- trinsic social nature (Castelfranchi 2001))» (Gangemi, Guarino, Masolo, Oltramari et

Schneider 2002, p. 167)

67«DOLCE is an ontology of particulars, in the sense that its domain of discourse is restricted to

them. The fundamental ontological distinction between universals and particulars can be informally understood by taking the relation of instantiation as a primitive : particulars are entities which have no instances ; universals are entities that do have instances.» (Gangemi, Guarino, Masolo,

jets physiques dont il sont les qualités. Les régions qu’occupent les qualités sont ce que l’on appelle des qualia (singulier quale). Formellement, les qualia sont des régions au même titre que les régions spatiales ou temporelles mais des régions i) atomiques intervenant dans un type de relation particulier : la relation q-location-of (relation qualité-région). Pour illustrer ce point, ma chemise est grise. Le gris de ma chemise, qualité, occupe une région R1 68 qui est logiquement d’un type distinct de

la région R2 qu’occupe ma chemise. En effet, si je peux subdiviser R2 en indiquant

que des sous-régions s’y trouvent, 69 tel ne peux être le cas, en DOLCE, d’un quale

comme R1. En un sens, il s’agit de la manière dont DOLCE s’assure du respect du

choix d’un degré de généralité en empêchant ainsi, via cette contrainte sur la localité des qualités, toute régression à l’infini.

Agentivité A ces distinctions de DOLCE-lite vient s’ajouter une dernière impor-

tante propriété scindant aussi bien les objets physiques que les événements dans sa version complète : l’agentivité. Ainsi, pour reprendre l’exemple de (Gómez et al. 2007), dans le cas de «Sénèque marche», un système expert pourvu de DOLCE, en identifiant que «Sénèque» est une Personne, l’identifierait alors comme un ob- jet physique agentif (Agentive Physical Object), d’où un objet physique, d’où un endurant et, de la sorte, que «marche» est une action – en tant qu’un objet phy- sique agentif y participe – d’où un accomplissement, d’où un événement, d’où un perdurant.

2.3.2.3 OpenCyc

OpenCyc est le descendant open-source d’un projet initié par Douglas Lenat au milieu des années 80 pour le compte de Cycorp (Austin TEX). L’actuelle version d’OpenCyc (4.0), écrite en CycL – langage à cadre spécifique à Cyc 70 – mais éga-

lement portée en OWL, peut être dite domaine général, mais non en tant que cette ontologie modélise l’intégralité des domaines de connaissances par la définition d’un petit nombre d’entités primitives à la manière de BFO ou DOLCE, mais en tant

68

R1 q− location − of Gris : (relation qualité-région) 69

R2 r− location − of R2,1, R2r− location − of R2,1 (relation région-région)

70CycL dénote les concepts à l’aide de #$. Parce que CycL ne distingue pas de type de concepts

différents pour les classes et les prédicats en tant que telle – #$isa est une instance d’une collection d’une certaine collection de prédicats (en l’occurrence, les prédicats de spécialisation) – c’est la syntaxe globale de la déclaration, soit la position dans le triplet, qui distingue les sujets prédicats et objets. Ainsi (#$capitalCity#$F rance#$P aris) signifie «Paris est la capitale de la France» et (#$isa#$BillClinton#$UnitedStatesP resident) que «Bill Clinton est un président des États

que, dans une approche plus quantitative que qualitative, le nombre de ses entrées capture une part importante de tout le vocabulaire de la langue anglaise ; distinction sur laquelle nous reviendrons en sec.2.3.3. Ainsi, OpenCyc se présente comme une exhaustive définition de termes (239000) assurée par non moins de 2093000 triplets. OpenCyc dispose toutefois d’une dichotomie type/instance, d’une certaine organi- sation de ses entités en classes et sous-classes. A titre d’illustration non exhaustive des quatre principales collections d’entités d’OpenCyc : 71

Site (19000) Un type de i) chose endurante localisée ii) chose qui n’est pas quel-

qu’un

sous-classes site classé par l’UNESCO, groupe de lagons, lieu de réunion instances le mémorial Martin Luther King, Université de Cambridge, le Pa-

radis

Organisation (26000) Un type de i) groupe d’agents intelligents agissant de

concert ii) entité sociale iii) un agent composé par de multiple personnes

sous-classes léproserie, organisation gouvernementale, organisation terroriste

avec une présence en Arabie Saoudite,

instances l’orchestre symphonique de Chicago, les frères Musulmans, le parti

démocrate japonais

prédicat (22000) Un type de i) relation, ii) fonction de vérité 72

instances

personne (12700) Un type i) d’entité stable dans le temps qui n’est pas une

organisation ii) d’humains iii) d’agent légal

sous-classes lunatique, habitant de New-York, punk, terroriste qui a été un

garde du corps, canadien

instances Macbet (roi d’Ecosse), JF Kennedy

OpenCyc a, en outre, cette particularité remarquable qu’une importante part de ses entrées possèdent des correspondances externes (owl :sameAs) avec de nom- breuses indexations sémantiques telles DBpedia (47000 liens) IMBEL (21000 liens), WordNet (11000 liens) ou encore le CIA World Factbook (172 liens). 73

71Nous transcrivons ici informellement les triplets qui nécessiteraient une présentation de prédi-

cats spécifiques à CycL.

72Cyc contient certaines de propriétés de owl : owl : DatatypeP roperty, owl : OntologyP roperty,

owl : SymetricP roperty, owl : T ransitiveP roperty

Figure 2.11 – Proton top v.3.0 : Principales catégories

2.3.2.4 PROTON

Proton (PROTo ONtonlogy) est une ontologie développée au sein de l’Ontotext Lab dans la lignée du projet européen Sekt (Semantic Knowledge Technologies) initié par A. Kiryakov en 2004. Elle possède une architecture modulaire composée i) d’une racine générique (Proton-Top) et ii) d’un module d’extension (Proton- Ext) destiné à affiner ses catégories. Dans sa version actuelle (v3.0) implémentée au moyen d’un fragment de Owl lite assez peu expressif (ALHI + (D)), 74 Proton

distingue primitivement les abstraits, les objets et les événements (happening). Bien que cette tri-partition s’apparente approximativement à aux oppositions primitives que l’on peut retrouver en Bfo ou Dolce, il convient de noter l’orien- tation très sociale et orientée entreprise de ses principales catégories – Cf fig.2.11. Ainsi, la majorité des relations qui unissent les entités de ces trois domaines n’inter- viennent qu’à partir de niveaux inférieurs. Ainsi, un agent participe à un événement, énonce un énoncé et a une position sociale (genre de situation lui même genre évé- nement). Les entités abstraites ne sont, enfin, que peu connectées aux autres. En conséquence, Proton ne saurait être qualifiée de domaine générale au même titre que Bfo ou Dolce.

En dépit de cela, Proton a été utilisée dans plusieurs domaines ainsi qu’à diverses fins depuis l’annotation sémantique – utilisé par la plate-forme KIM 75

jusqu’à la gestion de connaissance dans le domaine du droit (Casellas et al. 2005)

d’un point de vue stratégiquement pertinent (économie, armée, capacité de communication) pour des institutions gouvernementales.

74

ALEHOI + (D)

75

ou, comme dans le cas de FactForge (Bishopa et al. 2011), de connaissances générales.

2.3.2.5 Suggested Upper Merged Ontology (SUMO)

De la même manière que Cyc, l’origine de Sumo est industrielle. Développée par I. Niles et A. Pease pour Teknowledge, sa version actuelle maintenue par Articu- late Software comprend les définitions de pas moins de 25000 concepts assuré par approximativement 80000 axiomes. De la même manière et pour les mêmes raisons que Cyc, Sumo possède son propre langage d’implémentation : SUO-KIF, variante du langage Knowledge Interchange Format (KIF) spécifiquement destinée à Sumo (Niles et A. Pease 2003 ; A. Pease 2004). Dans sa traduction partielle en OWL, SUMO s’apparente également à Cyc par la multiplicité de ses entités : 4558 classes, 86475 individus et 587842 axiomes (pour sa version portée en OWL). Portée sur Wordnet, son expressivité correspond à celle des logiques de description de la fa- mille SOIF. 76

Du point de vue de sa structure, Sumo distingue primitivement les entités abs- traites des entités physiques et, au sein de ces dernières, les objets des processus. Une (infime) partie du reste de l’arborescence est visible en fig.2.12. Parmi les relations qui se distinguent de est un (is a), nous citerions la relation est une partie (réflexive sur Objet) ainsi que le fait que les abstraits ont une contrepartie Physique. Si les Agents possèdent des objets, seuls les Organismes, sous-type d’agents, les habitent. Enfin, les processus sont des types d’entités physiques ayant pour origine des objets et expérimentés par des agents.