Les attributs - CoDesc , un modèle de représentation des connaissances descriptives et

CoDesc , un modèle de représentation des connaissances descriptives et

2.4 Les attributs

Une modélisation possible consiste dans cet exemple à définir un objet général dent, de multiplicité [1 4] permettant de décrire jusqu’à quatre instances de dents, ainsi que quatre com-posants spécialisés correspondant aux quatre sortes de dents existantes. Ainsi, un observateur pourra instancier jusqu’à quatre types de dents puis les décrire et/ou les spécialiser en fonction de sa connaissance du domaine.

La création de hiérarchies locales d’objets permets de respecter le principe d’homologie. Si nous devons comparer dans le détail les dentures du chien et du chat, il faut s’assurer que nous comparons bien les canines (ou "crocs") de l’un avec les canines de l’autre. Sinon, le principe n’est pas respecté. « . . . Il faut être conscient du risque d’interprétation (donc de subjectivité) qu’il peut y avoir à s’aventurer dans des "déterminations locales d’objets" ; le descripteur, non averti des limites de son savoir désignerait comme des canines les défenses du Morse et celles de l’éléphant commettrait une erreur, qui par suite conduirait à comparer des objets non véritable-ment homologues : les défenses de l’Eléphant sont des incisives modifiées, contrairevéritable-ment à celles du Morse qui sont bien des canines, quoique d’une taille exceptionnelle. »

La définition d’un objet polymorphe au niveau du modèle descriptif selon la sémantique particulière accordée à la spécialisation des composants dans CoDesc, offre plusieurs avantages pour décrire une observation :

– Renseigner l’ensemble des descripteurs sans connaître précisément le type d’un objet. Au niveau de B, toutes les caractéristiques sont accessibles.

– La présence d’un objet particulier permettra de déduire le type précis de l’objet décrit. Par exemple, la présence de fleur terminale dans la description de l’inflorescence permet de déduire que le type de cet objet est une Inflorescence définie.

2.4 Les attributs

Les attributs sont attachés aux composants ou au schéma du modèle descriptif et définissent des parties du modèle. Les attributs sont simples et ne peuvent référencer d’autres composants ni d’autres attributs.

Nous notons A, l’ensemble des attributs d’un modèle descriptif et A ∈ A un attribut particu-lier. A est défini par un ensemble de propriétés qui précisent son type, possède un identificateur qui permet de le référencer de manière unique dans la base et un domaine de définition, noté dom(A) spécifiant l’ensemble des valeurs simples admissibles par les instances. Un attribut A ∈ A peut être vu comme une fonction qui associe à tout objet une ou plusieurs valeurs. Cette fonction a pour ensemble de définition Ω, et pour co-domaine, l’ensemble des valeurs admissibles par les instances, noté cod(A). En particulier, la valeur inconnue est admissible pour toute instance. Les ensembles de valeurs de dom(A) sont également autorisés pour toute instance, sans qu’aucune restriction ne soit précisée.

2.4. Les attributs Nous reviendrons sur cet aspect, mais pour fixer les idées, on considère que, pour les des-criptions, un attribut A est une application à valeur dans l’ensemble des parties du domaine, noté P(dom(A)). Cette définition permet de considérer que toute valeur valide de A peut-être un sous-ensemble de valeurs de dom(A), un singleton, l’ensemble vide ou le domaine tout en-tier. La valeur inconnue est considérée comme une valeur particulière qui généralise toute valeur possible que peut prendre une instance. Dans cette acception, les attributs ne précisent pas de contraintes sur la cardinalité de l’ensemble de valeurs simples du domaine que peuvent prendre les observations : tout attribut, quel que soit son type, peut être mono-valué ou multi-valué.

Il est possible de spécifier une valeur par défaut qui sera prise par les instances à défaut de la valeur vide (ou ensemble vide). En général, la valeur la plus fréquente est choisie.

Notons que le statut de propriété contingente ou nécessaire n’est pas explicite pour les attri-buts : il est déduit du composant auquel il est attaché. Si le composant est absent possible (ou absent possible déduit), toutes ses propriétés sont contingentes (y compris les règles). Le modèle ne permet donc pas de distinguer différents statuts possibles pour les attributs d’un même com-posant. Lorsque l’on souhaite effectuer cette distinction, il faut procéder à une décomposition supplémentaire du composant en deux sous-composants attachant respectivement le sous-groupe de propriétés contingentes et le sous-groupe de propriétés nécessaires.

2.4.1 Les types d’attributs

La complexité des observations issues du monde réel implique la nécessité de disposer de différents types d’attributs pour décrire ces observations. On aura besoin par exemple qu’un attribut prenne des valeurs numériques, pour décrire une longueur ou un poids, symboliques pour exprimer l’aspect ou la forme, ou bien hiérarchisées pour qualifier différents niveaux de précisions de l’observation. Nous présentons dans cette partie les différents types d’attributs utilisés dans le modèle CoDesc. L’étude des valeurs que peuvent prendre les attributs dans les observations fera l’objet du § 2.9.

Le type d’un attribut décrit la nature du domaine de définition de l’attribut, en particulier la structure sous-jacente de l’ensemble : ordre total ou partiel entre valeurs, les bornes du domaine, etc. Il conditionne également les opérations possibles sur les valeurs et sur les ensembles de valeurs (union, intersection, généralisation, borne inféreur, etc.). Les types sont prédéfinis et ne peuvent être créés, étendues ou modifiés par l’utilisateur de la base. La plate-forme IKBS offre cependant des mécanismes de création de nouveaux types, sous la forme d’interfaces de conception ou par spécialisation de types existants, qui facilitent l’extension du modèle par le programmeur (cf. chap. 6).

Plus formellement, la définition d’un attribut est donnée par un type et un domaine : Définition 2.3 Soit A = {A1, . . . ,Ap}, l’ensemble fini de tous les attributs définis dans le modèle descriptif, dénotant un concept C.

Soit D = {D₁, . . . ,D_p}, l’ensemble fini des domaines (notés également dom(A)) et T = {τ (A1), . . . ,τ (A_p)}, l’ensemble des types associés au domaine de chaque attribut de A à valeur dans {numérique, nominal, ordinal, booléen, taxonomique, textuel}.

Nous regroupons sous le terme générique type symbolique, tout attribut dont le domaine est caractérisé par un ensemble de symboles. Les symboles représentent les valeurs simples qu’une observation est susceptible de prendre. Le type symbolique regroupe les types nominal, ordinal, booléen et taxonomique.

Type nominal

Pour un type symbolique, lorsqu’aucune relation d’ordre n’existe entre les symboles, l’attribut est de type nominal.

Un attribut symbolique possède un domaine caractérisé par un ensemble de symboles. Ces symboles représentent les valeurs simples qu’une observation est susceptible de prendre. Un domaine symbolique peut être simplement un ensemble de symboles, sans relation d’ordre, le type est alors nominal. Il peut être muni d’une relation d’ordre total 6, il est alors de type ordinal.

Exemple de descripteur nominal : P ays = {F rance,Chine,Suisse,Y ougoslavie, . . .}. Aucune relation d’ordre n’existe entre les valeurs.

Un cas particulier de type nominal est le type booléen, lorsque le domaine possède deux valeurs {oui,non}, {vrai,faux}, {0, 1}, etc.

Type ordinal

Lorsqu’un type symbolique est muni d’une relation d’ordre entre les symboles, notée 6, le type est ordinal.

Exemple de descripteur ordinal : Longueur = {P etit,Moyen,Grand}. La présence d’une relation d’ordre entre les valeurs permet de considérer que la valeur P etit est plus proche de Moyen que de Grand, ce qui est utile pour comparer les observations : P etit 6 M oyen 6 Grand.

Type taxonomique

Le domaine d’un attribut symbolique peut être structuré sous la forme d’une taxonomie de valeurs. La taxonomie51

permet d’ordonner partiellement les différentes valeurs d’un domaine de type symbolique.

La figure 2.7 illustre un ensemble de couleurs selon différents niveaux de précision, à l’aide d’une taxonomie de valeurs. Par exemple, la valeur clair est plus générale que rose, blanc et jaune. En particulier, la valeur indéterminé n’offre aucune précision, c’est la valeur la plus générale, racine de la taxonomie de valeurs. Elle est équivalente à la valeur inconnu.

Type numérique

Le domaine de valeur d’un attribut numérique est défini par un intervalle de R, noté noté [inf, sup]. Toute valeur valide pour une observation doit être incluse dans cet intervalle. Comme pour

Dans le document Construction itérative de bases de connaissances descriptives et classificatoires avec la plate-forme à objets IKBS. Application à la systématique des coraux des Mascareignes (Page 97-100)