• Aucun résultat trouvé

2.7 Description et développement de concepts, méthodes et mécanismes pertinents pour la

2.7.1 Représentation

La question de la représentation est essentielle dans tout système traitant des informations externes. Pour Peschl, la représentation serait une interprétation du monde extérieur permettant la construction de comporte- ment [189]. En effet, il est nécessaire de coder la réalité sous formes de données que le système puisse traiter. Comme le fait remarquer Kokinov, la structure d’un mécanisme cognitif est basée sur la représentation, la mé- morisation et les mécanismes qui lui sont associés [134]. Or, ceci pose un problème majeur dans les systèmes d’intelligence artificielle [45]. En effet Chalmers fait remarquer que la question cruciale est comment représenter le monde, la connaissance de manière pertinente. Ainsi, plusieurs types de représentation existent. Premièrement, d’après Kokinov, elle peut être symbolique ou basée sur les connexions [134]. Ensuite, le choix du modèle doit permettre l’utilisation et la modification des règles tout en utilisant les concepts de manière efficace [37]. À l’in- verse, il semble difficilement possible qu’un système de type Pandemonium soit nécessaire pour la reconnaissance de forme [168].

Ainsi, dans [6] Aissaoui et al. présentent une représentation graphique des influences qui autorise l’utilisateur à effectuer des choix et mettent en avant l’utilisation de cartes cognitives pour structurer des données sous une forme logique. Cazenave présente le Patern Representation qui est une forme de représentation intéressante de l’espace mais qui manque de précision [43]. Ce dernier ajoute que l’utilisation de prédicats et de méta- prédicats peut être intéressante dans la représentation de l’environnement. Kohonen propose une représentation de l’information structurée dans l’espace, the self organized mapping [133]. Cette structure a les mêmes buts que les réseaux de neurones plus traditionnels et se base sur l’idée que les informations sont organisées dans l’espace. Mano [157] définit un système complexe comme un système avec plusieurs niveaux de description. Enfin, en théorie psychologique, Markman pense que les représentations sont organisées de manière hiérarchique lors de la recherche de similarité [159].

Cependant, si le modèle de représentation est très structuré et laisse peu de place à l’interprétation, il est souvent incomplet. Au contraire, si le modèle accepte toutes les interprétations possibles, il est souvent ambigu. Ainsi, dans [6] Aissaoui et al. expliquent qu’une des difficultés que pose les cartes cognitives est leur manque de structuration forte. Pour Chalmers séparer la représentation d’un mécanisme de haut niveau de perception est impossible [45]. Enfin, Richard soutient que la modification de l’interprétation permet la construction d’une bonne représentation et ainsi de trouver l’adequation entre cette dernière et les moyens de résoudre le problème [201]. Un point intéressant souligné est que les systèmes dits intelligents sont souvent confrontés à des informa- tions approximatives. Or, comme le souligne Diez, l’une des difficultés majeures pour les systèmes d’intelligence artificielle est la gestion des incertitudes [80]. Cette incertitude peut provenir de plusieurs causes comme des

2.7. DESCRIPTION ET DÉVELOPPEMENT DE CONCEPTS, MÉTHODES ET

MÉCANISMES PERTINENTS POUR LA CONCEPTION D’UN RÀPC

erreurs ou l’inexactitude des données.

Une multitude de représentations existent comme celle des valeurs prédéfinies caractéristiques. Cependant, compte tenu de la complexité des problèmes que nous souhaitons aborder, seules les deux méthodes les plus pertinentes sont exposées : celles permettant un stockage de l’information et celles permettant de modéliser des événements. Ainsi, certaines méthodes utilisent la propagation de l’information. La propagation est un phénomène qui se déroule dans les systèmes composés d’éléments interconnectés. Par exemple, Chauvin décrit le processus de propagation qui se déroule dans les cartes cognitives [47]. Cette activité permet de transporter de l’information entre les éléments et de réaliser des actions spécifiques au système. Ainsi, la propagation de l’influence est définie comme une propagation calculée en fonction des liens entre les concepts [47].

2.7.1.1 Représentation de l’information

On trouve dans la littérature une représentation intéressante de l’information sous forme de graphes ou de réseaux. Ces graphes peuvent être plus ou moins complexes, comme les hypergraphes, qui sont une variante plus généraliste des graphes. Duris définit un hypergraphe, généralisation de la notion de graphe, comme un ensemble fini d’éléments, de sommets, ainsi que d’arrêtes [76].

Pour notre problématique, les réseaux sémantiques sont une forme de représentation intéressante. Ce sont des réseaux de données qui peuvent servir à représenter de l’information mais aussi à la traiter. Ainsi, comme le définissent plusieurs auteurs un réseau sémantique est constitué d’un ensemble de nœuds représentant des objets ou des concepts et des arcs orientés les reliant [82] [196]. Contrairement à un modèle de données hiérarchisé, le réseau de concepts constitue un modèle multidimensionnel dans l’espace [64]. L’une des notions fondamentales des réseaux sémantiques est l’utilisation de concepts [41].

L’un des principaux avantages de cette structure de données est la possibilité de les traiter informatiquement. Descles mentionne en effet que c’est une structure de données utilisable en informatique et souvent utilisée en intelligence artificielle [64]. Ainsi, associés à des mécanismes de traitements, les réseaux sémantiques peuvent être utilisés avec des inférences. D’après Carbonnell, les inférences dans les réseaux sémantiques humains sont de quatre types : déductive, négative6, fonctionnelle7 et inductive [41]. Enfin, les cartes cognitives, qui sont un cas particulier des réseaux sémantiques, forment des réseaux d’influence [47].

Néanmoins, certains problèmes liés à l’utilisation des graphes apparaissent également dans les réseaux sé- mantiques comme la recherche de similarité entre deux éléments. Dans [107], les auteurs proposent une méthode pour rechercher des cas similaires dans un réseau sémantique avec l’utilisation d’un schéma RDF8 (Resource Description Framework). Néanmoins, cette méthode ne compare que seulement une partie des deux graphes car le problème est au moins NP complet.

Dans la même idée, les graphes conceptuels sont une variante des réseaux sémantiques [223] utilisés en intelligence artificielle entre autre. Rasovska définit les graphes conceptuels comme une amélioration des graphes sémantiques par le fait que les nœuds représentent des concepts liés entre eux par une structure permettant une hiérarchisation [196]. Comme le souligne Jordan, l’utilisation de graphes est pertinente pour représenter une multitude de données liées entre elles [128] et ainsi avoir une représentation complète de l’information [216].

De plus, dans [132] Karouach et Dousset expliquent que les graphes peuvent être un outil intéressant pour manipuler de grands nombres de données et pour permettre d’en dégager certaines informations, comme des relations cachées. De plus, leur utilisation permet de pouvoir utiliser les concepts ainsi que les règles quelque soit leur niveau d’abstraction [37]. Mugnier dans [170] va plus loin en essayant de montrer qu’il est possible de représenter des connaissances avec des graphes et que des algorithmes qui leur sont dédiés peuvent réali- ser des raisonnements. Cependant, certains auteurs pensent qu’ils peuvent représenter de l’incertitude quant à l’information qu’ils représentent [146] [213].

Une forme plus élaborée de graphes se retrouve également dans la notion d’ontologie. L’ontologie consiste en la structuration de concepts appartenant à un même domaine. Elle désigne des connaissances structurées et hiérarchisées [47]. Ce terme qui provient de la philosophie, a été repris en informatique. C’est une forme de représentation de la connaissance qui peut être utilisée en intelligence artificielle. Chauvin dans [47] montre que l’ontologie peut servir pour l’utilisateur à trouver des concepts associés qui lui permettent de réaliser la carte cognitive. Il définit la vue comme une sélection particulière des concepts associés à l’ontologie par l’utilisateur.

Il est intéressant ici d’introduire la notion de concept que l’on retrouve fréquemment. En effet, elle entre en jeu dans de nombreux sujets liés à l’intelligence artificielle. Les concepts sont des représentations générales d’un objet et par conséquent, ils sont souvent abstraits. Ainsi, Lieber montre que la notion de concept est centrale dans la classification des données [148]. Goldstone montre que la capacité de conceptualisation est essentielle dans le procédé de cognition humaine [102]. De plus, l’auteur pense que la capacité conceptuelle partage des

6. basée sur la contradiction

7. basée sur le calcul, en réponse au « Pourquoi ? » 8. http ://xmlfr.org/documentations/tutoriels/041015-0001

éléments communs avec le processus de représentation. En fonction de son utilisation, un concept doit regrouper certaines propriétés. Ainsi, dans le cadre du RàPC, un bon concept doit être rapide à utiliser et pertinent dans la recherche de cas similaire [43].

2.7.1.2 Représentation évoluée

Certaines représentations sont plus évoluées par le fait qu’elles fournissent d’autres éléments d’information. Ainsi, les réseaux de Petri peuvent être considérés comme une représentation d’une connaissance introduisant une certaine dynamique [242]. Une autre forme intéressante est celle des réseaux bayésiens.

Les réseaux bayésiens sont des outils graphiques [22] définissant la probabilité d’un événement en connaissant à la fois les causes et les effets liés à ce dernier, ainsi que les probabilités associées à cet événement. D’une manière générale, les réseaux bayésiens sont des graphes orientés non cycliques [188]. Il est à noter qu’il existe d’autres types de modèle graphique, comme le réseau de croyance, le réseau d’indépendance probabiliste [22]. Ainsi, par la connaissance d’une partie des causes, on peut déterminer la probabilité d’apparition d’un événement. De même, il est possible de réaliser l’opération inverse, c’est-à-dire qu’en constatant l’apparition d’événements, on peut remonter à la cause la plus probable [62]. Cet outil se matérialise par un réseau liant les causes et les événements [22] [236]. Chaque nœud comprend une table de probabilités qui permet par la suite, grâce à la formule de Bayes, de calculer les relations les plus probables. Ce calcul est réalisé par un moteur d’inférences. L’inférence consiste à mettre à jour les données de chaque nœud en fonction de valeurs fixées dans le système [22], ou plus simplement l’inférence est le calcul de n’importe quelle probabilité sachant certaines causes [146].

De par leur nature, les réseaux bayésiens peuvent permettre de trouver des architectures de causalité à partir de données brutes, ou encore pour l’étude de fonctions cognitives [188]. De plus, les réseaux bayésiens ont un intérêt pour la représentation de données dans les problèmes de décision, comme les arbres de décision [236], les systèmes experts, réseaux de neurones [175]. Les réseaux bayésiens permettent de porter son attention sur la structure du système, au lieu de se focaliser sur les valeurs numériques [22]. Enfin, ils sont très utiles pour la représentation de données incomplètes et de connaissances incertaines, et permettent de représenter graphiquement les indépendances [147]. Weber souligne que les réseaux bayésiens orientés objets permettent d’avoir une architecture arborescente hiérarchisée [236] .

Néanmoins, comme le souligne Naim, les réseaux bayésiens ont plusieurs limites, comme le manque de recul sur les méthodes d’apprentissage, ou l’utilisation des probabilités qui restent une notion peu intuitive. De plus, selon l’auteur, ils restent très compliqués à gérer une fois que leur taille devient importante [175]. Sur ce point des auteurs soulignent que les méthodes de calcul sont confrontées à des explosions combinatoires ce qui implique la nécessité de méthodes approximatives [147] [22]. De plus, la base de tout modèle graphique est la décomposition en unité individuelle, en module simple, ce qui implique une forte connaissance du sujet traité [22]. Enfin, d’après Denis, dans certain cas, il est impossible de répondre à certaines interrogations s’il manque de l’information [62].

2.7.1.3 Informations et informations incomplètes

Un des problèmes dans les systèmes utilisant de l’information survient lorsque cette dernière est incomplète, ce qui est souvent le cas [72]. Bosc définit l’information incomplète comme étant la situation où l’ensemble des données décrivant un objet n’est pas enregistré dans le système de base d’information [32]. Une autre définition proposée par l’auteur est lorsqu’il est possible de poser des questions dont la réponse ne peut être donnée par le système [32]. Ce document souligne la nature même de certaines données qui peuvent être dépendantes d’autres informations et par conséquent sujet à interprétation [32].

Une autre cause d’imprécision est que l’information transmise peut être imparfaite [72]. Dubois souligne que la nature des données ainsi que les problèmes d’interactions homme-machine s’ajoutent aux sources d’incomplétudes de l’information. L’auteur souligne que l’un des moyens de diminuer l’impact lié à ce phénomène est d’introduire l’inexactitude dans le modèle de représentation. Ainsi, les ensembles floues ou la distance d’exactitude sont des solutions possibles [72].