Approches basées sur la logique - Représentation des connaissances

Chapitre II Modélisation des expériences

II.1. Représentation des connaissances

II.1.1. Approches basées sur la logique

Les premiers langages utilisés pour représenter les connaissances étaient d’origine mathématique, basés sur un formalisme logique et en particulier sur la logique des propositions ou la logique des prédicats. Par exemple, de nombreuses ontologies ont été codées en utilisant des expressions logiques dans des formats développés par des logiciens. La logique, de manière générale, est un domaine des mathématiques et de la philosophie en rapport avec la manipulation d’expressions dont la valeur de vérité peut être établie. On trouve différents types de logiques comme, par exemple, la logique des propositions (aussi appelée calcul des propositions), ou la logique des prédicats qui définit des opérateurs comme « quelque soit », « il existe ». Dans ce deux cas, l’évaluation des expressions est binaire c’est-à-dire à valeur dans l’ensemble {vrai, faux}. Il existe beaucoup d’autres types de logique avec en particulier celles qui autorisent des valeurs graduelles comme les logiques modales, proches de la logique floue bien que cette dernière soit davantage basée sur la théorie des ensembles, ou encore des logiques temporelles qui prennent en compte les relations temporelles dans les inférences.

Un langage logique est caractérisé par un système de symboles et de règles qui définissent un langage en termes de syntaxe et par une interprétation qui fournit la sémantique de ce langage. Il est alors possible de combiner les symboles sous formes de formules logiques. La sémantique associée dépend naturellement de la logique considérée. A partir d’un ensemble d’expressions valides (la base de connaissances), un système de déduction (le moteur d’inférence) permet de raisonner en construisant des démonstrations et des propositions nouvelles. Ces dernières sont inférées par le système et viennent compléter la base pour créer le corps de connaissances. Les mécanismes d’inférence peuvent aussi permettre de répondre à une question posée.

Les approches logiques de représentation des connaissances reposent sur le même principe général : la construction de nouvelles expressions par inférence. Il existe plusieurs types d’inférences : la déduction, l’induction, ou encore l’abduction. Récemment, une distinction a été proposée dans le domaine de l’AGI (Artificial General Intelligence) sur le niveau d’axiomatisation des langages (Wang, 2006). Les systèmes de raisonnement basés sur une approche logique appartiennent à l’une des catégories suivantes :

! Axiomatique ! Semi-axiomatique ! Non-axiomatique

Les systèmes axiomatiques correspondent aux systèmes logiques mathématiques. L’hypothèse fondamentale est ici que le système possède suffisamment de connaissances et de ressources par rapport au problème à résoudre. Les systèmes semi-axiomatiques correspondent aux systèmes de raisonnement classiques que l’on retrouve en Intelligence Artificielle. La connaissance et les ressources sont suffisantes pour certains aspects de la résolution de problèmes mais pas tous. Cette approche repose sur les logiques mathématiques avec quelques adaptations en fonction de l’utilisation prévue de

la représentation (logique multi-valuée, temporelle…). Néanmoins, pour ces systèmes les outils mathématiques sont les mêmes que ceux employés pour les systèmes axiomatiques. Ils reposent donc sur les mêmes bases mathématiques. Les systèmes non-axiomatiques sont basés sur l’hypothèse qu’à tout moment, la connaissance et les ressources sont insuffisantes pour la résolution d’un problème. Le système doit pouvoir fonctionner en tenant compte de cette contrainte. P. Wang défend l’idée que pour l’Intelligence Artificielle, il est nécessaire d’adopter une approche non-axiomatique afin de ne pas faire d’hypothèses excessives sur la complétude de la connaissance disponible (Wang, 1995) (Wang, 2006). Par conséquent, certaines caractéristiques essentielles de la logique axiomatique, telles que la cohérence, ne sont plus assurées. En réponse, le système a un comportement intelligent, suivant la définition de Wang, car il s’adapte à la nature de la connaissance contenue dans la base. Il peut d’ailleurs avoir des comportements imprévisibles et surtout non renouvelables puisqu’il adapte ses réponses, ses inférences à la connaissance qui évolue en cours d’utilisation. Nous pouvons citer comme exemple de tels systèmes OpenNARS1_{et OpenCOG}2_.

Signalons qu’il existe aussi des langages d’échange des formalismes de représentation des connaissances basés sur la logique des prédicats. KIF (Knowledge Interchange Format) (Genesereth et Fikes, 1992) est une généralisation de ce type de langage. C’est un moyen d’échange de ce type de connaissances qui possède les caractéristiques suivantes :

! Une sémantique déclarative permettant d’exprimer des expressions formelles précises sémantiquement par l’utilisation de la logique des prédicats,

! Un méta-langage KIF Meta permettant de préciser la sémantique d’expressions particulières, ! Un ensemble d’entités et de notions comme l’objet, les fonctions et les relations qui permettent

des règles de raisonnement non-monotones.

KIF n’a cependant pas abouti à un standard et depuis peu, un nouveau formalisme d’échange appelé Common Logic (CL3_{) approuvé par l’ISO en octobre 2007 est développé.}

Synthèse critique sur l’utilisation d’un formalisme logique en retour d’expérience

D’un point de vue épistémologique, l’approche logique est bien adaptée à une large gamme de tâches de représentation (Hayes, 1977) (Moore, 1982). Néanmoins, les langages associés présentent de sévères limitations calculatoires. La logique des prédicats est seulement semi-décidable, et même pour des cas relativement simples. De plus elles sont souvent délicates à intégrer dans des systèmes logiciels actuels qui sont le plus fréquemment développés selon le paradigme orienté objet, dans des architectures de type MVC (Model - View - Controller).

Un inconvénient majeur de cette approche est que la logique du premier ordre est difficile à lire, à communiquer et à comprendre. Comme le font remarquer de nombreux auteurs, les modèles formels sont difficiles à construire (Ducournau et al., 1998). Pour pouvoir utiliser des systèmes basés sur la logique, il faut disposer d’une compétence de logicien. Une autre possibilité consiste à utiliser des dispositifs de capture basés sur le traitement du langage naturel (NLP), mais il s’agit là d’un domaine de recherche à part entière. Ces observations nous ont poussé à ne pas nous orienter vers une approche te type logique.

Nous remarquons simplement que l’approche de logique non-axiomatique aurait, malgré tout, pu constituer un choix approprié puisque les bases et hypothèses sont similaires à nos considérations initiales. En effet, la construction de la connaissance est incrémentale et passe par la prise en compte progressive des nouvelles informations, à l’instar du retour d’expérience. Toutefois, des problèmes de lisibilité subsistent. Pour illustrer ce problème examinons deux expressions dans le formalisme NAL (Non-Axiomatic Logic) de NARS peuvent être écrites :

! Expression simple : <!avalanche!"">!événement!>!%1.0!;0.9% exprime avec certitude que l’avalanche est un (type d’) événement.

1_{http://code.google.com/p/open-nars/} 2_{http://www.opencog.org/wiki/Main_Page} 3_{http://common-logic.org/}

! Expression composée : <<#x!"">!asthmatique!>!==>!<(*,!#x,!ventoline)!"">!utilise!>.!%0.9!;0.9% exprime qu’une personne asthmatique utilise de la ventoline avec une certitude élevée.

Il existe des expressions bien plus complexes, en particulier quand les aspects temporels et procéduraux (actions qui modifient l’état du monde) sont pris en compte. Ces deux exemples montrent bien que la lecture n’est pas directe. Il faut connaître la signification des symboles et, pour construire de nouvelles expressions, il faut connaître et respecter la syntaxe du langage. Ceci nécessite donc un apprentissage très difficile à envisager pour les utilisateurs d’un système de retour d’expérience.

Il existe des formalismes plus structurés, plus contraints et donc limités dans leur expressivité. Ces langages permettent aisément de décomposer l’information sans entrer dans la définition sémantique de tous les liens existants. Cet aspect de décomposition et de structuration de l’information est important et ne nécessite pas une forte cohérence de l’information. La perte d’expressivité est compensée par le gain en termes de lisibilité et de prise en main. Les formalismes basés sur les frames et orientés objet permettent cette approche plus pragmatique et sont présentés dans les parties suivantes.

Dans le document Modélisation générique d'un retour d'expérience cognitif. Application à la prévention des risques (Page 35-37)