HAL Id: hal-02120285
https://hal.archives-ouvertes.fr/hal-02120285v5
Preprint submitted on 30 Aug 2020
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
La logique contextuelle
Arnaud Kohler
To cite this version:
Arnaud Kohler. La logique contextuelle. 2020. �hal-02120285v5�
La logique contextuelle
Entre langage formel et langage naturel Arnaud Kohler
Résumé
La sémantique des langages formels porte exclusivement sur la syntaxe. A l’opposé, le sens des mots a au moins autant d’importance que la grammaire dans un langage naturel. Pour combler cette différence, nous postulons que la signification des phrases est dans les pensées, et nous présentons une modélisation qui les intègre dans le formalisme. Appliqué à la logique propositionnelle, l’exercice produit la logique contextuelle Lc, langage monotone syntaxiquement et non monotone sémantiquement. Garantissant la cohérence syntaxique, elle propose des réponses à quelques difficultés propres aux langages formels, comme l’exploitation de connaissances aléthiques, incomplètes ou incohérentes, et bénéficie d’une capacité à produire des pensées imaginaires. Nous étudions la place de Lc dans la famille des logiques non classiques, et établissons des liens avec les sciences cognitives.
Abstract
The semantics of formal languages deal exclusively with syntax. Rather, the meaning of words is at least as important as grammar in natural language. To bridge this difference, we postulate the meaning of sentences is in the thoughts, and we introduce a model which integrates them into the formalism. Applied to propositional logic, the exercise produces contextual logic Lc, a language that is syntactically monotonic and not semantically monotonic. Ensuring syntactic consistency, it provides answers to some specific difficulties to formal languages, such as the exploitation of alethic, incomplete or incoherent knowledge, and benefits from the capacity to produce imaginery thoughts. We study the place of Lc in the family of non-classical logics, and we set up links with cognitive sciences.
Introduction
Dans les langages formels classiques, une proposition élémentaire est supposée strictement vraie ou strictement fausse. La fonction d’interprétation, dite sémantique, utilise les propriétés syntaxiques des connecteurs pour associer une valeur de vérité aux formules,
indépendamment du sens des propositions. Plutôt que de fonction d’interprétation sémantique, et pour éviter toute ambiguïté, il serait donc plus précis de parler de « fonction d’interprétation de la syntaxe ». En effet, pour reprendre une formule de Jacques Hébenstreit (Automates et langages formels, Encyclopedia Universalis), « Un langage formel est, par définition, un langage ne possédant qu'une syntaxe et pas de sémantique ».
Cette définition pointe un écart entre les langages formels et les langages naturels. Pour ces derniers, le sens des mots a au moins autant d’importance que la grammaire. Considérons les deux expressions « je mange des haricots » ou « haricots moi manger ». Elles semblent accepter une interprétation sémantique identique – mais même cela n’est pas systématique : prononcée dans le contexte d’un jeu qui simule l’existence de haricots carnivores, la seconde expression peut prendre un sens totalement différent. L’interprétation sémantique exploite de toute évidence une fonction dépendante de paramètres internes et externes au langage : le sens d’une phrase dépend du contexte dans lequel elle est prononcée, ou, plus précisément, du contexte pensé par celui qui l’interprète.
Pour rapprocher les langages formels des langages naturels, il apparaît nécessaire de les adosser à une mécanique qui exploite le sens – non pas uniquement « de la syntaxe », mais aussi « des mots et des phrases ». La résultante est la constitution de la logique contextuelle Lc, langage que nous positionnons entre les langages formels (en tant que porteur des règles syntaxiques du raisonnement) et les langages naturels (en tant que consommateur d’une sémantique des mots).
Dans la suite, nous utiliserons, dans le sens et selon les règles usuelles de la logique (sauf mention contraire explicite), les symboles ⊢ (la règle de production syntaxique) et ⊨ (la règle d’interprétation de la syntaxe), ainsi que les connecteurs de négation (¬), de disjonction (∨), de conjonction (∧), d’implication (→) et d’équivalence (↔). Tout aussi usuellement, nous appellerons modèle le résultat obtenu par l’association d’une valeur d’interprétation (classiquement vrai ou faux) à chaque proposition élémentaire du langage formel.
Le postulat contextuel
Considérons un tableau peint, par exemple La Joconde de Léonard de Vinci. Nous le pensons comme un tout, dans le sens défini par René Descartes : « Par le nom de pensée, je comprends tout ce qui est tellement en nous que nous en sommes immédiatement connaissant » ([DERE]). Nous le désignons par un nom (La Joconde) – mais ce nom n’est pas le tableau qu’il désigne, nous sommes immédiatement connaissant de cela. Nous le décrivons par un ensemble de phrases : « La Joconde est le portrait d'une jeune femme, sur fond d'un paysage montagneux aux horizons lointains etc. » (La Joconde, Wikipedia) – mais quand bien même cette description serait idéalement complète et parfaite, elle n'est pas le tableau qu'elle décrit. Nous sommes immédiatement connaissant de cela aussi.
Nous établissons donc instantanément, et sans doute possible, une distinction tranchée entre la pensée que nous avons du tableau (symbolisons cette pensée par le signe c) et les mots ou les phrases f que nous utilisons dans le langage pour le désigner ou le décrire. De manière toute aussi immédiate, nous établissons un lien entre c et f. Selon Ludwig Wittgenstein ([WILU]),
« Nous ne devons pas dire : Le signe complexe aRb dit que a se trouve dans la relation R avec b, mais : Que a se trouve dans une certaine relation R avec b dit que aRb ».
Nous proposons de modéliser cette assertion par :
Soit L un langage formel muni de la fonction d’interprétation syntaxique ⊨. Une formule bien formée f de L est un ensemble de signes qui n’a pas de signification. Son sens est porté par une pensée, qui est une proposition élémentaire de L. Pour c symbolisant cette pensée, la relation entre c et f est c ⊨f.
Nous appelons cette affirmation le postulat contextuel. L’expression c ⊨f n’affirme ni la pensée c ni la phrase f, mais la connaissance que la pensée c dit que la phrase f est vraie (ou que la phrase f exprime la pensée c). Il entraîne une restriction de la fonction d’interprétation aux expressions C ⊨f, pour C un ensemble de propositions élémentaires réputées symboliser des pensées et f une formule du langage. Applicable à toute logique formelle L, il génère la logique formelle L contextualisée. La logique propositionnelle contextualisée, notée Lc, est appelée par convention la logique contextuelle.
Contextualisation de la logique propositionnelle
Considérons l’ensemble des propositions élémentaires {a, b, c, d} et un ensemble de formules ELp = {a → b, c → a, d → a, d → ¬ b}. Nous obtenons {ELp, c} ⊢ b et {ELp, d} ⊢ b ∧ ¬ b. Cette dernière inférence ne modélise pas ce que nous souhaiterions, précisons notre besoin : il est de pouvoir dire que la formule a → b est vraie « en général ».
Notamment, elle serait fausse lorsque d est vraie. Mais remplacer a → b par ¬ d → (a → b) ne conviendrait pas, parce que {ELp, c} produirait ¬ d → b, et non plus b.
Cet exemple illustre deux difficultés des langages formels : pouvoir dire qu’une proposition peut être vraie et fausse (si elle est généralement vraie, c’est qu’elle est parfois fausse), et pouvoir qualifier son interprétation (pour dire qu’elle est « plutôt vraie » ou « plutôt fausse »).
Il est nécessaire de faire évoluer le formalisme pour y parvenir. De nombreuses études ont été réalisées dans ce but, participant à la constitution de la famille des logiques dites non classiques. Parmi les pistes empruntées, on trouve l’affaiblissement des règles de production syntaxique (pour échapper au principe d’explosion, qui dit que b ∧ ¬ b produit toute formule f, ce qui n’est pas acceptable), la définition d’une relation d’ordre entre les formules (exprimant que a → b est moins certaine que les autres par exemple), et l’enrichissement de la vision binaire {vrai, faux} (par l’adjonction de nouveaux connecteurs pour qualifier l’interprétation, ou directement par l’adjonction de nouvelles valeurs de vérité).
Les formules de ELp sont syntaxiquement bien formées, ce qui autorise la production ⊢. Mais si on accepte le postulat contextuel, elles ne permettent pas l’utilisation de ⊨. ELp présente un ensemble de signes, auquel on impose un comportement mécanique sans signification autre que syntaxique. Le fait de dire a → b génère pourtant une pensée associée à la formule. Nous lui prêtons un sens, et de cela nous sommes immédiatement connaissant. Si nous souhaitons raisonner sur cette connaissance, nous devons l’intégrer dans notre modélisation.
Plusieurs solutions sont possibles pour contextualiser ELp. Nous pouvons, par exemple, considérer qu’il exprime une unique pensée. Nous constaterons par la suite que la réponse à cette question a un impact sur les résultats de l’interprétation sémantique. Ceci ouvre la question de l’apprentissage. Nous ne l’aborderons pas, pour nous focaliser sur la présentation de l’expressivité de Lc. Pour les besoins de l’exercice, nous supposerons que chaque formule qui apparait dans la rédaction choisie pour présenter ELp est associée à une pensée dédiée.
L’ensemble contient quatre formules. Notons A, B, C et D les pensées connexes. Selon le postulat contextuel, ce sont des propositions élémentaires. Nous obtenons :
ELc = {A ⊨ a → b, B ⊨ c → a, C ⊨ d → a, D ⊨ d → ¬ b}
La première expression, par exemple, se lit : « la pensée A dit que a → b est vraie » (ou
« a → b exprime la pensée A »). Nous utiliserons dans la suite de la rédaction les définitions suivantes :
- une conjonction de pensées est un contexte. Par exemple, A ∧ B est un contexte. Il sera noté {A, B}. Un contexte identifie donc l’ensemble des modèles dans lesquels un ensemble de pensées désignées est vrai. Notons que tous les modèles contenants {¬ A, ¬ B, ¬ C, ¬ D} (« toutes les pensées sont fausses ») vérifient ELc.
- une formule produite par un contexte est une croyance. Par exemple, la croyance c → b est produite par le contexte {A, B},
- une expression comme contexte ⊨ croyance est une connaissance. Une connaissance modélise donc la relation entre un contexte (qui porte une sémantique) et la croyance (qui l’exprime).
Pour respecter le postulat contextuel, nous allons utiliser une pensée, notée H, qui symbolisera la question posée à la base de connaissances. Supposons que H dit que c est vraie, c’est-à-dire H ⊨ c. On obtient {A, B, C, D, H} ⊨ b. Si H dit que d est vraie, on obtient {A, B, C, D, H} ⊨ b ∧ ¬ b. L’utilisation de l’ensemble des pensées générant une incohérence, il serait intéressant de pouvoir sélectionner le sous-ensemble pertinent en fonction de H. Nous l’appellerons le contexte de référence de l’interprétation sémantique. Nous avons cinq connaissances, ce qui fait un nombre important de contextes possibles. Pour les distinguer, utilisons les définitions suivantes :
- un contexte est impossible si, et seulement si, il n’est vérifié dans aucun modèle vérifiant l’ensemble des formules considéré. Il est possible sinon,
- il est impossible minimal si tout contexte qu’il contient strictement est possible, - il est possible maximal si tout contexte qui le contient strictement est impossible, - il est crédible s’il n’a pas de jointure non vide avec un contexte impossible minimal,
- il est crédible maximal s’il contient tous les contextes crédibles.
Les contextes impossibles minimaux indiquent que les connaissances qu’ils portent ne sont pas fiables. Appliquons une stratégie de prudence, et retenons le contexte crédible maximal.
Si H ⊨ c, le contexte de référence est {A, B, C, D, H}, et on obtient {A, B, C, D, H} ⊨ b. Si H ⊨ d, {A, C, D, H} est un contexte impossible minimal. Le contexte de référence est {B}. Il ne nous permet aucune conclusion concernant d.
Le contexte impossible minimal {A, C, D, H} interroge. En réponse, nous apprenons que A peut être vraie et fausse. En disant cela, nous émettons une qualité sur une pensée : nous émettons une méta-pensée ([PIJA]). Il y a donc des pensées (qui disent des relations entre des propositions atomiques de Lp), et des méta-pensées (qui disent des relations entre des pensées et peut-être des propositions atomiques de Lp). Il y a aussi probablement des méta-méta- pensées, etc. Cela décrit une relation d’ordre entre les pensées. Pour la formaliser, convenons que les propositions élémentaires de Lp sont de rang 0, que les pensées sont de rang 1, que les méta-pensées sont de rang 2, etc. Etablissons une définition qui nous sera utile par la suite : nous dirons que le contexte vide est de rang 0, qu’un contexte est de rang i s’il est composé de pensées dont le rang est supérieur ou égal à i, et de rang strictement i si toutes les pensées qui le composent sont de rang i.
Ceci établi, intégrons les nouvelles pensées A' (qui dit que la pensée A est vraie) et B' (qui dit que la pensée A est fausse) :
ELc = {A ⊨ a → b, B ⊨ c → a, C ⊨ d → a, D ⊨ d → ¬ b, A' ⊨ A, B' ⊨ ¬ A}
{A', B'} étant un contexte impossible minimal, les contextes crédibles maximaux restent identiques pour H ⊨ c et H ⊨ d. Si on souhaite exploiter les nouvelles informations A' et B', nous devons modifier la définition du contexte de référence. Plusieurs solutions sont possibles, nous proposons de retenir celle-ci :
- Pour i le plus haut rang des pensées dans ELc, soit Ci+1 le contexte vide.
o Pour j = i à 2, sélection dans chaque {ELc, Cj+1} des contextes Cj possibles maximaux de rang j.
- Pour chaque C2 obtenu, sélection du contexte crédible maximal dans {ELc, C2}.
Nous appelons les contextes ainsi définis les contextes épistémiques. Ils consistent à sélectionner les contextes possibles maximaux sur les méta-pensées, puis à retenir les contextes crédibles maximaux associés à cette sélection. Le rang est utilisé comme une relation d’ordre pour privilégier des pensées sur les autres. La fonction produit potentiellement plusieurs contextes de référence. Modifions la fonction d’interprétation pour en tenir compte. Nous proposons :
- une croyance est crédible si, et seulement si, au moins un contexte de référence la produit et si aucun contexte de référence ne produit sa négation,
- elle est possible si, et seulement si, au moins un contexte de référence la produit et au moins un contexte de référence produit sa négation,
- elle est improbable si, et seulement si, au moins un contexte de référence produit sa négation et si aucun contexte de référence ne la produit,
- elle est non interprétable si elle n’est ni crédible, ni possible, ni improbable.
Appliquons. Si H ⊨ c, nous avons 2 contextes possibles maximaux de rang 2 :
- {A'}. Le contexte crédible maximal dans {ELc, A'} est {A', A, B, C, D, H}.
Il produit {c, a, b, ¬ d}.
- {B'}. Le contexte crédible maximal dans {ELc, B'} est {B', B, C, D, H}.
Il produit {c, a}.
Si H ⊨ c, c ∧ b est crédible.
Si H ⊨ d, nous avons 2 contextes possibles maximaux de rang 2 :
- {A'}. Le contexte crédible maximal dans {ELc, A'} est {A', A, B}.
Il produit { a → b, c → a}.
- {B'}. Le contexte crédible maximal dans {ELc, B'} est {B', B, C, D, H}.
Il produit {d, a, ¬ b}.
Si H ⊨ d, d ∧ ¬ b est crédible.
Enfin, si on n’a pas d’hypothèse, les contextes de référence sont {B’, B, C, D}, qui ne produit pas de proposition élémentaire de rang 0, et {A', A, B, C, D}, qui produit ¬ d : d est improbable.
Ces résultats conduisent à deux constats :
- la contextualisation apporte à Lp la possibilité de modéliser des règles avec exception en respectant les règle de production syntaxique de la logique propositionnelle. Si on intègre une nouvelle pensée qui dit que e → a est vraie, la croyance e ∧ b sera crédible si on suppose H ⊨ e. La pensée A est généralement vraie, mais elle s’incline face à une contradiction,
- d a un comportement particulier : si elle n’est pas forcée comme une hypothèse, la proposition est interprétée comme improbable. C’est une conséquence du principe d’exception : elle est improbable tant qu’elle n’est pas explicitement crédible. Si on suppose que toutes les règles admettent une exception, et que l’ensemble des connaissances est exhaustif, Lc dit que toute proposition élémentaire du langage Lp est improbable. Cela paralyse, dans l’absolu, la capacité de décision. Nous reviendrons plus loin sur ce sujet.
Nous clôturons l’exercice. Il nous a montré comment Lc modélise et exploite les informations aléthiques, incomplètes ou incohérentes : la contextualisation de Lp lui apporte la capacité à raisonner sur les modèles. Les pensées portent les connaissances. Les contextes de référence (nous avons utilisé la définition des contextes épistémiques) utilisent leurs rangs pour favoriser une vision plutôt qu’une autre, et la fonction sémantique consolide les interprétations issues de chaque contexte. Résumons les principales propriétés de Lc :
- un ensemble de connaissances est toujours syntaxiquement cohérent (« toutes les pensées sont fausses » caractérise un modèle possible),
- le langage respecte les règles de production syntaxique de la logique propositionnelle.
Il est de ce fait syntaxiquement monotone,
- l’adjonction d’une nouvelle connaissance peut entraîner une modification des contextes de références, et donc des résultats de l’interprétation sémantique. Le langage est sémantiquement non monotone,
- Lc adopte une conception perspectiviste de la connaissance : les contextes de référence sélectionnent chacun un sous-ensemble des connaissances, et l’interprétation sémantique est le croisement des interprétations issues de chaque perspective.
En supposant f, g et h trois formules telles que f ∧ g ⊢ h, la sémantique contextuelle peut se prononcer sur f et sur g (selon deux contextes éventuellement distincts), et dire dans le même instant que h n’est pas interprétable. Une application immédiate est la possibilité d’interpréter f comme étant simultanément vraie et fausse (cad possible dans la sémantique de Lc),
- Lc adopte une conception faillibiliste de la connaissance : toute pensée pouvant être fausse, Lc interprète comme crédibles les croyances produites par un raisonnement justifiable. La justification est portée par la définition retenue pour construire les contextes de référence.
Compte tenu de ces propriétés, voyons maintenant la place de Lc ans la famille des formalismes non classiques.
La logique contextuelle dans la famille des formalismes non classiques
Les logiques para-consistantes et la modélisation de l’incohérence
Les formalismes classiques sont fondés sur une hypothèse : les règles de raisonnement sont autonomes des sens des propositions. Associée aux trois principes d’Aristote (tiers exclu (a est vrai ou faux), non contradiction (a n’est pas à la fois vrai et faux), et identité (a est a)), elle conduit au principe d’explosion.
Les logiques para-consistantes se donnent comme objectif de tolérer les incohérences en échappant à l’explosion. La démarche couramment empruntée consiste à affaiblir les principes d’Aristote pour limiter les capacités d’inférence du langage. La proposition retenue par Lc est de conserver les principes d’Aristote, et de contourner l’hypothèse initiale : les propositions élémentaires sont toutes égales face à la syntaxe, mais pas face à la sémantique.
Le caractère perspectiviste de Lc lui permet alors de considérer qu’une proposition peut être vraie selon une perspective, fausse selon une autre, et que ces deux perspectives (les contextes de référence) sont vraies simultanément l’une et l’autre. Lc n’est donc pas un formalisme para- consistant. Il peut dire que a est vrai et faux (cad possible dans le vocabulaire sémantique de Lc), mais il n’accepte pas la production syntaxique simultanée de a et de ¬a.
Cela permet toutefois de penser que les chevaux bon marché sont rares, et donc chers selon
« le sens commun » (puisque, comme chacun sait, tout ce qui est rare est cher), tout en négociant dans le même instant le prix de vente dudit cheval supposé bon marché – et donc pas cher.
Les logiques modales et la modélisation des informations aléthiques
Pour pouvoir raisonner sur la qualité de la valeur d’interprétation, les approches modales étendent l’expressivité des langages par l’adjonction d’un nouveau connecteur. Le connecteur modal épistémique le plus utilisé est le connecteur aléthique ◻. ◻ f exprime usuellement que f est nécessaire, et son dual ¬◻¬ f, noté ◇ f, que f est possible. Le langage s’adosse sur la sémantique des mondes possibles ([KRSA]) pour bénéficier d’une fonction d’interprétation.
La logique contextuelle conserve la syntaxe initiale, et fait porter le niveau de crédibilité sur la fonction d’interprétation en exploitant une classification des propositions élémentaires.
Arnaud Kohler ([KOAR]) propose la relation suivante entre les deux formalismes :
Une formule f, de rang i, est possible s’il existe des propositions B et C de rang i+1 telles que B ⊨ f et C ⊨ ¬ f, et est nécessaire si B existe et que C n’existe pas.
Cette traduction permet de modéliser l’ensemble {◇ f, ◇¬ f}, mais pas l’ensemble limité à {◇ f}. Il est interprété comme {◻ f} tant que la connaissance C ⊨ ¬ f n’est pas introduite explicitement dans la base. Lc est donc moins expressif que le langage modal. C’est une conséquence de son caractère faillibiliste : s’il existe un raisonnement qui justifie la possibilité de f, et que rien ne fait douter de f, alors f est considérée comme vraie tant que la possibilité
du contraire n’est pas explicitement exprimée. Sous réserve d’accepter cette limite, l’apport de Lc sur les formalismes modaux est sa capacité à modéliser des informations aléthiques en restant dans le cadre de la syntaxe propositionnelle.
Monotonie et non-monotonie
L’objectif de la non-monotonie est de pouvoir modéliser qu’une formule f peut être interprétée comme vraie dans un ensemble {E}, et fausse dans un ensemble {E, g}. Les langages proposés sont le plus souvent soit complètement monotones (syntaxiquement et sémantiquement), soit complètement non monotones (syntaxiquement et sémantiquement).
La logique contextuelle propose un formalisme monotone syntaxiquement (si {E} produit syntaxiquement f alors {E, g} produit syntaxiquement f) et non monotone sémantiquement (f peut être vraie sémantiquement dans E et ne pas être vraie sémantiquement dans {E, g}).
Compte tenu des principes d’adéquation (ce qui est produit est vrai) et de complétude (ce qui est vrai est produit), un langage complètement non monotone ne produit des formules que si rien ne contredit cette production. En conservant la monotonie syntaxique, la logique contextuelle échappe à cet écueil.
Considérons par exemple la logique des défauts proposée par Raymond Reiter ([RERA]). Elle étend les règles de production par des expressions de la forme (a : b / c), qui se lisent : si a est vrai et que rien ne contredit b alors c est produit. Nous avons constaté au paragraphe précédent que Lc permet la modélisation et l’exploitation de règles avec exception. Toutefois, rapportée à la syntaxe de Raymond Reiter, l’expressivité de Lc se limite aux règles de la forme (a : b ∧ c / b ∧ c) ([KOAR]), en ajoutant a → b ∧ c à tous les modèles qui l’autorisent. La difficulté est la même que celle rencontrée avec les langages modaux : exprimer une possibilité (par exemple b et a → c sont possibles) conduit à la considérer comme vraie tant que la possibilité de son contraire n’est pas explicitement exprimée.
L’enracinement épistémique
Le principe a été proposé par Peter Gärdenfors et David Makinson, (GPMD). Il suppose l’existence d’une relation d’ordre qui établit un choix lorsque deux informations sont
contradictoires. Au-delà des questions philosophiques que cela pose, l’enracinement épistémique répond déjà à un problème technique. Un langage non contextuel ne peut pas techniquement absorber une incohérence parce que l’incohérence syntaxique lui est interdite.
Il a donc besoin d’une solution systématique pour y échapper.
La logique contextuelle n’a pas ce problème, puisque la cohérence syntaxique est garantie. Le principe de l’enracinement épistémique n’est donc plus une nécessité technique. Cela ne veut pas dire qu’il n’existe pas. Comme nous le verrons plus loin dans ce document, nous proposons de le situer en dehors du langage.
Les logiques adaptatives
Pour résoudre les différents problèmes rencontrés par les logiques classiques, Diderick Batens ([BADI]) propose de considérer qu’il existe plusieurs stratégies de raisonnement. Il conviendrait de sélectionner celle la mieux adaptée à l’ensemble des connaissances.
Considérons, par exemple, l’ensemble de formules suivant : ELa = {¬ p, ¬ q, p ∨ q, p ∨ r, q ∨ r}. Il est incohérent, donc explosif dans le cadre de la logique propositionnelle. Si on adopte une stratégie favorisant la fiabilité du raisonnement, il n’est pas possible de déduire r : il serait imprudent de conclure quoi que ce soit en utilisant les trois premières formules. Cependant, si on retient une stratégie qui minimalise les anormalités, et qu’on considère qu’au moins une des trois premières formules est vraie, alors r est produit.
En logique contextuelle, l’ensemble devient :
Elp = {A⊨ ¬ p, B ⊨ ¬ q, C ⊨ p ∨ q, D ⊨ p ∨ r, E ⊨ q ∨ r}
{A, B, C} étant un contexte impossible minimal, {D, E} est le contexte de référence. En l’état des connaissances, r n’est pas interprétable. Utiliser les contextes épistémiques qui retiennent au rang 1 les contextes crédibles maximaux relève donc d’une stratégie prudente. Adoptons les contextes possibles maximaux. Nous obtenons dans ce cas trois contextes de référence :
- {A, B, D, E}, qui produit {¬ p, ¬ q, r}, - {A, C, D, E}, qui produit {¬ p, q, r},
- {B, C, D, E}, qui produit {p, ¬ q, r}.
Avec cette définition des contextes de référence, r est crédible.
Notons que Lc n’est pas une logique adaptative :
- les deux formalismes partagent la capacité d’adapter l’interprétation sémantique aux caractéristiques locales. Nous avons constaté dans l’exemple développé pour présenter Lc qu’elle choisit d’utiliser ou non une connaissance en fonction de l’hypothèse intégrée dans la base,
- mais son principe n’est pas d’adapter la définition de son raisonnement face à une contradiction. Elle utilise une stratégie d’inférence unique, basée sur les contextes de référence, dont la définition est établie de manière définitive selon des critères théoriques généraux.
Il serait toutefois intéressant d’exploiter plus en profondeur les réflexions de Diderick Batens.
Elles suggèrent l’idée de contextes de référence dont la définition même pourrait s’adapter de manière dynamique. Nous avons par exemple privilégié les contextes épistémiques. Ils utilisent les contextes possibles maximaux sur les pensées de rang 2, et les contextes crédibles maximaux sur les pensées de rang strictement 1. ELa nous montre qu’il y aurait peut-être une utilité à modifier cette définition dans certaines configurations.
La production de pensées imaginaires
Les langages formels classiques infèrent des formules par application du modus ponens. Ce sont des productions par déduction : l’imagination leur échappe complètement. Nous appelons pensée imaginaire une expression qui ne serait pas productible par les règles classiques du langage. Sa cohérence sémantique avec les pensées existantes est forcément incertaine, et son apparition pourrait générer une explosion en logique classique. Dans Lc, la garantie de la cohérence syntaxe autorise l’imagination. Cela permet d’étendre les connaissances par n’importe quelle autre connaissance, à condition qu’elle soit portée par une pensée nouvelle.
La logique contextuelle peut donc supporter des productions par induction ou par abduction par exemple – ou, de manière générale, toute combinaison de signes syntaxiquement bien formée. Cette capacité n’est pas évidente à exploiter dans le cadre de la logique propositionnelle. Elle prendra plus de sens avec une logique du nième ordre contextualisée.
Les sciences cognitives et la paralysie du raisonnement
Rappelons-nous une propriété de la logique contextuelle : en supposant l’ensemble exhaustif des connaissances, le raisonnement contextuel conduit à considérer que toutes les pensées sont possiblement fausses, et que toute autre proposition élémentaire est improbable. Un système cognitif appliquant la logique contextuelle serait donc, dans l’absolu, condamné à ne rien pouvoir décider. Les sciences cognitives proposent une réponse à ce problème. Les recherches ont conduit à distinguer la Mémoire à Long Terme (MLT, contenant l’ensemble des connaissances) et la Mémoire à Court Terme (MCT, contenant les connaissances utilisées à un instant t pour réagir à un stimulus). Des seuils cognitifs ont été identifiés, qui bordent la fonction de sélection des données de la MCT :
- le changement minimal : le contenu de la MCT évolue a minima entre deux instants, - le critère d'évolution, parfois assimilé à l’enracinement épistémique : la MCT
privilégie la convocation des connaissances les plus récentes ou primitives,
- les seuils d'incapacités techniques : la MCT ne peut exploiter simultanément qu’un nombre limité (et apparemment faible) de connaissances,
- les seuils sémantiques : les travaux de Jacques Pitrat ([PIJA]) laissent à penser qu'un humain n'est pas capable de raisonner sur plus de quatre niveaux de méta- connaissances,
- le seuil du raisonnement proportionné : confronté à un stimulus, l’objectif n’est pas de réaliser la meilleure analyse théorique, mais d’atteindre un niveau d’analyse suffisant pour entraîner une réaction.
Dans un formalisme classique, une nouvelle information doit être confrontée à la totalité de la base (la MLT) pour garantir le maintien de sa cohérence syntaxique. Un langage contextualisé peut s’autoriser à interpréter une nouvelle information uniquement sur un sous-ensemble (la MCT). C’est par ailleurs une réponse possible à la question de « l’inférence non
démonstrative », concept mis en avant ces dernières années par quelques auteurs (par exemple [ANDA]) : avec Lc, la production syntaxique serait complètement aristotélicienne. Les sciences cognitives invitent à l’adosser à une fonction de sélection des connaissances, qui relève d’une logique « pragmatique » (les seuils cognitifs répondent à l’évidence à des contraintes de faisabilité), formalisable mais distincte de celle du langage formel.
Le concept MLT/MCT propose une réponse à l’exemple des haricots carnivores (cf.
l’introduction), en présentant un mécanisme d’influence de l’interprétation sémantique par des paramètres externes au langage. Le test suivant devient aussi abordable. Après avoir, d’une manière ou une autre, introduit l’idée de la couleur blanche dans les pensées immédiates d’une personne, nous lui demandons de répondre rapidement à la question suivante : « Que boit la vache ? ». Sa première réponse sera très souvent « Du lait », qu’elle corrigera après quelques secondes de réflexion. Ce test utilise des capacités de raisonnement et des mécaniques d’adaptation au contexte externe. Une forme de production de pensée imaginée est appliquée, utilisant les connaissances qu’une vache boit un liquide et que le lait est un liquide, et la plupart des seuils cognitifs est exploitée.
Les sciences cognitives nous sauvent de la paralysie générée par le raisonnement contextuel : quand bien même nous bénéficierions d’un ensemble de connaissances exhaustif, les seuils cognitifs limiterait notre capacité à exploiter toutes les informations disponibles.
Conclusion
Supposant que les pensées sont les porteuses de la sémantique, nous avons proposé une modélisation pour les intégrer dans les langages formels. Nous avons constaté que l’exercice enrichit leur capacité d’expression, les adossant à un raisonnement faillibiliste (une croyance est interprétée comme crédible dès l’instant où un raisonnement le justifie) et perspectiviste (l’interprétation sémantique des connaissances est l’union de l’interprétation sémantique de sous-ensembles de connaissances). Nous avons toutefois survolé deux difficultés :
- l’interprétation sémantique est immédiatement dépendante de la modélisation retenue : le comportement de {E, A ⊨ b ∧ c} est différent de celui de {E, B ⊨ b, C ⊨ c}. Pour modéliser les connaissances, nous avons fait des choix adaptés à ce que nous
souhaitions démontrer. Contextualiser un langage pose la question de la méthode de modélisation de l’information dans le cadre de l’apprentissage,
- le postulat contextuel présente la relation c ⊨ f comme une réalité systématique et immédiate. Mais il ne dit pas comment une phrase est générée par (ou reliée à) une pensée. Il conviendrait de donner à ce terme une signification concrète, et d’associer à la réflexion les relations avec les émotions.
Face aux difficultés rencontrées par les logiques classiques, nous avons emprunté un chemin qui suppose que les propositions élémentaires d’un langage sont toutes égales face à la syntaxe, mais sont inégales face à la sémantique. Le formalisme obtenu respecte les trois principes d’Aristote, et est pourtant capable d’exploiter des informations aléthiques, incomplètes ou incohérentes. Mais ce résultat entraîne, dans l’absolu, la paralysie du raisonnement. Nous avons recherché une réponse à ce problème dans les sciences cognitives.
Au-delà des exemples théoriques, la confrontation de Lc aux constats empiriques fera émerger de nouvelles questions. La contextualisation d’un langage du nième ordre sera une étape nécessaire pour enrichir l’expressivité du langage, et tester la modélisation sur des cas complexes représentatifs du raisonnement humain.
Références bibliographiques
- [ANDA] ANDLER, Daniel, Introduction aux sciences cognitives, Gallimard, 2004 - [BADI] BATENS, Diderick, Une caractérisation générale des logiques adaptatives,
Logique & Analyse 173–174–175, 2001
- [DERE] DESCARTES, René, Méditations métaphysiques. Objections et Réponses (I à VI), édition sous la direction de Jean-Marie Beyssade et de Denis Kambouchner, éd.
Gallimard Tel (2018), 1641
- [GPMD] GÄRDENFORS, Peter & MAKINSON, David, Relations between the logic of theory change and nonmonotonic logic, in André Fuhrmann and Michael Morreau, eds. The Logic of Theory Change, LNAI-465, 1991
- [KOAR] KOHLER, Arnaud, Proposition d’une structure de représentation de la connaissance pour les raisonnements non classiques, Université d’Aix-Marseille I, France, thèse de doctorat en informatique, 1995
- [KRSA] KRIPKE, Saul Aaron, Semantical considerations on modal logic, Reference and Modality, L. linsky (éditeur), Oxford University Press, London, 1971
- [LUJA] LUKASZEWICZ, Jan, Many-Valued Systems of Propositional Logic, eds. S.
Mc Call, polish Logic, Oxford University Press, Oxford, 1967
- [MCJO] MC CARTHY, John, Circumscription - A Form of Non Monotonic Reasonning, Artificial Intelligence 13, 1980
- [NODO] NORMAN, Donald, Models of human memory, Academic Press, New York, 1970
- [PIJA] PITRAT, Jacques, Méta-connaissance, Futur de l'Intelligence Artificielle, Hermes, 1990
- [RERA] REITER, Raymond, A logic for default reasoning, Artificial Intelligence 13, 1980
- [THAN] THAYSE, André & co-auteurs, Approche logique de l’intelligence artificielle, Dunod informatique, 1993
- [WILU] WITTGENSTEIN, Ludwig, Tractatus logico-philosophicus, traduction Gilles Gaston Granger, éd. Gallimard Tel (1993), 1921