• Aucun résultat trouvé

Chapitre I : Enquête épistémologique

1.8 Pierre-Simon Laplace Une définition opératoire

Du vaste travail de Laplace nous nous sommes focalisé sur deux axes, le premier consiste à repérer le(s) sens donnée(s) par cet auteur à la probabilité, le deuxième à trouver une place à la formule classique de la probabilité dans l’approche de dualité de probabilité.

Pour la recherche des traces de la dualité de la probabilité chez Laplace nous nous sommes basés principalement sur le livre intitulé Essai philosophique sur la probabilité (Laplace, 1795).

Dans la première partie de cet ouvrage Laplace présente les généralités de son approche, dans la deuxième il en propose des applications telles que les jeux de hasard, les sciences naturelles et "morales" et même les jugement de tribunaux. Bien que la formule de cas favorables sur cas possibles est présente dès de début de l’ouvrage, nous avons commencé l’analyse des traces de la dualité chez cet auteur.

Le chapitre consacré aux sciences naturelles est assez proche de l’interprétation fréquentiste. Les exemples sont en général non seulement plausibles de reproduction ; Laplace évoque constamment la question du recueil d’un grand nombre d’observations pour étudier les lois de certains phénomènes ; il a même esquissé quelques éléments d’une théorie des erreurs de mesure. Nous sommes clairement dans une approche fréquentiste. Le contexte est celui de l’attente à long terme, même le théorème de Bernoulli est cité dans ce chapitre de son essai.

Pour ce qui concerne l’interprétation bayésienne, ses contextes typiques sont présents dès le début de l’ouvrage. La formule de la probabilité totale y est un outil récurrent pour Laplace. Les exemples d’urnes de compositions inconnues (probabiliser sur une hypothèse) sont fréquents et l’estimation de la probabilité d’un événement futur par un événement du passé (formule de probabilité totale) est récurrente. En fait Laplace s’est appuyé sur ces formulations mathématiques pour défendre sa conception déterministe de l’univers ((Laplace, 1795), page 3):

« (…)Nous devons donc, envisager l’état présent de l’univers, comme l’effet de son état antérieur et comme la cause de celui qui va suivre(…) ».

La probabilité des "causes", autrement dit des hypothèses, est récursivement considérée pour modéliser des situations assez diverses. D’ailleurs, dans un passage intitulé « Des

inégalités inconnues qui peuvent exister entre les chances que l’on suppose égales » (ibid. page

Chapitre I : Enquête épistémologique. Pierre-Simon Laplace

les valeurs des probabilités. Nous ne prendrons qu’un seul exemple de la notion bayésienne chez Laplace, bien qu’ils soient nombreux tout au long de son essai.

Des témoignages

Le cas que nous avons retenu s’occupe de la probabilité de témoignages. Tous les ingrédients y sont présents pour une probabilité bayésienne. Ce genre de contexte s’avère propice pour cette notion, ci-contre un exemple d’un cas dont la probabilité modélise un rapport épistémique (ibid. page 124) :

«(…)la plupart de nos jugements étant fondés sur la probabilité des témoignages, il est bien important de la soumettre au calcul (…) on peut dans plusieurs cas, résoudre des problèmes qui ont beaucoup d’analogie avec les questions que l’on se pose, et dont les solutions peuvent être regardées comme des approximations propres à nous guider(…) ».

Laplace propose ici le cas d’un "témoin" qui déclare avoir tiré8 le numéro 79 d’une urne renfermant mille numéros. On s’intéresse à la probabilité de cette sortie, autrement dit, la probabilité que le numéro extrait soit effectivement le 79 déclaré par le témoin, celui-ci n’étant pas tout à fait crédible : « l’expérience a fait connaître que ce témoigne trompe une fois sur

dix ».

La modélisation proposée par Laplace fait apparaître la véracité du témoigne comme un facteur pondérateur (9 /10) sur la probabilité d’avoir tiré le numéro 79 (1/1000) donnant finalement une probabilité de 9/10000 que le numéro tiré soit effectivement 79. Si le témoin trompe en nous disant que le 79 est sorti, elle sera de 999/1000 x 1/10.

En suite Laplace affirme que la crédibilité du témoin peut se voir engagée par des enjeux particuliers à la situation (« avait quelque intérêt à choisir le numéro 79 ») et ainsi se voir substantiellement modifiée (ibid., page 127) :

«(…) ½, 1/3, etc., suivant l’intérêt qu’il aura d’annoncer ce numéro. En la supposant 1/9, il faudra multiplier par cette fraction la probabilité 999/1000, pour avoir dans l’hypothèse du mensonge, la probabilité de l’événement observé (…) »

Nous voyons ici une autre caractéristique de la probabilité bayésienne qu’explique sa dénomination de "subjective", celle de varier en fonction des approches considérées. Pour Laplace, la probabilité peut, dans ce cas, prendre des valeurs différentes en fonction de l’intérêt du témoin pour annoncer le numéro 79.

Le caractère subjectif de cette probabilité est une conséquence du rapport épistémique qu’elle modélise, rapport qui devient plus évident à cerner si nous comparons la position du témoin avec celle de Laplace. Il peut arriver que ce témoin connaisse parfaitement le résultat du tirage en question. Néanmoins, le manque de connaissance de Laplace lui amène à traiter ce problème en termes de probabilités. La notion de rapport épistémique peut s’observer plus concrètement dans l’exemple suivant :

Deux élèves A et B sont assis tête à tête devant une table. On place une feuille de papier sur la table en mode de rideau (Figure 5). On lance une pièce de monnaie du côté de l’élève A et on leur demande à tous les deux de déterminer la probabilité que la face visible de la pièce soit pile. L’élève A ayant le résultat sur ses yeux répondrait 0 ou 1, tandis que l’élève B, se servant de quelques hypothèses habituelles en classe, évaluerait sa probabilité par un ensemble de référence, vraisemblablement sa probabilité serait de 1/2.

Figure 5

Peut-on considérer une probabilité fréquentiste ici ? Qu’elle soit éventuellement évoquée ne veut pas dire que cette interprétation soit la notion centrale. La fréquence participerait comme élément auxiliaire en tant que raison de croire, et en reprenant notre terminologie elle aurait le rôle d’ensemble de référence infini pour quantifier une épreuve

générique, on serait ainsi en présence d’un type de raisonnement par référenciation.

En fait, il n’est pas clair que Laplace se serve de la rareté ou non des phénomènes évoqués comme raison, il cherche d’autres motifs, en général, ces exemples font appel au rapport entres les ensembles de cas favorables sur les cas possibles pour évaluer une probabilité, en d’autres termes un ensemble de référence fini ; démarche qu’il justifie comme étant naturelle (ibid., page 28) : « Cette règle conduit à des résultats conformes aux indications

du sens commun ». Il est évident que ces exemples vont vers la direction de l’emploi de la

Chapitre I : Enquête épistémologique. Pierre-Simon Laplace

référence, ce qui lui permet d’illustrer l’utilité de la formule. Ces cas seront en général des contextes du type épreuve générique référenciés par des ensembles finis.

Nous constatons donc encore une fois la présence de la dualité d’interprétation chez un même auteur, cette fois-ci chez Laplace et en particulier dans son ouvrage Essai philosophique

sur la probabilité. Nous profitons de l’attention qu’il y a consacré à la formule menant à la

quantification de la probabilité pour préciser nos raisons nous conduisant à ne pas la considérer comme une interprétation.

Quelle place pour la définition classique ?

Les interprétations (frequentiste et bayésienne) ont un statut bien différent de celui de la définition classique de la probabilité. Pour mieux comprendre cette différence, nous introduisons les concepts de définition sémantique et définition opératoire.

Définitions sémantique et opératoire

Dans le contexte de notre recherche, nous dirons qu’une définition est sémantique si elle rend compte du signifié d’un terme, ou en autres termes lorsqu’elle explicite l’empreinte signifiante du concept en question.

Une définition sera opératoire si elle détermine les étapes à suivre dans un procédé donné, dans ce sens une recette peut être considérée comme une définition opératoire, un algorithme en est un autre exemple.

Les définitions de la probabilité esquissées en la section 14 (fréquentiste et bayésienne) vont dans la direction d’une définition sémantique. Notons que dans ces deux définitions (même provisoires) se précise le signifié du terme probabilité :

«… La probabilité est alors la limite de la proportion de l’apparition de l’événement en question… » et « …Elle exprime une mesure de certitude ou un degré de croyance ou de crédibilité portée sur une proposition…»

La définition de la probabilité comme un quotient de cas favorables sur cas possibles est une définition opératoire parce qu’elle n’indique qu’un algorithme. Cette définition, dépourvue de sens et en tant que procédé de quantification, ne précise pas ce qu’on doit entendre par probabilité. Ce qu’elle nous indique sont des pas bien précis pour la quantifier. De plus, elle est utilisée par les deux paradigmes probabilistes, ce qui prouve son manque de signifié.

On peut aussi comparer ces deux type de définitions selon trois axes que nous appellerons : fonctionnel, hiérarchique et extensif.

- L’axe fonctionnel. Il nous parle des fonctions remplies par les définitions sémantiques et opératoires. Comme nous l’avons précisé ci-dessus, les définitions sémantiques ont l’intention de spécifier le signifié attribué à un terme. La définition opératoire a pour fonction de fournir une méthode de quantification.

- L’axe hiérarchique. Les unes habillent de signifié un mot, l’autre reste sous-ordonnée aux interprétations source et ne fait que préciser comment procéder pour passer au symbolisme mathématique. Le danger de mettre au premier plan la formule de Laplace est, parmi d’autres, celui de la perte de signifié des objets statistiques, et dans cette perte il y a au moins deux risques en statistique ; l’un consiste à faire croire que le travail statistique se résume à la manipulation mathématique d’objets dépourvus de signifié ; l’autre à en utiliser la symbolisation mathématique comme pivot pour échanger les interprétations de la probabilités (Figure 5) ((Jaynes, 1984);(Hacking & Dufour, 2004; Lecoutre, 2005)). En fin, nous parlons de hiérarchie parce que les définitions sémantiques se trouvent au dessus des définitions opératoires : une probabilité change de valeur par les opérations mathématiques effectuées, mais les traces de son signifié restent invariantes, tout au long de ces transformations.

- Extension. La dite définition opératoire, n’est pas valable pour tous les cas : ni pour la probabilité fréquentiste ni pour la probabilité bayésienne. On ne peut pas se contenter de la caractérisation de la formule de Laplace pour la substituer aux interprétations de la probabilité. Qu’en serait-il de toutes les situations fréquentistes où on ne peut pas la décomposer en cas élémentaires de même possibilité élémentaire ? Qu’en serait-t-il de toutes les situations bayésiennes dont les informations disponibles n’amènent pas à une distribution a priori équirepartie ? Et, comment considérer une probabilité que ne répond plus à ce schéma lors des transformations mathématiques ? Si la probabilité est un quotient entre cas favorables et possibles, alors la probabilité est un nombre9 ((Keynes, 1921), page 22), ce qui est faux :

« (…) It is often said, for instance, that probability is the ratio of the number of "favourable cases" to the total number of "cases" If this definition is accurate, it

9 Nombreuses sont les situations où lorsque μ=p, l’auteur parle de μ comme étant une probabilité. Par exemple : la

Chapitre I : Enquête épistémologique. Pierre-Simon Laplace

follows that every probability can be properly represented by a number and in fact is a number (…) ».

Erreur par échange d’interprétation postérieur aux calculs

Figure 6

Bref, la place d’une définition opératoire de la probabilité en statistique en tant que quotient de cas favorables et cas possibles ne relève pas du même statut que les définitions

sémantiques et dans le reste de notre travail, cette dernière ne sera pas prise en compte comme

une interprétation en soi mais comme un passage (un parmi d’autres) à la modélisation mathématique. Après et en nous intéressant à une optique didactique, ces éléments seront repris du point de vue sémiotique.

Nous venons de placer la formule de Laplace ou définition classique de la probabilité comme algorithme permettant à la probabilité le passage au nombre. Dans ce contexte, elle n’est pas une interprétation dans le sens détaillé dans Chapitre I. Définitions sémantique et

opératoire.

Nous comptons déjà avec trois types de différences entre les deux interprétations de la probabilité : les objets sur lesquels probabiliser, leurs valeurs logiques et le type de raisonnement mobilisé dans chacune des interprétations.

Dans la section Chapitre I. Pour la probabilité bayésienne nous avons parlé de la

référenciation comme un procédé pour les épreuves génériques et aussi de la mise en place de

deux principes permettant à la probabilité le passage au nombre, tous les deux utilisaient des ensembles de référence, l’un fini (formule de Laplace), l’autre infini.

Il nous manque d’autres principes qui facilitent le passage au nombre. Cela concerne toujours la probabilité bayésienne mais maintenant, c’est lorsque nous évaluons une probabilité dite hypothèse. Ce principe a lieu lors des premiers pas de l’abduction et il est couramment connu comme principe de raison insuffisante. Nous le développerons à partir des travaux de Keynes et ses réflexions sur la Logique inductive dans les années vingt.

Situation de caractéristiques bayésiennes Situation de caractéristiques fréquentistes

Passage au calcul

Interprétation fréquentiste de P

Chez Keynes nous ne prétendons pas trouver des traces de la présence de la dualité, il fut un défenseur de l’approche bayésienne, principalement à partir d’une optique logique, nous retiendrons quelques-uns de ses apports à l’approche bayésienne de la probabilité.

Chapitre I : Enquête épistémologique. John Keynes