• Aucun résultat trouvé

Proc´edure d’inf´erence causale traditionnelle

3.2 Inf´erence causale traditionnelle

3.2.2 Proc´edure d’inf´erence causale traditionnelle

L’objet de la section qui commence est de d´efinir une proc´edure d’inf´erence causale hypoth´etico-d´eductive qui utilise les outils de l’analyse de chemins. En vue de cela, nous commen¸cons par rappeler ce qu’il faut entendre pr´ecis´ement par « hypoth´etico-d´eduction ».

3.2.2.1 Hypoth´etico-d´eduction

La d´efinition classique de l’hypoth´etico-d´eduction est propos´ee dans Pop- per (1934) : il s’agit de

la m´ethode qui consiste `a mettre les th´eories `a l’´epreuve dans un esprit critique et `a les s´electionner conform´ement aux r´esultats des tests, suit

12

Plus exactement, c’est une caract´erisation de « a-th´eorique » qui a ´et´e donn´ee plus haut. Toutefois, il est clair que cette d´efinition implique une d´efinition de « th´eorique ».

3.2. Inf´erence causale traditionnelle 125

toujours la mˆeme d´emarche : en partant d’une nouvelle id´ee, avanc´ee `a titre d’essai et nullement justifi´ee `a ce stade – qui peut ˆetre une pr´evision, une hypoth`ese, un syst`eme th´eorique ou tout ce que vous voulez –, l’on tire par une d´eduction logique des conclusions. L’on compare alors ces conclusions les unes aux autres et `a d’autres ´enonc´es relatifs `a la question de mani`ere `a trouver les relations logiques (telles l’´equivalence, la d´eductibilit´e, la compatibilit´e ou l’incompatibilit´e) qui les unissent.13

Ainsi, les inf´erences hypoth´etico-d´eductives se d´eroulent en quatre temps : i) une hypoth`ese est formul´ee ;

ii) des cons´equences en sont tir´ees ; iii) l’hypoth`ese est mise `a l’´epreuve ; iv) l’hypoth`ese est rejet´ee ou accept´ee.

Pour ce qui est de la mise `a l’´epreuve de l’hypoth`ese, Popper distingue en particulier deux choses : d’une part les tests portant sur les cons´equences tir´ees de l’hypoth`ese14, d’autre part « la comparaison de la th´eorie [c’est-`a-

dire de l’hypoth`ese] `a d’autres th´eories, dans le but principal de d´eterminer si elle constituerait un progr`es scientifique au cas o`u elle survivrait `a nos divers tests »15. Il nous semble clair que la logique de l’hypoth´etico-d´eduction

n’impose pas un ordre dans lequel les diff´erentes mises `a l’´epreuve devraient avoir lieu.

Maintenant que nous savons pr´ecis´ement ce qu’est l’hypoth´etico- d´eduction, nous pouvons d´efinir une proc´edure d’inf´erence causale hy- poth´etico-d´eductive mobilisant les outils de l’analyse de chemins. Nous le faisons en deux temps. D’abord, nous ´enum´erons les grandes ´etapes de cette proc´edure. Ensuite, nos explicitons ce qu’il s’agit de faire `a chaque moment.

3.2.2.2 Etapes de l’inf´´ erence aux causes traditionnelle

Etant donn´es un ensemble de variables V et des donn´ees probabilistes re- latives `a V, la proc´edure d’inf´erence causale AC que nous d´efinissons consiste `a :

´

Etape A : Sp´ecifier un mod`ele causal sur-identifi´e (over-identified ), M . ´

Etape B : Estimer la valeur des param`etres associ´es aux diff´erentes relations de cause `a effet repr´esent´ees par M.

´

Etape C : Tester M et d´ecider s’il doit ˆetre rejet´e.

13

Popper (1934) pp. 28–29.

14

Ces tests peuvent eux-mˆemes ˆetre de plusieurs types.

15

´

Etape D : R´eit´erer les ´etapes A `a C pour des mod`eles diff´erents de M. ´

Etape E : Identifier celui des mod`eles non rejet´es `a l’issue de C qui a la meilleure ad´equation (fit) aux donn´ees, et noter M* ce mod`ele.

´

Etape F : Identifier, parmi des mod`eles ´equivalents `a M*, celui dont il est le plus plausible qu’il repr´esente ad´equatement la structure causale sur V, et noter M IV ce mod`ele.

M IV est le r´esultat de la proc´edure d’inf´erence causale.

En vue de montrer que cette proc´edure est bien hypoth´etico-d´eductive au sens popperien du qualificatif, il nous faut rendre plus sensible et explicite ce en quoi consiste chaque ´etape de la proc´edure que nous venons de d´ecrire.

3.2.2.3 Explicitation

Dans le paragraphe qui commence, nous reprenons chacune `a son tour les diff´erentes ´etapes de la proc´edure d’inf´erence causale qui vient d’ˆetre d´efinie et, pour chacune, nous explicitons ce qui exige de l’ˆetre.

Sp´ecifier un mod`ele causal , c’est d´efinir un graphe orient´e qui pourrait repr´esenter ad´equatement les relations de cause `a effet directes sur l’ensemble de variables V qu’on consid`ere. Un mod`ele est sur-identifi´e si et seulement si il a des degr´es de libert´e, c’est-`a-dire si et seulement si le nombre de ses param`etres est inf´erieur au nombre d’observations autoris´e par V. Une ob- servation autoris´ee par V est soit la variance d’une variable de V, soit la covariance entre deux variables de V. Le nombre d’observations autoris´ees par V est kVk(kVk+1)/2. Pour ce qui est des notions d’identification autres que la sur-identification et des crit`eres d’identification, nous renvoyons le lec- teur `a Kline (1998).16

Estimer les param`etres causaux d’un mod`ele, c’est d´eterminer quel est l’ef- fet quantitatif de la variation de la valeur d’une cause suppos´ee sur la valeur de l’un de ses effets suppos´es. Dans le cas lin´eaire, le plus simple, c’est esti- mer quelle diff´erence cela fait sur la valeur de l’effet que la valeur de la cause augmente d’une unit´e. Pour un mod`ele sur-identifi´e, il est th´eoriquement possible de d´eriver une estimation unique de chacun des param`etres cau- saux. Deux options sont possibles pour l’estimation des param`etres causaux d’un mod`ele :

– l’estimation par r´egression multiple. Le principe est alors le suivant : pour chaque variable, on consid`ere les relations pour lesquelles elle est effet et on attribue aux param`etres correspondant `a ces relations la valeur qui minimise la distance entre les valeurs de V qu’on observe et les valeurs de V que le mod`ele pr´edit ;

16

3.2. Inf´erence causale traditionnelle 127

– l’estimation par maximum de vraisemblance. Il s’agit alors de maxi- miser la vraisemblance de l’hypoth`ese selon laquelle les observations donn´ees sont tir´ees de la population consid´er´ee.

Le choix de l’une ou de l’autre de ces options d´epend en particulier des hypoth`eses qu’on ´emet `a propos du mod`ele.

Tester un mod`ele, c’est d´eterminer s’il reste plausible apr`es que les pa- ram`etres ont ´et´e estim´es. Plus pr´ecis´ement, c’est r´epondre `a la question, ferm´ee, de savoir si l’hypoth`ese selon laquelle le mod`ele consid´er´e repr´esente ad´equatement les relations de cause `a effet sur V ne se r´ev`ele pas incoh´erente `a la lumi`ere de l’estimation des param`etres causaux. Nous identifions trois types de tests qui peuvent (et donc devraient) ˆetre men´es `a l’´etape 3. de la proc´edure d´ecrite plus haut. Ils consistent respectivement `a :

a. s’assurer que les signes et valeurs absolues des estimations obtenues pour les param`etres sont plausibles. Cette v´erification doit ˆetre `a la fois locale et globale. Localement, il s’agit de v´erifier que le signe et la valeur absolue de l’estimation de chaque param`etre fait sens. En particulier, chacun de ces param`etres doit ˆetre significativement diff´erent de z´ero. En effet, si ce n’´etait pas le cas, alors le mod`ele – qui pr´ecis´ement pos- tule l’existence de relations de cause `a effet auxquelles les param`etres sont associ´es – doit ˆetre rejet´e. De fa¸con g´en´erale, les cons´equences des examens locaux aussi bien que globaux men´es `a ce point portent toujours sur le mod`ele lui-mˆeme, qui est rejet´e ou non ;

b. calculer les r´esidus de corr´elation – c’est-`a-dire les diff´erences entre les corr´elations impliqu´ees par le mod`ele et les corr´elations observ´ees – et v´erifier qu’aucun n’a une valeur absolue sup´erieure `a 0,117. Ce test

repose sur ceci que si un mod`ele est causal, alors la corr´elation entre deux variables doit ˆetre ´egale `a la somme des param`etres causaux et des corr´elations non causales qui figurent le long des diff´erents chemins entre les deux variables. C’est cette somme qu’on appelle « corr´elation impliqu´ee par le mod`ele », et qu’on compare `a la corr´elation effective- ment observ´ee. Dans le cas o`u le mod`ele est acyclique, l’´egalit´e entre les corr´elations impliqu´ees par le mod`ele et les corr´elations observ´ees est connue sous le nom de « r`egle du trac´e » (tracing rule)18;

c. calculer les restrictions de sur-identification (over-identification res- trictions) – c’est-`a-dire la diff´erence entre deux estimations diff´erentes des mˆemes param`etres structurels – et v´erifier que l’hypoth`ese selon laquelle elles sont nulles ne peut pas ˆetre rejet´ee. L’id´ee est ici la sui- vante : pour des mod`eles sur-identifi´es, il est parfois possible d’estimer

17

Il s’agit d’une valeur conventionnelle mais g´en´eralement accept´ee.

18

un mˆeme param`etre de plusieurs fa¸cons diff´erentes. Si le mod`ele est cor- rect, ces diff´erentes m´ethodes doivent donner des r´esultats identiques. R´eciproquement, si ces m´ethodes donnent des r´esultats diff´erents, alors le mod`ele peut ˆetre rejet´e.

Mesurer l’ad´equation d’un mod`ele aux donn´ees, c’est ´evaluer le degr´e au- quel le mod`ele est capable de reproduire les donn´ees. Il ne s’agit donc plus d’examiner si le mod`ele en tant qu’il est estim´e est plausible, mais de confron- ter le mod`ele aux donn´ees. En outre, la question pos´ee n’est plus une ques- tion ferm´ee, qui requiert une r´eponse cat´egorique, mais une question ouverte, qui appelle une r´eponse gradu´ee, quantifi´ee. C’est pr´ecis´ement ce caract`ere gradu´e qui rend possible la comparaison des mod`eles entre eux sur le crit`ere de leur ad´equation aux donn´ees. Il existe diff´erentes mesures de l’ad´equation d’un mod`ele aux donn´ees, qui portent sur des aspects diff´erents du rapport entre les donn´ees et le mod`ele consid´er´e. Plusieurs de ces grandeurs peuvent ˆetre calcul´ees `a l’´etape E de la proc´edure d’inf´erence causale AC. Le « chi- deux » d’un mod`ele est sans doute la plus fondamentale d’entre elles, au sens o`u les mesures plus complexes mobilisent presque toujours cette grandeur. Elle repr´esente ce que le mod`ele explique des corr´elations entre les variables consid´er´ees. On notera que mesurer l’ad´equation d’un mod`ele n’a de sens que si ce mod`ele est sur-identifi´e ; dans le cas contraire, le mod`ele estim´e ne peut qu’ˆetre compl`etement ad´equat aux donn´ees.

Engendrer un mod`ele ´equivalent `a un mod`ele donn´e, c’est construire un mod`ele diff´erent du mod`ele initial mais qui pr´edit les mˆemes corr´elations que lui. Des mod`eles ´equivalents ont la mˆeme ad´equation aux donn´ees, pour toutes les mesures d’ad´equation. Il existe des algorithmes d’engendrement de mod`eles ´equivalents `a un mod`ele donn´e.19

Cette explication des termes mobilis´es `a l’occasion de la description de la proc´edure d’inf´erence causale AC ach`eve notre description de cette proc´edure. Surtout, elle nous permet de montrer en quoi cette proc´edure est conforme au principe de l’hypoth´etico-d´eduction tel qu’il est formul´e par Popper.

3.2.2.4 Caract`ere hypoth´etico-d´eductif de la proc´edure d´efinie Il est clair que l’´etape A est le moment o`u est formul´ee une hypoth`ese, que l’´etape B est le moment o`u des cons´equences sont tir´ees de cette hypoth`ese et l’´etape C le moment o`u ces cons´equences sont utilis´ees pour tester l’hy- poth`ese. Plus pr´ecis´ement, l’´etape C consiste `a d´eterminer si les cons´equences du mod`ele sont compatibles avec les donn´ees. Il nous semble que ce qui se

19

3.2. Inf´erence causale traditionnelle 129

passe apr`es qu’on a test´e le mod`ele estim´e est moins imm´ediatement clair. Nous nous y arrˆetons donc plus longuement.

Une fois que le mod`ele a ´et´e test´e (`a l’´etape C), il est rejet´e si et seulement si ses cons´equences ne sont pas compatibles avec les donn´ees. Puis, seulement ensuite et d’abord `a l’´etape E, a lieu la comparaison entre hypoth`eses que prescrit Popper. Plus pr´ecis´ement, la comparaison est alors entre les mod`eles qui n’ont pas ´et´e rejet´es `a l’issue de l’´etape C de test. Il apparaˆıt alors clai- rement que mener la comparaison entre mod`eles apr`es que les mod`eles ont ´et´e test´es s´epar´ement permet de comparer entre eux seulement des candidats d´ej`a s´erieux au titre de mod`ele ad´equat.

Ces candidats s´erieux sont compar´es sur le crit`ere de leur ad´equation aux donn´ees. Plus exactement, on retient `a l’issue de l’´etape E celui des mod`eles compar´es qui a la meilleure ad´equation aux donn´ees. Une fois ce mod`ele identifi´e, on compare les mod`eles qui lui sont ´equivalents et on retient le plus plausible d’entre eux. Prises en ensemble, les ´etapes E et F constituent une inf´erence `a la meilleure explication au sens o`u Harman d´efinit cette no- tion : « on inf`ere, de la pr´emisse qu’une hypoth`ese donn´ee fournirait une “meilleure” explication que n’importe quelle hypoth`ese, la conclusion selon laquelle l’hypoth`ese donn´ee est vraie »20. D’une part, en effet, l’ad´equation

d’un mod`ele aux donn´ees est g´en´eralement consid´er´ee comme sa capacit´e `a expliquer les donn´ees. L’´etape E vise donc `a choisir celle qui explique le plus parmi les hypoth`eses formul´ees (`a l’´etape A) et qui n’ont pas ´et´e rejet´ees (`a l’issue de C). D’autre part, l’´etape F vise `a identifier celle qui est la plus plausible, et en ce sens la meilleure, parmi des hypoth`eses ´egalement expli- catives. En effet, ´etant ´equivalentes, elles ont le mˆeme score pour toutes les mesures d’ad´equation aux donn´ees.