Proc´edure d’inf´erence causale traditionnelle

3.2 Inf´erence causale traditionnelle

3.2.2 Proc´edure d’inf´erence causale traditionnelle

L’objet de la section qui commence est de définir une procédure d’inférence causale hypothético-déductive qui utilise les outils de l’analyse de chemins. En vue de cela, nous commen¸cons par rappeler ce qu’il faut entendre précisément par « hypothético-déduction ».

3.2.2.1 Hypoth´etico-d´eduction

La définition classique de l’hypothético-déduction est proposée dans Pop- per (1934) : il s’agit de

la méthode qui consiste à mettre les théories à l’épreuve dans un esprit critique et à les sélectionner conformément aux résultats des tests, suit

Plus exactement, c’est une caractérisation de « a-théorique » qui a été donnée plus haut. Toutefois, il est clair que cette définition implique une définition de « théorique ».

3.2. Inf´erence causale traditionnelle 125

toujours la même démarche : en partant d’une nouvelle idée, avancée à titre d’essai et nullement justifiée à ce stade – qui peut être une prévision, une hypothèse, un système théorique ou tout ce que vous voulez –, l’on tire par une déduction logique des conclusions. L’on compare alors ces conclusions les unes aux autres et à d’autres énoncés relatifs à la question de manière à trouver les relations logiques (telles l’équivalence, la déductibilité, la compatibilité ou l’incompatibilité) qui les unissent.13

Ainsi, les inférences hypothético-déductives se déroulent en quatre temps : i) une hypothèse est formulée ;

ii) des conséquences en sont tirées ; iii) l’hypothèse est mise à l’épreuve ; iv) l’hypothèse est rejetée ou acceptée.

Pour ce qui est de la mise à l’épreuve de l’hypothèse, Popper distingue en particulier deux choses : d’une part les tests portant sur les conséquences tirées de l’hypothèse14_{, d’autre part « la comparaison de la théorie [c’est-à-}

dire de l’hypothèse] à d’autres théories, dans le but principal de déterminer si elle constituerait un progrès scientifique au cas où elle survivrait à nos divers tests »15_{. Il nous semble clair que la logique de l’hypothético-déduction}

n’impose pas un ordre dans lequel les différentes mises à l’épreuve devraient avoir lieu.

Maintenant que nous savons précisément ce qu’est l’hypothético- déduction, nous pouvons définir une procédure d’inférence causale hy- pothético-déductive mobilisant les outils de l’analyse de chemins. Nous le faisons en deux temps. D’abord, nous énumérons les grandes étapes de cette procédure. Ensuite, nos explicitons ce qu’il s’agit de faire à chaque moment.

3.2.2.2 Etapes de l’inf´´ erence aux causes traditionnelle

Etant donnés un ensemble de variables V et des données probabilistes re- latives à V, la procédure d’inférence causale AC que nous définissons consiste à :

Etape A : Spécifier un modèle causal sur-identifié (over-identified ), M . ´

Etape B : Estimer la valeur des paramètres associés aux différentes relations de cause à effet représentées par M.

Etape C : Tester M et décider s’il doit être rejeté.

Popper (1934) pp. 28–29.

Ces tests peuvent eux-mˆemes ˆetre de plusieurs types.

Etape D : Réitérer les étapes A à C pour des modèles différents de M. ´

Etape E : Identifier celui des modèles non rejetés à l’issue de C qui a la meilleure adéquation (fit) aux données, et noter M* ce modèle.

Etape F : Identifier, parmi des modèles équivalents à M*, celui dont il est le plus plausible qu’il représente adéquatement la structure causale sur V, et noter M IV ce modèle.

M IV est le résultat de la procédure d’inférence causale.

En vue de montrer que cette procédure est bien hypothético-déductive au sens popperien du qualificatif, il nous faut rendre plus sensible et explicite ce en quoi consiste chaque étape de la procédure que nous venons de décrire.

3.2.2.3 Explicitation

Dans le paragraphe qui commence, nous reprenons chacune à son tour les différentes étapes de la procédure d’inférence causale qui vient d’être définie et, pour chacune, nous explicitons ce qui exige de l’être.

Spécifier un modèle causal , c’est définir un graphe orienté qui pourrait représenter adéquatement les relations de cause à effet directes sur l’ensemble de variables V qu’on considère. Un modèle est sur-identifié si et seulement si il a des degrés de liberté, c’est-à-dire si et seulement si le nombre de ses paramètres est inférieur au nombre d’observations autorisé par V. Une ob- servation autorisée par V est soit la variance d’une variable de V, soit la covariance entre deux variables de V. Le nombre d’observations autorisées par V est kVk(kVk+1)/2. Pour ce qui est des notions d’identification autres que la sur-identification et des critères d’identification, nous renvoyons le lec- teur à Kline (1998).16

Estimer les paramètres causaux d’un modèle, c’est déterminer quel est l’effet quantitatif de la variation de la valeur d’une cause supposée sur la valeur de l’un de ses effets supposés. Dans le cas linéaire, le plus simple, c’est estimer quelle différence cela fait sur la valeur de l’effet que la valeur de la cause augmente d’une unité. Pour un modèle sur-identifié, il est théoriquement possible de dériver une estimation unique de chacun des paramètres causaux. Deux options sont possibles pour l’estimation des paramètres causaux d’un modèle :

– l’estimation par régression multiple. Le principe est alors le suivant : pour chaque variable, on considère les relations pour lesquelles elle est effet et on attribue aux paramètres correspondant à ces relations la valeur qui minimise la distance entre les valeurs de V qu’on observe et les valeurs de V que le modèle prédit ;

3.2. Inf´erence causale traditionnelle 127

– l’estimation par maximum de vraisemblance. Il s’agit alors de maxi- miser la vraisemblance de l’hypothèse selon laquelle les observations données sont tirées de la population considérée.

Le choix de l’une ou de l’autre de ces options dépend en particulier des hypothèses qu’on émet à propos du modèle.

Tester un modèle, c’est déterminer s’il reste plausible après que les pa- ramètres ont été estimés. Plus précisément, c’est répondre à la question, fermée, de savoir si l’hypothèse selon laquelle le modèle considéré représente adéquatement les relations de cause à effet sur V ne se révèle pas incohérente à la lumière de l’estimation des paramètres causaux. Nous identifions trois types de tests qui peuvent (et donc devraient) être menés à l’étape 3. de la procédure décrite plus haut. Ils consistent respectivement à :

a. s’assurer que les signes et valeurs absolues des estimations obtenues pour les paramètres sont plausibles. Cette vérification doit être à la fois locale et globale. Localement, il s’agit de vérifier que le signe et la valeur absolue de l’estimation de chaque paramètre fait sens. En particulier, chacun de ces paramètres doit être significativement différent de zéro. En effet, si ce n’était pas le cas, alors le modèle – qui précisément pos- tule l’existence de relations de cause à effet auxquelles les paramètres sont associés – doit être rejeté. De fa¸con générale, les conséquences des examens locaux aussi bien que globaux menés à ce point portent toujours sur le modèle lui-même, qui est rejeté ou non ;

b. calculer les résidus de corrélation – c’est-à-dire les différences entre les corrélations impliquées par le modèle et les corrélations observées – et vérifier qu’aucun n’a une valeur absolue supérieure à 0,117_{. Ce test}

repose sur ceci que si un modèle est causal, alors la corrélation entre deux variables doit être égale à la somme des paramètres causaux et des corrélations non causales qui figurent le long des différents chemins entre les deux variables. C’est cette somme qu’on appelle « corrélation impliquée par le modèle », et qu’on compare à la corrélation effective- ment observée. Dans le cas où le modèle est acyclique, l’égalité entre les corrélations impliquées par le modèle et les corrélations observées est connue sous le nom de « règle du tracé » (tracing rule)18_;

c. calculer les restrictions de sur-identification (over-identification restrictions) – c’est-à-dire la différence entre deux estimations différentes des mêmes paramètres structurels – et vérifier que l’hypothèse selon laquelle elles sont nulles ne peut pas être rejetée. L’idée est ici la sui- vante : pour des modèles sur-identifiés, il est parfois possible d’estimer

Il s’agit d’une valeur conventionnelle mais généralement acceptée.

un même paramètre de plusieurs fa¸cons différentes. Si le modèle est cor- rect, ces différentes méthodes doivent donner des résultats identiques. Réciproquement, si ces méthodes donnent des résultats différents, alors le modèle peut être rejeté.

Mesurer l’adéquation d’un modèle aux données, c’est évaluer le degré au- quel le modèle est capable de reproduire les données. Il ne s’agit donc plus d’examiner si le modèle en tant qu’il est estimé est plausible, mais de confron- ter le modèle aux données. En outre, la question posée n’est plus une question fermée, qui requiert une réponse catégorique, mais une question ouverte, qui appelle une réponse graduée, quantifiée. C’est précisément ce caractère gradué qui rend possible la comparaison des modèles entre eux sur le critère de leur adéquation aux données. Il existe différentes mesures de l’adéquation d’un modèle aux données, qui portent sur des aspects différents du rapport entre les données et le modèle considéré. Plusieurs de ces grandeurs peuvent être calculées à l’étape E de la procédure d’inférence causale AC. Le « chi- deux » d’un modèle est sans doute la plus fondamentale d’entre elles, au sens où les mesures plus complexes mobilisent presque toujours cette grandeur. Elle représente ce que le modèle explique des corrélations entre les variables considérées. On notera que mesurer l’adéquation d’un modèle n’a de sens que si ce modèle est sur-identifié ; dans le cas contraire, le modèle estimé ne peut qu’être complètement adéquat aux données.

Engendrer un modèle équivalent à un modèle donné, c’est construire un modèle différent du modèle initial mais qui prédit les mêmes corrélations que lui. Des modèles équivalents ont la même adéquation aux données, pour toutes les mesures d’adéquation. Il existe des algorithmes d’engendrement de modèles équivalents à un modèle donné.19

Cette explication des termes mobilisés à l’occasion de la description de la procédure d’inférence causale AC achève notre description de cette procédure. Surtout, elle nous permet de montrer en quoi cette procédure est conforme au principe de l’hypothético-déduction tel qu’il est formulé par Popper.

3.2.2.4 Caractère hypothético-déductif de la procédure définie Il est clair que l’étape A est le moment où est formulée une hypothèse, que l’étape B est le moment où des conséquences sont tirées de cette hypothèse et l’étape C le moment où ces conséquences sont utilisées pour tester l’hy- pothèse. Plus précisément, l’étape C consiste à déterminer si les conséquences du modèle sont compatibles avec les données. Il nous semble que ce qui se

3.2. Inf´erence causale traditionnelle 129

passe après qu’on a testé le modèle estimé est moins immédiatement clair. Nous nous y arrêtons donc plus longuement.

Une fois que le modèle a été testé (à l’étape C), il est rejeté si et seulement si ses conséquences ne sont pas compatibles avec les données. Puis, seulement ensuite et d’abord à l’étape E, a lieu la comparaison entre hypothèses que prescrit Popper. Plus précisément, la comparaison est alors entre les modèles qui n’ont pas été rejetés à l’issue de l’étape C de test. Il apparaˆıt alors clai- rement que mener la comparaison entre modèles après que les modèles ont été testés séparément permet de comparer entre eux seulement des candidats déjà sérieux au titre de modèle adéquat.

Ces candidats sérieux sont comparés sur le critère de leur adéquation aux données. Plus exactement, on retient à l’issue de l’étape E celui des modèles comparés qui a la meilleure adéquation aux données. Une fois ce modèle identifié, on compare les modèles qui lui sont équivalents et on retient le plus plausible d’entre eux. Prises en ensemble, les étapes E et F constituent une inférence à la meilleure explication au sens où Harman définit cette no- tion : « on infère, de la prémisse qu’une hypothèse donnée fournirait une “meilleure” explication que n’importe quelle hypothèse, la conclusion selon laquelle l’hypothèse donnée est vraie »20_{. D’une part, en effet, l’adéquation}

d’un modèle aux données est généralement considérée comme sa capacité à expliquer les données. L’étape E vise donc à choisir celle qui explique le plus parmi les hypothèses formulées (à l’étape A) et qui n’ont pas été rejetées (à l’issue de C). D’autre part, l’étape F vise à identifier celle qui est la plus plausible, et en ce sens la meilleure, parmi des hypothèses également expli- catives. En effet, étant équivalentes, elles ont le même score pour toutes les mesures d’adéquation aux données.

Dans le document Causalité et probabilités : réseaux bayésiens, propensionnisme (Page 141-146)