Le problème du modèle statistique en psychologie

PROPRIETES MENTALES ET VARIABLES LATENTES

2.1 Le problème de la mesure en psychologie

2.4.1 Le problème du modèle statistique en psychologie

Une représentation sur une échelle numérique ne prétend pas refléter une vraie propriété au sens d’une représentation d’une réalité, mais bien comme une représentation objectivée. Mais son opérationnalisation va user de modèles statistiques qui ne sont pas sans poser des questions.

2.4.1.1 Lois et langage logico-mathématique

Comme le dit Falissard (2008b) « La mesure est donc avant tout une commodité, un outil qui

permet de mieux se représenter les faits que l’on étudie [...] faciliter la compréhension de phénomènes trop complexes pour être appréhendés directement. ». L’homme catégorise et a

besoin de construire un cadre formel de cette catégorisation. Le cadre formel des mathématiques, et le formalisme logique associé, est une manière usuelle en science pour représenter la réalité, ou une relation théorique entre différents objets. Sherry (2011) considère “our ontology requires mathematical objects because they are indispensable for

science. ». Putnam (1998) a écrit un petit ouvrage dédié à la logique mathématique. Putnam

pose que l’usage d’une représentation mathématique est indispensable en physique car on ne peut construire de lois sans recours au langage logico-mathématique, c’est-à-dire sans recours aux nombres, aux fonctions, aux ensembles, … De même Vautier (2012) cite Granger : « La

connaissance scientifique de ce qui relève de l'expérience consiste toujours à construire des schémas ou modèles abstraits de cette expérience, et à exploiter, au moyen de la logique et des mathématiques, les relations entre les éléments abstraits de ces modèles, de façon à déduire finalement des propriétés correspondant avec suffisamment de précision à des propriétés empiriques directement observables ».

Mais ce qui est « vrai » pour la physique, à la recherche de lois, l’est-elle pour la psychologie ? Le langage mathématique en psychologie renvoie à des questions relatives à la

178 logique mathématique et son efficience pour la psychologie. Granger (2002) écrit : « Les

sciences de l’homme se trouvent de par leur propre nature placées devant un dilemme. Ou réduire totalement les significations à des sens strictement mis en forme, au risque de voir s’évanouir la spécificité de leur objet, et dégénérer en exercices logico-mathématiques. Ou introduire massivement et naïvement les significations comme telles, et, perdant toute possibilité de construire vraiment des modèles abstraits, se muer, dans le meilleur des cas en herméneutique philosophique, en vaticinations mythiques dans le pire. » (p. 272).

Il y a en effet un grand risque en usant de l’écriture logico-mathématique de glisser vers la recherche de « lois » en psychologie au sens lois déterministes. Or c’est l’absence de telles lois déterministes qui autorise certains auteurs à considérer la psychologie comme non- scientifique. J. Kim (2009) considère que « la recherche de lois pour constitutive de la nature

même de la science [...] faute de lois psychologiques, la psychologie ne saurait être une science [...] [les chercheurs en psychologie] ne produisent pas des théories psychologiques, des systèmes englobants et intégrés de lois générales exactes, formulés dans un vocabulaire proprement théorique, à partir desquels les phénomènes mentaux pourraient être expliqués et prédits ». J. Kim se base sur Davison qui positionne « la psychologie comme une philosophie » et non comme une science, car pour Davidson il n’y a pas « de lois déterministes strictes » (cité par J. Kim pp.21-22). Cette question du caractère scientifique de

la psychologie renvoie à l’objet de la science. Je suis en accord avec Putnam (1998) : « il est

difficile de croire qu’il puisse exister une chose telle que " le but de la science" » (p. 67).

Même si l’objet de la recherche en psychologie n’est pas des lois déterministes, je considère que la psychologie est pour autant dans une démarche scientifique en posant un cadre de discussion collectif pour faire progresser la connaissance, au sens où Bourdieu (2001) pose ce collectif comme communauté scientifique.

Juhel (2013a, p. 13) définit l’objectif de la psychologie comme « de rendre compte des

mécanismes psychologiques qui sous-tendent les diverses formes d’invariance du comportement humain. ». Je peux adhérer à cette définition si on comprend qu’en

psychologie, comme dans tout champ scientifique, il y a « de l’ordre, une logique, bref

quelque chose à comprendre dans le monde, y compris dans le monde social » (Bourdieu,

2001). Mais à contrario l’usage de terme « d’invariance » peut renvoyer me semble-t-il à des formes de « lois déterministes » (cette formulation peut entrainer l’idée que l’objectif serait de rendre compte des formes déterministes, sans variance, du comportement humain). On retrouve un glissement vers un déterminisme aussi chez Vautier (2015g) qui définit la psychologie comme « la découverte de principes psychologiques généraux c’est-à-dire

179

valables pour tout système psychologique et falsifiables (i.e., tels que l’observation d’un cas particulier peut en droit falsifier la théorie) », qui me semble renvoyer aussi vers une

recherche de lois déterministes. A mes yeux, si la psychologie se contente comme objectif de rendre compte « d’invariance » ou de « principes valables pour tout système psychologique », le champ est faible car il ne peut s’agir que de lois déterministes rares en psychologie. Si on entend « formes d’invariance » dans un sens plus souple (« forme »), je peux adhérer à la définition de Juhel.

La psychologie est, en effet, en tension entre une forme de déterminisme et une forme d’indéterminisme. Il y a du sens dans les propriétés mentales, donc nous cherchons des règles de déterminations… mais sans considérer que ce sens soit régit comme pour les lois des sciences de la nature, ne serait-ce que par la nécessité de renégocier les objets dont la psychologie discute (des propriétés mentales inscrites dans une pratique sociale). Je considère, sans vouloir définir précisément l’objet de la psychologie, que nous recherchons plutôt des « tendances », des « propensions», de certains mécanismes psychologiques ; sans affirmer que de telles relations soient « invariantes », ou qu’elles soient des « principes généraux », mais bien des relations « en moyenne » opérantes si on les considère inscrites dans une pratique à laquelle le chercheur appartient. C’est-à-dire des lois « probables » (au sens statistique) et non « déterministes » de relations entre propriétés mentales considérées comme appréhendées relativement à un contexte et enjeu (donc bien en rupture avec une prétention de déterminer des relations entre propriétés qui seraient valides indépendamment de notre pratique sociale). En accord avec Rouxel (2015) « Les psychologues, quelle que soit

leur orientation, ne peuvent qu’être d’accord avec l’idée selon laquelle les personnes possèdent des dispositions à se comporter de façon consistante [...] à minima dans certaines classes de situations » (p. 127). On parle de « consistance » ici et non « d’invariance » ou de

« principes valables pour tout système psychologique ».

Le recours au langage logico-mathématique me parait une nécessité en psychologie dans certaines situations, si ce recours est inscrit dans cette démarche claire de refus de chercher des « lois », mais bien d’user de modélisation dans le sens de faire progresser la connaissance pour comprendre des mécanismes « probables », c’est-à-dire user du langage logico- mathématique pour poser des modèles statistiques et non des modèles déterministes.

180 2.4.1.2 Limites du langage logico-mathématique

Comme le dit Putnam (1998), dans un formalisme mathématique « Ce qui est vrai ce n’est

pas l’énoncé [...] mais ce que signifie l’énoncé » (p. 21). Il doit donc y avoir un retour vers le

« sens » d’une formalisation logico-mathématique en psychologie car tout le cadre de référence (catégories, mesures, …) est inscrit dans une pratique précise (contexte, enjeu). Je peux reprendre les mots de Merleau-Ponty (1960/2001, p. 127) en l’appliquant à la psychologie : « Si l'objectivisme ou le scientisme réussissait jamais à priver la sociologie de

tout recours aux significations, il ne la préserverait de la "philosophie" qu'en lui fermant l'intelligence de son objet. Nous ferions peut-être alors des mathématiques dans le social, nous n'aurions pas la mathématique de la société considérée. Le sociologue fait de la philosophie dans toute la mesure où il est chargé non seulement de noter les faits, mais de les comprendre. ».

Donc clairement, le recours à un langage logico-mathématique ne doit pas annihiler le sens que les mathématiques ne donnent pas. Armatte (2005) considère, avec raison je pense, qu’un modèle mathématique est un formalisme logico-mathématique qui est une abstraction extraite d’une réalité ; et donc le terme « modèle » renvoie à une vision normative qui doit être appréhendée avec du recul en psychologie car tout cadre normatif oublie les singularités. Armatte cite Suppes : « une théorie est une entité linguistique faite d'énoncés alors que les

modèles sont des entités non linguistiques dans lesquelles la théorie est satisfaite. », et donc

avec une confusion potentielle, voire inversion de sens entre « modèle » et « théorie ». Donc l’objet d’un modèle en psychologie doit clairement être compris comme un support pour extraire du sens, passer du « modèle » à la « théorie » par le « sens », mais non dans une vision normative et déterministe.

C’est dans ce rapport psychologie/langage-logico-mathématique/sens que l’article de Falissard, Révah, Yang, & Fagot-Largeault (2013) me semble très intéressant. Ces auteurs cherchent à repositionner la taxinomie usuelle qui oppose les études qualitatives aux études quantitatives. Une nouvelle taxinomie est proposée basée sur deux axes différents : 1/ le langage symbolique de représentation des objets analysés ; et 2/ la relation entre les objets analysés. Le langage de représentation peut être “littéraire”, “mathématique” ou “un mélange des deux”. La relation entre les objet peut être “herméneutique", ”déterministe” ou “statistique” (au sens de relations “probables”).

181 TABLEAU 3 : TAXONOMIE DES APROCHES EN RECHERCHE PSYCHIATRIQUE

Tiré de par Falissard et al. (2013, p. 5)

La psychométrie est clairement positionnée le plus souvent dans une représentation mélangeant le « littéraire » et le « mathématique » ; et l’analyse est le plus souvent « statistique ». La différence entre un modèle « mathématique » et un modèle « statistique » est caractérisé ainsi : « Some could argue at this point that statistics are a branch of

mathematics and that obviously equations are very common in this discipline (linear regression models, often used in psychiatric research, are indeed equations). The distinction between the two categories “statistics” and “equations” (B. and C.) could thus be highly questionable. The difference is that statistical procedures do not inherently provide formal, universal and deterministic relationships. In short, deterministic equations provide relationships that are supposed to be true in all instances, for everyone, while most statistical relationships are only true for an average subject, who does not exist in practice. » (p. 7).

En reprenant ce cadre, nous pouvons considérer que la psychométrie, usant d’écriture mathématique, comme non inscrite dans une démarche fondamentalement “mathématique” mais bien “statistique” au sens donné par Falissard et al. (2013) ; c’est-à-dire cherchant non des modèles « exacts » mais bien des modèles « probables » au sens statistique du terme (vrais en moyenne en quelque sorte). Je reviendrai par la suite sur ce que ces auteurs ajoutent à la fin de l’extrait (« true for an average subject, who does not exist in practice ») car cela est fondamental. On peut rapprocher ce cadre défini par ces auteurs au « style statistique » dans l’histoire de l’argumentation scientifique tel que Hacking (1992) le discute comme trajectoire particulière de procédure de vérifications scientifique.

2.4.1.3 Tensions d’un modèle statistique

L’usage de modélisations statistique s’appuie, partiellement, sur une formalisation en langage mathématique. Cette écriture laisse souvent considérer une « objectivité » au travail quantitatif que n’aurait pas un travail s’appuyant sur des études qualitatives. Or, comme

182 l’explique Falissard et al. (2013), la construction du discours et de la pratique est en réalité assez proche entre les études quantitatives et les études qualitatives. Le discours d’une étude quantitative en psychologie se différencie d’un discours mathématique. Ce dernier se suffit du formalisme logico-mathématique ; les études quantitatives en psychologie introduisent littéralement le modèle et analysent les résultats empiriques de même par un formalisme littéraire et non dans un formalisme logico-mathématique. En accord avec ces auteurs, les études quantitatives ne différent pas des procédures des études qualitatives car fondamentalement : « differing degrees of mathematical representation each involve

subjective and heuristic choices that impact the results and their interpretation. » (Falissard et

al., 2013, p. 8).

Il y a donc une analyse réflexive à avoir sur une approche statistique car des choix subjectifs impactent les résultats. Je m’appuie sur deux schémas pour clarifier cette position.

D’une part il faut clairement différencier une propriété mentale, le concept associé, et la formalisation mathématique de la propriété mentale.

FIGURE 13 : SCHEMA DIFFERENCIANT PROPRIETE-CONCEPT-VARIABLE

- La variable renvoie à la représentation de la propriété mentale dans un formalisme logico-mathématique ;

- le concept est la catégorisation pratique par une formalisation linguistique de la propriété mentale.

La variable et le concept sont deux formalisations différentes d’une seule et même propriété mentale ; il n’y a pas équivalence entre le concept et la variable. C’est là, de prime abord ,une dérive fréquente dans la littérature que d’assimiler la variable au concept, et la variable à l’objet (Maraun & Gabriel, 2013; Maraun & Peters, 2005). Il y a une démarche de « choix » du concept et de la variable (Quels items ? Quel codage ?).

Concept Propriété

mentale

183 Cette tension entre propriété mentale, concept et variable va générer des tensions entre théorie et modèle statistique. Je représente dans le schéma suivant en flèches rouges les « implications » et en flèches noires les « tensions » dans une modélisation.

FIGURE 14 : SCHEMA DU PROCESSUS D’UNE APPROCHE QUANTITATIVE

- La propriété mentale étudiée renvoie à une « théorie » sur la propriété mentale inscrite dans une pratique et non comme une « vérité » en soi ;

- Cette « théorie » sur la propriété mentale (unidimensionnalité de la propriété mentale, indépendance locale, …) permet de « conceptualiser » la propriété mentale dans un cadre pratique ;

- Cette théorie sur la propriété mentale permet de poser si la propriété mentale peut être représentée ou non sur une échelle numérique ;

- Une telle formalisation dans le langage numérique va autoriser une formalisation d’un « modèle statistique ». Ce modèle représente dans le langage logico-mathématique la « théorie », mais il n’y a pas équivalence entre les deux. Concrètement, une même théorie sur une propriété mentale peut faire l’objet de différentes modélisations. Si je prends par exemple les modèles d’équations structurelles (SEM), nous pouvons

Concept la propriété mentale peut être représentée

quantitativementivement Modèle statistique Opérationnalisation (Variable) Data Propriété mentale Théorie sur la propriété mentale Fit ?

184 utiliser les SEM soit par l’approche CB-SEM (covariance based) ou soit par l’approche PLS-SEM (partial least square based) qui répondent à deux modèles mathématiques différents pour un même cadre théorique (et donneront des résultats différents, parfois très proches, parfois éloignés).

- Ce modèle statistique renvoie à l’opérationnalisation26 des variables, la mesure concrète pour résumer. Cette opérationnalisation d’une mesure n’est pas unique et peut être entreprise de différentes manières (choix des manifestations ; choix des mesures, sur une échelle de Likert ou autres par exemple ; choix des items ; …). Il y a donc un choix dans l’opérationnalisation et donc pas d’identité entre la variable opérationnalisée et le concept. La variable opérationnalisée est une démarche de « représentation » pratique basée sur un langage logico-mathématique pour mesurer la propriété mentale ;

- Le modèle statistique est validé, ou non, par des critères « statistiques » (que j’ai résumé par « fit »)… avec comme nous le savons tous les problèmes liés (puissance des Goodness of Fit, GOF ; potentiel modèle concurrents ; ….). Donc la validation « statistique » d’un modèle n’est en rien une validation du modèle théorique.

Il y a donc tout au cours de la formalisation et de l’analyse des « choix » et des « heuristiques » qui demandent un retour réflexif. Je renvoie pour exemple au livre de Desrosières (2008a) qui discute entre autres des implications/choix liées au choix d’user de la régression logistique ou de l’analyse des correspondances par exemple (chapitre 1).

2.4.1.4 Validité d’un modèle statistique ?

Si je développe ce schéma, c’est pour pointer à mon sens les erreurs qui me semblent exister dans la littérature académique. Combien d’articles après avoir « modélisé » et « validé » un modèle statistique (par un GOF ou une p-value) prétendent sans retenu avoir « montré » (voire « démontré ») la validité du modèle théorique. Du modèle statistique à la théorie il y a l’ajout du « sens », c’est à dire que nous remontons d’un formalisme logico-mathématique (avec tout l’avantage de ce formalisme, mais aussi son incapacité à donner du « sens ») à notre conception pratique de la propriété mentale. C’est ce sens que donne le cadre théorique,

« une théorie est opérationaliste quand les termes théoriques, auxquels elle recourt, sont définis par

l'énonciation de procédures expérimentales permettant de leur assigner une grandeur de les mesurer. (Drouet,

185 ce que Falissard et al. (2013) considèrent comme le discours dans un formalisme littéraire et non plus logico-mathématique. Le modèle statistique, son opérationnalisation et sa validation, ne sont que des supports à l’intelligence scientifique et ne portent en eux-mêmes aucun « sens » pratique. C’est en cela que la pratique concrète dans l’écriture d’un travail de recherche use du langage littéraire pour donner ce « sens » aux résultats… comme une étude « qualitative » (cf. Falissard et al., 2013).

Je me permets de développer rapidement cette « fragilité » relative de résultats statistiques, non pour considérer qu’elles ne fournissent pas d’information, mais pour rappeler que cette information statistique ne prouve pas la validité du modèle théorique (entre autres, aucun modèle statistique ne prouve qu’une propriété mentale soit mesurable). Si je considère les deux formes qui paraissent les plus usuelles avec les variables latentes, le modèle de Rasch et les SEM, nous pouvons souvent lire cette hérésie (je reprends le terme de Maraun) de considérer qu’un modèle statistique, validé par un indicateur statistique (GOF), valide le modèle théorique. Pour le modèle de Rasch, P. Barrett (2005), Borsboom & Scholten (2008), Michell (2004), Scholten (2011b), Sijtsma (2012b) par exemple illustrent sur des exemples précis que des données issues d’une propriété mentale non quantitative peuvent valider empiriquement un modèle de Rasch. Pour les SEM, de même, bien des travaux montrent la faible puissance des indicateurs statistiques (Chen, Curran, Bollen, Kirby, & Paxton, 2008; Fan, Thompson, & Wang, 1999; Steiger, 2007) et le fait que des modèles empiriques valides statistiquement sont néanmoins erronés relativement aux cadres théoriques de données générées (Jarvis et al., 2003; MacCallum & Browne, 1993). Sijtsma (2012b, p. 800) écrit pour le modèle de Rasch, mais cela peut s’étendre aux SEM et autres modèles avec variables latentes : « however, an IRT model cannot “know” that the operationalization was incorrect

and thus cannot reveal this [...] However, the Rasch model is a statistical model, and I contend that whether it refers to the real world depends on whether its formal structure matches the theoretical structure of an attribute. ».

Je peux illustrer par un autre exemple la tension entre modèle théorique et validation empirique. L’alpha de Cronbach est encore aujourd’hui souvent utilisé pour valider une échelle de mesure d’une propriété mentale en tant que validation de l’unidimensionnalité et fiabilité de cette échelle (reliability). Or l’usage de l’alpha de Cronbach semble en contradiction avec ses qualités mathématiques. Je ne développe pas ce point mais je renvoie à quelques articles qui pointent l’efficience relative de cet indicateur et sa nature « mathématique » vs son « usage » : Green & Yang (2009); Rouquette & Falissard (2011); Sijtsma (2009a, 2009b).

186

2.4.2 Le problème des probabilités

Les modèles avec variables latentes sont des modèles « statistiques ». Ils cherchent à caractériser des relations probables et non-déterministes ; de plus ils se caractérisent par l’introduction des erreurs de mesure et d’erreurs systématiques (Sijtsma, 2012a, 2012b). Cela oblige les modèles avec variables latentes à poser des modèles ayant recours aux variables aléatoires, donc renvoyant aux probabilités. L’usage de probabilités couvre une discussion large que je ne prétends pas développer, je discute juste du problème posé par certains auteurs sur la légitimité de considérer des probabilités comme des réalités.

2.4.2.1 Les deux formes des probabilités

Une probabilité peut être comprise dans deux sens différents avec une propriété mentale, en référence à ce que Hacking (2002) développe : « Il est notoire que cette probabilité qui

émerge si soudainement a les deux visages de Janus. D'un côté, elle est statistique et s'applique aux lois stochastiques des probabilités aléatoires. De l'autre, elle est épistémique et concerne l'évaluation des degrés auxquels il est raisonnable de croire en la vérité de propositions n'ayant rien de statistique. » (p. 38). Je reprends les mots de Drouet (2012) pour

différencier « probabilité ontologique » et « interprétation épistémique » : « il y a des

probabilités parce que certains événements sont, effectivement, aléatoires. Les probabilités et

Dans le document Variables latentes et processus mentaux : une réflexion épistémologique et méthodologique (Page 178-192)