• Aucun résultat trouvé

Diagnosticité des mesures physiologiques périphériques de la charge mentale

N/A
N/A
Protected

Academic year: 2021

Partager "Diagnosticité des mesures physiologiques périphériques de la charge mentale"

Copied!
233
0
0

Texte intégral

(1)

© Mark Parent, 2019

Diagnosticité des mesures physiologiques

périphériques de la charge mentale

Thèse

Mark Parent

Doctorat en psychologie

Philosophiæ doctor (Ph. D.)

(2)
(3)

iii

Résumé

La charge mentale est un concept très utile dans les domaines dont l’objet d’étude et d’analyse est le travail et la performance humaine. Typiquement, la charge mentale est mesurée à l’aide des mesures subjectives (c.-à-d. des questionnaires) ou par des mesures comportementales (c.-à-d. les actions des individus). La charge mentale peut également être mesurée à l’aide de l’activité physiologique périphérique (p.ex. l’activité cardiaque). Il est cependant difficile de déterminer la source de la charge mentale à l’aide des mesures physiologiques périphérique. En effet, les sous-dimensions de la charge mentale, comme l’exigence, l’effort, le stress et la fatigue, provoquent souvent des manifestations physiologiques similaires. En plus de cette problématique, les mesures physiologiques de la charge mentale sont trop souvent étudiées dans des contextes de laboratoire et trop rarement étudiées dans des milieux de travail réels. Il est donc crucial d’investiguer leur potentiel dans des contextes réels. Cette thèse vise donc à investiguer le potentiel diagnostique (le potentiel à déterminer la source) des mesures physiologiques périphériques de la charge mentale. Pour y arriver, une méthode combinant l’approches cognitive traditionnelle et l’apprentissage automatique est utilisée. La thèse rapporte les résultats de deux expériences : une première menée en contexte de laboratoire et une seconde menée dans une simulation de commandement et contrôle reproduisant un milieu de travail réel. Les résultats montrent que les mesures physiologiques périphériques peuvent prédire, avec une bonne précision, la sous-dimension qui est à l’origine de la charge mentale en contexte de tâche simple. Bien que moins précise, il reste possible de faire cette prédiction dans des contextes de tâche réelle. Dans l’ensemble, cette thèse apporte plusieurs contributions essentielles afin de rendre possible les mesures physiologiques périphériques de la charge mentale dans les milieux de travail réels.

(4)

iv

Abstract

Mental workload stands out as a key concept as soon as human work and human performance is discussed. Mental workload is often measured using subjective questionnaires or behavioral cues. Peripheral physiological measures (e.g. heart rate) can also be used to measure workload. However, it is particularly difficult to determine the source of workload using peripheral physiological measures. Sub-divisions of mental workload, such as task load, mental effort, stress and fatigue, often trigger similar physiological reactions, blurring the diagnostic potential of physiological measures. Furthermore, physiological measures are too often investigated in laboratory settings, making it hazardous to determine their performance in real world settings. This thesis aims at investigating the diagnostic potential of peripheral physiological measures. A mixed methodology, combining traditional cognitive approach as well as machine learning techniques, is used. This thesis presents results of both a laboratory setting experimental as well as an ecological command and control simulation. Results show that peripheral measures can be used to predict, with high accuracy, the source of workload in laboratory settings. While not as accurate, results also show that it is possible to perform a diagnostic measure of workload in an ecological work simulation. This thesis contribute to improve the potential of peripheral physiological measures in real work settings.

(5)

v

Table des matières

Résumé ... iii

Abstract ... iv

Table des matières ... v

Liste des tableaux ... viii

Liste des figures ... xi

Liste des abréviations ... xii

Remerciements ... xiii

Introduction ... 1

Chapitre 1 : Le concept et les mesures de la charge mentale ... 3

1.1 La charge mentale et ses composantes ... 3

1.1.1 Exigence, effort et motivation ... 5

1.1.2 Stress, anxiété et frustration ... 8

1.1.3 Fatigue, vigilance et ennui ... 10

1.2 Mesures de la charge mentale ... 12

1.2.1 Considérations psychométriques ... 13

1.2.2 Mesures comportementales ... 16

1.2.3 Mesures subjectives ... 18

1.2.4 Mesures physiologiques ... 19

1.3 Mesures physiologiques périphériques des dimensions de la charge mentale ... 22

1.3.1 Le potentiel des mesures physiologiques périphériques ... 22

1.3.2 Justification des dimensions de la charge mentale ... 24

1.3.3 Effets physiologiques des dimensions de la charge mentale ... 27

1.3.4 Synthèse ... 32

1.4 Problématique ... 33

1.4.1 Manque de diagnosticité ... 33

1.4.2 Difficulté à intégrer dans des milieux de travail humain ... 36

1.5 Objectif de la thèse ... 38

Chapitre 2 : Stratégie méthodologique ... 40

2.1 Expériences ... 42

2.2 Mesures ... 44

2.2.1 Mesures subjectives et comportementales ... 44

2.2.2 Mesures physiologiques ... 45

2.3 Découpage en époque et prétraitement des signaux ... 49

2.4 Calcul des métriques physiologiques ... 51

2.5 Organisation des schèmes de classification ... 54

2.6 Imputation des données ... 54

2.7 Rééquilibrage des classes ... 55

2.8 Entraînement des modèles ... 55

2.9 Calcul de la performance ... 56

Chapitre 3 : Diagnosticité dans des tâches simples ... 59

3.1 Particularités de méthodologie ... 61

3.1.1 Participants ... 61

3.1.2 Tâches expérimentales ... 61

3.1.3 Devis ... 62

(6)

vi

3.1.5 Paramètres d’apprentissage automatique ... 64

3.2 Résultats ... 64

3.2.1 Analyse des réponses subjectives ... 64

3.2.2 Analyse de la performance et de l’effort ... 68

3.2.3 Analyse des métriques physiologiques ... 72

3.2.4 Analyse des modèles d’apprentissage automatique ... 75

3.2.5 Méta-analyse des classificateurs ... 81

3.2.6 Analyses de paramètres supplémentaires ... 87

3.3 Discussion ... 89

3.3.1 Discussion sur les mesures ... 89

3.3.2 Discussion des modèles d’apprentissage automatique ... 96

3.3.3 Discussion générale ... 104

3.3.4 Leçons pour la prochaine expérience ... 107

3.4 Conclusion ... 108

Chapitre 4 : Diagnosticité en simulation de commandement et contrôle (C2) ... 110

4.1 Particularités de méthodologie ... 112

4.1.1 Participants ... 112

4.1.2 Tâches expérimentales ... 112

4.1.3 Devis ... 114

4.1.4 Procédure ... 116

4.1.5 Paramètres d’apprentissage automatique ... 116

4.2 Résultats ... 119

4.2.1 Analyse des réponses subjectives ... 119

4.2.2 Analyse de la performance et de l’effort ... 122

4.2.3 Analyse des métriques physiologiques ... 124

4.2.4 Analyse des modèles d’apprentissage automatique ... 127

4.2.5 Méta-analyse des classificateurs ... 135

4.2.6 Analyse de paramètres supplémentaires ... 144

4.3 Discussion ... 147

4.3.1 Discussion sur les mesures ... 147

4.3.2 Discussion des modèles d’apprentissage automatique ... 153

4.3.3 Discussion générale ... 162

4.4 Conclusion ... 165

Chapitre 5 : Discussion générale ... 166

5.1 Sommaire des résultats ... 166

5.2 Contributions théoriques ... 168

5.2.1 Introduction de nouvelles métriques physiologiques ... 168

5.2.2 Redéfinition du rôle de l’exigence mentale ... 170

5.2.3 Distinction entre l’effort mental et le stress ... 172

5.3 Contribution méthodologique ... 173

5.3.1 Avantage – Grand nombre de métriques physiologiques ... 173

5.3.2 Avantage – Méthode orientée vers la pratique ... 174

5.3.3 Limites – Fatigue confondue avec d’autres facteurs ... 176

5.3.4 Limite – Pas de comparaison de performance entre les modalités ... 177

5.4 Contributions pratiques ... 178

(7)

vii

5.4.2 Supporter la conception du travail et l’élaboration de contre-mesures cognitives

... 180

5.4.3 Modèles interindividuels ... 181

5.5 Défis à relever ... 183

5.5.1 Augmenter la robustesse face aux mouvements et aux bruits du signal ... 183

5.5.2 Augmenter la robustesse face à la parole ... 185

5.5.3 Considérer plus de dimensions ... 186

Conclusion ... 189

(8)

viii

Liste des tableaux

Tableau 1- Propriétés psychométriques et métrologiques utilisées ce projet ... 16

Tableau 2 - Synthèse des effets physiologiques des composantes de la charge mentale... 32

Tableau 3 - Description des fonctions utilisées pour calculer les métriques physiologiques ... 52

Tableau 4 - Utilisation des fonctions par type de signal physiologique ... 52

Tableau 5 - Sous-ensemble de métriques testées dans cette analyse ... 54

Tableau 6 - Exemple de prédiction d’un modèle pour deux catégories ... 57

Tableau 7 - Critères déterminant la qualité des classificateurs ... 58

Tableau 8 - Définition des variables d’intérêt ... 64

Tableau 9 - Tailles d’effet des ANOVAS menées sur les réponses du NASA-TLX (partie 1/2) ... 67

Tableau 10 - Tailles d’effet des ANOVAS menées sur les réponses du NASA-TLX (partie 2/2) ... 68

Tableau 11 - Scores moyens de performance dans les quatre conditions ... 70

Tableau 12 - Scores moyens de l’effort dans les quatre conditions ... 72

Tableau 13 - Taille d’effet des métriques physiologique ... 74

Tableau 14 - Moyenne du d de Cohen par groupe de métriques physiologiques ... 75

Tableau 15 - Vérification de l’indépendance des variables objectives ... 76

Tableau 16 - Vérification de l’indépendance des variables subjectives ... 76

Tableau 17 - Vérification de l’indépendance des variables objectives/subjectives ... 77

Tableau 18 - Performance en test des variables en fonction des métriques utilisées pour un classificateur SVM ... 78

Tableau 19 - Performance en test des réponses subjectives du NASA-TLX pour un classificateur SVM ... 79

Tableau 20 - Performance en test des variables en fonction des métriques utilisées pour un classificateur linéaire ... 80

Tableau 21 - Performance en test des réponses subjectives du NASA-TLX pour un classificateur linéaire ... 81

Tableau 22 - Régression logistique multiple effectuée sur la performance en classification ... 82

Tableau 23 - Pourcentage de la contribution des modalités physiologiques selon les classificateurs ... 83

Tableau 24 - Métriques ayant les plus grands poids pour la classification de la classe « Repos initial » ... 85

Tableau 25 - Métriques ayant les plus grands poids pour la classification de la classe « Difficulté » ... 85

Tableau 26 - Métriques ayant les plus grands poids pour la classification de la classe « Stress » ... 86

Tableau 27 - Métriques ayant les plus grands poids pour la classification de la classe « Tâche » ... 86

Tableau 28 - Métriques ayant les plus grands poids pour la classification de la classe « Performance » ... 87

Tableau 29 - Métriques ayant les plus grands poids pour la classification de la classe « Effort » ... 87

(9)

ix

Tableau 30 - Performance des classificateurs en fonction du chevauchement des

époques ... 88

Tableau 31 - Régression logistique multiple effectuée sur la performance en classification ... 89

Tableau 32 - Définition des variables d’intérêt ... 118

Tableau 33 - Tailles d’effet des ANOVA menées sur les réponses du NASA-TLX ... 121

Tableau 34 - Coefficients de corrélation entre le temps passé sur la tâche et les dimensions du NASA-TLX ... 122

Tableau 35 - Scores moyens de performance dans les quatre conditions ... 123

Tableau 36 - Scores moyens de l’effort dans les quatre conditions ... 124

Tableau 37 - Taille d’effet des métriques physiologique ... 126

Tableau 38 - Moyenne du d de Cohen par groupe de métriques physiologiques ... 127

Tableau 39 - Vérification de l’indépendance des variables objectives ... 128

Tableau 40 - Vérification de l’indépendance des variables subjectives ... 128

Tableau 41 - Vérification de l’indépendance des variables objectives/subjectives ... 129

Tableau 42 - Performance en test des variables en fonction des métriques utilisées et de la durée des époques pour un classificateur SVM ... 131

Tableau 43 - Performance en test des réponses subjectives du NASA-TLX en fonction de la durée des époques pour un classificateur SVM ... 132

Tableau 44 - Performance en test des variables en fonction des métriques utilisées et de la durée des époques pour un classificateur linéaire ... 134

Tableau 45 - Performance en test des réponses subjectives du NASA-TLX en fonction de la durée des époques ... 135

Tableau 46 - Régression logistique multiple effectuée sur la performance en classification (difficulté) ... 136

Tableau 47 - Régression logistique multiple effectuée sur la performance en classification (stress) ... 137

Tableau 48 - Régression logistique multiple effectuée sur la performance en classification (ordre des conditions) ... 137

Tableau 49 - Régression logistique multiple effectuée sur la performance en classification (ordre des époques) ... 138

Tableau 50 - Régression logistique multiple effectuée sur la performance en classification (performance) ... 138

Tableau 51 - Régression logistique multiple effectuée sur la performance en classification (effort) ... 139

Tableau 52 - Pourcentage de la contribution des modalités physiologiques ... 140

Tableau 53 - Métriques ayant les plus grands poids pour la classification de la classe « Repos Initial » ... 142

Tableau 54 - Métriques ayant les plus grands poids pour la classification de la classe «Stress » ... 142

Tableau 55 - Métriques ayant les plus grands poids pour la classification de la classe « Ordre des conditions » ... 143

Tableau 56 - Métriques ayant les plus grands poids pour la classification de la classe «Ordre des époques » ... 143

Tableau 57 - Métriques ayant les plus grands poids pour la classification de la classe «Effort (vies sauvées) »... 144

(10)

x

Tableau 58 - Performance des classificateurs en fonction du type de classificateur et

de l’imputation ... 146 Tableau 59 - Performance des classificateurs en fonction du type de classificateur et

(11)

xi

Liste des figures

Figure 1 : Représentation schématique du modèle de Wickens (2008). ... 4

Figure 2 : Exemple d’un électroencéphalogramme et d’un système de spectroscopie proche infrarouge. ... 21

Figure 3 : Synthèse méthodologique ... 41

Figure 4 : Le Bioharness 3 ... 46

Figure 5 : Positionnement des électrodes électrodermales. ... 47

Figure 6 : Lunette ASL Mobile Eye. ... 48

Figure 7 : Exemple des signaux physiologique recueillis lors des séances expérimentales. ... 49

Figure 8 : Exemple d’un découpage en époques. ... 50

Figure 9 : Exemple du tableau de données créé après le calcul des métriques. ... 53

Figure 10 : Relation entre la performance et kappa pour deux seuils de hasard différents. ... 58

Figure 11 : Représentation schématique de la tâche de n-back. ... 62

Figure 12 : Exemple de la tâche de recherche visuelle (difficile). ... 62

Figure 13 : Résultats du NASA-TLX lors du n-Back. ... 66

Figure 14 : Résultats du NASA-TLX lors de la recherche visuelle. ... 66

Figure 15 : Performance en fonction de la difficulté et de la tâche. ... 70

Figure 16 : Performance en fonction du stress et de la tâche. ... 71

Figure 17 : Score d’effort en fonction de la difficulté et de la tâche. ... 72

Figure 18 : Contribution des modalités physiologiques selon le classificateur. ... 84

Figure 19 : Interface du logiciel de gestion de crise. ... 113

Figure 20 : Exemple d’un panneau montrant les propriétés d’un incident. ... 114

Figure 21 : Classificateurs de l’ordre des conditions. ... 119

Figure 22 : Résultats du NASA-TLX lors de la tâche de C2. ... 120

Figure 23 : Temps de réponse en fonction de la difficulté et du stress. ... 123

(12)

xii

Liste des abréviations

- ADASYN : Algorithme d’échantillons synthétique (de l’anglais : Adaptive Synthetic Sampling Approach for Imbalanced Learning)

- ANOVA : Analyse de la variance - C2 : Commandement et contrôle - ECG : Électrocardiogramme

- EDA : Relatif à l’activité électrodermale

- GAZ : Relatif à l’activité oculaire (de l’anglais : gaze) - HF : Haute fréquence

- LF : Basse-fréquence

- NASA-TLX : Nom court du questionnaire subjectif NASA Task Load Index - PUP : Relatif à l’activité pupillaire

- RR : Relatif aux intervalles entre les battements cardiaques - RSP : Relatif à la respiration

- SVM : Machine à vecteur de support (de l’anglais : support vector machine) - TSST : Trier Social Stress Task

(13)

xiii

Remerciements

Je tiens à remercier mon directeur de thèse, le Dr Sébastien Tremblay, pour son encadrement lors de la réalisation de mon doctorat. Tout au cours de mon cheminement, Sébastien m’a donné l’impression d’être son homme de confiance, ce qui est incontestablement le plus beau souvenir que je vais garder de mon doctorat. Je me considère extrêmement chanceux d’avoir eu un directeur aussi engagé à me voir me développer professionnellement. Grâce à lui, j’ai été exposé à des projets des plus enrichissants. Il m’a également donné l’occasion de voyager, de rencontrer et de collaborer avec des experts à travers le monde. J’en lui en suis profondément reconnaissant.

J’aimerais également remercier les Drs François Vachon et Mickaël Causse pour leur rôle au sein de mon comité de thèse. Merci à François pour sa rigueur et son expertise, sans qui des failles méthodologiques et intellectuelles auraient certainement échappé à ma vigilance. Merci à Mickaël pour ses commentaires toujours constructifs, pour les opportunités de projet à l’ISAE et, plus particulièrement, pour m’avoir toujours traité avec beaucoup professionnalisme.

La réalisation de ce doctorat a été pour moi l’occasion d’apprendre un grand nombre de savoirs qui font aujourd’hui de moi, je l’espère, un meilleur scientifique. Une quantité importante de ces acquis est due à la patience de mes collègues et collaborateurs à me transmettre leur précieuse expertise. Je tiens à remercier mes prédécesseurs au laboratoire, les Drs Cindy Chamberland, Jean-François Gagnon et Benoît Roberge-Vallières, pour leur judicieux conseils et la générosité du temps qu’ils m’ont accordé. I wish to extend this gratitude toward Dr Joel Suss for his truly appreciated mentoring. I would also like to thank Dr Tiago H. Falk for giving me the opportunity to perform an internship at MuSAE lab, in Montreal. This internship allowed me to significantly brush up my machine learning and neurophysiological skills as well as exchange with his lab resourceful members. Je remercie également le Dr Frédéric Dehais et les membres de l’ISAE, à Toulouse, pour leurs conseils sincèrement appréciés.

(14)

xiv

Je tiens aussi à remercier les nombreux collègues universitaires avec qui j’ai eu le plaisir de collaborer, mais qui ont également rendu le travail quotidien tellement plus agréable. Merci à Catherine, Alexandre et Alexandre, Serge et Jean-Denis et tous les membres des laboratoires Co-DOT et PACE de l’université Laval. Merci aussi aux membres de l’Unité de Recherche Mixte en Sciences Urbaines pour leur chaleureuse compagnie.

En dehors du contexte professionnel, je tiens à souligner le support indéfectible de tous mes amis pendant mes années d’études. Merci notamment à ma bonne amie Josée de m’avoir continuellement encouragé et d’avoir écouté inconditionnellement mes idées (des plus farfelues aux plus sérieuses). Merci à mes amis de longue date, Martin et Cyrille, pour leurs encouragements. Merci à Stéphane, sans qui mes analyses ne seraient toujours pas terminées.

Finalement, je souhaite remercier ma famille, sans qui les moments sans espoir auraient eu raison de moi. Merci à mes frères, Nicolas et Alex, pour tous les bons moments que je passe avec vous. Merci à Jocelyn et à Susan. J’apprécie toujours votre présence et suis très reconnaissant de la sagesse que vous me transmettez. Enfin, merci à ma mère France et à mon père Marc. Être votre fils est une chance que je ne peux quantifier.

(15)

1

Introduction

Les applications, comme des systèmes d’aide à la décision (p.ex. Görges et coll., 2013; Shen, Carswell, Santhanam et Bailey, 2012) ou de système d’automatisation adaptative (p.ex. Aricò et coll., 2016; Dixon & Wickens, 2006) sont généralement considérés comme ayant un grand potentiel pour améliorer les conditions de travail humain et même sauver des vies. La prémices de plusieurs de ces systèmes consiste souvent à adapter la conception ou le fonctionnement du système en fonction d’une mesure de la charge mentale des individus. Malgré les bénéfices promis de ces systèmes, certains auteurs suggèrent qu’il est nécessaire de repenser la manière dont est mesurée la charge mentale (p.ex. Matthew, Reinerman-Jones, Wohleber et coll., 2015), sans quoi ses applications ne pourront pas fonctionner à leur plein potentiel. De plus, les applications concrètes tardent encore à être implémentées dans des milieux de travail humain (Friedman, Brouwer et Nijholt, 2017).

La charge mentale est un concept très utile dans les domaines dont l’objet d’étude et d’analyse est le travail et la performance humaine – la psychologie, les sciences cognitives, et l’ergonomie. Depuis plusieurs années, un grand nombre de recherches sont effectuées afin de quantifier la charge mentale liée au travail humain. La charge mentale peut se mesurer à partir du comportement et de la performance des opérateurs humains. Toutefois, cette approche a comme limite de ne pas permettre la mesure de la charge si aucun comportement observable n’est réalisé. Il est également possible de mesurer la charge de travail à l’aide de questionnaires. L’utilisation de questionnaires requiert soit des interruptions chaque fois qu’une mesure est requise, soit une analyse post hoc. Les mesures neurologiques, comme l’électroencéphalographie, peuvent permettre de contrer ces deux problèmes. Bien que des progrès soient effectués afin de faciliter l’utilisation des mesures neurologiques, il n’est pas toujours possible d’envisager leur utilisation dans des contextes de travail réel. Les mesures physiologiques périphériques présentent un grand potentiel pour quantifier la charge mentale et elles sont plus faciles à implémenter que les mesures neurologiques. Les mesures physiologiques périphériques présentent toutefois, elles aussi, un problème : la charge mentale peut se diviser en plusieurs sous-composantes et très peu de mesures physiologiques permettent de distinguer avec précision l’influence de chacune de ces sous-composantes. Ces sous-composantes, comme l’effort mental, le stress ou la fatigue, peuvent avoir des

(16)

2

implications différentes. Ainsi, dans un contexte de travail réel, un excès d’effort mental ne sera pas réglé de manière identique à un excès de fatigue. Le problème de l’identification de la source de la charge mentale réfère à un problème de diagnosticité. Ce projet de thèse vise à établir si la physiologie périphérique a le potentiel de donner une mesure diagnostique de la charge mentale.

Dans la première expérience de cette thèse, des participants ont été invités à accomplir des tâches expérimentales simples pendant que leurs signaux physiologiques étaient enregistrés. Dans cette expérience, deux sous-composantes de la charge mentale étaient modulées : le niveau d’exigence mentale et le niveau de stress. Une approche d’apprentissage automatique a été menée sur les signaux physiologiques. Cette analyse a permis de montrer qu’il était possible de prédire l’exigence mentale, l’effort mental, le stress ainsi que la fatigue dans un contexte de tâche expérimentale simple. Dans la deuxième expérience de thèse, les participants étaient invités à compléter des scénarios de simulation de gestion de crise, plus proches de ce qui peut être vécu dans un contexte de travail réel. Encore une fois, l’exigence mentale et le stress étaient modulés. Le contre-balancement permettait cette fois-ci d’investiguer l’effet de la fatigue. Le stresseur utilisé a également été modifié. Cette fois-ci, un stresseur psychosocial a été retenu. Finalement, un plus grand nombre de participants ont été évalués, et les séances expérimentales étaient plus longues, ce qui a permis une meilleure taille du jeu de données. Les résultats suggèrent qu’il est possible, en n’utilisant que la physiologie périphérique, de prédire l’effort mental, le stress ainsi que la fatigue d’un individu réalisant une tâche de gestion de crise.

(17)

3

Chapitre 1 : Le concept et les mesures de la charge mentale

1.1 La charge mentale et ses composantes

La charge mentale est un concept très populaire en psychologie cognitive. La communauté scientifique a commencé à étudier la charge mentale dans les années 70 (Wierwille, 1979) mais le concept est devenu plus présent dans la littérature au cours de la décennie suivante (voir Young, Brookhuis, Wickens et Hancock, 2015, pour une revue des écrits). À l’époque, le terme charge de travail (anglais : workload) est utilisé pour décrire la quantité objective de travail à réaliser, sans égards aux capacités et compétences de celui qui réalise le travail. Le concept de charge mentale est subséquemment introduit afin de considérer les capacités et compétences de l’humain à effectuer son travail (voir : Rouse, Edwards et Hammer., 1993). Depuis le début des recherches sur le sujet, des centaines d’études traitant de la charge mentale ont été publiées (voir Wickens, 2017). Young et coll. (2015) ont recensé une centaine d’études publiées depuis 1980 et présentent les principaux thèmes à l’étude pour chaque décennie : la mesure de la charge mentale dans les années 1980, l’amélioration de la définition du concept dans les années 1990 et l’exploration d’applications concrètes dans les années 2000. Encore aujourd’hui, des efforts sont investis à développer de nouvelles mesures de la charge mentale de même qu’à préciser les définitions, qui ne font pas consensus (Young et coll., 2015).

Dans sa forme la plus simple, la charge mentale peut être définie comme étant le ratio entre les ressources cognitives utilisées et la capacité cognitive maximale d’un individu. Lorsqu’une tâche est réalisée, celle-ci consommerait des ressources cognitives. Selon cette vision, la performance et la quantité de ressources cognitives investie suivent une relation linéaire. Lorsque la quantité de ressources cognitives consommée atteint la capacité maximale d’un individu, la performance plafonne (ou même décline; Durantin, Gagnon, Tremblay & Dehais, 2014; Matthews & Campbell, 2009) et l’individu atteint sa charge mentale maximale. Malgré que cette conceptualisation unidimensionnelle de la charge mentale soit attirante en raison de sa simplicité, elle a également fait l’objet de plusieurs critiques. À titre d’exemple, le paradigme de la tâche secondaire (Wickens, 2008) permet plutôt de suggérer que la charge mentale soit multidimensionnelle. Les résultats obtenus au sein de ce paradigme suggèrent que dans certains cas, il est possible d’ajouter une tâche

(18)

4

secondaire à une tâche primaire sans pour autant affecter la performance. Ce patron de résultats est en conflit avec la conceptualisation unidimensionnelle de la charge de travail puisqu’il suggère qu’un individu peut avoir atteint une charge mentale maximale dans une tâche tout en étant capable d’investir de nouvelles ressources cognitives dans une nouvelle tâche. Ce phénomène a donné naissance à la théorie des ressources multiples. Selon cette théorie, les tâches peuvent être catégorisées selon trois divisions : 1) le niveau de processus (perception, cognition et réponse), 2) l’encodage (spatial ou verbal) et 3) la modalité (visuelle ou auditive). Cette catégorisation est présentée visuellement à la Figure 1. Tant que deux tâches n’utilisent pas les mêmes niveaux de chaque dimension, le déclin de la performance devrait être faible, ce qui suggère plusieurs dimensions de la charge mentale.

Figure 1 : Représentation schématique du modèle de Wickens (2008).

Bien qu’il s’agisse d’un modèle fréquemment utilisé, la théorie des ressources multiples n’est pas la seule qui aborde la multidimensionnalité de la charge mentale. Hoedemaeker (2002) divise la charge mentale en trois composantes : la charge visuelle, la charge motrice et la charge mentale. Au lieu de diviser la charge mentale en se basant sur son fonctionnement, Hart et Staveland (1988) suggèrent de diviser la charge mentale selon les différentes manières dont celle-ci peut être perçue de manière subjective par les individus. Pour certaines

(19)

5

personnes, la charge mentale provient de la difficulté de la tâche qu’ils sont en train de réaliser. D’autres individus vont plutôt considérer le temps qui leur est alloué pour réaliser cette tâche comme un indice de charge mentale (voir Hollnagel, 2002). Dans le questionnaire de charge de travail qu’ils ont développé, le NASA-TLX, Hart et Staveland (1988) suggèrent six dimensions à la charge mentale : l’exigence mentale, l’exigence temporelle, l’exigence physique, la performance, l’effort et la frustration. Dans un autre questionnaire visant à mesurer la charge de travail, Reid (1988) propose plutôt 3 dimensions : la charge temporelle, l’effort mental et le stress psychologique. Contrairement à la théorie des ressources multiples et à la division de Hoedemaeker (2002), les modèles de Hart et Staveland (1988) et Reid (1988) incluent tous deux une composante plus affective que cognitive (respectivement : la frustration et le stress psychologique). En plus des différentes dimensions proposées par ces auteurs, plusieurs autres dimensions, telles que la fatigue, la motivation ou l’engagement, peuvent être considérées comme des composantes de la charge mentale. Les sections suivantes font un survol des différentes composantes de la charge mentale qu’il est possible de retrouver dans la littérature.

1.1.1 Exigence, effort et motivation

La charge mentale prend sa source d’une exigence de travail à réaliser (anglais : task demand). Cette exigence de travail occupe une place importante dans la conceptualisation de la charge mentale puisqu’elle est souvent considérée comme l’un des premiers intrants dans plusieurs modèles qui visent à expliquer la charge mentale (p. ex. : Moray, 2013, Parasuraman et Hancock, 2001, Wickens, 2008). Lorsqu’on parle d’exigence mentale, il est nécessaire de faire la distinction entre l’exigence réelle de la tâche de l’exigence perçue. L’exigence réelle correspond à la quantité, l’intensité ou encore la difficulté objective d’une tâche. L’exigence perçue, de son côté, correspond à l’évaluation subjective, que fait un individu, de l’exigence réelle. L’exigence réelle d’une tâche est généralement facile à quantifier. À moins que le travail à réaliser soit inconnu, l’exigence réelle correspond généralement à la définition de la tâche. L’exigence réelle est très souvent manipulée expérimentalement dans les études se penchant sur la charge mentale en augmentant la difficulté des tâches ou en augmentant la quantité totale de travail à effectuer (p. ex., Backs et Seljos, 1994; Bailey et Iqbal 2008; Carroll, Turner et Prasad, 1986; Engström, Markkula,

(20)

6

Victor et Merat, 2017; Galy, Cariou et Mélan, 2012). Tout comme l’exigence réelle, il est possible de mesurer l’exigence subjective. Pour le faire, il est toutefois nécessaire d’utiliser des outils de mesure, comme des questionnaires (p.ex. Delignières, Famose, & Genty, 1994; Hart & Staveland, 1988) ou encore par l’observation du comportement et de la performance des individus (voir Gawron, 2000).

Dans l’ensemble, il est possible d’affirmer que l’augmentation de l’exigence mentale (réelle ou subjective) entraîne une hausse de la charge mentale (Ayres, 2006). L’exigence à elle seule ne peut toutefois pas expliquer toutes les variations de la charge mentale. Par exemple, Thomas et Tsai (2012), suggèrent que l’anxiété ressentie par les individus peut venir biaiser leur perception de l’exigence. Selon leurs travaux empiriques, les individus anxieux percevraient une exigence plus élevée. Les auteurs suggèrent également que la distance psychologique (définie de manière similaire au niveau d’engagement envers la tâche) et physique (comme la distance entre l’individu et son écran d’ordinateur) permet de mitiger les effets de l’anxiété sur l’évaluation de l’exigence. De leur côté, Colle et Reid (1998) démontrent comment l’exigence réelle peut biaiser l’évaluation de la charge mentale. Ils expliquent que, lorsqu’on demande à un individu d’évaluer l’exigence d’un ensemble de stimuli quelconques, celui-ci tend à diviser l’étendue de l’exigence en certaines catégories et à regrouper les stimuli sous chacune de ces catégories. Ainsi, si l’étendue de l’exigence est petite (c.-à-d. : s’il n’y a pas beaucoup de différence entre les niveaux de difficulté), les individus vont quand même évaluer un grand contraste entre ces niveaux. Tel qu’expliqué par les auteurs, ce biais provoque une inflation de la charge mentale perçue lorsque l’étendue de l’exigence mentale est faible et une diminution de la charge mentale perçue lorsque l’étendue de l’exigence mentale est grande.

L’exigence mentale peut aussi être modulée par la pression temporelle (c.-à-d., le temps disponible pour effectuer la tâche). La pression temporelle affecte l’exigence mentale (Hollnagel, 2002), en dégradant notamment la performance de la mémoire de travail (Barrouillet, Bernardin et Camos, 2004). Certains auteurs suggèrent toutefois de la différencier de l’exigence. Sweller, van Merrienboer et Pass (1998), qui s’intéressent au domaine de l’apprentissage, font notamment la distinction entre charge intrinsèque et charge

(21)

7

extrinsèque. Selon cette théorie, la charge intrinsèque réfère aux éléments inhérents de la tâche (p.ex., la difficulté, la quantité de travail à réaliser) alors que la charge extrinsèque réfère aux facteurs externes (p.ex. l’environnement, le bruit et le temps accordé pour réaliser la tâche). Il existe d’ailleurs des appuis empiriques permettant de différencier les effets provenant de la charge intrinsèque et extrinsèque sur la charge mentale, ce qui suggère que l’exigence mentale (associée plutôt à l’exigence intrinsèque) doit être différente du stress associé plutôt à la charge extrinsèque (Galy, Cariou et Mélan, 2012).

Dans la plupart des recherches où l’exigence mentale est modulée, il est assumé que les individus motivés vont augmenter l’effort investi au fur et à mesure que l’exigence augmente (Gendolla et Wright, 2005). Certains indices empiriques laissent toutefois croire que l’exigence et l’effort ne varient pas toujours en même temps. En effet, on peut supposer que l’augmentation de la difficulté puisse décourager les individus, diminuer leur niveau de motivation et, par le fait même, empêcher les individus d’investir plus d’effort (Capa, Audiffren et Ragot, 2008). Il est également possible que les individus n’aient plus de ressources cognitives disponibles, ce qui signifie qu’il leur est difficile de fournir plus d’effort. Ces indices suggèrent donc que l’exigence mentale et l’effort mental sont conceptuellement différents. Le concept d’effort mental a été popularisé par Kahneman (1973). Sa vision de l’effort mental n’est pas sans rappeler la théorie du contrôle utilisée en ingénierie (voir Skogestad et Postlehwaite, 2007). Kahneman suggère effectivement que l’effort mental est le résultat d’une boucle de rétroaction faisant intervenir l’exigence de la tâche, l’objectif souhaité et les capacités cognitives disponibles. Selon Kanheman (voir aussi Gaillard, 1993; Hockey, 1997), l’exigence mentale et l’effort mental devraient être considérés comme des concepts différents. Pourtant, la définition de ces concepts se recoupe à certains niveaux. Wickens et Hollands (2000) définissent l’exigence mentale comme étant « […] la quantité de ressources qui doit être allouée afin de maintenir la performance ». Hockey (1993, 1997) définit quant à lui l’effort mental comme étant la stratégie compensatoire qui vise à protéger la performance lorsque la demande de la tâche augmente. Bien que similaires, ces deux définitions font ressortir une différence fondamentale entre l’exigence mentale et l’effort mental. Alors que l’exigence mentale est associée à la perception de la tâche imposée (ce que l’individu sent qu’il doit faire), l’effort mental est

(22)

8

plutôt vu comme étant la quantité réelle d’investissement cognitif fourni par l’individu (voir aussi Matthews, Warm et coll., 2010; Paas et Van Merrienboer, 1993).

Gaillard (1993) détaille quelques éléments clés qui caractérisent l’effort mental. Tout d’abord, l’investissement d’énergie par l’effort mental, perçue par la sensation « d’essayer plus fort », représenterait la seule manière directe de changer l’état énergétique mental d’un individu. Selon Gaillard (1993), les autres composantes de l’état énergétique mental, comme la fatigue et les émotions, ne peuvent pas être directement modulées. L’effort mental se distingue de l’activation (anglais : arousal). En effet, l’effort mental représente une forme d’activation dédiée à exécuter un travail cognitif alors que l’activation est plutôt une excitation générale du corps (provoqué par plusieurs sources comme la joie, la colère ou le stress). Selon ce même auteur, il est nécessaire d’investir un effort mental lorsque l’activation est faible (p.ex. par monotonie ou fatigue), mais également lorsque l’activation est élevée (p.ex. sous l’effet du stress) afin de neutraliser ou ignorer ces distracteurs. Il est également précisé que l’effort mental se distingue du travail effectué ou de la performance. En effet, lorsqu’un processus cognitif est automatisé, il est reconnu pour ne requérir aucun ou peu d’effort pour être réalisé. Contrairement à l’exigence, il peut être difficile d’obtenir une mesure objective de l’effort mental. En effet, celui-ci est à la fois fonction de l’exigence perçue et de la performance atteinte.

L’effort mental se rapproche au plan conceptuel de la motivation ou de l’engagement. La théorie de la motivation de Brehm (Brehm et Self, 1989) est souvent citée en psychophysiologie et distingue la volonté d’agir d’un individu (la motivation potentielle) de son effort réel (l’intention de la motivation). Selon Matthews, Warm et coll. (2010), l’engagement est défini par l’activation d’énergie, la motivation et la concentration. Malgré l’intérêt qu’apporte l’identification de ces dimensions de la charge mentale, il n’en demeure pas moins qu’elles sont difficiles à distinguer les unes des autres.

1.1.2 Stress, anxiété et frustration

Tel que relevé plus tôt, certains modèles de la charge mentale intègrent une composante affective, comme la frustration (Hart et Staveland, 1988) ou encore le stress psychologique

(23)

9

(Reid, 1988). Le stress est un concept psychologique très étudié. Une simple recherche utilisant le mot clé stress sur la plateforme APA PsycNET identifie 10874 articles de revues scientifiques publiées en 2016. En opposition, les mots clés mental workload ou encore simplement workload, obtiennent respectivement 102 et 366 résultats pour la même année. L’intérêt massif porté envers le stress s’explique notamment par l’impact de ce dernier sur la santé des individus (Jones, Latreille et Sloane, 2016). La plupart des chercheurs étudiant le stress ne le considèrent pas à priori comme une composante de la charge mentale. Une revue de l’historique de la recherche dans le domaine du stress permet toutefois de réaliser que les deux concepts sont liés de près. Les chercheurs ont commencé à s’intéresser au stress date au début du 20e siècle. Yerkes et Dodson (1908) sont souvent considérés comme ayant été les premiers à se pencher sur ce phénomène (Staal, 2004). Leurs travaux ont éventuellement mené à l’élaboration de la loi de Yerkes-Dodson1, qui suggère que l’augmentation de l’activation augmente la performance de l’individu jusqu’à un certain point à partir duquel une activation encore plus élevée fait diminuer la performance. À cette époque, il n’était pas mention d’aucune dimension émotive du stress (on utilisait le terme « activation » plutôt que « stress » d’ailleurs). Il est toutefois possible de remarquer que, tout comme la charge mentale, la performance est centrale dans leur définition du stress. Hans Selye (1975) propose de diviser le stress en deux composantes, soit l’eustress et la détresse. Selon Selye, un stress qui contribue à la bonne performance se qualifie d’eustress, alors qu’un stress qui n’est pas résolu est qualifié de détresse. Basé sur des travaux empiriques et des observations (souvent faites chez des rats) du système endocrinologique, Selye suggère toutefois une réaction physiologique unique au stress, qu’il s’agisse d’eustress ou de détresse.

Cette séparation dichotomique entre une composante plus cognitive et une composante plus émotionnelle du stress est reprise par la théorie énergétique de Gaillard et Wientjes (1994), également reprise par Dyregrov, Solomon, et Basso (2000). Cette théorie est basée sur la manière dont le corps investit de l’énergie pour réguler ses états en vue d’atteindre une

1 Cette loi, aussi appelée « Loi en U inversée » (anglais : Inverted-U), est soutenue par plusieurs travaux (voir Anderson, 1976; Andreano & Cahill, 2012; Bierman et coll., 2005; Johnston, Moreno, Regas, Tyler et Foreyt, 2012; Le, Oh et coll., 2011; Zajenkowski, 2013). Elle fait toutefois l’objet de nombreuses critiques (voir Diamond et coll., 2007; Teigen, 1994; Winton, 1987).

(24)

10

performance optimale. Les auteurs proposent de distinguer deux types de demandes : la charge mentale et le stress; ainsi que deux mobilisations énergétiques associées : l’effort et la détresse. Selon eux, l’effort mental est défini comme un processus demandant de l’énergie et de l’efficacité afin de réaliser une tâche. Selon cette définition, l’effort mental devrait provoquer une émotion positive (comme un sentiment d’accomplissement) à la fin de la tâche. D’un autre côté, les mêmes auteurs définissent également le stress comme un état où l’individu se sent menacé et où il a peur de perdre le contrôle de la situation. Toujours selon eux, la mobilisation d’énergie n’est pas efficace pendant une période de stress et mènerait plutôt à ressentir en fin de tâche des émotions négatives, telles que l’anxiété. Contrairement à l’approche de Selye, l’approche énergétique distingue toutefois les mécanismes associés à l’effort et la détresse (Gaillard, Wientjes, 1994; Frankenhaeuser, 1986). Tel que relevé par Staal (2004), certains auteurs préfèrent ne pas mentionner le stress et se fient plutôt à la charge mentale pour expliquer la performance alors que d’autres vont parler de détresse en référant plutôt à la pression temporelle (p.ex. Hendy, Farrell et East, 2001).

1.1.3 Fatigue, vigilance et ennui

Lorsque les individus passent un temps prolongé à effectuer une tâche, il est possible que ces derniers subissent une baisse de vigilance ou encore souffrent d’ennui, ce qui peut venir affecter leur charge mentale. Cette section fait un survol des composantes de la charge mentale plutôt associées au temps passé sur la tâche, centrées notamment autour du concept de la fatigue. Au sens large, la fatigue est définie comme une baisse de performance causée par des contraintes physiologiques ou psychologiques (Kalsbeek, Merrow, Roenneberg et Foster, 2012). Lorsqu’on parle de la fatigue, il est nécessaire de différencier deux concepts parfois confondus : celui de la somnolence (ou privation de sommeil) et celui de la fatigue mentale. La somnolence peut être définie comme un état similaire à la fatigue mentale, mais provoquée par un manque de sommeil, un sommeil de mauvaise qualité ou un débalancement des rythmes circadiens (May et Baldwin. 2009). La fatigue mentale, elle-même, peut être définie de différentes manières. Pour Granjean (1979), la fatigue mentale est définie comme un état d’épuisement et d’inhibition associé à une moins grande efficacité et à une moins grande vigilance. Pour Boksem et Tops (2008), la fatigue est aussi un état d’épuisement, mais elle serait également associée à une aversion à continuer l’activité en cours ainsi qu’une

(25)

11

diminution de l’implication dans ladite activité. Dans Shen et coll. (2006), les auteurs relèvent que la fatigue mentale peut être aiguë (considérée comme normale et momentanée) ou chronique. Si la fatigue chronique est, par définition, associée à un problème de santé, les deux types de fatigue peuvent avoir de nombreux effets sur les individus. Suite à un sondage effectué auprès de travailleurs américains (Ricci et coll. 2007), 38 % des individus ont rapporté être fatigués. La majorité de ces individus ont rapporté avoir perdu du temps de productivité en raison de la fatigue. La fatigue mentale serait associée à de nombreux accidents (Baker, Olson, et Morisseau, 1994, Idogawa, 1991) de même qu’à des problèmes de santé (Boksem, Meijman et Lorist, 2006; Chaudhuri et Behan, 2000; Lorist, Boksem et Ridderinkhof, 2005; ten Caat et coll., 2008).

Typiquement, la fatigue mentale est causée par l’effort mental soutenu. Cet effort mental soutenu n’a pas nécessairement besoin d’être long pour provoquer de la fatigue. Par exemple, dans Matthews et Desmond (2002), les auteurs utilisent une tâche de conduite automobile simulée afin d’étudier la fatigue mentale des conducteurs. Ils montrent une difficulté à détecter la présence de piétons après seulement 24 minutes de simulation. Dans Pattyn et coll. (2007), les auteurs démontrent, en utilisant une tâche expérimentale simple, que les effets du temps passé à exécuter la tâche peuvent être visibles dès 30 minutes d’effort mental. Les auteurs émettent l’hypothèse que la baisse de performance serait provoquée par l’ennui plutôt que par la fatigue mentale provoquée par un effort soutenu. Toutefois, certains auteurs suggèrent que les tâches typiques de vigilance sont cognitivement exigeantes, même en présence d’ennui, ce qui suggère que les effets de la fatigue mentale peuvent être présents même lorsque les tâches semblent monotones (Warm, Parasuraman et Matthews, 2008). De plus, les mesures subjectives de la fatigue montrent que les individus ne sont pas toujours en mesure de bien estimer leur degré de fatigue. Dans Lim et coll. (2010), les auteurs ne trouvent pas de corrélation significative entre les variations de temps de réaction et les variations de la fatigue autorapportée, et suggèrent donc que les individus ont du mal à évaluer l’impact de la fatigue après une période de forte charge cognitive. Lorsqu’on demande aux individus d’évaluer leur fatigue mentale, ces derniers se basent parfois sur le temps qu’ils ont investi sur la tâche plutôt que d’estimer leur niveau réel de fatigue (Haga, Shinoda et Kokbun, 2002).

(26)

12

Il semble exister une interaction théorique entre l’exigence mentale, l’effort mental et la fatigue mentale (tous selon les définitions de ce projet). La fatigue mentale provoque généralement une baisse de l’effort mental (Borghini et coll. 2014, Hockey, 1997). Par exemple, dans Wright et coll. (2003), les auteurs induisent soit une fatigue faible ou élevée aux participants à l’aide d’une tâche d’arithmétique et leur demandent par la suite de réaliser une seconde tâche. Les auteurs indiquent aux participants que si leur performance dépasse un certain seuil, ils auront une plus grande récompense. Les résultats font ressortir que les participants non fatigués fournissent un effort plus élevé si la récompense est élevée plutôt que faible alors que l’inverse est observé pour les participants fatigués. Un résultat similaire a été trouvé par Nolte et coll. (2008). Compte tenu des interactions précédemment énoncées, il peut être possible de croire que la fatigue n’est en réalité qu’une absence d’effort. Certains travaux empiriques laissent pourtant croire qu’il est quand même possible d’être fatigué et de fournir un effort élevé. Boksem et Tops (2008) montrent que la fatigue est un signal biologique qui survient lorsque le coût (l’effort) est élevé, mais que la perception de la récompense est faible. Selon eux, ce mécanisme diminue la motivation qui, par la suite, tend à faire diminuer l’effort. Ainsi, la fatigue est donc ressentie lorsque l’effort est jugé trop élevé pour les bénéfices estimés. Dans Hockey (1997), les auteurs rapportent également deux études (Holdings 1983, Meijman et coll., 1992) dans lesquels les auteurs ont démontré que lors d’une période de fatigue mentale, les individus avaient tendance à choisir des stratégies à effort moindre, mais qu’un certain effort pouvait néanmoins être mis en branle pendant de brèves périodes. Mis à part une difficulté à investir de l’effort, la fatigue mentale peut mener à une baisse d’attention (Boksem, Lorist et Meijman, 2005), des difficultés au niveau du choix stratégique (Van der Linden, Frese et Meijman, 2003; Van der Linden, Frese et Sonnentag, 2003), une diminution de la qualité de l’activité motrice (Duncan et coll., 2015) ainsi qu’une diminution de la performance à des tâches d’effort physique soutenu.

1.2 Mesures de la charge mentale

Un effort considérable est investi afin d’élaborer des mesures de la charge mentale. Plusieurs raisons justifient cet intérêt. Les mesures de la charge mentale peuvent guider la conception d’interfaces ou de systèmes d’aide à la décision (p.ex. Görges et coll., 2013; Shen, Carswell, Santhanam et Bailey, 2012), aider à comprendre et optimiser l’apprentissage (p.ex. Wiebe,

(27)

13

Roberts & Behrend, 2010) ou encore, évaluer l’impact de changements organisationnels (p.ex. Colligan, Potts, Finn et Sinkin, 2015). Ils peuvent également permettre la conception de systèmes informatiques intelligents qui adaptent le niveau d’automatisation du travail afin de garder la charge mentale de l’humain dans sa zone optimale (p.ex. Aricò et coll., 2016; Dixon & Wickens, 2006). La section suivante vise donc à faire un survol des méthodes de mesures de la charge mentale. Avant de détailler ces méthodes, une revue des considérations psychométriques sera effectuée. Ces considérations permettent de qualifier différents aspects des mesures de la charge mentale et, éventuellement, permettent de les comparer entre elles. Par la suite, le chapitre couvrira les trois principaux types de mesure de la charge mentale : 1) les mesures comportementales, 2) les mesures subjectives et 3) les mesures physiologiques.

1.2.1 Considérations psychométriques

Lorsqu’il est question de mesurer un concept psychologique, il est nécessaire de s’assurer de ses propriétés psychométriques, telles que la validité, la fiabilité, la sensibilité et la spécificité. La validité réfère au degré auquel un instrument (c.-à-d. un questionnaire, une mesure physiologique) mesure réellement ce qu’il prétend mesurer2 (Chadha, 2009). La fiabilité correspond au degré auquel un instrument donne un résultat constant lorsque la mesure est répétée dans une situation similaire (Chadha, 2009), par exemple, en répétant la mesure sur une même personne à un moment différent dans le temps. La fiabilité est également très essentielle comme propriété psychométrique puisqu’elle qualifie l’erreur ou l’incertitude qui est associée à la mesure. La sensibilité et la spécificité sont deux autres propriétés psychométriques importantes, mais pourtant parfois négligées. La sensibilité est la probabilité d’un instrument à retourner une valeur positive lorsque le résultat est positif (Glaros et Kline, 1988)3. De manière analogue, la spécificité est la probabilité d’un instrument à retourner une valeur négative lorsque le résultat est négatif (Glaros et Kline,

2 Le concept de la validité comporte plusieurs sous-divisions telles que la validité interne, externe ainsi que la validité du test, elle-même sous-divisée en 3 (validité de contenu, de construit et de critère). Bien que cette thèse soit étroitement associée à la validité externe et la validité de construit, d’autres termes plus adaptés au domaine seront utilisés pour décrire ces caractéristiques (voir Chadha, 2009).

3 Le terme « sensibilité » peut avoir une signification différente en traitement de signal et métrologie

(28)

14

1988). Pour distinguer les deux, on fait souvent appel à l’exemple du dépistage du cancer. Si un test de dépistage est hautement sensible, il risque de repérer facilement tous les individus ayant un cancer, mais il risque également de signaler un cancer chez des individus sains (c.-à-d. générer beaucoup de faux positifs). À l’inverse, un test de dépistage hautement spécifique a rarement tort lorsqu’il diagnostique un cancer, mais n’arrive parfois pas à repérer un cancer lorsqu’il est présent. À titre d’exemple physiologique, il est généralement reconnu que le rythme cardiaque est très sensible à l’activité physique. Lors d’un effort physique, la probabilité d’observer un rythme cardiaque plus élevé est grande. Les exemples de spécificité physiologique sont beaucoup plus rares. Au mieux, il est suggéré que certaines combinaisons de signes physiologiques pourraient être spécifiques à un concept psychologique (Fairlough et coll., 2009). Des instruments de mesure, qui seraient à la fois hautement sensibles et hautement spécifiques, sont évidemment désirables puisqu’ils pourraient permettre, avec une bonne certitude, la détection des composantes de la charge mentale. Cette combinaison optimale de sensibilité et de spécificité, permettant de discriminer une hypothèse de ses alternatives, est appelée la diagnosticité (Matthews, Reinerman-Jones, Barber et Abich., 2015; Trope et Mackie, 1987). Une mesure hautement diagnostique peut permettre de repérer les comportements, les états mentaux et les manifestations physiologiques de phénomènes mentaux, c’est-à-dire l’ensemble des manifestations qui sont spécifiques à ces concepts. Par exemple, si une telle mesure existait, il pourrait être possible de mesurer l’effort mental à l’aide d’un ensemble de signes physiologiques, tout en garantissant qu’il ne s’agit pas de stress ou encore de variables confondantes, comme la consommation de café, l’exercice physique ou encore les particularités individuelles.

Mis à part les propriétés psychométriques classiques présentées jusqu’ici, certaines autres propriétés métrologiques affectent également la mesure. Ces propriétés regroupent les considérations temporelles, qui décrivent les temps et les délais requis pour effectuer une mesure, ainsi que les considérations pratiques, qui décrivent comment l’outil de mesure peut être efficace dans un contexte appliqué. Parmi les caractéristiques temporelles, trois paramètres sont particulièrement importants : 1) la durée de prise de mesure, 2) le délai avant l’obtention de la mesure et 3) la résolution temporelle de mesure. La durée de prise de mesure correspond au temps requis par l’instrument avant de pouvoir fournir une mesure. Le délai

(29)

15

avant l’obtention de la mesure correspond au temps entre la fin de la prise de mesure et le moment où la mesure est obtenue4. Finalement, la résolution temporelle de mesure correspond au temps minimum qu’il est nécessaire d’attendre avant d’obtenir une seconde mesure (Asch et coll., 2011). Il est nécessaire de préciser que les caractéristiques présentées ici ne font pas nécessairement référence aux propriétés des appareils de mesure eux-mêmes, mais plutôt aux propriétés des mesures de concepts psychologiques. À titre d’exemple, il est possible d’utiliser un électrocardiogramme en prenant 1000 mesures par secondes, ce qui correspond à une résolution temporelle très élevée. Toutefois, cela ne signifie pas que la mesure de la charge mentale peut être renouvelée 1000 fois par seconde. Selon la méthode utilisée, il faudra peut-être attendre plusieurs secondes avant d’obtenir une nouvelle mesure de la charge mentale, ce qui diminue ainsi la résolution temporelle de la mesure psychologique. Quant aux considérations pratiques, on peut distinguer : 1) la tolérance au bruit, 2) la portabilité, 3) l’acceptabilité et 4) la facilité d’implémentation. La tolérance au bruit est définie comme étant la capacité d’un instrument à fournir une mesure résistante aux paramètres indésirables (le « bruit ») comme l’activité physique, les variations d’éclairage ou les déplacements de l’appareil de mesure (Johnson, 2006). La portabilité représente la capacité d’un appareil de mesure à être transporté facilement. L’acceptabilité représente le degré de volonté d’un utilisateur à porter ou utiliser l’appareil de mesure (Matthews, Reinerman-Jones, Barber et Abich, 2014). Quant à la facilité d’implémentation, elle regroupe les considérations comme le coût, l’expertise requise et la complexité de l’implémentation (Matthews, Reinerman-Jones, Barber et Abich, 2014). Le Tableau 1 synthétise les informations précédentes.

4 La durée de prise de mesure et le délai ne sont pas des propriétés typiquement définies dans la littérature. Toutefois, il est jugé nécessaire de les ajouter pour capturer des propriétés temporelles de mesure qui ne peuvent pas être exprimées par la résolution temporelle.

(30)

16 Tableau 1

-Propriétés psychométriques et métrologiques utilisées ce projet

Propriété Description

Validité Degré auquel un instrument mesure réellement ce qu’il prétend mesurer.

Fiabilité Degré auquel un instrument donne un résultat constant lorsque la mesure est répétée.

Sensibilité Probabilité d’un instrument à retourner une valeur positive lorsque le résultat est positif.

Spécificité Probabilité d’un instrument à retourner une valeur négative lorsque le résultat est négatif

Diagnosticité Propriété d’une mesure à discriminer une hypothèse de ses alternatives.

Durée de mesure Temps requis par l’instrument avant de pouvoir fournir une mesure.

Délai d’obtention Temps entre la fin de la prise de mesure et le moment où la mesure est obtenue.

Résolution temporelle Temps minimum qu’il est nécessaire d’attendre avant d’obtenir une seconde mesure.

Tolérance au bruit Capacité d’un instrument à fournir une mesure résistante aux paramètres indésirables.

Portabilité Capacité d’un appareil de mesure à être transporté facilement.

Acceptabilité Degré de volonté d’un utilisateur à porter ou utiliser l’appareil de mesure. Facilité d’implémentation Coût, l’expertise requise et la complexité de l’implémentation

1.2.2 Mesures comportementales

Les mesures comportementales regroupent toutes les mesures qui peuvent être prises en observant les actions d’un individu. Il peut s’agir de mouvements physiques, de décisions ou encore de la performance des individus à une tâche. Les origines des mesures comportementales remontent aux tout débuts de la psychologie, notamment avec l’émergence de la psychologie expérimentale et de la psychophysique (voir Wertheimer, 2012). Dans l’interprétation de concepts psychologiques de bas niveau, les mesures comportementales peuvent être faciles à interpréter. Un des atouts des mesures comportementales et son bon niveau d’acceptabilité. En effet, il existe plusieurs cas où il est possible de mesurer le comportement ou la performance de l’individu sans avoir besoin de le

(31)

17

déranger, de l’interrompre et même sans affecter sa tâche. À titre d’exemple, il est possible de mesurer l’interaction avec un ordinateur (c.-à-d. l’utilisation du clavier ou de la souris) afin de prédire le niveau de fatigue de l’utilisateur (Pimenta, Carneiro, Neves et Novais, 2016) ou encore de mesurer les paramètres de conduite (Horberry et coll., 2006) sans que les utilisateurs n’aient à faire quoi que ce soit. Ces mesures ont toutefois quelques limitations. Le problème le plus proéminent des mesures comportementales provient du fait que de nombreux phénomènes psychologiques n’élicitent pas, à tout coup, un comportement. À titre d’exemple, un individu peut effectuer un effort mental (p.ex. planifier son travail, prédire l’issu d’une situation) sans nécessairement que cela ne soit observable. En terme psychométrique, cela revient à dire que les mesures comportementales ont parfois une faible sensibilité. Cette limitation affecte également la résolution temporelle des mesures comportementale puisqu’il est nécessaire d’attendre les actions avant de mettre à jour la mesure.

Les mesures comportementales de la charge mentale peuvent être divisées en deux catégories (Cain, 2007; Gawron, 2008). Premièrement, il est possible de se baser sur la performance de la tâche principale des individus. Selon cette méthode, plus un individu est chargé mentalement, plus la performance (c.-à-d. son temps de réaction ou encore sa précision) diminue (Cain, 2007; Gawron, 2008). Tel que noté par Wierwille et Eggemeier (1993), les mesures de la performance de la tâche principale peuvent avoir une bonne sensibilité sur le niveau de charge mentale. Toutefois, comme les individus sont capables de s’adapter à leur charge de travail, notamment à cause de leur entraînement, leurs expériences et leurs stratégies (O’Donnell et Eggemeier, 1986) il est possible que cette sensibilité soit fortement réduite et que la performance ne varie que très peu lorsque la charge de travail change. O’Donnel et Eggemeier (1986) notent également que les mesures de la charge mentale par la performance à la tâche principale sont biaisées lorsque la charge est très faible ou très élevée et que ces mesures sont souvent non généralisables à d’autres tâches. Les mesures comportementales peuvent également se baser sur la méthode de la tâche secondaire. L’idée derrière cette méthode est d’introduire une tâche secondaire artificielle, plus courte et moins complexe, à une tâche primaire et prédire la charge mentale à partir de la performance à cette seconde tâche. Les tâches secondaires sont souvent des tâches expérimentales (tâches de

(32)

18

mémoire ou d’arithmétique; voir Cain, 2007). La méthode de la tâche secondaire est très utilisée dans la recherche sur la charge mentale (Cain, 2007; voir par exemple Lansman et Hunt, 1982; Merat, Jamson, Lai et Carsten, 2012; Weinger et coll., 1994) et plusieurs travaux montrent que la performance à la tâche secondaire est parfois sensible aux variations de charge mentale de la tâche principale (voir Wierwille et Eggemeier, 1993). Bien que cette méthode convienne à une recherche en laboratoire, elle diminue fortement l’acceptabilité dans des situations réelles puisqu’elle provoque des interruptions. Dans certains cas, il est possible d’utiliser une tâche secondaire faisant partie du travail humain afin de mitiger les effets sur l’acceptabilité. L’introduction d’une tâche secondaire peut également avoir comme effet de changer les stratégies de la tâche principale (Meshkati et Hancock, 1995), ce qui affecte également la validité de la mesure.

1.2.3 Mesures subjectives

Les mesures subjectives font référence aux questions qui visent à comprendre l’état psychologique des individus tel que ressenti par ces derniers. Les mesures subjectives peuvent être très structurées, comme avec un questionnaire, mais également plus informelles, comme avec une entrevue. Il serait laborieux de faire une synthèse de toutes les formes de mesures subjectives utilisées dans l’histoire de la psychologie. On peut toutefois souligner que ces mesures sont utilisées dans la psychologie de la personnalité (p.ex. Ashton et Lee, 2007; Goldberg, 1992), dans le traitement de troubles psychologiques (p.ex. Duval et coll., 2018; Lovibond & Lovibond, 1995), ou encore en psychologie cognitive et en facteurs humains (voir Rubio, Diaz, Martín et Puente, 2004). Il peut être difficile de résumer la performance en validité et fiabilité des mesures subjectives de manière globale. On peut toutefois préciser qu’il existe de nombreuses méthodes statistiques permettant d’éprouver ces questionnaires (voir Chadha, 2009). Une des plus grandes forces des mesures subjectives est la haute diagnosticité qu’elles peuvent atteindre (Cain, 2007). Ce type de mesure bénéficie également d’une très grande facilité d’implémentation à faible coût. Contrairement aux mesures comportementales, les mesures subjectives peuvent être prises même en l’absence d’actions physiques. De plus, il est possible d’élaborer des questionnaires qui ne sont pas spécifiques à une tâche en particulier. Cet avantage permet de facilement comparer les tâches entre elles. Ces mesures ont toutefois quelques désavantages. Étant donné la nature subjective

(33)

19

de cette méthode, il est impossible d’atteindre une validité absolue. Les mesures subjectives sont reconnues pour être affectées par de nombreux biais cognitifs. Ces mesures dépendent également de la mémoire des personnes interrogées. Plus le délai entre l’événement et la mesure est long, plus l’individu doit se fier à sa mémoire pour répondre au questionnaire, ce qui peut mener à des imprécisions. Tout comme l’introduction de tâches secondaires (voir 1.2.2), les mesures subjectives provoquent des interruptions. Les mesures subjectives ont des caractéristiques temporelles qui peuvent être peu désirables. Des questionnaires trop élaborés peuvent avoir une durée de mesure très longue. Dans certains cas, il n’est pas non plus envisageable de répéter ces questionnaires plusieurs fois de suite.

Parmi les questionnaires les plus fréquemment utilisés afin de mesurer la charge mentale, on retrouve l’échelle de Cooper-Harper (Cooper et Harper, 1969), le Subjective Workload Assessment Technique (Reid, Eggemeier et Shingledecker, 1982) ou encore le NASA-TLX (Hart & Staveland, 1988). Certains autres questionnaires peuvent également être utilisés pour mesurer des sous-dimensions de la charge mentale. C’est le cas du Dundee Stress State Questionnaire (Helton, Matthews et Warm, 2009), qui vise à distinguer l’engagement, la détresse et l’inquiétude. Contrairement aux mesures comportementales, les mesures subjectives de la charge mentale ne sont pas toujours des bons prédicateurs de la performance (Vidulich, 1988; Yeh et Wickens, 1988). Tel que noté par Cain (2007), cette propriété n’est toutefois pas vue comme un problème par tous les auteurs (p.ex. Brookhuis et de Waard, 2002). Étant donné la faible résolution temporelle de ces outils, les mesures subjectives sont parfois jugées inefficaces pour relever des changements abrupts de charge de travail (Wierwille, 1988).

1.2.4 Mesures physiologiques

Il est difficile de retracer les origines exactes des mesures physiologiques. Tel qu’écrit dans Stern, Ray et Quigley (2001), la psychophysiologie à « une histoire courte, mais un long passé », signifiant que malgré le jeune âge du nom psychophysiologie (vers les années 1950), il est possible de retracer des exemples de mesures physiologiques jusqu’à l’antiquité. On pourrait suggérer que les mesures physiologiques modernes ont débuté avec l’apparition d’appareils tels que l’électroencéphalogramme (en 1926, voir Haas, 2003) ou

Figure

Figure 1 : Représentation schématique du modèle de Wickens (2008).
Figure 2 : Exemple d’un électroencéphalogramme et d’un système de spectroscopie proche  infrarouge 5
Figure 3 : Synthèse méthodologique Expériences
Figure 4 : Le Bioharness 3
+7

Références

Documents relatifs

parcelle DEPHY, la réduction d’IFT par rapport au verger référence est liée d’une part à la lutte raisonnée employée contre les bioagresseurs et d’autre part à

Dans ce but, nous avons analysé premièrement les modifications de la composition de la paroi cellulaire, ses propriétés d’hydrophobie, et la réponse transcriptomique de 27

deux directions : la géographie médicale ou encore géographie des maladies (répartition, prévalence des maladies), et la géographie des soins de santé (accès et recours aux

Le premier type de combinaison présenté dans le chapitre 4 consiste à ex- ploiter les sorties des systèmes de reconnaissance de la parole utilisant le même type de modélisation mais

– Dessiner le champ visuel d'un oeil fixant un point à 20cm d'un tableau en suivant le protocole fourni. Re – Formuler une hypothèse sur la sensibilité de la rétine aux

Les comptages cellulaires du lait des 4 quartiers Ctaient encore 6le- vbs en fin de dklai d'attente : respectivement 463 000 celluleslml 21 la 12bme traite aprbs le dCbut

MISE EN COMMUN DES DEUX ETUDES La spécificité relative du test Bovigam ® (PPD avec R inclus) actuellement utilisé en Dordogne est estimée entre 95,7 % et 98,4 % (Sp finale) alors

Pour les faibles prévalences d’infection (< 5%) et pour 50 ou 100 animaux testés la sensibilité des stratégies basées sur la sérologie ELISA de