Influence de la désirabilité sociale dans l’utilisation des tests de personnalité : une étude comparative de la validité du NEO-PI-3 dans un contexte d’orientation professionnelle et de sélection de personnel.

(1)

Influence de la désirabilité sociale dans l’utilisation des

tests de personnalité : une étude comparative de la

validité du NEO-PI-3 dans un contexte d’orientation

professionnelle et de sélection de personnel.

Mémoire

Janik Desbiens

Maîtrise en sciences de l'orientation - avec mémoire

Maître ès arts (M.A.)

(2)

Influence de la désirabilité sociale dans l’utilisation

des tests de personnalité : une étude comparative de

la validité du NEO-PI-3 dans un contexte

d’orientation professionnelle et de sélection de

personnel.

Mémoire

Janik Desbiens

Sous la direction de :

(3)

Résumé

L’inventaire de personnalité NEO-PI-3 (NEO-PI-3; Costa & McCrae, 2010) est un des questionnaires de personnalité les plus utilisés et diverses études en ont démontré la validité transculturelle (Crego, Gore, Rojas & al, 2015). Il n’est toutefois pas exempt de limites. Une d’entre elles concerne le caractère falsifiable des réponses fournies. Les experts critiquent l’absence d’une échelle de désirabilité sociale (DS; Benson, 2014; Kluck, 2014) et avancent que l’influence de la DS pourrait être différente selon les contextes d’évaluation (Congard & al., 2012). L’objectif de cette étude est d’évaluer l’influence différentielle de la DS dans l’utilisation du NEO-PI-3 en orientation professionnelle et en sélection de personnel. Cent deux étudiants universitaires ont rempli le NEO-PI-3 et le Balanced Inventory

of Desirable Responding de Paulhus (1998) en contexte simulé d’orientation

professionnelle et de sélection de personnel. Les corrélations entre la DS et les résultats au NEO-PI-3 sont faibles aux domaines Extraversion, Ouverture et Agréabilité, mais modérées pour Névrotisme et Conscience, et plus fortes avec l’autoduperie, une sous-échelle de la DS, et en orientation professionnelle. Seuls 56 des 240 items montrent une corrélation modérée avec la DS et gagneraient à être reformulés. Les répondants très enclins à la DS obtiennent des résultats plus faibles à Névrotisme et plus élevés à Conscience et Agréabilité. Bien que l’effet générale de la DS soit faible, elle s’avère présente en réponse aux items de Névrotisme et de Conscience et plus importante chez les répondants enclins à la DS. Dans le cas de l’Agréabilité et en contexte de sélection, la DS ne semble qu’affecter la façon de répondre des personnes qui font de l’hétéroduperie en plus de l’autoduperie. La prudence est requise quant à l’interprétation des résultats au NEO-PI-3. L’inclusion d’une échelle de DS est recommandée et des recherches complémentaires comparant les résultats au NEO-PI-3 dans des contextes d’évaluation réels plutôt que simulés seraient utiles.

(4)

Table des matières

Résumé ... ii

Table des matières ... iii

Liste des figures, tableaux, illustrations ... v

Remerciements ... vi

Introduction ... 1

Chapitre 1 Contexte théorique et objectifs de recherche ... 4

1.1 Les méthodes d’évaluation de la personnalité ... 4

1.1.1 Les types de tests objectifs de personnalité ... 9

1.2 Le NEO-PI-3 ... 10

1.2.1 Qualités métriques du NEO-PI-3 ... 12

1.2.2 Domaines et facettes du NEO-PI-3 ... 14

1.3 La désirabilité sociale ... 17

1.3.1 Influence de la désirabilité sociale à la complétion des tests objectifs de personnalité ... 21

1.4 Les objectifs de recherche et la pertinence de l’étude ... 27

Chapitre 2 Méthodologie ... 31

2.1 Participants ... 31

2.2 Instruments de mesure ... 32

2.2.1 Questionnaire de renseignements généraux ... 32

2.2.2 L’inventaire de personnalité NEO-PI-3 ... 33

2.2.3 L’Inventaire de désirabilité sociale (BIDR) ... 34

2.3 Procédure ... 36

3. Résultats ... 39

3.1 Préparation du fichier de données ... 39

3.2 Portrait des participants sur les plans scolaire et occupationnel ... 40

3.3 Relation entre les scores au NEO-PI-3 et la désirabilité sociale ... 43

3.3.1 Domaines et facettes du NEO-PI-3 ... 43

3.3.2 Items du NEO-PI-3 ... 48

3.4 Analyse comparative des profils de désirabilité sociale ... 52

4. Discussion ... 58

4.1 Relation entre les résultats au NEO-PI-3 et la désirabilité sociale ... 58

4.2 Profil de personnalité des individus qui ont une propension élevée à la désirabilité sociale ... 64

(5)

Conclusion ... 66 Références ... 71

(6)

Liste des figures, tableaux, illustrations

Tableau 2.1 Descriptions des participants en fonction des variables sociodémographiques ... 32 Encadré 2.2 Mise en contexte de la condition expérimentale Sélection de personnel ... 37 Encadré 2.3 Mise en contexte de la condition expérimentale Orientation

professionnelle ... 38 Tableau 3.1 Description des participants sur les plans scolaire et occupationnel . 41 Tableau 3.2 Corrélations entre les résultats au NEO-PI-3 et au BIDR en fonction du

contexte d’évaluation et moyennes en valeur absolue. ... 45 Tableau 3.3 Moyennes des corrélations en valeur absolue par domaine et par

facettes du NEO-PI-3 en fonction des dimensions de désirabilité sociale et des contextes d’évaluation. ... 47 Tableau 3.4 Liste des items du NEO-PI-3 qui montrent une corrélation modérée ou

élevée avec l’une ou l’autre des dimensions de désirabilité sociale et coefficients observés en fonction des contextes d’évaluation ... 49 Tableau 3.5 Analyses univariées - Moyennes et écarts-types de chacun des groupes

de désirabilité par domaines du NEO-PI-3 et sous-ensembles auxquels appartiennent les scores dans un contexte de sélection de personnel ... 54 Tableau 3.6 Analyse univariées - Moyennes et écarts-types de chacun des groupes

de désirabilité par domaines du NEO-PI-3 et sous-ensembles auxquels appartiennent les scores dans un contexte d’orientation professionnelle ... 56

(7)

Remerciements

Ce projet de mémoire figure sans nul doute parmi mes plus grandes fiertés et réalisations à ce jour. Mon premier remerciement s’adresse sans hésitation à Nathalie Parent. Je souhaite te remercier non seulement pour ton support, tes conseils et ta motivation pendant cette rédaction, mais également de m’avoir transmis cet intérêt pour la psychométrie lors de mes années universitaires. Il y aura eu plusieurs obstacles au travers de la route qui aura semé le doute, merci de m’avoir guidé. J’ai la ferme conviction que jamais je n’aurais pu me rendre où je suis sans ton aide et l’apprentissage que tu m’as apportés. Je réalise aujourd’hui avoir énormément évolué en quelques années.

Je tiens à remercier ma famille. Je crois que tous ont à leur façon contribué à ce projet. Que ce soit par les valeurs transmises, les ressources nécessaires, le support moral ou tout simplement me dire à la blague : « quand est-ce qu’il va finir ce mémoire-là ?». Je sais que vous avez toujours eu confiance malgré que ce n’était pas facile de comprendre pourquoi je le faisais. Un merci tout spécial à ma sœur Andrée-Ann et mes parents Guylaine et Langis pour vos conseils, ainsi que d’avoir écouté mes plaintes lorsque j’avais besoin de ventiler.

Je tiens également à remercier plusieurs amis. J’ai la chance d’avoir dans ma vie des individus incroyables avec lesquelles je grandis depuis plusieurs années. Des modèles qui m’ont ouvert la voie vers les études supérieures et qui m’ont montré que moi aussi je pouvais le faire. D’autres personnes se sont également ajoutées pendant le parcours et on suivit de près ou de loin mes étapes. D’ailleurs, merci Marc-Olivier pour tous ces cafés études et Valentin pour toutes ces nuits blanches productives !

(8)

Merci finalement à tous les gens qui m’ont soutenu de près ou de loin. Merci à ceux qui m’ont donné ma chance tout en acceptant ma situation d’étude. Un merci spécial à ceux qui ont accepté de participer à cette étude.

(9)

Introduction

Les inventaires de personnalité sont des instruments de mesure utilisés dans une variété de contextes qui disposent de nombreux avantages. On les emploie notamment en orientation professionnelle, dans le but d’aider les personnes à faire une exploration de choix de carrière, et en sélection de personnel, afin de contribuer à identifier les meilleurs candidats pour un poste donné. Bien que diverses études aient démontré la validité de façon générale de ces tests, l’emploi de ceux-ci entraîne tout de même son lot de critiques (Ones, Viswevaran & Reiss, 1996; Murphy et Dzieweczynski, 2005; Pelt, Van Der Linden et Born, 2018). La principale concerne le caractère falsifiable des réponses fournies à ces instruments qui en limiterait la validité pour certains individus (Boudrias & Morin, 2011). Ainsi, les recherches soulignent l’importance de prendre en compte la DS dans l’interprétation des résultats aux inventaires de personnalité, surtout quand les contextes incitent à se présenter sous un jour favorable, comme on pourrait le croire en sélection de personnel (Viswevaran, Deller & Ones, 2007).

La DS est une forme de gestion des impressions qui se caractérise par une tendance à vouloir se présenter sous un jour favorable plutôt qu’à offrir une image sincère de soi-même (Paulhus, 1991; Cambon, 2006; Hogan, 2017; Weiner & Greene, 2017). Il s’agit donc d’un biais de réponse et une certaine falsification des résultats en découle.

La DS peut entraîner des conséquences importantes sur le plan individuel comme un choix occupationnel erroné ou une intervention inadéquate (Viswesvaran & Ones, 1999; Ziegler & al., 2007). Elle peut aussi avoir des répercussions sur le plan collectif pouvant notamment entraîner de l’iniquité ainsi que des pertes sociales et économiques (Fisher, 1993 ; Franke, 2002; Goffin & Boyd, 2009). En effet, dans le cas d’une mauvaise décision en sélection de personnel, cette situation est non

(10)

seulement inéquitable pour la personne qui aurait dû être choisie, mais la candidature retenue peut aussi s’avérer incompétente et le processus de sélection à refaire à grands frais. Par ailleurs, dans une situation clinique, la DS peut mener à une erreur diagnostic qui fait en sorte qu’une personne ayant besoin d’une intervention n’obtient pas les soins requis ou qu’elle soit dirigée vers les mauvaises ressources. La santé mentale de cette personne peut alors se détériorer, ou bien cela peut se traduire par une sollicitation inefficace de ressources cliniques souvent limitées, laissant d’autres individus sans traitement.

C’est dans ce contexte que la présente étude s’intéressera à l’influence de la DS sur les résultats aux inventaires de personnalité dans une variété de contextes. Plus particulièrement, elle portera sur l’inventaire de personnalité NEO-PI-3, un des inventaires de personnalité les plus connus, et se penchera sur les contextes de la sélection de personnel et de l’utilisation clinique, par exemple dans un processus d’orientation ou de psychologie, de cet instrument. Est-ce que l’influence de la DS sur les résultats au NEO-PI-3 diffère selon les contextes ? C’est ce à quoi tentera de répondre cette recherche.

Ce mémoire est composé de cinq chapitres. Le premier propose une recension des écrits en ce qui concerne l’utilisation des inventaires de personnalité et ces liens avec la DS. Il se conclut par la présentation des objectifs de recherche. Le deuxième chapitre porte sur la méthodologie employée. Il comprend une description des participants, des instruments de mesure et de la procédure d’expérimentation. Le troisième chapitre présente les résultats obtenus, tandis que le quatrième en offre une discussion. Une conclusion générale incluant des pistes de recherche pour de futures études termine se mémoire.

(11)

(12)

Chapitre 1 Contexte théorique et objectifs de

recherche

Ce chapitre propose une recension de la documentation scientifique en ce qui trait à la problématique de recherche. Dans un premier temps, il décrit les méthodes et instruments d’évaluation de la personnalité, dont le NEO-PI-3. Il se poursuit avec une description des principaux biais de réponse et plus particulièrement du concept de DS. Ensuite, une description de l’utilisation des inventaires de personnalité dans un contexte d’orientation professionnelle et de sélection de personnel est réalisée, tout en décrivant les différents risques de DS dans ces contextes. Pour clore ce chapitre, les objectifs de recherche sont précisés.

1.1 Les méthodes d’évaluation de la personnalité

Il existe une variété de méthodes d’évaluation de la personnalité, selon les experts, les trois principales sont l’observation, l’entrevue et les tests psychométriques (Bernaud, 2014).

L’observation implique principalement de faire une analyse des comportements adoptés par la personne évaluée dans un contexte particulier (par exemple: au travail) ou pendant que celle-ci réalise des tâches liées à une situation particulière d’évaluation (par exemple: un jeu de rôle dans une mise en situation donnée). En multipliant les périodes ou situations d’observation (généralement de trois à cinq), on considère que l’on peut ainsi construire une image qui reflète adéquatement les caractéristiques de personnalité de l’individu (Bernaud, 2014 ; Hansenne, 2013). Les principaux avantages de cette technique résident dans le fait que les conclusions sont tirées par le professionnel à partir de l’expertise de l’évaluateur et de comportements précis qui ont été adoptés par l’individu lors de la période

(13)

d’observation (Bernaud, 2014) plutôt qu’en fonction des représentations cognitives de la personne évaluée en ce qui a trait à ses comportements, comme ce serait le cas en ayant recours aux entrevues ou aux tests psychométriques. Malgré ces avantages, force est de convenir que l’observation ne permet pas d’évaluer les comportements que la personne évaluée a pu adopter par le passé ni de connaître son opinion à l’égard de ceux-ci. Également, cette technique d’évaluation est teintée par la qualité de la relation de l’observateur avec la personne évaluée (Bernaud, 2014). Pour terminer, cette méthode d’évaluation peut s’avérer contraignante en ce qui trait à la correction. La présence d’un ou de plusieurs observateurs (accord inter-juge) est souvent nécessaire pour s’assurer de la fidélité des observations, ce qui entraîne des coûts faramineux (Hogan, 2017).

La deuxième méthode préconisée pour évaluer la personnalité est l’entrevue. Elle consiste en un échange verbal entre la personne évaluée et le professionnel portant sur des sujets relatifs au motif d’évaluation, permettant de mieux connaître la personnalité de l’individu et de prédire ses comportements futurs (Bernaud, 2014; Denis, Morin & Guidon, 2010). Au cours de cette discussion, c’est surtout la personne évaluée qui parle, le professionnel s’affairant à poser les questions pertinentes pour favoriser le dévoilement de soi, à écouter les réponses fournies et à prendre des notes judicieuses (Groth-Marnat, 2009). En évaluation, on a surtout recours à l’entrevue structurée ou semi-structurée (Hogan, 2017) qui implique que les thèmes permettant d’identifier les comportements présents et antérieurs sont déterminés à l’avance. Dans un contexte où l’entrevue est utilisée comme méthode permettant de classer divers individus, comme en sélection de personnel, non seulement le professionnel identifie préalablement les thèmes à aborder, mais il aura recours aux mêmes questions et déterminera une cotation précise des réponses en vue de faciliter les comparaisons entre les personnes évaluées en plus de ne pas simplement faire appel à une impression générale ou à la mémoire (Bernaud, 2014; Hogan, 2017).

(14)

Bien que l’entrevue soit une méthode disposant de plusieurs avantages, elle possède également des limites. Contrairement aux questionnaires, l’entrevue prend beaucoup plus de temps puisque l’expert ne peut évaluer qu’une personne à la fois (Hogan, 2017). De plus, étant donné que le temps imparti pour l’évaluation est limité, l’entrevue doit se concentrer sur les comportements liés aux exigences du contexte (Bernaud, 2014). Ainsi, contrairement à un questionnaire qui peut générer de l’information générale, l’entrevue va plutôt devoir cibler un type d’information précise. Il existe également des limites à cette méthode liée à l’évaluateur. Par exemple, l’effet de Halo (ou effet de la première impression) implique que le professionnel peut involontairement biaiser les résultats en fonction de sa perception de l’individu. Le problème de suggestivité, lui, implique que le professionnel peut involontairement biaiser les réponses en formulant les questions de façon à suggérer une réponse.

La troisième catégorie de méthodes d’évaluation de la personnalité est celle des tests psychométriques, plus précisément des tests de personnalité. Il s’agit d’instruments de mesure permettant d’évaluer un ou plusieurs traits de personnalité. On reconnaît généralement deux types de tests de personnalité, soit les tests projectifs et objectifs (Hogan, 2017).

Les tests projectifs présentent deux caractéristiques clés. D’abord, leurs items sont généralement des stimuli visuels ambigus (Hogan, 2017 ; Hansenne, 2018). Leur signification n’est pas immédiatement claire et laisse place à l’interprétation de la personne évaluée. De plus, leur format de réponse est libre, permettant à celle-ci d’expliquer ses réponses. L’hypothèse projective est que la réponse de la personne évaluée à un item ambigu sera déterminée par la dynamique de sa personnalité. Elle reflétera ainsi ses désirs, ses fantasmes, ses motivations, etc. Le plus connu

(15)

des tests projectifs est assurément le test de Rorschach (1927) au cours duquel le sujet est exposé à diverses taches d’encre. Pour chacune de ces taches, constituant un stimulus ambigu, le sujet est appelé à indiquer ce qu’il y voit. Des inférences sur la personnalité du client sont ensuite faites en fonction des réponses fournies.

La méthode projective se targue de permettre une évaluation en profondeur de la personnalité, voire même des conflits internes et l’inconscient (Hogan, 2017). Toutefois, il faut savoir que la cotation des tests projectifs est complexe et nécessite une formation approfondie (Greene & Weiner, 2008), que ces tests sont matière à surinterprétation et que leurs qualités métriques sont discutables dans la plupart des cas (Hogan, 2017).

Somme toute, les méthodes d’évaluation décrites précédemment ont leurs propres avantages, mais disposent de lacunes communes. De façon générale, elles requièrent une formation avancée ainsi qu’un grand investissement de temps dans une passation individuelle en plus d’une cotation qui peut parfois être lourde ou comportant de la subjectivité. Elles sont donc considérées comme coûteuses (Hogan, 2017) si on prend en compte l’ensemble des coûts/bénéfices, et disposant de qualités métriques parfois discutables. À cet égard, recourir à des tests objectifs de personnalité peut s’avérer une solution intéressante.

Les tests objectifs de personnalité se composent de questions ou d’affirmations incitant le répondant à dévoiler ce qu’il pense ou ressent, comment il se conduit dans certaines situations ou comment il réagit à divers événements (Hansenne, 2018). Ces tests proposent des choix de réponses, généralement sur une échelle binaire (vrai/faux; oui/non; accord/désaccord) ou de type Likert (Complètement/beaucoup/ moyennement/peu/pas du tout) (Hogan, 2017). Les tests objectifs sont basés sur

(16)

Les réponses aux énoncés sont ensuite compilées selon une grille de correction spécifique au test (Bernaud, 2014). La correction des tests objectifs de personnalité est une tâche cléricale qui ne nécessite aucune formation particulière (Hogan, 2017). À cet égard, elle ne requiert aucun jugement du professionnel et peut aisément être réalisée par un ordinateur. C’est en raison de cette correction mécanique égale pour tous que l’on qualifie ces tests de personnalité d’objectifs.

Bien que chaque méthode a ses propres avantages d’utilisation dans différents contextes, les tests de personnalité objectifs forment la méthode d’évaluation la plus utilisée (Hansenne, 2018). Que ce soit en clinique, en sélection de personnel ou autre, la première démarche d’une évaluation est souvent d’obtenir plusieurs échantillons de comportements (Hansenne, 2018). Dans ce contexte, les tests objectifs correspondent à ce besoin. Ils permettent d’évaluer rapidement et efficacement la personnalité et d’en savoir davantage sur les perceptions, les émotions et les comportements des répondants. Les tests objectifs de personnalité mesurent divers traits personnels généralement déterminés selon une approche empirique ou conceptuelle qui varie selon les objectifs du test et niveau d’intérêts à investiguer la personnalité. Ces tests peuvent aussi dresser un bilan identifiant les préférences de comportement, de réflexion et de motivation qui constituent la personnalité d’un individu (Bernaud, 2014). Malgré leurs avantages, les tests objectifs de personnalité ne sont toutefois pas exempts de biais. Leur lacune principale réside dans le fait que les résultats à ces tests peuvent être influencés par divers biais de réponse, notamment la DS (Bernaud, 2014 ; Boudrias & Morin, 2011 ; Hogan 2017). C’est dans ce contexte qu’est réalisé le présent mémoire.

(17)

1.1.1 Les types de tests objectifs de personnalité

Il existe deux types de tests objectifs de personnalité, soit les tests spécifiques de personnalité et les inventaires à large de spectre. Les tests spécifiques de personnalité visent à examiner un ou des traits spécifiques plus en profondeur. Ils sont souvent utilisés dans des contextes cliniques en vue d’évaluer des comportements précis, notamment ceux relatifs à l’anxiété, à la dépression et à l’agressivité (Hogan, 2017). Les tests spécifiques ont pour avantages d’être rapides (environ 15 minutes), concis et facilement interprétables. Toutefois, ils ont pour inconvénients de ne pas présenter une grande variété d’applications et de fournir des informations plutôt limitées.

Les inventaires à large spectre, quant à eux, visent à cerner la personnalité dans son ensemble. Ils contiennent un grand nombre d’items, soit plus de 200, et permettent l’évaluation de plusieurs traits de caractère, souvent résumés dans un rapport narratif (Hogan, 2017). Étant donné leur visée générale, ils sont utiles dans une variété de contextes notamment en clinique, en sélection de personnel et en recherche.

Il existe une panoplie d’inventaires de personnalité à large spectre. Parmi ceux-ci, le Minnesota Multiphasic Personality Inventory-2 (MMPI-2 ; Butcher et al., 1990) et le NEO-PI-3 (Costa & McCrae, 2010), figurent parmi les plus populaires (Butcher et Williams, 2009 ; Hogan, 2017 ; Hansenne, 2018 ; Colledani, Anselmi et Robusto, 2019). Le MMPI-2 est un inventaire de personnalité à large spectre qui axe sur les troubles de comportement. Il se retrouve sur presque toutes les listes des tests le plus fréquemment utilisés, de ceux ayant fait l’objet de plus de recherches et de ceux qui sont les plus souvent cités (Hogan, 2017). Quant au NEO-PI-3, il est considéré comme l’un des premiers tests visant à opérationnaliser la théorie des Big Five. À

(18)

cet égard, il est devenu l’exemple principal des inventaires de personnalité à large spectre visant à évaluer la personnalité normale (Hogan, 2017). C’est dans ce contexte que la présente recherche s’intéressera à cet inventaire de personnalité.

1.2 Le NEO-PI-3

Le NEO-PI-3 est un inventaire de personnalité à large spectre composé de 240 items répondus sur une échelle de type Likert en cinq points variant de « Fortement en désaccord » à « Fortement en accord ». Originalement créé en 1985, il a été révisé en 1992, puis en 2010. La version la plus récente s’adresse aux individus de 12 ans et plus et a comme objectif principal de fournir une évaluation de la personnalité dite normale. Le NEO-PI-3 se veut une opérationnalisation de la théorie des Big Five (Costa & McCrae, 1992). À cet égard, il permet d’évaluer la personnalité en fonction des cinq grands domaines à l’origine de cette théorie ainsi qu’une variété de facettes représentant des manifestations comportementales de chacun d’eux.

Il existe deux versions du NEO-PI-3, soit une version d’auto-évaluation (version S) et une autre utile à des fins d’évaluation par un tiers (version R). Le présent mémoire portera sur la version S du NEO-PI-3, soit la plus utilisée des deux (Hogan, 2017).

Le NEO-PI-3 est disponible sous le format papier-crayon ainsi qu’électronique. On estime que 30 à 45 minutes sont suffisantes pour le remplir. Un rapport narratif détaillé peut également être généré à la suite de sa passation en ligne, ce qui contribue à la popularité du NEO-PI-3 dans une variété de contextes (Hogan, 2017).

Il est à noter qu’une version abrégée du NEO-PI-3 est également disponible. Celle-ci dispose toutefois de son identité propre et se fait connaître sous le nom de NEO

(19)

Five Factor Inventory (FFI-3; McCrae & Costa, 2007). Cette version du NEO-PI-3 ne comprend que 60 items et peut être remplie en une dizaine de minutes. Bien qu’elle offre une évaluation rapide des 5 grands domaines de la personnalité, ce qui est plus particulièrement utile en recherche, elle ne permet pas l’investigation des facettes de chacun d’eux.

Le NEO-PI-3 est utilisé un peu partout dans le monde et plusieurs études ont été conduites afin d’en vérifier la validité transculturelle (McCrae & al., 2010). Il est d’ailleurs estimé qu’il a été traduit dans plus de 50 langues, dont le français (Le Corff & Busque-Carrier, 2016).

Le NEO-PI-3 permet l’obtention de 5 scores reflétant chacun des domaines de la théorie des Big Five, puis de 30 facettes représentant des manifestations comportementales de chacun d’eux. Le score brut de chaque domaine et facette du NEO-PI-3 est conversé en score T permettant de comparer l’individu aux gens du même âge et du même sexe que lui à partir d’un groupe normatif représentant les États-Unis. À cet égard, deux séries normes sont proposées. Une première est basée sur un échantillon de 500 jeunes âgés de 12 à 20 ans et la seconde, sur un groupe de 635 adultes de 21 à 91 ans. Ces échantillons ont été constitués à partir d’individus respectivement originaires de 26 et 29 états américains (Costa et McCrae, 2010). Toutefois, les experts relèvent un manque d’information en regard à la représentation de la diversité ethnique, de niveau d’éducation et de la localisation géographique (Benson, 2014).

Au Québec, les normes américaines et des normes canadiennes-françaises sont utilisées. Ces dernières ont été réalisées à partir d’un échantillon de 2186 individus

(20)

âgés de 18 à 64 ans ayant répondu à la version électronique du NEO-PI-3 dans la plateforme internet de l’éditeur canadien (Institut de recherches psychologiques).

1.2.1 Qualités métriques du NEO-PI-3

En ce qui a trait à la cohérence interne du NEO-PI-3, Costa et McRae (2010) rapportent des indices variant de 0,89 à 0,93 pour les domaines et de 0,54 à 0,83 pour les facettes, avec une médiane de 0,76. En somme, les coefficients de cohérence interne sont considérés excellents pour les domaines et satisfaisants pour la plupart des facettes, bien que la facette Ouverture aux actions affiche un coefficient alpha de 0,54 et s’avère problématique (Benson, 2014; Kluck, 2014).

Le manuel du NEO-PI-3 ne rapporte toutefois aucune donnée sur la fidélité test-retest et réfère plutôt aux données cumulées au sujet de la version antérieure du test. Les coefficients du NEO-PI-R sont donc de 0,91 à 0,93 pour les domaines et de 0,70 à ,91 avec une moyenne de 0,83 pour les 30 facettes. Dans l’ensemble, les critiques sont d’avis que les preuves de fidélité du test sont satisfaisantes, mais que les évidences de stabilité temporelle doivent être renforcies pour ce qui est du NEO-PI-3 (Kluck, 2014; Benson 2014).

Dans le cas de la structure factorielle du NEO-PI-3, les auteurs ont conduit diverses analyses factorielles afin de vérifier à quel point la structure interne du test correspond aux prédictions de ce modèle, soit de représenter le modèle de la théorie des Big Five (Costa & McCrae, 2010). Somme toute, les résultats de ces analyses confirment la structure factorielle suggérant la présence de 5 facteurs représentant les 5 domaines de la théorie des Big Five et les 30 facettes s’y rattachant. Par ailleurs, il faut souligner que le NEO-PI-3 a été traduit en plusieurs langues et que sa structure factorielle a ainsi été testée à partir des données d’une variété

(21)

d’échantillons d’origines ethniques diverses. Les travaux de McCrae et Costa (1997) et McCrae et Terracciano (2005) sont notamment remarquables à ce sujet et dans l’ensemble, ils démontrent que les traits de personnalité du NEO-PI-3 peuvent être observés dans une diversité de pays, allant de l’Islande à l’Éthiopie et de l’Israël au Japon (McCrae & al., 2010). D’ailleurs, l’étude de McCrae et Terracciano (2005) rapporte une comparaison des résultats d’analyses factorielles de plus de 50 cultures différentes. À quelques exceptions près, les résultats de la structure factorielle reproduisent les résultats des analyses antérieures sur le NEO-PI-R. Toutefois, ils ont remarqué une variance des scores aux différentes échelles d’une culture à l’autre, spécialement dans les cultures occidentales. Bien que la structure factorielle soit stable culturellement parlant, ces résultats incitent à croire que des normes nationales propres à chaque culture sont essentielles.

Finalement, diverses études ont démontré la validité convergente du NEO-PI-3 affichant des corrélations significatives entre ce test et d’autres inventaires de personnalité, tels l’Eysenck Personality Inventory (EPI), les échelles du DSM-5 ou encore une échelle d’expression émotionnelle (Laghai & Joseph, 2000 ; Costa & McCrae. 2010 ; Crego, Gore, Rojas & al, 2015).

Malgré les preuves de fidélité et de validité cumulées au sujet du NEO-PI-3, l’inventaire n’est pas à l’abri des critiques. La plus importante concerne l’influence possible des biais de réponse sur les résultats au test, et plus particulièrement de la DS. Kluck (2014), comme plusieurs autres (Schinka, Kinder & Kremer 1997 ; Goffin & Christiansen, 2003 ; Marshall & al, 2005), considère que l’absence d’échelles de validité dans le NEO-PI-3 constitue une lacune importante. À cet égard, il invite les utilisateurs à la prudence puisque l’instrument ne contient aucun indice leur permettant de s’assurer objectivement de la validité des données cumulées sur les répondants.

(22)

Pour leur part, les concepteurs du NEO-PI-3 sont d’avis que l’inclusion d’indices de validité engendrerait plus de conséquences négatives que le problème en soi, puisque la validité des indices de validité s’avère imparfaite. En d’autres termes, les concepteurs croient que ces indices de validité n’arriveraient pas à départager les gens qui mentent des gens possédants vraiment des traits de haut niveau. Dans ces circonstances, ils conseillent plutôt de ne pas utiliser le NEO-PI-3 si l’on croit que le répondant ne sera pas honnête ou d’utiliser la version de l’instrument pouvant être répondu par un tiers.

Kluck (2014) conclut que l’opinion des auteurs vis-à-vis les critiques quant à la DS est déroutante et constitue un problème en soi. À cet égard, la présente étude permettra d’en savoir un peu plus concernant l’influence de la DS sur les résultats au NEO-PI-3 dans différents contextes d’utilisation et les qualités métriques de l’instrument.

1.2.2 Domaines et facettes du NEO-PI-3

Ainsi qu’il a été mentionné, le NEO-PI-3 permet d’évaluer la personnalité en fonction des cinq grands domaines de la théorie des Big Five. À chacun de ces grands domaines se rattachent 6 facettes qui constituent des comportements spécifiques de ces domaines. Le texte qui suit offre un aperçu de ces cinq grands domaines de la théorie des Big Five et leurs facettes, telles qu’évaluées à l’aide du NEO-PI-3. Ces cinq grands domaines sont le Névrosisme (N), l’Extraversion (E), l’Ouverture (O), l’Agréabilité (A) et la Conscience (C).

Le domaine Névrosisme (N) fait référence au domaine des émotions. Il met en contraste l’adaptation ou la stabilité émotionnelle à l’inadaptation ou névrosisme. Il

(23)

s’agit en fait de la tendance générale de l’individu à éprouver des affects négatifs, tels que la peur, la tristesse, la gêne, etc. (Costa et McCrae, 2010). D’ailleurs, les individus qui font de la DS auront tendance, à l’inverse des autres traits, à obtenir un score plus faible (Ballenger, Caldwell-Andrews & Baer, 2001). Ils pourraient par exemple sous-estimer ses troubles d’adaptation ou encore surestimer sa stabilité émotive pour bien paraître. Les facettes du domaine Névrosisme sont l’anxiété, la colère-hostilité, la dépression, la timidité sociale, l’impulsivité et la vulnérabilité (Costa et McCrae, 2010).

Le domaine Extraversion (E) fait certes référence à la sociabilité, mais également à l’intérêt des individus à être en contact avec les autres et à leur manière d’agir au sein d’un groupe (Costa et McCrae, 2010). Weiss et Feldman (2006) avancent l’idée que les individus extravertis ont davantage tendance à faire de la DS, et ce, pour deux raisons. La première est qu’ils ont tendance à vouloir bien paraître en société. Ils mettent ainsi plus d’efforts à créer une image positive de soi pour être acceptés. La deuxième est qu’ils seraient possibles qu’étant plus souvent en interaction avec des gens, ils seraient également plus compétents à mentir. Les facettes de l’Extraversion sont la chaleur, la grégarité, l’assertivité, l’activité, la recherche de sensation et les émotions positives (Costa et McCrae, 2010).

Le domaine Ouverture à l’expérience (O) fait référence à l’intérêt des individus pour ce qui se passe autour de lui et en lui. Les facettes de ce domaine représentent la zone d’expérience à laquelle un individu est ouvert (Costa et McCrae, 2010). Peu d’études mentionne de lien entre la DS et l’Ouverture. Les facettes de ce domaine sont l’ouverture aux rêveries, à l’esthétique, aux sentiments, aux actions, aux idées et aux valeurs (Costa et McCrae, 2010).

(24)

Le domaine de l’Agréabilité (O) fait surtout référence aux tendances interpersonnelles (Costa et McCrae, 2010). La personne agréable est fondamentalement altruiste. Celle-ci est sympathique envers les autres et croit que les autres vont l’être également en retour. En fait, ce domaine fait référence aux valeurs humaines et aux comportements de bienveillance envers l’entourage (Costa et McCrae, 2010). Graziano et Tobin (2002) affirment que l’Agréabilité est le domaine le plus susceptible d’être élevé chez les individus qui font de la DS, puisque plusieurs des composantes présentent des qualités apparaissant socialement désirables. Ils auront ainsi tendance à surestimer leur côté sympathique et sensible et sous-estimer leur hostilité. Les facettes de ce domaine sont la confiance, la droiture, l’altruisme, la compliance, la modestie et la sensibilité (Costa et McCrae, 2010).

Le dernier domaine, la Conscience (C) fait référence à la maîtrise des pulsions, soit l’apprentissage de l’individu face à la gestion des désirs. Le domaine fait également référence à la planification, à l’organisation et à la mise en exécution des tâches (Costa et McCrae, 2010). Les individus qui font de la DS ont tendance à obtenir de haut score à ce domaine, souvent pour démontrer une haute volonté de réussir ce qu’ils entreprennent, par exemple en laissant supposés qu’ils sont des bourreaux de travail. Graziano et Tobin (2002) avancent que le domaine de la Conscience peut être affecté par un facteur qu’ils appellent l’autosurveillance. Il s’agit du fait d’être conscient des attentes de l’évaluateur et de se conformer à ceux-ci. En fait, un score élevé à ce domaine suggère une propension à respecter les règles et à réfléchir davantage aux conséquences (Spector, 2011). Les facettes de la Conscience sont la compétence, l’ordre, le sens du devoir, la recherche de réussite, l’autodiscipline et la délibération (Costa et McCrae, 2010).

Comme on peut le constater, plusieurs domaines et facettes du NEO-PI-3 apparaissent vulnérables à la DS, ce qui peut négativement affecter l’interprétation

(25)

de résultats issus de son utilisation, malgré ce que peuvent en penser les concepteurs de l’instrument. Dans ce contexte, la prochaine section de ce mémoire vise à mieux définir plus spécifiquement le concept de DS et son influence sur les résultats aux tests objectifs de personnalité.

1.3 La désirabilité sociale

Comme décrit précédemment, malgré la volonté d’avoir des tests dits objectifs, une des limites de ces instruments s’avère la possibilité qu’ils soient affectés par des biais de réponse comme la DS (Hogan, De Fruyt & Rolland, 2005 ; Boudrias & Morin, 2011). Somme toute, un biais de réponses peut se définir par une tendance du répondant à remplir un instrument de mesure d’une façon qui ne correspond pas vraiment à ce qu’il pense ou ce qu’il ressent pour différentes raisons comme une volonté de terminer la tâche plus rapidement ou à vouloir bien paraître (Goffin & Boyd, 2009 ; Hogan, 2017).

Il existe plusieurs types de biais de réponses. Les plus connus et les plus souvent pris en compte et évalués dans les tests de personnalité sont les tendances à l’acquiescement, à la désapprobation, à la réponse aléatoire, à l’incohérence, et à la gestion des impressions (Hogan, 2017).

L’acquiescement, la désapprobation et la réponse aléatoire se caractérisent par une tendance du répondant à ne pas vraiment prendre en compte le contenu des items pour répondre (Boudrias & Morin, 2011). Le biais d’acquiescement est suspecté quand une personne se dit d’accord avec une grande proportion des énoncés du test en comparaison avec le groupe normatif. Pour ce qui est de la désapprobation, elle se remarque chez le répondant qui se déclare en désaccord pour une grande

(26)

proportion des items de l’instrument, toujours en comparaison avec le groupe normatif. Finalement, la tendance à la réponse aléatoire est observée chez une personne qui répond différemment du groupe normatif à des items qui font généralement l’unanimité et qui sont intégrés dans un inventaire de personnalité spécifiquement pour la détecter (par exemple, je bois 50 verres de lait par jour ou j’ai fait la une du journal à plusieurs reprises au cours de l’année).

La tendance à l’incohérence caractérise la personne qui répond de façon contradictoire à des items qui sont hautement compatibles. Par exemple, un répondant ne prêtant pas attention à ses réponses ou étant déconcentré, peut se décrire comme une personne craintive à un item, et mentionner n’avoir peur de rien à un autre item. Des échelles d’incohérence constituées de ce genre de paires d’items se retrouvent régulièrement dans certains inventaires de personnalité.

La gestion des impressions, quant à elle, constitue une tentative de créer une impression favorable ou défavorable de soi au moyen de ses réponses (Hogan, 2017 ; Pelt, Linden et Born, 2018). Dans ce contexte, la falsification négative ou gestion défavorable des impressions, est une tendance des individus à vouloir dépeindre une image négative et peu flatteuse d’eux-mêmes en fonction de leur connaissance de ce qu’ils considèrent comme non désirable pour s’en approcher (Paulhus, 1991 ; Hogan, 2017). Inversement, la DS, ou gestion favorable des impressions est une tendance des individus à vouloir dépeindre une image positive d’eux-mêmes en fonction de leur connaissance de ce qu’ils considèrent comme désirable (Paulhus, 1991 ; Cambon, 2006 ; Hogan, 2017 ; Weiner & Greene, 2017).

Pour certains experts, la DS fait référence à un besoin d’approbation sociale (Crowne & Marlowe, 1960). Pour la plupart des personnes, rien ne pousse vraiment à la simulation, et l’idée de projeter une image honnête est satisfaisante. Toutefois,

(27)

pour d’autres, le besoin d’être accepté en fonction de ce qu’ils perçoivent comme étant la norme sociale s’avère plus important (Hogan, 2017). Différents contextes peuvent aussi exacerber cette tendance comme la sélection de personnel ou le cadre légal.

Pour d’autres experts, la DS fait référence à une habileté sociale de type défensif (Paulhus & Reid, 1991). Il s’agirait alors d’une volonté de modifier l’image projetée dans le but de cacher des traits de personnalité qu’on n’ose pas démontrer. Par exemple, un individu peut mentionner se faire facilement des amis et en avoir plusieurs, alors qu’il est plutôt timide socialement. Finalement, des experts allèguent que la désirabilité pourrait être un style de personnalité (McCrae & Costa, 1983), une tendance à performer socialement ou à adopter des comportements acceptables (Chen, 1994; Solhberg, 1976). Par exemple, un jeune voulant rejoindre le groupe populaire de son école aura tendance à adapter des comportements cohérents aux normes de ce groupe. À cet égard, Crowne et Marlowe (1964) indiquent que les individus à forte DS auraient tendance à être plus prudents, conventionnels et persuasifs.

D’ailleurs, Holden et Passey (2010) amènent des détails cruciaux à prendre en considération. Ils précisent que la DS n’est pas forcément une source d’erreur à contrôler et que les mesures de DS pourraient prédire une partie de la variance du score vrai. Aussi, la DS pourrait s’avérer un trait de personnalité important dans certaines situations, notamment en contexte d’emploi. À cet égard, ces experts mentionnent que la DS pourrait être une composante importante dans la prédiction de la performance en emploi.

(28)

dimensions (Paulhus, 1984 ; Pauls et Crost, 2004 ; Juhel & Rouxel, 2005). La première, l’autoduperie, décrit une forme d’évaluation optimiste de soi, l’individu croyant sincèrement à la description favorable qu’il fournit de lui-même (Juhel & Rouxel, 2005). Il s’agit d’une propension inconsciente à se mentir soi-même en exagérant les comportements favorables et en minimisant les comportements défavorables (Paulhus, 1991). Dans son échelle d’autoduperie, Paulhus (1991) la définit comme évaluant le déni des pensées qui sont psychologiquement menaçantes tout en étant supposément universellement vraies. Par exemple, une personne pourrait mentionner qu’elle n’a jamais douté de ses compétences. La deuxième dimension, l’hétéroduperie, renvoie à une autoprésentation de l’individu visant volontairement à donner une image positive de soi dans des situations ou des environnements qui incitent plus particulièrement à duper et/ou à manipuler (Juhel & Rouxel, 2005 ; Boss, König & Melchers, 2015). Par exemple, une personne pourrait mentionner qu’elle a toujours respecté le Code de la route même s’il était peu probable qu’elle se fasse arrêter.

Il est important de noter que selon les experts, un répondant doit voir une opportunité avant de procéder à la duperie (Goffin & Boyd, 2009). Cette opportunité pourrait se décrire par l’absence de conséquences liées à la supercherie ou bien par une évaluation que les avantages à se présenter positivement surpassent les inconvénients associés au fait de mentir. Par exemple, dans un contexte de sélection de personnel, un candidat croyant qu’il a peu de chance d’être embauché pourrait voir plus d’avantages à la supercherie (et être engagé) quitte à se faire démasquer, auquel cas le résultat serait le même et il ne serait tout simplement pas embauchée.

Pour évaluer la DS et ses deux dimensions, Paulhus a conçu le Balanced Inventory of Desirable Responding (BIDR version 7 ; Paulhus, 1998)

,

un des tests les plus utilisés dans ce domaine (Pauls & Crost, 2004 ; Hart & al., 2015). Les tests évaluant

(29)

la DS incluent des items constitués d’affirmations traduisant des comportements de tous les jours allant à des items positifs qui sont rarement endossés ou des items négatifs qui sont rarement réfutés. Par exemple, il serait possible de retrouver des items allant de «J’ai de mauvaises habitudes» à «Je dis toujours la vérité».

D’ailleurs, les échelles de DS sont souvent administrées avec d’autres tests psychométriques, comme les tests de personnalité, afin de contrôler un possible biais de réponse et ainsi assurer la validité de ces tests (Paulhus, 1991). À ce titre, plusieurs inventaires de personnalité, comme le MMPI-2, contiennent des échelles de validité de profil permettant d’évaluer des biais de réponse comme la DS (Brown & Sellbom, 2020). Ce n’est toutefois pas le cas du NEO-PI-3, ce qui est d’ailleurs bien critiqué (Hogan, 2017). Mais comment la DS influence-t-elle les résultats aux tests objectifs de personnalité ?

1.3.1 Influence de la désirabilité sociale à la complétion des tests objectifs de personnalité

De nombreuses études ont été réalisées en vue de cerner l’influence de la DS dans la complétion des inventaires de personnalité (Goffin & Woods, 1995 ; Hogan, De Fruyt & Rolland, 2005 ; Congard, Antoine, Ivanchank & al, 2012). En somme, ce biais peut influencer et altérer les résultats à un test, ce qui affecte la validité des conclusions tirées à partir de l’instrument (Goffin & Woods, 1995). Plus précisément, certaines études concernant instruments mesurant des dimensions du Big Five ont démontré que la DS pouvait influencer les réponses à certains items, modifiant ainsi le score moyen à certains traits et donc la signification générale des résultats pour certains individus (Viswesvaran & Ones, 1999 ; Ziegler & al., 2007). L’étude de Birkeland et ses collègues (2006) portant sur la sélection de personnel concluent notamment que certaines échelles, surtout celles qui sont liées au motif d’évaluation (par exemple être engagé), sont plus atteintes que les autres, démontrant ainsi que

(30)

l’effet de la DS est plus important pour les traits de personnalité des répondants qu’ils jugent désirables selon le contexte.

Ellingson, Sackett et Smith (2001) allèguent que les réponses aux tests de personnalité autorapportés sont plus susceptibles d’être influencées par la DS. Selon eux, l’intention et la motivation d’un répondant à choisir sa réponse peut dépendre d’un processus inconscient ou conscient. Plus précisément, les candidats peuvent inconsciemment fournir des réponses qui, à leur avis, révèlent des traits propres et représentatifs de sa personnalité, même si d’autres observateurs tels que leur conjoint n’étaient pas d’accord. Dans d’autres cas, les candidats désireux d’obtenir un emploi peuvent envisager de fausser ou modifier leurs réponses, dans l’espoir que ces réponses augmentent leur chance d’être sélectionnés. Dans les deux cas, la réponse socialement souhaitable apparaît comme une source de variance supplémentaire (Ellingson, Sackett & Smith, 2001). Ainsi, il semblerait que l’influence de la DS sur les résultats à un test de personnalité puisse être différente d’un individu à l’autre et d’un contexte à l’autre.

Des chercheurs ont voulu étudier l’influence de la DS sur la mesure de la personnalité et le rôle du contexte d’évaluation (Congard, et al., 2012). Plus précisément, ils ont voulu comprendre ce qui se passe lorsqu’une personne répond à un inventaire de personnalité dans un contexte où la DS risque d’avoir plus d’influence, soit dans un contexte de sélection de personnel. Pour ce faire, les chercheurs ont comparé les résultats des participants ayant répondu au Test d’Admission initial – aspect personnalité (TAMI-P ; Congard et al, 2012) ainsi que l’inventaire DS 36 (Tournois et al, 2012) dans deux contextes d’évaluation simulés dans un délai de 8 jours. Le premier contexte incitait le répondant à remplir le TAMI-P de façon neutre et le deuxième, comme s’il participait à un processus de sélection de personnel. Le TAMI-P opérationnalise les cinq dimensions de la personnalité, tout comme le NEO-PI-3. Il est observé que les scores à l’inventaire de personnalité

(31)

varient selon le contexte. Plus précisément, en contexte de sélection de personnel, il est observé que les résultats au domaine Névrotisme du TAMI-P sont plus faibles et qu’ils sont plus élevés pour tous les autres domaines à l’exception d’Ouverture. Par ailleurs, les dimensions Névrotisme et Conscience montrent les plus fortes corrélations avec la DS, et ce, aux deux dimensions de DS. Le domaine Extraversion, quant à lui, corrèle modérément avec l’autoduperie seulement. Il serait intéressant de vérifier si de tels résultats seraient observés avec le NEO-PI-3.

Les inventaires de personnalité sont souvent utilisés en sélection de personnel. Plusieurs études ont donc été réalisées afin de déterminer si les réponses à certaines dimensions des inventaires de personnalité pourraient plus particulièrement être falsifiées dans ce contexte (Juhel & Rouxel, 2005 ; Goffin & Boyd, 2009 ; Congard & al, 2012).

De façon générale, Boudrias et Morin (2011) avancent qu’en théorie, les réponses à toutes les dimensions de personnalité peuvent être falsifiées puisque les exigences pour un emploi varient d’une occupation à l’autre. Par exemple, l’analyse de l’agréabilité peut être utile dans la sélection d'un candidat pour un emploi impliquant le service à la clientèle mais pas dans celle d’un scientifique œuvrant dans un laboratoire. Toutefois, les dimensions concernant la stabilité émotionnelle et le sentiment de compétence tel les domaines Névrotisme et Conscience seraient presque toujours utiles (Boudrias & Morin, 2011). En effet, ces dimensions décrivent des traits de personnalité qu’il est avantageux de posséder dans le monde occupationnel. Par exemple, dans la plupart des emplois, les gestionnaires préfèrent les candidats qui sont stables sur le plan émotionnel (et donc plus posés et résistants au stress) et qui sont soignés, organisés et qui ont à cœur la réussite.

(32)

L’étude de Juhel et Rouxel (2005) a analysé l’influence du contexte d’évaluation sur les scores latents des dimensions de la DS en plus de comparer les temps de réponse associés. Les chercheurs avaient pour hypothèse que les scores d’une échelle évaluant la DS seraient plus élevés dans un contexte de recrutement que dans un contexte de bilan de compétence. Pour vérifier cette hypothèse, ils ont administré un questionnaire de personnalité et un questionnaire de DS construit à partir de 24 items du DS36 (Tournois et al, 2006) à deux échantillons. Le premier est constitué de 720 adultes répondant dans un contexte de bilan de compétence, le deuxième est constitué de 306 adultes répondant dans un contexte d’un cabinet de recrutement privé. À noter qu’à la différence de bien des études, dans ce cas-ci, les contextes étaient réels. Les auteurs ont ensuite comparé et analysé les résultats et les temps de réponses aux DS selon les contextes. Les résultats démontrent un lien entre la DS et les contextes de sélection et de bilan de compétence. De plus, leur hypothèse semble également confirmée, les résultats étant plus élevés dans un contexte de recrutement que dans un contexte de bilan de compétence et ce, pour les deux dimensions. Les résultats des délais de réponse suggèrent la possibilité d’une activation automatique (délais plus rapides) des réponses socialement désirables quand les contraintes situationnelles (charge attentionnelle) sont plus fortes (Juhel & Rouxel, 2005). Dans la présente étude, il est toutefois requis de se questionner quant au questionnaire de DS utilisé. En effet, le questionnaire initial ne contenait que 24 items et les auteurs en ont retiré 5, jugeant que ceux-ci n’engendraient pas de réponses socialement désirables. Il serait pertinent de réaliser une telle étude à l’aide d’un questionnaire de DS plus reconnu, comme le BIDR de Paulhus (1991).

Les inventaires de personnalité sont aussi fréquemment utilisés dans un contexte d’orientation afin de connaître le profil de personnalité d’un individu et l’aider à réfléchir sur son choix de carrière ou de formation. On pourrait s’attendre à ce qu’un client en contexte d’orientation réponde de façon honnête et représentative, puisqu’il est dans son intérêt d’avoir des résultats valables. L’étude de Schermer (2019)

(33)

appuie d’ailleurs cette idée. Le chercheur a voulu vérifier si les résultats au Jackson Career Explorer (JCE; Schermer & MacDougall, 2012) pouvaient être influencé par la DS. Pour ce faire, un échantillon de 779 adultes nord-américain a rempli le JCE, l’échelle de DS du Personality Research Form (PRF; Jackson, 1999) et le Self– Monitoring Scale de Snyder et Gangestad (1986) une échelle qui évalue l’autoduperie. Les résultats montrent que le JCE ne corrèle avec aucune des échelles de DS. Ainsi, il semblerait que la DS ait peu d’influence dans un contexte d’orientation. Toutefois, l’auteur nous met en garde quant aux résultats puisqu’une seule dimension de la DS n’a été utilisée. De plus, cette échelle avait une valeur de cohérence interne relativement faible. Pour terminer, il est important de préciser que le JCE ne portait pas sur les dimensions de la théorie des Big Five, mais plutôt sur les intérêts vocationnels. Dans ce contexte, il serait possible de se demander si de tels résultats se retrouveraient avec le NEO-PI-3 et si des différences pourraient être observées en fonction des dimensions de DS évaluées.

Pour leur part, Schinka, Kinder et Kremer (1997) ont mené une étude visant à concevoir des échelles de validité pour le NEO-PI-R. Pour ce faire, les auteurs ont administré le NEO-PI-R à un échantillon de 140 adultes recrutés de façon aléatoire parmi une liste de gens ayant répondu à une étude nationale sur la performance en emploi. Les répondants devaient simplement remplir ce questionnaire sans aucun contexte d’évaluation. Par la suite, ils ont sélectionné des items du NEO-PI-R ayant obtenu des scores moyens extrêmes pour former leurs échelles de validité (0,5 écart-type au-dessus ou en dessous du score moyen de 2,0). Cette étude leur a permis de conceptualiser trois échelles de validité découlant des items du NEO-PI-R, soit la gestion positive des impressions (10 items), la gestion négative des impressions (10 items) et l’inconsistance (10 paires d’items à contenu semblable). Les auteurs ont ensuite créé un échantillon normatif constitué de résultats de 400 adultes. Pour terminer, les auteurs ont administré leurs échelles à 5 échantillons de personnes répondant selon différents contextes. Deux groupes différents ont

(34)

un hôpital, un autre groupe de façon à convaincre l’hôpital qu’ils ont besoin de traitement psychologique. Le dernier groupe a été construit par un algorithme générant des résultats aléatoires aux items. Ils ont ensuite comparé ces résultats à leur échantillon normatif. Les analyses ont révélé que les échelles de validité conçues étaient sensibles aux différences entre les groupes, c’est-à-dire que les contextes semblent avoir un effet sur les résultats des échelles de validité. Toutefois, puisqu’il s’agissait d’une première ébauche, des études supplémentaires étaient nécessaires afin d’appuyer la pertinence de ces échelles.

Dans ce contexte, Young et Schinka (2001) ont examiné les qualités métriques des échelles de validité développées par Shinka et al. (1997). Somme toute, la consistance interne des échelles est satisfaisante et les validités de convergence et de divergence sont soutenues par les corrélations observées avec les échelles de validité du Personality Assessment Inventory (PAI ; Morey, 1991). Toutefois, dans la vérification de la validité des échelles de Schinka et ses collaborateurs, les auteurs mentionnent que les résultats ont été obtenus auprès de vétérans ayant un contexte spécifique. Ces auteurs précisent donc que le contexte pourrait avoir joué sur les résultats et qu’il serait nécessaire de faire d’autres recherches avec une clientèle moins spécifique.

L’étude de Marceau (2012) a analysé la validité des échelles de Shinka auprès d’une clientèle universitaire de 71 étudiants ayant rempli le NEO-PI-R et le BIDR. Les participants devaient simplement répondre de façon la plus honnête et spontanée. Somme toute, les résultats à cette étude démontrent que le NEO-PI-R serait peu affecté par la DS, les corrélations entre les résultats aux domaines et facettes du NEO-PI-R et les résultats aux échelles du BIDR étant faibles ou négligeables. En fait, seules les facettes Sens du devoir, Vulnérabilité, Ouverture aux idées et Ouverture aux rêveries auraient un lien faible avec l’autoduperie. Pour ce qui est des items, l’étude de Marceau montre un lien faible avec la DS pour 35 des 240 items

(35)

seulement, alors que pour les autres, les corrélations sont négligeables avec les deux dimensions de DS. Pour la grande majorité, ces items plus affectés par la DS, sont associés au domaine Névrotisme. Outre ces items pour lesquels la chercheure suggère une reformulation, cette étude avance l’idée que les résultats au NEO-PI-R seraient peu affectés par la DS. Quant aux échelles de Schinka, les résultats des corrélations entre ces échelles et les dimensions du BIDR démontrent peu de liens, à l’exception de l’échelle Gestion positive des impressions qui aurait un lien significatif faible (r = 0,26) avec l’autoduperie. À cet égard, la validité des échelles de Schinka n’est pas soutenue.

Toutefois, l’étude de Marceau (2012) demandait aux participants de répondre de façon la plus représentative de leur personnalité et ne prenait donc pas en compte de contexte particulier. Ainsi, il pourrait être intéressant de vérifier si la DS influence les réponses à la troisième édition du NEO (NEO-PI-3) dans une étude qui permettrait de comparer des contextes d’utilisation variant quant à la propension à la DS.

1.4 Les objectifs de recherche et la pertinence de l’étude

Ainsi qu’il a été mentionné, les inventaires de personnalité sont des instruments de mesure utilisés dans une variété de contextes qui disposent de nombreux avantages. Bien que diverses études aient démontré la validité de façon générale de ces tests, l’emploi de ceux-ci entraîne tout de même son lot de critiques (Ones, Viswevaran et Reiss, 1996 ; Murphy et Dzieweczynski, 2005 ; Pelt, Van Der Linden et Born, 2018). La principale concerne le caractère falsifiable des réponses fournies à ces instruments qui en limiterait la validité pour certains individus et dans certains contextes (Boudrias & Morin, 2011). Ainsi, on reproche à plusieurs concepteurs de tests objectifs de personnalité de ne pas suffisamment contrôler ou évaluer

(36)

l’influence de la DS sur les résultats (Boudrias et Morin, 2011 ; Kluck, 2014). Malgré un nombre considérable d’études démontrant les bonnes qualités métriques du NEO-PI-3 dans une variété de contextes (Denis, Morin et Guindon, 2010 ; Derrick et Chibnall, 2006), celui-ci n’échappe pas à cette critique puisqu’il ne contient aucune échelle de DS. Dans ce contexte, des experts se questionnent sur la validité des résultats issus de cet instrument de mesure pour certains individus plus enclins à la DS et/ou dans certains contextes qui y sont plus propices (Kluck, 2014 ; Benson, 2014).

Est-ce que cela varie selon le contexte d’utilisation ? C’est ce à quoi la présente recherche tentera de répondre.

D’autre part, certaines études avancent l’idée que les dimensions de la DS n’affectent pas les résultats de la même façon (Juhel & Rouxel, 2005 ; Marceau, 2012). Par ailleurs, certains domaines, notamment le Névrotisme et la Conscience, seraient plus à risque d’être affecté par un biais de DS (Ballenger, Caldwell-Andrews & Baer, 2001 ; Congard & al, 2012). Cela supposerait donc que les réponses de certains profils d’individus montrant un profil de DS élevé pourraient affecter les résultats à quelques domaines du NEO-PI-3. Il devient alors pertinent d’étudier de quelle façon les dimensions autoduperie et hétéroduperie affectent les résultats aux NEO-PI-3. Est-ce que des individus montrant un profil de DS élevé se distinguent des autres dans leur façon de répondre au NEO-PI-3 ? Est-ce que certains domaines du NEO-PI-3 sont plus à risque ? Ces différences se retrouvent-elles à chaque dimension et à de multiples contextes d’évaluation ? Ce mémoire permettra également de répondre à ces questions.

(37)

L’objectif général de cette recherche est d’étudier la relation entre la DS et les résultats à l’Inventaire de personnalité NEO-PI-3. Dans ce contexte, quatre objectifs spécifiques sont particulièrement visés.

Le premier est d’étudier la relation entre les scores à une échelle de DS et ceux du NEO-PI-3. Pour ce faire, un groupe d’individus remplira le NEO-PI-3 ainsi qu’une échelle de DS réputée. Le patron de corrélations entre les résultats aux échelles du NEO-PI-3 et ceux d’une mesure DS sera étudié tant avec les scores aux domaines et aux facettes qu’avec les réponses aux items. Certaines études pourraient nous laisser croire que les résultats aux domaines Névrotisme, Agréabilité et Conscience corréleraient davantage avec une mesure de DS (Ballenger, Caldwell-Andrews & Baer, 2001; Graziano et Tobin, 2002; Boudrias & Morin, 2010; Spector, 2011).

Le deuxième objectif est de comparer l’influence de la DS dans deux contextes d’utilisation, soit le contexte de l’orientation professionnelle et celui de la sélection de personnel. Ainsi, les participants répondront au NEO-PI-3 à deux reprises, soit une fois dans un contexte où l’on simule un processus d’orientation professionnelle et une autre dans un contexte où l’on simule un processus de sélection de personnel. En fonction des recherches réalisées par le passé, il est attendu que les résultats au NEO-PI-3 corrèlent plus fortement avec la DS lorsque celui-ci est rempli dans un contexte de sélection de personnel (Juhel & Rouxel, 2005; Birkeland & al., 2006; Goffin & Boyd, 2009; Congard & al., 2012).

Le troisième objectif est d’estimer l’influence différentielle des dimensions de la DS, sur les résultats au NEO-PI-3, et ce, en fonction des contextes d’évaluation. Pour ce faire, les résultats aux deux dimensions de DS (autoduperie, hétéroduperie) seront corrélés aux résultats au NEO-PI-3 rempli dans chacun des contextes d’utilisation.

(38)

autoduperie de la DS corrèleront davantage avec les résultats au NEO-PI-3, et ce, dans les contextes d’orientation professionnel et de sélection de personnel (Ballenger, Caldwell-Andrews & Baer, 2001; Marceau, 2012; Conguard & al., 2012)

Finalement, le quatrième objectif de ce mémoire est d’étudier si les individus montrant un profil de DS élevé se distinguent des autres dans leur façon de répondre au NEO-PI-3 pour chacun des contextes d’évaluation. Pour ce faire, les résultats au NEO-PI-3 de groupes d’individus ayant obtenu des résultats de DS élevés seront comparés, et ce, dans un contexte favorisant la réponse honnête (orientation professionnelle) et dans un autre plus propice à la DS (sélection de personnel). De cette façon, il sera possible de vérifier comment les dimensions de la DS affectent les résultats au NEO-PI-3 et si ces différences se reproduisent à chaque contexte. La documentation scientifique nous laisse croire que les individus enclins à la DS obtiendront des résultats plus élevés au contexte de sélection de personnel et aux domaines Névrotisme, Conscience et Agréabilité du NEO-PI-3 (Ballenger, Caldwell-Andrews & Baer, 2001; Graziano et Tobin, 2002 Juhel & Rouxel, 2005; Birkeland & al., 2006; Boudrias & Morin, 2010; Spector, 2011).

Cette recherche contribuera ainsi à mieux cerner l’influence de la DS sur les résultats aux inventaires de personnalité ainsi qu’au débat sur la nécessité d’intégrer une échelle de DS à l’inventaire de personnalité NEO-PI-3.

(39)

Chapitre 2 Méthodologie

Ce chapitre expose la méthodologie utilisée dans le but de réaliser la présente recherche. L’échantillon de participants y est décrit, puis les instruments de mesure utilisés. La procédure suivie tout au long de la recherche est également présentée dans ce chapitre.

2.1 Participants

La population visée par cette recherche est celle des étudiants universitaires de tous domaines et cycles d’études. Ceux-ci sont à une étape charnière de leur vie et il est logique de croire qu’ils explorent les choix de carrière possibles en fonction de leurs études et qu’ils planifient de s’impliquer à court terme dans la recherche d’un poste en lien avec leur formation académique. À cet égard, ils font partie des individus généralement sollicités pour répondre à des inventaires de personnalité dans des contextes d’orientation et de sélection de personnel et risquent davantage d’être interpellés par la présente recherche.

L’échantillon de participants est composé de 102 étudiants universitaires. Il s’agit de femmes dans 76,5% des cas (n=78), avec un âge moyen de 31,99 ans (é.t. = 8,95) dont l’origine ethnique est caucasienne pour la plupart (n=80 ; 78,4%). Les participants sont principalement au baccalauréat (46,1%; n=47) ou à la maîtrise (22,5%; n=23). Le tableau 2.1 offre un portrait sociodémographique détaillé de l’échantillon.

(40)

Tableau 2.1 Descriptions des participants en fonction des variables sociodémographiques

Variables sociodémographiques Pourcentage de participants (n) Sexe Femmes Hommes 76,5% 23,5% (n=78) (n=24) Origine ethnique Caucasienne Africaine Autochtone Européenne Latine ou Hispanique Autres origines Origines multiples 78,4% 2,9% 1,0% 3,9% 2,9% 2,0% 8,8% (n=80) (n=3) (n=1) (n=4) (n=3) (n=2) (n=9) Niveau d’étude Baccalauréat Maîtrise Doctorat Certificat 46,1% 22,5% 9,8% 21,6% (n=47) (n=23) (n=10) (n=22) 2.2 Instruments de mesure

Dans le cadre de cette étude, trois instruments de mesure ont été utilisés. Il s’agit d’un questionnaire de renseignements généraux, de l’Inventaire de personnalité NEO-PI-3 (Costa & McCrae, 2010) et de l’Inventaire de désirabilité sociale BIDR (Paulhus, 1998).

2.2.1 Questionnaire de renseignements généraux

Le questionnaire de renseignements généraux, conçu spécifiquement pour cette étude, est composé de 10 questions permettant d’abord à collecter de l’information générale sur les participants comme l’âge, le sexe, l’origine ethnique ainsi que le parcours scolaire et professionnel. Une série de questions permettent aussi de