• Aucun résultat trouvé

CHAPITRE 3 – ANALYSES ET RÉSULTATS

3.4. Analyse de classification

L’analyse de classification (cluster analysis) vise à « constituer des groupes, c’est-à-dire une partition de l’ensemble étudié » (Nakache et Confais, 2005, p. 3), possédant la plus grande similitude intragroupe et la plus grande différence intergroupe. Dit simplement, « [l]a notion de groupe se base sur le concept de distance. Être dans le même groupe veut dire être proche » (Morgenthaler, 2013, p. 326). L’analyse de classification peut se représenter graphiquement sur un plan cartésien, où chaque individu est indiqué par un point sur le plan. Dans le cas présent, l’individu est situé dans ce plan en fonction de son orientation motivationnelle, soit en fonction de son résultat à la composante Ego (axe des abscisses) et à la composante Tâche (axe des ordonnées). L’analyse de classification sert donc à former différents groupes d’individus, sans aucune information a priori sur leur nombre ou leur constitution. L’intérêt de ce genre d’analyse est qu’elle prend en compte l’orientation motivationnelle (orientation vers l’ego et orientation vers la tâche) du répondant dans sa globalité, à l’inverse des analyses descriptives et inférentielles précédentes où les deux orientations sont analysées séparément. Les analyses de classification peuvent être divisées en deux catégories, soit les classifications hiérarchiques et les classifications non hiérarchiques, appelées le plus souvent classification par partition (ou partitionnement de données) (Nakache et Confais, 2005). Cette dernière forme d’analyse de classification sépare les données en un certain nombre de groupes en fonction de critères, procédant par itération afin d’optimiser l’assignation des répondants au groupe qui leur est le plus proche (Ruwet et Haesbroeck, 2015). Pour réaliser l’analyse de classification par partitionnement de données, la fonction « NbClust » du « package NbClust » du logiciel R a été utilisée. Cette fonction calcule différents critères statistiques selon cinq méthodes de classification (Ward, Complete, Average, Centroid, K-means) et selon douze critères statistiques. Le nombre de groupes qui est choisi le plus fréquemment parmi les douze critères est alors suggéré par la fonction statistique afin de produire les meilleurs groupes. En plus de calculer le meilleur nombre de groupes selon la méthode de classification, la fonction « NbClust » retourne la partition dans laquelle on trouve le groupe de chaque participant. Suite aux analyses des données recueillies, le nombre de groupe proposé ayant la plus grande récurrence parmi les cinq méthodes fut deux groupes. Dans l’optique de choisir la meilleure partition, le Cubic Clustering Criterion (CCC) a été utilisé comme critère pour sélectionner la méthode à privilégier afin d’effectuer la partition parmi les méthodes ayant suggéré deux groupes. La valeur de CCC la plus élevée (54.4) a été retenue, celle-ci ayant été obtenue avec la méthode k-means (ou k-moyennes). Cette méthode, la plus courante des analyses de classification par partitionnement, « est basée sur la minimisation de la somme des distances euclidiennes à l’intérieur des groupes » (Ruwet et Haesbroeck, 2015, p. 75), soit la distance entre deux coordonnées sur un plan cartésien. Compte tenu de ce qui a été présenté plus haut, la méthode k-means a été choisie afin de partitionner les données et de former les deux groupes.

À la suite de la formation des deux groupes, on remarque que la moyenne de la composante Ego des répondants du groupe 1 (2.60) est inférieure à celle du groupe 2 (3.89), alors que la moyenne de la composante Tâche des répondants est très similaire pour les deux groupes (4.58 et 4.56) (cf. Tableau 3.7). Précisons qu’à des fins de description, les résultats moyens de la Tâche et de l’Ego ont été divisés en trois catégories descriptives. Puisque les résultats possibles aux items du QPSS sont compris entre 1 et 5, dû à l’échelle de Likert à 5 points utilisée, des « étiquettes descriptives » ont été créées en divisant les résultats possibles en trois catégories égales et absolues, soit faible (entre 1 et 2.33), modéré (entre 2.34 et 3.66) et élevé (entre 3.64 et 5). Ainsi, le groupe 1 a été nommé « Ego-modéré/Tâche-élevé », car la moyenne de la composante Ego est de 2.60 et celle de la Tâche est de 4.58. De même, le groupe 2 a été nommé « Ego-élevé/Tâche-élevé », car la moyenne de l’Ego est de 3.89 et celle de la Tâche de 4.56.

Concernant les variables sociodémographiques, on constate en premier que la proportion de répondants s’identifiant au genre homme est plus élevée dans le groupe 2 Ego-élevé/Tâche-élevé (64.7 %) que dans le groupe 1 Ego-modéré/Tâche-élevé (51.2 %) (cf. Tableau 3.8). Pour la variable programme de formation, on ne remarque pas de grandes différences dans la constitution des deux groupes, les proportions des répondants inscrits au BIS (38.2 % contre 39.0 %) et au BEÉPS (61.8 % contre 61.0 %) étant similaires. Concernant le

nombre de sessions complétées, les seules données qui semblent différer d’un groupe à l’autre sont les

proportions de répondants ayant complété 5 sessions (17.1 % contre 27.3 %) et 7 sessions (23.6 % contre 15.0 %).

Tableau 3.7.

Caractéristiques générales des groupes

Ego Tâche Groupe Fréquence Proportion (%) M ET M ET 1. Ego-modéré/

Tâche-élevé 123 39.68 2.60 0.475 4.58 0.473

2. Ego-élevé/

Tâche-élevé 187 60.32 3.89 0.429 4.56 0.473

Tableau 3.8.

Caractéristiques des groupes en fonction du genre, du programme de formation et du nombre de sessions complétées

Groupe 1 Ego-modéré/Tâche-élevé

Groupe 2 Ego-élevé/Tâche-élevé Variable Fréquence Proportion (%) Fréquence Proportion (%) Genre Femme 58 47.2 66 35.3 Homme 63 51.2 121 64.7 Manquant 2 1.6 0 0.0 Programme BIS 47 38.2 73 39.0 BEÉPS 76 61.8 114 61.0 Sessions complétées 1 43 35.0 61 32.6 3 29 23.6 47 25.1 5 21 17.1 51 27.3 7 29 23.6 28 15.0 Manquant 1 0.8 0 0.0

Note. Manquant = donnée manquante.

Par la suite, des tests d’indépendance du Khi-carré de Pearson ont été réalisés afin de vérifier si les différences de proportion entre les deux groupes sont statistiquement significatives. Ce test « permet de déterminer si deux variables qualitatives sont indépendantes l’une de l’autre » (Bourque et El Adlouni, 2016, p. 205). Au final, seul le test du Khi-carré pour le facteur genre a été significatif (valeur de p exacte de 0.0323), tandis que les facteurs

programme de formation (valeur de p exacte de 0.9056) et nombre de sessions complétées (valeur de p exacte

de 0.0899) n’ont pas été significatifs. Ainsi, l’hypothèse d’indépendance entre le groupe et le genre fut rejetée, alors que l’hypothèse d’indépendance entre le groupe et le programme de formation ainsi que celle d’indépendance entre le groupe et le nombre de sessions complétées ne furent pas rejetées. Autrement dit, seules les variables groupe et genre possèdent un lien de dépendance statistiquement significatif. Enfin, deux tests de Wilcoxon, servants à « comparer les données de deux échantillons appariés » (Bourque et El Adlouni, 2016, p. 262), ont été réalisés afin de comparer la moyenne de l’Ego et la moyenne de la Tâche entre les deux groupes. Le test non paramétrique de Wilcoxon a été préféré au test de Student — son équivalent paramétrique —, puisque l’hypothèse de normalité n’était pas respectée. D’après les résultats, la moyenne de

la composante Ego entre les deux groupes (2.60 contre 3.89) est significativement différente (p < 0.0001), alors que la moyenne de la composante Tâche entre les deux groupes (4.58 contre 4.56) n’est pas significativement différente (p = 0.8820). En conclusion, les résultats des analyses de classification reflètent bien les constats tirés en premier lieu lors des analyses descriptive et inférentielle.

Documents relatifs