• Aucun résultat trouvé

Analyse en clusters des profils motivationnels des apprenants

CHAPITRE 6. ANALYSE ET INTERPRETATION DES RESULTATS

2.1 Analyse en clusters des profils motivationnels des apprenants

Comme on l’a déjà mentionné au chapitre précédent, nous procédons à une analyse en clusters non hiérarchique avec l’algorithme K-means et cela via le recours à la technique de la distance de dissimilarité euclidienne (deux observations qui se ressemblent, auront une distance de dissimilarité réduite, alors que deux observations différentes auront une distance de séparation plus grande) pour définir les clusters des participants selon leur niveau d’autodétermination.

Nous détaillons ci-dessous le déroulement du processus de clustering conformément à l’algorithme de K-means.

2.1.1 Répartition en clusters

Nous commençons dans un premier lieu par déterminer le nombre optimal de clusters regroupant des profils motivationnels homogènes. La première étape consiste à utiliser la méthode Elbow via la fonction statistique fviz_nbclust du package R «factoextra ». Cette fonction permet de définir le nombre optimal de clusters et cela en faisant plusieurs itérations de fouille au sein de nos données.

146

Cette fonction nous indique une répartition optimale des profils motivationnels en trois clusters (voir figure ci-dessous).

Figure 36 Graphe de définition du nombre optimal de clusters, conformément au méthode Elbow On remarque sur ce graphique, la forme d’un bras où le point le plus haut représente l’épaule et le point d’une valeur de 10 représente l’autre extrémité appelée la main. Le nombre optimal de clusters est le point représentant le coude. Ici le coude peut être représenté par la valeur 3. C’est le nombre optimal de clusters. Généralement, le point du coude est celui du nombre de clusters à partir duquel la variance ne se réduit plus significativement. En effet, la “chute” de la courbe de variance (distanciation) entre 1 et 3 clusters est significativement plus grande que celle entre 3 et 10 clusters.

La visualisation des répartions des apprenants donnée par l’algorithme K-means est schématisée ci-dessous grâce à la fonction fviz-cluster :

147

Afin de vérifier la qualité de répartition des données sur les trois clusters, nous faisons appel à une analyse de l’indice de silhouette : la valeur de la silhouette est une mesure de la similitude d'un objet avec son propre cluster (cohésion) par rapport aux autres clusters (séparation). L’indice de silhouette varie de -1 à +1, où une valeur élevée indique que l'objet est bien adapté à son propre cluster et mal adapté aux clusters voisins. Si la plupart des objets ont une valeur élevée, la configuration de clustering est appropriée. Dans notre cas nous calculons cet indice grâce à la fonction fviz_silhouette. La moyenne des silhouettes des points composants chacun des clusters est de 0,51 pour le cluster 1, 0,64 pour le cluster 2 et 0,61 pour le cluster 3. Le tableau ci-dessous nous donne un récapitulatif sur nos trois clusters :

Cluster 1 Cluster 2 Cluster 3

Indice de silhouette 0,51 0,64 0,61

Nombre d’éléments 284(43,10%) 261(39,61%) 114(17,30%)

Tableau 16 Indice de Silhouette pour les trois clusters

La figure suivante modélise donc l’indice de Silhouette pour les observations des trois clusters :

Figure 38 Répartition de l’indice de Silhouette des trois clusters de profil motivationnel des inscrits à la 2ème session du MOOC Delf/Dalf

Nous remarquons donc que cet indice est positif (0,54) pour l’ensemble de la population étudiée et qu’il dépasse le 0,5 pour la moyenne des populations de chaque cluster ce qui confirme la qualité de la répartition des profils motivationnels en trois clusters.

148

2.1.2 Caractéristiques des profils motivationnels proposés

Nous rappelons que nous procédons à une analyse intra-individuelle et cela en comparant les quatre composantes motivationnelles caractérisant les trois clusters. Le tableau ci-dessous nous donne les moyennes des quatre types de motivation au niveau de chaque cluster :

Cluster 1 Cluster 2 Cluster 3

1.MI 6,00 5,05 3,49

2.MERID 6,56 6,00 4,73

3.MERE 2,98 3,69 4,08

4.AMO 1,38 2,34 3,67

Tableau 17 Différences entre les trois clusters par rapport aux variables motivationnelles Cette répartition est schématisée comme suit :

Figure 39 Profils motivationnels des inscrits à la 2e session du MOOC Delf/Dalf

La classification des apprenants des trois clusters par rapport à leur moyenne obtenue pour les quatre variables motivationnelles nous a permis de définir les caractéristiques motivationnelles intra-individuelles de chaque cluster :

• Le premier cluster labellisé « Profil motivationnel autodéterminé » regroupe 284(43,10%) des apprenants dont le profil motivationnel présentait des scores les plus élevés de motivation intrinsèque (MI) et extrinsèque à régulation identifiée (MERID) et les scores les

149

plus faibles de motivation extrinsèque à régulation externe (MERE) et de score faible d’amotivation (AMO).

• Le deuxième cluster labellisé «Profil motivationnel modéré» regroupe 261(39,61%) des apprenants dont le profil motivationnel affichant à la fois des scores modérés à élevés de motivation autonome (Motivation intrinsèque et Motivation externe à régulation identifiée) et de niveau modéré de la motivation extrinsèque à régulation externe et d’amotivation • Le troisième cluster labellisé «Profil motivationnel faible» c’est un profil regroupant 114

(17,3%) apprenants, se caractérise d’un niveau de motivation autodéterminée (Motivation intrinsèque et externe à régulation identifiée) le plus faible des trois clusters et le niveau de motivation extrinsèque à régulation externe et d’amotivation le plus élevé par rapport aux

autres clusters.

Afin de confirmer cette relation entre chacune des quatre composantes motivationnelles et les trois clusters, nous avons opté pour un test statistique de comparaison des variances en occurrence le test ANOVA. Ces tests univariés ANOVA nous permettront de confirmer s’il y a une différence ou pas entre les variances des trois clusters par rapport à chacune des quatre composantes motivationnelles. Ci-dessous on trouve donc les résultats du test ANOVA par rapport à chacune des quatre composantes motivationnelles :

• La motivation intrinsèque [F (2,640) =201,7 ; p<2e-16],

• La motivation extrinsèque à régulation identifiée [F (2,640=194,9 ; p<2e-16)], • La motivation extrinsèque à régulation externe [F (2,640=1,48 ; p=0,902)] • Et l’amotivation [F (2,640) =292,3 ; p<2e-16].

Ces résultats nous rendent une valeur de p-value quasiment nulle pour les trois variables motivationnelles intrinsèque (MI), extrinsèque à régulation identifiée (MERID) ainsi que l’amotivation (AMO). Ce qui confirme l’hypothèse de relation statistique entre les trois clusters de profils motivationnels et les trois types de motivation.

La p-value relative à la variable motivation extrinsèque à régulation externe (MERE) est supérieure à 5% et donc on accepte l’hypothèse qu’il n’y a pas de lien statistique entre ce type de motivation et les trois clusters analysés.

La figure ci-dessous nous montre la différence entre les trois clusters pour chacune des quatre variables motivationnelles. Nous remarquons que, par rapport à la variable MERE, les clusters 2 et 3, une partie des données ayant une différence de variance égale à 0 ce qui veut dire que la variable MERE ne présente pas de différence pour une partie des données du cluster 2 et 3.

150

Analyse ANOVA univariée pour AMO Analyse ANOVA univariée pour MERE

Analyse ANOVA univariée pour MERID Analyse ANOVA univariée pour MI

Figure 40 Représentations graphiques de la différence des variances entre les quatre dimensions motivationnelles et les trois clusters de profils motivationnels

Dans la section suivante, on analysera la relation pouvant exister entre les trois clusters de profil motivationnel et la réussite au MOOC