Analyse quantitative des résultats
2. Cadre théorique
2.1 Hofer critique la méthode de Silberman
Les travaux de Hofer (1981a, 1981b, 1986) s’appuient sur les recherches de Silberman (1969) qui a notamment présenté une étude portant sur dix enseignantes du 3e degré élémentaire.
L’une des phases de cette recherche consistait à demander à ces enseignantes de classer deux de leurs élèves dans quatre attitudes suggérées par Silberman : élève attachement (si vous aviez le choix de conserver un élève une année de plus dans votre classe pour le simple plaisir, qui conserveriez-vous plus volontiers ?), élève indifférence (si le père de l’un des enfants venait à l’improviste, de quel enfant seriez-vous le moins préparé à parler ?), élève préoccupation (si vous pouviez consacrer toute votre attention à un élève qui vous préoccupe beaucoup, quel élève choisiriez-vous ?) et, élèves rejet (si votre classe devait être réduite, quel élève seriez-vous soulagé de voir quitter votre classe). Durant, une autre phase, les comportements de chaque enseignante vis-à-vis des élèves ont été observés durant 20 leçons pour comparer les traitements différentiels en fonction de l’attitude à laquelle les élèves étaient associés. Les résultats de Silberman montrent que l’association à l’attitude détermine les traitements pédagogiques. Cependant, Hofer pense que les quatre types retenus par Silberman ne sont pas une représentation fiable des connaissances que les enseignants possèdent concernant leurs élèves. Il s’appuie, pour corroborer sa critique, sur une étude de Storch (1978, cité par Hofer, 1981a) qui a montré que des enseignants ne sont parvenus qu’à cataloguer 50% de leurs élèves au sein des catégories de Silberman, 30% des élèves étaient classés dans plusieurs catégories à la fois et 20% n’étaient pas catégorisés du tout car leurs enseignants n’y étaient pas parvenus. Par ailleurs Hofer (1981a) prétend que le
2.2 L’approche de Hofer
Hofer (1981a) plaide pour une approche différente de celle de la fixation de types a priori par le chercheur. Pour lui, le chercheur doit identifier a posteriori des types d’élèves au départ des jugements des enseignants sur une ou plusieurs caractéristiques. Il présente deux recherches allant dans ce sens dans son texte : la première porte sur des élèves de l’enseignement secondaire et, la deuxième sur des élèves du primaire. Il explique ensuite une étude analysant les comportements différentiels des enseignants en fonction de catégories basées sur des scores de jugement.
2.2.1 Regroupements d’élèves du secondaire via les jugements de leurs enseignants
Hofer (1981a) propose des analyses de données rassemblées auprès de quinze enseignants d’allemand de classes du secondaire. Ils ont été priés de juger tous les élèves de l’une de leurs classes en fonction de 25 caractéristiques opposées sur des échelles de type Likert en 7 points allant du négatif au positif (note : Par exemple, pour la caractéristique « attitude que l’élève a face à l’école », l’échelle allait de 1 – attitude très défavorable à 7 – attitude très favorable). Hofer a ensuite soumis les matrices de jugements à une analyse en clusters selon deux algorithmes agglomératifs. Cette procédure lui a permis de mettre en exergue une catégorisation des 358 élèves de son échantillon en cinq types, qu’il décrit à partir de la comparaison des moyennes des différents profils aux 25 variables jugées par les enseignants. On peut interpréter ces cinq types comme étant deux bons et deux mauvais groupes d’élèves ainsi qu’un groupe d’élèves moyens.
Le premier cluster comprend 64 élèves que les enseignants qualifient d’intelligents, d’appliqués, de disciplinés et d’actifs. Ils sont contrôlables, prennent l’initiative et obtiennent de bonnes notes ;
Le deuxième cluster renferme 120 élèves qui obtiennent également des bonnes notes ainsi que des hautes valeurs de talent, de perspicacité et de discipline. Ils se distinguent par leur retenue sociale : ils sont sensibles, calmes, modestes, simples et participent peu ;
Le troisième cluster contient 60 élèves ayant un niveau de performance scolaire en dessous de la moyenne et des scores moyens aux autres variables. Ils sont considérés comme étant fermés, peu sûr d’eux, timides, calmes et distants, mais relativement
Le quatrième cluster englobe 74 élèves fort peu disciplinés avec une intelligence jugée moyenne, une haute activité sociale et plutôt une mauvaise relation avec le travail. Les trublions et les dérangeurs de tous les niveaux de rendement sont contenus dans ce cluster ;
Les 40 élèves du cinquième cluster sont perçus comme étant peu intéressés avec un don insuffisant, sans ambition ni perspicacité au travail et manquant d’activité sociale.
2.2.2 Regroupements d’élèves du primaire via les jugements de leurs enseignants Afin de contrôler si la même typologie se retrouve à l’identique dans d’autres niveaux scolaires, Hofer (1981a) a mené une seconde étude auprès de 167 élèves de 5 classes de deuxième primaire en effectuant le même procédé. Pour cet échantillon, le chercheur procède à un clustering initial et un clustering adapté. Pour son clustering initial, Hofer a, à nouveau, utilisé deux méthodes agglomératives hiérarchiques conduisant à une classification totalement identique des élèves. Dans les deux cas, une solution à quatre ensembles est la plus pertinente pour cet échantillon. Hofer ne décrit pas les quatre ensembles d’élèves du primaire dans ce texte, mais précise que, comparativement aux clusters du secondaire, les deux premiers groupes fusionnent et que les autres sont inchangés. En d’autres termes, il obtient un cluster de bons élèves, deux d’élèves faibles et un de moyens.
Pour comparer ces données avec celles du secondaire, Hofer procède à une nouvelle catégorisation de ces 167 élèves du primaire en forçant une solution à cinq clusters puis en calcule les scores moyens aux variables sous analyse. Il procède ensuite à un traitement statistique que l’on n’accepterait vraisemblablement pas à l’heure d’aujourd’hui puisqu’il corrèle ces scores moyens des clusters du primaire avec ceux des clusters du secondaire. Il obtient des corrélations allant de .98 à .78. Hofer en conclue qu’il y a une haute superposition dans la manière dont des enseignants de différents niveaux s’y prennent pour grouper les élèves selon leur ressemblance.
2.3 La tendance au regroupement comme artifice statistique
Hofer estime que les deux études qui précèdent appuient l’idée que les enseignants
comportant de quatre à cinq profils. Il écrit que la méthode de l’analyse par clusters s’est avérée valide pour l’identification de ces stéréotypes d’élèves dans les représentations des enseignants.
Ce constat est cependant mis en doute par Oldenbürger (1986) et par Friedrich (1979). A l’aide des données de Hofer (1969) qui concernent 36 enseignants et leurs 810 élèves, Oldenbürger a testé l’hypothèse de Hofer consistant à dire que les enseignants catégorisent leurs élèves en groupes. Il écrit qu’avant de pouvoir soumettre les matrices de données à une analyse en clusters, ayant par essence la propriété de structurer les données en ensembles hétérogènes d’éléments homogènes (Everitt, Landau, Leese, & Stahl, 2011), il faut analyser leur structure interne à l’aide d’algorithmes statistiques pour déceler si on peut raisonnablement considérer qu’elles contiennent des ensembles sous-jacents d’éléments.
Les algorithmes statistiques qu’il rapporte dans ses textes sont d’une extrême complexité, c’est pourquoi, nous ne rapporterons que sa conclusion ici : d’après ses résultats, on ne peut pas raisonnablement considérer que les matrices de données de Hofer (1969) contiennent des ensembles distincts d’élèves. Ainsi, Oldenbürger ne retrouve pas de pattern de regroupement des élèves chez les enseignants, et estime que les classifications de Hofer sont des produits de la structuration de données à partir d’algorithmes statistiques et donc des artefacts de la recherche.
A noter que Friedrich (1979) émet une critique semblable concernant l’identification d’une structure statistique artificielle via la participation de 76 enseignants secondaires autrichiens. Par ailleurs, ce chercheur montre que l’échelle de jugement de Hofer contient des dimensions qui n’appartiennent pas forcément à celles que les enseignants utilisent effectivement. De plus, il semblerait que les items avec des pôles opposés tels que ceux que Hofer a développés n’entrent pas en résonnance avec les représentations des enseignants.
Par exemple, dans l’échelle de Hofer, l’opposé d’intelligent est « bête » alors que les données de Friedrich indiquent que, pour les enseignants, le contraire d’intelligent correspond à « a besoin davantage d’aide pour l’atteinte des objectifs pédagogiques ».
Hofer n’est pas resté sourd face à ces critiques. Pour vérifier la pertinence de l’utilisation de
Dershimer (1978-1979), qui demande à des enseignants de regrouper les élèves de leurs classes selon leur ressemblance à l’aide d’étiquette (pour une description plus complète voir la partie méthode). Hofer et Köpke (1987) ont demandé à une vingtaine d’enseignants de cinq écoles différentes de juger les élèves de leur classe sur l’échelle de jugement utilisée précédemment par Hofer (1981a, 1981b, 1986), de les regrouper à l’aide d’étiquettes et de décrire les groupes d’élèves d’élèves ainsi obtenus. Leurs résultats d’analyse enseignants par enseignant montrent des taux de recouvrement décevants entre les regroupements par étiquettes et les clusterings à partir de scores de jugements. Ils en concluent que la méthode par analyse de scores de jugements est vraisemblablement inopportune pour déceler les catégories d’élèves contenues dans les bagages cognitifs des enseignants.
2.4 La structure interne des connaissances
Hofer (1986) interprète ses résultats en termes d’organisation interne des connaissances des enseignants en se référant à la théorie des prototypes d’Eleanor Rosch (1973, 1975, 1978). Il estime que les connaissances sont compartimentées en clusters distincts qui adoptent une organisation de type centrale-périphérique. Il nous semble donc important de proposer à ce stade une description des hypothèses les plus courantes sur la structure interne des croyances et connaissances.
Rokeach (1978) rassemble plusieurs de ses textes des années 1960 dans un livre. Il y défend l’idée que la structure des croyances s’apparente à une galaxie ayant plusieurs soleils (noyaux centraux) autour desquels gravitent des planètes ayant des satellites (éléments périphériques). Selon l’idée de Rokeach, toutes les croyances seraient inter-reliées au sein de cette galaxie et prennent les rôles de soleils, étoiles, planètes ou lunes en fonction de leurs importances respectives. Green (1971) pense aussi que les croyances et connaissances sont organisées selon une structure centrale-périphérique. Cependant, il estime que toutes les croyances ne sont pas inter-reliées. Il ajoute une dimension supplémentaire à la structuration des croyances, à savoir l’isolement. Pour Green (1971), les croyances adoptent une structure centrale-périphérique à l’intérieur de clusters de croyances qui n’ont pas de liens entre eux (il y aurait plusieurs galaxies). Toutefois, il n’exclue pas la possibilité que les
Pour être complet, il faut également citer les deux axes théoriques de la catégorisation.
Selon le premier axe, dit classique, toute catégorie est définie par un ensemble de conditions nécessaires et suffisantes ; tous ses éléments, ayant en tous points les mêmes caractéristiques, en sont de parfaits représentants (Hofer, 1986; Medin, 2004; Reed, 2011;
Sternberg, 2007). A l’opposé, la théorie des prototypes (Rosch, 1973, 1975, 1978) considère que l’esprit humain manipule des pseudo-catégories hiérarchisées au sein desquels les éléments sont regroupés selon leur proximité. Selon cette conception, les catégories sont formées sur la base de traits caractéristiques ou de critères précis, mais dont le nombre serait variable, qui décrivent le modèle réel ou prototypique de la catégorie. Ici, les regroupements seraient représentés par un (ou des) « centroïde(s) » qui pourrai(en)t être une distance moyenne « virtuelle » ou être représenté par un (voire plusieurs) membre(s) de la catégorie considéré comme son (ou leurs) meilleur(s) exemplaire(s). Autrement dit, certains membres de la catégorie seraient de meilleurs représentants que d’autres sans qu’il n’existe forcément de représentant parfait (Hofer, 1986; Medin, 2004; Reed, 2011;
Sternberg, 2007).
Hofer (1986) pense que ses recherches ont démontré que les connaissances des enseignants concernant le(ur)s élèves sont organisées en catégories isolées (clusters) dont la structure interne est de type centrale-périphérique et qu’elles adoptent une organisation prototypique avec une possibilité de frontières délimitées par des conditions nécessaires voire suffisantes. Cependant, comme nous l’avons vu plus haut Hofer a obligé ses données à adopter cette structure centrale-périphérique clusterisée. Aussi, nous pensons que sa recherche devrait être complétée par trois stratégies de recueil de données pour répondre à trois questions de recherche.
Premièrement, et afin de vérifier la pertinence de l’approche par clusterisation de scores de jugement pour identifier les catégories d’élèves dans le répertoire cognitif des enseignants, il serait intéressant de renouer avec l’approche de Storch (1978) et de demander à des enseignants de catégoriser leurs élèves à l’intérieur du système de clusters. La première question de recherche est donc : les enseignants assignent-ils à leurs élèves les mêmes
étiquettes de clusters que ceux que l’algorithme statistique leur confère à partir de leurs jugements ?
La deuxième question de recherche interroge la pertinence de l’hypothèse de l’organisation centrale-périphérique de clusters de croyances. Pour y répondre, nous adoptons une approche inspirée des recherches classiques en matière de catégorisation (Reed, 2011;
Rosch, Mervis, Gray, Johnson, & Boyes-Braem, 2004; Sternberg, 2007). Ces recherches analysent communément dans quelle mesure des sujets estiment que des objets sont proches des définitions suggérées pour les différentes catégories. Nous allons donc demander aux enseignants d’estimer la distance de chacun de leurs élèves à la catégorie à laquelle ils les ont assignés ainsi qu’aux autres catégories.
Troisièmement, conformément à la méthode de Morine-Dershimer (1978), nous demanderons aux enseignants de regrouper les élèves au sein d’ensembles qu’ils estiment hétérogènes mais dont ils estiment que les élèves qui les composent sont homogènes. La question est ici de vérifier d’une autre manière la pertinence du recours à l’analyse en clusters de scores de jugements pour identifier les catégories d’élèves contenues dans le bagage cognitif des enseignants.
L’analyse de la pertinence de l’approche de Hofer et de l’hypothèse de la structuration centrale-périphérique de clusters de connaissance sera donc au cœur de notre texte. Dans la suite nous allons décrire notre échantillon, la méthode que nous avons utilisée pour recueillir nos données, les traitements statistiques auxquels nous les avons soumises et les résultats auxquels ils permettent d’aboutir. Nous clôturerons notre contribution par une discussion quant à la structure interne des connaissances des enseignants et quant à l’utilisation de méthodes statistiques pour l’analyser.
3. Méthode