• Aucun résultat trouvé

Analyse quantitative des résultats

2. Cadre théorique

2.1 Hofer critique la méthode de Silberman

Les  travaux  de  Hofer  (1981a,  1981b,  1986)  s’appuient  sur  les  recherches  de  Silberman  (1969)   qui a notamment présenté une étude portant sur dix enseignantes du 3e degré élémentaire.

L’une   des   phases   de   cette   recherche   consistait   à   demander à ces enseignantes de classer deux de leurs élèves dans quatre attitudes suggérées par Silberman : élève attachement (si vous aviez le choix de conserver un élève une année de plus dans votre classe pour le simple plaisir, qui conserveriez-vous plus volontiers ?), élève indifférence (si   le   père   de   l’un   des   enfants  venait  à  l’improviste,  de  quel  enfant  seriez-vous le moins préparé à parler ?), élève préoccupation (si vous pouviez consacrer toute votre attention à un élève qui vous préoccupe beaucoup, quel élève choisiriez-vous ?) et, élèves rejet (si votre classe devait être réduite, quel élève seriez-vous soulagé de voir quitter votre classe). Durant, une autre phase, les comportements de chaque enseignante vis-à-vis des élèves ont été observés durant 20 leçons   pour   comparer   les   traitements   différentiels   en   fonction   de   l’attitude   à   laquelle   les   élèves   étaient   associés.   Les   résultats   de   Silberman   montrent   que   l’association   à   l’attitude   détermine les traitements pédagogiques. Cependant, Hofer pense que les quatre types retenus par Silberman ne sont pas une représentation fiable des connaissances que les enseignants  possèdent  concernant  leurs  élèves.  Il  s’appuie,  pour  corroborer  sa  critique,  sur   une étude de Storch (1978, cité par Hofer, 1981a) qui a montré que des enseignants ne sont parvenus  qu’à  cataloguer  50%  de  leurs  élèves  au  sein  des  catégories  de  Silberman,  30%  des   élèves  étaient  classés  dans  plusieurs  catégories  à  la  fois  et  20%  n’étaient  pas  catégorisés  du   tout  car  leurs  enseignants  n’y  étaient  pas  parvenus. Par ailleurs Hofer (1981a) prétend que le

2.2 L’approche  de  Hofer

Hofer (1981a) plaide pour une approche différente de celle de la fixation de types a priori par le chercheur. Pour lui, le chercheur doit identifier a posteriori des   types   d’élèves   au   départ des jugements des enseignants sur une ou plusieurs caractéristiques. Il présente deux recherches allant dans ce sens dans son texte : la première porte sur des élèves de l’enseignement   secondaire   et,   la   deuxième   sur   des   élèves   du   primaire.   Il   explique   ensuite   une étude analysant les comportements différentiels des enseignants en fonction de catégories basées sur des scores de jugement.

2.2.1 Regroupements   d’élèves   du   secondaire   via les jugements de leurs enseignants

Hofer (1981a) propose des analyses de données rassemblées auprès de quinze enseignants d’allemand   de   classes   du   secondaire.   Ils   ont   été   priés   de   juger   tous   les   élèves   de   l’une   de   leurs classes en fonction de 25 caractéristiques opposées sur des échelles de type Likert en 7 points allant du négatif au positif (note : Par exemple, pour la caractéristique « attitude que l’élève  a   face  à  l’école »,  l’échelle  allait   de  1   – attitude très défavorable à 7 – attitude très favorable). Hofer a ensuite soumis les matrices de jugements à une analyse en clusters selon deux algorithmes agglomératifs. Cette procédure lui a permis de mettre en exergue une catégorisation   des   358   élèves   de   son   échantillon   en   cinq   types,   qu’il   décrit   à   partir de la comparaison des moyennes des différents profils aux 25 variables jugées par les enseignants. On peut interpréter ces cinq types comme étant deux bons et deux mauvais groupes  d’élèves  ainsi  qu’un  groupe  d’élèves  moyens.

 Le premier cluster comprend   64  élèves  que  les  enseignants  qualifient  d’intelligents,   d’appliqués,   de   disciplinés   et   d’actifs.   Ils   sont   contrôlables,   prennent   l’initiative   et   obtiennent de bonnes notes ;

 Le deuxième cluster renferme 120 élèves qui obtiennent également des bonnes notes ainsi que des hautes valeurs de talent, de perspicacité et de discipline. Ils se distinguent par leur retenue sociale : ils sont sensibles, calmes, modestes, simples et participent peu ;

 Le troisième cluster contient 60 élèves ayant un niveau de performance scolaire en dessous de la moyenne et des scores moyens aux autres variables. Ils sont considérés comme   étant   fermés,   peu   sûr   d’eux,   timides,   calmes   et   distants,   mais   relativement  

 Le quatrième cluster englobe 74 élèves fort peu disciplinés avec une intelligence jugée moyenne, une haute activité sociale et plutôt une mauvaise relation avec le travail. Les trublions et les dérangeurs de tous les niveaux de rendement sont contenus dans ce cluster ;

 Les 40 élèves du cinquième cluster sont perçus comme étant peu intéressés avec un don   insuffisant,   sans   ambition   ni   perspicacité   au   travail   et   manquant   d’activité   sociale.

2.2.2 Regroupements  d’élèves  du  primaire  via  les  jugements  de  leurs  enseignants Afin   de   contrôler   si   la   même   typologie   se   retrouve   à   l’identique   dans   d’autres   niveaux   scolaires, Hofer (1981a) a mené une seconde étude auprès de 167 élèves de 5 classes de deuxième primaire en effectuant le même procédé. Pour cet échantillon, le chercheur procède à un clustering initial et un clustering adapté. Pour son clustering initial, Hofer a, à nouveau, utilisé deux méthodes agglomératives hiérarchiques conduisant à une classification totalement identique des élèves. Dans les deux cas, une solution à quatre ensembles est la plus  pertinente  pour  cet  échantillon.  Hofer   ne  décrit  pas  les  quatre  ensembles  d’élèves  du   primaire dans ce texte, mais précise que, comparativement aux clusters du secondaire, les deux premiers groupes fusionnent et que les autres   sont   inchangés.   En   d’autres   termes,   il   obtient  un  cluster  de  bons  élèves,  deux  d’élèves  faibles  et  un  de  moyens.  

Pour comparer ces données avec celles du secondaire, Hofer procède à une nouvelle catégorisation de ces 167 élèves du primaire en forçant une solution à cinq clusters puis en calcule les scores moyens aux variables sous analyse. Il procède ensuite à un traitement statistique   que   l’on   n’accepterait   vraisemblablement   pas   à   l’heure   d’aujourd’hui   puisqu’il   corrèle ces scores moyens des clusters du primaire avec ceux des clusters du secondaire. Il obtient des corrélations allant de .98 à .78. Hofer en conclue qu’il   y   a   une   haute   superposition  dans  la  manière  dont  des  enseignants  de  différents  niveaux  s’y  prennent  pour   grouper les élèves selon leur ressemblance.

2.3 La tendance au regroupement comme artifice statistique

Hofer estime que les deux études qui précèdent appuient   l’idée   que   les   enseignants  

comportant   de   quatre   à   cinq   profils.   Il   écrit   que   la   méthode   de   l’analyse   par   clusters   s’est   avérée  valide  pour  l’identification  de  ces  stéréotypes  d’élèves  dans  les  représentations  des   enseignants.

Ce constat est cependant mis en doute par Oldenbürger (1986) et par Friedrich (1979). A l’aide   des   données   de   Hofer   (1969)   qui   concernent   36   enseignants   et   leurs   810   élèves,   Oldenbürger  a  testé  l’hypothèse  de  Hofer  consistant  à  dire  que  les  enseignants  catégorisent   leurs   élèves   en   groupes.   Il   écrit   qu’avant   de   pouvoir   soumettre   les   matrices   de   données   à   une analyse en clusters, ayant par essence la propriété de structurer les données en ensembles   hétérogènes   d’éléments   homogènes   (Everitt,   Landau,   Leese,   &   Stahl,   2011),   il   faut  analyser  leur  structure  interne  à  l’aide  d’algorithmes  statistiques  pour  déceler  si  on  peut   raisonnablement   considérer   qu’elles   contiennent   des   ensembles   sous-jacents   d’éléments.  

Les   algorithmes   statistiques   qu’il   rapporte   dans   ses   textes   sont   d’une   extrême   complexité,   c’est  pourquoi,  nous  ne  rapporterons  que  sa  conclusion  ici :  d’après  ses  résultats,  on  ne  peut   pas raisonnablement considérer que les matrices de données de Hofer (1969) contiennent des   ensembles   distincts   d’élèves.   Ainsi,   Oldenbürger   ne   retrouve   pas   de   pattern   de   regroupement des élèves chez les enseignants, et estime que les classifications de Hofer sont des produits de la structuration de données à  partir  d’algorithmes  statistiques  et  donc   des artefacts de la recherche.

A  noter  que  Friedrich  (1979)  émet  une  critique  semblable  concernant  l’identification  d’une   structure statistique artificielle via la participation de 76 enseignants secondaires autrichiens.  Par  ailleurs,  ce  chercheur  montre  que  l’échelle  de  jugement  de  Hofer  contient   des   dimensions   qui   n’appartiennent   pas   forcément   à   celles   que   les   enseignants   utilisent   effectivement. De plus, il semblerait que les items avec des pôles opposés tels que ceux que Hofer  a  développés  n’entrent  pas  en  résonnance  avec  les  représentations  des  enseignants.  

Par   exemple,   dans   l’échelle   de   Hofer,   l’opposé   d’intelligent   est   «   bête   »   alors   que   les   données de Friedrich indiquent que, pour les enseignants, le contraire   d’intelligent   correspond  à  «  a  besoin  davantage  d’aide  pour  l’atteinte  des  objectifs  pédagogiques  ».  

Hofer  n’est  pas  resté  sourd  face  à  ces  critiques.  Pour  vérifier  la  pertinence  de  l’utilisation  de  

Dershimer (1978-1979), qui demande à des enseignants de regrouper les élèves de leurs classes  selon  leur  ressemblance  à  l’aide  d’étiquette  (pour  une  description  plus  complète  voir     la partie méthode). Hofer et Köpke   (1987)   ont   demandé   à   une   vingtaine   d’enseignants   de   cinq   écoles   différentes   de   juger   les   élèves   de   leur   classe   sur   l’échelle   de   jugement   utilisée   précédemment  par  Hofer  (1981a,  1981b,  1986),  de  les  regrouper  à  l’aide  d’étiquettes  et  de   décrire les groupes  d’élèves  d’élèves  ainsi  obtenus.  Leurs  résultats  d’analyse  enseignants  par   enseignant montrent des taux de recouvrement décevants entre les regroupements par étiquettes et les clusterings à partir de scores de jugements. Ils en concluent que la méthode par analyse de scores de jugements est vraisemblablement inopportune pour déceler les catégories  d’élèves  contenues  dans  les  bagages  cognitifs  des  enseignants.

2.4 La structure interne des connaissances

Hofer  (1986)  interprète  ses  résultats  en  termes  d’organisation interne des connaissances des enseignants  en  se  référant  à  la  théorie  des  prototypes  d’Eleanor  Rosch  (1973,  1975,  1978).  Il   estime que les connaissances sont compartimentées en clusters distincts qui adoptent une organisation de type centrale-périphérique. Il nous semble donc important de proposer à ce stade une description des hypothèses les plus courantes sur la structure interne des croyances et connaissances.

Rokeach (1978) rassemble plusieurs de ses textes des années 1960 dans un livre. Il y défend l’idée   que   la   structure   des   croyances   s’apparente   à   une   galaxie   ayant   plusieurs   soleils   (noyaux centraux) autour desquels gravitent des planètes ayant des satellites (éléments périphériques).   Selon   l’idée   de   Rokeach,   toutes   les   croyances   seraient   inter-reliées au sein de cette galaxie et prennent les rôles de soleils, étoiles, planètes ou lunes en fonction de leurs importances respectives. Green (1971) pense aussi que les croyances et connaissances sont organisées selon une structure centrale-périphérique. Cependant, il estime que toutes les croyances ne sont pas inter-reliées. Il ajoute une dimension supplémentaire à la structuration  des  croyances,  à  savoir  l’isolement.  Pour  Green  (1971),  les  croyances  adoptent   une structure centrale-périphérique   à   l’intérieur   de   clusters   de   croyances   qui   n’ont   pas   de   liens  entre  eux  (il  y  aurait  plusieurs  galaxies).  Toutefois,  il  n’exclue  pas  la  possibilité  que  les  

Pour être complet, il faut également citer les deux axes théoriques de la catégorisation.

Selon le premier axe, dit classique, toute catégorie est définie par un ensemble de conditions nécessaires et suffisantes ; tous ses éléments, ayant en tous points les mêmes caractéristiques, en sont de parfaits représentants (Hofer, 1986; Medin, 2004; Reed, 2011;

Sternberg,  2007).  A  l’opposé,  la  théorie  des  prototypes  (Rosch,  1973,  1975,  1978)  considère   que   l’esprit   humain   manipule   des   pseudo-catégories hiérarchisées au sein desquels les éléments sont regroupés selon leur proximité. Selon cette conception, les catégories sont formées sur la base de traits caractéristiques ou de critères précis, mais dont le nombre serait variable, qui décrivent le modèle réel ou prototypique de la catégorie. Ici, les regroupements seraient représentés par un (ou des) « centroïde(s) » qui pourrai(en)t être une distance moyenne « virtuelle » ou être représenté par un (voire plusieurs) membre(s) de la catégorie considéré comme son (ou leurs) meilleur(s) exemplaire(s). Autrement dit, certains  membres  de  la  catégorie  seraient  de  meilleurs  représentants  que  d’autres  sans  qu’il   n’existe   forcément   de   représentant   parfait   (Hofer,   1986;   Medin,   2004;   Reed,   2011;  

Sternberg, 2007).

Hofer (1986) pense que ses recherches ont démontré que les connaissances des enseignants concernant le(ur)s élèves sont organisées en catégories isolées (clusters) dont la structure interne est de type centrale-périphérique   et   qu’elles   adoptent   une   organisation   prototypique avec une possibilité de frontières délimitées par des conditions nécessaires voire  suffisantes.  Cependant,  comme  nous  l’avons  vu  plus  haut  Hofer  a  obligé  ses  données  à   adopter cette structure centrale-périphérique clusterisée. Aussi, nous pensons que sa recherche devrait être complétée par trois stratégies de recueil de données pour répondre à trois questions de recherche.

Premièrement,  et  afin  de  vérifier  la  pertinence  de  l’approche  par  clusterisation  de  scores  de   jugement  pour  identifier  les  catégories  d’élèves  dans  le  répertoire cognitif des enseignants, il serait   intéressant   de   renouer   avec   l’approche   de   Storch   (1978)   et   de   demander   à   des   enseignants   de   catégoriser   leurs   élèves   à   l’intérieur   du   système   de   clusters.   La   première   question de recherche est donc : les enseignants assignent-ils à leurs élèves les mêmes

étiquettes   de   clusters   que   ceux   que   l’algorithme   statistique   leur   confère   à   partir   de   leurs   jugements ?

La  deuxième  question  de  recherche  interroge  la  pertinence  de  l’hypothèse  de  l’organisation   centrale-périphérique de clusters de croyances. Pour y répondre, nous adoptons une approche inspirée des recherches classiques en matière de catégorisation (Reed, 2011;

Rosch, Mervis, Gray, Johnson, & Boyes-Braem, 2004; Sternberg, 2007). Ces recherches analysent communément dans quelle mesure des sujets estiment que des objets sont proches des définitions suggérées pour les différentes catégories. Nous allons donc demander  aux  enseignants  d’estimer  la  distance  de  chacun  de  leurs  élèves  à  la  catégorie  à   laquelle ils les ont assignés  ainsi  qu’aux  autres  catégories.

Troisièmement, conformément à la méthode de Morine-Dershimer (1978), nous demanderons  aux  enseignants  de  regrouper  les   élèves  au  sein  d’ensembles  qu’ils  estiment   hétérogènes mais dont ils estiment que les élèves qui les composent sont homogènes. La question est   ici   de   vérifier   d’une   autre   manière   la   pertinence   du   recours   à   l’analyse   en   clusters   de   scores   de   jugements   pour   identifier   les   catégories   d’élèves   contenues   dans   le   bagage cognitif des enseignants.

L’analyse   de   la   pertinence   de   l’approche   de   Hofer   et   de   l’hypothèse   de   la   structuration   centrale-périphérique  de  clusters  de  connaissance  sera  donc  au  cœur  de  notre  texte.  Dans  la   suite nous allons décrire notre échantillon, la méthode que nous avons utilisée pour recueillir nos données, les traitements statistiques auxquels nous les avons soumises et les résultats   auxquels   ils   permettent   d’aboutir.   Nous   clôturerons   notre   contribution   par   une   discussion quant à la structure interne des connaissances des enseignants et quant à l’utilisation  de  méthodes  statistiques  pour  l’analyser.

3. Méthode