Des travaux sur l’évaluation sommative issus des didactiques

Partie 2 - Revue de littérature

2 L’étude des pratiques d’évaluation sommative, ou l’expression de tensions

2.6 Des travaux sur l’évaluation sommative issus des didactiques

De nombreuses sources le mettent en évidence : les disciplines impactent les pratiques d’évaluation sommative ou, pour le dire autrement, « il y aurait bien des comportements évaluatifs disciplinaires spécifiques » en évaluation (Braxmeyer et al., 2005, p. 52). Certains travaux évoquent l’influence de la discipline sans la détailler (e.g., Black & al., 2010 ; Zhang

& Burry-Stock, 2003). D’autres l’approfondissent, et l’on dispose de nombreuses recherches qui s’inscrivent explicitement dans une discipline. À ce niveau, toutes montrent que les caractéristiques des objets de savoir évalués influencent grandement la pratique évaluative sommative des enseignants (e. g., Biberman-Shalev, Sabbagh, Resh & Kramarski, 2011 ; Klein et al., 2009; Meier, Rich & Cady, 2006). Des habitudes et des façons de faire existent donc en évaluation sommative et se différencient en fonction des disciplines scolaires (Braxmeyer et al., 2005).

Mottier Lopez et Laveault (2008) affirmaient déjà il y a une dizaine d’années que les pratiques d’évaluation devraient se diversifier en fonction, notamment, « des choix didactiques et des objectifs qui en découlent » (p. 13). Cela dit, relativement à l’importance des contenus, force est de constater qu’à ce jour, les travaux francophones en didactique traitant de la question sont encore assez rares, comme si l’enseignement et l’évaluation sommative étaient, dans une certaine mesure, dissociés. Un constat appuyé par Millon-Fauré (2013) : « Bien qu’il s’agisse d’un rituel quasi-quotidien de la classe, les évaluations constituent encore des dispositifs peu étudiés en didactique » (p. 149). L’intention est donc présente, mais les résultats encore assez discrets. Le rôle de la didactique dans l’évaluation sommative semble pourtant de plus en plus partagé au sein de la communauté scientifique. Nous disposons en effet depuis peu de travaux qui s’inscrivent clairement dans l’étude des pratiques relativement à des objets disciplinaires circonscrits (e. g., Demonty, Fagnant & Dupont, 2015 ; Sayac, 2018)¹⁷. Dès lors, pour documenter ce que nous apprennent les travaux de didactique en la matière, nous nous concentrerons sur le français langue première et les mathématiques, les deux disciplines que nous avons prises en considération dans notre étude. Commençons par la didactique de la

17 Voir également l’ouvrage publié par l’Association Internationale pour la Recherche en Didactique du Français (AIRDF) en 2016 « L’évaluation en classe de français, outil didactique et politique », ou les résumés des communications du colloque « Evaluation & mathématiques : dispositifs, validité et pratiques » organisé par l’Ecole Supérieure du Professorat et de l'Education (ESPE) de l'académie de Créteil, composante de l'Université Paris Est Créteil (UPEC) en 2016.

langue.

2.6.1 La didactique du français et l’évaluation sommative

Dans un texte intitulé « L’évaluation du travail des élèves » - considéré comme une référence par de nombreux auteurs consultés - Simard, Dufays, Dolz et Garcia-Debanc (2010) abordent la question de l’évaluation sommative en français et proposent d’en édicter les conditions de son efficacité. Ce dernier terme n’est déjà pas anodin. Il renvoie à une forme d’utilité, de rendement. En effet, l’évaluation sommative est ici bel et bien mise en relation avec les processus d’enseignement et d’apprentissage, tout en étant réduite, via les grilles de critères qui la médiatisent, à une finalité de production. Nous constatons cette même perception de l’évaluation sommative chez certains autres chercheurs comme Gagnon, Monnier et Dolz (2014), lorsqu’ils affirment, s’agissant des critères d’évaluation :

Si la pertinence et l’utilité des grilles sont discutées par certains chercheurs (Daunay, 1994), il n’en demeure pas moins que bon nombre d’entre eux (Simard, Dufays, Dolz & Garcia-Debanc, 2010) s’accordent à dire qu’elles permettent de stabiliser les critères, les indicateurs précis à utiliser pour apprécier le degré d’adéquation à la tâche d’écriture proposée, ainsi que la pondération à accorder aux différents critères sélectionnés. Elles constituent ainsi une aide non seulement pour fixer le seuil de réussite, mais également pour communiquer le résultat à l’élève (p. 2).

Par ailleurs, l’évaluation sommative, toujours selon Simard et ses collègues, devrait en plus porter sur des savoirs déclaratifs, convoqués pour être « utilisés » en même temps que des savoir-faire, dans des tâches non fragmentées, complexes, porteuses de sens et, si possible,

« dotées d’une dimension épistémologique et/ou de plaisir » (p 19). Autant de principes généraux qui, selon nous, font l’impasse d’une conceptualisation de l’évaluation, tant du point de vue des paradigmes dans lesquels elle s’inscrit (De Ketele, 2012 ; Figari, 2012, 2013)¹⁸, que des systèmes desquels découlent les outils exploités. Constat que l’on peut encore réaliser à la lecture des travaux de Tobola Couchepin, Sanchez Abchi et Dolz (2016), lorsqu’ils présentent leurs travaux sur les pratiques d’évaluation sommative de la production écrite au primaire : la finesse de leur analyse didactique est à nos yeux péjorée par une absence de conceptualisation des grilles critériées utilisées comme outils évaluatifs¹⁹.

18 Par souci de clarté et pour éviter de mélanger les niveaux de problématisation, nous abordons l’influence des paradigmes sur les outils d’évaluation plus loin.

19 Ce constat est d’autant plus interpellant sachant que cette recherche fait partie du recueil de textes publié par l’AIRDF mentionné plus haut.

Enfin, notons que l’incomplétude conceptuelle de l’évaluation sommative présente dans ces approches didactiques est d’autant plus intrigante qu’elle fait par ailleurs systématiquement l’impasse sur la construction de la note. Dans les sources consultées, les auteurs proposent des modèles de grilles de critères qui tiennent compte d’une forme de pondération - par ailleurs trop peu problématisée encore une fois - mais le pas jusqu’à l’acte de noter n’est pas développé.

C’est notamment une des raisons qui nous fera revenir sur cette question plus loin en abordant justement les recherches qui ont documenté ce processus complexe qui est fortement dépendant, selon nous, de l’acte d’évaluer.

Un constat identique peut encore être réalisé à la lecture de travaux qui ont abordé l’évaluation d’objets de savoir spécifiques. Par exemple, en 2001, Lafontaine fait un tour d’horizon des travaux ayant abordé la question de l’évaluation de la lecture. On n’y trouve aucune trace d’une quelconque thématisation de l’évaluation sommative ni de la notation. En 2014, Roth, de Pietro et Sanchez Abchi abordent également la question de l’évaluation de la lecture, mais plus spécifiquement en référence au PER. Bien que mettant l’accent sur le rapport étroit devant exister entre enseignement et évaluation, nous observons les mêmes incomplétudes²⁰. En 2016, la revue de didactique et de pédagogie du français Recherches porte sur l’évaluation²¹. Les éditorialistes y revendiquent une approche critique que certains auteurs thématisent au niveau de l’évaluation sommative. Par exemple, Mottier Lopez, Serry et Sales Cordeiro analysent la production de l’écrit du fait divers au primaire. Si leurs propos sont très pertinents jusqu’à la pondération, rien n’est dit sur la construction de la note. Enfin, la même année, un ouvrage important sur le jugement professionnel²² rend compte de recherches dont certaines ont pour ancrage l’évaluation sommative. On peut y lire notamment le texte de Goasdoué, Vantourout et Bedoin (2016) qui s’intéresse aux composantes du jugement professionnel lors de la correction de dissertations en français, mais qui ne va pas non plus jusqu’à investiguer la dimension pragmatique de la construction de la note. Par exemple, lorsque les auteurs disent que « la note n’est pas la somme des jugements produits lors de la correction. Des appréciations semblables peuvent conduire à des notes divergentes et inversement des appréciations divergentes peuvent se solder par des notes voisines » (p. 75), on souhaiterait en savoir

20 Notons par ailleurs que les auteurs utilisent indifféremment « évaluer » et « mesurer » sans les définir préalablement.

21 C’est la quatrième fois que cette revue aborde cette problématique, après les numéros 6 (1987), 21 (1994) et 38 (2003).

22 « Le jugement professionnel, au cœur de l’évaluation et de la régulation des apprentissages », coordonné par Lucie Mottier Lopez et Walther Tessaro, et publié chez Peter Lang.

davantage sur les outils auxquels ils se réfèrent, ou sur une éventuelle conceptualisation des pratiques de pondération et/ou de notation.

2.6.2 La didactique des mathématiques et l’évaluation sommative

Du côté de la didactique des mathématiques, force est de constater que nos recherches dans les travaux francophones sur les pratiques évaluatives sommatives des enseignants ont été également peu fructueuses. Pourtant, deux textes sont jugés fondateurs par la communauté scientifique. Le premier est de Chevallard (1989), dans lequel il montre le lien qui réunit l’acte d’évaluer et l’objet évalué :

L’évaluation, le « test » par lequel elle se réalise, plutôt qu’une mesure fournit un écran sur lequel vient se projeter l’objet évalué – le rapport de l’élève à l’objet de savoir, ou de tout autre catégorie d’acteurs qu’on voudra à tout autre objet qu’on voudra. Une telle image est potentiellement véridictrice : elle nous dit, ou du moins on pourra chercher à y lire, une certaine vérité sur ce rapport, sur cet objet que l’on évalue. (p. 16).

Il est ici intéressant de constater que l’auteur distingue déjà ici, certes dans des cadres anthropologiques, l’acte de mesurer et implicitement celui d’évaluer. Nous y reviendrons en détail plus loin. La pertinence de mettre l’objet au centre du processus évaluatif est aussi bel et bien là, mise en perspective avec cette question de vérité que nous assimilons aux enjeux de validité et/ou de cohérence, omniprésents. On observe donc, dans cette référence incontournable, une volonté didactique de problématiser l’objet d’évaluation. Toutefois, ici aussi, la question du verdict sur l’objet, via une note, n’est pas abordée par l’auteur. Nous y reviendrons également.

Le second apport est de Martinand (1986). L’auteur pose les bases de ce que pourrait être un regard didactique sur l’évaluation. Il met en évidence les potentiels risques de considérer l’évaluation à l’aune unique des objectifs²³. Pour lui, il est fondamental de mettre au centre du processus évaluatif une réflexion conjointe sur les objectifs et sur les objets. Dans ce sens, il accorde au contenu d’enseignement « une importance que les généralistes des sciences de l’éducation avaient un peu trop tendance à oublier ou même à nier » (Geminard & Martinand, 1987, p.114). Il est alors surprenant de constater que du point de vue de l’étude des pratiques évaluatives sommatives, la didactique des mathématiques est depuis restée discrète, à notre

23 Nous faisons l’hypothèse ici que les propos de l’auteur peuvent être transposés à la notion de compétences, pas encore en vogue dans le monde scolaire au moment où il publie son texte.

connaissance. Et, paradoxalement, ce sont des recherches non didactiques qui fournissent des résultats intéressants.

Centrées sur la discipline, certaines ont montré, par exemple, que les enseignants de mathématiques se trouvent face à une complexité très élevée lorsqu’il s’agit de critérier des épreuves (Meier et al., 2006), ou ont documenté les enjeux à produire des jugements globaux dans cette discipline (Klein et al., 2009). De manière complémentaire, d’autres résultats de recherche sur les pratiques apportent des connaissances intéressantes. Par exemple, en France, Braxmeyer et al. (2005) révèlent que les évaluations dans cette discipline au secondaire sont le plus souvent longues et écrites, proposent des tâches de niveau de difficultés et de nature variés.

Ce sont régulièrement des tâches de restitution à l’image de celles des manuels. Mais de manière générale, ils constatent que « les enseignants de mathématiques interrogés ont eu un discours assez sommaire autour de l’évaluation » (p. 29). Toutefois, ils précisent que l’« on peut percevoir des signes indubitables de pratiques évaluatives relevant aussi d'autres perspectives que la seule mesure des acquis des élèves et de l’appréciation de leurs progrès : en effet, comprendre la nature des erreurs concerne 79,4 % des professeurs de mathématiques » (p. 68).

Notons enfin qu’une recherche par mots clés d’articles portant sur l’évaluation sommative et sur la notation réalisée sur le site de la revue Recherches en didactique des mathématiques (RDM) n’a donné aucun résultat.

À la lumière des travaux recensés dans cette discipline, nous observons qu’il semble exister un manque dans la recherche francophone²⁴ sur les pratiques évaluatives sommatives réelles des enseignants articulant une réflexion sur les objets disciplinaires et une conceptualisation de l’évaluation, jusqu’à la notation. Les derniers travaux de Sayac (2018), en France, tentent de combler le vide. Toutefois, s’ils éclairent de manière pertinente la problématique de la complexité des tâches, ils la séparent en revanche des pratiques de pondération et de notation, alors que selon nous, elles sont indissociables.

Cette situation contraste avec la recherche en évaluation sommative au sein de la communauté anglophone, qui a une longue tradition en la matière (McGatha & Bush, 2013). En effet, on voit encore une fois nombre de chercheurs inscrire leurs travaux dans cette discipline (e. g., Black et al. 2010 ; McKinney, Chappell, Berry & Hickmann, 2009 ; Smith, Smith & De Lisi, 2001 ;

24 La recherche dans le monde anglo-saxon est en revanche très prolifique à ce niveau (voir par exemple le site de la revue Educational Studies in Mathematics : https://link.springer.com/journal/10649).

Stiggins, 2001). Cette recherche, durant les vingt dernières années, s’est centrée sur deux axes : l’étude des pratiques réelles et le jugement des enseignants. Le premier axe a permis de montrer que les pratiques évaluatives sommatives sont dans cette discipline souvent traditionnelles (Ohlsen, 2007), le second a mis en évidence l’importance des connaissances de l’objet de savoir dans la pertinence des jugements (Martinez et al., 2009).

Cela étant posé, il s’agit maintenant de passer en revue ce qu’offre la littérature en termes de résultats relativement à la notation, car notre problématique de recherche considère - à l’instar de certains chercheurs comme McMillan et Nash (2000) ou Walwoord et Johnson Anderson (2009) pour ne citer que ceux-ci - que les pratiques d’évaluation sommative et de notation sont en forte interdépendance.

Dans le document Le modèle de l'alignement curriculaire élargi pour étudier les pratiques évaluatives sommatives d'enseignants de mathématiques et de français du secondaire: enjeux conceptuels et pragmatiques (Page 38-43)