Une notation différente au travers de l’évaluation critériée

Partie 2 - Revue de littérature

6 Une notation différente au travers de l’évaluation critériée

L’utilisation de critères d’évaluation constituerait donc une approche pertinente pour une notation à visée qualitative appelée « holistic grading » (Royce Sadler, 2009). Cette notation, globale, élaborée à l’aide de critères centrés sur des éléments de contenus significatifs, se distingue d’une notation analytique « analytic grading » (p.1), où des critères trop précis participent au découpage du savoir pour finalement se compenser et ne rien évaluer de complexe³⁹. Nous développerons ces apports dans notre cadre conceptuel car ils nous permettent d’appréhender toute la complexité inhérente à un alignement curriculaire élargi jusqu’à la notation. En effet, une littérature importante montre que la démarche pour arriver à une notation holistique est la plus pertinente pour garder une trace de l’apprentissage jusqu’au bilan final. Décrite comme exigeante, elle pose selon nous toute la problématique de la qualité de l’apprentissage et de son traitement dans la note. Et ceci, même si, dans un autre texte, Royce Sadler (2009), soucieux d’arriver à une note « juste », reste à nos yeux très général sur sa fabrication. Cette prudence à faire le pas du système de pondération à la construction de la note se ressent toutefois dans la majorité des travaux cités : évaluer par des critères qualitatifs oblige l’enseignant à se référer à ce qui est attendu au niveau de l’apprentissage, à le caractériser, et à le pondérer. Ces pratiques, qui semblent avoir des implications très importantes sur la note, ne

39 Afin de ne pas surcharger notre propos, nous donnons un exemple de ces démarches de notation contrastées dans notre cadre conceptuel (Partie 3).

peuvent exister sans le recours à une échelle. Dans une perspective de notation holistique, échelle et critères se fondent, puisque chaque échelon de note est caractérisé par des contenus à maîtriser référés aux objectifs. La notation holistique, de notre point de vue, remet donc profondément en question l’échelle traditionnelle.

6.1 Une notation holistique qui questionne l’échelle ordinale traditionnelle

Ce sont les travaux en docimologie qui ont les premiers critiqué cet outil qu’est l’échelle. La référence en la matière reste selon nous De Landsheere (1992). Dans un ouvrage qui a marqué la discipline, il fait état des limites de cet outil, lorsqu’il est considéré d’un point de vue mathématique. Il en identifie quatre faiblesses principales (pp. 146-148) :

- L’échelle n’a ni zéro ni maximums naturels ou absolus. Elle commence et finit n’importe où, au choix de l’utilisateur. Donc, même s’ils évaluent un même objectif, du même point de vue, les évaluateurs n’ont jamais des échelles rigoureusement les mêmes.

Les différences sont souvent considérables.

- Les degrés, ou échelons, ne sont pas de la même grandeur à l’intérieur d’une même échelle. Par exemple, il est impossible de démontrer que la distance séparant la bonne de la très bonne connaissance de l’allemand est la même que la distance séparant la connaissance moyenne de la bonne. Et quid des extrêmes, surtout vers l’excellence ? - Des degrés ou échelons correspondant d’une échelle à l’autre pour une même discipline

ne sont pas de même grandeur. Bon en allemand oral pour un enseignant, n’est pas quantitativement égal à bon en allemand oral pour un autre. Rien de peut établir pareille égalité de façon mathématique.

- Des échelles portant sur des disciplines différentes ne sont pas comparables. Par exemple, un enseignant qui donnerait plusieurs disciplines dans une même classe serait dans l’impossibilité de se servir des mêmes échelles, les objectifs, l’enseignement, les objets disciplinaires et les situations ne se ressemblant pas.

Ces éléments montrent que les échelles d’évaluation classiques, ordinales, participent essentiellement à quantifier l’apprentissage au travers d’opérations mathématiques. Leur capacité à rendre compte de la qualité de ce qui est évalué est très limitée. Dans ce sens, l’auteur va même jusqu’à affirmer que c’est un instrument mal connu qui vicie une large partie des examens, à tous les niveaux de la scolarité, dans toutes les disciplines. Pourtant, il soulève un paradoxe en montrant conjointement que l’échelle est toutefois incontournable : dans une

perspective non normative, mais qualitative, elle reste le seul outil pour concrétiser un jugement sur une performance pour aboutir à une note, quelle qu’elle soit. Il est dès lors important, toujours selon lui, de respecter certains principes lors de son élaboration :

- L’échelle devrait posséder peu d’échelons, au maximum cinq. Cela semble logique, puisque qualifier un apprentissage ne peut se décliner de manière infinie ;

- Il est nécessaire de décrire chaque échelon en référence aux apprentissages en caractérisant l’objet de l’évaluation au travers de critères. Cette étape permet notamment de critérier le seuil de réussite, si problématique comme nous l’avons notamment évoqué dans notre introduction de thèse, en fonction du contenu évalué et de l’objectif visé. En procédant de la sorte, on s’approche d’échelles holistiques (Biggs ; 2003) ou descriptives (Laveault & Miles, 2008) qui décrivent les différents seuils de réussite d’un point de vue qualitatif.

Ainsi construites, ces échelles sont progressives et mettent des mots sur les acquis et difficultés des élèves. Elles offrent ainsi des éléments de régulation car elles permettent des feedbacks centrés sur les apprentissages. Là, il devient plus aisé de verbaliser à l’élève les éléments de l’apprentissage qu’il ne maîtrise pas en se référant concrètement aux critères.

Toutefois, l’échelle comme outil de construction de la note, peut également être source de problèmes, et ceci, indépendamment de sa nature. Des travaux s’accordent même à dire que le problème de la notation soumise à des échelles ordinales classiques vient moins de la note que de l’échelle (Brookhart, 2011 ; Tierney, 2015), car plus elle possède d’échelons, plus une notation référée aux apprentissages devient difficile et potentiellement biaisée (Jonsson &

Svingby, 2007). Mais nous serions tenté de dire que ces problèmes, spécifiquement liés aux caractéristiques mathématiques des échelles traditionnelles, s’estompent dans une démarche holistique. En effet, une telle perspective de notation n’est plus confrontée au dilemme de traduire des apprentissages en termes de quantités ordonnées. En revanche, d’autres problèmes surgissent, comme celui de hiérarchiser la qualité de l’apprentissage⁴⁰.

À la lumière de ces premiers constats sur la notation, il nous incombera donc, dans notre cadre conceptuel, de voir dans quelle mesure une notation holistique est compatible avec des échelles traditionnelles. Nous faisons l’hypothèse que de ce point de vue, les approches théoriques de la

40 La manière d’élaborer des échelles qualitatives est toutefois spécifique aux situations d’évaluation et aux apprentissages évalués. Nous montrerons dans nos résultats que ces échelles comportent également des limites et qu’il est dès lors délicat de généraliser leur pertinence.

notation sont à ce point divergentes qu’elles demandent à être conceptuellement tranchées.

6.2 Une notation à visée qualitative : quelques enjeux

Il est maintenant important de documenter à quelles conditions une notation alternative, davantage référée à l’apprentissage, peut être envisagée. Tout d’abord, des recherches anglo-saxonnes ont permis de montrer que si les pratiques de notation s’articulent avec les pratiques d’évaluation, elles se différencient et se pensent spécifiquement (McMillan & Nash, 2000 ; Randall & Engelhard, 2010 ; Walvoord & Johnson Anderson, 2009). En effet, elles documentent que certains facteurs exercent des influences majeures spécifiquement sur les pratiques de notation : les normes prescrites en la matière, la question des seuils de suffisance, le fait de tenir compte de l’effort fourni par l’élève ainsi que des performances supplémentaires démontrées, la distribution des notes, et enfin la question du zéro comme signe d’absence totale d’apprentissage. Par exemple, on apprend que le seuil de suffisance est issu d’un jugement subjectif de l’enseignant, que des notes plus élevées sont données aux élèves qui ont fait preuve de persévérance, ou encore que nombre d’enseignants offrent des occasions d’engranger des points supplémentaires pour augmenter la note (Cross & Frary, 1999). Ces auteurs n’hésitent pas ici à parler de pratiques de notation idiosyncratiques, les enseignants étant toujours en tension entre leurs croyances d’un côté et leurs contraintes de l’autre. Dans de telles perspectives, comment penser une notation référée à l’apprentissage ? En effet, on observe ici une difficulté chez les praticiens à justifier leurs pratiques de notation au regard de pratiques d’évaluation en lien avec des contenus et objectifs, même si l’on constate dans ces recherches qu’ils sont unanimes à reconnaître l’interdépendance entre notation, évaluation, enseignement et apprentissage, et cela, même si les enseignants incluent dans leurs constructions de notes des éléments indépendants d’apprentissages cognitifs tels que la motivation, l’engagement ou l’effort (Cross & Frary, 1999 ; Martinez, Stecher & Borko, 2009). Sur ce point, la littérature consultée semble converger vers l’idée qu’évaluer d’un point de vue sommatif des éléments n’ayant souvent pas fait l’objet d’un enseignement, et de surcroît délicats à caractériser, induit des biais dans l’élaboration des notes (e. g., Zhang & Burry-Stock, 2003), et donc converge vers un désalignement⁴¹ curriculaire. Il devient dès lors important, d’un point de vue de recherche, de questionner à quelles conditions la notation peut se centrer sur les apprentissages réalisés et en rendre compte. En d’autres termes, à la lumière de ces apports, on se demandera

41 Dans notre travail, et fidèlement à la littérature consultée, nous considérerons désalignement et rupture d’alignement comme des synonymes traduisant une perte de cohérence de l’évaluation sommative.

quels raisonnements vont permettre de penser une notation rendant visibles les apprentissages, et à l’aide de quels outils cette visibilité peut devenir envisageable. Cette réflexion demande à problématiser la notation comme une dimension qualitative du processus d’évaluation sommative.

6.3 Des notes pour une évaluation sommative au service des apprentissages

Les travaux qui ont abordé cette problématique d’une notation en référence aux apprentissages - c’est-à-dire pouvant rendre compte des apprentissages réussis mais aussi insuffisants dans une perspective de régulation - proposent tous, en amont, de passer par un travail d’explicitation des exigences attendues. La question clé revient ici à se demander ce que doivent dire les notes (Brookhart, 2011). Ce raisonnement implique, dans un premier temps, une référence à des objectifs clairs, univoques et compréhensibles (Klenowski & Wyatt-Smith, 2014), reliés à des tâches évaluatives en rapport, travail impossible à réaliser sans une expertise des contenus à enseigner (Bateman et al., 2009). Puis, dans un deuxième temps, l’enseignant aura recours à des critères d’évaluation centrés sur des contenus et en cohérence avec les tâches et objectifs évalués. Comme nous l’avons déjà évoqué, cette évaluation critériée est, selon toutes les sources que nous avons consultées, la méthode incontournable pour une notation référencée aux apprentissages.

6.4 Des constats fondamentaux sur une notation référée aux apprentissages

Cette partie de notre revue de littérature sur la notation qualitative nous permet d’établir deux constats importants. Le premier est qu’il est possible de considérer qu’une évaluation sommative référée aux apprentissages peut aboutir à une note qui donne des informations qualitatives sur ces derniers (e.g., Pellegrino, 2006 ; Walvoord & Johnson Anderson, 2009). Le second constat, directement en lien, nous fait affirmer qu’il est possible d’envisager une approche englobante de la question de la cohérence de l’évaluation, et donc de sa validité.

L’étude des liens de cohérence existant entre la référence au prescrit, les tâches évaluatives, leur pondération et la notation ouvre des possibles, tant d’un point de vue de recherche que de développement des pratiques évaluatives sommatives. Nous touchons ici au cœur de notre orientation théorique : l’alignement curriculaire élargi.

Dans le document Le modèle de l'alignement curriculaire élargi pour étudier les pratiques évaluatives sommatives d'enseignants de mathématiques et de français du secondaire: enjeux conceptuels et pragmatiques (Page 65-70)