• Aucun résultat trouvé

Ou ce professeur de sciences naturelles, en terminale, à qui je dois mon exclusion du lycée. Se plaignant de ce que la moyenne générale de "cette classe" n'excédât pas les 3,5/20, il avait commis l'imprudence de nous en demander la raison. Front haussé, menton tendu, commissures tombantes : - Alors quelqu'un peut-il expliquer cette... prouesse ?

J'ai levé un index poli et suggéré deux explications possibles : ou notre classe constituait une monstruosité statistique (32 élèves qui ne pouvaient dépasser une moyenne de 3,5 en sciences naturelles), ou ce résultat famélique sanctionnait la qualité de l'enseignement dispensé.

(Pennac, 2007, p. 263264)

Dans le domaine de l’éducation, le terme évaluation peut se référer à l’évaluation des apprentissages des élèves mais aussi, par exemple, à l’évaluation des politiques éducatives. Nous nous intéressons dans notre recherche à l’évaluation des apprentissages des élèves. Sauf mention contraire, le terme d’évaluation est donc utilisé avec ce sens-là dans toute la suite de notre texte.

D’un point de vue individuel, l’évaluation joue un rôle central dans la scolarité de chaque élève puisque les décisions concernant le passage dans la classe supérieure, l’orientation dans une filière donnée ou encore la réussite à un concours sont bien souvent prises en fonction des résultats à des évaluations certificatives.

Ce prolifique domaine de recherche constitue aussi un important sujet de société. Le traitement médiatique accompagnant la publication des résultats des évaluations internationales standardisées, telles que PISA15 ou TIMSS16, en est une illustration. Les pays sont comparés, classés entre eux en fonction des résultats de leurs élèves, mais aussi comparés à leurs propres résultats lors des évaluations précédentes, les résultats des élèves actuels étant mis en parallèle avec ceux des élèves des cohortes précédentes. Ces évaluations à large échelle sont vues comme un outil permettant, entre autres, de dresser un état des lieux des savoirs et savoir-faire des jeunes citoyens de la société actuelle et d’en mesurer l’évolution. D’un point de vue politique, les résultats de ces évaluations peuvent amener les gouvernances à adapter les politiques éducatives en fonction des recommandations préconisées par le programme. C’est en tout cas un des souhaits

15Programme international pour le suivi des acquis des élèves.

16Trends in International Mathematics and Science Study.

54 qui ressort de la lecture des documents PISA publiés en Suisse Romande, comme le souligne Revaz (2016) « l’objectif de cette enquête est d’entrainer des débats et d’émettre des suggestions afin d’améliorer d’éventuels défauts des systèmes éducatifs » (2016, p. 28).

La mise en place de nouvelles directives institutionnelles en lien avec l’évaluation des apprentissages des élèves suscite bien souvent aussi des débats dans la sphère publique. Ce fut par exemple le cas en France, lors de la mise en place de l’évaluation du socle commun de connaissances et de compétences. Dans le canton de Genève, quelques années après la généralisation de la réforme de rénovation de l’école primaire genevoise17 durant laquelle les enseignants ont été incités à mettre en œuvre des évaluations plus centrées sur l’aspect formatif et soutenant les apprentissages des élèves, un climat social tendu s’est développé, avec « une opposition entre enseignants ainsi qu’entre parents : les partisans des notes et des moyennes […]

versus ceux qui défendent une évaluation formative » (Soussi, 2010, p. 61). Et c’est une consultation populaire qui a abouti à la remise en place d’évaluations notées et de moyennes de notes décidant du passage ou du redoublement des élèves à la fin de chaque année scolaire (Mottier Lopez, 2014).

L’évaluation des apprentissages est, comme nous venons de le souligner, sujet à de nombreuses discordes sociétales. Les deux fonctions qui lui sont habituellement attribuées, certificative et formative, ne semblent, de plus, pas jouir de la même popularité. L’évaluation formative est souvent perçue comme positive car bienveillante et participant au développement des apprentissages des élèves tandis que l’évaluation certificative reste au contraire associée à l’idée de classement, de sélection et est considérée comme un facteur participant à l’échec scolaire et aux inégalités sociales. Dans le domaine de la recherche, les études autour de l’évaluation formative se sont massivement développées depuis les années 1990 (Black, 2013, p. 167; Bodin, 1997, p. 62).

Si l’évaluation des apprentissages est omniprésente dans les débats animant la sphère scolaire, elle l’est, avant tout, dans la salle de classe. Les enseignants évaluent régulièrement les productions de leurs élèves à la fin d’une séquence, sur la base le plus souvent de leurs écrits individuels, dans le but de certifier leurs apprentissages. Ils transmettent alors ces informations à l’élève, à l’institution et aux parents. Ils évaluent aussi les apprentissages des élèves en cours de séquence, en leur posant des questions dans le but de déterminer s’ils ont compris ou non les notions et concepts en jeu, afin de pouvoir les aider à rectifier leurs stratégies au vu des objectifs

17 La phase d’extension de la rénovation de l’enseignement primaire genevois entreprise en 1994, a été mise en œuvre à partir de 1999 (Groupe de pilotage de la rénovation. Département de l’Instruction publique, Enseignement primaire, 1999).

visés et de pouvoir adapter leur enseignement. Ils évaluent aussi la motivation des élèves, leur implication dans l’activité qu’ils sont en train de réaliser, etc. La tentation est ainsi grande de considérer tout acte d’enseignement, toute interaction en classe comme relevant de l’évaluation.

L’évaluation serait ainsi partout et tout le temps. Mais ces différents moments évaluatifs impliqués dans la vie de la classe sont cependant variés. La nature des informations recueillies n’est en effet pas la même, ces informations ne sont pas utilisées dans le même but et elles sont recueillies par différents moyens.

Loin de n’être qu’une des tâches qui incombent à l’enseignant, indépendante, isolée du reste de la vie de la classe, l’évaluation occupe une place centrale dans les processus d’enseignement, notamment dans le cas d’un enseignement de la résolution de problèmes. « There are, however, many challenges in implementing IBSE. Central among these is the assessment of students’ learning since this has a strong influence on what is taught and how it is taught » (Harlen, 2013, p. 1). Concernant notre objet d‘étude, on imagine aisément que le flou qui accompagne les objectifs d’apprentissage associés aux activités RPP et à la résolution de problèmes rend la tâche évaluative des enseignants ardue.

Afin de circonscrire ce que nous considérons comme relevant de l’évaluation, nous commençons par définir l’acte évaluatif. Nous nous intéressons ensuite aux principales fonctions qui lui sont attribuées.

Étymologiquement, évaluer signifie « déterminer la valeur, le prix de quelque chose »18. D’aucuns pourraient alors considérer l’évaluation en contexte scolaire comme un acte de mesurage, aboutissant à un résultat quantitatif, absolu et indiscutable. Or comme le rappelle Hadji

« l’évaluation est toujours autre chose que ce qui serait une pure et simple mesure scientifique » (Hadji, 1997, p. 10). Mottier Lopez (2013, p. 942‑943) remet elle aussi en question le fait de considérer la mesure comme cadre de référence pour penser l’évaluation. Il ne s’agit pas, pour elle, d’exclure la mesure de l’évaluation mais bien de les distinguer et de considérer en particulier que l’évaluation englobe d’autres opérations, comme l’interprétation des informations au regard d’un référentiel. Nous considérons à sa suite, l’évaluation comme une pratique sociale et

18 Evaluer. (s. d.). In Portail lexical du Centre National de Ressources Textuelles et Lexicales. Consulté à l’adresse http://www.cnrtl.fr/etymologie/evaluer

56 culturelle, située dans un contexte donné (Mottier Lopez, 2009, p. 9). Pour Bodin, qui parle d'évaluation pédagogique, l’objectif est de connaître, avec le moins d'incertitude possible, le savoir de l'élève (1985, p. 17). Plus tard il souligne, dans une perspective didactique, l’importance d’une prise en compte de la situation : « EVALUER suppose d’organiser et d’étudier des situations permettant de recueillir des informations, qui, après traitement, soient susceptibles de révéler quelque chose de fiable et de substantiel sur la "valeur" d’un "objet" » (1997, p. 60).

Allal (2008b, p. 311) définit l’acte évaluatif relatif aux apprentissages, comme toujours constitué d’une même série de quatre démarches : la définition de l’objet d’évaluation ; la récolte d’informations concernant les conduites des apprenants en rapport avec l’objet choisi ; l’interprétation des informations recueillies et la prise de décisions et la communication d’appréciations à autrui. Mottier Lopez (2017, p. 173‑174), qui propose une modélisation de l’activité évaluative de l’enseignant en vue d’étudier les processus de « référentialisation », considère ces quatre éléments comme des invariants de l’activité évaluative, permettant notamment de la caractériser par rapport à d’autres activités. Sa mise en regard de ces quatre invariants par rapport aux propositions de Hadji (2012) permet de spécifier les tâches de l’évaluateur associées à chaque élément et de souligner l’articulation des éléments entre eux, qui sont à considérer non pas successivement mais comme possiblement liés les uns aux autres (Figure 2).

Figure 2. Invariants de l’activité évaluative (Mottier Lopez, 2017, p. 174).

Roegiers (2004), quant à lui, précise que pour qu’un système d’évaluation soit bon, il convient de s’assurer qu’il soit à la fois :

- efficace, c’est-à-dire qu’il doit aider à prendre des décisions ;

- réaliste, les étapes de conception de l’épreuve, de recueil des informations et de correction doivent être facile à élaborer, limité et à la portée de l’enseignant ;

- et visible, il doit permettre d’informer les acteurs du système de façon compréhensible.

Cette caractérisation d’un bon système d’évaluation est ainsi soutenue par une perspective pratique, de mise en œuvre effective dans les classes. Nous revenons ci-après sur chacun des invariants de l’activité évaluative.

Evaluer implique de commencer par définir l’objet de l’évaluation. L’enseignant doit ainsi déterminer à l’avance ce qu’il souhaite évaluer, ce sur quoi il souhaite obtenir de l’information. Le curriculum19 définit institutionnellement les savoirs, savoir-faire, compétences qui doivent faire l’objet d’une évaluation certificative. Mottier Lopez souligne la multiplicité des objets d’évaluation.

Ce bref tour d’horizon montre que le regard évaluatif s’ouvre à des dimensions autres que les seuls contenus de savoir disciplinaire. Il s’agit désormais d’appréhender aussi des dimensions métacognitives, sociales, affectives, situées des apprentissages, notamment dans une perspective d’évaluation formative mais aussi, dans une certaine mesure, en vue d’une évaluation certificative.

De plus, il s’agit non seulement d’apprécier des acquis en fin de périodes de formation, mais également d’évaluer des processus, des trajectoires, des progressions. Autrement dit, les « objets » susceptibles d’être évalués sont incroyablement multiples ! Et le mouvement actuel tend à renforcer les demandes évaluatives. (Mottier Lopez, 2015b, p. 44)

En ce qui concerne notre étude, la mise en avant dans les curriculums de mathématiques de la résolution de problèmes comme un objectif d’apprentissage pour lui-même, soulève la question de son évaluation. Les enseignants sont ainsi confrontés au besoin, voire à l’injonction, d’évaluer un objet d’enseignement, qui n’est pas clairement défini institutionnellement, afin de certifier de sa bonne appropriation par les élèves. Les enseignants doivent donc identifier et caractériser la résolution de problèmes en tant qu’objet d’évaluation.

19 Le plan d’études romand pour l’enseignement obligatoire à Genève.

58 Une fois l’objet de l’évaluation défini, il s’agit de se donner les moyens de recueillir des informations concernant les conduites des élèves en lien avec cet objet. La récolte des informations peut se faire de manière instrumentée ou non (Allal, 2008b; Mottier Lopez, 2015b).

Dans le dernier cas, cela signifie que l’évaluation ne s’appuie sur aucun outil physique d’évaluation et ne donne pas lieu à des traces re-consultables ultérieurement. L’évaluation est alors souvent informelle (Mottier Lopez, 2015b, p. 53). Des échanges verbaux avec l’élève concernant le problème, ou l’observation de ce dernier en train de résoudre un problème peuvent ainsi être, pour l’enseignant, un moyen non instrumenté de recueillir de l’information. A contrario, l’évaluation instrumentée implique le recours à un outil palpable. Il peut s’agir :

- d’outils évaluatifs de prescription de tâches à réaliser par l’élève ;

- d’outils d’étayage et d’appréciation, tels qu’une grille d’observation critériée ;

- d’outils de communication d’évaluations bilan à l’extérieur de la classe (Mottier Lopez, 2015b, p. 54‑55).

A l’appui des travaux de Vygotsky (1930), Allal (2008a) souligne que les outils d’évaluation exercent des fonctions de contrôle et de régulation et qu’ils permettent, de plus, d’amplifier et d’améliorer l’action de celui qui les utilise.

Ainsi, un outil ou instrument d’évaluation, telle qu’une grille de critères d’appréciation, peut contribuer à la fois à contrôler l’action de l’évaluateur (focaliser son attention sur les aspects pertinents de l’objet à évaluer) et à amplifier sa capacité de jugement (suggérer des attributs à prendre en compte auxquels il n’aurait pas pensé). (2008a, p. 4)

Il convient cependant, comme le rappelle Mottier Lopez (2015b, p. 26), de ne pas céder à une illusion instrumentale qui laisserait croire que les problématiques liées à l’évaluation peuvent se régler par la création et le recours à de nouveaux outils.

Si les moyens qui peuvent être utilisés pour recueillir des informations sont multiples, leurs utilisateurs doivent chercher à s’assurer de la qualité des informations recueillies. De Ketele (1989) met en avant trois critères qui doivent caractériser les informations recueillies en vue d’une évaluation : la pertinence, la validité et la fiabilité. Pour de nombreux chercheurs travaillant sur la thématique de l’évaluation, ces critères sont considérés comme nécessaires pour assurer un bon système d’évaluation. Ils peuvent être définis ainsi :

- la pertinence : c’est le caractère plus ou moins approprié de l’épreuve, selon qu’elle s’inscrit dans la ligne des objectifs visés ((De Ketele, Chastrette, Cros, Mettelin, & Thomas, 1987) cité par (De Ketele & Gerard, 2005, p. 3)) ;

- la fiabilité : c’est le degré de confiance que l’on peut accorder aux résultats observés.

Seront-ils les mêmes si on recueille l’information à un autre moment, par une autre personne, etc. ? (De Ketele & Gerard, 2005, p. 1; Roegiers, 2004, p. 52) ;

- la validité : c’est l’adéquation entre ce que l’on évalue et ce que l’on prétend évaluer (Roegiers, 2004, p. 164).

Le critère de validité, ainsi considéré, est cependant abandonné par Vantourout et Goasdoué (2014) au profit de celui de validité didactique de l’évaluation. La validité psycho-didactique de l’évaluation s’appuie sur l’idée « qu’il n’existe pas de tâches valides en soi mais des regards différents sur la validité relativement à des finalités d’évaluation. La finalité principale de la VPD [validité psycho-didactique] est avant tout d’assurer la qualité du diagnostic […] » (Vantourout & Goasdoué, 2014, p. 146). Cette finalité incite ainsi à se demander si le problème proposé en évaluation met bien en jeu les savoirs, savoir-faire que l’on souhaite évaluer, si le choix des valeurs des variables didactiques peut influencer les procédures des élèves ou encore si les problèmes proposés en évaluation sont proches de ceux travaillés en classe. Cette manière d’appréhender la validité de l’évaluation repose sur une analyse qualitative du processus de réponse de l’élève et tient compte des spécificités des apprentissages en jeu. Elle permet une prise en compte conjointe des travaux en psychologie cognitive et en didactique pour penser la question de la validité en évaluation.

Une fois les informations recueillies, il est nécessaire de les interpréter. Hadji parle ainsi de l’évaluation comme d’une opération de lecture de la réalité (1997), l’évaluateur devant construire du sens à partir d’un ensemble de signes mis à sa disposition. « Le sens n’est pas présent, dans l’objet, avant l’acte d’évaluation. L’objet est là, présent. Mais il faudra se prononcer sur un rapport à ce qui peut être, dans cette institution, souhaité, attendu » (Hadji, 1997, p. 41). Il ne s’agit donc pas simplement pour l’enseignant, de piocher des indices déjà présents dans la production de l’élève, mais davantage de co-construire du sens, en interaction avec un milieu, une situation et des sujets.

Trois cadres de référence permettent de distinguer les manières d’interpréter les informations recueillies (Allal, 2008b; Mottier Lopez, 2015b) :

- Une interprétation à référence normative lorsque le résultat de l’élève est comparé à ceux des autres apprenants ;

60 - Une interprétation autoréférenciée lorsqu’il s’agit d’évaluer une progression, le niveau de

l’élève étant comparé à son niveau à un moment antérieur ;

- Une interprétation à référence critériée lorsque la production de l’élève est confrontée à des critères déterminés en fonction des objectifs fixés.

Mottier Lopez (2009, 2015c, 2017; Mottier Lopez & Allal, 2008) parle, de plus, dans une perspective d’évaluation située, de multiréférentialité de l’évaluation. Elle souligne ainsi la nécessité de considérer conjointement plusieurs contextes, scolaires et extrascolaires, plusieurs cadres et référentiels, pour rendre compte de la manière dont s’opère le jugement professionnel de l’enseignant dans une finalité de construction de sens. Il convient ainsi de considérer à la fois : […] les normes professionnelles perçues comme reconnues et partagées par les acteurs ; les exigences institutionnelles formalisées dans les lois, règlements ou principes d’application ; les choix collégiaux d’une école ou d’un établissement qui parfois se concrétisent dans une chart ; la microculture de la classe qui est construite entre chaque enseignant et ses élèves délimitant les attentes, les normes, les pratiques partagées au regard des activités effectivement réalisées ; les valeurs personnelles de l’enseignant et ses croyances qui intègrent, entre autres, les aspects plus ou moins conscients du jugement évaluatif (Laveault, 2005). (Mottier Lopez & Allal, 2008, p. 467) Le jugement de l’enseignant relève ainsi à la fois d’un processus cognitif individuel et d’une pratique sociale (Mottier Lopez & Allal, 2008, p. 467).

A partir d’une étude de ses définitions dans divers champs disciplinaires et sociaux, Cros et Raisky caractérisent la notion de référentiel comme « […] un construit social qui clarifie les normes d’une activité ou d’un sens donné à des systèmes sociaux. Il est ce par rapport à quoi un jugement ou un sens est donné à un objet ou une action » (2010, p. 107). La prise en compte de la multiréférentialité de l’évaluation nous amène à considérer que le jugement évaluatif de l’enseignant s’appuie sur des référentiels explicites mais aussi sur des référentiels implicites.

Mottier Lopez et Dechamboux distinguent ainsi :

− Le référentiel explicite préexistant, sous forme d’objectifs d’apprentissage, critères d’évaluation, indicateurs « déjà là ». Dans ce cas, les attentes sont formelles, communicables, pouvant être communes et partagées.

− Le référentiel implicite, qui émerge lors de la verbalisation de l’enseignant pendant la correction.

Par exemple, l’enseignant admet que l’élève n’explicite pas toutes les phases de son raisonnement mathématique dans une résolution de problèmes si celui-ci est correct. Dans ce cas, les attentes sont informelles, susceptibles d’être différentes entre les classes, voire entre les élèves d’une même classe.

(Mottier Lopez & Dechamboux, 2017, p. 45)

Quel que soit le cadre de référence considéré, il s’agit de comparer, de confronter un référé à un référent, pour lui donner du sens et de la valeur. L’acte d’évaluation est donc foncièrement « un acte de confrontation, de mise en rapport… » (Hadji, 1997, p. 10). De Ketele définit ainsi l’acte d’évaluer comme le fait de :

[…] recueillir un ensemble d’informations suffisamment pertinentes, valides et fiables et examiner le degré d’adéquation entre cet ensemble d’informations et un ensemble de critères adéquats aux objectifs fixés au départ ou ajustés en cours de route, en vue de prendre une décision. (De Ketele, 1989, p. 44).

L’évaluation nécessite donc de définir, de construire un référent, c’est-à-dire un ensemble de critères précisant les attendus (Hadji, 1997, p. 42). Si Hadji associe le concept de référent à des normes ou des idéaux à atteindre, Figari (1994) en propose une vision élargie, considérant qu’un référent peut être aussi constitué par un niveau, un élément de comparaison spécifique, non associé à une norme (Figari & Tourmen, 2006). Mottier Lopez et Dechamboux (2017) postulent, quant à eux, que la relation entre le référent et le référé relève davantage d’une relation dialectique, c’est-à-dire comme étant co-constitutifs l’un de l’autre, que d’une comparaison ou d’une confrontation. Une des conséquences de cette conceptualisation est que « l’évaluation de productions complexes s’éloigne de l’idée de rechercher des "correspondances" entre des attendus et des réponses d’élèves » (2017, p. 9). Cela conduit, de plus, à considérer les quatre opérations décrites par Allal (2008b) dans une relation dynamique plutôt qu’en tant qu’étapes successives (Mottier Lopez & Morales Villabona, 2018, p. 130), le référent étant associé à l’étape de définition de l’objet de l’évaluation, tandis le référé est relatif à l’interprétation des informations recueillies.

Roegiers définit un critère comme « un élément auquel on se réfère pour porter une

Roegiers définit un critère comme « un élément auquel on se réfère pour porter une