Évaluation des apprentissages : aspects théoriques

CHAPITRE 2 La recension des écrits

5. Évaluation des apprentissages

5.1 Évaluation des apprentissages : aspects théoriques

Guba et Lincoln (1989) ont divisé en deux catégories, les courants théoriques sur l’évaluation en éducation : l’évaluation objective et l’évaluation subjective. L’évaluation objective est présentée en trois générations. L’évaluation subjective ou constructiviste consiste en la quatrième génération.

Évaluation objective : les trois premières générations. Les générations de l’évaluation objective sont l’ère de la mesure, la description et le jugement (Guba & Lincoln, 1989).

La première génération d’évaluation, appelée l’ère de la mesure, a commencé à la fin du siècle dernier et a contribué à développer de nombreux instruments de mesure qui permettaient, et permettent encore, de placer les apprenants ou les écoles selon un ordre (ranking). Cette période correspond à la création de tests de quotient intellectuel et d’examens nationaux.

La deuxième génération d’évaluation, l’ère de la description, a pris son envol après la 2e Guerre Mondiale, au moment où les curriculum scolaires ont commencé à se développer à partir d’objectifs d’apprentissage. L’évaluateur, tout en maintenant une approche de mesure, peut décrire les forces et les faiblesses des étudiants en fonction des objectifs visés de leur programme d’études. En quelque sorte, il compare les résultats obtenus avec les résultats espérés.

Quand la Russie a dépassé les États-Unis dans la course dans l’Espace à la fin des années 50, les planificateurs américains ont posé un regard critique sur des objectifs qui ne pouvaient les assurer d’être les meilleurs. Avec la troisième génération d’évaluation, le

jugement, certains ont revu les objectifs, la façon de les atteindre et les résultats prévus. Des normes sont apparues pour comparer les résultats obtenus avec ceux désirés et

l’évaluateur fut considéré la personne la plus objective pour juger cette comparaison. Cette génération est une combinaison des deux premières. À partir des normes, il est en effet possible de placer les résultats en ordre, du meilleur au pire.

Au cours de ces trois premières générations, l’évaluation est perçue comme objective et comparative, d’abord avec des objectifs, ensuite avec des normes. Dans les écrits des infirmières, cette conception a toujours été valorisée. À titre d’exemple, (Lindeman, 1988,1989) a procédé à une recension exhaustive des études sur l’éducation du patient qu’elle a classé en six catégories : 1) les caractéristiques des patients comme apprenants, 2) les caractéristiques des infirmières comme enseignantes, 3) la relation infirmière comme stratégie éducative, 4) les caractéristiques des groupes –cible, 5) les établissements de santé comme environnement éducatif et 6) les contenus spécialisés, tels la relaxation, les comportements de parents, les contenus psychoéducationnels. Elle conclut chacune de ces catégories par une synthèse dans le but de développer une théorie de l’instruction. Lindeman (1988, 1989) termine ce travail gigantesque (près de 150 études révisées) en déplorant le manque de souci théorique des infirmières qui mettent surtout l’accent dans le développement de l’intervention éducative et, parfois un peu sur l’évaluation sans relier le tout à un cadre conceptuel cohérent.

Notre démarche est donc parfaitement justifiée. Cependant, comme nous nous intéressons à l’apprentissage dans sa définition subjective, ces générations d’évaluation ne conviennent pas.

Évaluation subjective : la quatrième génération. Avec la 4e génération,

l’évaluation ne suit plus le même pattern de se complexifier et de se préciser; elle prend un virage subjectif. Ce type d’évaluation est négocié, à tous les niveaux, avec des partenaires et il comprend le point de vue de l’ensemble des personnes impliquées.

L’évaluation est dite constructiviste : elle s’appuie sur l’idée que même la science est une construction et que cette construction s’établit à partir d’un consensus, dans un contexte donné. Il n’y aurait pas d’une part, un évaluateur et, d’autre part, un objet à évaluer, mais bien des sujets qui se rencontrent avec leur subjectivité. Cette approche se caractérise par l’étude interprétative de cas dans leur contexte, selon les perspectives des personnes qui y sont impliquées. Il ne s’agit pas d’établir des liens causals entre l’intervention et certains résultats, mais bien de cerner des comportements humains, complexes, systémiques et signifiants. « Constructivist inquiry cannot provide demographic answers to many

[research] questions, but it has enormous power and subtlety when it is used for questions of human behavior, interactivity, belief systems and meaning attribution » (Lincoln, 1992 p. 390).

La figure la plus influente de cette génération est Stake (1983, 1995). Stake (1983) insiste sur l’aspect adapté à la situation (responsive) et négocié de l’évaluation.

L’évaluation, pour être considérée comme adaptée à la situation, doit répondre à certains critères : 1) elle doit s’intéresser davantage aux activités ou aux manifestations éducatives qu’aux intentions ou objectifs du programme, 2) elle doit répondre aux demandes d’un auditoire, 3) elle doit rapporter les valeurs et les perspectives des personnes impliquées. Les outils de l’évaluateur sont les récits, les descriptions et, si nécessaire, les graphiques. « He or she finds out what is of value to the audience and gathers expressions of worth from various individuals whose points of view differ. » (Stake, 1983, p. 292-293). Guba et Lincoln (1989) ont, pour leur part, déterminé les bases épistémologiques de l’évaluation constructiviste et ils ont établi des critères de crédibilité.

Stufflebeam (1980) classe ce type de recherche évaluative dans les évaluations centrées sur les clients et orientées vers les valeurs puisqu'elle cherche à promouvoir une

compréhension des activités et leurs valeurs dans un milieu particulier, selon la

perspective de plusieurs sources. À son avis, la principale force de cette approche est son orientation vers l’action, puisque les personnes qui y sont impliquées participent à leur propre évaluation. En utilisant les critères de rigueur de qualité de l'approche objective, ses principales faiblesses seraient le manque de crédibilité externe et les dangers de biais occasionnés par le contrôle possible que les personnes impliquées peuvent exercer sur l'évaluation.

Par ailleurs, ces évaluations sont rarement diffusées à la communauté scientifique. Deux raisons peuvent expliquer ce quasi-silence. D’une part, elles peuvent être jugées comme non recevables à cause des critères de publication, entre autres, la crédibilité externe. D’autre part, les auteurs des rapports peuvent juger que leur publication ne peut intéresser que les personnes directement concernées. Deux études font exceptions : une étude sur l’évaluation d’un programme d’accompagnement du deuil et une étude sur l’évaluation d’un programme précoce d’interventions familiales à la naissance d’un enfant avec une déficience, le PRIFAM.

Dans le document Apprentissages de parents et d'infirmières lors de l'application du PRIFAM : programme précoce d'interventions familiales à la naissance d'un enfant avec une déficience (Page 76-79)