• Aucun résultat trouvé

Essai d'utilisation du système de Flanders pour l'analyse de l'interaction en classe

N/A
N/A
Protected

Academic year: 2021

Partager "Essai d'utilisation du système de Flanders pour l'analyse de l'interaction en classe"

Copied!
91
0
0

Texte intégral

(1)

L8

$".->

, 4 74

r /

-ESSAI D'UTILISATION DU SYSTEME DE FLANDERS POUR L»ANALYSE DE L'INTERACTION EN CLASSE

par Yves Poisson

Thèse présentée

à la Faculté des Sciences de l'Education de l'Université Laval

en vue de l'obtention de la

maîtrise en sciences de l'éducation

(2)

quelques spécialistes de la Faculté des Sciences de l'Education de 1*Université Laval» Nous leur exprimons notre vive gratitude pour leur-collaboration.

Nous sommes non moins redevable d'une reconnaissance toute spéciale à l'endroit de Mademoiselle Aimée Leduc, professeur agrégé à la Faculté des Sciences de l'Education de l'Université Laval, qui a bien voulu assumer la direction de cet ouvrage et qui nous a fait bénéficier de sa compétence professionnelle et de son grand dévouement»

Il nous fait plaisir de remercier l'Université du Québec à

Chicoutimi de nous avoir fourni, sous forme de bourse, des subventions qui nous ont permis de mener à bon terme cette entreprise»

Enfin, au personnel enseignant des classes où nous avons fait nos observations, à leurs élèves ainsi qu'aux étudiants gradués qui nous ont apporté leur si généreux concours, notre plus sincère merci»

(3)

INTRODUCTION 1

Chapitre I: Le système d'analyse de Flanders . . . » 3 Variables à mesurer » 4

Unités de mesure . . . 6 Comparaison des unités . . . 7

Interprétation des événements observés • 8

Chapitre II: Essai du système de Flanders • 10

Obtention des données 10 Comparaison des données . » 17

Chapitre III: Analyse et interprétation des difficultés 33 Variables à mesurer . . . 33

Unités de mesure 39 Interprétation des événements codés . • 45

CONCLUSION 49

Appendice A: Catégories originales et traductions. • 53 Appendice B: Court protocole et façon de coder • • • 59 Appendice C: Modèle de matrice d'observation et

(4)

Appendice D:

Appendice E: Appendice F:

Tableau de Flanders pour illustrer le calcul du coefficient de Scott • » Données de l'expérimentation

Protocole de cinq minutes d'enseignement enregistré et ensuite codé en laboratoire

64 66

79

(5)

La présente étude résulte des difficultés rencontrées lors de l'entraînement fait en vue de l'utilisation du système d'analyse

d'interaction développé par N.A» Flanders (I960). Notre projet initial de thèse avait comme objectif d'essayer de déterminer s'il existe des liens entre certaines variables qui font partie del 'enseignement. Etant donné que le systèmed 'observation de Flanders est construit de façon à donner des informations sur les aspects affectifs de l'acte d'enseigner, nous avions pensé qu'il pourrait y avoir des relations entre ces données et celles obtenues sur les qualités de relations humaines des professeurs telles que perçues par les élèves et mesurées par le Barrett-Lennard (1962).

Comme nous devions nous assurer des qualités métrologiques de l'instrument d'observation que nous avions décidé d'utiliser, une

période d'entraînement suffisamment longue pour obtenir un coefficient acceptable d'entente entre deux observateurs avait été prévue. Tenant compte du fait que Flanders (1967) estime qu'un entraînement préliminaire de six à dix heures avec des enregistrements est nécessaire avant de

passer à l'observation dans des classes réelles, tenant compte également que d'après Flanders (1967), un coefficient de Scott (1955) d'au moins 0.85 d'entente entre deux observateurs est souhaitable, nous avons

(6)

approfondie des problèmes qui se rapportent à la fidélité et à la validité du système d'analyse d'interaction en classe. Nous avons cru qu'une telle étude s'imposait du fait que le système de Flanders est très répandu aux Etats-Unis (Campbell et Barnes, 1969) et qu'il est maintenant utilisé au Québec (Gauthier, 1969) alors que peu d'études critiques ont été faites à son sujet (Allon, 1969; Mitchell, 1969; Rosenshine, 1970).

Trois chapitres servent à rendre compte de notre recherche. Dans le premier chapitre, nous faisons un exposé du système d'analyse

élaboré par Ned A. Flanders» Le deuxième chapitre fait état de l'essai d'utilisation que nous avons fait du système d'analyse d'interaction. Les problèmes rencontrés en exécutant cette opération sont analysés dans le troisième chapitre. Une conclusion termine l'ouvrage.

(7)

Le système d'analyse de Flanders

Lorsqu'un chercheur en éducation décide de développer ou d'utiliser un système pour l'observation de l'enseignement,il a d'abord l'intention de rendre compte le plus objectivement possible de la situation telle qu'elle existe. Comme la situation sociale d'une classe est passablement complexe et que les variables pouvant être

étudiées sont nombreuses., il faut nécessairement choisir certaines dimensions et limiter l'observation à certains actes qui permettront finalement d'avoir une image passablement juste de la réalité observée. Dans un article sur les problèmes de la mesure, Delgado et Delgado (1962) résument et ramènent à quatre opérations essentielles le processus de la mesure du comportement: l'isolement des objets ou variables a mesurer, la détermination et la définition des unités de mesure, la comparaison des unités de mesure et finalement l'interprétation des événements observés. C'est en ayant à l'esprit ces quatre opérations que nous présenterons d'abord le système d'analyse d'interaction et que plus tard nous en ferons l'évaluation et la critique.

(8)

Il est important de signaler dès maintenant que Flanders aurait voulu élaborer un système d'observation qui puisse rendre compte de tout ce qui arrive en classe. Cette préoccupation est signifiée par ce qui suit: "First, the system should be designed to include all possible events, that is, the categories should be totally inclusive."

(Flanders, 1966, p. 8 ) . L'auteur continue en faisant remarquer que tout système d'observation qui ne rencontrerait pas cette exigence serait sélectif et ne fournirait pas des données représentatives de

tous les événements verbaux qui pourraient se présenter dans la situation observée. Notons que c'est en raison de cette préoccupation de rendre compte de la totalité de l'interaction que seront observés et mesurés les comportements verbaux du maître et des élèves; la seule limite que pose Flanders se rapporte au verbal. Dans ce système on ne tient compte que des comportements verbaux du maître et des élèves; pour justifier cette limite, Flanders assumé que le comportement verbal d'un individu est un échantillon adéquat de tout son comportement

(Flanders, 1966)»

Même si l'observation faite a l'aide du système d'analyse

d'interaction est centrée sur tous les comportements verbaux du maître et des élèves en classe,une autre limite, d'un type différent plutôt qualitatif cette fois, est imposée. Flanders (1966) fera porter

l'observation sur les comportements verbaux du maître en classe capables d'influencer la participation des élèves. Sur ce point, les recherches de Flanders se situent dans la ligne de celles d'Anderson (1939),

(9)

The rationale behind our system of categories

is closely related to Anderson's concepts of "domination" and "integration". We prefer to use the words "direct influence" to indicate acts that tend to restrict freedom of action, and "indirect influence" to refer to acts that tend to increase freedom of action. (Flanders, 1959, P. 17).

Les recherches mentionnées portent principalement sur les variables relatives au contrôle et à l'influence du maître sur la communication en classe et leurs auteurs se sont très peu préoccupés du contenu co—municjue en classe et de l'aspect cognitif; ils ont fait porter leur attention sur le climat de la classe. On pourrait dire que l'hypothèse fondamentale à la majorité de ces recherches pourrait se résumer ainsi: l'apprentissage est favorisé par le climat

créé par le maître; avec un maître intégrateur ou démocratique, les élèves sont dans une situation facilitant l'apprentissage alors que les élèves ayant un maître dominateur ou autocratique né tirent pas profit d'un tel avantage. Flanders, reprenant une hypothèse semblable, a développé les concepts d'influence indirecte et d'influence directe; voici comment il les décrit:

Direct influence consists of stating the teacher's own opinions or ideas, directing the pupil's action, criticizing his behavior, or justifying the teacher's authority or use of that authority.

Indirect influence consists of soliciting the opinions or ideas of the pupils, applying or enlar-ging on the opinions or ideas of the pupils praising or encouraging the participation of pupils, or cla-rifying and accepting the feelings of pupils.

(10)

Dans le système de Flanders il y a combinaison de deux dimensions: le temps et les catégories de comportement. L'observation se fait à la fois en notant directement les comportements à toutes les trois secondes, et en décidant à quelle catégorie appartiennent ces compor-tements.

L'unité de temps est un élément tout-à-fait arbitraire dans ce système. Flanders (1966) exige simplement que l'observateur note à peu près vingt unités par minute; pour une période de cinquante minutes, il devrait y avoir, environ, mille unités.

En considérant les catégories comme unités de mesure nous pourrions dire que le système de Flanders comprend dix unités de comportements. Les catégories sont identifiées nominalement par des chiffres et ne sont pas classées, dit Flanders, par ordre de valeur; ainsi la catégorie 10 ne vaut pas plus que la catégorie 2. Si nous présentons sommairement les dix unités que sont les catégories, nous avons ce qui suit: (1) comportements d'acceptation des sentiments des élèves par le maître, (2) félicitations et encouragements exprimés par le maître, (3) utilisation des idées des élèves par le maître,

(4) questions posées par le maître, (5) exposés faits par le maître, (6) directives données par le maître, (7) critiques émises par le maître, (8) interventions verbales des élèves en réponse à une sollicitation du maître, (9) interventions spontanées des élèves, (10) moments de silence et de confusion. La description originale

(11)

utilisée dans le texte pour désigner une période de trois secondes environ se rapportant à l'une des dix catégories énumérées ci-dessus.

C. Comparaison des unités

Les comportements verbaux observés en classe sont partagés en trois ensembles: les comportements du maître, les comportements des élèves, les autres comportements non identifiables parce qu'il y a bruit ou confusion.

Flanders subdivise les comportements du maître en deux sous-ensembles: l'un d'influence directe et l'autre d'influence indirecte. Sont regroupés sous le terme "influence indirecte" tous les actes du maître pouvant être en mesure d'accroître la liberté d'action et la participation des élèves (catégories 1, 2, 3, 4 ) , le deuxième

sous-ensemble nommé "influence directe" comprend les actes du maître qui établissent une contrainte sur les élèves ou une diminution de leur participation (catégories 5, 6, 7)» La description statistique de cette relation est nommé rapport I/D. Pour trouver ce rapport, il s'agit de faire la somme des unités d'influence indirecte et de la diviser par la somme des unités d'influence directe. Un rapport I/D égal à l'unité signifierait que le maître manifeste un comportement plutôt neutre tandis qu'un I/D > 1 serait l'indice d'un comportement

d'influence indirecte et qu'un I/D < 1 coïnciderait avec un compor-tement d'influence directe. Une autre mesure reliée au comporcompor-tement verbal du maître est le rapport i/d, ou I/D modifié obtenu en divisant la somme des unités comprises dans les catégories 1, 2, 3 par celle

(12)

comprise dans les catégories 6 et 7.

D» Interprétation des événements observés

Flanders a prévu une technique de codage qui permettrait une certaine analyse de l'interaction maître-élèves. Le codage se fait en notant successivement les comportements selon leur ordre d'appa-rition et d'après le chiffre de la catégorie à laquelle ils sont jugés appartenir. Toutes les unités de comportement verbal sont inscrites

directement par le codeur qui se tient en classe à l'endroit le plus propice pour entendre et voir les participants. A la fin de chaque période de trois secondes, le codeur décide quelle catégorie représente mieux les événements qui viennent de survenir; le codeur écrit immé-diatement le numéro de la catégorie retenue en même temps qu'il observe ce qui se passe afin de continuer à noter de 20 à 25 observations par minute» Les notations constituent finalement une série de chiffres

disposés en colonnes de façon à être lus par paires, de haut en bas. Un court protocole codé est présenté à l'appendice B et illustre ce qui vient d'être décrit»

Une fois le codage terminé, les observations sont reportées sur un tableau que Flanders nomme matrice d'observation. La matrice

d'observation comprend dix rangées et dix colonnes correspondant aux dix catégories de comportement» La jonction des colonnes et des rangées forme cent cellules où sont transcrites toutes les unités de comportement selon leur ordre d'apparition; ainsi, les unités correspondant à une

question du maître (catégorie 4) suivie d'une réponse d'un élève

(13)

verbal se succèdent, ces unités sont inscrites à la rencontre de la rangée et de la colonne correspondant au comportement en question; ainsi lorsque le maître a encouragé (catégorie 2) les élèves pendant une minute, vingt unités sont inscrites dans la cellule située à la rencontre de la rangée 2 et de la colonne 2» L'appendice C constitue un modèle de matrice d'observation et fait voir comment sont trans-posées les informations notées à l'appendice B.

Le tableau imaginé par Flanders est fait pour permettre une

vue d'ensemble de l'interaction maître-élèves; toutes les unités codées peuvent être compilées d'après leur ordre d'apparition par paires et comparées entre elles. Les informations contenues dans ce tableau peuvent être analysées et commentées de diverses façon; il est à

signaler que Flanders (1968) attache une importance considérable à l'interprétation des données qui y sont cumulées» Flanders a élaboré un procédé d'analyse où il est possible de faire certaines inferences k partir de la répartition du nombre d'unités de comportement dans chacune des cellules ou de certains groupes de cellules. Notons également que la matrice d'observation contient toutes les données nécessaires au calcul des rapports I/D et i/d.

(14)

Essai du système de Flanders

Ce chapitre se divise en deux parties. La première décrit les principales démarches faites pour l'obtention des données nécessaires à l'analyse de l'interaction en classe. La deuxième a trait à la comparaison des résultats obtenus lors du codage.

A» Obtention des données

1» Traduction des catégories

Dans le but de rester le plus possible en conformité avec les directives de Flanders sur l'observation et la codification, il fut décidé de n'utiliser que le matériel provenant de l'auteur lui-même» Les deux publications qui ont servi comme références de base à

l'entraînement sont: Interaction analysis in the classroom (Flanders, 1966) et The role of the teacher in the classroom (Amidon et Flanders, 1967)» Comme la traduction de l'anglais au français est le premier obstacle à franchir lorsque l'on veut utiliser du matériel américain,

(15)

voici comment a été solutionné ce problème. Une première traduction des catégories du système d'analyse d'interaction a été effectuée et utilisée lors des discussions en séminaire à la Faculté des Sciences de l'Education.

Après avoir comparé notre traduction initiale à celle qu'en donnent Bayer (1966) et Gauthier (1969) nous avons finalement opté pour la version définitive qui semblait plus près du texte original anglais. L'appendice A contient le texte original de Flanders et les quatre versions utilisées pour la présente étude.

2» Entraînement au codage

Le codage devant être fait par au moins deux codeurs, une

étudiante inscrite à la maîtrise en sciences de l'éducation et l'auteur ont fait l'entraînement exigé à cette fin. Notre première tâche,

après avoir mémorisé les dix catégories du système d'analyse d'inter-action, fut de traduire de l'anglais des extraits de protocoles reçus de Flanders (1964) et de les coder. L'utilisation de ce matériel pré-paré par Flanders et ses assistants nous assurait au départ de la

fidé-lité aux procédures de l'auteur (voir appendice B ) . En comparant notre façon de coder avec celle qui est indiquée au protocole, il était possible

(1) Séminaire sur les attitudes et les styles d'enseignement

sous la direction de Mlle Aimée Leduc, Université Laval, 1969. Séminaire sur l'analyse du comportement pédagogique sous

la direction du Dr Gilles Dussault, Université Laval, 1969-70.

(16)

de vérifier immédiatement sur quelles unités de comportement il y avait divergence et de modifier notre évaluation advenant une telle nécessité» Toutes les délibérations entre les deux codeurs concernant le choix d'une catégorie plutôt qu'une autre furent enregistrées ou notées; ceci fut fait afin de faciliter l'identification ultérieure des points sur lesquels il pourrait y avoir litige» Ayant complété douze heures d'entraînement au codage non soutenu.c'est-à-dire fré-quemment interrompu par des comparaisons et des discussions, nous avons décidé de coder une période de vingt minutes sans arrêt»

Cette tentative devait permettre de trouver le coefficient de Scott (1955) entre deux codeurs» Il est à signaler que le coefficient de Scott est une formule que Flanders a utilisée pour évaluer la pro-portion d'entente entre deux observateurs. Flanders décrit ce

coefficient de la façon suivante:

P P

7T» — ° ______ ( 1 ) 100 - P e

P P o is the percentage of agreement, and e

is the percentage of agreement expected by chance which is found by squaring the proportion of tallies is each category, summing these over all categories, and multiplying by 100

Pe = 100 £ P? . ( 2 )

1=1

In formula two there are K categories and p. is the proportion of tallies falling into each category, ff , in formula one, can be expressed in words as the amount that two observers exceeded chance agreement divided by the amount that perfect agreement exceeds chance.(Flanders, 1966, p. 13).

Nous reproduisons à l'appendice D un tableau que Flanders (1966) présente pour démontrer la manière de calculer le coefficient de Scott.

(17)

La première fois que nous avons effectué le calcul du coefficient d'accord, d'après la formule dont il vient d'être question, nous n'avons pu obtenir qu'un coefficient de 0.42 d'accord. Comme nous avions à

notre actif seulement douze heures d'entraînement et étant donné que Flanders (1966) estime que cette période de temps est le minimum requis en vue de l'entraînement au codage pour fins de recherche, nous avons décidé de prolonger la préparation jusqu'à l'obtention d'un coefficient de 0.85» Même après un entraînement supplémentaire de quinze heures, il ne fut pas possible d'atteindre cet objectif. Lors de différentes ten-tatives pour calculer les coefficients d'accord, aucune stabilité ne semblait être assurée; ainsi, après avoir obtenu 0.82 pour une période de dix minutes, nous ne pouvions atteindre que 0.38 d'accord à l'essai suivant. Devant cette instabilité, trois solutions pouvaient être envisagées, à savoir: continuer l'entraînement jusqu'à ce que nous

ayions atteint la stabilité et le coefficient requis pour une recherche, abandonner la tentative, procéder au codage sans avoir le coefficient d'accord suffisant. En optant pour la'première solution, nous ne savions pas jusqu'où cela pourrait nous mener; déjà nous avions fait un entraînement de plus de vingt-cinq heures sans compter les heures nécessaires au calcul des coefficients. Il fallait donc rejeter cette option qui risquait d'exiger trop de temps. La deuxième solution ne s'avérait guère plus économique puisque nous avions consacré un très grand nombre d'heures à l'étude du système de Flanders, à sa traduction et à l'entraînement au codage. Il fallait également rejeter la troisième solution puisque toute recherche à base d'observation exige nécessaire-ment un haut degré de concordance (Medley et Mitzel, 1963). Après

consultation de notre directeur de thèse, nous avons jugé préférable de modifier notre étude et de procéder de la façon suivante: faire le

(18)

codage d'une façon systématique et analyser ensuite les données obtenues lors du codage par deux codeurs. Cette procédure devait permettre de déterminer pourquoi il est si difficile d'obtenir un coefficient de 0.85 d'accord en utilisant le système d'analyse d'interaction.

3# L'échantillon

Comme Flanders (1966) assume que le comportement verbal est un échantillon adéquat du comportement total d'un individu, nous avons cru qu'il n'était pas indispensable de faire le codage directement en classe»

Grâce à l'utilisation d'un magnétophone Wollensak 3M, quinze périodes de cours ont été enregistrées sur rubans magnétiques» L'enregistrement fut fait avec la présence en classe d'un seul des deux codeurs» Cette façon de faire devait nous permettre de procéder au codage en laboratoire; la décision de se servir de l'enregistrement magnétophonique vient du fait que cette technique permet de conserver, de réentendre et d 'utiliser aussi souvent que nécessaire les compor-tements verbaux alors que la codification directement faite en classe nous prive de toute reprise de ce genre» Leô enregistrements ont été faits dans les classes de deux professeurs de français enseignant au niveau secondaire V, dans une régionale de la banlieue de Québec»

Après avoir obtenu le consentement des professeurs pour effectuer l'enregistrement de leur enseignement en classe et après leur avoir simplement expliqué que notre recherche consistait à l'analyse de ce qui se passe en classe lorsqu'un enseignement est donné, nous étions

(19)

en mesure de disposer de tout le temps nécessaire à l'enregistrement en classe» Les étudiants furent brièvement mis au courant de la

nature de notre recherche. La présence en classe fut la plus discrète possible et, au témoignage des professeurs, il semble que les compor-tements en classe n'aient que très peu été altérés du fait de l'enregis-trement et de la présence d'un observateur en classe»

C'est au cours des trois premières semaines de mars 1970 que l'enregistrement de quinze périodes de cours fut effectué. Comme le programme de français au niveau secondaire V prévoit cinq périodes d'enseignement par semaine, il fut alors possible d'observer l'ensei-gnement qui se fait normalement pendant une semaine. Il est à remarquer que dans les classes observées, les activités d'enseignement comprenaient à la fois des cours traditionnels ou magistraux, des discussions en

équipe, des périodes de lecture silencieuse, du français parléo Puisqu'il n'était pas question de vouloir analyser tout ce que fait un maître en

classe mais plutôt d'expérimenter en milieu québécois le système d'analyse de Flanders, seuls les enregistrements de périodes que nous avons estimé se prêter mieux à l'analyse de l'interaction en classe ont été retenus < pour le codage. Six périodes de quarante-cinq minutes chacune ont été choisies parce qu'elles avaient les caractéristiques suivantes: le

maître donne un cours ou un exposé, les élèves peuvent parler lorsqu'ils le désirent, l'enregistrement est techniquement réussi et sans inter-férence. Nous n'avons donc pas essayé de coder les périodes où il y a discussions en petits groupes ou lecture silencieuse. Parmi les six périodes retenues, trois ont été prises pendant les cours d'un professeur que l'on identifie sous les sigles suivants: R309, R302, R209 et trois autres dans celles d'un deuxième professeur: S203, S210, S110. Les lettres servent à identifier le professeur tandis que le premier chiffre

(20)

indique le groupe d'étudiants et les deux autres chiffres signalent la date de l'enregistrement.

4, Codage

Bien qu'une période de cours soit fixée à quarante-cinq minutes au secondaire, il peut arriver que l'enseignement proprement dit soit de plus courte durée. Pour fins de codage ne fut compté comme période d'enseignement que le temps compris entre le moment où le professeur avertit clairement les étudiants que le cours commence et celui où il est évident que le cours est terminé. Dans les classes observées, le début d'un cours était ordinairement souligné par une phrase du genre: "Messieurs, nous allons commencer..." La fin d'un cours pouvait être marquée par un son de cloche ou par l'annonce d'un changement d'activité

souvent énoncé ainsi: "La prochaine fois que nous nous rencontrerons..."

Le codage fut fait séparément par deux codeurs lors de l'audition des enregistrements sélectionnés; les deux codeurs étaient suffisamment éloignés pour ne pas s'influencer l'un l'autre et chacun d'eux devait s'efforcer de garder le rythme de vingt à vingt-cinq notations par minute.

(21)

B. Comparaison des données

La transposition des unités codées (appendice E) a rendu possible le calcul des coefficients de concordance entre les deux codeurs. Le tableau I permet de constater que l'ensemble des coefficients obtenus se situe bien en deçà du 0.85 souhaité.

TABLEAU I

Coefficients de Scott entre les codeurs

Classes Coefficients R309 0.54 R302 0.60 R209 0.58 S203 0.45 S210 0.65 S110 0.15

Il apparaît avec évidence ici que la difficulté rencontrée lors de l'entraînement existe toujours; les deux codeurs n'ont pas réussi à s'entendre suffisamment pour que leurs observations aient la fidélité nécessaire à une recherche scientifique. Il s'agit maintenant d'essayer de déterminer les causes de cet écart. Deux types d'explications nous ont paru plausibles: les erreurs relatives aux codeurs eux-mêmes et celles dépendant du système d'analyse lui-même.

(22)

1. Nombre total d'unités observées

L'une des premières questions à se poser au sujet de la

constance dans l'observation du comportement concerne les unités à noter; il faut bien déterminer si les observateurs ont effectivement observé les mêmes événements. Le tableau II laisse voir que le nombre d'unités de comportement notées par les deux codeurs ne coïncide pas avec celui qui devrait être obtenu hypothétiquement avec une moyenne de vingt à vingt-cinq unités par minute.

TABLEAU II

Unités hypothétiques comparées aux unités notées par les codeurs

Classes Minutes Unités Unités Diff. Unités Diff. Diff. d'ensei- hypothé- codées A - H codées B - H A - B gnement tiques H par A par B

R309 24 480 496 +16 465 - 15 31 R302 34 680 680 0 685 + 5 5 R209 25 460 443 -17 405 - 55 38 S203 39 780 775 + 5 584 -196 191 S210 41 820 780 -31 750 - 70 30 S110 39 780 787 + 7 622 -158 165 TOTAL 202 4000 3961 -20 3511 -489 460 MOYENNE 33 666 660 - 6 585 - 81 +75

(23)

Ce tableau permet de constater qu'il a été difficile de garder un rythme constant lors du codage. Le codeur A a réussi à garder une moyenne d'unités d'observations qui se rapproche sensiblement de la moyenne hypothétique. Par contre, le codeur B a enregistré moins

d'unités que le nombre hypothétiquement prévu. La différence moyenne d'unités observées pour les six périodes d'enseignement équivaut appro-ximativement à trois minutes; ceci signifierait que pour six périodes d'enseignement d'une durée moyenne de trente-trois minutes environ,il y a une marge de trois minutes en moins pour le codeur B. Cette constatation permet de retenir que les codeurs n'ont pas été capables de garder un rythme d'observation égal. De plus, un fait demeure: le codeur A a rendu compte d'un plus grand nombre d'événements que le codeur B et ceci dans une proportion qui atteint près de dix pourcent du temps d'enseignement. Ici les codeurs sont en cause puisqu'ils n'ont pas été en mesure d'atteindre une conformité suffisante. Toutefois, nous verrons plus loin que le système ne facilite pas le travail de l'observateur en exigeant trop de lui.

2. Pourcentage par catégorie

La comparaison du pourcentage d'unités accordées par les codeurs à chacune des catégories permettra de préciser les points sur lesquels il y a divergence entre les codeurs. Dix tableaux ont été préparés de façon à faire voir dans quelle proportion les codeurs portent un jugement identique ou différent. Ces tableaux permettront également de comparer les moyennes d'unités notées dans chacune des catégories;

(24)

ainsi les catégories 1, 2, 7 ne comprennent qu'environ un pourcent des unités codées alors que la cinquième catégorie grouperait 84% des unités dans une classe (tableau VII). Remarquons que le pour-centage a été utilisé dans les tableaux qui suivent parce que nous avions dû utiliser le pourcentage pour trouver le coefficient de Scott et que, ayant déjà en main ces chiffres, nous trouvions qu'ils pouvaient mieux servir pour fins de comparaison que les nombres

(25)

TABLEAU III

Pourcentage d'unités accordées à la première catégorie

Classes Codeur A Codeur B A et B

R309 0.40 0.00 0.20 R302 5.80 1.89 3.84 R209 3.61 0.00 1.80 Moyenne 3.27% 0.63% 1.94% S203 0.00 0.85 0.42 S210 1.26 0.40 0.83 S110 0.00 0.00 0.00 Moyenne 0.42% 0.41% 0.41%

Il apparaît clairement ici que le codeur A note généralement plus de comportements dans la catégorie 1; ceci se présente avec évidence pour les groupes de sigle R où la moyenne des unités notées par A est cinq fois celle de B. Le faible pourcentage des unités notées par les deux observateurs doit être signalé; pour les six

périodes, il arrive trois fois que le pourcentage soit zéro pour l'un ou l'autre des codeurs et dans un cas les deux observateurs ont jugé qu'aucun comportement n'appartenait à la première catégorie.

(26)

TABLEAU IV

Pourcentage d'unités accordées à la deuxième catégorie

Classes Codeur A Codeur B A et B

R309 0.00 0.64 0.32 R302 0.73 2.18 1.45 R209 0.68 1.48 1.08 Moyenne 0.47% 1.43% 0.95% S203 0.12 S210 0.00 S110 0.00 0.68 0.40 0.26 0.13 0.00 0.00 Moyenne 0.04% 0.31% 0.17%

Dans ce deuxième cas, c'est l'observateur B qui note d'une

façon constante plus de comportements manifestant de l'encouragement. Ici encore, il faut insister sur la faible fréquence des unités codées; le codeur A n'a pas codé de comportements dans la catégorie 2 pour

trois classes alors que l'observateur B n'a pas remarqué de comporte-ments d'encouragement dans une classe. La moyenne des pourcentages d'unités codées dans la deuxième catégorie ne dépasse pas un pourcent.

(27)

TABLEAU V

Pourcentage d'unités accordées à la troisième catégorie

Classes Codeur A Codeur B A et B

R309 2.21 6.45 4.33 R302 7.94 5.69 6.81 R209 4.51 6.40 6.45 Moyenne 4.88% 6.18% 5.53% S203 2.83 12.84 7.83 S210 1.01 4.00 2.50 S110 2.92 24.59 13.75 Moyenne 2.28% 13.81% 8.02%

Les deux observateurs n'ont que très peu d'entente au sujet de la fréquence d'utilisation des idées des élèves par le maître. Dans tous les cas, sauf un, l'observateur B codifie plus de compor-tements dans la troisième catégorie. D'après l'observateur A, c'est dans les classes R que la fréquence d'unités de la troisième catégorie est la plus élevée alors que, au contraire, pour l'observateur B,

(28)

TABLEAU VI

Pourcentage d'unités accordées à la quatrième catégorie

Classes Codeur A Codeur B A et B

R309 3.02 3.08 3.05 R302 8.53 11.68 10.10 R209 4.74 2.71 3.72 Moyenne 5.43% 5.82% 5.62% S203 9.80 12.67 11.23 S210 0.63 0.40 0.51 S110 0.76 0.80 0.78 Moyenne 3.73% 4.62% 4.17%

Les moyennes d'unités relatives aux questions posées par le professeur sont assez semblables pour les deux observateurs. Il est à noter cependant que d'après les deux observateurs,le professeur des classes R consacre plus de temps aux questions. Pour la majorité des classes observé es», l'observât eur B note plus d'unités de cette quatrième catégorie.

(29)

TABLEAU VII

Pourcentage d'unités accordées à la cinquième catégorie

Classes Codeur A Codeur B A et B

R309 64.31 52.47 58.39 R302 20.44 20.87 20.65 R209 52é85 41.76 47.00 Moyenne 45.86% 38.37% 42.01% S203 56.76 40.80 48.78 S210 84.00 79.85 81.92 S110 62.52 35.53 49.01 Moyenne 67.76% 52.06% 59.97%

Remarqupns ici que des deux observateurs, c'est l'observateur A qui a noté le plus de comportements rattachés à cette catégorie» Le maître des cours R semblerait faire plus d'exposés que le maître des autres classes; ceci est confirmé par les deux observateurs» Le pourcentage des unités observées dans cette cinquième catégorie est le plus élevé de tous»

(30)

TABLEAU VIII

Pourcentage d'unités accordées à la sixième catégorie

Classes Codeur A Codeur B A et B

R309 4.43 2.79 3.61 R302 8.38 2.18 5.28 R209 3.80 3.45 3.62 Moyenne 5.53% 2.81% 4.17% S203 2.58 4.08 3.33 S210 2.78 2.60 2.69 S110 1.01 0.48 0.74 Moyenne 2.12% 2.39% 2.26%

Dans tous les cas, sauf un, l'observateur A note plus d'unités se rapportant aux directives données» Les deux observateurs notent que le temps utilisé par le professeur des groupes R dépasse celui utilisé par le professeur des groupes S. Le pourcentage des unités

accordées à la sixième catégorie est sensiblement le même que celui de la quatrième»

(31)

TABLEAU IX

Pourcentage d'unités accordées à la septième catégorie

Classes Codeur A Codeur B A et B

R309 0.20 0.21 0.20 R302 3.88 4.36 4.12 R209 0.23 0.49 0.36 Moyenne 1.43% 1.69% 1.56% S203 0.00 0.00 0.00 S210 0.12 0.26 0.19 S110 1.78 0.96 1.37 Moyenne 0.63% 0.41% 0.52%

L'observateur B note plus de comportements faisant état des critiques émises par le professeur. Les deux observateurs sont

d'accord pour reconnaître que le professeur des groupes R utilise plus fréquemment la critique. Les pourcentages pour la septième catégorie sont très faibles et peuvent être assimilés sur ce point à ceux des catégories 1 et 2.

(32)

TABLEAU X

Pourcentage d'unités accordées à la huitième catégorie

Classes Codeur A Codeur B A et B

R309 0.00 0.14 0.07 R302 . 4.85 5.98 5.41 R209 0.45 0.98 0.71 Moyenne 1.76% 2.36% 2.06% S203 7.74 13.36 10,55 S210 0.12 0.13 0.12 S110 0.12 0.64 0.38 Moyenne 2.66% 4.71% 3.68%

Encore ici l'observateur B note plus de comportements que l'observateur A. Un certain accord semble apparaître du fait que

toutes les fois que l'observateur A note plus d'unités de comportements, l'observateur B le fait également; la proportion d'unités varie tou-tefois avec les observateurs. Le pourcentage d'unités dans la

(33)

TABLEAU XI

Pourcentage d'unités accordées à la neuvième catégorie

Classes Codeur A Codeur B A et B

R309 6.65 13.76 10.20 R302 26.03 27.15 26.59 R209 - 10.38 26.67 18.52 Moyenne 14.35% 22.52% 18.43% S203 10.58 7.19 8.88 S210 2.66 3.73 3.19 S110 24.52 27.01 25.76 Moyenne 12.58% 12.64% 12.61%

L'observateur B réussit à codifier un plus grand nombre de comportements se rapportant à l'intervention spontanée des étudiants. L'accord n'est que rarement fait. Les deux observateurs notent

toutefois que c'est dans les groupes R que les étudiants prennent plus fréquemment d'initiative de parler. Le pourcentage pour cette catégorie vient après celui de la cinquième catégorie.

(34)

TABLEAU XII

Pourcentage d'unités accordées à la dixième catégorie

Classes Codeur A Codeur B A et B

R309 18.75 19.14 18.94 R302 13.17 18.24 15.75 R209 18.74

16.

17.35 Moyenne 16.88% 17.79% 17.30% S203 9.52 S210 7.35 S110 6.35 7.19 8.35 8.06 7.75 9.99 8.17 Moyenne 7.74% 8.41% 8.09%

Ici la marge de différence entre les observations paraît moins évidente. L'observateur B note plus fréquemment des secondes de silence et de confusion; par contre, dans deux groupes c'est l'obser-vateur B qui code plus d'unités. Le pourcentage d'unités observées dans la dixième catégorie est presque équivalent à celui de la neuvième catégorie. Notons que les deux codeurs observent qu'il y a environ deux fois plus de silence dans les groupes R.

(35)

TABLEAU XIII

Différence entre les jugements des deux observateurs

Catégories Codeur A Codeur B

+ +

+

S

­ + + ­ ­ 1

+ -

z t

­ o

î î

il i

Î

i

Î

ii

6 I i : :

+ ­ ­ +

" S î . ■

. ='= i î

: i ï î

=

Ï

• î s ■

Légende» Lorsque le signe (+) est placé sous la colonne codeur A et que le signe (­) est placé en même temps sous la colonne codeur B ceci indique que le premier codeur a noté, pour une même catégorie, un plus grand nombre d'unités alors que le deuxième codeur en a noté moins» Le tableau fait voir quelles catégories privilégie l'un ou l'autre codeur pour l'ensemble des six leçons»

(36)

En regroupant dans le tableau qui précède les données des autres tableaux, il est possible de mieux voir sur quels points l'un ou

l'autre des codeurs l'emporte lorsqu'il classifie un comportement à l'intérieur des dix catégories. Les signes positifs indiquent qu'un codeur a enregistré un pourcentage supérieur d'unités pour une leçon donnée tandis que le signe négatif indique que l'autre codeur a enregistré moins d'unités pour la même leçon.

Le codeur A a manifestement enregistré plus de comportements verbaux dans les catégories 1, 5, 6 alors que l'observateur B en a enregistré plus dans les catégories 2, 3, 7, 8, 9. Il n'est pas actuellement possible d'analyser dans quelle mesure ces différences peuvent être significatives. Les coefficients d'accord allant de 0»15 à 0.65 dans la présente étude peuvent laisser supposer que seuls les deux codeurs sont en cause; dans le chapitre suivant nous verrons comment le système.autant que les codeurs,peut être mis en question.

(37)

Analyse et interprétation des difficultés

Une mesure du comportement peut être considérée fidèle et sûre en autant que les observateurs ont été capables de s'entendre sur les événements qui se présentent dans une situation donnée; Medley et Mitzel (1963) soulignent cet aspect mais n'énumèrent pas toutes les causes pouvant être à l'origine de ce manque d'entente entre codeurs. Les explications qui suivent ont été formulées à partir de l'essai que nous avons fait du système d'analyse d'interaction; comme les causes d'erreur peuvent être attribuées soit aux codeurs, soit au système lui-même, nous aborderons ces deux aspects du problème et nous nous efforcerons de faire voir comment ils peuvent être reliés l'un à l'autre.

A. Variables à mesurer

Delgado et Delgado (1962) considèrent qu'un critère important pour un bon système de catégories est la clarté et la simplicité dans la description des éléments devant être codifiés par plusieurs obser-vateurs. Il se pose un problème au sujet des catégories présentées

(38)

dans les deux manuels utilisés pour l'entraînement. Dans Interaction analysis in the classroom,écrit par Flanders, il y a très peu de détails sur la façon de faire la distinction entre chacune des catégories.

Face à des cas difficiles, Flanders (1966) va même jusqu'à déclarer que la durée de l'entraînement des observateurs importe peu puisque des maîtres créateurs présenteront toujours des comportements causant des nouveaux problèmes de catégorisation. Par contre dans The role of the teacher in the classroom. Amidon et Flanders donnent la façon de procéder pour distinguer entre chacune des catégories. En recherche, pour rester en conformité avec la méthode de l'auteur, il serait

préférable de s'en tenir seulement aux catégories décrites par Flanders lui-même puisque dans la deuxième publication on y lit ce qui suit:

The Flanders system of interaction analysis was originally used as a research tool and continues to serve this function. As such, it is employed by a trained observer in order to collect reliable data regarding classroom behavior as a part of a research project.

As it is described in this manual, the system is meant to be used as an in service training device for teachers. (Amidon, Flanders, 1967, p. 15)

Cette mise au point soulève quelques problèmes quant au choix du matériel à utiliser pour l'entraînement au codage. Existe-t-il un ensemble d'instructions spécialement préparées en vue de la recherche? La citation donnée ci-dessus le laisse supposer; si tel est le cas,

il deviendrait pratiquement indispensable de bien établir quels ouvrages et articles ont été écrits spécifiquement pour fins de recherche. Cette distinction ne semble pas avoir été clairement établie par Flanders. Lors de notre entraînement, nous avons utilisé indifféremment l'un ou l'autre des manuels mentionnés. Il semble qu'il aurait été préférable de s'en tenir uniquement au manuel Interaction analysis in the classroom.

(39)

Dans cet ouvrage la description des catégories est simple mais peu

claire; il nous aurait fallu déterminer nous­mêmes, comme observateurs, ce qui doit entrer dans l'une ou l'autre catégorie. L'exemple suivant fera voir qu'il devient pratiquement impossible de procéder sans règles. La catégorie 3 est décrite de la façon suivante: le professeur accepte, clarifie ou emploie les idées des élèves; lorsque le professeur contribue davantage par ses propres idées, il faut passer à la catégorie 5»

A partir de quels critères externes l'observateur doit­il fonder sa décision de passer de la catégorie 3 à la catégorie 5? Aucune instruc­ tion précise n'est donnée dans un cas comme celui­là. C'est à l'obser­ ■ vateur qu'il incomberait de juger si un comportement doit entrer dans l'une ou l'autre des catégories.

Le recours aux jugements et à l'interprétation par l'observateur semble un élément indispensable dans le système de Flanders; une règle fondamentale (ground rule) est même formulée pour inviter l'observateur à se fier à ses impressions. D'après Flanders (1967) c'est l'obser­ vateur qui est le mieux placé pour juger si un maître, d'une façon générale, facilite ou restreint la liberté d'action des élèves; l'ob­ servateur doit utiliser avec prudence les catégories indirectes s'il a l'impression que le maître est restrictif; si l'observateur a l'impres­ sion que le comportement du moment (pattern at the moment) augmente

la liberté d'action, il doit éviter l'utilisation des catégories directes; il doit demeurer attentif à tout changement brusque dans les modes de comportement en surveillant la situation sociale totale de la classe»

Tout en reconnaissant que cette règle puisse être une invitation à une observation biaisée, Flanders la justifie par ce qu'il nomme la théorie de "l'observateur biaisé qui n'est pas biaisé" (unbiased, biased

(40)

observer). En effet, l'observateur serait biaisé parce qu'il codifie en fonction de l'impression générale qu'il a du professeur et de la classe; il ne serait pas biaisé parce qu'il demeure ouvert à tout changement évident qui pourrait se produire en classe. La théorie de "l'observateur biaisé qui n'est pas biaisé" apparaît plutôt contestable en recherche alors qu'il faut chercher effectivement à éviter toute source d'erreur pouvant provenir de l'observateur lui-même. Borg met en garde tout observateur contre ce type d'erreur:

Still an error frequently encountered is the so-called "halo effect". This is the tendency for the observer to form an early impression of the person being observed and to permit this impression to influence his ratings on all

behaviors involving the given individual. For example, if the observer forms an initially favorable impression of the person being

observed, he will tend to rate the individual leniently in subsequent performance areas. An initially infavorable impression can lead to the opposite effect. "Halo effect" is most serious when the observation requires the evaluation of abstract qualities rather than specific behaviors. (Borg, 1963, p. 241)

Nous ne voyons pas comment il serait possible d'obtenir de forts coefficients de concordance entre des observateurs si le "halo effect" est accepté comme tel et est même reconnu comme

inhérent à l'observation. La règle fondamentale dictée par Flanders conduit à un type d'erreur qui annihile finalement toute garantie de fidélité. Il n'est pas surprenant de voir que Flanders (1968) en vienne lui-même à admettre que l'analyse d'interaction n'est pas exempte de biais et d'erreur et que probablement environ une classi-fication sur dix est incorrecte même avec un observateur d'expérience. Faire appel au jugement de l'observateur laisse beaucoup de prise à la subjectivité et il y a de fortes chances qu'en étant obligé de

(41)

procéder ainsi, il soit difficile d'obtenir un coefficient de concordance élevé chez les observateurs. Une façon de prévenir et même d'aplanir cette difficulté serait de bien déterminer ce qui fait partie de l'une ou l'autre catégorie avant-même de commencer l'observation; lorsque le codeur est en action, il n'est plus temps pour lui de prendre de telles décisions. Notre essai d'utilisation du système de Flanders fait voir que les deux codeurs ont rencontré beaucoup de difficultés à porter un "jugement" identique toutes les fois qu'une catégorie présente certaines analogies avec une autre. Cette constatation peut surtout être faite au sujet des catégories 1 et 3, 1 et 2, 3 et 5, 6 et 7. Lorsque le codeur A, par exemple, accorde plus d 'unités à la catégorie 6, le codeur B en accorde plus à la catégorie 7. (cf. tableau XIII). Deux exemples illustreront le type de confusion auquel nous faisons allusion. Lorsque le maître reprend une idée venant d'un élève, il faut utiliser la

catégorie 3, mais si le maître développe cette idée faut-il utiliser la catégorie 3 ou la catégorie 5? L'une ou l'autre pourrait être

acceptable puisque le maître développe une idée de l'élève (catégorie 3) en même temps qu'il exprime son opinion (catégorie 5 ) . L'autre exemple est le suivant: le maître dit à un élève: "Très bien Jean, tu as

suggéré line solution qui est excellente!" La catégorie 3 (reprise de l'idée d'un élève) convient-elle mieux que la catégorie 2

(encoura-gement)? Il semble que la catégorie 2 soit celle qu'il faille choisir; par contre, le maître a fait référence à une idée venant d'un élève. De nombreux cas de ce genre se sont présentés et ceci peut expliquer pourquoi les résultats de notre étude ne corroborent pas l'affirmation

de Amidon et Flanders (1967) voulant que toutes les catégories soient mutuellement exclusives.

(42)

Si les codeurs doivent fréquemment faire appel à leur jugement et à leurs impressions lorsqu'ils ont à opter pour le choix d'une catégorie, il en résulte presque inévitablement un codage plus subjectif. Même si Amidon et Flanders (1967) soutiennent que l'ob-servateur ne doit pas trop se préoccuper de ses propres biais il est indispensable en recherche de tenir compte de ce facteur.

En examinant le tableau XIII nous pouvons remarquer que l'ob-servateur B inscrit plus souvent des comportements se rapportant aux élèves (catégories 8, 9) alors que l'observateur A fait plus porter ses observations du côté du professeur (catégories 5, 6 ) .

Confor-mément aux instructions de l'auteur du système, les deux codeurs n'ont pas porté une attention spéciale à leur propre biais alors qu'il aurait été préférable de surveiller attentivement tout ce qui en eux peut

être source de distorsion dans leur perception. Dans leur ouvrage sur les méthodes de recherche, Selltiz et al. signalent ce problème et mettent en garde l'éventuel chercheur de la façon suivante:

One of the greatest sources of unreliability is the constant error introduced by the observer because of distortion of his perceptions by his own needs or values. An observer who sharply disapproves of certain leadership practices, for example, will have difficulty in preventing a bias; he may code more of the leader's behavior as falling in the

categories he disapproves of than would another observer who feels less strongly on the matter. Adequate training and practice can overcome this in most persons, though not in all. (Selltiz et al., 1959, p. 231)

(43)

B. Unités de mesure

Une autre difficulté majeure est soulevée par le fait que les dix catégories du système de Flanders semblent d'abord avoir été

construites pour tenir compte de toutes les interactions verbales qui peuvent survenir en classe. Flanders (1966) a écrit qu'un système de catégories devrait être construit de façon à tenir compte de tous les événements; c'est en ce sens que les catégories doivent être

totalement inclusives. Un système de catégories qui ne remplirait pas ce rôle serait sélectif et les données obtenues ne seraient pas néces-sairement représentatives.

On peut se demander si une telle préoccupation est nécessaire; il semblerait plutôt préférable selon Weick (1968) de laisser de côté les informations qui ne sont pas utiles puisqu'il n'y aurait aucune raison de supposer que toutes les informations pouvant être recueillies sont d'égale importance. En éliminant, la notation de certains événements il y a plus de chances d'obtenir des données fidèles; il faut reconnaître que la complexité d'une classe est telle qu'une restriction sur les

unités à observer est préférable à la tentative de tout observer (Medley et Mitzel, 1963). Notons que le fait de tenir compte du plus grand

nombre d'événements possible semble aller facilement de pair avec le manque de spécificité des catégories et la liberté de juger laissée à l'observateur; l'utilisation de catégories peu spécifiques permet à l'observateur de décider d'inclure des événements qui n'auraient pas été initialement prévus et qui se présenteraient forfuitement.

Il faut retenir cependant que Flanders limite l'observation au comportement verbal. En elle-même, cette restriction pourrait réduire

(44)

la possibilité d'erreur et diminuer le nombre de comportements à observer; cela ne se produit pas tout-à-fait puisque Flanders exige la présence du codeur en classe pour avoir plus d'information sur le comportement non verbal. Il ne serait donc pas totalement juste de dire que l'observateur tient compte exclusivement du comportement verbal si sa présence est jugée indispensable pour percevoir le

climat de la classe. . Notons que Flanders (1967) admet et n'admet pas en même temps la possibilité de codifier le comportement non verbal. Il reconnaît la nécessité de la présence de l'observateur comme unité de contexte^pour saisir le climat de la classe,mais soutient que le comportement non verbal n'est pas noté parce qu'il ne peut pas être observé avec autant de fidélité que le comportement verbal.

Certaines recherches (Galloway, 1968; Evans, 1969) ont été faites à l'aide de catégories portant sur le comportement non verbal et les chercheurs ont trouvé possible d'atteindre un coefficient élevé de concordance entre les observateurs; il est à remarquer toutefois que les catégories utilisées dans ces recherches portaient sur des gestes, des expressions faciales, des mouvements du corps beaucoup plus

clairement identifiés que la notion de "climat social". Il est probable que les catégories 1, 2, et 7 du système de Flanders com-portent beaucoup d'éléments non verbaux puisqu'elles ont spécialement trait à l'affectivité et que le non verbal joue un rôle important dans ce domaine; si tel est le cas, nous aurions là une explication à la difficulté d'obtenir un coefficient acceptable de concordance entre un codeur qui a vu le comportement en classe et un autre qui ne les a

(45)

Le fait d'avoir à partager les comportements en unités arbitraires de trois secondes reliées à des catégories que l'observateur choisit lui-même pose un problème sérieux de fidélité. Dans l'expérimentation faite, il apparaît clairement que les deux codeurs n'ont pas réussi à garder un rythme égal lors du codage (Tableau II). Cette disparité pourrait être attribuable au fait qu'il est extrêmement difficile de noter une unité en trois secondes tout en ayant à porter un jugement. L'étude de la répartition des catégories selon les deux codeurs peut être assez révélatrice sur cette question. La concentration des unités notées par le codeur A se situe à la catégorie 5 alors que les unités du codeur B sont plus souvent réparties dans des catégories 2, 3, 7. Cette distribution peut être expliquée de la façon suivante: pour arriver à classifier adéquatement un comportement dans les catégories 2, 3, 7 il faut fournir un effort de réflexion qui n'est pas exigé

dans le cas de la catégorie 5. Il semble bien que tel est le phénomène qui s'est produit lors du codage. En effet, l'observateur A a réussi à garder un rythme moyen de vingt observations par minute alors que l'observateur B n'a pas atteint cette performance (tableau II). Ce serait en évitant les catégories plus difficiles que le codeur A aurait été fidèle à la stabilité dans la fréquence des unités à noter tandis que le codeur B aurait négligé cette dimension pour s'efforcer de donner plus d'attention aux catégories exigeant plus de précision et de discer-nement »

La disparité considérable entre le nombre d'unités notées par les deux codeurs nous amène à discuter du coefficient de Scott» Cette formule mise à l'essai lors de l'entraînement à l'observation a été

(46)

fait récemment et nous avons pu le constater également» Le coefficient tel que calculé par Flanders est basé sur la comparaison du pourcentage accordé à chacune des catégories par les deux observateurs et non sur l'entente des deux observateurs pour une seule et même unité. Ainsi, lorsque le codeur A et le codeur B jugent tous deux que vingt pourcent des comportements devraient se situer dans la catégorie 10, rien

n'assure que ces pourcentages portent réellement sur les mêmes unités; le vingt pourcent noté par le codeur A peut l'avoir été au cours des dix premières minutes du cours alors que celui du codeur B peut avoir été noté durant les dix dernières minutes. Cette différence, fortement exagérée dans notre exemple, n'en demeure pas moins un problème sérieux et fait qu'en définitive un coefficient de concordance est calculé à partir de deux échantillons au lieu d'un seul. La difficulté relative à l'utilisation du coefficient de Scott provient surtout du fait qu'il est pratiquement impossible d'identifier et de contrôler l'accord des deux observateurs pour chacune des unités notées à toutes les trois secondes. Il est à préciser que la codification d'une unité à toutes les trois secondes n'aurait pas à être strictement suivie d'après Flanders (I964) qui écrit qu'un observateur peut accélérer son rythme lorsque les échanges verbaux sont plus rapides et facilement codables. Au cours d'une interaction plus longue le codeur modère et reprend

son rythme de près d'une unité d'observation à toutes les trois secondes. Cette règle qui laisse place à la subjectivité ne facilite pas

l'ob-tention d'un nombre égal d'unités observées pour deux observateurs.

Notons qu'avec le système de Flanders les fréquences pour chacune des catégories présentent un écart considérable; les unités de compor-tement sont plus nombreuses pour les catégories 5, 9, 10; viennent

(47)

ensuite les catégories 4, 3, 8, 6; les catégories 7, 1, 2 sont finalement les moins utilisées. Cette constatation que nous avons faite va dans le sens des observations de Flanders (1966) qui

précisément affirme avoir choisi la méthode de Scott parce qu'elle n'est pas affectée par les fréquences faibles. Plus loin, Flanders

(1966) souligne que les erreurs de codage diminuent et que le coef-ficient de concordance est plus élevé lorsque le nombre d'unités observées augmente; il suggère alors d'observer au moins pendant vingt minutes afin d'obtenir un coefficient acceptable. Il est à

se demander si on ne laisse tout simplement pas jouer le hasard dans ce cas; en effet, pour une période de plus de quarante minutes, il y aurait possibilité, avec des observateurs "biaises" et bien entraînés, qu'un certain concensus s'établisse sur la proportion d'unités à

placer dans les catégories qui augmentent ou diminuent l'action des élèves. Remarquons que Flanders lui-même reconnaît et admet l'arbi-traire de l'utilisation qu'il fait du coefficient de Scott, En collaboration avec Amidon, il a écrit:

Use of the Scott coefficient affords an approximation of observer agreement, although it does not reflect the extent to which two observers agree on the sequence of categories they have recorded. What the Scott coefficient does give is a general idea of the extent to which two observers agree on the amount of particular category a teacher employs. For training purposes, of course, the observers need to have as much information as possible about their progress. Higher Scott coefficients, after increased practice, indicate progress, No method is yet available for dealing with the problem of the reliability of sequential ratings. (Amidon et Flanders, 1967, p. 30)

Etant donné que le coefficient de Scott tel que décrit par

(48)

deux observateurs, nous avons essayé de trouver une solution valable. Pour en arriver à calculer le degré d'accord entre deux observateurs, nous avons utilisé une façon de procéder suggérée par le professeur

Gérard Scallon de la faculté des Sciences de l'Education de l'Université Laval. Le problème étant de bloquer les unités afin de nous assurer que deux observateurs se prononcent bien sur les mêmes comportements verbaux, l'utilisation d'enregistrements s'est avérée indispensable. Une période de cinq minutes d'enseignement contenant vraisemblablement la majorité des catégories du système de Flanders a été prélevée pour codage. Cette opération a été faite simultanément par deux observateurs avec interruption de l'audition de l'enregistrement à toutes les trois secondes. Ce procédé a finalement permis aux deux codeurs de coder cent unités bien délimitées. la formule utilisée pour mesurer le degré d'accord étant nombre d'accords . il a été possible d'obtenir

nombre d'observations

0.84 d'accord lors d'un essai. Cette courte expérience, (voir appen-dice F) sans remettre en cause tout ce qui a été précédemment analysé, permet de présumer qu'il serait possible.,dans une autre recherche^ de mesurer plus objectivement le degré de concordance entre les codeurs;

ceci ne pourrait être fait qu'en laboratoire seulement et non au cours de l'observation directe car il est nécessaire de bien détacher et de bloquer les unités à coder.

(49)

C. Interprétation des événements codés

Nous avons déjà signalé que Flanders voulait construire un sys-tème qui tienne compte du plus grand nombre possible d'événements pouvant survenir en classe; même avec cette préoccupation l'auteur du

système a toutefois limité les observations aux dimensions

psycho-affectives de l'acte d'enseigner apparentées au construit "autoritaire-démocratique". Il est à se demander si les informations de ce genre sont en mesure de fournir des informations valables sur l'enseignement. Anderson (1959) en est venu à la conclusion que ce construit, en autant que l'éducation est concernée, cesse d'être utile comme guide pour la recherche. Voici ce que Anderson pouvait écrire il y a maintenant dix ans passés:

There are no adequate notions of how the

authoritarian-democratic construct is related to learning. With the exception of a few

clinically-derived, ad hoc hypotheses emanating largely from the Rogerian school of psychotherapy and The Authoritarian Personality, the research on leadership styles seems to flow more from ethical generalization than from scientific hypothesis. Much of the research on teaching methods in the last twenty years seemed bent on discovering whether "The meek shall inherit the earth," or whether, on the other hand, "Nice guys lose." (Anderson, 1959, p. 211)

Dans un inventaire des données scientifiques sur le comportement humain, Berelson et Steiner (1964) constatent que l'effet du style

d'enseignement sur les relations maître-élèves ou sur le nombre d'idées acquises par les élèves (c'est-à-dire une forme d'efficacité de l'en-seignement) est incertain. Les auteurs ont relevé un grand nombre de recherches sur l'effet du "climat de la classe" ou sur le style d'en-seignement en relation avec des aspects comme l'approche maître

(50)

auto-ritaire ou démocratique, dominateur ou intégrateur; aucune conclusion claire n'a pu être tirée de toutes ces recherches. Plus récemment, Travers (1969) fait état de recherches de Coats (1966) confirmant l'opinion que le système d'analyse d'interaction porte sur des

variables n'ayant pas de relations cause-effet avec le rendement des élèves.

Que faut-il penser maintenant du tableau (appendice C) que Flanders a mis au point pour permettre à l'observateur d'avoir une vue d'ensemgle de l'interaction maître-élèves? Il semble bien que ce tableau, si ingénieux soit-il, peut présenter une image faussée de la réalité. En effet, les unités obtenues dans chacune des catégories sont additionnées comme si toutes les unités avaient exactement la

même valeur alors qu'il n'en est pas nécessairement ainsi. Par exemple, l'intervention d'un élève suivie d'un encouragement du maître n'a pas nécessairement la même signification qu'une autre intervention de cet élève suivie d'un autre encouragement du maître à un autre moment. Borgotta (1962), Ausubel (1967), Allon (1969), Mitchell (1969) ont

tous récemment insisté sur cet aspect de la mesure du comportement en psychologie. Les commentaires d'Allon méritent particulièrement d'être cités:

The classification of topographically similar behaviors seems to be the crux of the matter when speaking of the limitations inherent in the design of classroom interaction analysis systems. It is virtually impossible to extricate the variance within any one categorical classi-fication. This practice, of grouping together similar behaviors for recording and analysis, altogether confounds the explanation of the conditions which maintain any one behavioral response. It obscures the use of rates of

behavioral responses as the most basic dependent measure and it precludes any systematic explanation

(51)

Il est intéressant de rappeler qu'il y a un siècle un chercheur

formulait des considérations semblables sur la mesure en physiologie. Claude Bernard (1865) a bien fait voir que ce n'est pas en recueillant un grand nombre d'observations particulières sur une maladie et en faisant ensuite une description moyenne de tous les symptômes observés dans les cas particuliers qu'un médecin en arriverait à donner une description adéquate d'une maladie; ce médecin aurait simplement donné une description qui ne se trouvera jamais dans la nature. De même en enseignement/ ce ne serait pas la moyenne des phénomènes plus ou moins semblables pris au même endroit mais à des moments différents qui pourrait rendre compte d'une réalité aussi complexe que l'acte

d'en-seigner. La matrice d'observation et d'analyse d'interaction, cons-truite pour donner une image globale d'une période d'enseignement d'au moins vingt minutes, ne fournit précisément que des moyennes de ce

type. Il y a lieu de se demander s'il ne faudrait pas repousser de telles moyennes car selon l'expression de Claude Bernard elles con-fondent en voulant réunir et faussent en voulant simplifier. Les moyennes ne seraient applicables qu'à la réduction de données numé-riques variant très peu et se rapportant à des cas parfaitement déterminés et absolument simples. La solution qu'a trouvée Claude Bernard pour l'étude des phénomènes en physiologie pourrait être celle qui donnerait le plus de valeur aux recherches en éducation. Le

célèbre biologiste français indique la voie à suivre lorsqu'il écrit: En physiologie, il ne faut jamais donner des

descriptions moyennes d'expériences, parce que les vrais rapports des phénomènes disparaissent dans cette moyenne; quand on a affaire à des expériences complexes et variables, ilfaut en étudier les diverses circonstances et ensuite donner l'expérience la plus parfaite comme type, mais qui représentera toujours un fait vrai. (Bernard, 1965, p. 192)

(52)

Si les moyennes obtenues pour chacune des catégories du système de Flanders ne servent finalement qu'à donner une représentation dont la validité peut être contestée, il est à se demander s'il n'y aurait pas avantage à faire porter la recherche sur l'observation en profon-deur de phénomènes restreints comme le suggérait déjà Claude Bernard en physiologie. C'est d'ailleurs la conclusion à laquelle arrive Gage lorsqu'il écrit:

If the global criterion approach had proved to be sterile, what was the alternative? The answer was to take the same path that more mature sciences had already followed: if variables at one level of phenomena do not exhibit lawfulness, break them down. Chemistry, physics, and biology had in a sense, made progress through making finer and finer analyses of the phenomena and events they dealt with. Perhaps research on teaching would reach firm ground if it followed the same route.

(Gage, 1968, p. 120)

Ce qui précède est de nature à mettre en question des données obtenues par l'utilisation d'un système comme celui de Flanders. Que signifie avoir un rapport I/D> 1 ai les données qui ont servi à le mesurer proviennent d'unités de comportements ayant une signi-fication différente selon qu'elles sont prises individuellement ou collectivement? Il est possible que la personne qui a vraiment un comportement d'influence indirecte ne soit pas nécessairement celle qui a un I/D>1 mais plutôt celle qui est capable d'intervenir indirectement au bon moment.

(53)

En entreprenant cette étude nous n'avions pas en vue la défense ou la démolition du système d'analyse d'interaction en classe. Il s'agissait d'abord de vérifier s'il est possible

d'arriver à coder avec fidélité le comportement verbal d'une classe en utilisant les catégories développées par N.A. Flanders.

Une expérimentation faite en laboratoire et limitée à six enregistrements de cours nous a fait voir qu'il était très diffi-cile pour deux codeurs d'atteindre un coefficient de concordance acceptable. L'analyse des données obtenues lors du codage de six périodes d'enseignement a permis d'identifier quelques unes des causes qui expliqueraient pourquoi il peut être difficile pour deux codeurs de s'entendre sur le choix de catégories du système d'analyse d'interaction.

En essayant d'isoler les causes d'erreur pouvant provenir des observateurs eux-mêmes nous avons pu retenir: un entraînement peut-être insuffisant ou inadéquat, la possibilité d'une traduction française ne collant pas suffisamment aux catégories originales,

des biais personnels non contrôlés et vraisemblablement l'utilisation exclusive d'enregistrements alors que l'auteur du système exige la présence en classe des codeurs.

(54)

Après avoir reconnu que les difficultés de codage pouvaient avoir leur origine chez les observateurs eux-mêmes^nous nous sommes également demandé si certaines causes d'erreurs ne pouvaient pas être inhérentes aux catégories et au système lui-même. L'examen attentif des directives données par Flanders dans ses deux manuels écrits pour l'entraînement des observateurs a permis de constater certaines imprécisions pouvant compromettre l'objectivité et la

fidélité du système d'analyse d'interaction. Les principales causes d'erreurs venant du système lui-même ont été identifiées ainsi:

catégories peu spécifiques, utilisation du jugement personnel comme critère de décision pour le choix des catégories lors du codage, préoccupation de tenir compte du plus grand nombre possible de com-portements verbaux, utilisation inadéquate du coefficient de Scott, compilation qui isole les unités de comportement de leur contexte.

Les points qui viennent d'être soulevés laissent voir qu'en regard de la méthode scientifique, le système de Flanders doit être utilisé avec circonspection. Il faut bien souligner cependant que

c'est également la conviction de Flanders qui a écrit: "Interaction analysis ,is_far from a precision instrument. As a research tool, it should be used cautiously" (1965, p. 30).

Même si l'auteur du système a reconnu explicitement que son système d'analyse était loin d'être un instrument de précision, il n'en demeure pas moins qu'un très grand nombre de chercheurs en éducation l'ont utilisé aux Etats-Unis (Amidon et Hough, 1967). Actuellement, des chercheurs (Campbell et Barnes, 1969) subdivisent les catégories du système d'analyse d'interaction et tentent d'amé-liorer les techniques de compilation et d'analyse par l'utilisation

Figure

Tableau de Flanders pour illustrer  le calcul du coefficient de Scott • »  Données de l'expérimentation
TABLEAU II
TABLEAU III
TABLEAU IV
+7

Références

Documents relatifs

Calculer la trasform´ ee de Fourier de la gaussienne exp(−αx 2 ) Indication : On pourra d´ eriver sous les signe int´ egral puis faire une int´ egration par parties..

On dit qu'un nombre réel positif est octogonal s'il est la somme de nombres réels positifs dont les écritures décimales ne comportent que le chiffre 8. Q 3 Écrire 1

In conformity with Paragraph 27 of the Operational Directives, the evaluation of nominations for inscription on the List of Intangible Cultural Heritage in Need of

Following airborne emission, these particles deposit onto the earth’s surface where soil and vegetation magnetic records readily reveal historical and recent pollution

Enfin, le silence entourant la violence entre partenaires masculins au sein des communautés gaies indique qu’il s’agit d’un sujet sensible, ce qui contribue à inhiber

(i) la condition sur l’existence d’une d´ ecomposition de la d´ efinition est vraie ; (ii) tout ´ el´ ement irr´ eductible est premier.. Montrer que R[x] est principal si

Universit´ e Paris 7 – Denis Diderot Ann´ ee 2008-09 M2 Math´ ematiques fondamentales Introduction aux formes automorphes3. Feuille de r´

Par exemple, un tube à piston, rempli d'eau, sur lequel on appuie très lente- ment, donc avec ~« l, fait travailler la compressibilité du fluide, qui doit évidemment être prise