• Aucun résultat trouvé

ARTheque - STEF - ENS Cachan | Sur quelles connaissances s'appuyer pour introduire les statistiques descriptives : comparaison de séries de données par des enfants et des adultes

N/A
N/A
Protected

Academic year: 2021

Partager "ARTheque - STEF - ENS Cachan | Sur quelles connaissances s'appuyer pour introduire les statistiques descriptives : comparaison de séries de données par des enfants et des adultes"

Copied!
6
0
0

Texte intégral

(1)

SUR QUELLES CONNAISSANCES S'APPUYER

POUR INTRODUIRE LES STATISTIQUES

DESCRIPTIVES:

COMPARAISON DE SERIES DE DONNEES PAR

DES ENFANTS ET DES ADULTES

Denis CORROYER, Laboratoire de Psychologie du

Développement et de l'Education de l'Enfant·

Université de Paris V et CNRS

Jacques MATHIEU, Laboratoire de Psychologie et

Informatique· Université de Rouen

MOTS CLEFS PRECURSEURS STATISTIQUES ENFANTS ADOLESCENTS ADULTES

RESUME On ana 1yse 1a démarche "spontanée" de sujets non experts en stati~tiques (cla~ses de 6éme, 2nde et sujets adultes) lors de la comparaison de 2 séries de données dans différenls conlextes (notes scolaires, données biologiques ou données sans signification). L'analyse de 45 entretiens individuels a permis de préciser les aspects des données pris en compte par les sujets, les précurseurs de notions statistiques utilisés et certaines difficullés rencontrées. On discllte de l'influence du contexte "ur la nature des opéralions effecluées sur les données, et de la nécessité de dissocier la difficulté d'assimilalion des notions statistiques de leur complexité

ml:::t.thémutiCiue.

ABSTRACT We study the way subjects (6th grade, lUth grade and adults) compare two sets of data in one among three contexts (scholastic context, agronomical context or without any specified context) before the y had any statistical class. The analysis of 45

individual interviews allowed us 1.0 analyse which characteristics of data are taken into account, which of statistical notions they use and which difficulties they encounter. We discuss the raIe of context on the way subjects analyse data, and the necessity ta distinguish between difficulty to learn statistical notions and mathematical

(2)

d'un nouveau champ conceptuel, quels que nécessite d'avoir une représentation du de leurs connaissances (concepts acquis représentations spontanées) au moment o~

La recherché présent.ée iL~i Ci été menée en préalable à la

constr'lJction d'un logiciel d'appui à ] 'enseignement des premières nuli uns Je sLati sti ques Liescriptives. Elle concerne l'étude de la démarche "spontanée" sujets non experts lof'~ Je la comparaison de

delJX Béries de clorinées.

Aborder l'enseignement soient les moyens utilisés,

fonct.iorlnement des élèves,

dans les champs voisins.

débute eet enseignement.

Il s'agissait è travers cette étude d'analyser la démarche par laquelle un éléve se construit une représentation de séries de données, les pratiques et les connaissances qu'ils mettent en oeuvre, et les précurseurs des premières notions statistiques éventuellement utilisés.

Nous avons fait l'hypothèse que les élèves étaient, avant tout en~eigl1emellt directement ciblé Sllr ces flutions, capables Je mener à bien cel"tairles analyses. En eft'el si l'on considère en particulier la descripliLHl et lu comparaison de 8éries de données, lout élève,

parvenu HU collège fi été confronté au problème de J'analyse de séries

de notes scolaires, â la comparaison de sous-ensembles de notes, â

l'analyse de l'évolution de ses résult.ats ou à Jeur comparaison avec

ceux de ses camarades.

Notre propos est de préciser dans quelle mesure ces précurseurs statistiques peuvent être des points d'appui â un enseignement des premières not,ions statistiques ou, au contraire, constituer des

oilBtacles à cet erlseignement.

~lETHODE :

Population 45 sujt~l!:) de J niveaux scolaires tSixiemes, Secondes

et adultes) ont été examinés.

Matériel Le matériel présenté comprend 6 items. Chaque item est

cunstitlJé de 2 séries de dix nombres. Ces s~ries sont construites de

telle manière que leur comparaison puisse aboutir â des conclusions diverses selon les aspects des données pris en compte. Ainsi pour l'un de~ ilems on peut conclure à la supériorité d'une série si l'on

c(lnsidéI"e les extrêmes (rniJlimlJm et maximum), ou de l'a\Jtre série si

l'on COmpal"e la ,'aleur modale (valeur dont la fréquence est la plus élevée) ou enfin â leur égalité si l'on considére cette fois les moyennes. D'autres items opposent par exemple dispersion et moyenne (une série a Ilne moyenne plus élevée mais une dispersion plus faible).

Tâche Chaque sujet est confronté aux 6 items. Pour chaque item il doit comparer les deux séries de 10 nombres présentées en vrac sur des cartons manipulaldes (3xo\c1ll). La couleur des cartons différencie

(3)

Contexte A chaque niveau scolaire, les mêmes .nomtlres sont

présent.és, selon les sujets, soit comme les notes deB éJéves de deux cIEu,:ises à un même contrôle de malhémaliques, Boil conllue des hauteurs de plantes soumises à deux engrais différents, soit. Sttns contexte

spécifié.

Consigne En présentant chaque item on demande aux sujets de comparer les deux ensembles de plantes/notes/nombres et de dire tout ce ql,'ils font au fur et à mesure pour les comparer.

r:haque sujet est vu individuellement pendant une heure environ. Durant cette séance on relève la disposition des cartons (séparation

des deux séries, sériation, regroupement des valeurs iderltiqlJes ,

appariement . . . ) et on enregistre les verbalisations en vue de leur analyse ultérieure.

RESULTATS

Disposition des nombres:

On rappelle que les sujets étaient libres de disposer les nombres des deux séries comme ils le souhaitaient. Ces nombres leur étaient présentés en vrac. Considérons seulement ici les dispositions les plus élaborées consistant à placer les cartons sous forme de diagrammes

verticaux ou horizontaux (ceci nécessite de séparer les deux séries.

sérier les valeut·s de chaque série, regrouper les valeul's communes). CetLe disposition est. observée le plus souvent chez les adultes. Toutefois on notera qu'elle est utilisée fréquemment y compris chez les enfants de Sixième, puisque on l'observe dans 3Y cas sur YO (15 sujets x 6 items

=

90).

Analyse des entretiens :

L'analyse des verbalisations a permis de relever les caractéristiques des distributions prises en compte par les sujet.s

JUI'S de J .. de,,"ription el de 1.. comparai.wn de ces distributions

(Extrêmes, Mode, Effectif, Symétrie, Dispersion, Moyenne ... ). !lans ce relevé on ne prenait pss seulement en compte le terme utilisé pour désigner tel aspect des distributions mais le fait que cette

caractéristique ait été mentionnée ou non. BOUS quel que forme ql!e ce

soit.. Ainsi la valeur modale des distributions (valeur la plus fréquente dans une distribution) est une caractéristique fréquemment. relevée alors que le t.erme "Mode" n'a jamais été Iltilisé.

Cett.e analyse des entretiens a conduit en particulier à distinguer deux aspect.s

1/ Une même représentation peut se signifiants.

On prendra j'exemple de la dispersion. avec les t.ermes statistiques de Variance,

présenter sous différents En J'absence de l'am il i ari té Ecarts' la moyenne,

(4)

Ecart-L)'pe, Dispersion les sujets utilisent un (~ertain nOlnbre d'expressions pOlIr mentionner la variabilité des dispersions "Là dedtins c'est plus concentré en moyens chez les roses" (Franck, 6ème). "Celle-là elle e,;t plu,; IInie" (Florence, Lnde). "c'est surtout que la jaune est plus régulière alors que la classe bleue elle est plus éparpillée" (Pascal, Séme) Au delà de la diversité des termes utilisés c'est bien, dans chacun de Ces propos, sinon la même représentation, du moins la référence à la dispersion des distributions. représentations recouvrir des signifiant peut même 2/ Un différentes.

:\. l'invel'se un même terme, "Moyenne" par exemple, peut référer à des notions extrêmement disparates il peut être utilisé pour référer la tendtln(~e cerltrule d'lJne distriblJtion "Ça tourne en moyenne autour de Ce peut être la moyenne arithmétique, c'est à dire le résultat d'un calcul (EXi/N). Il importe de distinguer ces deux aspects car il~ ne S(lnt pas nécessairement coordonnés dans la r'eprésentation de la notion de moyenne chez le sujet qui ut.i lise ce terme. Ceci est appar'lJ à l'ubservatilln de plusieur's élèves de sixième, parfuitement. captiLles de calculer la moyenne d'une des sér'ies, tout en n'étant pas en mesure d'anticiper, même approximativement, ce résult.at. Plusieurs élèves ont ainsi prognost.iqué des moyennes ar'ithmétiques en dehors des extrêmes (minimas et maximas). Dans le contexte scolaire lli "Moyenne" c'est aussi bien entendu la limite fatidique de l'éxamen. C'est souvent la note maximale divisée par 2

(~O/2=IO par exemple), mais selon le cont.exte, ce pourra être une autre valeur dét.eI'minée sur des cri tères extérieurs "1L en ~Iath, en Seconde1 c' es L une note tou t jliS te moyenne pour passe r en 1è re Sl i

(S>·lvie, Seconde), Enfin dans les propos des sujets on relève que le terme "Moyenne" est parfois utilisé pour désigner le Mode de la dist.ribution. "La moyenne de la classe blanche se sit.ue dans les II alors que dans les bleus c'est dans les 10 je veux dire le plus grand nombre d'élèves qui ont la même note" (Marie, Adult.e)

Analyse des distributions et Précurseurs statistiques

Tous igea confondus i l apparaît. t.out. d'abord que de nombreuses caractérist.iques des distributions sont prises en compte, Il s'agit du

~lode, des Extrêmes, de la Dispersion, de la Moyenne. Par contre la Médiane notion relat.ivement simple (valeur qui sépare la distribut.ion ordonnée en deux classes d'effectifs égaux), n'est jamais utilisée. Toutefois une autre procédure - que l'on peut considérer proche de la not.ion de ~Iédiane - apparaît fréquemment pour décrire les distribulions. Elle consist.e à prendre une valeur, arbit.raire ou non, et à comparer pour les deux séries le nombre de valeurs supérieures à

cet.Le limite. "Au dessus de IL il y en a 7 el là i l n'yen a que 5" (Franck, Sixième); "les jaunes ont. beaucoup de notes . . . en dessous de 11 (Sylvie, Sixième). On remarquera que tout en présent.ant des analugies, la ~lédiaJle et ce que nous appellerons Coupure-Fréquence, se

(5)

distingu~nt en ce que la première considère une fréquence à priori

(50% / 50%) et ['eCliel'che la valeur qui permet de répartir ainsI les éléments Jes distributions alors que la seconde considè,'e J'aburd une valeur et. compare la ,'épartit.ion des fréquences ainsi obt.enue.

Analyse des distributions et Niveau Scolaire

Certains descripteurs sont utilisés relativement ~récocement, c'est à dire dès la Sixiéme. Il s'agit du Mode (~/15 sujets), des Ext.rêmes - Minimum et Maximum - (9/15 sujets), de la Coupure-fréquence (8/15 sujet.s), des Effectifs (6/15 sujets). La référence è. la dispersion apparaît. seulement è. partir de la Seconde (respect.ivement

<,

II et. 13 sujets sur les 15 sujets de Sixiéme, Seconde et adultes). Enfin certaines notions ne sont fréquemment utilisées que par les adultes; il s'agit de la Moyenne (l, 4 et Il sujets) et de l'Etendue

(1, 2 et 8 sujets).

Analyse des distributions et Contexte :

On observe que la fréquence d'utilisation de certains indices ( Ex t rêmes , Etendue, Di spe rs i on, ~Ioyenne, Coupu re-Fréquence), va [' ie selon le cont.exte dans lequel sont présentées les données. Cette fréquence est faible en l'absence de contexte spécifié et est la plus forte lorsque les nombres sont présentés dans un cont.exte scolaire. Un contexte familier tend è. favoriser la prise en compte de ces caractéristiques des distributions. En l'absence de contexte ce sont d'autres caractérist.iques différentes qui sont prises en compt.e: les sujets mentionnent alors plus fréquemment le fait que les nombres sont pairs ou impairs, la présence de nombres décimaux, la symétrie des distribut.ions . . .

DISCUSSION

Il apparait. tout d'abord que sous certsines conditions - présentation cont.extuée des données, en part.iculler - les sujet.s

utilisent "spontanement", sinon les notions statist.iques ejle~ mêmes,

du mOIns des précurseurs de ces notions. Pour certain",s (Mode, Effectif, Extrêmes) la tâche de l'enseignement pourrait consister a associer un signifiant normalisé è. une notion déjà construit.e.

On retiendra toutefois le recours à une procédure de comparaison ("Fréquence-Coupure") qui ne figure habituellement pas parmi les

premières notions enseignées et, inversement, l'absence totale de r~CO\jI~S à la Médiane.

Pour d'autres notions o~ des algorithmes de calcul sont en jeu, il semble 4"e le prubléme réside dan>; la coordination d", représentations intuitives (varIabilité des dispersions, tendance centrale) et de

représentations l~sues de la mise en oeuvre d'algorithme8 (variance, moyenne arithmétique).

(6)

D'autre part, i l apparaît une relation entre familiarité du contexte et variété des traits mentionnés lors de l'analyse des données. La première interprétation envisageable c()noer'ne l'aspect

motivat.ionnel: analyser des nombres représentant ùes noteH scolaires peut être pl\JS motivant qll'anaLyser ces mêmes nonlbres présentés comme

des longueurs de plantes et a fortiori s ' i l s sont présentés sans contexte. Sans négliger cet aspect nous avancerons une autre hypothèse: les sujets confrontés è un oontexte signifiant, ne font pas simplement plus de choses avec les données, c'est la lecture de ces données (processus d'analyse, traits perçus) qui est de nature différente selon le contexte. En l'absence de oontexte ils ne sont pas moins prolixes dans leur description mais mettent en avant des caractéristiques différentes. La nature du oontexte guide la lecture des données et par là même des opérations mises en oeuvre pour les traiter. Il nous parait important dans une perspective didactique de ne pas réduire l'influence du contexte à l'aspect motivationnel et de souligner ces aspects d'ordre cognitif.

Autre point important apparu au oours de l'analyse des ver'balisations des sujets, c'est dans le même temps

la fréquence importante aveo laquelle les sujet.s tiennent compte des caractéristiques de dispersion des distributions (les notions de ,Iispersion et de variance sont pourtant réputées difficiles).

- les diffioultés qui surgissent lors de l'utilisation d'une notion apparemment simple comme la moyenne.

La variance est mathématiquement une notion plus complexe que la

notion de moyenne. ~lais la compréhension d'une notion statistique ne se réduit pas fi la compréhension de ses aspects calculatoires. N'assimile-t-on pas trop aisément difficulté d'assimilation et oomplexité mathematique?

Références

Documents relatifs

– Les infirmiers anesthésistes relevant du troisième et du quatrième grade du corps des infirmiers en soins généraux et spécialisés régi par le décret du 29 septembre

L’activité de surveillance des MIE englobe la surveillance des agents infectieux, de leur comportement, des maladies ou des syndromes qu’ils causent, la surveillance des facteurs

Quels ions ces atomes vont-ils formés pour vérifier la règle de

CV, coefficient de variation; GXE, génotype par environnement; ppds ou LSD, plus petite différence significative; h², héritabilité; NPL, Nombre de poquets levés; VAL, Vigueur à

All the secondary metabolites from the isolated actinomycetes proved to posses the ability to inhibit bacterial growth by formation of different sized halo zones.. Conclusion

Il est plus élevé dans l’aire centrale (2,48) et la zone de transition (2,57) que dans l’aire de transition (2,1) qui subit plus l’influence de l’homme, qui par son action

More precisely, they sought to analyze the correlation between the saving rate and the investment rate and therefore determinate if these economies evolved closing (financing