• Aucun résultat trouvé

Conseil de l’Europe

1.2.7 La conception et la validation de descripteurs de compétence par étalonnage multidimensionnel par étalonnage multidimensionnel

1.2.7.1 Utilité et limites des descripteurs de compétence

L’élaboration, l’étalonnage et l’adaptation de descripteurs de compétence comme ceux que

nous venons de découvrir dans les travaux canadiens et dans le Cadre, est décrite dans de nombreuses publications. Nous retiendrons celles relatives aux travaux européens en relation avec le Cadre : G. Schneider et B. North (2000), A. Hasselgreen et al. (2003), P. Lenz et G.

46 Schneider (2004), ALTE Can-Do Project, H. Vollmer et al.. (2005), et le Portfolio européen des langues du du CIEP, (C. Tagliante, 2000).

B. North soulignait déjà il y a plus de dix ans (North, 1997) que deux influences majeures avaient conduit les spécialistes à créer des échelles de compétence :

- un mouvement général pour instaurer davantage de transparence dans les systèmes éducatifs,

- une volonté politique affirmée en Europe pour favoriser l’intégration internationale

et la mobilité.

Depuis l’échelle du Foreign Service Institut créée dans les années cinquante, celle du British National Language Standards (1992), celle de Eurocentres Scale of Language Proficiency (1993) ou celle de ALTE Framework (1994), les travaux de spécification au moyen de descripteurs simples ont évolué. Le Cadre en rappelle lui-même un certain nombre ( :160) :

Illustration 10 Echelles de compétence langagière utilisées comme sources par le Cadre

La liste est longue de travaux qui ont conduit à l’élaboration de grilles de compétence,

auxquelles il faut ajouter bien entendu celles de DIALANG et celle du Cadre lui-même qui est

sans doute celle qui a recueilli aujourd’hui le plus grand consensus.

47

“Les échelles qui offrent des définitions de la compétence des apprenants sur la base de couches successives d’habilités deviennent de plus en plus populaires parce qu’elles peuvent

être utilisées :

1. pour fournir des stéréotypes à partir desquels les apprenants peuvent comparer leur propre image et évaluer sérieusement leur positions (J. Trim 1978 ; M. Oscarson 1978, 1984).

2. Pour augmenter la fiabilité du jugement subjectif des évaluateurs en leur fournissant des échelles communes pour prendre leurs décisions (C. Alderson 1991).

3. Pour fournir des lignes directrices quant à l’élaboration d’un test (P. Dandonoli & G. Henning, 1990 ; C. Alderson, 1991).

4. Pour reporter les résultats de l’évaluation formative, les scores obtenus aux tests et l’auto-évaluation sur la base d’un même instrument (C. Alderson 1991; P.E. Griffin

1989).

5. Pour fournir des liens internes cohérents au sein d’une même institution entre les pré-tests, l’élaboration des plannings, l’organisation matérielle, les progressions et l’évaluation pouvant conduire à la certification (B. North 1993a).

6. Pour établir un cadre de référence qui puisse décrire les attendus dans un système

éducatif complexe, en termes significatifs pour l’ensemble des partenaires. (J. Trim 1978; G. Brindley 1986, 1991; R. Richterich & G. Schneider 1992, Conseil de

l’Europe, 1996).

7. Pour rendre possible la comparaison entre les systèmes en utilisant un système métrique commun. (P. Lowe 1983, J.E. Liskin-Gasparro 1984; L.F. Bachman & S.J. Savignon 1986; S. Carroll B.J. & R. West 1989)”.14

14 Scales offering definitions of learner proficiency at successive bands of ability are becoming more popular because they can be used:

To provide "stereotypes" against which learners can compare their self image and roughly evaluate their position (Trim 1978; Oscarson 1978, 1984).

To increase the reliability of subjectively judged ratings, providing a common standard and meaning for such judgements (Alderson 1991).

To provide guidelines for test construction (Dandonoli and Henning 1990; Alderson 1991).

To report results from teacher assessments, scored tests, rated tests and self assessment all in terms of the same instrument - whilst avoiding the spurious suggestion of precision given by a scored scale (e.g. 1-1,000) (Alderson 1991; Griffin 1989).

To provide coherent internal links within an institution between pre-course testing, syllabus planning, materials organization, progress assessment and certification (North 1993a).

To establish a framework of reference which can describe achievement in a complex educational system in terms meaningful to all the different partners involved (Trim 1978; Brindley 1986, 1991; Richterich and Schneider 1992, Council of Europe 1996).

48 J.L. Clark (1985), cité par B. North (1997) notait que la principale faiblesse de toutes ces

échelles réside dans l’image qu’elles donnent d’un continuum unique sur lequel se développerait l’apprentissage. Cette observation nous semble de plus en plus avérée dans

l’usage quotidien que les institutions et les enseignants réservent aujourd’hui au Cadre,

comme peuvent en témoigner les nombreuses méthodes FLE en vogue aujourd’hui, qui toutes

présentent un parcours homogène de formation glissant du niveau A1 au niveau B2. Nous

pourrions d’ailleurs relever que les certificateurs renforcent cette vision du continuum linéaire lorsqu’ils proposent aussi des parcours généraux d’un niveau à l’autre. Cette vision linéaire a

au moins deux effets induits pervers que nous avons déjà notés : la notion de niveau entendue

comme un fait homogénéisant du niveau d’un apprenant (tous les diplômes de langue recensés

par ALTE fonctionnent sur ce principe qui, sur la base d’une agglomération de données par

compétence, proposent une image globale de niveau), et la visée implicite d’un aboutissement unique de l’apprentissage, plus ou moins basée sur l’image idéale du locuteur natif.

Le troisième effet induit d’une telle approche, ou plus exactement des représentations qui se

construisent autour de sa mise en œuvre, réside dans un dogmatisme limitatif qui s’impose.

Pris dans une dimension prescriptive, le Cadre, malgré toutes les précautions prises par ses

auteurs, semble cautionner des parcours d’apprentissages préformatés et peu contextualisés. Ceci est peut-être dû, comme le fait remarquer C. Puren (2006 : 17) au fait que les auteurs du Cadre « n’ont pas développé, au-delà de ces simples constats, une réflexion systématique sur les relations entre pratiques de l’éclectisme et théories de la complexité », ou peut-être est-ce dû au fait que les usagers du Cadre, faute de référence claires, ont tendance à en limiter les postulats théoriques dans leurs applications.

En revanche, la méthode de validation empirique de ces descripteurs, basée sur des analyses statistiques précises, en valide la valeur consensuelle, offrant toutes les garanties de fiabilité requises (fiabilité entendue comme « la mesure selon laquelle on retrouvera le même

classement (…) dans deux passations réelles ou simulées d’examens», Cadre : 135).

To enable comparison between systems or populations using a common metric or yardstick (Lowe 1983, Liskin-Gasparro 1984; Bachman and Savignon 1986; Carroll B.J. and West 1989)”.

49