L es erreu rs lexicales - (Chapitre V) Résultats des erreurs du système linguistique

(Chapitre V) Résultats des erreurs du système linguistique

5.1.1 L es erreu rs lexicales

En comparant le nombre total d’erreurs lexicales comptabilisées dans les deux semestres, on observe une diminution nette de 20,17% en sm2 par rapport au sm1. La répartition de ces erreurs se trouve dans le tableau 18. Celui-ci met en avant, entre autres, le fait que la réduction observée n’est pas homogène dans l’ensemble des sous-catégories et qu’il y a même une catégorie (à savoir au niveau des erreurs portant sur le choix lexical – dit aussi de vocabulaire) où l’on constate une tendance inverse.

Catégories d’erreurs lexicales sm1 sm2 D %

spelling 353 301 -52 14,7 ↘

False-friend 22 3 -19 86,4 ↘

coinage 31 22 -8 25,8 ↘

borrowing 20 14 -7 35 ↘

other-word-choice 86 52 -34 39,5 ↘

vocab-choice 48 55 7 14,6 ↗

Tableau 18 : Répartition des erreurs lexicales

Parmi les écarts observés entre les deux semestres, deux remarques s’imposent vis-à-vis des erreurs d’orthographe et celles portant sur le choix lexical (ou le choix du vocabulaire). La première de ces catégories enregistre un total de 654 occurrences, ce qui en fait un problème non-négligeable pour nos sujets-participants. La deuxième catégorie, avec beaucoup moins d’erreurs, compte tout de même 103 items auxquels on pourrait ajouter les « faux-amis », « calque » et « emprunt » qui s’apparentent tous – dans une certaine mesure – à des erreurs de choix lexical. Donc, nous avons la possibilité ici de catégoriser l’ensemble des erreurs dans deux grands groupes : à savoir l’orthographe d’un coté, et toutes les autres catégories de l’autre.

Récurrence d’un même item Sm1 Sm2

≥ x6 4 2

x5 2 1

x4 3 2

x3 4 5

x2 26 24

x1 232 211

nombre d’items différents 271 245 Total d’items relevés 353 301

149

Tableau 19 : La fréquence individuelle des erreurs lexicales

De ces deux premiers constats, la première chose que l’on remarque quand on s’intéresse de près aux erreurs d’orthographe, c’est la non-systématicité des items relevés. Autrement dit, au niveau des occurrences individuelles annotées, la majorité relève des erreurs que l'on pourrait appeler « solitaires », se produisant une ou deux fois de manière identique (comme indiqué dans le tableau 19). On remarquera par exemple en sm1 la présence de 232 items lexicaux qui ne se répètent pas du tout dans l'ensemble du corpus. Tandis que le nombre d'items lexicaux qui se répètent plus de 5 ou 6 fois demeure également peu élevé. Ce constat conforte la thèse d'une non-systématicité et donc d’une erreur purement humaine par opposition à une erreur d’apprentissage ou une erreur due à la non-maîtrise d’une règle linguistique donnée : le trait distinctif ici pour ainsi dire est donc l’aspect hautement aléatoire de ces erreurs. Nous allons maintenant porter notre attention sur la composition détaillée de l’ensemble des erreurs étiquetées ‘lexicales’.

5.1.1.1 « Sp ellin g errors »

Il est à noter ici que 232 sur les 353 erreurs (cf. tableau 19 ci-dessus) signalées en sm1 sont des erreurs qui se sont produites une seule fois ; tandis que sur ces mêmes 353 erreurs, 271 sont des items lexicaux différents. L’écart de 82 (à savoir 23% de l’ensemble) renvoie aux items qui se sont distingués par leur récurrence. C’est-à-dire, à titre d’exemple, qu’en sm1 quatre items se sont produits avec une valeur ≥ 6x : à savoir à une fréquence égale ou supérieure à six fois. Ces quatre items s’expliquent de la manière suivante : developping comptabilisé six fois ; developped sept fois ; interdependance comptabilisé huit fois ; et interdependant quatorze fois. En bas, donc, de cette échelle de fréquence se trouvent des erreurs lexicales ayant une récurrence nulle (x1).

Quelques exemples sont donnés ci-après.

compagny paradoxaly worste caracteristics agrements comit desappearance middel Theorically Polution compains wich

sovereignity desastrous bureaucraty

Tableau 20 : Quelques exemples d'erreurs d'orthographe

En définitive, nous soulignons que les erreurs d'orthographe se sont réduites de manière globale d'environ 15%. De surcroit, étant donné la non-systématicité des erreurs observées ici, une description approfondie sur la caractérisation de cette diminution s'avère problématique, en raison du fait que seulement deux sur les soixante-et-un textes annotés en sm1 pour des erreurs lexicales n’en avaient pas d’une part, tandis que seulement cinq sur soixante et un au deuxième semestre n’en avaient pas. On peut donc conclure que cette réduction est largement généralisée, au sens que

150 la distribution est plutôt uniforme entre sujets-participants et traduit peut-être une faible amélioration dans l’attention accordée à la relecture et l’autocorrection dans les écrits chez les sujets-participants.

5.1.1.2 « Fals e-fri end errors »

Pour ce qui est des faux-amis, les chiffres sont beaucoup moins révélateurs. On ne dénombre que 25 cas annotés, dont 22 au premier semestre et 3 au deuxième. De plus, la diminution n'est pas aussi remarquable que pourrait laisser entendre l'écart de 86%. En effet, les 22 cas en sm1 se limitent à seulement 16 participants et à quatre items différents : à savoir ‘balance’ (x19) ; ‘sage’

(x1) ; privations (x1) ; ‘hazard’ (x1). Tandis que les trois cas en sm2 relèvent d’un même sujet-participant, avec les items suivants : ‘relativise’, ‘definitively’, ‘education’. Ces trois termes ont été utilisés respectivement dans le sens ‘to put something into perspective’, ‘once and for all’, et

‘upbringing’. Le problème des faux-amis nous parait donc ici superficiel notamment en raison du fait que ce phénomène renvoie, rappelons-le, aux items lexicaux existant dans au moins deux langues avec une orthographe analogue, mais un sens tout à fait différent. Cela étant, ce type de phénomène ne nécessite pas à nos yeux de faire l’objet d’un cours à part entière mais pourrait tout simplement s’introduire sous forme d’un rappel ponctuel non obligatoire.

5.1.1.3 « Coin age errors »

Les erreurs de ‘coinage’, rappelons-le, renvoient ici à des emprunts de termes existant en langue française adaptés à la morphologie de la langue anglaise. On comptabilise un total de 52 erreurs de ce type dont 30 au premier semestre et 22 au deuxième, avec un écart s’élevant à 26%. Toutefois, comme ce fut le cas avec les erreurs dit de faux-amis, les 30 erreurs du sm1 ont été repérées chez 17 participants de même que les 22 restants du sm2. Cela traduit un pourcentage de 27,8% - correspondant aux 34 textes sur 122 dans lesquels cette erreur a été signalée. La liste de ces néologismes est fournie ci-après :

altern exempl, norvegia, sensibilize, benefic explication, provocate, solidarian, comparate foundators, provocated, subordonised, considerated, futur, provocs, to acceed, constat, implicts, provoque, to applicate, denunciate, inegalities, provoqued, to combinate, discuted, inegality, relativised, to instaure,

effets, inoved, reputate, traduces,

151 egal, limitate, scarify, underminated,

evoluate, megaconcurrential, sensibilize, unlivinable

Tableau 21 : Quelques exemples de "coinage"

Ce qu’il faut retenir de cette liste est que les interférences (cf. section 7.2.2) peuvent porter sur différentes classes grammaticales, mais avec une préférence marquée pour le verbe. De plus, certains lemmes sont plus récurrents et donc plus problématiques que d’autres, par exemple le verbe ‘provoke’ en anglais qui apparait sous trois formes différentes avec une fréquence de 10 sur 52 items observés. Par opposition au point précédent de faux-amis, le phénomène ici – de par sa fréquence – mérite que l’on s’y intéresse en cours de langue puisqu’en généralisant les résultats de nos 122 participants à l’ensemble d’une population d’étudiants d’une même année dans un même établissement, la fréquence de ce type d’erreur pourrait s’avérait conséquente.

5.1.1.4 « B orrowing errors »

Quant aux erreurs d’emprunt, ou, dans une certaine mesure, aux erreurs de calque, entendu ici comme l’emprunt d’un élément existant en langue française mais utilisé sans modification en langue anglaise - on en dénombre un total de 34 : dont 20 en sm1 et 14 en sm2. Les 20 occurrences erronées observées au premier semestre sont réparties entre 15 participants et les 14 du deuxième semestre entre 9 participants.

agricol, fondation polluant changements humains poste commun, inconvenients processus creches investissement remplace crise methodes soumission dommages ministre survie

et objectif ue

exemple permet xxe face to phenomene

Tableau 22 : Quelques exemples d’emprunt

Il est judicieux de préciser ici que la frontière entre ce type d’erreurs et les deux derniers (à savoir les erreurs dites de faux-amis ou de coinage) peut paraitre minime. Et ce, étant donné que les calques et faux-amis traduisent d’une manière générale (i) une méconnaissance de l’équivalent lexical d’un terme utilisé dans la langue cible ou (ii) une sorte de piège facile dans lequel tout apprenant inattentif pourrait tomber.

152 5.1.1.5 « O th er word choi ce errors »

‘Other-word-choice’ renvoie à ce que l’on désigne communément comme lapsus. Toutefois, il n’y a aucun moyen de vérifier que l’élément erroné relève d’un item lexical non-maîtrisé sémantiquement plutôt que d’un emploi ponctuel par inadvertance, sauf bien entendu à contacter le participant en question afin d’avoir des éclaircissements factuels. De ce fait, comme nous l’avons vu pour d’autres types d’erreurs lexicales, la primauté de ces étourderies nous semble appariée avec le principe de la non-systématicité. Et ce, étant donné la récurrence quasi-nulle observée (x1) pour les items relevés à ce niveau : à savoir une seule fois par type et situation phrastique donnée, indépendamment des participants.

A titre d’exemple, nous avons recensé des erreurs sur l’item lexical ‘is’. Dans la première phrase, au vu du contexte informatif et textuel il s’agit d’un lapsus manifeste qui aurait dû être ‘if it’, tandis que dans la deuxième phrase ‘is’ doit être remplacé par la préposition ‘in’.

1. *It is $If is$ doesn't save Greece, all the countries will be impacted and it will be [...]

(txt_53_sm1)

2. Since the economic and financial crisis *is $in$ 1929, the western countries [...]

(txt_48_sm1)

Le même principe est identique avec les deux exemples suivants portant sur le mot ‘they’. Dans les deux cas, il s’agit clairement d’une erreur d’inattention – le premier renvoyait à ‘the’ et le deuxième à ‘there’.

3. Consumers would not even know [about] *they $the$ possibility for them to buy modern objects. (txt_13_sm1)

4. Nowadays, advertising is almost ubiquitous: when we watch television, *they $there$

are commercial air times every 15 minutes [...] (txt_29_sm1)

Nous pensons que ce type d’erreurs relève de ce que l’on ne peut ni anticiper ni corriger de façon systématique, en raison du fait qu’il caractérise l’erreur humaine par excellence. Nous signalons tout de même une réduction de 39% par rapport au nombre total d’erreurs observées ici, passant de 86 au premier semestre à 52 au deuxième semestre. Nous supposons par conséquent que cela peut s’expliquer par des raisons purement pratiques : notamment que la diminution d’erreurs ici témoigne du niveau d'attention des élèves et tout singulièrement des stratégies de relecture qu’ils mettent en place pour leurs examens de fin d’année.

153 5.1.1.6 « Vocabul ary errors »

Les erreurs de vocabulaire⁹⁰ renvoient aux items lexicaux qui ne sont pas maîtrisés sur le plan sémantique, résultant de ce fait dans ce que l’on appelle un faux-sens ou un non-sens. Autrement dit, le mot est connu par l’apprenant mais son contexte d’utilisation précis pose problème. Le nombre total de ce type d’erreurs s’élève à 103 dont 48 en sm1 répartis entre 30 participants et 55 répartis entre 26 participants en sm2. Notons à titre accessoire que ce nombre total se voit multiplié par neuf si l’on y ajoute les erreurs de choix inappropriés signalés et classés dans le schéma d’UAM uniquement selon la classe grammaticale. Nous reviendrons sur ce « problème » dans la section 8.3.1.1. Mais pour l’instant, examinons ces trois exemples d’erreurs de vocabulaire, telles que prévu par le schéma d’UAM.

5. Some *feminisms $feminists$ think that fighting for women is a long processus [sic], where people have to make evolve[sic] their *consciousness $change-their-mindset$

and point of view of the society. (txt_042_sm2)

6. Besides, the *paper $money?$ of[sic] multinationals is crucial in the world economy because they hire millions of people in the world and they show in a spectacular way how the international system is globalised. (txt_045_sm1)

7. [...] they would be more emotive [...] and would balance work and family very *hardly

$with difficulty$ (txt_031_sm2).

Le principe de la non-systématicité des items lexicaux s’applique de nouveau dans ce type d’erreurs. Et ce, étant donné que la récurrence d’un même item lexical chez plusieurs participants n’est relevée qu’à une fréquence infime. Toutefois, par rapport aux erreurs aléatoires proprement orthographiques, les éléments relevés ici traduisent également un véritable manque et une faiblesse dans le processus d’apprentissage chez les apprenants. En effet, une erreur orthographique suppose de manière générale que le contenu sémantique est maîtrisé, tandis qu’une erreur de vocabulaire laisse entendre le contraire. De plus, dans l’apprentissage d’une langue étrangère, le lexique constitue de manière générale un poids considérable face à l’orthographe.

5.1. 2 L es erreu rs grammatica l es

Pour les erreurs relevant d’une non-maîtrise ou d’un écart d’usage du système linguistique, la comparaison entre semestres n’a pas été de nature – que nous jugeons – statistiquement

90 Les problèmes de vocabulaire recensés ne tiennent pas compte de ceux identifiés dans les catégories grammaticales où le problème se pose à la fois au niveau du sens et de la fonction de l’item dans la phrase.

154 significative : notamment en termes de ce qui avait été escompté. En effet, l’ensemble des erreurs de la catégorie grammaticale n’a diminué que de 4,5% : passant de 1589 items annotés au premier semestre à 1518 au deuxième. Il faut cependant noter que la distribution de cette réduction n’est pas homogène, comme nous le démontrons ci-après.

Catégories d’erreurs

grammaticales sm1 sm2 n=

(sm1+sm2)

(sm2-sm1) (%)

np-error 576 543 1119 -33 -5,72

adjectival-phrase-error 66 50 116 -16 -24,24

adverb-phrase-error 33 22 55 -11 -33,33

prep-phrase-error 185 170 355 -15 -8,10

vp-error 364 395 759 +31 +8,51

clause-error 184 166 350 -18 -9,78

clause-complex-error 164 144 308 -20 -12,19

special-structure-error 12 24 36 +12 +100

other-grammatical-error 5 4 9 -1 -20

Tableau 23 : Répartition des erreurs grammaticales

Le tableau 23 met en avant des données brutes renvoyant au nombre total d’annotations obtenues au premier semestre (sm1) ; au deuxième semestre (sm2) ; au total comptabilisé des deux semestres (n) ; la différence observée entre semestres (d) ; et le pourcentage effectif de la différence observée.

Au vu de ce tableau, les points de grammaire qui illustrent les meilleures "améliorations" en pourcentage sont les ‘adverb-phrase-error’ (33%), les ‘adjectival-phrase-error’ (24%) et les ‘clause-complex-error’ (12%): tandis que "les meilleures améliorations" en chiffres bruts sont les "np-error" (-33), les 'clause-complex-error' (-20) et les 'clause-error' (-18). De manière générale, ces réductions ne nous paraissent pas suffisamment significatives, compte tenu de (i) la variable temporelle qui représente un écart d'environ 6 mois entre les rédactions en sm1 et sm2 et (ii) les 2 heures 30 minimum de cours intensif de langue anglaise, suivi de façon hebdomadaire.

Toutefois considérer les éléments ayant les plus hauts pourcentages comme synonymes d’amélioration peut induire en erreur, en raison du fait que ces pourcentages reflètent des catégories avec un faible nombre de cas annotés en leur sein comparé aux autres sous-catégories. Autrement dit, les 33% de réduction observés dans la catégorie ‘adverb-phrase-error’ en sm2 doivent être relativisés au vu du bien maigre nombre d’items annotés au premier semestre. Ceci n’est pas en soi une mauvaise chose. La figure 26 ci-dessous permet de voir ces réductions de façon proportionnelle : à savoir le total obtenu en sm1 et la différence observée entre les deux semestres.

155 Au travers de ces visualisations, il devient clair que la baisse observée est très relative voire minime dans l’ensemble des différentes sous-catégories d’erreurs grammaticales. En effet, l’écart maximum observé dans l’ensemble des sous-groupes est de 33 (dans le groupe ‘np-error’) alors que le nombre total d’occurrences erronées enregistrées dans la catégorie correspondante en sm1 était de 576. Ce qui en fait une baisse de 5%. De plus, le faible écart global va à l’encontre de ce qui avait été escompté, nous obligeant en conséquence à nous poser davantage de questions sur ces résultats statistiques. Nous allons donc, dans un ordre décroissant, détailler l’ensemble de ces différentes catégories de ‘np-error’ en fonction du nombre total d’items comptabilisés par sous-catégorie.

Figure 26 : L'écart relatif des erreurs grammaticales entre les semestres

5.1.2.1 « Np -error »

Tout d’abord, rappelons que la catégorie d’erreurs représentée ici est celle du groupe ou syntagme nominal. Elle porte principalement sur le noyau du groupe nominal – c’est-à-dire ‘la tête’– avec ses rapports privilégiés avec des satellites à gauche (les déterminants et les pré-modifieurs) et à droite (les post-modifieurs). Notons également que dans cette catégorisation, il y a des erreurs de pronom annotées comme telles quand l’erreur porte sur l’item en fonction de ‘tête’⁹¹.

les sous-catégories ‘np-error’ sm1 sm2 n(sm1+sm2) d(sm2-sm1) (%)

determiner-error 355 268 623 -87 -24,50

premodifier-error 19 31 50 +12 +63,15

head-error 153 220 373 +67 +43,79

postmodifier-error 22 10 32 -12 -54,54

np-complex-error 1 1 2 0 0

91 Notons que les erreurs de pronom sont étiquetées selon leur nature et peuvent par exemple être signalées comme erreur de référence par opposition à un simple choix erroné ayant trait à la classe grammaticale employée.

156

pronoun-error 26 13 39 -13 -50

Tableau 24 : Répartition des erreurs du groupe nominal

Comme nous l’avons expliqué précédemment, la comparaison entre semestres peut facilement induire en erreur si l’on commence l’analyse à partir des pourcentages affichés à droite des tableaux. Il convient de ce fait de commencer avec les colonnes d(sm2-sm1) et n(sm1+sm2) qui indiquent respectivement la différence effective de manière chiffrée entre nos deux semestres d’observation et le total d’éléments annotés. Ces deux colonnes nous permettent donc d’établir l’ordre décroissant des différentes catégories en fonction de leur « gravité » : c’est-à-dire celles qui mériteraient que l’on y accorde le plus d’importance correctrice dans une classe de langue.

(np-errors → erreurs portant sur les déterminants)

Intéressons-nous de ce fait aux erreurs de déterminants qui, rappelons-le, ont pour fonction de déterminer et limiter la portée du groupe ou syntagme nominal qu’ils précèdent. En effet, à en croire les deux tableaux précédents, les déterminants constituent une sorte de talon d’Achille de nos sujet-participants. Ces éléments épineux constituent l’erreur la plus récurrente en termes statistiques : par exemple elle représente 55,6 % des 1119 erreurs identifiées dans le groupe nominal (ce qui ne constitue pas une surprise en soi au vu de la composition de base du syntagme nominal) ou encore 20% de l’ensemble des 3107 erreurs annotées dans la catégorie grammaticale.

Aucun autre élément n’obtient de telles statistiques tout seul dans l’ensemble de notre corpus. Par ailleurs, il est important de souligner ici que la majorité des cas annotés portent sur l’article défini, mais que même dans ce sous-ensemble d’erreurs les caractéristiques des erreurs ne sont pas homogènes.

Cela étant, les quatre types d’erreurs de déterminants les plus fréquents sont précisés et sont suivis d’exemples ci-après :

(i) la présence non-requise d’un déterminant, il s’agit principalement de l’article défini (t278 occurrences) : l’erreur dans l’usage survient par exemple (i) lorsque le sujet nominal n’est pas connu de l’allocutaire et n’a pas été mentionné précédemment ; (ii) lors qu’il s’agit de généralités ou d’abstraction ; ou encore (iii) lorsqu’il s’agit de parler de certains pays ou des saisons.

8. Universities […] try to adapt themselves but they can’t foresee eventual changes in the world of *the $the$ work. (txt_015_sm1)

9. We are on the 1^st of February, and *the $the$ winter is eventually showing up! It is more than one month late. The effects of *the $the$ climate change are affecting more and more our daily life. (txt_016_sm1)

157 10. We can think about the situation of *the $the$ Spain [...] (txt_023_sm1)

11. Some solutions has[sic] been found like the using of other energy resources. For instance *the $the$ wind power (windturbine), *the $the$ solar energy (solar panel) or even synfuel. Moreover, *the $the$ oil is getting more and more expensive [...]

(txt_011_sm1)

(ii) l’absence d’un déterminant requis (t222 occurrences). Dans ce contexte, l’article est obligatoire et ne peut en aucun cas faire l’objet d’une ellipse ou ne relève pas d’un usage dit de l’article zéro.

12. With *Ø $the$ Greek crisis, we can see that the solution has to come from the European Union [...] (txt_039_sm2)

13. But we will see that some criteria or trainings have been developed for *Ø $the$ last 40 years. (txt_008_sm2)

14. But there is *Ø $an$ economic sector where supply is growing very quickly because of an absent demand. (txt_035_sm2)

15. Europe was situated between *Ø $the$ United States and the communism bloc[sic] and had to prove that it was powerfull[sic]. (txt_029_sm2).

(iii) Le choix erroné de déterminant (t82 occurrences) : l’erreur se porte ici sur le choix

Dans le document Cartographie des erreurs en anglais L2 : vers une typologie intégrant système et texte (Page 162-187)