• Aucun résultat trouvé

CLASSEMENT DES MOTS DE LA DICTÉE D’IVQ SELON LEUR INDICE DE CONSISTANCE ET DE FRÉQUENCE CALCULÉS DANS LA BASE MANULEX-INFRA

OBJECTIFS DE LA RECHERCHE PROBLÉMATIQUE

CHAPITRE 4. PRÉSENTATION DES ENQUÊTES ET DES CHOIX DES ENQUÊTES ET DES CHOIX

1.2.1.1 CLASSEMENT DES MOTS DE LA DICTÉE D’IVQ SELON LEUR INDICE DE CONSISTANCE ET DE FRÉQUENCE CALCULÉS DANS LA BASE MANULEX-INFRA

Pour rendre compte du degré de difficulté de la dictée, nous présentons dans le tableau 3, le classement des mots de la dictée d’IVQ (sous la forme de lemme) selon leur indice de consistance (compris entre 0 et 100) et de fréquence U67. Pour chaque mot, nous indiquons son rang de classement par rapport aux autres mots, selon l’indice de consistance et de fréquence calculé dans la base Manulex-Infra (1 étant le mot qui apparait comme le plus consistant et le plus fréquent dans Manulex). Notons que l’item ANTI est absent de Manulex-Infra.

Cet outil permet également de choisir entre le lemme ou la forme fléchie. Lorsque nous les avons trouvés dans la base, nous avons relevé les indices de consistance et de fréquence des formes fléchies telles qu’elle étaient attendues dans l’exercice (FROMAGES, SENTENT). Nous

65 Pour une présentation plus détaillée de l’outil MANULEX et de ses exploitations possibles, se référer à la partie théorique (chapitre 3, section 1).

66 Pour une présentation de l’outil LEXIQUE, voir la partie théorique (chapitre 3, section 1.2.1.2)

67 Pour rappel, U représente la fréquence estimée d’usage. Cet indice prend en compte la dispersion des mots dans le corpus ainsi que leur fréquence réelle, ce qui permet de disposer d’un indicateur plus fiable de la fréquence des mots (pour davantage d’explications, se référer au chap.3, section 1.2).

avons également relevé les indices de consistance et de fréquence des graphies observées dans les réponses des enquêtés (indiquées en italique dans le tableau), par exemple :

- le « -s » de TOMATE(S) ou de CERISE(S), qui n’était pas attendu puisque les items étaient dictés sans déterminant ;

- les marques de genre ou de nombre erronées : FIANCÉE pour FIANCÉ, SOLENNELLE pour SOLENNEL, LIBRAIRIES pour LIBRAIRIE, etc. ;

- les homophones SELLE vs SEL, RHUM vs RHUME qui pourraient expliquer certaines confusions ;

- l’item FORT selon qu’il est utilisé en tant qu’adjectif ou adverbe (comme dans la dictée) ;

- etc.

Les calculs sont effectués « par Token »68, sur le mot entier (moyenne des différentes associations dans le mot) et à partir de tous les manuels de la base (moyenne du CP au CM2).

68 Les calculs "par token" prennent en compte le nombre d’occurrences des mots dans les textes (c’est-à-dire leur fréquence réelle), ce qui permet de prendre en considération la rareté d’un mot. Sans cela, un mot qui apparait fréquemment dans un texte aurait le même poids qu’un mot qui apparait plus rarement.

mots consistance rang « consistance » fréquence U rang « fréquence » SOLENNEL 86,64 1 2,53 14 SOLENNELLE 67,22 0,94 TOMATE 82,99 2 23,87 6 TOMATES 79,37 23,77 FROMAGE 81,72 3 118,16 3 FROMAGES 78,72 16,04 SENTIR 81,04 4 22,68 7 SENTENT 48,76 5,92 SENTES 8,75 0,02 SEL 80,52 5 78,43 4 SELLE 48,07 23,26 PAYS 79,25 6 309,72 1 FORT 78,31 7 302,95 2 FORTS (ADJ) 67,37 18,55 LIBRAIRIE 77,63 8 11,13 11 LIBRAIRIES 75,41 0,02 CONFITURE 76,01 9 42,33 5 CONFITURES 73,97 8,10 CERISE 72,03 10 11,67 10 CERISES 84,55 25,41 PHARMACIE 67,17 11 16,84 9 PHARMACIES 66,12 0,46 ÉPICERIE 64,86 12 7,14 13 ÉPICERIES 64,06 0,01 RHUME 61,74 13 20,21 8 RHUM 58,96 7,84 ALCOOL 61,47 14 7,35 12 FIANCÉ 59,19 15 0,46 15 FIANCÉE 62,41 2,10

Tableau 3. Classement des mots de la dictée d’IVQ et de certaines graphies produites par les enquêtés selon leur degré de consistance (consistance PO totale, du CP au CM2, calcul par token) et leur indice de fréquence, calculés dans Manulex-Infra.

L’observation des indices de consistance montre que dans cet exercice, les enquêtés ont été confrontés à :

- des mots plutôt réguliers, dont le degré de consistance est élevé (avec un indice supérieur à 80 sur 100) : TOMATE, FROMAGE, SENTIR (sans la forme fléchie), SEL ;

- les mots CONFITURE, LIBRAIRIE, FORT, PAYS sont également plutôt consistants, avec des indices proches de 80, compris entre 76 et 79 sur 100 ;

- des mots moins réguliers dont le degré de consistance est plus faible comme RHUME, ALCOOL, ÉPICERIE et PHARMACIE qui ont un indice de consistance compris entre 61 et 67 sur 100. Le mot le moins consistant de la dictée d’IVQ est FIANCÉ, avec un indice de 59 sur 100.

Nous relevons que le mot SOLENNEL est considéré comme très consistant par Manulex. Il semblerait que ce soit la rareté de la correspondance du phonème /a/ avec la réalisation graphique « en » qui explique ce résultat. Nous observons le même phénomène sur le mot PAYS, qui est considéré comme plutôt consistant avec un indice de 79 sur 100.

Nous verrons avec ces deux exemples que les calculs proposés par cet outil ne prédisent pas le taux de restitution de cet item SOLENNEL. Puisque cet item est considéré comme étant le mot le plus consistant de la dictée, il devrait également être le mieux restitué ; or nous observerons le contraire.

La fréquence des mots peut également constituer une explication aux difficultés rencontrées par les scripteurs69, notamment lorsque la graphie est plutôt irrégulière. Dans ce corpus, s’opposent ainsi :

- des mots fréquents comme PAYS, FORT qui ont un indice élevé (U = 302 et 309), ainsi que FROMAGE (U = 118), qui est le troisième mot le plus fréquent de la dictée ;

- des mots dont l’exposition semble bien moindre : ÉPICERIE, SOLENNEL, FIANCÉ.

- parmi les formes qui ont un ou plusieurs homophones comme SEL vs SELLE : c’est la forme la plus fréquente (SEL) qui a été utilisée dans la dictée ;

- la graphie RHUM (qui désigne la boisson et que nous retrouvons dans certaines dictées est également bien moins fréquente que la forme attendue RHUME (U = 7 vs 20).

69 Se reporter à la partie théorique (chapitre 3, section 1.2) pour les études qui montrent l’impact de la fréquence dans les compétences orthographiques.

COMPARAISON DES INDICES DE FRÉQUENCE ENTRE LEMMES ET FORMES FLÉCHIES

Selon Manulex, les items TOMATE et CERISE ne sont pas plus fréquents, qu’ils soient présentés sous forme de lemme ou sous leur forme fléchie (TOMATES, CERISES).

En revanche FROMAGE apparait plus fréquemment au singulier dans les manuels (indice U = 118 vs 16), tout comme CONFITURE (indice U = 42) vs CONFITURES (indice U = 8,1).

Les items ANTI, ALCOOLS, PHARMACIES, ÉPICERIES, LIBRAIRIES ne se trouvent pas dans la base ou ont un indice de fréquence très faible (indice U < 1).

Par ailleurs, nous observons parmi les mots qui possèdent un ou plusieurs homophones, que les enquêtés n’ont en grande majorité pas fait de confusion : ils ont écrit SEL plutôt que SELLE ou CELLE. En revanche pour RHUME, la proximité avec la graphie RHUM, qui désigne la boisson, a perturbé les enquêtés « bas » chez qui l’on retrouve de nombreuses formes RHUM.

1.2.1.2 CLASSEMENT DES MOTS DE LA DICTÉE SELON LEUR INDICE DE FRÉQUENCE CALCULÉ

Documents relatifs