• Aucun résultat trouvé

La prise de décision floue peut-elle permettre d améliorer les correcteurs orthographiques dys?

N/A
N/A
Protected

Academic year: 2022

Partager "La prise de décision floue peut-elle permettre d améliorer les correcteurs orthographiques dys?"

Copied!
7
0
0

Texte intégral

(1)

HAL Id: hal-03115250

https://hal.archives-ouvertes.fr/hal-03115250

Submitted on 19 Jan 2021

HAL

is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire

HAL, est

destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

La prise de décision floue peut-elle permettre d’améliorer les correcteurs orthographiques dys ?

Johana Bodard, Isis Truck, Céline Jost, Gérard Uzan

To cite this version:

Johana Bodard, Isis Truck, Céline Jost, Gérard Uzan. La prise de décision floue peut-elle permettre

d’améliorer les correcteurs orthographiques dys ?. 11e conférence Handicap 2020, Nov 2020, PARIS

(distanciel), France. �hal-03115250�

(2)

La prise de décision floue peut-elle permettre d’améliorer les correcteurs orthographiques dys ?

JohanaBodard CHArt EA4004 UniversitéParis 8 Saint-Denis, France johana.bodard@etud.univ-paris8.fr

IsisTruck CHArtEA4004 UniversitéParis8 Saint-Denis,France 0000-0003-2052-2546

Céline Jost CHArtEA4004 UniversitéParis8 Saint-Denis, France 0000-0002-5870-9640

Gérard Uzan CHArtEA4004 UniversitéParis 8 Saint-Denis,France gerard.uzan@univ-paris8.fr

Résumé—Lespersonnessouffrantde dysorthographieetdys- lexie ont bien souvent du mal à écrire sans faute et à être comprises. La question de la correction automatisée de textes rédigés par des personnesatteintes de ce typede handicap est importante, et toujoursd’actualité, tant les correcteurs actuels peinentàrépondreefficacementauxbesoins.

Dans cet article,nous exposonsles outils correcteurs actuels puis nous avançons une idée : celle que le problème étant dû à des erreurs humaines,des erreurs d’imprécision notamment, peut-êtrequedesthéoriescommecelledessous-ensemblesflous (exprimantparessencelesimprécisions)associésauxmécanismes deprisededécisionpourraientaideràaméliorerlescorrecteurs existants.Unexempled’algorithmecorrectifestsuggéré,àpartir d’uncourttexteécritparunepersonnedys.

Motsclés—dyslexie, dysorthographie,correction,prise dedé- cisionfloue

I. INTRODUCTION

La question de l’orthographe des mots est très ancienne, mêmesil’onditqu’elleétaitextrêmementvariableauMoyen- âge car l’écriture n’était qu’une sorte d’aide-mémoire, dans une civilisation surtout orale [1]. Dès la Renaissance, on a commencéàessayerdenormerlalangueparlée.Maiscertains commeLouisMeigretsouhaitaientquel’onécrivesimplement en étant fidèle àla prononciationdes mots [2], [3]. D’autres étaient partisansd’uneorthographe étymologique.

Toujours est-il que la problématique de la correction or- thographique estfondamentaledans unesociété del’écrit. Et ellel’estplusencorepourdespersonnessouffrantdetroubles cognitifsspécifiques,enparticulierpourlespersonnesatteintes dedyslexieetdysorthographie.Onsaitbienquel’orthographe estunmarqueursocialtrèsfortetquediagnostiqueretcorriger les fautes est un enjeu majeur. Bien sûr, on s’intéresse à la correction automatique depuis de nombreuses années et on a atteint un niveau de correction qui peut sembler assez satisfaisant.Mais,ày regarderdeprès,lescorrecteursfournis (ycomprisparlesindustriels)nefonctionnentpasdanstoutes les circonstances. En effet, dans beaucoup de cas, soit la correctionproposéeesterronée,soitiln’yapasdecorrection du toutcar leproblème estjugétrop difficile.Surlescorpus issus de personnes dys, à peine un quart des fautes est corrigé [4]. Ainsi, la correction automatique performante de

Cetravailaétéréaliségrâceaucontratdoctoraln°68685del’Université Paris8.

textesproduitspardes dysestunsujet derecherche toujours d’actualité.

Par ailleurs, on aune intuition : sachant que corriger une erreur, c’est prendre une décision, il pourrait être pertinent d’étudier les travaux dans l’aide à la décision pour peut- être améliorer la performance de la correction. En effet, lorsque l’on corrige une erreur, on fait habituellement une propositionissued’uneliste depossibleshabituellementtriés par pertinence. Or, l’obtention de cette liste qu’on souhaite pertinente passe par unesuccession de “mini-décisions”. Par exemple, pour le groupe de mots <havan c’est> issu d’un corpus dys, par décision a, on obtient <avant c’est> et par décision b puis c, on obtient <avancer>, <avancé>,

<avancée> selon une liste triée. C’est-à-dire que dans le premier cas, on a corrigé uniquement <havan> et dans le deuxième, on a corrigé <havan> et <c’est>. Regarder la littératuredanslesmécanismesdeprisededécisionenmilieu incertainetimprécispourraitrendrepluspertinentelalistedes corrections proposées.

Dans cet article, nous définissons dans un premier temps, rapidement, les troubles cognitifs responsables des retards des personnes dites dys. Puis nous relatons les différents correcteursorhtographiquesactuelsquel’onpeuttrouverdans lalittérature.Dansundeuxièmetemps,laprisededécision,en particulierfloue,estexpliquéeetdiscutée,cequinous amène àproposer uneébauched’algorithme,intégrant desdécisions floues, pour améliorer lescorrecteurs. Enfin, nous concluons cetteétude ensuggérant desperspectivesde travail.

II. LESDYSETLESOUTILSDECORRECTIONSACTUELS

A. Lestroubles cognitifsspécifiques

D’après la fédération française des Dys (FFDys), on dis- tinguehabituellementsixfamillesdetroubles:lestroublesdu développementdulangageoral,dudéveloppementmoteur,du développementdesprocessusattentionnelset/oudesfonctions exécutives, du développement des processus mnésiques, les troubles desactivités numériquesetlestroubles del’acquisi- tiondu langageécrit, appelésdyslexieetdysorthographie.

Toujoursselonlafédération,onparle,enFrancede6à8%

depersonnesatteintesdetroublesdys.Bienqu’aucunesource réellementfiablenepuisseêtrecitée,certainsaffirmentque4à 5%desélèvesd’uneclassed’âgesontdyslexiquestandisque

(3)

d’autres annoncent8à10%d’enfants présentantunhandicap lié àla dyslexieparmilesélèves scolarisés.

La dyslexie (difficulté de lecture) est toujours associée à la difficulté de transcriptiondes mots (dysorthographie).Les erreurs en production écrite peuvent être catégorisées selon quatre typesd’erreurs[5] :

— erreurs phonologiques: confusionsentressonsproches (notamment concernant les paires de consonnes sourdes/sonores:faudra!fautra),assimilations(chan- ger!chancher),substitutionsdemots(dans!de),er- reursvisuelles(confusionentrelettresmiroirs:douce! bousse ; erreursde jambage: amie!anie),inversions de caractères (personne ! presonne), déplacements de caractère (digestif ! disgetif), erreurs de graphie contextuelle(jardinier!gardinier),erreursportant sur lesgraphiescomplexes (notamment lessemi-voyelles: vieille! viéieu)

— erreurs sémantiques : confusions entres homophones (c’est ! ses), erreurs de découpage (bienveillante ! bienveillante)

— erreurs morphologiques : erreurs sur les morpho- grammesgrammaticaux(marquesd’accord:unefemme cultivé, unepersonne sportif ; désinencesverbales : ils vive, on a manger), erreurs sur les morphogrammes lexicaux(gros! gro,retard !retare)

— erreursorthographiques:ellessontliéesàunedifficulté à mémoriser l’orthographe d’usage des mots qui sont écritscommeilsseprononcent(niveau!nivo,histoire

!istoir)

Corrigerlesfautesd’orthographeetdegrammairedefaçon automatiquepermettraitauxenfantsdemieuxs’intégreretde mieux réussirdans uneécolevéritablement inclusive.

B. Lescorrecteurs orthographiques spécifiquespourlesper- sonnesdys

Lespremiers algorithmesdecorrectionorthographique qui ont été élaborésutilisent des types d’erreurssimples pour la correctiondemotsisolés,c’est-à-diresanspriseencomptedu contexte. Damerau propose ainsi de distinguer quatre types d’erreurs (insertion d’un caractère, omission d’un caractère, substitution d’un caractère par un autre, inversion de deux caractères adjacents) qui représenteraient 80 % des erreurs rencontrées [8].Lestravaux réaliséssur des corpusdetextes peu normés ne retrouvent pas ses résultats. Mitton constate ainsi que seulement 69 % des erreurs issues d’un corpus de productions d’élèves faibles en orthographe entrent dans les quatre catégoriesd’erreursdéfinies parDamerau [9].Les autreserreurssontenmajoritédeserreursnonlexicales,c’est- à-dire des erreurs qui aboutissent à un mot qui existe dans le dictionnaire et qui ne peuvent donc pas être détectées ou corrigées sans prise en compte du contexte environnant (par exemple : la plus part pour la plupart). Ce type d’erreurs se retrouvent en proportion non négligeable dans les écrits des dys:Pedler relève 17% d’erreursnon lexicalesdans un corpus en langueanglaise[10], Antoineet al. 29% dans un corpus enlanguefrançaise[4].

Une autre limite de l’approche proposée par Damerau est qu’elle fait l’hypothèse que la majorité des mots erronés ne contiennent qu’une seule erreur. Or, l’analyse de corpus de textes rédigés par des personnes dys montre que ceux-ci font souvent plus d’une erreur par mot. Pedler relève 39 % d’erreursmultiplessursoncorpus[10].Cetauxmonteà54% dans lecorpusd’Antoineetal.[4].

Des méthodes plus complexes doivent donc être utilisées pour corriger les productions écrites des dys. Pour la détec- tion et la correction des erreurs non lexicales chez les dys anglophones, Pedler propose d’identifier des ensembles de motssouventconfondus(comme{dessert,desert}ou{from, form}) etd’utiliseruneanalyse syntaxiqueetsémantique du contexte pour identifier quel mot de l’ensemble est le plus probable [10]. Rello, Ballesteros, et Bigham utilisent cette approchepourlacorrectiondeserreurs nonlexicaleschezles dyshispanophones[12].

Cependant,dans destextespeunormés,le contexteautour des mots erronés est lui aussi souvent erroné. Pour palier en partie ce problème, il est possible de s’appuyer sur la phonétique qui est correcte dans la plupart des cas. Sitbon, BellotetBlacheproposentuntraitementphonétiqueauniveau de laphrase entièrepour réécriredes phrasessaisies par des enfants dysfrancophones dans un moteur de recherche [14].

Cetravailetceluid’Antoineetal. surledéveloppementd’un correcteur orthographique intégré à un prédicteur de mots [4] sont à notre connaissance les seuls travaux qui se sont intéressésauxtraitements deserreurs d’orthographed’enfants dysfrançais.

III. PRENDREUNEDÉCISIONENMILIEUIMPRÉCISET

INCERTAIN

A. L’aide à la décisioncomme uneaide dans un correcteur orthographique ?

L’aide à la décision est une branche de la théorie de la décision. Parmi les techniques d’aide à la décision se trouventcellesquiprennentencomptelesimprécisionsetles incertitudes, considérant leschoix commedes objetsplus ou moinsprobables,ouauxquels onaffecte desdegrésde vérité [6].

En particulier, il existe des techniques s’appuyant sur la théorie dessous-ensemblesflous (notéshabituellementSEFs) quipermettentdemodélisercegenred’imprécision.Eneffet, la logiquefloue qui s’appuiesur la théorie des SEFspermet d’utiliser des versions “étendues” des variables de travail, autrement dit de considérer non seulement les variables en présence(ici,lesunitéslexicales—dansnotreacception,une unité lexicaleest simplementune suitede caractères séparée par des espaces ou de la ponctuation, indépendamment de toutdictionnaire) maiségalement laversionimprécisedeces variables(intégrantéventuellementplusieursunitéslexicales).

Par exemple, au lieu de ne manipuler que l’unité lexicale

“léser”, on manipulera également “lésée”, “lésé”, “lésés”,

“lésées”,“l’aisé”,maiségalement“laisser”,“laissé”,“l’essai”, etc. c’est-à-dire des termes dont la sonorité est identique à

(4)

l’unité lexicale, mais également des termes dont la sonorité estapprochante.

Ainsi, on pourra conserver les imprécisions dans toute la chaîne de prise de décision.L’hypothèse qui estfaite iciest que le résultat sera plus pertinent si l’on n’élimine pas des possiblesdès ledépart.

B. Lalogiqueflouepourdestransitionsplussouplesdansles décisions

Lathéoriedessous-ensemblesflousestuneextensiondela théoriedesensemblesdanslaquellel’intersectiond’unepartie et de son complémentaire n’est pas nécessairement égale à l’ensemblevide,etl’uniond’unepartieetdesoncomplémen- tairen’estpasnécessairementégaleàl’ensembleenglobantles parties.Cela se traduitdoncpar uneappartenanceàunsous- ensemble flou qui n’exclut pas une appartenance à un autre sous-ensemble flou. Par exemple, dans la figure 1, certaines valeursxdeX appartiennentseulementàA1 ouseulementà A3,maisd’autres(au niveaudel’intervalleB2,parexemple) peuvent appartenir à la fois à A1 et A2, avec une valeur d’appartenance comprise entre0 et 1, etdontla somme fait, sur ceschéma,toujoursexactement1.

Cettemodélisation,inventéepar LotfiZadeh,se prêtebien àladescriptiondesphénomènesnepouvantêtrequegrossiè- rement décrits[7].

La logique floue, quant à elle, étend le syllogisme bien connu "Tousleshommessont mortels(c’est-à-dire : sihest unhommealorshestmortel),orSocrateestunhomme,donc Socrate est mortel" en : "si v est A alors w estB, or v est A0 donc w est B0", avec B0 à définir. A, B, A0 sont des SEFs dontles fonctionsd’appartenance sont définies lors de lamodélisation, etB0 estunSEFàcalculer.

Prenons un exemple dont les règles floues sont les sui- vantes:

— siv estA1 alorsw estB1

— siv estA2 alorsw estB2

— siv estA3 alorsw estB3

v est à valeurs dans X (voir figure 1) et on peut donc calculersavaleurd’appartenanceàA1,A2etA3.Parexemple, si v vaut 0, alors µA1(v) = 1, µA2(v) = 0 et µA3(v) = 0, avecµA(x)lafonctiond’appartenancedexausous-ensemble flou A.

Danscetexemple,poursimplifier,lestroisSEFsB1,B2et B3 sontégalementdéfinis surX.

Onobserve(onmesure)vetonchercheàconnaîtrelavaleur dew.Onvaprendretroistypesdedécisiondifférents.Dansle premier cas,onfaithypothèsequelavaleurdev mesuréeest extrêment fiable et qu’elle est, de surcroît, exactement égale àA1,A2ouA3.Ainsi,lavaleurdewensortieseratoujours exactement égale à B1, B2 ou B3. Par ailleurs, B1, B2 et B3 ne sont pas des sous-ensembles flous, mais de simples intervalles (caslimitesdesSEFs).

Dans le deuxième cas, on fait hypothèseque la valeur de v mesurée est extrêmement précise (voir figure 2 où v est défini sur l’axe de façon très précise). De surcroit, B1, B2

et B3 sont toujours desintervalles, mais cette fois, réduitsà

FIGURE1. Modélisationd’unproblèmeavectroisSEFsA1,A2,A3ettrois intervallespourladécision.

un point(respectivement x1, x4 et x7, sur leschéma). Dans l’exemple,lecalculdelavaleurdesortiewestunbarycentre.

Etdonc,par exemple,

w= x1µA1(v) +x4µA2(v) +x7µA3(v) µA1(v) +µA2(v) +µA3(v) soit, dansl’exemple,

w=x1µA1(v) +x4µA2(v) µA1(v) +µA2(v) puisque µA3(v)=0.

FIGURE 2. Modélisation d’un problème avec trois SEFs et trois points (x1,x4,x7)pourladécision.

Dans le troisième cas, on fait toujours hypothèse que la valeur de v mesurée est extrêment précise mais, cette fois, B1, B2 et B3 sont de véritables SEFs (voir figure 3, en pointillés).Pourcalculerlavaleurdesortiew,onpeututiliser dessurfaces(voirfigure4, oùlasurfacerelative àB1 (notée SB1) esthachurée avec des vaguelettes, la surface relative à B2 (notée SB2) est hachurée avec des losanges noirs et la troisièmesurface(SB3)estnulle).Doncondéfinir wainsi:

w=x1SB1+x4SB2+x7SB3

SB1+SB2+SB3

soit, dansl’exemple,

w= x1SB1+x4SB2

SB1+SB2

Nota bene : Dans ces trois cas, on a cherché à calculer la valeur précise w, donc on a défuzzifié w. On pourrait

(5)

FIGURE3. Modélisationd’unproblèmeavectrois SEFsenentréeettrois SEFspourladécision.

FIGURE4. Calculdessurfacespourladécision.

également ne pas calculer la valeur défuzzifiée et souhaiter conserver unrésultatflou.

Ainsi,onpeutanalyserl’intérêtd’utiliserdesSEFsdansles règles et, en particulier, on peut étudier l’évolution de w en fonctionde lavaleurv enentrée.

FIGURE5. Analysedel’évolution:premiercas.

Dans le premier cas (voir figure 5), la valeur en entréev est considérée comme se superposant exactement à l’un des SEFspossiblesetladécisionpossible(B1,B2ouB3)estun intervalle.Doncladécisionn’utilisepaslamodélisationfloue etlerésultatévolueparpaliers,selonunecourbediscontinue, avec un choix de la classe d’appartenance la plus probable.

Eneffet,lorsquevaugmente,waugmenteégalement,maisde façon saccadée,en escalier,avec des cassures nettes lorsque v atteint x3 puisx5.

Dans le deuxième cas (voir figure 6), la valeur en entrée v est considérée comme très précise et on calcule donc son

appartenance aux SEFs A1, A2 et A3. La décision possible (B1,B2 ouB3) estcette fois réduiteàunpoint.

Lecalcultientcomptedesvaleursd’appartenance etleré- sultatévolueselonunecourbecontinue,linéaireparmorceaux.

Lavariabledew enfonctiondev estplusdouce.

FIGURE6. Analysedel’évolution:deuxièmecas.

Dansletroisièmecas (voirfigure7), lavaleuren entréev esttoujours considérée commetrès précise.On calcule donc encore son appartenance aux SEFs A1, A2 et A3, mais la décision possible (B1, B2 ou B3) est cette fois définie sous laformedetroisSEFs.

Lecalcultientcomptedesvaleursd’appartenancereportées sur les SEFs B1, B2 et B3, donnant ainsi des surfaces. Le résultat évolueselonunecourbe lissée,correspondant bienà lamodélisationd’un problème flou.

FIGURE7. Analysedel’évolution:troisièmecas.

Cetexempleamontréque,grâceauflou,onpeutmodéliser davantagedesouplesse dans laprisededécision.

En effet,le fait de faire évoluer"doucement" w peut être comparé aufaitde déciderde sélectionnerunmot correcteur (pourétablirunecorrectiondumoterroné)oubienunautre,de façonplusdouce.Ainsi,onauraitunevaleurd’appartenanceà unmot correcteurmais également unevaleurd’appartenance àundeuxièmemot correcteur,voireuntroisième, quatrième, etc.

Ces valeurs d’appartenance (non nulles) à plusieurs mots indiquent un ensemble de possibilités solutions, au lieu de n’enconserverqu’une seule.

En conséquence, les SEFs B1, B2, etc. pourraient repré- senterlesmotscorrectionspossibles,pourunemêmesonorité (par exemple :<souris>,<sourit>,...) et l’axeX pourrait déterminerlaproximitésonoreentrelesmots corrections.

(6)

Dans un autre registre, on pourrait également envisager que les SEFs représentent des catégories d’erreurs et que l’on obtiendrait un degréd’appartenance àchaque SEF pour chaque mot erroné. Ces catégories d’erreurs pourraient donc être utilisées dans la correction et on pourrait envisager des règlesdu type:

— R1 : “Si erreur est e11 et e21 ou e31 alors appliquer correctionc11”,

— R2:“Si erreureste21ete22 alorsappliquercorrection c21”,

— etc.

Et on obtiendrait, à lafin,des appartenancesà despropo- sitions de correction de mots qui permettraient de “classer”

la meilleure proposition : par exemple : <souris> à 0.82 ;

<sourit> à0.1, etc.Dansce cas,on ne défuzzifieraitpasle wquiresteraitunevaleurflouecorrespondantàplusieursmots correcteurs possibles.

Maintenant que nous avons étudié l’intérêt d’apporter du flou dans la prise de décision, nous allons suggérer des ajouts dans le schéma global de correction, tel que nous l’envisageons.

IV. PROPOSITIONDETRAVAILPOURLAMÉLIORATIONDES CORRECTIONSDESFAUTESDYSAVECPRISEDEDÉCISION

FLOUE

Lefiltrede correctionquenoussouhaitonsmettreen place pour améliorer la correction des fautes dys est composé de plusieurs phases, telles que décrites en figure 8. L’exemple reprend unvéritable extrait de texterédigé par unepersonne dysorthographiqueetanalysel’algorithmepermettantd’abou- tir àunelistedesuggestionsdemots correcteurs.

Il nous semble quelesmécanismes issusde lathéorie des sous-ensembles flous pourraient être injectés au niveau des étapes de définition de la liste de suggestions et de la liste finale triée (en bas à gauche et à droite dans la figure). En effet, l’obtentionde la liste de suggestionsavec lesmodules de phonétisation, degestion de l’omissionde l’apostropheet demesuredesimilaritépeutprobablementsefaireenutilisant du flou.

Et la liste de suggestions devrait être un ensemble de couples (valeurs d’appartenance, SEF). Le tri de cette liste pourraits’envisagerparsimplecomparaisondesvaleursd’ap- partenance.

V. CONCLUSIONS

On a vu dans cet article que les correcteurs actuels de l’orthographe chez les personnes dys ont encore une bonne margedeprogressionavantdepouvoirêtreconsidéréscomme totalementefficaces.Onaégalementvuquelaproblématique de proposition de corrections d’un mot ou d’un groupe de mots (suggestionde motscorrecteurs) peuts’apparenteràun problème deprisededécisionenmilieuincertainetimprécis.

Nous avons suggéré, en montrant un exemple, que la prise de décision floue semble pertinente dans ce cas de figure, puisqu’elle permet de conserver des imprécisions dans toute lachaine duraisonnement.

Lestravaux futursque nousenvisageons surces questions consisterontàmettreenapplicationcesidéesdansl’algorithme que nous avons présenté en dernière partie. Pour finir, on n’exclut pas d’envisager d’autres outils flous pour améliorer la précision de l’outil de correction, comme par exemple les hesitant fuzzy subsets [15] qui permettent de modéliser des situations d’hésitation, c’est-à-dire des situations où il est difficile de déterminer l’appartenance d’un élément à un ensemble àcaused’un douteentredifférentesvaleurs.

RÉFÉRENCES

[1] D. Sallenave,“L’orthographe : Histoired’une longuequerelle,”Note dans l’Académie française, www.academie-francaise.fr/lorthographe- histoire-dune-longue-querelle-0,2016.

[2] L.Meigret,“Traitetouchantlecommunusagedel’escriturefrançoise,”

1542.

[3] L.Meigret,“Letrettédelagrammèrefrançoise,”1550.

[4] J.-Y.Antoine,M.Crochetet, C.Arbizu,E. LopezetS.Pouplin,“Ma copie adore levélo : analyse des besoinsréels en correction ortho- graphiquesuruncorpusdedictéesd’enfants,”TALN2019,Toulouse, France,2019.

[5] C. Wicker, T. Barbier, C. Bataille, M.-H. Ferrand, M.-A.

Sandrin-Bui, “Dyslexie et dysorthographie,” Projet Tous à l’école, http://www.tousalecole.fr/content/dyslexie-et-dysorthographie,2020.

[6] H.Raiffa,“DecisionAnalysis:IntroductoryLecturesonChoicesUnder Uncertainty,”Collegecustomseries,McGraw-Hill,1997.

[7] L. A.Zadeh,“Fuzzysets,”Information andControl,vol.8(3),pages 338–353,1965.

[8] F.J.Damerau,“Atechniqueforcomputerdetectionandcorrection of spellingerrors,”CommunicationsoftheACM,vol.7,no3,p.171-176, janv.1964,doi:10.1145/363958.363994.

[9] R.Mitton,“Spellingcheckers,spellingcorrectorsandthemisspellings ofpoorspellers,”InformationProcessing&Management,vol.23,no5, p.495505,janv.1987,doi:10.1016/0306-4573(87)90116-6.

[10] J.Pedler,“ComputerCorrectionofReal-wordSpellingErrorsinDys- lexicText,”UniversityofLondon,2007.

[11] A.Golding,“ABayesianHybridMethodforContext-sensitiveSpelling Correction,”inThirdWorkshoponVeryLargeCorpora,1995.

[12] L. Rello, M. Ballesteros, et J. P. Bigham, “A Spellchecker for Dyslexia,” Proceedings of the 17th International ACM SIGACCESS Conference on Computers & Accessibility, 2015, p. 3947, doi : 10.1145/2700648.2809850.

[13] K. Toutanova, R. C. Moore, “Pronunciation Modeling for Improved SpellingCorrection,”Proceedingsofthe40thannualmeetingofACL, Philadelphia,p.144-151,Juillet,2002.

[14] L.Sitbon,P.Bellot,etP.Blache,“Elémentspouradapterlessystèmes de recherched’informationauxdyslexiques,”TraitementAutomatique desLangues,vol.48,no2,p.123147,2008.

[15] V. Torra, “HesitantFuzzy Sets,” InternationalJournal of Intelligence Systems,JohnWiley&Sons,Inc.,vol.25(6),p.529–539,2010.

(7)

Filtre de correction

version au 14 février 2020

Phrase

" Tou dabord mes meyeur veu pour 2018. "

Texte

" Bonjour pierre,

Tou dabord mes meyeur veu pour 2018.

Je revien vers toi pour orgniser la journée séminér pour les suite à doner au projé. "

Mot à analyser

" veu "

Mots précédents déjà analysés

" Tout d'abord mes meilleurs "

Mots suivants pas encore analysés

" pour 2018 "

Le mot est dans le lexique ? Est-ce qu'on traite le mot ?

Erreur lexicale (non-word error) Ex : veu (vœux)

Potentiellement une erreur non lexicale (syntaxique, sémantique)

(real-word error) Ex : les suite (les suites) NON

OUI OUI

Découpage du texte en phrases à l'aide des caractères de ponctuation de fin de phrases et des retours à la ligne.

Découpage de la phrase en mots. Un mot est une séquence de caractères délimitée par des espaces ou des caractères de ponctuation à l'exception du trait-d'union et de l'apostrophe.

Les mots composés d'une seule lettre et ceux qui commencent par une majuscule et qui ne sont pas au début de la phrase ne sont pas traités.

Est-ce qu'on traite le mot ? Les mots composés de moins de 3 lettres ne sont pas traités.

Liste de suggestions suite : suite ; suites

OUI

Obtention de la liste de suggestions avec la liste des suffixes substituables Liste de suggestions

veu : veut ; veux ; vœu ; vœux feu, feue, feues, feus, feux

Liste de suggestions triée 1. voeux

2. feux 3. feus ...

Liste de suggestions triée 1. suites

2. suite Obtention de la liste de suggestions

avec les modules de phonétisation, de gestion de l'omission de l'apostrophe et de mesure de similarité

Tri de la liste de suggestions avec les modules d'analyse contextuelle : - ensembles de confusion - accord en genre et en nombre - conjugaison

Tri de la liste de suggestions avec les modules d'analyse contextuelle : - accord en genre et en nombre - conjugaison

FIGURE8. Filtredecorrectionenvisagé:exempleàpartird’untexterédigéparunepersonnedys.

Références

Documents relatifs

 Après détection d’une erreur, la redondance dans le message transmis est suffisante pour permettre de retrouver le message initial..  Exemple : la technique de détection

Dans cet article, nous exposons les outils correcteurs actuels puis nous avançons une idée : celle que le problème étant dû à des erreurs humaines, des erreurs

That is, by structuring the decision making authority in concert with the organization’s quadrant on Hofstede’s power distance index and the uncertainty avoidance

Nous soustrayons 2 ` a toutes les entr´ ees de la premi` ere colonne et r´ ep´ etons cette op´ eration jusqu’` a ce qu’au moins une des entr´ ees soit 1 ou 2.. Maintenant nous

Si les deux marques diff´ eraient par plus d’un point, alors la solution fut reconsid´ er´ ee jusqu’` a ce que les diff´ erences soient r´ esolues.. Si les deux marques ne

Beaucoup d’´ etudiants ont r´ eussi ` a trouver une expression pour les termes de la suite {a n } par une vari´ et´ e de m´ ethodes: une formulation explicite, utilisation

That's one small step for a man, a giant leap for mankind Un premier exercice. Message

Le groupe des automorphismes d’un tel système de Steiner (et du code de Golay) est le groupe de Mathieu M 24 , groupe 5 fois transitif sur 24 lettres, d’ordre (24 × 23 × 22 × 21