• Aucun résultat trouvé

Ce chapitre présente divers outils d'aide à l'accessibilité. D'une part, nous présentons un outil d'aide à la

4.3 Traducteur en braille abrégé

La lecture des informations peut être plus ou moins rapide selon les capacités des per-sonnes handicapées visuelles et selon les aides techniques qu'elles utilisent. Il est en eet possible de régler la vitesse du débit de parole d'une synthèse vocale, ou encore de faire déler les lignes d'un clavier braille à un rythme déni par l'utilisateur. Cependant si le débit reste trop lent lors de l'utilisation d'un clavier braille, on peut envisager de lui faire transcrire non pas du braille intégral mais du braille abrégé. La méthode toujours en vigueur actuellement est celle de 1955 qui exige environ 4 années d'apprentissage et la connaissance de nombreuses règles. Ce système a été révisé en 2000 dans la thèse de Carmen Fontaine [59] et en 2004 par Evelyne Kommer [72].

An de nous familiariser avec les aides techniques comme le clavier braille, nous avons créé une application permettant la transcription d'un texte français en braille abrégé, la lecture se faisant sur un terminal braille adapté. La méthode consiste à découper un texte en mots, à les soumettre à un traitement de locutions et ensuite à vérier les règles de compression. Ce procédé permet de réduire les ouvrages imprimés en braille d'une part et d'autre part d'augmenter la vitesse de lecture. Ainsi cet outil pourra être intégré à d'autres que nous avons créés pour accélérer la lecture sur Internet.

4.3.1 Méthode de transcription

Comme nous l'avons précisé dans la section 2 (page 19), un texte en braille abrégé est composé de mots contenant une ou plusieurs contractions de symboles, et de mots en intégral.

Pour transcrire un texte en braille abrégé, il faut tout d'abord détecter les locutions. Une locution correspond à une séquence de mots ayant une abréviation dénie. Les locutions ainsi que leurs abréviations sont répertoriées dans un dictionnaire. Ensuite, pour les mots ne correspondant pas à des locutions, il faut rechercher si une ou plusieurs abréviations sont possibles. Pour cela il faut dans un premier temps essayer de trouver une abréviation du mot complet, on parle alors de symbole, et si aucun symbole n'est trouvé, il faut dans un deuxième temps essayer de contracter le plus de lettres possible. Les algorithmes principaux de transcriptions en braille abrégé sont donnés dans l'annexe A. A l'instar des locutions, un dictionnaire des symboles est établi. Les règles de contraction permettent d'abréger des ensembles de lettres mais uniquement si cet ensemble appartient à une même syllabe.

Par dénition, une syllabe est un son ou un groupe de sons prononcé par une seule émission de voix. An de détecter de manière automatique les diérentes syllabes d'un mot, nous avons utilisé les règles de division suivantes :

une consonne placée entre deux voyelles introduit une nouvelle syllabe ;

quand deux consonnes sont placées entre deux voyelles, la première appartient à la syllabe précédente, la seconde à la syllabe suivante ;

les groupes bl, cl, , gl, pl, br, cr, dr, fr, gr, pr, tr, vr qui contiennent un l ou un r, sont inséparables ;

les groupes ch, ph, gn et th sont inséparables ;

quand il y a trois consonnes consécutives à l'intérieur d'un mot, les deux premières terminent une syllabe, la dernière commence quant à elle une nouvelle syllabe ; les groupes inséparables cités précédemment commencent une syllabe.

Si on note V les voyelles, C les consonnes et / le caractère de séparation des syllabes, les règles citées précédemment peuvent être synthétisées comme suit :

1. V CV →V /CV

2. V CCV →

(

V C/CV si CC n'est pas inséparable

V /CCV sinon

3. CCC →

(

CC/C si la 2ème et la 3ème consonnes ne sont pas inséparables

C/CC sinon

Prenons par exemple le mot montagne à découper en syllabes. A partir de la lettre m il n'est pas possible d'appliquer une règle. Il faut donc passer à la lettre suivante : le o . C'est une voyelle suivie de deux consonnes puis d'une voyelle. Il s'agit donc du cas VCCV (règle 2). Or comme nt ne fait pas partie des groupes inséparables, on doit découper le mot après le n , ce qui donne mon/tagne. Par la suite, on observe encore une fois VCCV avec les lettres agne mais cette fois le groupe gn est inséparable donc on utilise le deuxième cas de la règle 2 qui permet de diviser après le a . On obtient donc le découpage mon/ta/gne.

4.3.2 Résultats expérimentaux

Le but de ce générateur de braille abrégé étant en partie d'être intégré à d'autres outils accélérant la vitesse de lecture sur Internet, nous avons évalué le temps d'exécution de notre algorithme de transcription, pour estimer si le temps d'exécution ne risquait pas de faire attendre l'internaute. Pour cela nous avons réalisé des tests sur plusieurs extraits d'÷uvres dont les références sont les suivantes :

1. Molière (1622-1673) - Le Bourgeois Gentilhomme (1670) - Acte 2, Scène 4 2. Pierre Corneille (1606-1684) - Le Cid (1682) - Acte 1, Scène 1

3. Charles Perrault (1628-1703) - Contes de ma mère l'Oye (1697) - Cendrillon 4. Charles Perrault (1628-1703) - Contes de ma mère l'Oye (1697) - Le Petit Chaperon

Rouge

5. Jean-Jacques Rousseau (1712-1778) - Confessions, Livre 12 (1789) 6. Victor Hugo (1802-1885) - Notre-Dame de Paris (1831)

7. Gustave Flaubert (1821-1880) - Madame Bovary (1857) - Chapitre 1 8. Alphonse Daudet (1840-1897) - Le Petit Chose (1868)

10. Marc Levy (1961-) - Et si c'était vrai (2001)

La gure 4.10 montre un exemple de résultat obtenu pour une partie du texte 1 de Molière. A savoir : à droite le texte original et à gauche ce même texte transcrit en abrégé.

Monsieur Jourdain Apprenez-moi l'orthographe. Maître de philosophie Très volontiers.

Monsieur Jourdain

Après, vous m'apprendrez l'alma-nach, pour savoir quand il y a la lune et quand il n'y en a point. Maître de philosophie Soit.

¾mr Jourdain

¾ap !enz-mù l'Ñthoïaphe. ¾maî)e d philosophie ¾)s v½.

¾mr Jourdain

¾a !, v m'ap ! ?ôz l'almanaà, ç savùr qd i y a ' lune ù qd i n'y ? a pt.

¾maî)e d philosophie ¾sùt.

Fig. 4.10 Texte de Molière en intégral puis en abrégé.

Dans l'exemple de la gure 4.10, on peut voir qu'une lettre en majuscule est représentée en braille par deux caractères : le caractère ¾ précisant qu'il s'agit d'une majuscule et le caractère lui-même. On peut également trouver l'abréviation de symboles : monsieur possède pour symbole en braille abrégé mr ; vous devient v ; pour devient ç . . . A partir de cela, on comprend aisément que Monsieur se traduise par ¾mr en braille abrégé. De plus, on rencontre quelques contractions : dans le mot apprenez , pr est suivi d'une voyelle et se contracte donc en ! ; oi se contracte quelque soit son emplacement en ù dans moi , savoir et soit . Remarquons que ù est également le symbole du mot et .

Dans cet exemple, on observe aussi quelques caractères inhabituels comme Ñ . Ceux-ci ne font pas partie du braille abrégé mais ont été introduits pour les besoins de la program-mation. En eet, l'alphabet braille ore 26 possibilités (soit 64 combinaisons), et le français n'en utilise que 50 (26 lettres, 10 signes de ponctuations et 14 signes comprenant 13 lettres accentuées et le ç ). Il en découle 14 possibilités de symboles braille, appelés caractères hors séries , qui sont utilisés essentiellement pour le braille abrégé et ne correspondent pas à des caractères utilisés dans la langue française. C'est pour cela que ces caractères hors séries ont été traduits par des caractères spéciaux dans notre application. Par exemple or se contracte en Ñ , ce qui correspond en fait à un caractère braille non traductible en français. Le caractère ¾ représentant une majuscule fait d'ailleurs lui aussi partie des caractères hors séries.

Sur le tableau 4.2, nous remarquons comme attendue, une diminution du nombre de caractères entre le texte originale et le texte abrégé, correspondant à des pourcentage de réduction de 20 à 30%. De plus nous observons des temps d'exécution acceptable pour une utilisation sur Internet. Nous pouvons remarquer que le temps d'exécution n'est pas directement lié au nombre de mots du texte initial. De plus, il n'est pas non plus possible

Texte original Texte abrégé

Nb de Nb de Nb moyen de Nb de Pourcentage Temps d'exécution mots caractères caractères par mots caractères de réduction en ms

T exte1 1077 2466 2,28 1828 25% 172ms T exte2 1346 2960 2,19 2181 26% 391ms T exte3 5231 12877 2,46 9147 28% 703ms T exte4 1721 3749 2,17 2697 28% 453ms T exte5 679 1808 2,66 1250 30% 282ms T exte6 869 2240 2,57 1659 25% 297ms T exte7 7870 19963 2,53 14297 28% 2188ms T exte8 2019 4930 2,44 3573 27% 546ms T exte9 3817 9846 2,57 7238 26% 1031ms T exte10 852 2414 2,83 1815 24% 390ms

Tab. 4.2 Résultats de tests de conversion en braille abrégé sur diérents textes. d'établir de relation directe entre le genre du texte (pièces de théâtre pour les textes 1 et 2, contes pour enfants pour les textes 3 et 4, autobiographies pour les textes 5 et 8, ou encore romans pour les textes 6, 7, 9 et 10) et le temps d'exécution. Cependant sauf quelques permutations on peut fortement corréler le nombre de caractères au temps d'exécution. Il est à noter que, dans ce tableau, le nombre de mots indiqué ne représente pas les mots tels qu'ils sont dénis dans la langue française, mais plutôt tels qu'ils sont utilisés dans le code de cette application. Ainsi les caractères de ponctuation et les espaces représentent des mots à part entière, ce qui explique que le nombre moyen de caractères par mot soit peu élevé. Les tests ont été eectués sur des textes relativement courts puisque cette application est destinée à transcrire des pages (ou des morceaux de pages) web, et non des documents importants comme des livres.

4.4 Optimisation d'un clavier virtuel par des fourmis