• Aucun résultat trouvé

Chapitre 4 :Reconnaissance de caractères arabes et amazighes manuscrits isolés par

7. Présentation de l’écriture arabe et amazighe

7. Présentation de l’écriture arabe et amazighe

Dans cette section, nous présentons un aperçu sur les principales caractéristiques morphologiques de l’écriture arabe et amazighe. Pour une synthèse plus détaillée de ces caractéristiques, les lecteurs peuvent se référer aux travaux ([Bena00], [El-Ha07], [Mena08], [Kess09], [Essa12]).

7.1.Caractéristiques morphologiques de l’écriture arabe

L'écriture arabe est semi-cursive aussi bien dans sa forme imprimée que manuscrite. Elle s’écrit de droite à gauche. Elle comprend un alphabet comportant 28 lettres comme le montre la Figure 4-1 ci-dessous.

En écriture arabe, il n’y a pas de différence entre les lettres manuscrites et les lettres imprimées. Les notions de lettre capitale et lettre minuscule n’existent pas. En revanche, la plupart des lettres s’attachent entre elles, même en imprimé. Leurs graphies différent selon qu’elles sont précédées et/ou suivies d’autres lettres ou qu’elles sont isolées. C.-à-d. leur forme dépend de leur position dans le mot. Certaines lettres prennent jusqu’à 4 formes différentes : par exemple la lettre kaf (k) ( , , , ) ou le Mim (M) ( , , , ).

Figure 4-1 : Alphabet arabe

En plus, des spécificités signalées préalablement, l’écriture arabe possède d’autres caractéristiques. Nous citons les plus courantes, notamment les signes diacritiques, ascendants et descendants et la notion de pseudo mot.

Signes diacritiques

la majorité des caractères isolés arabes reposent sur le même tracé de base. En effet, dans le but de différencier entre eux, On a recourt à la notion de signe diacritique. Elle constitue une composante secondaire d’une lettre, qui vient la compléter ou en modifier le sens. Dans l’alphabet arabe, 15 lettres parmi les 28 possèdent un ou plusieurs points. La Figure 4-2ci- dessousillustre un ensemble des caractères avec les signes diacritiques qui sont situés soit

au-dessus, soit en dessous de la forme à laquelle ils sont associés, mais jamais les deux à la fois.

Figure 4-2 : Lettres arabes avec signes diacritiques

Au contraire au latin, les caractères arabes sont majoritairement des consonnes, les voyelles ne sont pas des lettres, mais ils sont généralement représentées par ces signes diacritiques. Ascendants et descendants

Comme dans l’écriture latine, l’écriture arabe contient des ascendants et des descendants. La Figure 4-3ci-dessous montre un exemple d’un descendant sur la lettre Mim (M) (cercle en verre), et d’un ascendant de la lettre Lam (L) (cercle en bleu).

Figure 4-3 : Les ascendants et descendants entourés et la ligne de base en rouge Notion de pseudo mot

L’alphabet arabe comporte 6 caractères qui ne sont pas connectés à leur successeur : , , , , , . Ces caractères introduisent donc une discontinuité dans le mot. Un pseudo- mot est une composante connexe associant un ou plusieurs caractères sous forme d’une séquence. Un mot peut être composé d’un ou plusieurs pseudo-mots (cf. Figure 4-4 ci- dessous).

Figure 4-4 : Le mot technologie en arabe est composé de 3 pseudos mots

Nous avons donné ci-dessus un survol sur les caractéristiques essentielles de la graphie arabe. Toutefois, Nous noterons que dans l’expérimentation (cf. Section 0) de notre système développé, nous considérons uniquement un ensemble de caractères arabes manuscrits dans leurs formes isolées sans points diacritiques. La Figure 4-5 ci-dessous montre quelques exemples de caractères étudiés.

98

7. Présentation de l’écriture arabe et amazighe

7.2.Caractéristiques morphologiques de l’écriture amazighe

L’écriture amazighe est utilisée en Afrique de nord notamment au Maroc [Essa12]. Elle est de nature alphabétique consonantique. A la différence des caractères arabes, l’écriture amazighe n’est pas cursive. Ce qui facilite toute opération de segmentation. De plus, l’écriture amazighe est écrite de gauche à droite. Elle utilise des signes de ponctuation classique acceptés en alphabet latin.

En écriture amazighe, les notions de lettre capitale et lettre minuscule n’existent pas. Il n’y a pas de différence entre la taille verticale de différentes lettres de l’alphabet. C.-à-d., tous les caractères amazighes s’écrivent de même taille verticale sauf le seul caractère ya (a), qu’est plut petit par rapport aux autres caractères. D’où, en écriture amazighe, il n’y a pas d’ascendants et descendants.

L’écriture amazighe comprend un alphabet comportant 33 lettres comme le montre la Figure 4-6 ci-dessous

Figure 4-6 : Alphabet amazighe

En plus, en écriture amazighe, il n’y a pas de notion de pseudo-mot. En revanche, la majorité des modèles graphiques des caractères amazighes est composée de points, de petits cercles, et/ou de segments. Nous distinguons généralement entre deux groupes des caractères amazighes suivants leurs formes:

− Formes circulaires: A, e, r, u, s, h, c, b.

− Formes non circulaires : t, w, z, y, i, o, p, m, l, k, j, g, f, d, q, x, n, v.

− Formes avec deux ou trois composantes connexes: æ, e, å, u, s.

L’alphabet amazighe est formée généralement des caractères sans signes diacritiques. Néanmoins, il comporte seulement deux caractères affectés d’un signe diacritique qui sont situés toujours au-dessus de la forme à laquelle ils sont associés: æ «yakw» et å «yagw».

La Figure 4-7 ci-dessous montre certaines de ces caractéristiques morphologiques dans un texte amazighe extrait dans un manuel scolaire.

Figure 4-7 : Exemple du texte amazighe dans un manuel scolaire [Essa12]

Nous avons cité ci-dessus quelques caractéristiques morphologiques de l’écriture amazighe incarnées par l’alphabet tifinagh. Ces caractéristiques seront exploitées pendant la mise en ouvre de système de reconnaissance proposé et présenté dans le chapitre 5. Néanmoins, le système de reconnaissance présenté dans ce chapitre, opère sur la forme de caractère par les fenêtres glissantes qu’il que soit son type de graphie (arabe ou amazighe). De ce fait, ce système ne tient pas compte en général des spécificités de l’écriture étudiée.

Nous présentons par la suite, les composantes de l’architecture utilisée par notre système et l’approche utilisée dans ses différentes phases. Les résultats expérimentaux ainsi que la conclusion et les perspectives de la méthode sont donnés dans les deux derniers paragraphes.