• Aucun résultat trouvé

Système automatique d'analyse morpho-lexicale d'un corpus arabe

N/A
N/A
Protected

Academic year: 2022

Partager "Système automatique d'analyse morpho-lexicale d'un corpus arabe"

Copied!
1
0
0

Texte intégral

(1)

Journées portes ouvertes sur la Faculté des Sciences Exactes JFSE 2017

55

Système automatique d'analyse morpho- lexicale d'un Corpus Arabe

Belmaoun Hafsa, Hoceini Youssef

Département Mathématique et Informatique Faculté des Sciences Exactes, Université Tahri Mohamed

Béchar, Algérie yhoceini@gmail.com

Résumé—A l’heure actuelle, le Traitement Automatique des Langues (TAL) et plus précisément la langue arabe, fait l’objet de nombreux travaux concernant d’une part, la modélisation linguistique propre à la langue, d’autres part, la conception et la réalisation des applications.

Notre projet s’intéresse à l’analyse morpho-lexical d’un corpus arabe non voyellé, le processus de traitement adapté porte sur une approche d’analyse morpho-lexicale approfondie du contenue du corpus. La stratégie adoptée repose tout d’abord sur une phase de constitution du corpus dans un domaine tel que la culture, puis une autre de segmentation du corpus au niveau du texte, paragraphe, la phrase ainsi à l’intérieur du mot afin de décortiquer les différentes unités élémentaire (préfixe, suffixe, racine et schème) et enfin la conception et réalisation d’un module d’analyse à base de règles capable de faire : le prétraitement morpho lexical, l’analyse affixale, l’analyse morphologique et le post-traitement et enfin une catégorisation morpho-lexical des différents types de mots arabes, à savoir, les noms, les verbes, et les particules (mots outils, mots spéciaux).

Mots-clés—Traitement automatique de l’arabe, corpus, Analyseur morpholexical, segmentation, règles, , analyse affixale, catégorisation morpho-lexical.

Références

Documents relatifs

On sait en effet que ce type d’approche permet de réduire la quantité de données annotées en utilisant parallèlement une grande masse de données non annotées : cette méthode

Le domaine du contrôle aérien offre l’exemple parfait de l’instauration et de la mise en pratique d’une norme langagière : la phraséologie aéronautique, un langage

Nous avons d’abord évalué le suivi des composantes corpo- relles, puis la segmentation de la main quand elle se trouve devant le visage et enfin la segmentation des gestes utilisant

Et nous avons vraiment beaucoup d’utilisateurs (y compris le droit), chacun avec un besoin différent. Le choix d’une méthode d’évaluation est implicitement à l’intention

La procédure de segmentation que nous venons de présenter peut être regardée comme un test de stationnarité, l'affirmation selon laquelle "la série est stationnaire"

structurée par la langue fait l’objet d’analyses approfondies. Joanna Bator prend pour point de départ de ses réflexions les paroles de Roland Barthes qu’elle cite dans son

A novel deep-UV polymer for nanophotonics: waveguides structures towards cascade of serial micro- resonators for ultra-sensitive detections of glucose.. Bruno Bêche 1

A l’origine Phosphore vient du grec fosforos qui signifie porteur de lumière. Dès le Moyen -Âge ce mot caractérisait tous les matériaux qui luisaient dans le noir après