Reconnaissance automatique des formes

Top PDF Reconnaissance automatique des formes:

Modèle probabiliste indexé par des arbres pour la reconnaissance de formes : application à la reconnaissance automatique de la parole

Modèle probabiliste indexé par des arbres pour la reconnaissance de formes : application à la reconnaissance automatique de la parole

III.4.2 Les Systèmes De Compréhension Les systèmes de compréhension se caractérisent par un vocabulaire limité et par une sémantique fermée. Les applications généralement choisies sont de type par exemple comme l'interrogation d'une base de données, les standards téléphoniques automatisés qui donnent des renseignements météo, ou même permettent de réserver des places. Ces systèmes sont connectés à des modules d'interprétation de message reconnu, dont le but est de réagir soit par l'émission d'une réponse vocale soit par une action mécanique sur l'environnement après prise de décision. De ce fait, la performance de ces systèmes doit être jugée sur la base du nombre de phrases reconnues. Beaucoup de grands systèmes ont été conçus autour du projet ARPA lancé en 1977 aux USA. Aujourd'hui, plusieurs laboratoires travaillent sur le projet DARPA (CMU, MIT, BBN, SRI .). Par exemple, le système SPHINX développé au CMU, suppose l'emploi d'un petit vocabulaire (les milles mots du corpus ''Ressources Management Data Base''). Il a par contre le mérite de permettre aux locuteurs une parole continue et ne nécessite pas d'apprentissage préalable. Le taux de reconnaissance sur les mots est de l'ordre de 96%.
En savoir plus

84 En savoir plus

Reconnaissance automatique de la parole avec intelligence artificielle

Reconnaissance automatique de la parole avec intelligence artificielle

II-Tifinagh : II-1- Présentation : Le Tifinagh, pluriel de Tafineq qui signifie caractère d'écriture en touarègue, désigne toutes les gravures et les peintures aussi bien que les caractères alphabétiques. D'autres sources tendent à expliquer que le mot « Tifinagh » viendrait du verbe « Fnagh » qui veut dire : J’ai dessiné. Ou encore, une étymologie populaire déclare qu'il s'agirait d'un mot composé de « tifin » qui signifie : trouvaille ou découverte, et de l'adjectif possessif « nagh » qui signifie : notre ; le tout donne : notre découverte. Le Tifinagh est un alphabet consonantique utilisé par les Amazighs en Afrique du nord. L’origine de cette écriture plonge ses racines dans la Préhistoire, à la période Néolithique dite capsienne, comme l’attestent les nombreuses gravures rupestres où les signes de cette écriture, dite « libyque », de formes géométriques simples, se trouvent associés à des scènes de la vie quotidienne, de chasse ou de représentations des animaux de cette époque. Tombé en désuétude depuis l'Antiquité, il fut conservé uniquement dans la sphère linguistique touarègue (Sahara algérien, malien, libyen et nigérien) jusqu'au début du XX e siècle avant d'être réintroduit par les militants kabyles de
En savoir plus

63 En savoir plus

Reconnaissance automatique des entités nommées arabes et leur traduction vers le français

Reconnaissance automatique des entités nommées arabes et leur traduction vers le français

 la traduction dans la langue cible. Les dictionnaires ainsi établis doivent être compilés dans la plateforme NooJ avant d'être utilisés. Leur compilation est effectuée aussi dans NooJ. Concernant les transducteurs, traitant et produisant des formes syntaxiques des EN, des traductions, des annotations et des transformations, nous n’allons pas les présenter ici puisque nous les avons déjà cités et expliqués dans les deux chapitres précédents. En plus de ces transducteurs, nous avons ajouté celui qui permet de résoudre le problème d’agglutination des EN arabes. Le principe de ce transducteur est de tester si le mot commence par ب bi, ف fa, ك ka, ل li, و wa. Si c’est le cas, alors on parcourt le reste du mot. Si la catégorie grammaticale du reste du mot est un nom ou un adjectif alors la sortie de cette grammaire sera l’annotation du premier alphabet composant le mot concerné par sa catégorie grammaticale correspondante : CONJ pour conjonction, PREP pour préposition et ARTDEF pour l’outil de détermination.
En savoir plus

147 En savoir plus

2015 — Reconnaissance automatique des émotions spontanées à partir du signal de parole

2015 — Reconnaissance automatique des émotions spontanées à partir du signal de parole

6.2.1 Construction de l'espace d'ancrage Dans un problème de reconnaissance de formes où le nombre de classes est illimité tel qu’un problème de vérification de locuteur, c’est un sous-ensemble de locuteurs ou de locuteurs virtuels (obtenus par regroupement de locuteurs) le plus représentatif de l’ensemble de tous les locuteurs qui est utilisé pour générer les modèles de référence. Lorsque le problème en main implique un nombre limité de classes, comme c’est le cas pour la reconnaissance des émotions, nous avons la possibilité de modéliser l'ensemble des classes d'émotion. Ainsi, dans ce type de problème à catégories multiples, toutes les classes ont l'avantage d'être bien représentées dans l'espace d'ancrage. Nous pouvons souligner deux différences principales entre les modèles d'ancrage appliqués à la reconnaissance du locuteur et ceux appliqués à la reconnaissance des émotions. Tout d'abord, pour le cas de la reconnaissance du locuteur, l'espace d'ancrage possède une dimension élevée composée d'une centaine de modèles de locuteurs. Pour la RAE, la dimension de l'espace d'ancrage est beaucoup moins élevée en raison du nombre limité de classes d'émotion disponibles. Deuxièmement, en reconnaissance du locuteur, la personne à caractériser dans l'espace d'ancrage lors de la phase d’entrainement ou de test, n'appartient généralement pas à l'ensemble des modèles d'ancrage. Par contre en RAE, l'émotion de l’énoncé de test appartient déjà à l'ensemble des modèles d'ancrage étant donné que tous les modèles des classes d'émotion sont utilisés comme modèles d'ancrage. Si chacune des C classes d’émotion est modélisée par un GMM λ i , l'espace de référence
En savoir plus

271 En savoir plus

Reconnaissance automatique de la parole en milieu réel bruité par fusion audiovisuelle

Reconnaissance automatique de la parole en milieu réel bruité par fusion audiovisuelle

46 correspondance d'imagettes de ces éléments sur l'image, la bouche était localisée de façon relativement précise par une approche « template matching ». (Shdaifat et al. 2001) localisent directement la bouche sur une image présentant un visage complet avec un fond non-uniforme, en utilisant la corrélation entre une image de « bouche moyenne » et l'image à analyser. Dans un premier temps, les auteurs constituent par inspection visuelle, des classes des différentes formes de bouche susceptibles d'être rencontrées (visèmes). Puis des images représentatives de ces cinq visèmes sont moyennées pour obtenir une image de « bouche moyenne » utilisée pour localiser la bouche sur l'image. Les auteurs reconnaissent que des éléments du visage autres que la bouche peuvent être détectés à tort (yeux notamment) et proposent de raffiner la recherche en calculant la corrélation entre des imagettes des commissures droite et gauche de la bouche, du même locuteur, et les zones de l'image à analyser où le coefficient de corrélation dépasse un seuil. Les commissures sont ainsi localisées et leur position sert de référence pour normaliser l'image en rotation et en échelle. L'image de la zone de la bouche normalisée est finalement comparée aux images des cinq visèmes pour sa classification. Des expérimentations de cette méthode ont été effectuées pour quatre locuteurs, et les taux de classification correcte obtenus varient de façon très importante selon le locuteur et la généralisation de ces travaux mono- locuteur à un cadre multi-locuteurs ne nous semble pas évidente.
En savoir plus

158 En savoir plus

Techniques d’apprentissage pour la sélection d’attributs : Application à la reconnaissance des formes

Techniques d’apprentissage pour la sélection d’attributs : Application à la reconnaissance des formes

3.1. Bases de validation Pour l'évaluation expérimentale de l’approche, dix-huit (18) bases de données de référence ont été utilisées. dix (10) bases de données médicales sont choisies de UCI Machine Learning Repository [Bache 2013]: Wisconsin Breast Cancer (WDBC), Breast Cancer (Ljubljana), Diabetic Retinopathy Debrecen (DRD), Pima Indiana Diabetes, Hepatitis, Parkinson’s, Heart Disease, Cleveland Heart Disease, Echocardiogram (ECG) et Cardiac Catheterization Diagnostic. Une autre base de données réelle de référence dans le diagnostic automatique de la maladie du glaucome RIM-ONE [Fumero 2011], la base de données réelle du dépistage du cancer du sein DDSM [Heath 2001]. Prostate Cancer et VA Lung Cancer de Vanderbilt Biostatistics Wiki [Frank 2016]. Appendicitis de Shalom Weiss [Weiss 1990]. Trois autres bases de données médicales de Ludmila Kuncheva Collection (LKC) [Kuncheva 2004] ont contribué à l'évaluation de ce travail. Celles-ci sont : Weaning, Respiratory et Laryngeal_2. Toutes ces bases de données sont utilisées dans le contexte de la classification binaire et ont contribué à l'évaluation de nombreuses études. Une description détaillée des bases de données utilisées est présentée dans la table 5.1
En savoir plus

181 En savoir plus

Répertoire des Notaires parisiens Segmentation automatique et reconnaissance d'écriture

Répertoire des Notaires parisiens Segmentation automatique et reconnaissance d'écriture

On opère différemment pour les lignes de texte ou de chiffres dans les colonnes 1-5 et 7-9 : on applique d’abord un filtre gaussien (c’est-à-dire qu’on rend l’image floue, ce qui permet d’obtenir des formes moins précises et donc où les formes des différents caractères, par exemple deux chiffres, se touchent et forment ainsi des composantes connectées) avant de les binariser. On obtient ainsi des composantes connectées, à peu près un polygone par chiffre, nombre ou mot, qu’on peut aligner à une ligne de la colonne 6 grâce à la position verticale de son centroïde (le centre de gravité d’un polygone, l’intersection de ses diagonales) [ 6 ]. Il arrive que des objets appartenant à des lignes différentes soient faussement régroupés dans un même polygone ; on peut résoudre ce problème par un découpage en fonction de maxima déterminés par rapport à la distance moyenne entre les lignes. L’avantage de cette méthode est qu’elle permet d’avoir les hampes et les descendantes dans un même polygone.
En savoir plus

12 En savoir plus

Reconnaissance automatique de la parole arabe par CMU SPHINX 4

Reconnaissance automatique de la parole arabe par CMU SPHINX 4

26 vif d'une conversation, les phrases agrammaticales se mêlent aux phrases incomplètes, tandis que fourmillent hésitations, reprises, retours en arrières, ou autres répétitions. Cependant, l'exercice même de la dictée sous-entend l'utilisation de plusieurs dizaines voire plusieurs centaines de milliers de formes fléchies. Les mots sont pris en contexte, et régis par une syntaxe aussi libre que la grammaire de la langue naturelle le permet. De plus, s'il nous faut comparer la séance de dictée à une scène connue, il s'agit de reproduire plutôt le scénario du médecin dictant une lettre à sa secrétaire, que celle de l'institutrice vérifiant les connaissances de ses élèves. Cette précision est importante dans la mesure où l'utilisateur n'a pas forcément comme l'enseignant, devant les yeux un texte déjà écrit. Il improvise, et donc doit pouvoir se tromper, revenir en arrière afin de corriger un mot ou remanier une tournure.
En savoir plus

91 En savoir plus

Reconnaissance d es Formes - Intelligence Artificielle (RF - IA

Reconnaissance d es Formes - Intelligence Artificielle (RF - IA

II.2 Reconnaissance Manuscrite 5000 ans après son invention, 550 ans après son automatisation, l‟écriture est toujours au cœur des communications entre les hommes. A l‟heure des interactions entre l‟humain et la machine toujours plus sophistiquées et performantes à l‟aide de" boutons", de microphones ou de cameras, il est naturel de chercher à comprendre automatiquement l‟écriture. Depuis les premières tentatives, les systèmes de lecture des adresses pour le traitement automatique du courrier ou de lecture des chèques ont connu d‟importants développements et sont maintenant largement utilisés. Toutefois, la compréhension de l‟écriture par un ordinateur est encore loin d'être pleinement satisfaisante. La raison est liée au fait que l‟étude de la reconnaissance de l‟écriture est un domaine très vaste tant par ses applications que par ses techniques.
En savoir plus

113 En savoir plus

Outils d'apprentissage automatique pour la reconnaissance de signaux temporels

Outils d'apprentissage automatique pour la reconnaissance de signaux temporels

Par la suite, la reconnaissance précoce d’actions humaines est devenue une thématique cen- trale dans la communauté de vision artificielle. [Davis et Tyagi, 2006] reformule le problème dans un cadre d’inférence probabiliste et utilise un ratio de probabilités pour prendre une décision. Cette approche suppose qu’un HMM génératif appris de manière usuelle sur les événements complets peut aussi générer des séquences partielles. [Ryoo, 2011] modélise la partie masquée d’un événement comme une variable latente et propose une extension du paradigme de sacs de mots, sous la forme d’un histogramme dynamique de caractéristiques spatio-temporelles. [Li et Fu, 2012] propose de nouveaux descripteurs, construits comme des histogrammes de vitesses orientées, et couple un HMM à un modèle auto-régressif afin de tirer partie de puissances prédictives complémentaires. En effet, un HMM est supposé prédire correctement des formes globales dans des séries temporelles, tandis que le modèle auto-régressif est attendu sur la prédiction des valeurs futures dans un rayon local de la sé- rie temporelle. Ces travaux sont par la suite étendus à la prise en compte du contexte dans le processus décisionnel [Li et Fu, 2014] . Enfin, [Cao et coll., 2013] présente une étude géné- rale (englobant le concept de classification précoce) dans laquelle l’absence d’information n’est pas nécessairement située à la fin de la série temporelle, mais n’importe où. Les au- teurs mettent en place un cadre bayésien dans lequel la vraisemblance est calculée à partir de l’erreur d’approximation parcimonieuse de la séquence partiellement observée à classer. Toutefois, un réel essor est donné avec les travaux de Xing et coll., qui proposent une méthode capable de classer une série temporelle précocement en assurant que la déci- sion aurait été identique en analysant la séquence dans sa globalité [Xing et coll., 2009] . Cette approche se fonde sur la règle de décision du plus proche voisin et le principe de distance minimale de prédiction. Considérons un ensemble de séquences d’apprentissage {(s i , y i ) } 1≤i≤n , et pour un certain indice temporel t, la troncature s i | t de la série s i (i ∈ N n ) correspondant à ses t premières valeurs. On appelle plus proches voisins inverses de s i , toutes les séquences de l’ensemble d’apprentissage dont le plus proche voisin est s i . Avec ces dé- finitions, la distance minimale de prédiction de s i correspond au plus petit indice temporel t tel que les plus proches voisins inverses de s i | t existent et ne changent pas lorsque le reste de la série est progressivement observé (i.e. pour tout indice t 0 pris entre t et T , les plus proches voisins inverses de s i | t 0 existent et coïncident avec ceux de s i ). Une séquence in-
En savoir plus

188 En savoir plus

Systèmes de Reconnaissance Automatique de la Parole

Systèmes de Reconnaissance Automatique de la Parole

CHAPITRE IV LA RECONNAISSANCE AUTO MATIQUE DE LA PAROLE IV.2.1 La programmation dynamique : Lorsqu'un locuteur, même entraîné, répète plusieurs fois une phrase ou un mot, il ne peut éviter les variations du rythme de prononciation ou de la vitesse d'élocution, ces variations entraînent des transformations non linéaires dans le temps du signal acoustique, ce qui fait qu'on ne pourra comparer directement point à point (matching) deux formes acoustiques sans correction temporelle au préalable. Pour établir une meilleure correspondance entre les axes temporels des deux mots, en même temps que leurs comparaisons, on utilise une technique appelée technique d'alignement temporel dynamique ou DTW. C'est une technique basée sur la programmation dynamique qui consiste à trouver la trajectoire optimale entre le mot de référence et le mot inconnu [25].
En savoir plus

58 En savoir plus

La Reconnaissance Automatique de la Maladie de Parkinson

La Reconnaissance Automatique de la Maladie de Parkinson

I.6. Prise en charge I.6.1. Traitement médicamenteux Actuellement, aucun médicament n'a démontré d'efficacité sur la progression de la maladie : il n'existe pas de traitement curatif de la maladie. Les traitements médicamenteux restent donc aujourd'hui encore purement symptomatiques [2]. La L-DOPA est le traitement le plus utilisé car le plus actif. Ce médicament va être transformé en dopamine et utilisé par l‟organisme. La transformation se passe dans le système nerveux central mais aussi dans tout l‟organisme par la DOPA décarboxylase au niveau sanguin. Pour cette raison, ce traitement est couplé à un inhibiteur de la décarboxylase périphérique ou de la catheco-O-méthyl transférase qui permet de diminuer la transformation périphérique et ainsi de diminuer les effets secondaires tout en multipliant par 10 la disponibilité au niveau du système nerveux central. Les effets secondaires comme des nausées ou des vomissements sont devenus rares lorsque l'on augmente les doses progressivement. La L-DOPA a une demi-vie (temps au bout duquel la molécule est à moitié éliminée de l'organisme) comprise entre 1h30 et 3h. Les prises du médicament seront donc répétées et régulières tout au long de la journée afin de maintenir un taux sanguin stable, et donc un effet clinique permanent. L'effet des médicaments va se modifier au cours du temps en raison d'une augmentation de la sensibilité des récepteurs cérébraux à la L-DOPA et de la diminution de la durée d'action de chaque prise de médicaments. Ces deux particularités vont respectivement entraîner des fluctuations d'effet et des dyskinésies. Les fluctuations motrices peuvent être précoces. Le malade présente des états de blocage au cours de la journée imposant des modifications d'horaires et l'utilisation de formes à libération prolongée. Les dyskinésies surviennent le plus souvent au moment où les taux de L-DOPA sont le plus importants dans le sang. Elles peuvent être retardées par la prise d'agonistes dopaminergiques. Lorsque celles-ci surviennent, il est nécessaire de diminuer la dose de la prise unitaire de L-DOPA. [2]
En savoir plus

62 En savoir plus

RECONNAISSANCE DE FORMES
APPLIQUEE A L’ECRITURE ARABEMANUSCRITE
PAR DES MULTICLASSIFIEURS

RECONNAISSANCE DE FORMES APPLIQUEE A L’ECRITURE ARABEMANUSCRITE PAR DES MULTICLASSIFIEURS

2 Introduction générale Les techniques liées au traitement de l’information connaissent actuellement un développement très actif en liaison avec l’informatique et présentent un potentiel de plus en plus important dans le domaine de l’interface homme machine. L’écriture restera l’un des grands fondements des civilisations et le mode par excellence de conservation et de transmission du savoir. La reconnaissance de l’écriture est un domaine vaste qui constitue un sous ensemble des systèmes de la reconnaissance des formes (RF). Ces systèmes sont la première étape d’un processus de compréhension de notre univers dans le cadre global de la communication homme machine. La reconnaissance de l’écriture manuscrite ou imprimée reste encore un sujet de recherche et d’expérimentation, le problème n’est pas encore entièrement résolu bien que l’on sache atteindre des taux assez élevés dans certaines applications pour lesquelles soit le vocabulaire est limité, soit la fonte est unique ou en nombre restreint.
En savoir plus

116 En savoir plus

Reconnaissance de formes basée sur l'approche possibiliste dans les images mammographiques

Reconnaissance de formes basée sur l'approche possibiliste dans les images mammographiques

Face ` a l’augmentation significative du taux de mortalit´e par cancer du sein chez les femmes ainsi que la croissance continue du nombre de mammographies r´ealis´ees chaque ann´ee, le diagnostic assist´e par ordinateur devient de plus en plus imp´eratif pour les experts. Dans notre travail de th`ese, une attention particuli`ere est accord´ee aux masses mammaires vu qu’elles repr´esentent le signe de cancer du sein le plus couramment ob- serv´e en mammographies. N´eanmoins, ces images pr´esentent un tr`es faible contraste, ce qui fait que les fronti`eres entre les tissus sains et les masses sont mal d´efinies. C’est ainsi qu’il est difficile de pouvoir discerner avec pr´ecision ces masses et de leur d´efinir un contour unique. En outre, la complexit´e et la grande variabilit´e des formes des masses mammaires rendent les tˆaches de diagnostic et de classification difficiles.
En savoir plus

133 En savoir plus

Le scanner laser 3D : reconnaissance de formes et modélisation de déformations

Le scanner laser 3D : reconnaissance de formes et modélisation de déformations

implicites. a) A partir d’un point Cette méthode de reconnaissance de formes constitue le principe de l’extraction simplifiée. À partir de la sélection d’un point, l’algorithme calcule, à l’aide de ses points voisins, un modèle CAO a priori, ce dernier servant de base pour le reste de l’algorithme. L’étape suivante concerne le choix du point de base, considéré comme appartenant au cylindre par la suite. Il est donc nécessaire qu’il soit le plus proche possible du modèle a priori. Une recherche de ce point est alors effectuée, avec l’utilisation d’un algorithme de rejet, lorsque la distance-point modèle dépasse un certain seuil. Une fois le point trouvé, l’algorithme de traitement utilise ses proches voisins à l’aide d’une sphère. Par la suite, il projette ces points sur un plan, coplanaire à la base du cylindre. A partir du résultat obtenu, l’algorithme va déterminer le meilleur cercle sur ce plan, c’est- à-dire celui qui est le plus adapté à l’ensemble des points projetés. Ce dernier constitue donc la base du modèle CAO à obtenir, le traitement aborde ensuite l’ajustement de la longueur du cylindre par rapport au nuage de points. Cet algorithme tient donc essentiellement compte du voisinage du point sélectionné, d’où l’intérêt de centrer la zone d’étude sur une surface correcte (à éviter à proximité d’un cône réducteur ou d’un coude).
En savoir plus

99 En savoir plus

Développement et exploitation de méthodes de reconnaissance de formes pour des applications industrielles

Développement et exploitation de méthodes de reconnaissance de formes pour des applications industrielles

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignemen[r]

150 En savoir plus

Gémellité et reconnaissance automatique du locuteur

Gémellité et reconnaissance automatique du locuteur

Pour compl´eter notre d´emarche, r´ealis´ee `a partir de l’´etude des coefficients cepstraux (et de leurs d´eriv´ees), un syst`eme bas´e sur des crit`eres prosodiques pourrait ˆetre impl´ement´e pour ´evaluer l’influence de la g´emellit´e sur le rythme et/ou l’intonation des locuteurs. Plus g´en´eralement, l’´etude de param`etres de stabilit´e de la voix (jitter, shimmer, coefficient de variation de la F0) pour- rait permettre de mettre en ´evidence les aspects physio- logiques au niveau de la source laryng´ee. Enfin, `a l’ins- tar de Nolan [9], une analyse de la coarticulation pourrait laisser apparaˆıtre des similarit´es, cons´equences de ressem- blances anatomiques de l’appareil phonatoire mais aussi des diff´erences dues `a une utilisation personnalis´ee. Enfin, le champ de cet article pourrait ˆetre ´etendu par l’´etude de l’influence de la taille de la base de donn´ees sur l’interpr´etation des r´esultats obtenus par un syst`eme de RAL. La r´ealisation d’une exp´erience similaire sur des pe- tits ´echantillons tir´es, al´eatoirement ou suivant des crit`eres pr´ecis, d’un corpus de taille cons´equente, compl´eterait notre ´etude. En effet, les r´esultats et leurs intervalles de confiance calcul´es dans ce papier renforcent l’id´ee d’extrˆeme pr´ecaution [2] dont il faut faire preuve pour toute application relevant de la v´erification automatique du locuteur.
En savoir plus

5 En savoir plus

Approches Ensemblistes de Classification et Sélection des Prédicteurs pour la Reconnaissance de Formes

Approches Ensemblistes de Classification et Sélection des Prédicteurs pour la Reconnaissance de Formes

76 L'extraction de caractéristiques est une tâche très importante dans tous systèmes de reconnaissance de formes [Liu 2013 ; Sundararaj 2014]. Elle vise à extraire les informations pertinentes d’une image et les transformer à des mesures distinctes pour les utiliser à l’étape de classification. Plusieurs techniques d'extraction des caractéristiques ont été proposées pour l'analyse des images [El-Atlas 2014]. Les méthodes d'extraction des caractéristiques sont variantes et dépendantes du choix des descripteurs employés (descripteur bas niveau, descripteur haut niveau) ainsi que du type d'image à analyser (image binaire, image en niveaux de gris et image couleur). Dans notre proposition, nous avons choisi de décrire nos images par une combinaison des informations de bas niveau comme : la forme et la texture. Les moments de Hu et les moments centraux ont été utilisés pour représenter la forme, tandis que la matrice de co-occurrence a été utilisée pour assurer la texture. Nos images ont été éventuellement représentées par un grand vecteur de caractéristiques incluant les valeurs de ces trois familles de caractéristiques (ce vecteur contient plus de 24 caractéristiques).
En savoir plus

191 En savoir plus

Simulation d'erreurs de reconnaissance automatique dans un cadre de compréhension de la parole

Simulation d'erreurs de reconnaissance automatique dans un cadre de compréhension de la parole

CVER 31,6 25,1 27,7 31,3 27,7 28,3 30,3 25,3 33 T ABLE 1 – Comparaison de différents APP en CER et CVER sur un TEST et un DEV automatique. Nous pouvons d’abord noter que notre hypothèse sur l’importance d’apprendre sur des données proches des données de test (avec des transcriptions automatiques ou contenant des simulations d’erreurs) est vérifiée : avec l’APP A, les résultats des RNR-EDA et des CRF sont significativement meilleurs que ceux fait avec un APP M. On voit également que les CRF surpassent significativement les RNR-EDA sus les corpus d’entraînement M et A. Il est également clair que l’entraînement d’un SCAP sur des transcriptions manuelles est largement insuffisant pour gérer les transcriptions automatiques. Le système doit être préparé aux erreurs de transcriptions.
En savoir plus

10 En savoir plus

Des images au texte : LECTAUREP, un projet de reconnaissance automatique d'écriture

Des images au texte : LECTAUREP, un projet de reconnaissance automatique d'écriture

Il s’agit de rendre un patrimoine commun accessible, appropriable et “enrichissable” par de nouveaux publics grâce au traitement des numérisations de la collection de répertoires. L’interprétation de ces images fait intervenir en premier lieu des technologies de reconnaissance automatique d’écriture (REM) et d’extraction de structure logique (ESL). Ce travail implique en outre nécessairement l’établissement d’une chaîne de traitement des données ainsi que leur modélisation.

5 En savoir plus

Show all 2508 documents...