Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Les améliorations apportées au réseau de neurones perceptif font de lui une solution hybride

Dans le document Réseau de neurones dynamique perceptif - Application à la reconnaissance de structures logiques de documents (Page 92-95)

A partir de travaux men´es sur la perception humaine lors de la reconnaissance de l’´ecriture,

nous avons utilis´e le mod`ele d’activation interactive de [McClelland et Rumelhart, 1981] pour

construire notre propre r´eseau de neurones. L’architecture et le fonctionnement de ce dernier

sont similaires à ceux du système Perceptro de [Côté, 1997], repris par [Snoussi Maddouri, 2003]

plus tard. Des changements nécessaires ont été effectués pour adapter l’existant au problème

de reconnaissance de structures logiques de documents, notamment le choix de primitives ainsi

que l’organisation et la s´emantique des neurones dans le r´eseau. L’analyse contextuelle utilise

d´esormais la nature hi´erarchique de la structure logique pour organiser les couches composant

le contexte. Le principe des cycles perceptifs a aussi été conservé et nous avons choisi de nous

concentrer sur la correction de la segmentation qui s’avère être la source majeure des problèmes

rencontr´es.

Partant de données bruitées, nous n’avons ni gardé la fonction d’activation à saturation, ni la

manière de fixer les poids des précédents auteurs ; nous avons proposé un apprentissage, proche

de celui du Perceptron multicouche, permettant au réseau de déterminer lui-même les relations

entre les observations physiques et les interprétations logiques. Le réseau modifié, que nous avons

nommé réseau de neurones perceptif, est plus apte à traiter des données d’entrée imparfaites.

Il conserve une architecture à représentation locale avec intégration de connaissances dans les

neurones tout en ayant une forte prédominance data-driven. La détection d’ambigu¨ıté et la

correction de la segmentation ont aussi été revues pour être en adéquation avec le nouveau

fonctionnement du r´eseau.

Les améliorations apportées au réseau de neurones perceptif font de lui une solution hybride

entre une m´ethodedata-drivenetmodel-driven avec une architecture `a mi-chemin entre

représen-tation locale et représenreprésen-tation distribuée. Les résultats obtenus sur notre base de test confortent

le fait que le choix d’une approche perceptive pour notre probl`eme est tout aussi profitable que

dans le cas de la reconnaissance du manuscrit. Si l’on compare les r´esultats obtenus `a ceux

d’expérimentations similaires présentées au chapitre 1 on s’approche de résultats comme ceux

Chapitre 3. R´eseau de neurones perceptif

de [Ishitani, 1999] ou de [Kim et coll., 2001] en notant toutefois que la majorit´e n’utilise pas

autant de structures que nous (en moyenne 7 contre 21 chez nous) et qu’elles consid`erent aussi

que les donn´ees sont parfaites. Nous n’utilisons d’ailleurs que tr`es peu d’informations concernant

la microstructure contrairement à ce que la littérature propose, et nous avons insisté sur le fait

que tous nos indices d´ependent principalement d’un seul et mˆeme OCR commercial. Le but de la

comparaison que nous avons faite avec le PMC est de montrer le gain potentiel de reconnaissance

que le réseau de neurones perceptif peut apporter à une approche très peu employée dans la

litt´erature.

Le gain de reconnaissance que nous obtenons se fait au d´etriment d’un allongement du

temps de reconnaissance. La correction des entrées ou la validation d’hypothèses peut nécessiter

plusieurs extractions des indices physiques. De plus, l’allongement peut en théorie être multiplié

par le nombre de cycles perceptifs utilis´e si tous les blocs, `a chaque passage, ont besoin d’une

nouvelle extraction. Nous estimons que pour notre base de documents scientifiques, le nombre

d’extractions supplémentaires est multiplié par deux pour le troisième cycle perceptif pour

lequel on obtient déjà de meilleurs résultats qu’avec un Perceptron multicouche. Nous allons

montrer au prochain chapitre comment diminuer ce temps de reconnaissance en limitant les

extractions physiques inutiles. L’idée développée consistera à créer une partition des entrées

servant à alimenter progressivement le réseau par des groupes de variables, et à n’utiliser les

extractions lourdes que si la forme est difficile `a reconnaˆıtre.

Chapitre 4

M´ethode de partitionnement

A

u cours du précédent chapitre, nous avons exposé le fonctionnement du réseau de neurones

perceptif en nous focalisant sur sa topologie, son apprentissage et sa reconnaissance

sin-guli`ere par correction des entr´ees et validation des sorties. Nous allons montrer dans ce

chapitre comment les cycles perceptifs, qui sont l’atout majeur du réseau, peuvent être effectués

plus rapidement et rendre le syst`eme encore plus proche de la vision humaine. Le partitionnement

des variables d’entrée que nous proposons, issu d’approches de sélection et de réduction de

données, permettra de conserver tous les concepts et les propriétés vues jusqu’à présent tout en

r´eduisant la charge de travail au niveau de l’extraction des indices physiques.

Sommaire

4.1 R´eseau de neurones perceptif et temps de reconnaissance . . . 73

4.2 Acc´el´eration de la reconnaissance . . . . 74

4.3 M´ethodes diminuant la taille de l’entr´ee . . . . 76

4.3.1 La s´election de variables . . . 76

4.3.2 Classement de variables . . . 76

4.3.3 S´election de sous-ensembles de variables . . . 78

4.3.4 R´eduction de donn´ees . . . 80

4.4 Partitionnement de l’espace d’entr´ee . . . . 83

4.4.1 Contraintes sur le choix de la m´ethode `a proposer . . . 83

4.4.2 Justification de la m´ethode . . . 85

4.4.3 Algorithme de la m´ethode . . . 87

4.4.4 Choix de la dimension du sous-espace . . . 91

4.5 Exp´erimentations . . . . 93

4.6 Conclusion . . . 100

4.1 R´eseau de neurones perceptif et temps de reconnaissance

Il est de plus en plus fr´equent que des travaux manipulant `a la fois un grand nombre de

données et de variables aient recours à des techniques de réduction de l’espace d’entrée. Les

syst`emes sont alors aliment´es par des ensembles de taille beaucoup moins importante mais tout

aussi informatifs et peuvent ensuite traiter avec plus de facilit´e le flot de donn´ees.

Chapitre 4. M´ethode de partitionnement

Les systèmes de reconnaissance dépendent généralement, en complexité, de la taille des

entrées à traiter. Que ce soit au niveau de la complexité temporelle ou spatiale, ils sont rarement

linéaires et toute réduction de l’espace d’entrée, même minime, peut entraˆıner des gains non

négligeables en termes de temps ou de place mémoire. Ces gains sont d’autant plus appréciables

pour des syst`emes polynomiaux ou exponentiels.

Dans notre syst`eme de reconnaissance de structures logiques de documents, nous avons port´e

notre choix sur une solution `a base de Perceptron multicouche. L’une des contraintes majeures

de ce type de classifieur vient du fait que plus l’entr´ee d’un r´eseau est grande, plus le temps de

reconnaissance et surtout d’apprentissage est long.

La complexit´e d’un PMC est polynomiale en son nombre de poids n. Elle d´epend aussi du

nombre de neurones k présents dans le réseau, ce qui au final donne une complexité moyenne

en _O(kn

³

). Il faut aussi noter que le nombre de neuronesk peut lui aussi ˆetre grand. En effet,

comme évoqué en sous-section 2.4 p. 43, certains problèmes nécessitent un nombre exponentiel

de neurones pour être résolus avec une seule couche cachée. Même s’il est toujours possible

de transformer ce type de r´eseau sur plusieurs couches, le nombre de neurones sera quand

même polynomial en son nombre d’entrées. Selon la nature du problème à résoudre, derrière la

constantekse trouvant dans la complexit´e du PMC, se cache un nombre qui peut aussi croˆıtre

fortement quand la taille de l’entrée et la complexité du problème augmentent. Ces considérations

sont `a envisager dans le pire des cas ; il n’en reste pas moins que la reconnaissance et surtout

l’apprentissage d’un PMC requi`erent un temps de calcul extrˆemement long bien que chaque

traitement au niveau du neurone soit ´el´ementaire.

4.2 Acc´el´eration de la reconnaissance

Les seuls moyens permettant de r´eduire de mani`ere significative ce temps polynomial sont

Dans le document Réseau de neurones dynamique perceptif - Application à la reconnaissance de structures logiques de documents (Page 92-95)

Télécharger maintenant "Réseau de neurones dyn..."

Outline

Documents relatifs