APPRENDRE ET RECONNAÎTRE les mécanismes fondamentaux

APPRENDRE ET RECONNAÎTRE

APPRENDRE ET RECONNAÎTRE

APPRENDRE ET RECONNAÎTRE

APPRENDRE ET RECONNAÎTRE les mécanismes fondamentaux

3.1 Problématique . . . 48

I. Apprentissage en ligne . . . 48

II. Apprentissage non-supervisé . . . 49

3.2 Neurone et modèles . . . 50

I. Le neurone biologique . . . 51

II. Les modèles du neurone, décrire c’est choisir . . . 53

III. Les modéles biophysique . . . 54

IV. L’approche fréquentielle . . . 55

V. L’approche impulsionnelle . . . 57

VI. L’approche stochastique . . . 57

VII. Positionnement de notre approche . . . 58

3.3 Neurones, cartes et connectivité . . . 59

I. Cartes neuronales, invariance à la translation . . . 59

II. Hiérarchie et compétition . . . 60

3.4 Le modèle "intègre et tire" . . . 60

I. Intégration . . . 60

II. Tir . . . 62

3.5 Apprentissage et compétition . . . 65

I. La règle de Hebb . . . 65

II. La compétition par inhibitions latérales . . . 65

III. Compétition à l’activation . . . 67

IV. Loi d’apprentissage . . . 68

V. Matrices de poids adaptatives . . . 69

3.6 Les 3 voies de la perception . . . 71

3.7 La représentation des objets . . . 72

I. Représentation par vues, structure du réseau . . . 72

II. Association temporelle et spatiale de vues, invariance à l’objet . . . 74

3.8 La représentation des positions et des actions . . . 75

I. Cartes temporisées . . . 75

48 3

II. La représentation égocentrique de l’espace . . . 79

III. La représentation proprioceptive des actions . . . 80

IV. L’apprentissage incrémental de motifs de position et d’action . . . 80

3.9 Récompense perçue, récompense induite . . . 81

3.10 Conclusion . . . 83

Références . . . 83

3.1 Problématique

L’état du monde n’est pas directement accessible. Seule la mesure, l’observation

par l’intermédiaire de capteurs permet de mettre en lumière la structure de

l’environ-nement. Les capteurs selon leur nature, ne fournissent qu’un reflet incomplet et plus ou

moins dégradé de la réalité : l’image enregistrée par une caméra ne rendra pas compte

de l’information de profondeur dans la scène observée, un capteur laser sera incapable

de mesurer la couleur d’un objet... Il semble donc à première vue difficile de concevoir

un système capable de construire de manière autonome une représentation fidèle de

l’environnent dans lequel il évolue. Le robot dispose en plus de ses capteurs d’une

mé-moire capable de conserver la trace des observations passées. Cette mémé-moire est un outil

essentiel pour détecter des structures stables au cours du temps et lors du changement

de point de vue et ainsi identifier des classes d’objets perceptifs. Mesure et mémoire

sont les deux fonctions essentielles de nos unités de traitement, les neurones. Nous

pré-senterons dans ce chapitre le modèle de réseau de neurones artificiel implanté dans le

simulateur appelé NeuSter, qui a servi à la fois d’outil et de plate-forme

d’expérimen-tation durant toute la durée de nos travaux. Dans un premier temps, nous présenterons

les principes de l’apprentissage en ligne non supervisé ainsi que les solutions proposées

dans la littérature. Dans un deuxième temps, nous décrirons le modèle de neurone et les

schémas de connexion qui sont exploités pour la tâche de décomposition du contexte

perceptif dans la boucle sensori-motrice présentée au Chapitre 1. Cette présentation

sera précédée d’un bref panorama de trois différentes familles de modèles de neurones

proposées dans la littérature. Enfin, la dernière partie de ce chapitre sera consacrée à

l’exploitation de notre modèle de neurone pour la tâche de décomposition du contexte

perceptif selon trois axes : l’apprentissage des représentations d’objet, l’apprentissage

de motifs de position et l’apprentissage de motifs d’actions.

I. Apprentissage en ligne

Notre système doit permettre un apprentissage en ligne (on-line learning) de données

perçues en temps réel. Ce type d’apprentissage est à opposer aux méthodes

d’appren-tissage hors-ligne (batch learning) pour lesquelles toutes les données d’apprend’appren-tissage

sont fournies au système durant une phase d’apprentissage indépendante de la phase

d’exploitation sur des données réelles. Il est donc primordial de limiter au maximum le

temps de calcul global qui, dans le cadre des réseaux de neurones formels, inclut à la

fois le temps de traitement unitaire du neurone et le temps de propagation de

l’infor-3

49

mation au sein du réseau. Notre objectif étant d’autre part un apprentissage ouvert,

donc une acquisition incrémentale de connaissances, nous devons limiter l’incidence de

l’augmentation des connaissances sur la performance du réseau.

Le simulateur NeuSter a été conçu afin de permettre la distribution des calculs sur

de multiples machines connectées au sein d’un réseau local. Il est ainsi bien adapté au

calcul de réseaux de grandes tailles. Cependant, pour que le parallélisme du calcul soit

vraiment efficace, il est nécessaire d’y adjoindre une forme compacte de transmission

de l’information. Une solution à ce problème est d’utiliser un modèle de propagation