Adaptation par transfert partag´ e entre les domaines

Apprentissage autodidacte, Apprentissage multitâches, Etc. Adaptation de domaine, Biais de sélection d’échantillons, Covariance Shift,

Apprentissage partagé

Adaptation par transfert partag´ e entre les domaines

transfert de connaissances entre les domaines est r´ealis´e.

Nous nous pla¸cons dans le cadre de l’adaptation entre les domaines(AD) [133]. C’est

une m´ethode d’apprentissage par transfert permettant d’effectuer une tˆache d’adaptation

d’un syst`eme d’apprentissage d’un domaine source vers un domaine cible, (on parle aussi

d’adaptation de domaine multi-sources lorsque plusieurs domaines sources sont disponibles

[51,75,134]). La figure 5.1 donne la distinction entre l’apprentissage automatique classique

et l’apprentissage par transfert. La principale différence entre ces deux thématiques réside

au fait que les données disponibles dans les différents domaines d’apprentissage peuvent être

compl`etement diff´erents dans le cas du transfert par adaptation alors qu’elles doivent suivre

la même distribution et avoir les mêmes caractéristiques pour l’apprentissage classique.

L’objectif est d’apprendre une fonction de prédiction f à partir d’échantillons étiquetés ou

non, issus des deux domainesD

etD

, de telle sorte que la fonction f puisse permettre

au mieux l’´etiquetage de nouvelles donn´ees issues du domaine cibleD

.

Tâches source et

cible identiques? cible identiques? Tâches source et

Domaines source

et cibles

identiques ?

Apprentissage

traditionnel

Apprentissage par

transfert inductif

Apprentissage par

transfert transductif

Apprentissage par

transfert non supervisé

Non

Oui

Oui

Non

Oui

Non

Figure5.1 – Positionnement de l’adaptation entre les domaine au sein de l’apprentissage

automatique

5.3 Adaptation par transfert partag´e entre les domaines

D’un point de vue th´eorique, la performance d’un classifieur a de meilleures garanties

de généralisation lorsque les distributions marginales des données du training (source) et du

testing (cible) sont assez similaires [135]. Lorsque ces donn´ees proviennent de deux domaines

dont les distributions marginales sont diff´erentes, il faut ´evidemment trouver un moyen de

maximiser la similarité (ou minimiser la dis-similarité) entre les domaines pour améliorer

la performance de classification sur la base des données utilisées. Unifier ou homogénéiser

Section 5.3 – Adaptation par transfert partag´e entre les domaines

les distributions marginales des données devient une nécessité. De nombreux critères, tels

que la divergence Kullback-Leibler (KL) [136], peuvent être utilisés pour optimiser le critère

basé sur la distance. Cependant, beaucoup d’estimateurs sont paramétriques ou nécessitent

une estimation de densité intermédiaire. Récemment, une estimation de distance non

pa-ramétrique a été con¸cue en intégrant des distributions dans un espace de Hilbert à noyau

reproduisant (RKHS) [42]. Ces méthodes, généralement basées sur le noyau font appel à

la d´ecomposition en valeurs propres et vecteurs propres pour trouver l’espace de nouvelle

repr´esentation. Pour ´eviter ce type de technique assez dense, nous proposons d’utiliser

l’ali-gnement de sous-espace (SA) avec l’approximation rapide de la SVD pour une r´ealisation

efficace du transfert entre les domaines. Pour la suite de cette section, nous pr´esentons

d’abord la méthode SA dans la section 5.3.1 puis la méthode proposée dans la section 5.3.2.

5.3.1 M´ethode d’alignement des sous-espaces

La m´ethode d’alignement de espace (SA) met l’accent sur l’utilisation du

sous-espace généré par la méthode ACP afin de faire une adaptation entre les domaines. Pour

une explication complète de la méthode SA, nous invitons les lecteurs à cette référence [56].

L’id´ee de base est d’appliquer l’ACP sur l’´echantillon source,X

et l’´echantillon cible,X

séparément en choisissant un espace de dimension commune égale àkinférieure à la

dimen-sion de l’espace d’origine,d. Cela conduit `a l’obtention de deux matrices de projection G

etGT. Ensuite, d’aligner les données sources projetées avec les données cibles projetées dans

le sous-espace commun en utilisant une matrice d’alignement sous-espaceGa =G

G

G

.

Pour ce faire, la méthode SA propose de réduire l’écart entre les domaines en rapprochant

les sous-espaces source et cible de sorte que :

G

=argmin

kG

G−G

k

, (5.1)

o`uk.k

d´esigne la norme de Frobenius et Gest la matrice de transformation qui rapproche

cible identiques? _{cible identiques?}^{Tâches source et}

=_argmin

, respectivement, et_P

6=_P