Apprentissage partag´ e

_n_S₊_n_T

Lorsqu’un modèle statistique est con¸cu dans un but de prédiction, une hypothèse

ma-jeure est l’absence d’évolution du phénomène modélisé entre les étapes d’apprentissage et de

prédiction. Ainsi, les données d’apprentissage source et les données cibles (futures) doivent

être dans le même espace caractéristique et doivent avoir la même distribution.

Malheureu-sement, cette hypothèse peut-être fausse dans les applications du monde réel. Par exemple,

les motivations industrielles pourraient conduire `a classer les ´echantillons d’une marque

don-n´ee lorsque seuls les ´echantillons d’une autre marque sont disponibles pour l’apprentissage.

Un modèle prédictif utilisé sur les données n’ayant pas exactement la même répartition que

les données d’apprentissage utilisées pour estimer ce modèle va évidemment conduire à des

résultats de prédiction dégradés. Dans ce cas, l’apprentissage par transfert est particuli`

ere-ment utile lorsque nous avons des données étiquetées disponibles dans le domaine source, ce

qui nécessite une exploitation des connaissances présentes dans d’autres domaines différents

(cibles) mais relatifs au domaine source pour am´eliorer la performance de pr´ediction des

donn´ees cibles.

L’apprentissage partag´e ou apprentissage par transfert de connaissance (transfer

lear-ning) est défini comme étant l’aptitude d’un système à reconnaˆıtre et à appliquer des

Section 2.6 – Apprentissage partag´e

connaissances et des compétences, apprises à partir de tâches antérieures, sur de nouvelles

tˆaches ou domaines partageant quelques similitudes. La probl´ematique qui se pose autour

de l’apprentissage partag´e est de pouvoir identifier ces similitudes entre une ou plusieurs

tâche(s) cible(s) (target) et une ou plusieurs tâche(s) source(s), ensuite transférer la

connais-sance acquise de la ou des tˆache(s) source(s) vers la ou les tˆache(s) cible(s). La technique

d’apprentissage par transfert vise `a am´eliorer les performances d’apprentissage dans un

do-maine cible `a l’aide de connaissances extraites des domaines sources ou des tˆaches connexes.

Ce qui distingue l’apprentissage par transfert de l’apprentissage traditionnel, c’est que les

domaines source et cible, ou les tˆaches cible et source, ou les deux, sont diff´erents.

Différentes techniques ont été développées pour transférer un modèle statistique estimé

d’une population source `a une population cible. Trois principales tˆaches d’apprentissage

statistique sont communément considérées : la classification probabiliste (paramétrique et

semi-paramétrique), la régression linéaire et le regroupement. Dans chaque situation, le

transfert de connaissance s’effectue par l’introduction des liens visant `a renforcer les

simi-litudes entre les deux domaines et `a minimiser les diff´erences. Dans de nombreuses

appli-cations typiques d’apprentissage partag´e, le probl`eme d’adaptation entre les domaines est

le plus utilisé. Il peut être étudié dans des tâches semi-supervisées et non supervisées. La

technique d’adaptation entre les domaines est bien adapt´ee `a de nombreuses applications du

monde réel, car dans de nombreux cas, les données de test ne contiennent pas d’échantillons

étiquetés. Dans ce cas, c’est la méthode d’adaptation non supervisée qui est développée car

elle ne n´ecessite aucune information d’´etiquetage du domaine cible. Pour la suite de cette

section, nous présentons le principe de la méthode d’apprentissage partagé ainsi que les

travaux existants dans la litt´erature.

2.6.1 Principes

En apprentissage partagé, on parle généralement de domaine ”source”, D

et ”cible”,

D

. Un domaine est constitu´e de deux composantes D = {X,P(X)} avec X l’espace

caract´eristique de X ={x

,· · ·,x

},x

∈ X et P(X) la distribution de X. En g´en´eral, le

domaine ”source” contient des données étiquetées et domaine ”cible” contient les données

non étiquetées. Le terme ”étiquette” utilisé ici fait référence à la connaissance a priori pour

qu’un ensemble de données appartienne ou non à un quelconque groupey∈ Y (ou catégorie).

Par la suite nous adaptons la notation de la matrice de donn´ees par X

et l’espace des

variables par X

avec S et T qui sont respectivement les indices des domaines source et

cible.

Le transfert partagé donne la possibilité d’apprendre une ou plusieurs tâche(s) bien

d´efinie(s) dansD

pour pouvoir pr´edire le comportement des donn´ees d’ensembleD

. C’est

`

a dire `a partir des donn´ees sources x

∈ X

et des ´etiquettes yi ∈ Y

, on construit une

fonctionf(.) qui sera utilisée pour la prédiction dey d’un nouveau échantillon xde X

.

Consid´erons deux ensembles d’apprentissage sourceSet cibleT issus de deux diff´erents

espaces caractéristiques mais de même nature (classe d’appartenance ou catégorie). Le

pro-bl`eme repose sur la construction d’une fonction de pr´ediction f(.) qui va nous permettre

Section 2.6 – Apprentissage partag´e

de mieux classer l’ensembleT en utilisant seulement l’information disponibles sur S. Plus

pr´ecis´ement, si on suppose que le domaineD

={S, P(X

)} avec X

={x

,· · · ,x

} la

∈ X et _P(X) la distribution de X. En g´en´eral, le

={T,_P(X

D´efinition 1 (Domaine) Un domaine d’apprentissage D = {X,_P(X)} est un ensemble

es-pace d’étiquettes Y et une fonction objective de prédiction, f(.) = _P(X|Y), qui peut être

,_P(X