Apprentissage a tif

Lese ondparadigmed'apprentissagequenousutiliseronsestdûàAngluin[Ang88b ℄.

Dans e adred'apprentissage,l'apprenant doittoujours trouverunlangage iblemais,

pour s'aider, il peut interroger un ora le qui onnaît e langage. Il peut alors poser

des questionsà l'ora le sous forme de diérents types de requêtes et e dernier doit y

répondresansmentir.

L'intera tion ora le-apprenant rappelle alors l'intera tion mère-enfant lorsque e

dernier apprend à parler. En eet, lorsque sa mère lui parle, nous pouvons dire que

l'enfantreçoit desexemples positifs.Demême, sil'enfantessaie defaire desphrasessa

mèrelui dira sisaphraseest orre teou non.

L'apprentissageàpartirderequêtesestalorsintéressantd'unpointdevuepratique.

Par exemple, plutt que de demander à un expert d'étiqueter tout un ensemble de

données, un apprenant pourra lui demander d'étiqueter seulement quelques exemples

qu'ilaura hoisi. Lefaitquel'ora lepuisseêtreunhumainnouspermet de omprendre

quelorsdel'apprentissageàpartirderequêtes, equivavraiment ompterestlenombre

derequêtes que l'apprenant fait.

2.3.1 Les requêtes usuelles

Depuis[Ang88b ℄,denombreux typesde requêtesont étédénis(sous-ensemble,

ex-haustivité,...).Toutefois,beau oupdetravauxamenantàdesrésultatsd'apprenabilité

(et d'inapprenabilité) n'en utilisent seulement que deux : les requêtes d'appartenan e

et ellesd'équivalen e.

Dénition 22 (Requêtes d'appartenan e) Soit

L

une lasse de langages et soit le langage ible

L ∈ L

onnu parl'ora le et que l'apprenant essaie de trouver.

Lesrequêtesd'appartenan e,ou membershipqueries(notées mq),permettentà

l'ap-prenant de soumettre un mot

w ∈ Σ^∗

à l'ora le. La réponse de elui- i, notée

M q(w)

, est alors :

Ouisi

w ∈ L

, Non si

w /∈ L

Dénition 23 (Requêtes d'équivalen e) Soient

L

une lasse de langageset

L ∈ L

lelangage ible onnu par l'ora le que l'apprenant essaie detrouver.

Lesrequêtesd'équivalen e, ou equivalen equeries(notéeseq ), permettentà

l'appre-nantdesoumettreunehypothèse

H

(enfaitunereprésentationdulangage

H

)àl'ora le. La réponse de e dernier, notée

Eq(H)

, est

Ouisi

H

est équivalentà

L

un ontre-exemple sinon, 'est-à-dire un mot dela diéren e symétrique

L ⊕ H

. En plus du temps de al ul global de l'apprenant, e qui justie qu'un algorithme

estmeilleur qu'unautre estle nombre total derequêtes ee tuées :

Dénition 24 SoitQuerunensemblederequêtes pouvant êtreutilisées.Une lasse

G

est polynomialementidentiableàpartirdeQuers'ilexisteunalgorithme Alg apable

d'identier haque

G ∈ G

et tel que, à haque appel de requêtes, le nombre total de requêtes ainsi que le temps utilisé jusqu'à et appel par Alg est polynomial en

kGk

et enla taille del'information présentée par l'ora le jusqu'à e point.

Exemple 19 Prenons une sous- lasse de

S

S′ = {S_n : n = 9k + 1, ∀k ∈ N}

. Les langages de

S^′

sont don disjoints deuxà deux et pour tout

j ∈ N⁺

a^j

appartient à un unique langage de

S′

S_{9∗⌊j/9⌋+1}

Nous allons montrer que

S′

n'est pas apprenable ave un nombre polynomial de

requêtes d'équivalen e et d'appartenan e. La preuve de la non apprenabilité repose sur

une te hnique utilisée par Angluin dans [Ang90℄ : l'ora le est un adversaire jouant le

rled'un ora le malveillant. Il peut avoira ès à l'algorithmedel'apprenant et lefor e

à faire le plus grand nombre de requêtes possibles en maintenant à jour l'ensemble

X

des hypothèses onsistantes ave les données.

Audébut,

X

ontientl'ensembledes langages de

S′

.Pour haque requête

d'apparte-nan e

M q(w)

,l'ora lerépondNon .Si

w

ontientlalettre

b

,au un langagen'estenlevé de

X

. Si

w = aj, j ∈ N+

, un seullangage est enlevé de

X

(

S_{9∗⌊j/9⌋+1}

). Demême, pour haque requête d'équivalen e

Eq(Sn)

, la réponse de l'ora le est Non éliminant unique-ment

S_n

X

Pour haque requête, un seul langage au maximum est enlevé de

X

, forçant ainsi l'apprenantàfaireunnombreexponentielderequêtes.

S′

n'estdon paspolynomialement

apprenable ave des requêtes d'appartenan e et d'équivalen e.

Danslapreuve i-dessus,lesrequêtesd'équivalen equisont faitessontdesrequêtes

dites propres : les langages hypothèses soumis à l'ora le sont des langages pouvant

Souvent,lefaitd'avoirledroitdefairede tellesrequêtespermetune identi ationplus

fa ile:

Exemple 20 Reprenons le langage

S_n= {ai : n ≤ i ≤ n + 9}

et la lasse delangages

S

omprenant tous les langages

S_n, ∀n ∈ N⁺

. Soit l'algorithmesuivant :

1. Faire la requête d'équivalen e

Eq{λ}

, soient

u

le ontre-exemple et

j = |u|

sa longueur.

2. Faire la requête d'appartenan e

M q(a^j−1)

3. Si l'ora le répond Oui,

j ← j − 1

puisaller en2. 4. Sinon,retourner

S_j

Cet algorithme identiealors à la limite

S

enfaisant au plusune eq et

10

mq.

Exemple 21 Toujours pour la même lasse de langages,soit l'algorithme suivant:

1. Faire la requête d'équivalen e

Eq(∅)

, soient

u

le ontre-exemple et

j = |u|

sa longueur.

2. Faire la requête d'équivalen e

Eq(S_j−5)

(si

j − 5 ≤ 0

,faire la requête

Eq(S_j)

). 3. Si l'ora le répond Oui,l'inféren e s'arrête. Sinon, soient

u

v

leplus petit et le

plusgrand ontre-exemples retournés par l'ora le.

4. Poser

j = ⌈^|u|+|v|₂ ⌉

et aller en 2.

Cet algorithme identiealors à la limite

S

enfaisant uniquementdes eq .

Nouspouvonsnoterunesimilaritéentre etalgorithmeet eluiidentiant

S

entemps Ipepolynomial.Nousverronsparlasuitequelesdeux on eptssontee tivementreliés

dans ertaines preuves d'identi ation.

De nombreux résultats et te hniques d'apprentissage utilisant seulement es deux

typesde requêtes ont ététrouvés [Ang01, ASA01, Sak90 ,HPRW96℄. Toutefois, les

re-quêtes d'équivalen e sont rarement utilisables en pratique. En eet, si nousreprenons

l'exemple de lamère et de l'enfant, il esttout àfait on evablequ'un enfant demande

à sa mère si telle ou telle phrase est orre te ( ela orrespondrait à une requête

d'ap-partenan e); enrevan he lesrequêtes d'équivalen e sont plusproblématiques.Eneet,

une requête d'équivalen e reviendrait àune question de l'enfant demandant à samère

s'il onnaîtlefrançais.Question àlaquelleilseraitbiendi ile derépondre.Demême,

en inféren e grammati ale, la question de l'équivalen e entre deux langages n'est pas

toujourspossible.Unmoyende ontourner eproblèmeestalorsd'utiliseruneméthode

dite d'é hantillonnage (ou sampling) [Ang87℄ oùnous remplaçons les eq par un tirage

aléatoires de mots qui servent à poser desrequêtes d'appartenan e. Dans bien des as

2.3.2 Les requêtes de orre tion

Si la requêted'équivalen e est souvent troppuissante et peu naturelle, un

ompor-tement se rappro hant plus de la réalité est le suivant : un enfant pose une question :

Est- e que J'ai vu deux hevals est une phrase orre te?, sa mère, plutt que

de lui répondre uniquement non ( e qui serait le as d'une requête d'appartenan e),

va plutt lui dire quelque hose omme : Non, e n'est pas français. Par ontre, tu

peuxdire J'ai vu deux hevaux.. En eet, l'enfant n'apprend pasuniquement ave

des exemples positifs ou des exemples négatifs, mais aussi à partir de orre tions de

ses phrasesfausses. C'est à partir de e onstat quedes travauxont ommen é surun

nouveau type derequête, les requêtes de orre tion [BBBD05℄:

Dénition 25 (Requêtes de orre tion) Soient

L

une lasse de langages et

L ∈ L

lelangage ible onnu par l'ora le que l'apprenant essaie detrouver.

Les requêtes de orre tion permettent à l'apprenant de soumettre un mot

w ∈ Σ^∗

à l'ora le. La réponse de elui- i, notée

Cq(w)

, est alors

Ouisi

w ∈ L

(ou

Θ

selon lestravaux), une orre tion de

w

relativement à

L

sinon.

Les requêtesde orre tion ont onnuun rapidesu èset plusieurs travauxont

pro-posésdesmodèles de orre tion diérent :

Dans[BBBD05℄,la orre tion orrespondaupluspetitmot

v

tel que

wv ∈ L

.La orre tion estdon baséesur lepréxe.

Dans[TK07 ℄,la orre tionestlamêmemaisellebornelalongueurdela orre tion.

Dans[Kin08 ℄,Kinberproposeune orre tionlapluspro hepossibledelarequête

enterme dedistan ed'édition,tellequela orre tionn'ait jamaisétévue,qu'elle

soit sipossible de même longueur,sinon lapluspetite selon l'ordrehiérar hique.

Nous avons proposé dans [BBdlHJT07 ℄ des requêtes de orre tion basées sur la

distan ed'édition.

Dans les deux premiers as, la orre tion est basée sur le préxe. Ce modèle n'est

alors pastrès pertinent du point de vue de la langue naturelle. Dans le troisième as,

les orre tionsdel'ora le sont hoisiesde façon àaider l'apprenant. Lesrelations entre

esvariantes ont étéétudiéesdans[Tir08 ℄.

Les requêtes de orre tion proposées dans [BBdlHJT07 ℄ et basées sur la distan e

d'édition semblent don à la foisplus naturelles et plus pertinentes. C'est elles- i que

nousutiliserons par lasuite :

Dénition 26 (Requêtes de orre tion ( q

Edit

)) Soient

L

une lassedelangages et

L ∈ L

lelangage ible onnu par l'ora le que l'apprenant essaie detrouver.

Les requêtes de orre tion basées sur la distan e d'édition, ou orre tion queries

( q Edit

),permettent à l'apprenant de soumettre un mot

w ∈ Σ^∗

à l'ora le. La réponse de elui- i, notée

Cq(w)

, est alors

une orre tion pro he de

w

relativement à

L

sinon, 'est-à-dire un mot

w′

appar-tenantau langage et à distan e d'édition minimum de

w

Cq(w) = argmin

w′∈L

d(w, w^′).

Lorsque plusieurs réponses sont envisageables, l'ora le en hoisit une. De plus, elui- i

est onsistant : même si plusieurs réponses sont possibles pour un mot

w

Cq(w)

sera toujoursla même orre tion.

Exemple 22 Soit

L = {a, b, aa, ab, ba, bb, aaaa, babbab}

un langage ible. La réponse à la requête de orre tion du mot

ab

est

Cq(ab) =

Oui. Le mot

baab

étant à distan e d'édition

2

desmots

aa, ab, ba, bb, aaaa

babbab

,l'ora le hoisiraunde esmots omme orre tion, par exemple

aa

, ettoutes lesréponses aux requêtes dumot

baab

serontalors

Cq(baab) = aa

Exemple 23 Reprenons lelangage

S_n= {ai : n ≤ i ≤ i + 10}

et la lasse delangages

S

omprenant tous les langages

Sn, ∀n ∈ N⁺

. Soit l'algorithmesuivant :

1. Faire la requête

Cq(λ)

, soient

u

la orre tion et

j = |u|

salongueur. 2. Retourner

S_j

Cet algorithme identie alors à la limite

S

en faisant une unique requête de or-re tion. En eet, la orre tion obtenue étant la plus pro he possible de

λ

, ela ne peut qu'être leplus petit motdu langage ible

S_j

, 'est-à-dire

a^j

Si à la pla e de

λ

nous avions demandé la orre tion d'un mot

w

et que elui- i appartenait au langage, il surait de demander la orre tion de

wa¹⁰

. Supposons que

a^k = Cq(wa¹⁰)

soit ette orre tion, le langage ible est alors

S_k−10

Dans notre dénition, la orre tion donnée par l'ora le est potentiellement laplus

mauvaise possible pour l'apprenant :si l'ora leestmalveillant,ilpourraitavoir a èsà

l'algorithmed'apprentissage, etproposer,lorsque plusieurssontpossibles,la orre tion

lamoinspertinente dupoint devueapprentissage, 'est-à-dire elleapportant lemoins

d'information(parexempleunmotdontl'apprenantsaitdéjàqu'ilestunexemple

posi-tif).Lorsde l'apprentissage,ilfaudradon toujours s'intéresser aunombre de requêtes

ee tuées danslepire as.

Si nousnous intéressonsmaintenant auxutilisations possiblesdes requêtes de

or-re tion,ilestànoterque ontrairement auxrequêtes d'équivalen e,ellessont bienplus

fa iles à simuler à partir du moment où nous onnaissons le langage ible. De plus,

elles existent déjà dans ertaines appli ations. En eet, sur la plupart des moteurs de

re her he surinternet, lorsque noustaponsdes mots quele moteur ne onnaît pas, ou

lorsqu'ils ne sont pas fréquents, e dernier propose une alternative aux mots- lés que

nousavonstapéspré édéed'unVouliezvousdireouEssayezave l'orthographe.

Demême,lefon tionnementdeprogrammesde orre teursorthographiquetelqu'ispell,

Dans le document Inférence grammaticale en situations bruitées (Page 36-41)

L

L ∈ L

w ∈ Σ∗

M q(w)

w ∈ L

w /∈ L

L

L ∈ L

H

H

Eq(H)

H

L

L ⊕ H

G

G ∈ G

kGk

S

S′ = {Sn : n = 9k + 1, ∀k ∈ N}

S′

j ∈ N+

aj

S′

S9∗⌊j/9⌋+1

S′

X

X

S′

M q(w)

w

b

X

w = aj, j ∈ N+

X

S9∗⌊j/9⌋+1

Eq(Sn)

Sn

X

X

S′

Sn= {ai : n ≤ i ≤ n + 9}

S

Sn, ∀n ∈ N+

Eq{λ}

u

j = |u|

M q(aj−1)

j ← j − 1

Sj

S

10

Eq(∅)

u

j = |u|

Eq(Sj−5)

j − 5 ≤ 0

Eq(Sj)

u

v

j = ⌈|u|+|v|2 ⌉

S

S

L

L ∈ L

w ∈ Σ∗

Cq(w)

w ∈ L

Θ

w

L

v

wv ∈ L

L

L ∈ L

w ∈ Σ∗

Cq(w)

w

L

w′

w ∈ Σ^∗

S′ = {S_n : n = 9k + 1, ∀k ∈ N}

S^′

j ∈ N⁺

a^j

S_{9∗⌊j/9⌋+1}

S_{9∗⌊j/9⌋+1}

S_n

S_n= {ai : n ≤ i ≤ n + 9}

S_n, ∀n ∈ N⁺

M q(a^j−1)

S_j

Eq(S_j−5)

Eq(S_j)

j = ⌈^|u|+|v|₂ ⌉

w ∈ Σ^∗

w ∈ Σ^∗

d(w, w^′).

S_n= {ai : n ≤ i ≤ i + 10}

Sn, ∀n ∈ N⁺

S_j

S_j

a^j

wa¹⁰

a^k = Cq(wa¹⁰)

S_k−10