4.3 Quand les boules de mots ne sont-elles pas apprenables ?
4.3.1 Identi ation à partir de requêtes
Contrairement auxautomates,lesrequêtesd'appartenan e ave lesrequêtes
d'équi-valen e nepermettent pasl'apprentissage desboules 2
:
Théorème 16 Soient
n, m ∈ N
etB≤n,m = {Br(o) | o ∈ Σ∗, |o| ≤ n, r ≤ m}
. N'im-porte quel algorithme qui identieexa tement haque boule hypothèse deB≤n,m
en uti-lisantEQ etMQ fait, dans lepire as, au moins2n− 1
requêtes.Démonstration :
Commedans[Ang90 ℄etleThéorème7,nousdé rivonsunadversairequifor en'importe
quelleméthode d'identi ationexa te utilisantmq et eqàfaire
Ω(|Σ|n)
requêtes dans lepire des as.L'adversaire maintient un ensemble
X
de toutes les boules possibles. Au début,X = B≤m,n
. Tant queX
ontient au moins deux boules, l'adversaire pro ède omme suit:à haquerequêted'équivalen eBr(o)
,l'adversaireretourne le ontre-exempleo
.À haque requête d'appartenan eo
, l'adversaire répond Non. En d'autres termes, après haquerequêtes,o
nepeutapparteniràlaboule ible.TouteslesboulesdeX
ontenanto
sont don enlevéesde l'ensembleX
.Beau oup de boules peuvent ainsidisparaîtredeX
,mais,à haqueétape,uneseuleboulederayon0
estenlevée:B0(o)
.CommeilexisteΩ(|Σ|n)
boules derayon0
dansB≤m,n
, n'importequel apprenant sera for éde faireauminimum
B≤m,n
requêtes pour identier une telle boule.✷
Ce résultat peut paraîtresurprenant. En eet,les boules peuvent être représentées
par des automates et nous avons vu au Chapitre 2 que
AF D(Σ)
est apprenable à partir de mq et eq (voir le Théorème 5 de e même hapitre). Soit Alg l'algorithmequi identie les afd à partir de mq et eq. Ne pourrions-nous pas utiliser Alg pour
identier les boules? En eet, il surait de onstruire un automate hypothèse
A
en donnant les réponses aux requêtes de l'ora le à Alg. Ensuite, pour haque hypothèsede Alg, nousextrayons le rayon
r
et le entreo
deA
et nous ee tuons une nouvelle requêted'équivalen eBr(o)
. Voir Figure4.2.Plusieurs problèmes seposent sinousfaisons ela. Tout d'abord,Alg onstruit des
afdnere onnaissant pasfor ément uneboule. Quesigniealorsextrairele entreet le
rayond'un tel automate?Deuxièmement,est-il possibled'extrairelerayon et le entre
d'un automate dont nous savons qu'il re onnaît une boule en un temps polynomial?
Alg Ora le
Extraction
de r et o
`
a partir de A
M Q w
RéponsesEQ A
EQ Br(o)
Fig.4.2Diagrammemontrant ommentapprendre lesboulesàtraverslesautomates.
Enn, si omme nouslesupposonslataille del'automateminimal re onnaissant
Br(o)
est exponentiel en
r
, le problème reste in hangé : Alg aura bien appris un automateA
re onnaissantBr(o)
en temps polynomial en|A|
, mais|A|
est exponentiel enr
, et don en lataille de la boule ible (|o|
pour les bonnes boules, et|o| + log r
dansle as général).Finalement, nous pouvons aussi noter que la preuve du Théorème 16 ne tiendrait
plus si nous pouvions faire des requêtes d'équivalen e dites impropres : dans le adre
quenousavonsprésenté,l'apprenant à ledroitde fairedesequniquement de langages
appartenant àla lasse deslangages ibles 3
. Dans le asprésent,il nepeut faire de
re-quêtesuniquementqu'ave desboulesdemots.Siteln'étaitpasle as,alorsl'apprenant
pourraitfairelarequêted'équivalen esurl'ensemblevide.L'ora leseraitalors for éde
donnerun ontre-exemple, 'est-à-direun motde laboule ible.
4.3.2 Apprentissage Pa
Dans ette se tion, nousallons montrer queles bonnes boules ne sont pas
polyno-mialement Pa apprenables, 'est-à-dire qu'il existe au moins une distribution
D
sur 3Σ∗
tellequen'importequelalgorithmed'apprentissagenepeutretournerunehypothèse
ǫ
-bonneave uneprobabilitéplusgrandeque1−δ
,enuntempspolynomial.End'autres termes,ilexisteunedistributionpourlaquelleau unalgorithmeneretourneraentempspolynomialune hypothèse susamment pro he de la ible ave une onan e élevée.
La preuve de ette non-apprenabilité suit les lignes lassiquesde e genre de
résul-tats : nous montrons d'abord que le problème de onsistan e asso ié est
N P
-di ile, par rédu tionà unproblèmeN P
- omplet (plus long sous-mot ommun). S'ensuit que s'il existait un algorithme polynomial Pa -apprenant les boules, et algorithme nousfournirait unepreuve que e problème
N P
- omplet estdansRP
.Le problème que nousallonsutiliser pour notre rédu tion estlui-même obtenu par
rédu tionà unproblème
N P
- omplet :Lemme 6 Lesproblèmesde dé idabilité suivants sont
N P
- omplets :1. Problème du plus long sous-mot ommun (Pls ) : étant donnés
n
motsx1. . . xn
et unentierk
,existe-t-il unmotw
de longueurk
et sous-mot de haquexi
?2. Problème du plus long sous-mot ommuns à des mots d'une longueur
donnée (Pls mld) : étant donnés
n
motsx1. . . xn
de longueurs2k
, existe-t-il un motw
de longueurk
sous-mot de haquexi
?Démonstration :
1. Voir[Mai77 ,GJ79 ℄.
2. Voir[dlHC00 ℄, problèmeL s0.
✷
Ande montrerque
BB(Σ)
n'estpasPa -apprenable,nousallonsmontrer qu'ilest di ile de trouver uneboule onsistante ave desdonnéespositiveset négatives :Lemme 7 Le problème suivant est
N P
- omplet :Problème de la boule onsistante(B ): étantdonnédeux ensembles
X+
etX−
de motssurunalphabetΣ
,existe-t-ilune bonne boule ontenantX+
etau unmot deX−
?Démonstration :
Nousutilisonsunerédu tionduproblèmePls mld(Lemme6).Dans
X+
,nousmettons le mot videλ
et les mots deΣ2k
, 'est-à-dire tous les mots de longueurs
2k
. Nous onstruisonsX−
en prenant haquemot deΣ2k+1
Une boule qui ontient
X+
et au un mot deX−
a alors né essairement un entre de longueurk
etun rayon dek
(puisque nousnous on entrons surlesbonnesboules). Le entreest alors unsous-mot ommunà tousles mots delongueurs2k
.Inversement, si une boule est onstruite ave un sous-mot de longueur
k
omme entre, ette bouleestderayonk
, ontientaussiλ
et,à ausedurayon,ne ontient pas d'élémentsdeX−
.Finalement, le problèmeest dans
N P
, puisqu'étant donné un entreu
, il est fa ile devérier simaxx∈X+d(u, x) < minx∈X−d(u, x)
, 'est-à-diredevérier silabouleen-tréesur
u
ontient bientousles mots deX+
maisau un deX−
.✷
Nousallons maintenant montrer par l'absurde que
BB(Σ)
ne peut êtrePa -appris par rédu tionau problèmepré édent :Théorème 17
BB(Σ)
n'est pas polynomialement Pa apprenable. Démonstration :Supposons que
BB(Σ)
soit polynomialement Pa apprenable ave Alg et prenonsl'instan e
hX+, X−i
du problème B . Posonsh = |X+| + |X−|
et soit la distributionP r(x) = 1h
six ∈ X+∪ X−
, 0sinon dénit surΣ∗
.Soient
ǫ = h+11
,δ < 12
etm = n = max{|w| : w ∈ X+}
. Soit maintenantBr(o)
la boule retournée par une exé ution de Alg
(ǫ, δ, m, n)
. Testons siX+ ⊆ Br(o)
et siX−∩ Br(o) = ∅
. Deux asseprésentent alors.Soit iln'existepasde boule onsistante, alorsBr(o)
estné essairement in onsistante ave lesdonnées, don letest i-dessusest faux. Soit il existe une boule onsistante, alorsBr(o)
est une hypothèseǫ
-bonne, aveǫ < 1h
. Don , ave probabilité au moins1 − δ > 21
, il n'y a pas d'erreur du tout et le test seravrai.Clairement, ette pro édure s'exé ute en temps polynomial en
1
ǫ
,1
δ
,|Σ|
,m
etn
. Ainsi, si les bonnes boules étaient Pa apprenables, il existeraitun algorithmerando-misépourle problèmeB ,qui est
N P
- omplet parle Lemme 7.✷
Enn, demême que
AF D(Σ)
,BB(Σ)
ne peut êtrePa -apprisàpartir d'exemples positifs seuls:Théorème 18
BB(Σ)
n'est pas polynomialement Pa apprenable à partir d'exemples positifs seulement.Démonstration :
Soient
L1 = B1(a)
etL2 = B1(b)
. Posonsw1 = aa
,w2 = bb
etw3 = ab
. Le résultatdé oule alors duLemme 3.
✷
Lesbonnesboules(etdon lesboules)nesontdon pasPa apprenables
polynomia-lement,que e soitàpartir deTexteoud'Informateur. Commepour lesafd,nous
n'étudierons pas la Pa -apprenabilité de