Formalisation de l’Apprenti - De l’Apprentissage par Simulation `a l’Apprentissage par

2.4 De l’Apprentissage par Simulation `a l’Apprentissage par

2.4.1 Formalisation de l’Apprenti

Plusieurs définitions issues de [Blum & Blum, 1975] sont à rappeler afin de présenter les modifications proposées par [Angluin & Krikis, 2003].

Cible de l’apprentissage :

La cible de l’apprentissage est une fonction f ∈ F telle que :

– F est l’ensemble des fonctions partiellement d´eﬁnies sur l’ensemble

N

= {0, 1, 2, 3, ...} des entiers naturels,

– le domaine Df ⊂

N

de f est le sous-ensemble de

N

sur lequel f est

d´eﬁnie,

– le graphe Gf de f est l’ensemble des paires (x, f (x)) telles que x ∈ Df,

– soit Gg le graphe d’une fonction g, on dit que f ´etend g si on a Gg⊆ Gf,

et enﬁn

– la composition de f et g est une fonction telle que h(x) = f (g(x)) si g(x) et f (g(x)) sont définies, h(x) étant indéfinie dans le cas contraire. Notons que les points e ∈ Gf du graphe d’une fonction peuvent servir

d’exemples pour l’apprentissage de cette fonction, et que les graphes de fonctions peuvent être utilisés pour caractériser l’apprentissage (soit g la cible de l’apprentissage, celui-ci est exact si Gf = Gg, trop général si Gg⊆ Gf ou trop

sp´eciﬁque si Gf ⊆ Gg).

Listing standard :

On se donne la liste particuli`ere de toutes les machines de Turing, not´ee t0,

t1, ti, ..., dans laquelle chaque machine calcule une fonction partielle f :

N

→

N

et telle que :

– f n’est pas définie sur les entrées pour lesquelles la machine de Turing correspondante ne s’arrête pas,

– les fonctions r´ecursives partielles sont les fonctions partielles de

N

dans

N

calculables par une machine de Turing,

– les fonctions r´ecursives totales sont les fonctions calculables par une machine de Turing pour toute entr´ee.

Syst`eme de Programmation :

Un système de programmation est défini comme une suite φ0, φ1, φi, ...,

φn de fonctions r´ecursives partielles contenant toutes les fonctions r´ecursives

partielles. La fonction universelle pour ce syst`eme de programmation, u(i, x) = φi(x), peut-ˆetre vue comme une fonction de commande permettant de lancer

une machine particulière sur une entrée particulière. Si u est une fonction récursive partielle (i.e., calculable par une machine de Turing), le système de programmation est dit universel.

Syst`eme de programmation universel acceptable :

Une fonction de composition c est une fonction totale telle que pour tout i et tout j, i, j, k ∈

N

, si k = c(i, j), alors φk calcule la mˆeme fonction que φi◦ φj

. Un système de programmation universel est dit acceptable s’il a une fonction de composition récursive, ce qui est supposé être le cas pour le listing standard. [Machtey & Young, 1978] ont démontré que tous les systèmes de programmation acceptables ainsi définis se simulent mutuellement et sont en ce sens équivalents :

Lemme 2.5 Supposons que φ est un système de programmation universel et ψ un système de programmation acceptable. Il existe alors une fonction de translation récursive r telle que pour tout i ∈

N

, φi= ψr(i).

Une mesure de complexit´e adapt´ee : ´

Etant donn´e un syst`eme de programmation acceptable φ0, φ1, φ2, ..., une

s´equence Φ0, Φ1, Φ2, ... est une mesure de complexit´e calculatoire si :

1. quel que soit i, φi et Φi ont le même domaine :∀i, ∀x, φi(x) est définie ssi

Φi(x) est d´eﬁnie,

2. Φi(x) < y est décidable, i.e., « Φi(x) < y » est un prédicat récursif total

de i, x, et y.

Par exemple, on peut choisir comme mesure de complexit´e pour le listing standard t0, t1, t2, ..., les fonctions T0, T1, T2, ..., o`u Ti(x) est le nombre de pas

de calcul effectués par la ieme _{machine de Turing pour traiter l’entrée x, ou}

reste indéfini si le calcul ne s’arrête pas. Chaque fonction récursive partielle pouvant être calculée par une machine de Turing, la séquence t0,t1,t2, ... est un

système de programmation. La fonction universelle u(i, x) de ce système peut être calculée en simulant le fonctionnement de la ieme _{machine de Turing t}

i sur

l’entrée x, ce qui rend le système de programmation universel. Une fonction de composition c(i, j) = k peut être calculée en simulant le fonctionnement de la machine tkqui combine tiet tj en lan¸cant tipuis tj sur le résultat de tisi celle-ci

s’arrête. Ce système de programmation est donc acceptable. Ti est récursive

partielle, et poss`ede le mˆeme domaine que ti (condition 1), puisque l’on peut

calculer Ti(x) en simulant tisur l’entr´ee x, et en comptant le nombre d’it´erations

effectuées par ti. Si ti ne s’arrête pas pour l’entrée x, alors la simulation non

plus et Ti(x) est indéfinie, sinon le résultat de la simulation est le nombre total

d’itérations effectuées par tiavant de s’arrêter. De la même fa¸con, étant donnés

trois entiers i, x, et y, on peut d´ecider si Ti(x) ≤ y en simulant tisur y it´erations.

Si ti s’arrête en un nombre d’itérations inférieur ou égal à y, alors le prédicat

[Machtey & Young, 1978] étend la correspondance entre deux systèmes de programmation acceptables à leur mesure de complexité :

Lemme 2.6 Si φ et ψ sont des systèmes de programmation acceptables ayant Φ et Ψ pour mesures de complexité respectives, et si r est une transcription récursive de φ en ψ, alors il existe une fonction récursive b telle que pour tout i et pour tout x excepté pour un nombre fini de x, Ψ_r(i)(x) ≤ b(x, Φi(x)).

Il est ainsi prouvé qu’il existe une fonction récursive liant la complexité de deux programmes lorsque l’un est la transcription de l’autre dans un sys- tème de programmation équivalent : cette propriété forte est à l’origine des requêtes de « complexité » utilisées par Angluin pour limiter la complexité du programme simulé (hypothèse) en fonction de celle du programme original (calculant une fonction étendant la fonction cible). Cependant, le modèle de [Blum & Blum, 1975] suppose que l’apprenti connaˆıt parfaitement le système de programmation dont il dispose pour énoncer ses conjectures : l’apprenti est une machine de Turing M, la cible de l’apprentissage est une fonction récur- sive partielle f , et les exemples sont les paires appartenant au graphe de f . M dispose d’une bande d’entrée accessible en lecture seule, supposée contenir une présentation11

de f , et d’une bande de sortie accessible en écriture utilisée pour émettre ses conjectures concernant f . Chaque conjecture est un index j permettant d’identifier une fonction ψi dans son système de programmation

ψ0, ψ1, ψ2, .... Le critère d’apprentissage étant l’identification à la limite (voir

Section 2.1), on dit que M identiﬁe une classe de fonctions r´ecursives partielles

C

si pour toute fonction f ∈

C

et toute présentation T de f , la séquence d’hy- pothèses proposées par M converge correctement vers une hypothèse j (i.e., ψj étend f ).

Illustrons maintenant les limites de ce formalisme. On peut considérer que la liste de machines de Turing caractérisant un apprenti représente les opéra- tions purement cognitives de celui-ci, alors que le système de programmation associé représente le répertoire des actions qu’il est capable de réaliser (la « pensée » opposée à l’« action », en quelque sorte). Ce modèle suppose alors qu’il n’est pas nécessaire pour l’apprenti d’apprendre à réaliser effectivement la tâche cible, il lui suffit de s’imaginer cette réalisation, i.e., d’identifier une machine de Turing capable de simuler le programme cible (et simulant donc le programme calculant f ). Dans l’exemple du jonglage, on se contenterait ainsi de comprendre comment le jongleur s’y prend pour manipuler les balles en considérant qu’il n’est pas nécessaire de s’essayer à la tâche. Dans le cas de l’acquisition d’un langage, on peut distinguer le fait d’apprendre un vocabulaire

11. une présentation de f est une séquence infinie d’éléments pouvant être soit une paire (x, y) ∈ Gf, soit le caractère ∗ utilisé lorsque f n’est pas définie pour x.

et des règles grammaticales d’une part, et le fait d’apprendre à parler effectivement la langue d’autre part : prononcer, articuler, et accentuer correctement sont des tâches liées à l’action. Dans le cadre de la découverte scientifique, se limiter à la composante cognitive reviendrait à énoncer des théories et des modèles ne pouvant être expérimentés, donc potentiellement infalsifiables -ce sont les hypothèses transcendantales critiquées par Kant (voir Section 1.1.2). Il semble illusoire de considérer que la compréhension des étapes d’une ré- solution de problème et de leur enchaˆınement est suffisant, il faut également s’entraˆıner à les réaliser de fa¸con satisfaisante, associer un comportement ef- fectif au modèle théorique acquis. C’est le problème d’adéquation entre une réalité concrète et une abstraction théorique formulé en Section 1.3. L’hypo- thèse forte de ce modèle, et dont [Angluin & Krikis, 2003] souhaite s’abstraire, est donc que l’apprenti connaˆıt son système de programmation, et qu’il existe une correspondance directe entre l’index d’une machine de Turing et la fonction qu’elle permet de calculer, une correspondance innée entre le fait de s’imaginer la réalisation d’une tâche et sa réalisation effective, même si ces deux aspects sont en réalité étroitement liés et évoluent généralement en parallèle lors de l’apprentissage.

Un syst`eme de programmation de type boˆıte noire

Afin de rendre compte de la connaissance imparfaite de son fonctionnement propre, l’apprenti n’a plus un accès direct à son système de programmation. En remplacement, un système de programmation inconnu φ ainsi que la mesure de complexité correspondant Φ sont regroupés sous le terme de boˆıte de fonctions, désormais accessible en tant qu’oracle c’est à dire comme un système de type boˆıte noire. Une boˆıte de fonctions est ainsi définie comme une fonction récursive totale g(i, x, s), avec i, x, et s ∈

N

∪ {∗} et tels que :

– i repr´esente l’index d’une fonction gi : on dit qu’une boˆıte de fonctions g

contient les fonctions g0, g1, g2, .... Ces fonctions, r´ecursives partielles, re-

présentent l’espace des hypothèses pouvant être formulées par l’apprenti. – x désigne l’entrée désirée pour cette fonction gi,

– s est une estimation de la complexité associée à gi(x) : Gi(x) est la plus

petite valeur de s telle que g(i, x, s) soit un entier naturel, le cas échéant, ou reste indéfini dans le cas contraire. Si Gi(x) est définie, alors gi(x) =

g(i, x, Gi(x)). On dit ´egalement que g contient les mesures G0, G1, G2, ....

En d’autres termes, si l’on se donne i et x, et que l’on examine les valeurs successives de g(i, x, s) pour x = 0, 1, 2, ..., on observe une séquence alternant des entiers naturels et des ‘∗’. Si cette séquence ne contient aucun entier naturel, alors gi(x) et Gi(x) sont tous deux indéfinis. Dans le cas contraire, il existe un

et l’on définit gi(x) comme étant y, et Gi(x) comme la valeur de s lorsque y

apparaˆıt pour la premi`ere fois.

Cette définition généralise celle de la mesure de complexité proposée par [Blum & Blum, 1975] dans la mesure où il n’est pas requis que g contienne un système de programmation. Toutefois, les notions d’universalité et d’acceptabilité peuvent être définies de fa¸con comparable pour les boˆıtes de fonctions, et on retrouve la précédente définition dans le cas d’une boˆıte de fonctions acceptable (i.e., qui contient un système de programmation acceptable). De même, [Angluin & Krikis, 2003] paraphrase le lemme 2.6 et définit une b-relation pouvant être interprétée comme « ne pas être b fois plus lent que » de la fa¸con suivante : Soit b(x, s) une fonction récursive totale. Une boˆıte de fonctions g est b-reliée à une boˆıte de fonctions g� si pour tout i, il existe un j tel que :

1. gj´etend g�_i.

2. Gj(x) ≤ b(x, G�i(x)) pour tout x appartenant au domaine de g�i, sauf pour

un nombre ﬁni de x.

En d’autre termes, une boˆıte de fonctions g est b-reliée à une boˆıte de fonctions g� si pour toute fonction g�_i, et pour presque tous les éléments du domaine de g�_i, il existe une fonction gj∈ g qui ne soit pas b fois plus rapide

que g�_i. Si la boˆıte de fonctions d’un jongleur lui permet par exemple de lancer les balles à une certaine hauteur d’une part, et de les rattraper d’autre part, alors être b-relié à elle signifie pour ma boˆıte de fonctions qu’elle me permet de l’imiter dans une certaine mesure, de telle sorte que ma fa¸con de faire ne soit pas b fois pire que la sienne.

Par opposition à l’apprenti proposé par [Blum & Blum, 1975], qui a une connaissance experte du système de programmation utilisé pour exprimer ses conjectures, [Angluin & Krikis, 2003] définit un apprenti na¨ıf ainsi : un apprenti na¨ıf possède la même architecture qu’un apprenti expert, mais au lieu d’accéder directement à son système de programmation, il interroge une boˆıte de fonctions arbitraire, comme il le ferait pour un oracle (voir Section 2.3) : en plus de ses deux bandes usuelles (celle ou il lit les exemples, et celle ou il écrit ses hypothèses), deux bandes supplémentaires sont dédiées à la communication par requêtes avec la boˆıte de fonctions.

Dans le document Conception d'un Cadre Formel d'Interaction pour la Découverte Scientifique Computationelle (Page 50-55)