Co-classification de concepts dans un treillis en construction

4.3 Évaluation en cascade d’annotations conceptuelles

5.1.2 Co-classification de concepts dans un treillis en construction

données d’apprentissage L. L’ensemble U′_{initialement vide contient des exemples}

de U étiquetés à l’aide de ho et ha. Les exemples de U′ ayant les prédictions les

plus fiables sont déplacés vers l’ensemble L alors que les autres exemples sont conservés jusqu’à ce que la fiabilité de leur étiquetage soit suffisante. La fiabilité d’une prédiction l pour un élément x = o ou x = a correspond à la probabilité

P(l|x). L’ordre des exemples examinés dans le ﬂux n’est pas nécessairement le

même que l’ordre des exemples étiquetés car le choix des exemples déplacés de U′

vers L dépend de cette mesure de ﬁabilité. La structure de données incarnée par

U′ se comporte en fait comme une ﬁle d’attente contenant des exemples en de-

mande d’une connexion ﬁable avec de futurs exemples étiquetés. Lorsqu’il n’existe plus d’exemples non étiquetés dans U, la procédure retourne deux classiﬁeurs ho

et ha.

Cette procédure incrémentale est compatible avec l’algorithme 5 (cf. cha- pitre 2) d’ajout d’une relation quelconque à un treillis. Il devient ainsi envisa- geable de construire conjointement le modèle de co-apprentissage et le treillis. Par ailleurs, les classiﬁeurs ho et ha retournés manipulent les variables qui consti-

tuent les concepts formels, permettant ainsi d’étiqueter ces concepts.

5.1.2 Co-classification de concepts dans un treillis en construc-

tion

Nous décrivons ici notre modèle de classification supervisée des concepts formels capable de tirer parti d’estimations acquises avec deux classifieurs co-entraînés. Cette classification des concepts formels présente plusieurs intérêts. En premier lieu, l’enrichissement de la représentation des concepts avec les étiquettes issues

d’un corpus d’apprentissage unifie les procédures d’annotation conceptuelle (non supervisé) et d’étiquetage supervisé en produisant une double annotation des EN. En effet, une classification supervisée d’une unité lexicale est réalisée lorsqu’un concept lui transmet son étiquette. D’autre part, dans son langage des exemples, la technique supervisée étudiée ici manipule directement les variables (objets et attributs) qui constituent les concepts, contrairement à une méthodologie (cf. évaluation en cascade, chapitre 4) où seuls des identifiants des concepts sont pris en compte. Nous évitons ainsi de perdre des informations lors de l’enrichissement pour un apprentissage supervisé par une classification non supervisée.

Nous présentons ici comment procéder à la construction incrémentale du treillis en y intégrant des relations étiquetées lors d’un co-apprentisage. Nous montrons alors une technique de classiﬁcation de concepts formels combinant des classiﬁcations issues de deux modèles prédictifs co-entraînés.

5.1.2.1 Intégration de relations co-classifiées à un treillis

Nous cherchons ici à rendre compatibles l’algorithme de co-apprentissage et notre algorithme incrémental d’ajout de relations à un treillis (cf. algorithme 5, chapitre 2). Le graphe biparti manipulé en co-apprentissage correspond en fait à un contexte formel dont certaines relations sont associées à des étiquettes (en l’oc- currence les étiquettes sémantiques attachées aux entités nommées). Pour nous situer dans un cadre d’apprentissage semi-supervisé, nous pouvons distinguer le contexte formel KL = (OL, AL, RL) correspondant aux exemples étiquetés de L

et le KU = (OU, AU, RU) qui est associé aux exemples non encore étiquetés de U. Considérons un treillis de Galois T_K_L qui représente les exemples de l’en-

semble L. Les relations RL correspondent aux exemples étiquetés de L employés

à l’initialisation de l’algorithme de co-apprentissage. Rappelons que l’étiquetage des relations de RL n’inﬂuence pas la structure de TKL. À chaque cycle de co- apprentissage, l’ensemble L est augmenté de nouveaux exemples provenant des données étiquetées U. Plus précisément, la ligne 8 de l’algorithme 5 met en œuvre une sélection de relations (o, a) dans l’ensemble U′ _{qui obtiennent les meilleures}

prédictions pour les déplacer vers l’ensemble des relations étiquetées L. Notre démarche consiste simplement à ajouter au treillis chacune des relations (o, a) sélectionnées par un appel à l’algorithme T.add_relation(o, a). La construction du treillis et le co-apprentissage peuvent ainsi être réalisés conjointement selon un mode incrémental. Il est important de noter que la construction du treillis n’a aucune inﬂuence sur le déroulement du co-apprentissage. En revanche, les concepts formels de ce treillis sont employés pour l’annotation conceptuelle des EN du corpus de test. En fait les classiﬁeurs ho et ha mis à jour à chaque itéra-

tion de l’algorithme permettent d’étiqueter tous les concepts formels d’un treillis en cours de construction. Nous devons à présent préciser comment étiqueter les

concepts à l’aide de ces classiﬁeurs.

5.1.2.2 Classifieur bayésien naïf pour l’étiquetage d’un concept formel

Nous représentons maintenant les concepts formels dans un langage des exemples compréhensible par deux classiﬁeurs co-entraînés. Soit c = (E, I), un concept for- mel tel que E = {o0, o1. . . om} et I = {a0, a1. . . an}. Les deux ensembles O et A

du contexte formel K sont supposés conditionnellement indépendants, étant don- née une classe cible l ∈ Labels (cf. hypothèse d’indépendance formulée en 5.1).

Les intensions et les extensions des concepts constituent deux vues indépen- dantes fournissant des variables à deux classiﬁeurs entraînés conjointement par un algorithme de co-apprentissage. En considérant qu’un concept c est décrit par un ensemble de variables indépendantes X = ext(c) ∪ int(c) = {x1. . . xm}, nous

pouvons estimer la probabilité d’une étiquette l ∈ Labels sachant X à l’aide d’un classiﬁeur bayésien naïf :

P(l|X) = P (l) Y i P(xi|l) P(x₁. . . xm) (5.8) Pour des questions calculatoires, nous reformulons P (l|X) à l’aide du théorème de Bayes et de l’hypothèse d’indépendance 5.1 :

L’étiquette l ∈ Labels associée à un concept est celle qui maximise P (l|X) :

h(c) = argmax l∈Labels

P(l|X) (5.12)

Le treillis représenté en ﬁgure 5.3 montre un exemple simple de concepts formels disposant d’une classiﬁcation probabiliste. Les concepts situés entre ⊤ et ⊥

disposent d’une classiﬁcation probabiliste indiquée par des proportions (en pour- centages) pour chaque étiquette (PER, LOC, ORG, MISC). La ﬁgure 5.3 montre également une séquence d’unités lexicales · · · wi−1, wi, wi+1· · · wj−1, wj, wj+1· · ·

dans laquelle wi et wj sont annotées par deux concepts du treillis.

⊤ LOC (60%), ORG (30%), MISC (5%), PER (5%) LOC (10%), ORG (25%), MISC (55%), PER (10%) LOC (65%), ORG (25%), MISC (5%), PER (5%) LOC (40%), ORG (35%), MISC (20%), PER (5%) LOC (15%), ORG (60%), MISC (15%), PER (10%) LOC (55%), ORG (15%), MISC (15%), PER (5%) LOC (20%), ORG (55%), MISC (20%), PER (5%) ⊥ . . . w_i−1 wi LOC wi+1 . . . wj−1 wj ORG wj+1 . . .

Fig.5.3 – Annotation conceptuelle d’unités lexicales à l’aide d’un treillis de Galois disposant de concepts formels étiquetés

Ces deux concepts transmettent leur étiquette majoritaire (LOC et ORG) à

wi et wj. Selon ce principe, un treillis de Galois disposant de concepts étique-

tés peut être exploité en classiﬁcation supervisée. Notre nouveau classiﬁeur peut maintenant être évalué en ayant recours à des expérimentations sur corpus.

Dans le document Apprentissage incrémental pour la construction de bases lexicales évolutives : application en désambiguïsation d'entités nommées (Page 150-154)