Haut PDF Représentation et apprentissage de préférences

Représentation et apprentissage de préférences

Représentation et apprentissage de préférences

7.1 Introduction Depuis quelques années, plusieurs méthodes ont été proposées afin d’apprendre des relations de préférence, une bonne partie de ces méthodes sont présentées dans le livre de Fürnkranz et Hüllermeier [35]. Ces approches, vont de l’apprentissage de fonction d’utilité [7, 47, 72] pour les représentations de préférences quantita- tives, à l’apprentissage de règles structurées [10, 26, 49, 50]. Ces travaux sup- posent qu’on donne ou qu’on élicite un ensemble de comparaisons représenté par des paires d’objets comme effectué dans la partie apprentissage du chapitre 4 des GAI de cette thèse, afin de construire un modèle qui généralise ces comparaisons. Toutefois, dans plusieurs cadres, il est intéressant d’apprendre non pas le mo- dèle d’un seul utilisateur, mais plutôt un modèle probabiliste qui peut représenter de manière compacte les préférences d’un groupe d’utilisateurs - ce modèle peut alors être finement ajusté pour s’adapter à un utilisateur particulier. Même dans les contextes où un utilisateur n’est pas anonyme, ses préférences sont généra- lement mal connues, car elles peuvent dépendre de la valeur d’un ensemble de variables d’état non contrôlables. Dans un tel contexte, la question n’est plus de savoir quel est l’objet optimal ou encore est-ce qu’un objet o est préféré à un objet o 0 mais “Quelle est la probabilité qu’un objet o soit optimal ?” ou encore “Quelle est la probabilité que o soit préféré à un objet o 0 ? ”.
En savoir plus

153 En savoir plus

Apprentissage multimodal de représentation de mots à l'aide de contexte visuel

Apprentissage multimodal de représentation de mots à l'aide de contexte visuel

2 Travaux connexes 2.1 Apprentissage de représentation de mots à partir de textes. Les Modèles de Sémantique Distributionnels (MSDs) s’appuient implicitement ou explicitement sur la fac- torisation d’une matrice de co-occurrence de termes pour estimer les représentations de mots ; c’est le cas de GloVe [PSM14] ou Word2Vec [MSC + 13] sur lequel nous nous basons. Dans ce dernier modèle, les mots sont prédits compte tenu de leur contexte (modèle CBOW - "Continuous Bag Of Word") ou réciproque- ment (modèle Skip-Gram). Ces deux variantes de mo- dèles ont pour objectif d’apprendre deux représenta- tions pour un même mot (une pour le mot en tant qu’entité, une en tant que contexte) ; les représenta- tions d’entités et de contextes présentant des caracté- ristiques complémentaires [NMCC16]. Plusieurs exten- sions ont été proposées au modèle de Skip-Gram, les plus proches de notre travail étant celles qui prennent en compte de l’information supplémentaire fournie par des graphes de connaissance [TGCL16, SCH17]. Comme dans notre approche, des données complémen- taires au texte sont utilisées pour améliorer les re- présentations de mots, cependant, nous utilisons des images au lieu de bases de connaissance.
En savoir plus

11 En savoir plus

Apprentissage de préférences en espace combinatoire  et application à la recommandation en configuration interactive

Apprentissage de préférences en espace combinatoire et application à la recommandation en configuration interactive

Chapitre 5. Apprentissage de k-LP-trees à partir d’exemples positifs • ordonner des objets à partir de notes (défini section 3.2.2) ; • ordonner des étiquettes (défini section 3.2.3). Ces problèmes se différencient notamment par les données sur lesquelles se base l’apprentissage. Il existe néanmoins des situations dans lesquelles ni comparaisons, ni notes ne sont disponibles, comme cela peut être le cas pour les configurateurs en ligne. Par contre, les entreprises d’e-commerce conservent généralement une liste des produits déjà vendus. Ces objets vendus nous apportent des informations sur les goûts des utilisateurs ; on pourrait donc chercher à apprendre les préférences de ces utilisateurs à partir d’un ensemble d’exemples. Ce problème, apprendre un modèle ordinal à partir d’un ensemble d’objets sélectionnés par les utilisateurs, n’a encore jamais été traité. Pour cette raison, nous avons décidé de chercher à apprendre des k-LP-trees à partir d’exemples positifs ; en effet, il s’agit de modèles ordinaux relativement simples tout en étant une représentation généralement pertinente des comportements humains [GG96].
En savoir plus

180 En savoir plus

Apprentissage d'arbres de convolutions pour la représentation parcimonieuse

Apprentissage d'arbres de convolutions pour la représentation parcimonieuse

2 Introduction deux approches. Les approches à dictionnaire fixe utilisent un espace de représentation pré-construit, bénéficiant généralement d’une transformée rapide pour passer de l’image à sa représentation abs- traite et inversement. Toutefois, ces dictionnaires fixes, tels que les transformées en cosinus ou en ondelettes, ont une capacité limitée à exprimer les images de manière parcimonieuse. La clé pour obtenir des parcimonies plus fortes en limitant la dégradation des données est une approche adapta- tive, appelée apprentissage de dictionnaire. Dans cette approche, l’espace de représentation s’adapte à un certain type d’images. Si cela permet d’obtenir un bien meilleur compromis entre parcimonie et dégradation, ces dictionnaires adaptés n’ont pas de structure prévisible. Par conséquent, les calculs impliquant ces dictionnaires ne sont pas faits à l’aide de transformées rapides. Ces méthodes sont donc inadaptées aux images numérique de taille réelle. Elles opèrent sur des découpages d’images en “patchs” qu’il faut ensuite ré-assembler. Ces méthodes sont donc inadaptées aux applications en approximation et à la résolution de problèmes inverses mal posés.
En savoir plus

198 En savoir plus

Apprentissage de préférences à partir d'une ontologie formelle : méthodes et application en antibiothérapie

Apprentissage de préférences à partir d'une ontologie formelle : méthodes et application en antibiothérapie

Dans cet article, nous proposons une méthode pour apprendre un modèle de préférences à partir d’une ontologie, et prenant en compte les domaines multiples, les propriétés n-aires, et les valeurs manquantes. La méthode “projette” tous les attributs sur les individus d’une seule classe de l’ontologie, et ensuite les méthodes classiques d’apprentissage de préférences peuvent être employées. Nous décrivons aussi une méthode simple d’apprentissage de préfé- rences, qui traduit l’apprentissage du modèle de préférences en un problème d’optimisation qui est résolu à l’aide d’une métaheuristique. Cependant, d’autres méthodes d’apprentissage pourraient être utilisées, et donc, la méthode que nous proposons pour appliquer l’apprentis- sage de préférences aux ontologies est générale, et non limitée à la méthode d’apprentissage présentée ici. Nous présentons également une étude de cas, dans laquelle nous utilisons la mé- thode proposée sur une ontologie des antibiotiques. Cette ontologie décrit les antibiotiques, les maladies infectieuses et les profils de patients concernés. Elle inclut aussi les recomman- dations de prescription issues de guides de bonnes pratiques cliniques et diverses propriétés liées aux antibiotiques et à leur utilisation (comme la présence d’effets indésirables impor- tants, ou le risque de résistances bactériennes). A partir de cette ontologie, nous rendrons explicite le modèle de préférences implicite utilisé par les experts pour recommander un an- tibiotique lors de l’écriture des recommandations.
En savoir plus

16 En savoir plus

Apprentissage de représentation des documents médicaux guidé par les concepts pour la recherche d'information

Apprentissage de représentation des documents médicaux guidé par les concepts pour la recherche d'information

mots du document et les concepts issus de la ressource UMLS puis intégrer les degrés de ces associations dans le calcul de pertinence des documents. Apprentissage de représentation à partir de ressources externes. Une des principales approches d’apprentissage de représentation repose sur les modèles Skip-gram et CBOW (Mi- kolov et al., 2013). Basés sur l’hypothèse de la sémantique distributionnelle qui guide la re- présentation d’un mot en fonction de son contexte, ces modèles ont été étendus pour repré- senter les documents (Le et Mikolov, 2014) et les concepts issus de ressources externes (Ni et al., 2016). Au-delà, plusieurs travaux se concentrent sur l’utilisation additionnelle des res- sources externes afin d’intégrer les concepts et leurs relations dans la représentation latente des mots (Faruqui et al., 2015; Xu et al., 2014). Par exemple, Faruqui et al. (2015) propose une technique de lissage de représentation basée sur l’information relationnelle dérivée des res- sources externes. L’intuition sous-jacente à cette approche est que des concepts adjacents dans une ressource doivent avoir des représentations distributionnelles similaires. Dans le domaine médical, un nombre croissant de travaux s’intéressent à l’apprentissage de représentation des concepts (De Vine et al., 2014; Choi et al., 2016; Liu et al., 2016), dont certains d’entre eux (De Vine et al., 2014; Liu et al., 2016) pour une tâche de RI. Par exemple, Liu et al. (2016) s’appuient sur les travaux de Yu et Dredze (2014) pour intégrer la prise en compte des relations dans la représentation du document. Le score de pertinence est ensuite calculé par une combi- naison linéaire des scores de pertinence des documents obtenus sur la base des représentations uniquement basées sur les mots (bag-of-words) avec ceux obtenus à partir des représentations latentes intégrant la sémantique relationnelle. A un niveau de granularité plus élevé, Choi et al. (2016) proposent le modèle Med2vec qui exploite la séquence des comptes-rendus des visites des patients pour apprendre une représentation latente des concepts terminologiques et des visites.
En savoir plus

9 En savoir plus

Apprentissage de représentation des documents médicaux guidé par les concepts pour la recherche d'information

Apprentissage de représentation des documents médicaux guidé par les concepts pour la recherche d'information

mots du document et les concepts issus de la ressource UMLS puis intégrer les degrés de ces associations dans le calcul de pertinence des documents. Apprentissage de représentation à partir de ressources externes. Une des principales approches d’apprentissage de représentation repose sur les modèles Skip-gram et CBOW (Mi- kolov et al., 2013). Basés sur l’hypothèse de la sémantique distributionnelle qui guide la re- présentation d’un mot en fonction de son contexte, ces modèles ont été étendus pour repré- senter les documents (Le et Mikolov, 2014) et les concepts issus de ressources externes (Ni et al., 2016). Au-delà, plusieurs travaux se concentrent sur l’utilisation additionnelle des res- sources externes afin d’intégrer les concepts et leurs relations dans la représentation latente des mots (Faruqui et al., 2015; Xu et al., 2014). Par exemple, Faruqui et al. (2015) propose une technique de lissage de représentation basée sur l’information relationnelle dérivée des res- sources externes. L’intuition sous-jacente à cette approche est que des concepts adjacents dans une ressource doivent avoir des représentations distributionnelles similaires. Dans le domaine médical, un nombre croissant de travaux s’intéressent à l’apprentissage de représentation des concepts (De Vine et al., 2014; Choi et al., 2016; Liu et al., 2016), dont certains d’entre eux (De Vine et al., 2014; Liu et al., 2016) pour une tâche de RI. Par exemple, Liu et al. (2016) s’appuient sur les travaux de Yu et Dredze (2014) pour intégrer la prise en compte des relations dans la représentation du document. Le score de pertinence est ensuite calculé par une combi- naison linéaire des scores de pertinence des documents obtenus sur la base des représentations uniquement basées sur les mots (bag-of-words) avec ceux obtenus à partir des représentations latentes intégrant la sémantique relationnelle. A un niveau de granularité plus élevé, Choi et al. (2016) proposent le modèle Med2vec qui exploite la séquence des comptes-rendus des visites des patients pour apprendre une représentation latente des concepts terminologiques et des visites.
En savoir plus

10 En savoir plus

Pépite | Parsing en dépendances multilingue : représentation de mots et apprentissage joint pour l’analyse syntaxique

Pépite | Parsing en dépendances multilingue : représentation de mots et apprentissage joint pour l’analyse syntaxique

Multi-Lingual Dependency Parsing : Word Representation and Joint Training for Syntactic Analysis Parsing en Dépendances Multilingue : Représentation de Mots et Apprentissage Joint pour l[r]

187 En savoir plus

Modélisation et apprentissage des préférences appliqués à la recommandation dans les systèmes d'impression

Modélisation et apprentissage des préférences appliqués à la recommandation dans les systèmes d'impression

Cette remarque nous a guidé vers la recherche d'une solution inspirée du monde du commerce électronique. Depuis quelques années, de plus en plus de sites web marchands se dotent de systèmes de recommandation. Ceux-ci doivent faciliter la tâche de l'acheteur en lui proposant des produits qui sont sensés l'intéresser particu- lièrement. Plusieurs types de prolages utilisateur ont été proposés an de réaliser ces recommandations. On peut trouver des exemples de sites web proposant des ser- vices de recommandation, ainsi qu'une taxonomie des systèmes de recommandation utilisés dans [SKR99]. La plupart des recommandeurs nécessitent que l'utilisateur donne des informations sur ses préférences de manière explicite. Dans tous les cas, les prols sont ranés à travers les choix des utilisateurs. C'est l'approche que nous avons suivie pour résoudre le problème de l'automatisation de la conguration d'im- pression. Dans notre optique, la politique d'impression tient lieu de prol utilisateur et les congurations - éventuellement manuelles - des paramètres d'impression des diérents documents représentent les choix de l'imprimeur. La conguration de la politique d'impression est la conséquence d'un apprentissage automatique des pré- férences de l'imprimeur, au fur et à mesure de ses choix.
En savoir plus

221 En savoir plus

Jeux booléens statiques et représentation compacte de préférences

Jeux booléens statiques et représentation compacte de préférences

à n joueurs avec 2 actions chacun) et de 2 × 2 p × 2 2p = 2 3p +1 (pour le jeu à deux joueurs contrôlant chacun p variables booléennes). D’un autre côté, une sous-branche de l’intelligence artificielle s’intéresse aux langages de représentation compacte de préférences (ordinales ou numériques). Ces langages permettent une représentation concise de relations de préférences, ou de fonctions d’utilité, sur un ensemble de conséquences qui possède une structure combinatoire (c’est-à-dire un produit cartésien de domaines de valeurs finis pour un ensemble fini de variables), en exploitant dans une large mesure des propriétés structurelles des relations de préférences (comme l’indépendance préférentielle entre variables). En particulier, lorsque les variables en jeu sont binaires, ces langages sont fondés sur la logique propositionnelle, dont ils héritent l’expressivité et les méthodes algorithmiques (pour la déduction et la recherche de modèles, notamment). L’expressivité et le pouvoir de concision des langages de représentation logique de préférences sont étudiés dans [CMLLM04] et leur complexité algorithmique dans [Lan04].
En savoir plus

71 En savoir plus

Apprentissage de représentation dirigée par la tâche

Apprentissage de représentation dirigée par la tâche

Les premiers, appelés algorithmes de sélection d’attributs ([Guyon and Elisseeff, 2003]), choisissent un sous-ensemble des attributs initiaux, selon leurs capacités de prédiction individuelles ou combinées, tels que les algorithmes basés sur les arbres ([Geurts et al., 2006]). Les attributs initialement disponibles pouv- ant être peu adaptés à la tâche ciblée, les autres algorithmes d’apprentissage de représentation proposent de construire un ensemble d’attributs en trans- formant les attributs initialement disponibles, tout en réduisant le nombre d’attributs décrivant les données. Ces approches sont dans le domaine de la réduction de dimensionnalité, parmi lesquels on retrouve l’Analyse en Com- posantes Principales, ou les auto-encoders ([Rifai et al., 2011]). Un dernier groupe d’algorithmes d’apprentissage de représentation proposent un nouvel ensemble d’attributs sans contraintes sur la dimension. Avec ces méthodes, les données sont projetées dans un nouvel espace de représentation en ap- pliquant des transformations sur l’ensemble initial d’attributs. Parmi ces al- gorithmes et proches de l’approche proposée dans ces travaux, les algorithmes développés dans [J. Weston, 2008] et [Hoffer and Ailon, 2014] apprennent un réseau de neurones pour projeter les données dasn un espace de représenta- tion satisfaisant certaines contraintes liées à une distance.
En savoir plus

133 En savoir plus

Jeux booléens statiques et représentation compacte de préférences

Jeux booléens statiques et représentation compacte de préférences

à n joueurs avec 2 actions chacun) et de 2 × 2 p × 2 2p = 2 3p +1 (pour le jeu à deux joueurs contrôlant chacun p variables booléennes). D’un autre côté, une sous-branche de l’intelligence artificielle s’intéresse aux langages de représentation compacte de préférences (ordinales ou numériques). Ces langages permettent une représentation concise de relations de préférences, ou de fonctions d’utilité, sur un ensemble de conséquences qui possède une structure combinatoire (c’est-à-dire un produit cartésien de domaines de valeurs finis pour un ensemble fini de variables), en exploitant dans une large mesure des propriétés structurelles des relations de préférences (comme l’indépendance préférentielle entre variables). En particulier, lorsque les variables en jeu sont binaires, ces langages sont fondés sur la logique propositionnelle, dont ils héritent l’expressivité et les méthodes algorithmiques (pour la déduction et la recherche de modèles, notamment). L’expressivité et le pouvoir de concision des langages de représentation logique de préférences sont étudiés dans [CMLLM04] et leur complexité algorithmique dans [Lan04].
En savoir plus

72 En savoir plus

Apprentissage d'un espace de concepts de mots pour une nouvelle représentation des données textuelles

Apprentissage d'un espace de concepts de mots pour une nouvelle représentation des données textuelles

Nous utilisons le cadre du clustering de documents pour évaluer l’espace de concepts induit par notre hypothèse, et nous comparons ses performances avec l’espace de concepts induit par [r]

21 En savoir plus

Apprentissage automatique des classes d'occupation du sol et représentation en mots visuels des images satellitaires

Apprentissage automatique des classes d'occupation du sol et représentation en mots visuels des images satellitaires

A partir des cartes issues de la classification CORINE Land Cover, et des images satel- litaires multispectrales ayant contribu´e `a la constitution de ces cartes, nous montrons tout d’a[r]

191 En savoir plus

2004 — Optimisation d'ensembles de classifieurs non paramétriques avec apprentissage par représentation partielle de l'information

2004 — Optimisation d'ensembles de classifieurs non paramétriques avec apprentissage par représentation partielle de l'information

La classification est un domaine d'application et de recherche où des automates, souvent des programmes informatiques, ont à prendre des décisions quant à 1' appartenance d'un o[r]

192 En savoir plus

Apprentissage de représentation et auto-organisation modulaire pour un agent autonome

Apprentissage de représentation et auto-organisation modulaire pour un agent autonome

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignemen[r]

169 En savoir plus

La transparence sur les préférences des banques centrales est-elle souhaitable ?

La transparence sur les préférences des banques centrales est-elle souhaitable ?

3 Révélation implicite des préférences de la banque cen- trale Dans cette section, nous allons étudier l’impact de l’information sur ses préférences (le paramètre α) que la banque centrale peut dévoiler implicitement par ses décisions. Nous avons supposé jusqu’à présent que le taux d’inflation constituait l’instrument de la banque centrale. Par conséquent, le choix, par la banque centrale, du niveau d’inflation constitue un signal implicite des préférences de la banque centrale. De la même manière, si nous avions introduit une équation (IS) avec un taux d’intérêt, l’observation du niveau du taux d’intérêt aurait permis au secteur privé d’obtenir de l’information implicitement sur les objectifs de la banque centrale. Notre objectif à présent est d’étudier l’impact de l’information implicite contenue dans les décisions de la banque centrale afin de pouvoir éventuellement conclure si la banque centrale a plutôt intérêt à dévoiler ses préférences de manière explicite via sa politique de communication, ou au contraire, de laisser le secteur privé inférer ses préférences via l’apprentissage. Bien sûr, cette dernière possibilité (le secteur privé obtient de l’information sur les préférences implicitement via l’observation des décisions de la banque centrale) n’est possible que si l’on considère un jeu dynamique, ie à plusieurs périodes. Dans un jeu dynamique, il faut alors tenir compte de l’impact de l’équilibre à la première période pour calculer le bien-être à la seconde période.
En savoir plus

20 En savoir plus

Modèles ordinaux de préférences

Modèles ordinaux de préférences

considérerons donc que la relation d’incomparabilité de l’ordre strict O modélise la relation d’indifférence. Nous reviendrons sur l'équivalence -en fait une dualité- entre ces deux classes de modèles à!la fin de ce texte. Nous examinerons successivement aux sections 2,3 et 4 les classes d’ordres suivantes !: ordre strict fort, ordre strict quasi-fort et ordre strict d’intervalles (dans la suite nous omettrons généralement le qualificatif strict). Pour chacune de ces classes, nous donnerons plusieurs caractérisations des ordres de la classe ainsi que leurs propriétés de représentation numérique. La démonstration des résultats énoncés ne sera pas toujours faite immédiatement. En effet, il sera plus simple et surtout moins répétitif d’introduire à la section 5 une classe de relations binaires particulières appelées "relations de Ferrers" ou “biordres“. Les biordres ne sont pas en général des ordres, mais tous les ordres évoqués ci-dessus sont des biordres particuliers. Il suffira donc d’appliquer à ces différents cas les résultats généraux, d’ailleurs de démonstration simple, de caractérisation et de représentation numérique des biordres. On a toutefois une exception à cette démarche dans le cas de la représentation numérique “à seuil constant“ des ordres quasi-forts. Ce résultat, d’obtention beaucoup moins aisée, peut être prouvé au moyen de notions et résultats de la théorie des graphes dont l'exposé serait trop long ici ; nous nous contenterons donc de renvoyer à des références pour sa preuve.
En savoir plus

19 En savoir plus

Universités américaines : la fin des préférences raciales ?

Universités américaines : la fin des préférences raciales ?

ans le contexte américain, la « discrimination positive » (affirmative action) désigne un ensemble de mesures qui octroient un traitement pré- férentiel, pour la répartition de certaines ressources rares, aux membres de groupes ayant subi dans le passé un régime juridique discriminatoire : les Noirs, les Hispa- niques, les femmes, les descendants des populations autochtones (Native Americans) et parfois les Asiatiques. Ses trois domaines d’application sont l’emploi, l’attribu- tion de marchés publics et l’admission dans les universités. La plupart de ces mesures ont été adoptées à partir de la fin des années soixante à l’initiative de dif- férents organes de l’Exécutif fédéral, avec pour objectif de remédier à la sous- représentation statistique des membres de ces groupes parmi les bénéficiaires des ressources considérées. L’expression « traitement préférentiel », employée ici sans aucune intention polémique, se définit comme suit si l’on s’en tient au cas simplifié de l’opposition entre deux groupes : un candidat noir N1 sera sélectionné pour occuper une position donnée alors qu’il existait au moins un candidat blanc dont
En savoir plus

14 En savoir plus

Contribution à l'extraction des règles d'association basée sur des préférences

Contribution à l'extraction des règles d'association basée sur des préférences

• Outil de visualisation : les approches que nous avons proposées dans cette thèse fournissent un ensemble de règles sélectionnées selon les préférences d'un ou plusieurs experts. En revanche, les experts pourront avoir du mal à comprendre pourquoi une règle est sélectionnée ou encore quelles sont les mesures qui ont permis à une telle règle de faire partie des non dominées ou des représentatives. De telles informations permettent aux experts d'approfondir davantage leur analyse. Une solution possible consiste à exploiter la visualisation d'information [CMS99] an de présenter ces informations d'une manière graphique. En eet, plusieurs outils de visualisation ont été proposées permettant de visualiser les règles d'association. Parmi ces outils, nous citons IRSetNav [FR04] (basé sur la représentation textuelle), GerVis [YN06] (basé sur la représentation en deux dimensions), l'outil Minset Tree Viewer [Leh00] (basé sur la représentation en trois dimensions) et l'outil ARvis[BGRB03] (basé sur la réalité virtuelle). Par conséquent, il serait intéressant de proposer un environnement interactif intégrant nos approches et permettant la visualisation des règles sélectionnées avec leurs valeurs associées aux diérentes mesures.
En savoir plus

152 En savoir plus

Show all 2119 documents...