Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Cadre d'Evaluation pour la Méta Analyse de Données

Partager "Cadre d'Evaluation pour la Méta Analyse de Données"

N/A

N/A

Protected

Année scolaire: 2021

Info

Protected

Academic year: 2021

Partager "Cadre d'Evaluation pour la Méta Analyse de Données"

Copied!

3

0

0

3

0

0

Chargement.... (Voir le texte intégral maintenant)

Télécharger maintenant ( 3 Page )

Texte intégral

(1)

HAL Id: hal-01470864

https://hal.archives-ouvertes.fr/hal-01470864

Submitted on 22 Feb 2017

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Cadre d’Evaluation pour la Méta Analyse de Données

William Raynaut, Chantal Soulé-Dupuy, Nathalie Vallès-Parlangeau

To cite this version:

William Raynaut, Chantal Soulé-Dupuy, Nathalie Vallès-Parlangeau. Cadre d’Evaluation pour la Méta Analyse de Données. Extraction et Gestion des Connaissances, Jan 2017, Grenoble, France.

�hal-01470864�

(2)

Cadre d’Evaluation pour la Méta Analyse de Données

William Raynaut

^∗

, Chantal Soule-Dupuy

^∗

, Nathalie Valles-Parlangeau

^∗

∗

IRIT UMR 5505, UT1, UT3, Universite de Toulouse prenom.nom@irit.fr

Disclaimer - Ce texte est un aperçu de "Meta-Mining Evaluation Framework : A large scale proof of concept on Meta-Learning", accepté pour publication à AI 2016, "29th Australasian Joint Conference on Artificial Intelligence" (Raynaut et al., 2016).

La méta analyse de données désigne la recherche d’une méthode efficace ou optimale per- mettant d’adresser un problème d’analyse de données. Cela recouvre une grande variété de tâches, dont certaines ont d’ores et déjà été abondamment étudiées. Par exemple, pour le pro- blème de satisfiabilité booléenne (SAT), différentes approches de type portfolio ont été déve- loppées (Xu et al., 2012), reposant sur la sélection d’un algorithme approprié à la résolution d’une instance particulière du problème. La sélection d’algorithmes a également été employé pour des problèmes d’apprentissage, donnant lieu à diverses approches de méta-apprentissage.

Ces problèmes particuliers ont été étudiés isolément, mais le prochain défi de la méta analyse de données réside en leur unification. En particulier, la recommandation de chaine de trai- tement d’analyse de données a reçu un intérêt croissant ces dernière années (Zakova et al., 2011; Serban et al., 2013). Ce problème consiste en la construction de chaînes de traitement permettant de résoudre différents problèmes d’analyse de données.

L’émergence de ces nouvelles approches amène la question de leur évaluation et com- paraison. En effet, les critères employés dans l’évaluation des méthodes dédiées à des sous- problèmes spécifiques diffèrent souvent. Comparer la performance d’une recherche de motif et d’une régression n’est pas trivial. Afin de pouvoir évaluer et comparer les méthodes exis- tantes et futures de méta analyse de données, nous nous attachons à construire un cadre général basé sur un critère unifié.

D’autre part, l’analyse de données reposant toujours principalement sur l’expertise hu- maine, la connaissance du méta-domaine est partielle et souvent implicite. Un moyen de construire explicitement cette connaissance pourrait consolider notre compréhension du do- maine et aider à orienter les recherches à venir. Nous accorderons donc une grande importance à la compréhensibilité des résultats et à la qualification de leur validité.

Une expérience à grande échelle a été réalisée pour démontrer la praticabilité du cadre

d’évaluation, et les tests statistique employés pour l’exploration des résultats valident les con-

naissances produites. Ils permettent par ailleurs d’étudier par une visualisation intuitive di-

verses questions que l’on peut se poser sur l’analyse de données, comme illustré en Figure 1 :

Quelle sélection d’attributs employer au méta-niveau ? On peut y remarquer certains groupes

(3)

Cadre d’Evaluation pour la Méta Analyse de Données

F

IG

. 1 – Resultats du test de Nemenyi sur les méthodes de sélections d’attributs employées au méta-niveau. Les méthodes sont classées par performance croissante et les groupes connectés ne sont pas jugés significativement différents.

de méthodes virtuellement équivalentes, ainsi qu’y visualiser l’impact des paramètres de cer- taines méthodes, mais le résultat le plus frappant est que la majorité des méthodes sont si- gnificativement moins performantes que l’absence de sélection d’attributs au méta-niveau, suggérant l’importance de grands ensembles de méta-attributs pour la performance du méta- apprentissage.

Au delà de son intérêt naturel dans l’évaluation de nouvelles méthodes de méta analyse de données, notre approche permet d’étudier divers aspects du méta-niveau encore mal connus.

En particulier, des expériences conçues selon ce cadre d’évaluation sont en cours pour étudier l’impact de la caractérisation des jeux de données sur la performance du méta-apprentissage.

Références

Raynaut, W., C. Soule-Dupuy, et N. Valles (2016). Meta-mining evaluation framework : A large scale proof of concept on meta-learning. In 29th Australasian Joint Conference on Artificial Intelligence.

Serban, F., J. Vanschoren, J.-U. Kietz, et A. Bernstein (2013). A survey of intelligent assistants for data analysis. ACM Computing Surveys (CSUR) 45(3), 31.

Xu, L., F. Hutter, J. Shen, H. H. Hoos, et K. Leyton-Brown (2012). Satzilla2012 : improved algorithm selection based on cost-sensitive classification models. Balint et al., 57–58.

Zakova, M., P. Kremen, F. Zelezny, et N. Lavrac (2011). Automating knowledge discovery

workflow composition through ontology-based planning. Automation Science and Enginee-

ring, IEEE Transactions on 8(2), 253–264.

Références

Télécharger maintenant ( PDF - 3 Page - 221.50 KB )

Documents relatifs

ALFON spa دراسة میدانیة بالمؤسسة الجزائریة للسباكة علاقة فعالیة الأداء الفردي بالمیزة التنافسیة للمؤسسة

، 110:2007 ( ، ﺏﻫﺫ ﺎﻤ ﺍﺫﻫ ﻭ ﻪﻴﻟﺇ ﻭﻴﺩﺎﻨﻭﺩ ﺭﺍﺭﻴﺠ Gérard Donadieu لﺠﻴﻴﺭﻠﻴﻫ ﻥﻤ لﻜ ﺎﻀﻴﺃ ﻭ Hellriegel ﻡﻭﻜﻭﻠﺴ ﻭ ، Slocum ﻥﺎﻤﺩﻭﻭ ، Woodrman

Some aspects of mass transfer within the passages of fuel cells

2(b-c), '' however, the boundary conditions for mass transfer are considered as different for heat transfer, since although there is zero mass flux at all but one boundary,

Debunking Double Bunking in the Correctional Service of Canada: A Critical Qualitative Account

(CSC), as cited in the Annual Report of the Office of the Correctional Investigator for 2011-2012 speaks to the pervasive issue of a burgeoning federal prison population and its

Méta-analyse de la demande de vin

- La baisse générale du niveau de taxation des boissons alcoolisées. Pour tester cette hypothèse de causalité, les auteurs effectuent des simulations en supposant fixés les

Influence de la radioactivité des éléments actinide sur les mesures de susceptibilité magnétique en solution

L’apport d’informations sur les propriétés électroniques des ions actinide en solution peut être notamment réalisé par l’intermédiaire de mesures de susceptibilité

آلیات مقاربة التراث السردي في النقد المغاربي المعاصر

:ﺔﯾﺑرﻌﻟا ﺔﻐﻠﻟﺎﺑ صﺧﻠﻣﻟا Résumé (Français) ﺎﻋد ﺚﯿﺣ ، ﻲﺑرﺎﻐﻤﻟا ﺪﻘﻨﻟا ﻲﻓ ﺔﯾدﺮﺴﻟا ﺔﯿﺛاﺮﺘﻟا صﻮﺼﻨﻟا ﻦﻋ ةﺮﯿﺧﻷا ﺔﻧوﻵا ﻲﻓ ﺚﯾﺪﺤﻟا ﺮﺜﻛ لﺎﻤھﻹاو ﺮﯿﺼﻘﺘﻟا

Cours: "Le rôle du lecteur d'après Umberto Eco"

Avant tout la signification des textes littéraires, mais plus généralement de tout texte et d’autres activités humaines où l’on peut identifier la

Téléchargez tous les documents en téléchargeant vos documents d'étude.

Votre document sera enrichi, partagé sur 123dok FR pour vous aider à étudier.

Documents relatifs

Ability to Maintain Internal Arousal and Motivation Modulates Brain Responses to Emotions

Ability to Maintain Internal Arousal and Motivation Modulates Brain Responses to Emotions

24

0

0

Des ruptures conventionnelles vues par des salariés : analyse d'un échantillon de cent une ruptures conventionnelles signées fin 2010

Des ruptures conventionnelles vues par des salariés : analyse d'un échantillon de cent une ruptures conventionnelles signées fin 2010

229

0

0

Études fines des échanges énergétiques entre les bâtiments et l'atmosphère urbaine

Études fines des échanges énergétiques entre les bâtiments et l'atmosphère urbaine

200

0

0

Les déterminants du secteur informel dans les pays en voie de développement : réglementation, corruption, procédures administratives et mode de financement

Les déterminants du secteur informel dans les pays en voie de développement : réglementation, corruption, procédures administratives et mode de financement

146

0

0

Bureaucratie.

5

0

0

Consommation de masse et consommation de classe à Paris des années 1880 aux années 1920 : bilan d’une recherche

Consommation de masse et consommation de classe à Paris des années 1880 aux années 1920 : bilan d’une recherche

18

0

0

Blood donation within the family : the transmission of values and practices

Blood donation within the family : the transmission of values and practices

1

0

0