• Aucun résultat trouvé

Effets de la qualité des données sur la courbe d'apprentissage des forêts aléatoires

N/A
N/A
Protected

Academic year: 2021

Partager "Effets de la qualité des données sur la courbe d'apprentissage des forêts aléatoires"

Copied!
1
0
0

Texte intégral

(1)

Eets de la qualité des données sur la courbe

d'apprentissage des forêts aléatoires

Yves Brostaux

11 avril 2008

Résumé

Les forêts aléatoires ont été introduites par Leo Breiman (2001) comme un nouvel algorithme d'apprentissage, basé sur l'agrégation d'arbres de décision randomisés. Les eets de l'introduction de bruit et de variables parasites dans l'échantillon d'apprentissage sur la courbe d'apprentissage d'un classicateur de type forêt aléatoire ont été mesurés et comparés aux résultats d'un algorithme classique de génération d'arbre de décision ins-piré par la méthode CART de Breiman (1984). Globalement, la vitesse moyenne de l'apprentissage est assez similaire entre les deux algorithmes, mais les forêts aléatoires exploitent mieux les échantillons de petites et de grandes tailles : leur courbe d'apprentissage commence plus bas et n'est pas aectée par la limitation asymptotique présente chez les arbres de décision uniques.

Premier assistant à l'Unité de Statistique, Informatique et Mathématique appliquées de

la FUSAGx

Références

Documents relatifs

Nous avons étudié une méthode statistique qui prédit de manière jointe les déplacements en latitude et en longitude sur un horizon de 120 h avec un pas de 6 h à partir des

Enfin dans le dernier chapitre, été analysée la consommation d'énergie de l’unité CPF en basant sur les conditions et les donnée réels des conditions afin

The model captures the specificities of both economies (e.g. primary commodity, manufacturing, intermediate inputs, and credit) that are most relevant for understanding the

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Il semblerait que son influence soit limitée ; on peut tenter de l’expliquer en avançant que l’augmentation de ce paramètre permet de diminuer la va- riance de l’estimation

management, board of directors, Audit Committee.. هف تايوتحملا سر عوضوملا ةحفصلا ريدقتو ركش - ءادهلإا - سرهف تايوتحملا I-IV سرهف لوادجلا V سرهف

Before the work of Bogolyubov-Krylov the method of averaging existed as a heuristic theory, after that other rigorous averaging theories were created, see in [2].. In particular,

Le cas nous a permis d’introduire plusieurs concepts, tels que : le circuit économique simplifié, les agents économiques, la valeur ajoutée, la consommation