• Aucun résultat trouvé

Grille de calcul distribué pour l’optimisation combinatoire avec applications en génomique ESIEE-Paris - Projet de fin de troisième année - département d’informatique René Natowicz - Mars 2009

N/A
N/A
Protected

Academic year: 2022

Partager "Grille de calcul distribué pour l’optimisation combinatoire avec applications en génomique ESIEE-Paris - Projet de fin de troisième année - département d’informatique René Natowicz - Mars 2009"

Copied!
2
0
0

Texte intégral

(1)

Grille de calcul distribué pour l’optimisation combinatoire avec applications en génomique

ESIEE-Paris - Projet de fin de troisième année - département d’informatique

René Natowicz - Mars 2009

Un problème d’optimisation combinatoire c’est :

« Trouver unmeilleurélément,x, dans un ensemble fini,X.»

Plus précisément, une fonction réellefest définie sur l’ensembleX; l’élément x est un optimum de cette fonction (minimum ou maximum, selon le problème considéré) :

x = arg (optimumx∈Xf(x)). La fonctionf est dite fonction « objectif ».

L’ensembleXétant de cardinal fini, ce problème est trivialement résolu par un parcours exhaustif de l’ensemble, avec calcul de la valeurf(x)de chaque élément de l’ensemble. La difficulté vient de la taille de l’ensemble X : on s’intéresse ici à des ensembles dont le nombre d’éléments est « astronomique ». Cette car- actéristique conduit à développer à des « stratégies de résolution » permettant de n’explorer qu’une toute petite partie de l’ensembleX.

Vous avez déjà rencontré des problèmes d’optimisation combinatoire dans votre cours d’algorithmique de deuxième année (ou de troisième année selon votre voie d’entrée à l’ESIEE), et dans votre cours de graphe de troisième an- née. Quelques-uns d’entre-eux, rares, peuvent être résolus par des algorithmes gloutons (calcul d’arbres de poids minimum par les algorithmes de Prim ou de Kruskal). Les autres problèmes que vous avez rencontrés ont été résolus par pro- grammation dynamique : calcul d’un sac à dos de valeur maximum, calcul d’une répartition optimale des heures de travail pour la révision des contrôles (le célèbre problème de Juliette), calcul d’une d’une plus longue séquence commune à deux séquences, calculs de chemins de coût minimum, etc. Pour chacun de ces prob- lèmes, vous avez mis en évidence une propriété d’optimalité récurrente : toute solution optimale s’obtient en « combinant » des solutions optimales calculées pour des sous-problèmes de tailles inférieures. Cette propriété d’optimalité récur- rente permet de ne parcourir qu’une petite partie de l’ensembleX.

Pour chacun de ces problèmes que vous avez étudiés, l’approche de program- mation dynamique retournait des solutions optimales en complexité polynômiale.

Mais, comme chacun d’entre nous, la programmation dynamique a ses limites :

• il y a des problèmes pour lesquels le nombre de sous-problèmes à « com- biner » augmente de façon non polynômiale, conduisant ainsi à des com- plexités elles-mêmes non polynômiales ;

• il y a des problèmes pour lesquels on ne sait pas mettre en évidence la propriété d’optimalité récurrente (et peut-être n’existe-t-elle pas...)

(2)

Pour ces problèmes, renonçant à l’optimalité des solutions, on a développé des méthodes qui n’explorent qu’une partie de l’ensemble et retournent des solutions proches de l’optimum, sans garantie d’atteindre cet optimum : exploration avec listes tabou, algorithmes évolutionnaires, algorithmes de colonies de fourmis, al- gorithmes d’essaims particulaires pour ne citer que les principales approches (mé- taheuristiquespour l’optimisation difficile).

Ces méthodes étant assez aisément parallélisables, on s’intéresse particulière- ment à leurs implantations parallèles car elles permettent d’augmenter la taille du sous-ensemble exploré, donc de se rapprocher de l’optimum de la fonction objec- tif, tout en restant dans des temps de calcul « raisonnables. »

Les grilles de calcul sont une infrastructure matérielle et système pemettant de mettre en oeuvre avec un très faible coût, le parallélisme potentiel des méthodes d’exploration métaheuristiques. C’est l’objet de ce projet.

– Grille de calcul : Berkeley Open Infrastructure for Network Computing (BOINC).

– Langage de programmation : C.

– Applications : problèmes benchmark d’optimisation combinatoire ; calcul de sous-ensembles de gènes prédictifs de la réponse à la chimiothérapie ; calcul de sous-ensembles de gènes prédictifs de la mutation du gène TP53 (tumor protein P53).

Remarque : le projet « Calcul Distribué » (numéro 3 sur la liste des projets du département d’informatique) utilise également la plateforme de développement d’applications distribuées BOINC. L’interaction entre les deux groupes est vive- ment encouragée.

Quelques références rapidement accessibles : – BOINC (en anglais) :

http://boinc.berkeley.edu/

– BOINC (en français) :

http://www.boinc-af.org/

– Optimisation combinatoire :

http://fr.wikipedia.org/wiki/Optimisation_combinatoire – Métaheuristiques :

http://fr.wikipedia.org/wiki/Métaheuristique

2

Références

Documents relatifs

T out au long de cette thèse, nous avons proposé un ensemble d’outils pour l’analyse et la conception de métaheuristiques parallèles à base de population pour l’optimisation

En 10 ans, le calcul distribué sur plusieurs processeurs, c'est à dire le calcul parallèle en général, a pu se développer avec les avancées de l'algorithmique pour ce domaine..

La mise en commun des ressources informatiques disponibles sur des sites géographiquement dispersés suivant le modèle de grille est une approche intéressante : ce modèle

Les différents centres, selon leur niveau dans l’architecture de la grille de calcul, s’engagent par le biais de l’accord de collaboration ou MoU signé entre le CERN et les

Le traitement des séquences par ePANAM est réalisé en deux étapes : la première étape compare les séquences à une base de référence constituée de séquences

ﻥﻤ ﻍﺭﺎﺒﺩﻟﻭﻏ ﻑﻴﻟﺄﺘ Goldberg ﺯﻤﺎﻴﻟﻭﻭ Williams ﺔﻨﺴ 1991 ﻰﻟﺇ ﻡﺠﺭﺘ ﻱﺫﻟﺍ ، ﺔﻨﺴ ﺭﻔﻌﺠ ﻯﺩﻫ لﺒﻗ ﻥﻤ ﺔﻴﺒﺭﻌﻟﺍ ﺔﻐﻠﻟﺍ 1999 ﺩﺍﺭﻓﻷﺍ ﻥﻴﺒ ﺯﻴﻴﻤﺘﻟﺍ ﻰﻟﺇ ﻑﺩﻬﻴ ﻱﺫﻟﺍ ، ﻥﻤ ﻡﻫﺭﻴﻏ ﻥﻋ

Comme la plupart des paragangliomes sont multifocaux, leurs différents segments sont indépendants du point de vue hémodynamique. Cela signifie qu'ils reçoivent du

Nous concluons ce chapitre sur la remarque suivante au sujet d’une question ouverte : le Théorème 12 est plus général que le Théorème 13 dans la mesure où il fait intervenir