• Aucun résultat trouvé

CHAPITRE 1. LES ENJEUX D’UN SYSTEME DISTRIBUE DE GESTION DE BASES

1.3. A PPLICATION DES GRILLES POUR LA SANTE

1.3.2. Les grilles informatiques

Avant-propos

Le terme « grille » a souvent été critiqué comme une traduction littérale du mot « grid » anglophone. On reproche souvent au mot français un manque de profondeur dans sa signification, le terme désignant plus directement une séparation, une barrière ou alors une grille de mots croisés, de sudoku ou de barbecue. Le terme « grid » quant à lui désigne également le réseau de distribution électrique national britannique mais aussi une interconnexion de lignes dans un schéma, en électronique ou encore sur une carte. Ainsi, le terme « computing grid » prend une autre dimension en anglais qu’une « grille informatique ». Néanmoins, le terme français, même sujet à controverse semble être maintenant accepté comme tel, mais toujours accompagné de son qualificatif « informatique » ou, « de calcul ».

1.3. Application des grilles pour la santé 35

1.3.2.1. Historique

Les grilles informatiques ont émergé avec la généralisation des réseaux haut-débit au début des années 2000 pour partager un ensemble de ressources informatiques. Cependant des bases ont été posées dès les années 1960 par F.Corbato [33] à une époque où les ordinateurs avaient un coût prohibitif, d’où le besoin de partage :

« The time-sharing computer system can unique a group of investigators... one can conceive of such a facility as an... intellectual public utility. » ou encore L.Kleinrock, à propos des réseaux, lors de la création d’ARPANET en 1969 [34]:

« We will perhaps see the spread of ’computer utilities’, which, like present electric and telephone utilities, will service individual homes and offices across the country. » Ces informaticiens avaient prédit, avant même l’existence des ordinateurs personnels ou des réseaux, l’évolution de l’informatique comme un service global au bénéfice de la société. Par la suite, les réseaux et l’informatique personnelle sont nés, les besoins ont évolué et l’avènement d’Internet a changé la donne. En effet, à la fin du XXème siècle, le constat était simple : d’après les lois de Moore, Gilder et Metcalfe [Figure 7], l’évolution des capacités de calcul vis à vis de l’évolution de celle des réseaux et des capacités de stockage amènerait inévitablement à une décentralisation de l’informatique. En effet, là où Moore, en 1965 [35] affirmait (bien que de façon empirique) que la puissance des microprocesseurs (en terme de nombre de transistors) doublerait tous les 18 mois, Gilder en 1990, quant à lui annonce que les capacités de stockage tripleraient tous les ans tandis que Metcalfe en 1985 a montré que les capacités des réseaux évolueraient de façon proportionnelle à la racine du nombre de nœuds de ce réseau. Lorsque l’on mesure l’expansion que connait Internet à l’heure actuelle cette définition prend toute sa dimension.

Cependant, de récentes études [36] ont montré qu’a causes de limites physiques de miniaturisation des processeurs, ces lois n’auraient plus cours dans quelques années.

36 Chapitre 1 : Les enjeux d’un système distribué de gestion de bases de données pour la santé L’idée principale d’une grille est d’utiliser un ensemble de ressources informatiques géographiquement dispersées et homogènes à des fins de mutualisation de ces ressources. La définition du grid computing proposée par I.Foster en 1999 [37], considéré comme l’un des principaux acteurs du domaine est :

« Grid computing is the combination of computer resources from multiple administrative domains for a common goal. » Bien que cette définition ait longtemps été sujette à controverse [38], I.Foster proposa de nouveaux concepts en 2002 [39, 40].

1.3.2.2. But des grilles informatiques

En d’autres termes, il s’agit de regrouper au moyen d’une couche logicielle commune, un ensemble de machines reliées entre elles par internet. La principale dichotomie avec le « power grid » anglo-saxon, où l’offre d’électricité est mutualisée sur tout un territoire dans une relation stricte producteur-consommateur; ici, les clients doivent le plus souvent participer (mettre à disposition des ressources) pour pouvoir accéder à celles des autres dans un esprit collaboratif.

Cette principale contrainte est primordiale pour la pérennité d’un tel outil. En effet, si la participation des utilisateurs d'une grille est fortement déséquilibrée, des conflits peuvent alors remettre en question son intégrité. Pour cela, tout un ensemble de règles d’utilisation, de partage ou même de priorité doivent être définies pour maintenir harmonie et équilibre. Ces notions seront développées plus tard dans ce document.

1.3.2.3. Premières implémentations : le CERN

Dès 2001, le Conseil Européen pour la Recherche Nucléaire1 [41], a eu besoin, lors du lancement du projet LHC (Large Hadron Collider) [42], de trouver un moyen d’exploiter les données qui seront produites par cet accélérateur. En effet, les prévisions du CERN tablaient sur une production de données estimées à 15 Pétabytes par an. Devant le coût pharaonique d’une infrastructure centralisée capable de stocker puis de traiter cette masse de données, le projet LCG2 [43] a été lancé par le CERN. Partant de l’expérimentation du projet EDG (Datagrid) [44, 45], véritable laboratoire de test d’implémentation de l’infrastructure de grille, LCG a su créer, via les successifs projets EGEE [46] puis EGI [47], un système distribué de gestion de ces données. Le lancement du LHC, dont les premières collisions ont été effectuées le 9 novembre 2009, renforce l’importance de l’infrastructure de grille.

Le rôle du CERN dans le développement des grilles et des intergiciels a été fondamental pour l’avènement de la technologie.

1.3.2.4. Architecture d’une grille informatique

La [Figure 8] représente de façon stratifiée une architecture classique de grille informatique. On peut distinguer quatre couches principales, premièrement le réseau, qui assure les interconnexions des différents nœuds de grilles, représentés sur la deuxième couche. On peut considérer plusieurs

1 Conseil a été rebaptisé Organisation depuis mais l’acronyme est resté

2

1.3. Application des grilles pour la santé 37 types de ressources, de type ‘computing’, de stockage ou de capteurs. L’exploitation sous forme applicative de ces ressources par l’utilisateur, en quatrième couche, est gérée par une troisième couche, nommée middleware(intergiciel), qui a pour mission de fournir l’ensemble des outils nécessaires à l’utilisateur pour exploiter les ressources en assurant aussi la sécurité.

Figure 8 - Architecture d'une grille