Les grandes familles de m´ ecanismes de contrˆ ole du flot d’information

La mise en œuvre des mécanismes de contrôles du flot d’information peut s’appuyer sur le contrôle d’accès. Par exemple, il se pourrait que certaines entrées du programme soient gardées dans des fichiers du système sur lesquels s’appliquent des contrôles d’accès. La mise en œuvre peut aussi s’appuyer sur des techniques autres que le contrôle d’accès, notamment en considérant les effets de chaque instruction du programme. Ce sont des techniques qui s’appuient sur des notions propres aux langages de programmation. En particulier, elles se servent de la sémantique et de l’analyse du programme pour spécifier et appliquer les politiques de sécurité pour la confidentialité ou pour l’intégrité des données. Nous faisons dans cette section, un survol de ces différents mécanismes.

Les mécanismes de contrôle de flot d’information par le langage peuvent partitionnés en deux groupes, les mécanismes basés sur une analyse statique du programme d’une part, et les mécanismes basés sur une approche dynamique de l’autre. Cependant, certains mécanismes dynamiques utilisent les résultats de l’analyse statique lors de l’examen du code. Ces derniers sont souvent appelés des mécanismes hybrides.

2.4.1 Contrˆole de flot d’information par l’analyse statique

Analyser statiquement un programme consiste à extraire des informations relatives à l’exé- cution du code sans l’exécuter effectivement. Les informations sont valables pour toutes les exécutions possibles. Une telle analyse permet d’établir un modèle du comportement du programme. Les informations peuvent être utilisées pour optimiser, mettre au point, comprendre, maintenir ou vérifier le code. Dans le cas du contrôle du flot d’information, les méthodes statiques analysent le programme avant son exécution, et déterminent si toutes les exécutions possibles sont sécuritaires. Denning et Denning furent les premiers à utiliser l’analyse statique pour s’attaquer au problème de sécurisation du flot d’information dans un programme [10]. Ils proposent de modéliser toute politique de flot d’information par un modèle en treillis. Cela consiste à attribuer dans un premier temps à chaque variable une étiquette qui correspond `

a son niveau de sécurité. Ensuite on munit l’ensemble des classes de sécurité obtenu d’une relation d’ordre partiel (v), qui en fait une structure de treillis de classes de sécurité. Enfin, en se servant des propriétés du treillis, on peut incorporer le processus de certification du programme dans la phase d’analyse du compilateur. Par exemple, chaque affectation est vérifiée pour la propriété suivante : la variable affectée doit être de haut niveau si la variable à droite de l’affectation est de haut niveau (détection des flots explicites) ou si l’affectation a lieu dans une instruction conditionnelle ou une boucle de haut niveau. Leur mécanisme garantit qu’au- cun traitement de bas niveau n’est effectué dans un contexte de haut niveau. À la suite de Denning et Denning, plusieurs autres travaux ont suivi dans le même sens. Ces mécanismes

ont l’avantage de ne pas augmenter la charge du programme à l’exécution. On sépare souvent les mécanismes statiques en deux groupes : les mécanismes basés sur le système de types d’une part et les mécanismes non basés sur le système de types d’autre part.

Analyse bas´ee sur un syst`eme de types

Volpano et al. [32] furent les premiers à utiliser un système de types pour analyser la sécurité du flot d’information. Leur modèle s’applique à un langage impératif simple. Plusieurs études ont suivi dans le même sens avec pour certaines une extension au niveau du langage et pour d’autres, une extension au niveau de la propriété de non-interférence. Certaines approches, notamment les plus anciennes comme celle de Volpano et al. [32] sont insensibles aux flots au sens de2.3.2. Plus récemment, Hunt et Sands ont proposé pour la première fois un système de types sensible aux flots. D’autres travaux ont suivi dans le même sens, parmi lesquels ceux de Desharnais et al. [12]. Nous reviendrons plus en détails sur ces deux dernières approches dans le prochain chapitre.

Dans l’analyse basée sur un système de types, la sémantique statique du programme est représentée par un ensemble de règles de déduction appelé système de types.

Les règles permettent de déduire le type d’une expression et se présentent sous la forme suivante :

P 1...P n

Q .

Une telle r`egle stipule que si P1, ..., Pnsont tous vrais, alors Q l’est aussi. Le num´erateur est

constitué de prémisses (Pi) alors que le dénominateur contient la conclusion Q. Une règle qui

ne possède pas de prémisses est un axiome. Un axiome Q est généralement représenté par :

Q ou tout simplement

Q . Le symbole signifie qu’il n’y a pas de pr´emisses.

Chaque pr´emisse ou conclusion peut utiliser un jugement de la forme :

Γ ` e : τ

– Γ est une mappe qui associe à chaque variable du programme un élément du treillis de sécurité L. Cette mappe sera souvent appelée environnement de définition des types ou tout simplement environnement de typage.

– e est une expression

– τ est un élément du treillis de sécurité L.

Ce jugement signifie que, sous un environnement de typage Γ, l’expression e est de type τ . Un environnement de définition des types pour les constantes sert souvent de point de départ pour l’application des règles d’inférence et un algorithme d’inférence de types sert à calculer les informations utiles.

Analyse statique non bas´ee sur un syst`eme de types

Comme le fait remarquer Le Guernic [18], toutes les techniques d’analyse statique de la sécurité du flot d’information ne sont pas basées sur un système de types. La technique utilisée par Denning [11] avant Volpano, est similaire au système de types, mais n’est pas définie comme telle. Denning décrit un système dans lequel les variables et les commandes ont un niveau de sécurité. Ces niveaux sont ordonnés et forment une structure de treillis. Denning définit un ensemble de règles qui font le lien entre les structures du programme et le niveau de sécurité approprié de l’entité du programme impliqué dans ces structures. Elle suggère deux pistes. La première consiste à attribuer le niveau de sécurité aux variables et instructions et utiliser les règles pour vérifier si les niveaux sont appropriés. La seconde consiste à assigner des niveaux de sécurité seulement aux variables d’entrée et utiliser les règles pour calculer le niveau de sécurité des autres entités du programme.

D’autres méthodes d’analyse non basées sur le système de types existent, parmi lesquelles l’analyse par interprétation abstraite et l’approche basée sur les contraintes.

Analyse par utilisation de l’interpr´etation abstraite

L’interprétation abstraite est une technique permettant de dériver une analyse statique, à partir d’une sémantique instrumentée du programme. L’idée de base de l’interprétation abstraite est l’approximation de la sémantique des programmes. Elle peut être définie comme une exécution partielle d’un programme pour obtenir des informations sur sa sémantique (par exemple, sa structure de contrôle, son flot de données) sans avoir à en faire le traitement complet. Pour sécuriser le flot d’information, l’instrumentation de la sémantique consiste habituellement à ajouter aux valeurs une étiquette qui doit refléter l’ensemble des entrées qui ont influencé la valeur étiquetée. Toutefois, comme le remarque Le Guernic [18], il reste que la cohérence de l’analyse réside dans la cohérence du choix de la sémantique instrumentée. Autrement dit, si le calcul des étiquettes de sécurité par la sémantique instrumentée n’est pas cohérent, il n’y aura aucune garantie de fiabilité pour l’analyse dérivée.

Analyse bas´ee sur les contraintes

Les méthodes d’analyse basée sur les contraintes sont aussi utilisées pour vérifier statiquement la sécurité du flot d’information. Ces mécanismes se déroulent généralement en deux étapes : – La première étape consiste à générer un ensemble de contraintes qui doivent être vérifiées pour un programme qui respecte la propriété de non-interférence. On peut aussi se limiter à la production d’une liste de contraintes qui doivent être respectées par une exécution sécuritaire du programme.

– La seconde étape consiste à résoudre le problème en utilisant par exemple un prouveur de théorèmes4 ou un vérificateur de modèle.5 On peut aussi le transformer en une instance d’un problème de satisfaction de contraintes6 et la soumettre à un solveur de contraintes.7

Habituellement, pour l’analyse de la sécurité du flot d’information, le problème de résolution de contraintes concerne l’affectation des étiquettes de sécurité aux variables, de sorte qu’à chaque étape de l’exécution, l’information circule vers des variables avec un niveau de sécurité plus élevé ou égal à celui de l’origine du flot. L’autre approche, qui n’utilise pas les étiquettes de sécurité, consiste à démontrer directement que pour deux exécutions quelconques, les valeurs des sorties publiques ne sont pas différentes si celles des entrées publiques sont identiques.

2.4.2 Contrˆole de flot d’information par analyse dynamique

Le contrôle du flot d’information peut se faire dynamiquement, c’est-à-dire pendant l’exécu- tion du programme. Par rapport à l’analyse statique, les méthodes dynamiques sont souvent plus précises. Par contre, ce sont des mécanismes qui peuvent ajouter une grande surcharge de travail à l’exécution du programme. Sécuriser le programme par analyse dynamique est une idée plutôt ancienne, qui remonte aux années 1970, au travail de Fenton [14] tout au moins, mais qui est toujours d’actualité. D’ailleurs, plusieurs travaux récents ont étudié la possibilité d’incorporer des mécanismes dynamiques de contrôle du flot d’information dans les

4. La démonstration de théorèmes est une approche de vérification des programmes, qui est de plus en plus automatisée et assistée par ordinateur. Elle consiste à énoncer des propositions et à les démontrer dans un système de déduction de la logique mathématique, en particulier dans le calcul des prédicats. L’objectif est de raisonner rigoureusement sur des programmes informatiques afin de démontrer leur validité par rapport à une certaine spécification. Le prouveur de théorème est l’outil informatique utilisé.

5. Un vérificateur de mod`ele, « model checker » en anglais, analyse exhaustivement l’´evolution du système lors de ses exécutions possibles. Par exemple, pour démontrer l’absence d’erreurs à l’exécution, on pourra tester l’absence d’états d’erreur dans l’ensemble des états accessibles du système. En général, il n’est pas possible d’analyser directement le système, mais on en analyse plutôt un modèle, plus ou moins abstrait par rapport à la réalité.

6. Les probl`emes de satisfaction de contraintes, ou CSP en anglais pour « Constraints Satisfaction Problems

», sont des probl`emes mathématiques où l’on cherche des états ou des objets satisfaisant un certain nombre de contraintes ou de critères.

7. En général, on sépare la modélisation d’un problème CSP de sa résolution. Le solveur de contraintes est l’outil informatique qui est utilisé dans la phase de résolution du problème.

navigateurs web avec le langage JavaScript [13]. On regroupe généralement les mécanismes dynamiques en trois groupes :

(a) Le monitorage, qui consiste à faire surveiller l’exécution du programme par un autre programme appelé moniteur.

(b) L’instrumentation, qui consiste `a transformer le programme, en y ajoutant des commandes pour contrˆoler le flot d’information.

Le monitorage de l’ex´ecution

Un moniteur est un programme qui observe, régule et contrôle ou vérifie les opérations d’un système de traitement des données. Dans le cadre de la sécurisation du flot d’information, le moniteur a pour objectif de contrôler l’exécution des autres programmes pour prévenir tout flot d’information illicite. Des caractéristiques précises des politiques de sécurité applicables par monitorage des programmes ont été étudiées dans la littérature. La non-interférence a ´

eté présentée comme un exemple de politique qui ne peut être appliquée avec précision par des mécanismes dynamiques. Cependant, des travaux comme celui de Russo et Sabelfeld [24] ont rigoureusement démontré qu’il est possible d’utiliser un moniteur pour appliquer une certaine politique de sécurité qui est une approximation de la non-interférence et qui garantit la non-interférence dans les programmes qu’ils acceptent.

Le monitorage d’un programme est potentiellement plus permissif qu’une simple vérification de type (analyse purement statique). En fait, le monitorage peut autoriser les exécutions sécuritaires même si le programme contient des fragments non sécuritaires, dans les branches non prises d’un bloc conditionnel par exemple. De plus, la détermination des instructions sécuritaires se fait sur la base des informations précises à l’exécution par opposition à des approximations de l’analyse statique. Mais, en général, le moniteur ne peut voir que la partie déjà exécutée de la trace d’exécution, à moins qu’il ne soit doté des moyens lui permettant d’utiliser d’autres informations provenant de l’analyse statique.

Des travaux récents sur le monitorage du flot d’information portent sur des langages interpré- tés comme JavaScript. Dans la pratique, le moniteur est souvent intégré à la machine virtuelle Java par une modification du code source de cette dernière. Cette possibilité est due au fait que cette machine virtuelle est impliquée dans tous les évènements du flot de contrôle et du flot des données à l’exécution des programmes. Nous appellerons dans la suite un tel moniteur « moniteur MV ». Un exemple de moniteur MV est celui de Russo et Sabelfeld [24] que nous décrivons plus en détail au chapitre suivant.

L’instrumentation du code

Chudnov et Naumann affirment [8] qu’un moniteur MV est peu pratique dans certains cas. L’une des raisons évoquées est l’utilisation de nouvelles techniques de compilation comme le JIT (Just In Time). Cette technique de plus en plus répandue associe la traduction en bytecode et la compilation dynamique. La machine virtuelle n’a plus tout le contrôle sur les petites étapes des flots de contrôle et de données, notamment pour la partie du code qui est déjà traduite en langage natif. L’autre solution, qui aura à quelque chose près le même résultat que le moniteur est la transformation du code source du programme, c’est-à-dire l’instrumentation. Dans le cas du contrôle du flot d’information, elle consiste à ajouter au programme des variables qui reflètent le niveau de sécurité de ses variables originales. Des tests sur ces nouvelles variables sont aussi insérés, dans le but d’appliquer dynamiquement la non-interférence. Il sera alors suffisant de montrer que chaque programme ainsi transformé est non interférent. Plusieurs études proposent de telles transformations pour un langage procédural simple et déterministe. Nous présentons en détail dans le prochain chapitre un de ces mécanismes assez récent, élaboré par Chudnov et Naumann [8], qui a la particularité d’être basé sur une analyse sensible aux flots telle que définie dans la section 2.3.2.

L’ex´ecution multiple

L’idée principale derrière l’approche par exécution multiple consiste à exécuter un programme `

a plusieurs reprises, une fois pour chaque niveau de sécurité, en utilisant des règles spéciales pour sécuriser le flot d’information au niveau des opérations d’entrée/sortie. Contrairement aux autres approches dynamiques et à l’analyse statique par typage, l’exécution multiple ne requiert pas que l’ensemble du code de l’application soit inspecté (seulement les instructions d’entrée/sortie). C’est une idée qui a été explorée plus récemment, à la fin des années 90. Des articles récents [4,13] proposent des techniques d’analyse basées sur cette approche. Les difficultés inhérentes à cette approche résident, d’une part dans le choix des valeurs d’entrées de haut niveau à tester et, d’autre part dans le partage de la charge de test à travers les différentes copies de l’exécution de la fonction avec des entrées différentes. De plus, si le programme fait des choix non déterministes, il devient particulièrement difficile d’analyser les valeurs obtenues pour les sorties de bas niveau. Dans ce cas, il faut généraliser ou adapter la technique pour en tenir compte.

Chapitre 3

Contrˆole du flot d’information par

analyse sensible aux flots

3.1 Introduction

Nous examinons dans ce chapitre quelques mécanismes de contrôle de flot d’information parmi les plus récents, tous basés sur une analyse sensible aux flots des données.

Pour bien comprendre la diff´erence entre une analyse sensible aux flots et une qui ne l’est pas, consid´erons le programme suivant :

secret := 0; if secret then public := 1

Une analyse insensible aux flots rejette ce programme parce qu’il a un sous-programme non sécurisé, en l’occurrence, l’affectation à une variable publique dans un bloc conditionnel avec une garde impliquant une variable secrète. D’un autre côté, le programme est accepté par une analyse sensible aux flots, parce que la variable secret en recevant par affectation la constante 0 se comporte dans la suite comme une variable publique. On note que les constantes sont considérées comme publiques puisqu’elles ne transmettent aucune information sur un autre objet [10]. La garde du bloc conditionnel étant devenue publique, la mise à jour de la variable public ne représente plus de danger. Comme nous allons le voir, les approches sensibles aux flots permettent d’accepter un plus grand nombre de programmes sécuritaires que celles qui ne le sont pas.

Dans tout ce chapitre, nous supposons que dans notre système, les secrets sont conservés dans les variables des programmes. Les niveaux de sécurité sont associés aux variables et décrivent la sécurité voulue pour leur contenu. La plus simple instance d’un tel problème implique deux niveaux de sécurité : H pour haut niveau de sécurité qui dénote la partie secrète de l’information et L pour bas niveau qui dénote la partie publique. Une relation d’ordre partiel

L v H indique que les seuls flots permis sont ceux de L vers H. Le problème de sécurité est de vérifier qu’il n’y a pas de dépendance entre la valeur initiale d’une variable de niveau H (contenant le secret dont le programme a accès) et la valeur finale d’une variable de niveau L (la sortie qui est visible par le public).

Dans la suite du chapitre, nous présentons dans la première partie deux mécanismes d’analyse statique basés sur le typage. Il s’agit du modèle de Hunt et Sands [16] complété par Russo et Sabelfeld [24] pour le premier, et du modèle de Desharnais et al. [12] pour le second. Dans la seconde partie, on examine deux mécanismes hybrides de contrôle dynamique de

Dans le document Contrôle du flot d'information par des techniques basées sur le langage de programmation (Page 35-42)