Equivalence de gadgets - M´ etriques de protection

2.3 M´ etriques de protection

2.3.3 Equivalence de gadgets

La classification syntaxique des gadgets a quelques limitations sur le dénombrement de gadgets uniques présents dans un binaire. Considérons les deux gadgets suivants : pop %rbx; add %rax,0; retet add %rax,0; pop %rbx; ret. Ils sont syntaxiquement différents et donc classés comme tels dans notre analyse précédente. Ils font cependant la même opération, dans un ordre différent. Les ins-tructions add et pop sont ici commutables, car elles utilisent des registres différents. Cette section présente une forme normale de gadget permettant d’identifier ces deux gadgets comme équivalents.

Deux instructions sont commutables si la première n’écrit pas dans les registres lus par la seconde et si la seconde n’écrit pas dans les registres lus par la première. Définition. Soit deux instructions i et i⁰.

i ↔ i⁰ ssi w(i) ∩ r(i⁰) = ∅ ∧ w(i⁰) ∩ r(i) = ∅ ∧ w(i⁰) ∩ w(i) = ∅

o`u w(i) (resp. i⁰) est l’ensemble des registres potentiellement ´ecrits par i (resp. i⁰) et r(i) (resp. i⁰) l’ensemble des registres potentiellement lus par i (resp. i⁰)

Les registres implicites sont aussi considérés. Par exemple l’instruction pop %rbx modifie le registre %rsp, puisqu’il est décrémenté de 8. L’instruction add %rax,0 va potentiellement toucher les fanions du registre EFLAGS. Ce registre est donc toujours considéré comme modifié par cette instruction. Enfin les ins-tructions critiques qui changent le flot d’exécution ou le contexte d’exécution sont

2.3. M ´ETRIQUES DE PROTECTION 65

toujours définies comme non commutables. Par exemple les instructions syscall, break ou encore sysexit sont présentes dans cette catégorie. Pour déterminer les w et r de toutes les instructions de la famille x86, je me suis basé sur la référence des instructions disponible ici3. L’intégralité des registres touchés, accès mémoires et autres particularités des instructions de l’architecture y est détaillé.

L’assembleur utilisé dans le document est celui d’Intel contrairement à celui qui est utilisé par ROPgadget. Une traduction de certaines instructions de l’assembleur GNU (GAS) vers l’assembleur Intel a été réalisée. Par exemple l’instruction RET

utilisée par ROPgadget n’est pas présente dans le document à disposition, qui utilise RETN. La correspondance étant directe avec le document, quelques instructions ont nécessité ces traductions supplémentaires. Le tableau 2.4 liste toutes les traductions que j’ai opérées. Certaines traductions avec changement d’opérandes entre les formalismes, par exemple implicite dans l’assembleur Intel et explicite pour GAS, ne sont pas précisées dans le tableau.

Ensuite une relation d’ordre entre les instructions a été définie. Cette relation va permettre de mettre en place une forme minimale d’un gadget en triant les instructions commutables du corps du gadget. Cette relation d’infériorité d’une instruction sur une autre est applicable sur deux instructions commutables. Soit deux instructions a et b telles que a ↔ b. On définit la relation d’ordre entre a et b en algorithme 1.

On d´efinit la commutation adjacente de deux gadgets comme suit :

D´efinition. X = (x₁, ..., x_n) ≡ Y = (y₁, ..., y_n) ssi ∃i < n, x_i = y_i+1, x_i+1 = yi, xi ↔ xi+1, ∀j < n, j 6= i et j 6= i + 1 ⇒ xj = yj

Cette définition n’est cependant pas transitive. Elle n’est donc pas suffisante pour lier des gadgets entre eux. Elle permet quand même d’avoir une première classe de similitude pour des gadgets. Cette première relation est utilisée pour mettre en place une relation d’équivalence ensuite.

Pour mettre en place cette relation d’équivalence transitive, on effectue une complétion transitive de l’équivalence précédemment définie. Pour cela, j’ai com-mencé par mettre en place une relation d’ordre sur l’ensemble des formes que peut prendre un gadget.

Définition. L’ordre de deux gadgets X et Y est donné par l’ordre de leur première instruction distincte.

if b fait au moins un acc`es m´emoire et pas a then a ≺ b

else if (a et b) ou (ni a ni b) n’ont d’acc`es m´emoire then if b modifie au moins un registre et pas a then

a ≺ b else

Soit no a et no

b le nombre d’op´erandes de a et b; if no

a< no b then a ≺ b

else

L’ordre de a et b est l’ordre lexicographique de leur premier op´erande respectif distinct;

end end else

b ≺ a end

Algorithme 1 : Ordre entre deux instructions commutables a et b

L’ensemble des permutations que l’on peut atteindre en partant de X, en ne faisant que des permutations légales, peut être ordonné avec la relation d’ordre précédemment définie. La procédure de réduction d’un gadget est comme suit :

X = (x1, ..., xn);

while ∃i < n tel que x_i ↔ x_i+1 et x_i+1< x_i do X = (x₁, ..., x_i+1, x_i, ..., x_n);

end

Algorithme 2 : R´eduction en forme minimale

La forme de X obtenue à la fin de l’exécution de l’algorithme est appelée forme minimale de X. En se basant sur cette réduction, on peut définir une relation d’équivalence généralisée de la manière suivante.

Définition. Deux gadgets sont dits équivalents si et seulement si ils ont la même forme minimale.

Cette nouvelle définition a l’avantage d’être transitive et permet de faire plus facilement des distinctions entre différents gadgets.

2.3. M ´ETRIQUES DE PROTECTION 67 Ensemble des gadgets possibles e1 e2 e3 e4 _e5 e6 e7 < > > < ^< Transformation par commutation >

Figure 2.8 – Compl´etion transitive de la relation d’ordre des gadgets

Cette réduction et équivalence est illustrée en figure 2.8. Cette figure présente l’ensemble des permutations d’un gadget qui peuvent exister. Sur cette figure on peut voir la réduction du gadget e3 vers e7 en passant successivement par les gadgets e1 et e2. Le gadget e4 se réduit aussi en e7 en passant par le gadget e2. Les gadgets e1, e2, e3, e4 et e7 ont donc la même forme minimale e7. Ils sont donc équivalents. Les gadgets e5 et e6 sont composés des mêmes instructions, mais ils n’existent pas de commutations possibles pour réduire e6 vers un des autres gadgets. e5 et e6 ne sont donc pas équivalents aux autres gadgets écrits avec les mêmes instructions.

R´ealisation

J’ai donc utilisé cette relation d’équivalence pour étudier de manière plus précise l’unicité des gadgets présents dans des binaires. Les résultats précédemment peuvent donc être consolidés en ne travaillant plus sur l’unicité syntaxique des gadgets, mais sur les gadgets équivalents.

résultats présentés dans la section suivante ne concernent donc que ces architectures. La méthodologie utilisée ici n’est pas incompatible avec d’autres architectures. Il faut cependant classifier les instructions de toutes ces architectures ou utiliser un formalisme d’instruction indépendant de l’architecture. Les résultats sur l’architec-ture x86, qui représente environ 85 % du corpus, n’ont pas pu justifier le travail à fournir pour faire cette adaptation.

Dans le document Sensibilité de logiciels au détournement de flot de contrôle (Page 71-75)