Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

signifie que la connexion inclut une authentification r´eussie avec un nom d’utilisateur et un mot de passe valides :

Dans le document Observation, caractérisation et modélisation de processus d'attaques sur Internet (Page 113-117)

dangereuse(e) =

(

vrai, si ∃t∈e/commande(t)

f aux, sinon ^(4.8)

sagace(e) =

(

vrai, si |e| ≥9∪ ∃t∈e/valide(t)

f aux, sinon ^(4.9)

Prenons le premier crit`ere. En l’appliquant sur l’ensemble des sessions, nous

iden-tifions deux classes : une premi`ere classe des sessions dangereuses de taille 210 et une

classe des sessions non dangereuses “a priori”, de taille 1730. Cette derni`ere classe

CHAPITRE 4. CARACT´ERISATION DES ATTAQUES OBSERV´EES SUR LE POT

DE MIEL HAUTE INTERACTION

constitue la principale activité observée sur le pot de miel. L’étude de la répartition

des sessions non dangereuses vis-à-vis du second critère, à savoir la sagacité, permet

d’identifier 1391 comportements non dangereux mais sagaces et 339 comportements

non dangereux et non sagaces. Chacune des 1391 sessions est constitu´ee de plusieurs

connexions très proches et correspondant à des couples différents. Certaines ont

per-mis de collecter des informations sur les couples accessibles depuis l’ext´erieur. Ces

sessions s’apparentent à des attaques par dictionnaire, précédant un processus

d’in-trusion. L’ensemble des attaques par dictionnaire Dico(T, s) est d´efini de la mani`ere

suivante :

Dico(T, s) = {e∈ S(T, s)/dangereuse(e)∧sagace(e)} (4.10)

Quant aux comportements dangereux, ils correspondent `a un attaquant qui est

en-tr´e au cœur du syst`eme pour y lancer des commandes. Ces comportements se nomment

intrusions. Le caract`ere sagace ne nous int´eresse pas pour raffiner cette classe.

Effec-tivement, ce n’est pas en comptant le nombre de connexions d’une session que nous

pourrons apprécier la dangerosité d’une attaque : une connexion réussie, avec une

exploitation d’une vulnérabilité offrant un accès administrateur à l’attaquant est plus

dangereuse que plusieurs connexions r´eussies, avec uniquement des tentatives de

ra-patriement de fichiers depuis Internet. L’ensemble des intrusions Intr(T, s) est d´efini

de la mani`ere suivante :

Intr(T, s) ={e∈ S(T, s)/dangereuse(e)} (4.11)

Fig. 4.12 – Classification des sessions

En utilisant deux critères (dangerosité et sagacité), nous avons identifié deux

classes de comportements principales. La figure 4.12 repr´esente le dendrogramme

as-socié à cette classification. Toutefois, comme toute méthode de classification, des faux

positifs et des faux n´egatifs peuvent perturber les analyses. Dans notre cas, un faux

négatif peut être un exemple de comportement ayant réalisé une attaque par

diction-naire mais ayant collecté peu d’informations. Le critère de sagacité va masquer cet

exemple de comportement. En soit, l’´etude d’un tel comportement ne nous int´eresse

pas : a l’issue de cette activit´e, la connaissance de l’attaquant sur le pot de miel n’a

pas évolué. Quant à un faux positif, il peut être un exemple de comportement lié à

une erreur d’un utilisateur non malveillant. En se trompant d’adresse de destination,

cet utilisateur peut s’obstiner `a ´etablir une communication. Son intention n’est pas

mauvaise, mais, du point de vue d’un administrateur r´eseau, ce comportement se mˆele

aux comportements agressifs qui doivent être analysés. Nous les assimilons donc à des

exemples de comportement malveillants.

Nous ne sommes pas int´eress´es par les attaques non dangereuses et non sagaces.

En revanche, nous nous focalisons sur les comportements dangereux, qui constituent

l’objectif de ce chapitre. De plus, nous analyserons aussi les comportements non

dan-gereux mais sagaces. Ils constituent les prémices d’un scénario d’attaque. Etant donné

que ces comportements sont longs en terme de dur´ee, leur ´etude permettrait de les

identifier au plus tˆot. De la sorte, nous pourrions les bloquer avant leur terme et avant

qu’ils n’acquièrent le caractère dangereux. Ces analyses sont réalisées dans la suite de

ce chapitre, `a commencer par les attaques par dictionnaire.

4.4 Le processus d’attaque

Nous venons d’identifier les diff´erents types d’attaques que nous avons observ´es sur

le pot de miel haute interaction. Chaque type d’attaque repose sur une connaissance

à priori du système ciblé par l’attaquant, et permet à cet attaquant de renforcer sa

connaissance sur ce syst`eme. Par exemple, avant de r´ealiser une attaque par

diction-naire, l’attaquant a eu connaissance, par un moyen ou par un autre, de le pr´esence

du service de connexion `a distance sur la machine qu’il cible. De plus, une attaque

par dictionnaire lui permet de connaˆıtre une partie de l’ensemble des couples (nom

d’utilisateur, mot de passe) valides et une partie de l’ensemble des couples non valides

sur ce système. Il est alors intéressant d’étudier la manière dont les différents types

d’attaques s’agencent pour produire des sc´enario complexes que nous appellerons

pro-cessus d’attaque, dans le but de mieux comprendre l’organisation des attaquants sur

Internet. Cette ´etude prend en compte l’aspect spacial (nous nous int´eressons aux

adresses IP ayant r´ealis´ees les attaques) et l’aspect temporel (les attaques sont

ordon-n´ees dans le temps).

Tout d’abord, nous avons constat´e qu’une attaque par dictionnaire ayant permi

de découvrir un couple valide précède systématiquement une intrusion réalisée avec

ce même couple. Une connaissance à priori du système ciblé est donc requise par

un attaquant pour r´ealiser une intrusion. Elle peut ˆetre fournie par une attaque par

dictionnaire. De plus, nous avons confronté l’ensemble des adresses ayant réalisé des

attaques par dictionnaire à l’ensemble des adresses ayant réalisé des intrusions.

L’in-tersection de ces deux ensembles est vide. Autrement dit, les adresses ayant r´ealis´e des

attaques par dictionnaire (resp. intrusions) sont sp´ecialis´ees dans ce type d’attaque.

C’est constatation est d’autant plus intéressante qu’elle est vérifiée sur une longue

p´eriode de temps (419 jours).

Ensuite, nous avons confronté les adresses ayant réalisées les attaques par

diction-naire ou les intrusions aux adresses observ´ees sur les pots de miel basse interaction,

en considérant l’intégralité de la période de collecte (4 ans de collecte). Aucune de ces

adresses n’a été observées sur les pots de miel basse interaction. Cette constatation

appuye donc la sp´ecialisation des adresses `a un type d’attaque. De plus, il est peu

probable qu’un attaquant ex´ecute une attaque par dictionnaire sur une machine cible

sans se douter à priori de la disponibilité du service de connexion à distance sur cette

CHAPITRE 4. CARACT´ERISATION DES ATTAQUES OBSERV´EES SUR LE POT

DE MIEL HAUTE INTERACTION

machine. Une ´etape de balyage des adresses sur Internet, `a la recherche des machine

proposant le service de connexion à distance, à donc été nécessaire avant toute attaque

par dictionnaire.

Nous venons de mettre en ´evidence un processus d’attaque constitu´e de trois

´etapes : 1) balayage des adresses d’Internet `a la recherche de machines proposant un

service de connexion `a distance, 2) attaque par dictionnaire `a la recherche de couples

valides et 3) intrusion. De plus, les attaquants ont organis´e l’espace d’adressage sur

Internet afin de sp´ecialiser l’utilisation de chaque adresse `a un type d’attaque. Cette

cohérence est préservée dans le temps. Ils transfèrent donc les connaissances acquises

lors de chacune des attaques par le biais de communications cach´ees, dans une base de

connaissance qu’ils partagent. La suite de ce chapitre étudie plus en détail les étapes

d’attaque par dictionnaire est d’intrusion.

4.5 Etude des attaques par dictionnaire

Cette section va nous permettre d’apporter des éléments de réponse aux questions

suivantes : les attaquants utilisent-ils tous des dictionnaires diff´erents ? travaillent-ils

en équipe pour découvrir des couples valides ? reviennent-ils après un échec ?

Il est ais´e de trouver, sur Internet, un outil d’attaque par dictionnaire et un

diction-naire de couples (nom d’utilisateur, mot de passe). Toutefois, fort de plusieurs ann´ees

d’expériences, des attaquants peuvent être amenés à rédiger leur propre dictionnaire

de couples. Pour réaliser cette rédaction, ils peuvent même s’appuyer sur les

diction-naires existants. Une fois ´etabli, il y a de fortes chances pour que ce dictionnaire soit

partag´e par les membres de la communaut´e qui en est l’auteur. Pouvoir obtenir des

informations sur les dictionnaires utilis´es par les attaquants peut enrichir nos

connais-sances sur leur comportement et sur leurs habitudes. Cette connaissance peut nous

permettre de r´eagir plus vite face `a ce type d’attaques. Nous devons donc analyser

les attaques par dictionnaire observ´ees. Pour ce faire, nous introduisons la notion

de vocabulaire. Le vocabulaire d’une attaque par dictionnaire observ´ee est l’ensemble

des couples (nom d’utilisateur, mot de passe) tentés. Quant à ces couples tentés, ils

peuvent ˆetre assimil´es aux mots du vocabulaire.

Dans cette section, nous exposons dans un premier temps un aper¸cu des attaques

par dictionnaire observ´ees en d´etaillant la notion de vocabulaire. Ensuite, nous

présen-tons une définition d’une distance entre deux vocabulaires. Puis, à partir de la

défini-tion précédente de distance, nous classons les attaques par dicdéfini-tionnaire en confrontant

deux à deux les vocabulaires. Pour finir, nous présentons les caractéristiques des

at-taques par dictionnaire observ´ees.

4.5.1 Pr´esentation des attaques par dictionnaire observ´ees

L’attaquant s’appuie sur un dictionnaire pour mener une attaque par dictionnaire.

Ce dictionnaire peut ˆetre plus ou moins volumineux. Par manque de temps, ou baisse

de motivation, l’attaquant peut interrompre l’attaque avant son terme. Dans ce cas,

la liste des couples tent´es ne correspond pas exactement au contenu du dictionnaire

de l’attaquant. N’ayant aucun moyen de savoir si l’attaquant a men´e son attaque

par dictionnaire `a son terme, nous supposerons que l’ensemble des couples tent´es

n’est qu’une partie du dictionnaire de l’attaquant. Deux attaques par dictionnaire

peuvent employer le même dictionnaire. Si ces deux attaques ont été interrompues

à des moments différents de leur progression, les deux ensembles de couples tentés

seront ressemblants mais différents. Nous nommons vocabulaire associé à une attaque

par dictionnaire l’ensemble des couples (nom d’utilisateur, mot de passe) tent´es lors

de cette attaque. Formellement, un vocabulaire V(e) associ´e `a une attaque par

dic-tionnaire e∈Dico(T, s) se d´efinit comme suit :

V(e) ={couple(t)/t∈e} (4.12)

Deux vocabulaires dont l’intersection est vide ont de fortes chances d’avoir ´et´e

géné-rés depuis des dictionnaires différents. De même, deux vocabulaires dont l’intersection

est importante ont de fortes chances d’avoir été générés depuis le même dictionnaire.

Pouvoir identifier les similitudes entre vocabulaires nous permet de mieux parer aux

attaques par dictionnaire, en les bloquant avant leur issue.

Dans le document Observation, caractérisation et modélisation de processus d'attaques sur Internet (Page 113-117)

Télécharger maintenant "Observation, caractéri..."

Outline

Documents relatifs