Fiche Stage
CRD/Laboratoire/URD MAPS/NSS/STT
Intitulé du Stage (1-2 lignes)
Analyse du trafic DNS et lutte anti phishing Mission: (5-6 lignes)
DNS est le protocole qui permet de connaître l'adresse IP correspondant à un nom de domaine. Ainsi on tape dans son navigateur www.google.com, le
navigateur émet une requête DNS et obtient l'adresse IP du serveur web de google.
L'objectif de ce stage est de mener une analyse poussée du trafic DNS. On tentera de caractériser ce trafic afin de permettre de déterminer l'évolution a prévoir du trafic sur la plateforme. On s'intéressera également au trafic émis par les client de manière individuel et déterminer certains profiles.
On mènera cette analyse d'un point de vue statistique, ainsi qu'avec des mécanismes de clusterisation.
On étudiera également le trafic dit de pollution , qui est le trafic
« illegitime ». On pourra ainsi proposer des mécanismes permettant d'éviter aux serveurs DNS de le traiter. En fonction de sa nature, on pourra également proposer des mécanismes de redirection. On étudiera également le trafic du au attaques DNS, il s'agit ici de déterminer « a posteriori » le trafic qui s'apparente à celui d'une attaque. Et de définir des mécanismes ou des critères qui permettront à des mécanismes d'auto apprentissage à déterminer une attaques. Enfin pour chaque nom de domaine on déterminera des critères qui permettront de définir par des paramètres liés au nom de domaine (i.e. La question), à sa réponse, et enfin à sa place au sein du trafic afin de
définir des paramètres permettant aux ISP de définir si un nom de domaine est un site de phishing ou non.
Ces paramètres seront analysés et confrontés au différents algorithmes d’apprentissage supervisé ( sélective naive bayes, naïve bayes,
univariate…).
Profil: (3-4 lignes)
Ce stage est avant tout un stage d'analyse statistique, méthode de clusterisation...
Il nécessite d'être relativement à l'aise en programmation afin que le maximum de temps puisse être réservé à l'analyse. Au vue des données importantes à calculer et des librairies dont on dispose, le langage de programmation sera le C++. Certains scripts pourront être fait en Python.
Le partie sur le phishing sera également une composante d'analyse avec une forte composante théorique. Il s'agit d'un stage plutôt recherche... mais faisable et des résultats concrets sont attendus!
Modalités (durée, période, localisation)
5/6 mois à Issy-les Moulineaux France Telecom R&D
Contacts (ces coordonnées ne seront pas visibles sur l'appli, mais à indiquer pour le suivi et l'envoi des candidatures):
Nom- prénom-fonction- tél - e-mail
Daniel Migault / Ingénieur Recherche / daniel.migault@orange-ftgroup.com