• Aucun résultat trouvé

MASSE: Modular Automated Syntactic Signature Extraction

N/A
N/A
Protected

Academic year: 2021

Partager "MASSE: Modular Automated Syntactic Signature Extraction"

Copied!
2
0
0

Texte intégral

(1)

HAL Id: hal-02159947

https://hal.inria.fr/hal-02159947

Submitted on 19 Jun 2019

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

MASSE: Modular Automated Syntactic Signature

Extraction

François Déchelle, Bruno Lebon, Olivier Zendra

To cite this version:

François Déchelle, Bruno Lebon, Olivier Zendra. MASSE: Modular Automated Syntactic Signature Extraction. RESSI 2019 - Rendez-vous de la Recherche et de l’Enseignement de la Sécurité des Systèmes d’Information, May 2019, Erquy, France. pp.1. �hal-02159947�

(2)

Nom du projet : Modular Automated Syntactic Signature Extraction Acronyme : MASSE

Porteur : Teclib, 390 rue Saint-Honoré – 75001 Paris (PME) Consortium : Teclib, Inria (équipe TAMIS, Rennes)

Instrument de financement : RAPID

Dates : du 1er septembre 2017 au 31 août 2019

Description du projet :

Le projet MASSE propose de développer une solution de production automatique de signatures YARA, utilisant les caractéristiques significatives du malware qui ont été utilisées pour sa

classification. Ce mécanisme de production de signatures permettra de fournir des signatures plus efficaces dans la caractérisation des familles de malwares.

Les techniques d’analyse de malwares employées viseront des malwares difficiles à détecter par leur usage de polymorphisme ou de métamorphisme et présenteront une difficulté pour la rétro-ingénierie afin de gêner les créateurs de malware pour l’application de contre-mesures à la détection.

La solution proposée par le projet MASSE a deux caractéristiques essentielles :

• un traitement automatique des échantillons de malware, ne nécessitant pas l’intervention humaine pour l’analyse des codes malveillants et la production de signatures

• une architecture centralisée disposant d’une grosse puissance de calcul afin de mettre en œuvre des techniques d’analyse avancées et coûteuses et de fournir une réponse immédiate à tous les postes clients

L’architecture de MASSE est constituée :

• d’agents, fonctionnant sur Windows ou Linux, qui mettent en œuvre la détection temps réel à partir d’une base de règles YARA, l’envoi de fichiers suspects au ‘cloud’ d’analyse et la mise à jour de la base de règles

• d’un ‘cloud’ d’analyse assurant la classification des fichiers envoyés par les agents et, dans le cas où un fichier est classé comme malware, la génération automatique de règles YARA pour la détection

L’architecture d’analyse et de génération est modulaire et permet d’inclure facilement de nouveaux algorithmes de classification et de génération de règles.

La piste envisagée pour la génération de règles est basée sur les n-grams : l’algorithme extrait les séquences d’octets les plus significatives pour la discrimination malware/goodware, puis optimise les séquences obtenues à l’aide d’algorithmes génétiques.

Une architecture virtualisée de test et d’intégration continue est en cours de finalisation, permettant de tester plusieurs algorithmes de génération et de comparer leurs performances.

Références

Documents relatifs

L’extraction automatique d’informations contenues dans les SMS est la dernière étape de notre recherche. Plus précisément, nous nous intéressons à la tâche

a) Architecture: The MASSE architecture is composed of a client side and a server side where the server executes the computationally-heavy malware analysis procedures in an

(parfois appelé "sur-entraînement" ou "sur-ajustement") est le fait de construire un modèle de prévision trop spécifique, qui correspond trop étroitement

The features (byte image or n-gram frequency) were used as inputs to the classifier and the output was a set of float values assigned to the nine class nodes.. The node with the

automatique par champ générique et genre discursif, nous devons identifier les propriétés adaptées pour décrire les genres discursifs du domaine journalistique,

Appelé à remplacer ext3 et ext4 dans un avenir de plus en plus proche, cumulant les fonctionnalités d'un système de fichiers moderne et la flexibilité d'un gestionnaire de

Initially we used our syntactic parser [1] which has given high results on opinion mining when applied to product reviews [2] or the Semeval 2014 Sentiment Analysis

Pour ce faire, nous proposons de construire des données d’usages en inférant des notes à partir de commentaires utilisateurs à l’aide de la classification d’opinion.. Ces