• Aucun résultat trouvé

Projet : Classification des objets connectés

N/A
N/A
Protected

Academic year: 2022

Partager "Projet : Classification des objets connectés"

Copied!
2
0
0

Texte intégral

(1)Projet : Classification des objets connectés Nesrine Ammar – nesrine.ammar@nokia-bell-labs.com. Projet : Pour ce projet, nous allons identifier les objets connectés en se basant sur une classification supervisée. Pour cela, nous utilisons des attributs extraits à partir du trafic des objets. Le premier ensemble des attributs est des caractéristiques des flux réseaux tel que taille de paquet… le deuxième ensemble est des attributs textuels représentés par une matrice binaire. Les données contiennent 33 classes d’objets. Vous aurez besoin de la colonne ‘label’ dans la partie 2. Partie 1: Un module sous le nom de ​‘training_flows.py’ pour cette partie. Vous devez utiliser l’algorithme Arbre de décision pour construire un modèle de classification des objets sur le premier ensemble des attributs utilisant 70% des données pour l’apprentissage. Ensuite, vérifier si le modèle sur-apprend ou sous-apprend en utilisant la métrique ‘score de classification’: ​accuracy_score​(​y_true​, ​y_pred) ​de sklearn.metrics. Évaluer le modèle utilisant les métriques de performance: précision, rappel et la matrice de confusion sur les données d’apprentissage ainsi que les données de test. Reconstruisez le modèle en fixant la profondeur de l’arbre pour profondeur maximal d’un arbre = 2, =3 et =4 et affichez à chaque fois le score de classification sur les données de test. Entraînez un modèle entraîné que sur les attributs: taille moyenne des paquets, min, max et le temps inter-arrivé entre les paquets, puis retournez le score de classification sur les données de test. Entraînez un modèle que sur les flux DHCP des données d’apprentissage, puis retournez le score de classification sur les données de test. Est-ce que les flux DHCP sont suffisants pour avoir une bonne performance? Partie 2: Un module sous le nom de ​‘training_flows_text.py’ est demandé. Pour cette partie du projet, ​vous devez combiner les attributs numériques et les attributs textuels pour vérifier si la performance du modèle obtenu s’améliore. ​Pareil que la premièr partie: vous devez utiliser l’algorithme Arbre de décision pour construire un modèle de classification des objets sur l’ensemble des attributs textuels utilisant 70% des données.

(2) pour l’apprentissage. Ensuite, vérifier si le modèle sur-apprend ou sous-apprend en utilisant la métrique ​‘score de classification’: ​accuracy_score​(​y_true​, ​y_pred) ​de sklearn.metrics. Évaluer le modèle utilisant les métriques de performance: précision, rappel et la matrice de confusion sur les données d’apprentissage ainsi que les données de test. Comparer les valeurs de précision et rappel des modèles obtenus sur les attributs numériques des flux et sur les attributs combinés..

(3)

Références

Documents relatifs

1- Un module mDNS responsable d’analyser les records mDNS afin d’extraire toutes information utile pour le fingerprinting d’un objet connecté utilisant le protocole Bonjour tel

- Évaluer le meilleur modèle utilisant les métriques de performance : précision, rappel et la matrice de confusion sur les données d’apprentissage ainsi que les

L’Institut Montaigne s’assure de la validité scientifique et de la qualité éditoriale des travaux qu’il publie, mais les opinions et les jugements qui y sont formulés sont

Les données semi-structurées peuvent être représentées par des objets semi-structurés et en- suite interprétées par rapport à leur classe polythétique de référence

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Au processus de construction des classes peut être couplée une fonction d’interprétation qui donne la sémantique attachée à une classe (qui peut être l’ensemble des objets

Dans ce qui suit, ces deux aspects de la classication sont abordés, que ce soit pour concevoir des hiérarchies de classes (dans le cas d'un langage à objets ou d'un système de rcpo

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des