• Aucun résultat trouvé

Figure 5.14 – Capture des deux principales vues de GT-FCLMin Visualisation du réseau en (a) mode graphique et (b) mode textuel

et intègre la recherche des MFCLs basée sur la fréquence des itemsets [Stattner 2012h]. Il permet également à l’utilisateur de choisir entre plusieurs mesures d’intérêt et introduit un système de requête qui permet à l’utilisateur de rechercher les motifs liés uniquement à un groupe particulier de noeuds.

L’outil a été développé en JAVA et son interface graphique se compose de trois panneaux principaux comme le montre la Figure5.14.

1. Le panneau de configuration, situé à gauche, permet à l’utilisateur d’effectuer les opérations de calibrage telles que le chargement du réseau (noeuds, liens et attributs), le réglage des différents paramètres ou le choix des éventuelles mesures d’intérêt à ap-pliquer. Plus précisément, le réseau est chargé soit par la lecture d’un fichier au format UCINET [Borgatti 2002b] ou par le biais d’un simple fichier texte décrivant les liens du réseau sous la forme suivante :

<noeud 1 > <noeud 2 > <valeur>

Chaque ligne du fichier représente ainsi un lien entre deux noeuds. De la même façon, les attributs peuvent être lus à partir d’un fichier texte ayant la forme suivante :

<noeud 1 > <attribut 1 > <attribut 2 > ... <attribut n>

Un filtre peut également être appliqué aux attributs, pour ne conserver qu’un certain nombre d’entre eux lors de l’analyse.

Une fois le réseau chargé, les paramètres liés à l’extraction des liens conceptuels peuvent être fixés : seuil de support minimum β et mesure d’intérêt à appliquer. L’outil permet également de rechercher des liens conceptuels fréquents entre des groupes eux-mêmes fréquents. Il est ainsi possible de réduire l’espace de recherche en fixant un seuil α définissant la taille minimale des groupes à considérer [Stattner 2012h].

Enfin, il peut être intéressant de rechercher les liens conceptuels liés uniquement à un groupe de noeuds. L’outil fournit ainsi un espace de requête permettant à l’utilisateur de saisir les groupes à cibler sous la forme d’un itemset. Typiquement, pour extraire tous les liens conceptuels impliquant les hommes de 40 ans, la requête peut être la suivante "(40; 1; ∗; ∗; ∗; ∗)", si le réseau est le même que celui utilisé dans nos expériences.

Une fois les opérations de calibrage effectuées, c’est ce panneau qui permet de lancer le processus d’extraction.

2. Le panneau de visualisation placé au centre, permet à l’utilisateur de visualiser et d’interagir avec l’application. Deux vues du réseau sont proposées : (i) Un mode graphique (voir Figure5.14(a)), qui permet de visualiser le réseau en 2D. Les noeuds affichés peuvent être déplacés à l’aide de la souris. (ii) Un mode textuel (voir Figure5.14(b)) qui fournit une description plus détaillée du réseau : noeuds et propriétés, description des liens et diverses informations sur les caractéristiques du réseau (nombre de noeuds, de liens, degré min., degré moyen, degré max., coefficient de clustering, distribution du degré, etc.)

Le changement de vue s’effectue grâce aux onglets situés au-dessus du panneau.

3. Le panneau de résultats, situé à droite de la fenêtre, permet d’obtenir le résul-tat du processus d’extraction : liens conceptuels fréquents et support. Des informations résumant ce processus, telles que le nombre de liens conceptuels extraits et le temps d’exé-cution sont également fournis. En utilisant les options offertes par la barre de menu, ces informations peuvent ensuite être sauvegardées, ou utilisées pour générer et visualiser la vue conceptuelle. La vue conceptuelle peut, elle-même, être ensuite sauvegardée au format UCINET de façon à être manipulée par d’autres logiciels d’analyse de réseaux tels que UCINET [Borgatti 2002b], NetDraw [Borgatti 2002a] ou Gephi [Bastian 2009].

À terme, nous voulons intégrer à GT-FCLMin à la fois les méthodes d’analyse issues de l’analyse conceptuelle des réseaux sociaux [Riadh 2009,Le Grand 2009], mais également les méthodes issues de la fouille de liens [Fortunato 2009], l’objectif étant de mener l’analyse conceptuelle de pair avec l’analyse classique. Il serait par exemple intéressant d’appliquer

5.7. Conclusion 135

certaines techniques de fouille des réseaux sociaux, telles que la détection de communautés ou la prédiction de liens, aux vues conceptuelles.

D’un point de vue pratique, notre outil pourrait trouver des applications intéressantes dans divers domaines. Dans le domaine du marketing par exemple, appliquer GT-FCLMin à un réseau d’achats, dans lequel les individus sont connectés aux produits qu’ils achètent, pourrait permettre d’identifier les motifs types d’utilisateur/produits les plus fréquemment connectés.

5.7 Conclusion

Les techniques de data mining standard ont naturellement été appliquées et adaptées aux données sociales pour classifier, rechercher des motifs fréquents ou encore prédire l’ap-parition de liens. Pourtant, si des efforts ont été faits dans l’adaptation des méthodes exis-tantes, nous constatons que la plupart de ces travaux exploitent uniquement la structure du réseau et ne permettent pas de répondre à certaines questions impliquant les propriétés des noeuds et portant sur les corrélations entre ces propriétés et l’appartenance d’un noeud à une communauté.

Dans ce chapitre, nous avons abordé la question de l’extraction de motifs fréquents en tenant compte à la fois des informations sur la structure du réseau et des informations disponibles sur les noeuds. Les contributions de ce chapitre peuvent être résumées comme suit :

(i) En étendant les notions issues de l’analyse de concepts formels, nous avons proposé une définition d’un motif, que nous appelons "lien conceptuel", qui combine ces deux types d’informations : structure du réseau et propriétés des noeuds. Nous avons montré que notre approche présente un intérêt à deux niveaux. D’une part, les motifs que nous proposons permettent d’obtenir une connaissance pertinente sur les connexions entre les groupes de noeuds (et donc les caractéristiques) les plus connectés du réseau. D’autre part, nous avons montré que la connaissance acquise peut être synthétisée à travers des "vues conceptuelles", des structures de graphe qui synthétisent la sémantique du réseau initial.

(ii) Nous avons proposé l’algorithme MFCL-Min pour l’extraction des liens concep-tuels fréquents maximaux à partir de tout type de réseau social. L’algorithme effectue une recherche ascendante des motifs dans le treillis de concepts sociaux formés par les liens conceptuels, tout en réduisant progressivement l’espace de recherche. Les résultats expéri-mentaux obtenus à partir d’un réseau de contacts basé sur la fréquentation de lieux com-muns, ont permis d’observer d’une part la pertinence des motifs extraits et d’autre part les bonnes performances de l’algorithme comparé à une approche naïve.

(iii) Enfin, nous avons développé l’outil graphique GT-FCLMin qui implémente notre l’algorithme d’extraction MFCL-Min et fournit un environnement simple et ergono-mique pour la recherche de liens conceptuels fréquents et la génération de vues conceptuelles. Cet outil peut être utilisé sur tout type de réseaux sociaux et intègre un ensemble de mesures d’intérêt pour évaluer la pertinence de la connaissance extraite.

Le travail présenté dans ce chapitre constitue une première étape dans l’exploitation des attributs des noeuds pour la recherche de motifs fréquents. D’une façon plus générale, nous pensons que la structure du réseau et les attributs des noeuds sont deux informations qui doivent systématique être prises en compte pour tirer pleinement parti de toutes les informations disponibles sur le réseau. En ce qui concerne notre approche, nous pouvons par exemple citer deux applications intéressantes.

Exemple 1. (Conception de stratégie marketing) Supposons que des données transac-tionnelles soient utilisées pour générer un réseau impliquant des utilisateurs et les produits

qu’ils achètent. La recherche de liens conceptuels dans un tel réseau peut s’avérer utile, car ils fournissent des informations pertinentes sur les liens fréquents entre les utilisateurs et les produits achetés, une connaissance qui peut ensuite être utilisée pour des campagnes de promotion ciblées.

Exemple 2. (Aménagement du territoire) Supposons qu’en utilisant les dispositifs de géo-localisation un réseau biparti entre les individus et les lieux qu’ils fréquentent soit construit. Les motifs extraits par notre approche pourraient fournir des informations précieuses pour un aménagement efficace du territoire tenant compte des visiteurs potentiels.

Chapitre 6

Réseaux de capteurs sans fil pour

la collecte d’interactions sociales

Sommaire

6.1 Collecte d’interactions sociales en milieu sauvage : un état

de l’art . . . 140

6.1.1 Méthode manuelle d’observation . . . 141

6.1.2 Dispositifs mobiles . . . 141 6.1.3 Capteurs fixes. . . 142 6.1.4 Bilan. . . 142 6.2 Stratégie de collecte . . . 143 6.2.1 Question initiale . . . 143 6.2.2 Architecture de collecte . . . 144

6.2.3 Identification des individus . . . 147

6.3 Réseau social . . . 150 6.3.1 Organisation et construction . . . 151 6.3.2 Visualisation . . . 153 6.4 Expérimentations . . . 155 6.4.1 Simulateur Lypus . . . 155 6.4.2 Environnement de test . . . 158 6.4.3 Résultats expérimentaux. . . 161 6.5 Conclusion . . . 164

Une problématique majeure des travaux menés sur les réseaux concerne la collecte des données représentant les interactions réelles. Du fait de la complexité de la tâche de collecte, de nombreux travaux se sont restreints à des jeux de données synthétiques. Dans les études décrites aux chapitres précédents par exemple, nous avons utilisé des jeux de données issus de modèles de génération, ou d’outils de simulation.

Dans le Chapitre2, nous avons évoqué les perspectives nouvelles apportées par des dispo-sitifs mobiles tels que les périphériques GPS, les téléphones mobiles ou les puces RFID, qui permettent le suivi en temps réel d’entités en mouvement et la collecte de données sociales autres que celles traditionnellement extraites à partir de sites d’échange et de partage.

Cependant, bien que les dispositifs mobiles présentent un grand nombre d’avantages dans la collecte d’interactions sociales, on observe que la mise en oeuvre de ce type de solutions soulève de nouvelles questions. C’est par exemple le cas de la collecte de données dans la nature, quand la végétation dense entrave le bon fonctionnement de ces dispositifs et impose des contraintes techniques et matérielles supplémentaires.

MODELISATION Collecte Données réelles A priori Simulation Données simulées A posteriori Source Source Confrontation Exploitation

Documents relatifs