• Aucun résultat trouvé

Figure 6.18 – Erreur sur la détection des communautés

ca ti o n Temps (min) Config. 1 Config. 2 Config. 3 Config. 4

Figure 6.18 – Erreur sur la détection des communautés

Globalement, nous pouvons observer que quelle que soit la configuration, l’erreur est en général décroissante. Par exemple, pour la configuration 1, l’erreur est de 9.4 à la 5e minute contre 5.8 à la 10e minute et 0 à la 45e minute. Ce résultat suggère (1) que l’accumulation des données tend à améliorer les performances de la solution et (2) qu’il existe un temps d’accumulation nécessaire pour extraire les communautés.

Une observation intéressante concerne le temps à partir duquel les différentes configura-tions fournissent des réseaux capables d’extraire efficacement les familles d’individus. Nous pouvons en effet observer que plus la zone est couverte par des capteurs et plus le temps d’accumulation nécessaire est faible. Par exemple, dès la 15e minute, le réseau obtenu par la configuration 4 permet d’extraire les communautés d’oiseaux sans erreur. En revanche, il faut respectivement attendre la 20e, la 30e et la 45e minute pour extraire les communautés sans erreur des réseaux obtenus par les configurations 3, 2 et 1. Plus généralement, ces résultats confirment d’une part l’efficacité de l’approche dans le processus d’extraction des communautés et montrent d’autre part que le temps nécessaire à une collecte efficace des données diminue lorsque la zone est densément couverte.

Enfin, pour les configurations 2 et 3, on observe que l’erreur connaît une phase de crois-sance à partir d’un certain temps : la 40e minute pour la configuration 3 et la 45e pour la configuration 2. Cela peut s’expliquer par les phénomènes de chevauchement des rayons de détection, très présents sur ces deux types de configuration. En effet, plus le temps de collecte est élevé et plus on détecte des interactions entre des individus de communautés différentes, donc des cas de faux positifs. Après un certain temps de collecte, l’accumulation de ces faux positifs est telle, que le premier quartile n’est plus suffisant pour caractériser les liens non-pertinents. Ces résultats suggèrent ainsi que les performances de la solution sont améliorées quand les rayons de détection sont confinés aux régions associées.

6.5 Conclusion

La collecte des données est un sujet important pour l’étude des réseaux. Si des jeux de données ont pu être générés à partir de sites d’échange et de partage, ou à partir de périphériques mobiles capables de collecter en temps réel des données spatio-temporelles sur des individus, il existe des situations dans lesquelles ce type d’approche ne peut pas être utilisé.

Dans ce chapitre, nous nous sommes intéressés à la question de la collecte dans le contexte particulier d’études menées sur le Moqueur Gorge Blanche, une espèce d’oiseaux endémique à la Martinique, pour laquelle les périphériques mobiles traditionnellement uti-lisés, tels que les colliers GPS ou les puces RFID, ne peuvent pas être envisagés. Notre objectif dans ce travail était de proposer une architecture de collecte de données sociales et de mesurer son efficacité en vérifiant qu’elle permettait d’identifier les structures familiales. Les contributions de ce chapitre peuvent être résumées comme suit.

(i) Nous avons proposé une architecture de collecte basée sur un réseau de capteurs sans fil. Nous avons ensuite montré comment l’architecture peut être utilisée pour générer un réseau social pondéré, basé sur la fréquence des présences dans une même région géographique. Ce réseau est ensuite utilisé pour identifier les structures familiales. Bien que nous ayons expérimenté une méthode d’identification des individus basée sur l’analyse des chants, l’architecture proposée est assez souple pour supporter différents types de techniques de reconnaissance, la seule condition étant que les individus et les régions sur lesquelles ils sont présents puissent être identifiés.

(ii) Avant un déploiement réel de la solution sur le terrain, nous avons développé l’ou-til de simulation Lypus pour étudier d’une part la faisabilité de l’approche et analyser d’autre part les paramètres qui pouvaient influencer les performances de la solution. Ly-pus est un environnement de simulation en 2D qui permet de recréer virtuellement une zone d’étude sur laquelle des oiseaux ayant des comportements similaires à ceux de l’espèce étu-diée sont recréés et sur laquelle un réseau de capteurs virtuel est introduit. L’outil permet ainsi de mesurer la qualité des données obtenues selon différents paramètres.

(iii) Une première étude a mis en application l’outil pour étudier l’impact de diffé-rentes configurations de capteurs sur les performances de la collecte. Nous nous sommes dans un premier temps intéressés à l’évolution des propriétés des réseaux obtenus. Puis nous avons vérifié à chaque instant si le réseau obtenu permettait d’identifier les familles. Nous avons ainsi pu observer que le nombre de capteurs avait une influence directe sur le temps d’accumulation nécessaire pour une identification efficace des familles d’individus.

Le travail présenté dans ce chapitre constitue une étape préliminaire et nécessaire avant tout déploiement réel de la solution sur le terrain. Il est un garant de la faisabilité de l’approche et permet d’envisager un déploiement sur le terrain à court terme.

Chapitre 7

Conclusion et perspectives

Les travaux de recherche présentés dans ce mémoire apportent un certain nombre de contributions à l’étude des réseaux sociaux.

Les Chapitres 3et 4, consacrés à l’étude des phénomènes de diffusion sur des ré-seaux dynamiques contribuent à une meilleure compréhension de ces processus sur les réseaux du monde réel. En effet, en partant du constat que les travaux traditionnels ne tenaient pas compte de la dynamique des réseaux, nous avons proposé une approche géné-rique, permettant la modélisation d’un phénomène de diffusion sur des réseaux en évolution. En identifiant ensuite plusieurs facteurs qui peuvent être à l’origine de modifications struc-turelles du réseau, nous avons mis en application cette approche pour comprendre l’impact de ces facteurs sur le processus de diffusion. Si les résultats obtenus ont démontré le profond impact de la dynamique du réseau sur ces phénomènes, nous avons également pu mettre en évidence l’influence de l’espace, aussi bien social que géographique, sur ces processus. Les travaux menés ont également des implications directes pour l’étude des réseaux, puis-qu’ils nous amènent à nous interroger sur les méthodes de modélisation de la dynamique et des processus prenant place sur les réseaux, ainsi que leurs interdépendances.

Les travaux décrits dans le Chapitre 5sur l’analyse conceptuelle des réseaux so-ciaux permettent d’extraire un nouveau type de connaissance des réseaux. En effet, après avoir constaté que certaines questions pertinentes sur la structure des réseaux ne trouvaient pas de réponses à travers les méthodes classiques de fouille de réseaux sociaux, nous avons proposé une nouvelle approche qui exploite à la fois la structure des réseaux et les attri-buts des noeuds. Cette approche présente deux intérêts majeurs pour l’étude des réseaux sociaux. Elle permet tout d’abord d’extraire une connaissance statistiquement pertinente sur les groupes de noeuds les plus connectés du réseau, puis elle fournit une représentation sémantique du réseau en synthétisant la connaissance acquise. Les expériences menées ont permis de confirmer la pertinence de l’approche au regard des motifs extraits et les bonnes performances de l’algorithme d’extraction proposé.

D’une façon plus générale, ces travaux s’inscrivent dans une branche nouvelle de la recherche sur les réseaux, qui consiste à considérer toutes les informations disponibles sur le réseau lors de la phase d’extraction de connaissances.

Enfin, les travaux du Chapitre 6, menés sur la collecte automatique de données sociales permettent aujourd’hui d’envisager un champ d’applications à venir très large et le recueil de nouveaux jeux de données, autres que ceux traditionnellement extraits des sites d’échange et de partage. En effet, de nombreux types d’interactions sociales échappent encore aux travaux menés sur les réseaux en raison des difficultés liées à la disponibilité des données. Si des travaux ont déjà été menés sur l’utilisation de dispositifs mobiles pour la collecte de contacts de proximité, nous avons pu observer que ces dispositifs ne pouvaient pas être déployés dans toutes les situations. Le travail précurseur décrit dans ce chapitre propose une architecture composée de capteurs fixes qui répond aux exigences fonctionnelles et techniques de la collecte de données sociales au sein d’une population animale. Les résultats obtenus en simulation ont ainsi montré l’intérêt de cette architecture pour collecter les interactions et extraire les liens qui structurent la société animale étudiée.

Du point de vue de la recherche sur les réseaux, cette architecture peut être utilisée pour collecter des données dans des situations spécifiques où ni des observations humaines, ni des sites d’échange ne permettent d’obtenir des données pertinentes.

Perspectives

Les travaux entamés dans ce mémoire ouvrent de nouvelles perspectives de recherche intéressantes, que nous prévoyons d’aborder dans nos travaux futurs.

En ce qui concerne la diffusion sur des réseaux sociaux dynamiques, les travaux menés dans ce mémoire se sont uniquement intéressés à des contacts "directs", c’est-à-dire que nous supposions que la transmission s’effectuait d’un individu à l’autre. Cependant, dans de nombreuses situations, la transmission peut également survenir de manière "indirecte", à travers des vecteurs de diffusion intermédiaires tels qu’une poignée de porte, un tableau noir, une chaise, un mouchoir, etc. La dimension spatiale intrinsèque du modèle ER est par exemple tout à fait adaptée pour modéliser ce type de situation, caractérisée par la présence de zones géographiques.

Une évolution de cette approche serait de supposer que même dans leur état de mobilité, les individus peuvent passer plus ou moins de temps sur les zones qu’ils visitent : cinéma, centre commercial, musée, hôpital, etc. Comme l’illustre la Figure7.1, sur laquelle l’intensité de la couleur (points chauds) correspond au temps que passe un individu sur la zone, une première évolution du modèle ER a déjà été implémentée pour modéliser cette situation. Un des objectifs est d’étudier comment le temps d’immobilité passé sur une zone influence le processus de diffusion.

Figure 7.1 – Extension du modèle ER avec points chauds distribués dans l’espace

Documents relatifs