• Aucun résultat trouvé

7.5 Une nouvelle approche pour mesurer l’influence

7.5.3 Application en ligne

Pour compl´eter notre travail, nous avons d´evelopp´e une application en ligne pour cal-culer la probabilit´e de n’importe quel utilisateur de Twitter d’ˆetre un capitaliste social. Cette application est disponible `a l’adresse http://www.bit.ly/DDPapp (notons qu’il faut avoir un compte Twitter pour utiliser l’application). La figure 7.6 en montre une capture d’´ecran.

´

Etant donn´e le nom d’utilisateur d’un compte Twitter, l’application calcule les attributs d´ecrits dans le tableau 7.1 et utilise ensuite le classifieur LR afin de calculer la probabilit´e estim´ee que l’utilisateur de ce compte soit un capitaliste social. Les attributs sont extraits des 200 derniers tweets de l’utilisateur en question. Cette restriction vient de la limite impos´ee par l’interface de programmation (API) de Twitter. En haut `a gauche de la page web, les scores Klout et Kred sont affich´es. Le score Klout r´e´equilibr´e est affich´e sur la photo du profil de l’utilisateur. En plus des informations basiques du compte Twitter (nombre d’amis, de followers, de tweets, de listes et de favoris), des informations plus complexes sont affich´ees, telles que la proportion de tweets originaux et de retweets, les sources utilis´ees pour poster les tweets et l’heure `a laquelle les tweets ont ´et´e post´es.

Afin d’obtenir une r´eponse rapide, nous avons fait un compromis concernant les at-tributs utilis´es. La modification principale est que l’attribut 6 correspondant au nombre d’utilisateurs qui sont `a la fois amis et followers n’est pas utilis´e. Cet attribut n´ecessite d’extraire tous les amis et les followers d’un utilisateur, ce qui est tr`es long `a cause des restrictions de l’interface de programmation Twitter. Cependant, cette modification ne change pas significativement la pr´ecision de notre classifieur.

7.6 Conclusion et perspectives

Dans ce travail nous avons mis en parall`ele diff´erents outils utilis´es pour mesurer l’in-fluence des utilisateurs sur Twitter [2, 3, 5] avec de r´ecents travaux men´es sur les capitalistes sociaux [56, 69]. Notre ´etude montre que beaucoup de ces utilisateurs ne tweetent sur aucun autre sujet que le capitalisme social et obtiennent pourtant des scores d’influence ´elev´es. En effet, les mesures d’influence actuelles ne prennent pas en compte l’impact du capita-lisme social sur le r´eseau Twitter. Afin de pallier ces limitations, nous avons d´evelopp´e un classifieur qui prend en compte des attributs topologiques du r´eseau sous-jacent comme le nombre d’amis, le nombre de followers et le nombre d’utilisateurs `a la fois amis et follo-wers ainsi que d’autres attributs extraits des tweets de l’utilisateur, de son activit´e, etc. Notre classifieur d´etecte efficacement les capitalistes sociaux et ´etend des travaux ant´erieurs bas´es seulement sur des attributs topologiques [56]. Nous utilisons ensuite les pr´edictions du classifieur afin de r´e´equilibrer le score Klout, qui est l’outil le plus utilis´e pour mesu-rer l’influence sur Twitter. Ceci permet de r´eduire le score Klout des capitalistes sociaux tout en conservant le score d’influence des utilisateurs normaux. Nous avons ´egalement d´evelopp´e une application en ligne qui permet d’appliquer nos travaux `a n’importe quel utilisateur de Twitter.

Ce travail peut ˆetre ´etendu de plusieurs mani`eres. Avant tout, `a cause des limitations de Twitter, notre jeu de donn´ees est relativement petit. En construisant un jeu de donn´ees plus grand, ce qui est long mais simple, on pourrait construire un classifieur encore plus robuste et ´egalement y incorporer d’autres attributs.

De plus, nous nous sommes concentr´es dans ce chapitre sur le d´eveloppement d’un outil pour discriminer les capitalistes sociaux des utilisateurs normaux en fonction de certains attributs. Nous avons ensuite utilis´e cet outil pour r´e´equilibrer le score Klout. Il serait int´eressant de construire une nouvelle mesure d’influence en partant de z´ero et en utilisant ces attributs et ´eventuellement d’autres. De plus ces travaux montrent l’importance d’utili-ser d’autres attributs que ceux mis en avant dans les mesures d’influence classiques, tels que le nombre de retweets. En effet, du fait de la forte corr´elation entre le nombre de retweets et le nombre de followers, le nombre de retweets seul ne peut pas ˆetre consid´er´e comme un bon indicateur d’influence. Une piste int´eressante pour ´evaluer l’influence d’un utilisateur serait d’utiliser comme indicateur le nombre de retweets effectu´es par des utilisateurs qui ne sont pas amis avec lui.

Pour finir, ce travail est cibl´e sur le r´eseau Twitter sur lequel les capitalistes sociaux ont ´et´e mis en ´evidence par Ghosh et al. [69]. D’autres applications avec une composante sociale telles qu’Instagram ou Youtube pourraient avoir les mˆemes propri´et´es et n´ecessiter une am´elioration des outils de mesure d’influence.

Chapitre 8

G´en´eration directe de graphes

al´eatoires avec distribution de degr´es

prescrite

8.1 Introduction

Quand des ´etudes de r´eseaux sociaux r´eels sont effectu´ees et que des m´ethodes et m´etriques d’Analyse de R´eseaux Sociaux (Social Networks Analysis ou SNA [156]) sont utilis´ees, l’´evaluation des r´esultats est un aspect tr`es important de la d´emarche scientifique. Une m´ethode d’´evaluation consiste `a comparer les propri´et´es des r´eseaux ´etudi´es `a celles de graphes al´eatoires. Cette m´ethodologie a ´et´e particuli`erement mise en avant en 1998 dans l’article de Watts et Strogatz [157], dans lequel ils ont montr´e que le ”ph´enom`ene petit-monde”, c’est-`a-dire que la faible distance moyenne entre les nœuds, est pr´esent dans tout graphe avec un peu d’al´eatoire ; il s’agit donc d’une propri´et´e naturelle des graphes de terrain qui ne permet pas de les discriminer. Ceci a eu un fort impact en promouvant l’´evaluation par comparaison aux graphes al´eatoires.

Une d´ecouverte importante concerne la distribution de degr´es des graphes de terrain. Il a en effet ´et´e montr´e que la plupart des graphes de terrain ont une distribution fortement h´et´erog`ene, en loi de puissance [62], `a l’oppos´e des distributions en loi de Poisson comme observ´ees dans le mod`ele de graphes al´eatoires d’Erdos-Renyi [60]. Cela incite donc `a g´en´erer des graphes al´eatoires avec une distribution de degr´es en loi de puissance puis `a les comparer avec les graphes r´eels. Les propri´et´es similaires dans les deux cas sont consid´er´ees comme triviales, c’est-`a-dire qu’elles d´ecoulent directement de la distribution de degr´es, alors que les propri´et´es qui diff`erent indiquent l’existence d’une propri´et´e discriminante ou d’une anomalie dans le r´eseau ´etudi´e.

Afin de pouvoir mener ces analyses de mani`ere correcte, il est donc n´ecessaire de pouvoir g´en´erer des graphes al´eatoires avec une distribution de degr´es fix´ee. Dans ce chapitre, nous allons ´etudier des algorithmes existants qui g´en`erent des graphes al´eatoires avec une distribution de degr´es fix´ee et proposer une nouvelle m´ethode permettant de les g´en´erer de

mani`ere directe, c’est-`a-dire sans revenir en arri`ere, et quasi uniform´ement, c’est-`a-dire que chaque graphe a la mˆeme probabilit´e d’ˆetre g´en´er´e. La g´en´eration directe permet d’ajuster la g´en´eration pour des cas sp´ecifiques, ce qui ouvre de nouvelles possibilit´es pour une ´evaluation plus fine et la g´en´eration de benchmarks synth´etiques.

Apr`es une pr´esentation rapide des notations utilis´ees, dans la section 8.2, nous dresse-rons l’´etat de l’art dans la section 8.3. Nous d´ecrivons ensuite notre algorithme et le dis-cutons dans la section 8.4 avant de pr´esenter des implications sur l’´evaluation de r´eseaux dans la section 8.5. Nous concluons enfin dans la section 8.6.