• Aucun résultat trouvé

CHAPITRE 3 MÉTHODOLOGIE

3.5 Analyse de réseaux sociaux et indicateurs

3.5.2 Construction et visualisation des réseaux avec Gephi

Il existe une multitude de logiciels permettant de réaliser de l’analyse de réseaux sociaux ainsi que de la visualisation de graphes. Notre choix s’est posé sur le logiciel Gephi car il est facile d’usage et il est excellent en ce qui concerne la visualisation des réseaux. Les mesures dont avons besoin étant simples, dans un contexte d’analyse de réseaux sociaux, il n’était pas nécessaire de choisir le logiciel le plus puissant.

3.5.2.1 Importation des données dans le logiciel Gephi

Afin de construire les réseaux, Gephi a besoin d’un fichier csv contenant tous les liens. À partir de ce fichier, il peut créer les liens et les nœuds du réseau. On peut voir dans le Tableau 3-6, les champs du fichier csv nécessaires pour produire un réseau. On doit spécifier le nœud de départ (source) et le nœud d’arrivée du lien (target). De plus, on doit spécifier qu’on désire un lien non- dirigé (undirected). Finalement, le poids du lien (weight) permet d’ajuster l’intensité du lien.

Dans notre cas, il s’agit de l’occurrence de collaboration ou de co-publication pendant une période donnée.

Tableau 3-6: Exemple d’un fichier de liens pour le logiciel Gephi

Source Target Type Weight

Chercheur A Chercheur B Undirected 1

Chercheur A Chercheur C Undirected 3

Lorsqu’on désire rajouter de l’information supplémentaire à propos des nœuds, on peut importer un autre fichier csv contenant cette information. Par exemple, si on veut connaître l’institution des chercheurs, il faudrait importer un fichier qui aurait la forme du Tableau 3-7. Ici, le seul champ obligatoire est le Id. Ensuite, on peut mettre différents attributs, tels que l’institution ou l’expertise du chercheur.

Tableau 3-7: Exemple d’un fichier de nœuds pour le logiciel Gephi

Id Institution Attribut #2

Chercheur A Université Simon Fraser Matériel

Chercheur B Université de Sherbrooke Logiciel

3.5.2.2 Visualisation des réseaux

La visualisation des réseaux facilite grandement leur interprétation. Afin que cette interprétation soit juste, il est important que la représentation graphique soit fidèle à la nature des données. À l’aide du logiciel Gephi, on peut générer de nombreuses dispositions. Pour tous les réseaux étudiés dans ce travail, la même méthodologie a été appliquée afin de créer une visualisation esthétique et claire.

D’abord, les nœuds ont été dispersés selon un algorithme de spatialisation. Cet algorithme se nomme Force Atlas. Il utilise un système de forces (attraction et répulsion) appliquées entre les nœuds et les liens (Damlencour, 2013). L’analogie physique est que les nœuds représentent des

particules de même charge, tandis que les liens sont modélisés comme des ressorts. L’algorithme déplace les éléments du réseau itérativement en suivant les lois de la physique classique jusqu’à ce qu’il atteigne un état stable, un équilibre dans le système. En pratique, la spatialisation a pour effet d’éloigner, en périphérie, les nœuds faiblement liés et de rapprocher ceux qui ont de forts liens de connexion.

En plus de calculer les mesures statistiques de réseau (degré, centralités, etc.), le logiciel Gephi permet d’utiliser ces variables comme attributs dans la visualisation. Par exemple, dans les graphes créés avec nos données, la taille des nœuds est proportionnelle à leur degré. On peut aussi voir, à la Figure 3-6, que la taille des liens dépend également de l’intensité de collaboration entre les nœuds. Le code de couleur utilisé provient, dans la plupart de nos graphes, d’un calcul de modularité. Ce calcul permet l’identification de communautés au sein même d’une composante du réseau.

Le logiciel permet aussi de choisir l’ensemble du réseau ou uniquement certaines composantes. D’ailleurs, c’est en filtrant les composantes secondaires que l’on peut réaliser l’analyse de petit- monde sur la composante principale uniquement.

3.6 Résumé

En somme, dans ce travail, une méthodologie axée sur l’analyse de réseaux sociaux est employée afin d’étudier les liens de collaborations extraits des données en notre possession. Ces données sont divisées en deux catégories: le financement de la recherche et les données de co-publication d’articles scientifiques.

Pour les données de financement de la recherche, la principale source d’information est la base de données du CRSNG qui nous a permis d’identifier 9538 projets du secteur matériel des TIC, impliquant 725 chercheurs. La seconde source de liens de collaboration, dans le financement de la recherche, provient de l’organisme MITACS. Cette dernière permet d’identifier 423 projets supplémentaires respectant nos critères de sélection pour le secteur matériel des TIC.

Ensuite, la source de données bibliométriques (co-publication) est la base de données Web of

Science. L’extraction et le nettoyage des articles, contenant des liens de co-publication entre les

725 chercheurs préalablement choisis dans les données CRSNG, ont permis de collecter un ensemble de 12 167 articles.

On a vu que l’analyse de réseaux sociaux utilisée consiste en l’identification des acteurs les plus centraux des différents réseaux de collaboration, ainsi que l’étude de la structure de ces derniers. Les différentes définitions de centralité (d’intermédiarité, de degré et de vecteurs propres) sont utilisées. Plus précisément, c’est la structure petit-monde, vue dans la revue de littérature, qui nous intéresse. Donc, le coefficient de groupement et la longueur moyenne de chemin sont les principales propriétés de réseaux étudiées. Pour ce faire, le logiciel Gephi nous permet de calculer ces mesures de réseaux, en plus de permettre une visualisation des réseaux de collaboration. Les réseaux sont construits sur une base de cinq ans, permettant la capture d’un grand nombre de collaborations.