• Aucun résultat trouvé

2

2..11..QQ

UUEESSTTIIOONNSSCCEENNTTRRAALLEESS

La deuxième question centrale porte sur les types de données les plus adéquates à insérer dans le futur service d'archivage. Par types de données, nous entendons les catégories de données, leurs disciplines, le caractère et l'origine des données, et enfin le mode de sélection de celles-ci.

2

2..22..SS

CCEENNAARRIIOOSSPPOOSSSSIIBBLLEESS 2.2.1 Catégories de données Données quantitatives Données qualitatives Ressources multimédia

Matériel non digital (supports sur papier)

Autres types de données : ………

2.2.2 Disciplines

Toutes les données se rapportant aux sciences sociales au sens large : sociologie, économie, psychologie, histoire, criminologie, démographie, statistique, autres, … Uniquement la sociologie

Uniquement des bases de données quantitatives, peu importe leur discipline ………..

2.2.3 Caractère des données

Données "brutes" (chiffres collectés, extraits d'interviews, …)

Données "travaillées" : rapports de recherche, articles, guides méthodologiques, questionnaires, déclaration de variables, plans de traitements, … (documentation) Données personnelles

Données anonymisées

Prospectstudie SODA

Haalbaarheid van een data-archief voor de sociale wetenschappen

Troisième partie 47

2.2.4 Mode de sélection des données publiées dans le service

Définition d'un concept de "sciences sociales" et typologie des données Bases de sélection des données liée à

o la taille des données o la fiabilité de l'enquête

o ………..

o quelles sont les bases de sélection possibles et souhaitées, … ?

2

2..33..PP

OOSSIITTIIOONNNNEEMMEENNTTSS

2.3.1 D’après les expériences étrangères

Les types de données que nous avons observées dans les portails pour les sciences sociales à l’étranger sont majoritairement quantitatives et se rapportent aux sciences humaines au

sens large. Nous avons constaté avec surprise qu’aucun des portails que nous avons ciblés

n’avait défini ou même donné des références au concept de “sciences sociales”. Ces services d’archive intègrent au contraire tous les types de données en sciences sociales dans un but d’interopérabilité, jugeant tout découpage dans les sciences humaine difficile et arbitraire.

Les bases de sélection des données dans ces expériences sont souvent leur intérêt pour la

communauté scientifique à une large échelle en réponse à certains besoins et leur facilité de réutilisation.

Notons enfin que toutes les données présentes dans le portail d’archive sont toujours

anonymisées et que des normes standards d’encodage sont utilisées pour encoder les

données dans les bases documentaires. Les données présentes comportent toujours au moins de la documentation (fiches documentaires, abstracts, modèles de questionnaires, …) et sont parfois accessibles de manière brute en s’enregistrant dans le portail.

2.3.2 D'après les avis des institutions, du monde académique et scientifique

K. CATEGORIES DE DONNEES

Pour les représentants que nous avons rencontrés, toutes les catégories de données auraient a priori leur intérêt à figurer dans le portail. Il faut cependant veiller à ne pas faire double emploi avec des données déjà référencées ailleurs et il apparaît important de bien faire apparaître la spécificité d’un archivage digital par rapport à un archivage sur papier.

Leur optique se veut réaliste : il vaut mieux commencer par le minimum, c'est-à-dire de rendre d'abord disponible des données quantitatives (qui englobent beaucoup d’éléments et sont plus faciles à réutiliser), puis de s'attarder sur d'autres types de données, plus qualitatives, celles-ci étant souvent plus spécifiques.

L. DISCIPLINES DES DONNEES ET MODE DE SELECTION

Pour les disciplines des données et leur mode de sélection, les personnes interrogées

trouvent qu'une segmentation par discipline serait dangereuse. En effet, les distinctions de branches sont bien souvent arbitraires et difficiles à établir. Il faut donc prendre en compte

toutes les données se rapportant aux sciences sociales et humaines.

Pour que le portail puisse être utile, il est par contre important de se poser certaines questions fondamentales sur ses priorités : à quels utilisateurs s'adresse t'il ? suivant quels objectifs ? et pour répondre à quels besoins ?

Il est également essentiel que la qualité et la fiabilité des données soit garantie. Pour se faire, sélectionner des fournisseurs de données en provenance du secteur public, du monde scientifique ou du monde académique peut être un moyen de garantir cette qualité.

M. CARACTERE DES DONNEES

Ce sont des données travaillées, c'est-à-dire mises en forme et documentées, que les représentants que nous avons interrogés voudraient voir avant tout présentes dans le service. Pour accompagner les documents, une présentation des ressources sous forme de fiches contenant des méta-données1 ou des variables standardisées faciliterait grandement leur lecture. Dans un deuxième temps, le service pourrait contenir des données brutes, c’est-à-dire non mises en forme (chiffres, entretiens ou extraits d’entretiens). Ces données pourraient être réutilisées par d’autres chercheurs s’intéressant aux mêmes thématiques de recherche, malgré le fait que les données qualitatives recueillies soient souvent personnelles, très spécifiques et peu réutilisables. Pour rester dans un cadre légal, il apparaît également essentiel que les données accessibles dans le service d'archivage soient anonymisées2.

2

2..44..PP

OOIINNTTSSDDEECCOONNSSEENNSSUUSS

Les positions des personnes rencontrées sur le type de données à mettre dans un service d'archivage pour les sciences sociales en Belgique sont assez unanimes. Le service devrait se développer de manière réaliste en deux temps.

 Dans un premier temps, d'une manière limitative, c'est-à-dire en se concentrant sur les données et les ressources quantitatives des sciences sociales et leur documentation sous forme de fiches méthodologiques incorporant les méta-données.

 Dans un deuxième temps, en élargissant la cible à d'autres types de données plus qualitatives.

Les données seraient anonymisées et la présentation et l’encodage des ressources devront être effectués d’une manière standard.

1 Nous reviendrons sur les méta-données dans le chapitre V. : Méta-données et aspects techniques du système.

Prospectstudie SODA

Haalbaarheid van een data-archief voor de sociale wetenschappen

Troisième partie 49