2
2..11..QQ
UUEESSTTIIOONNSSCCEENNTTRRAALLEESSLa deuxième question centrale porte sur les types de données les plus adéquates à insérer dans le futur service d'archivage. Par types de données, nous entendons les catégories de données, leurs disciplines, le caractère et l'origine des données, et enfin le mode de sélection de celles-ci.
2
2..22..SS
CCEENNAARRIIOOSSPPOOSSSSIIBBLLEESS 2.2.1 Catégories de données Données quantitatives Données qualitatives Ressources multimédiaMatériel non digital (supports sur papier)
Autres types de données : ………
2.2.2 Disciplines
Toutes les données se rapportant aux sciences sociales au sens large : sociologie, économie, psychologie, histoire, criminologie, démographie, statistique, autres, … Uniquement la sociologie
Uniquement des bases de données quantitatives, peu importe leur discipline ………..
2.2.3 Caractère des données
Données "brutes" (chiffres collectés, extraits d'interviews, …)
Données "travaillées" : rapports de recherche, articles, guides méthodologiques, questionnaires, déclaration de variables, plans de traitements, … (documentation) Données personnelles
Données anonymisées
Prospectstudie SODA
Haalbaarheid van een data-archief voor de sociale wetenschappen
Troisième partie 47
2.2.4 Mode de sélection des données publiées dans le service
Définition d'un concept de "sciences sociales" et typologie des données Bases de sélection des données liée à
o la taille des données o la fiabilité de l'enquête
o ………..
o quelles sont les bases de sélection possibles et souhaitées, … ?
2
2..33..PP
OOSSIITTIIOONNNNEEMMEENNTTSS2.3.1 D’après les expériences étrangères
Les types de données que nous avons observées dans les portails pour les sciences sociales à l’étranger sont majoritairement quantitatives et se rapportent aux sciences humaines au
sens large. Nous avons constaté avec surprise qu’aucun des portails que nous avons ciblés
n’avait défini ou même donné des références au concept de “sciences sociales”. Ces services d’archive intègrent au contraire tous les types de données en sciences sociales dans un but d’interopérabilité, jugeant tout découpage dans les sciences humaine difficile et arbitraire.
Les bases de sélection des données dans ces expériences sont souvent leur intérêt pour la
communauté scientifique à une large échelle en réponse à certains besoins et leur facilité de réutilisation.
Notons enfin que toutes les données présentes dans le portail d’archive sont toujours
anonymisées et que des normes standards d’encodage sont utilisées pour encoder les
données dans les bases documentaires. Les données présentes comportent toujours au moins de la documentation (fiches documentaires, abstracts, modèles de questionnaires, …) et sont parfois accessibles de manière brute en s’enregistrant dans le portail.
2.3.2 D'après les avis des institutions, du monde académique et scientifique
K. CATEGORIES DE DONNEES
Pour les représentants que nous avons rencontrés, toutes les catégories de données auraient a priori leur intérêt à figurer dans le portail. Il faut cependant veiller à ne pas faire double emploi avec des données déjà référencées ailleurs et il apparaît important de bien faire apparaître la spécificité d’un archivage digital par rapport à un archivage sur papier.
Leur optique se veut réaliste : il vaut mieux commencer par le minimum, c'est-à-dire de rendre d'abord disponible des données quantitatives (qui englobent beaucoup d’éléments et sont plus faciles à réutiliser), puis de s'attarder sur d'autres types de données, plus qualitatives, celles-ci étant souvent plus spécifiques.
L. DISCIPLINES DES DONNEES ET MODE DE SELECTION
Pour les disciplines des données et leur mode de sélection, les personnes interrogées
trouvent qu'une segmentation par discipline serait dangereuse. En effet, les distinctions de branches sont bien souvent arbitraires et difficiles à établir. Il faut donc prendre en compte
toutes les données se rapportant aux sciences sociales et humaines.
Pour que le portail puisse être utile, il est par contre important de se poser certaines questions fondamentales sur ses priorités : à quels utilisateurs s'adresse t'il ? suivant quels objectifs ? et pour répondre à quels besoins ?
Il est également essentiel que la qualité et la fiabilité des données soit garantie. Pour se faire, sélectionner des fournisseurs de données en provenance du secteur public, du monde scientifique ou du monde académique peut être un moyen de garantir cette qualité.
M. CARACTERE DES DONNEES
Ce sont des données travaillées, c'est-à-dire mises en forme et documentées, que les représentants que nous avons interrogés voudraient voir avant tout présentes dans le service. Pour accompagner les documents, une présentation des ressources sous forme de fiches contenant des méta-données1 ou des variables standardisées faciliterait grandement leur lecture. Dans un deuxième temps, le service pourrait contenir des données brutes, c’est-à-dire non mises en forme (chiffres, entretiens ou extraits d’entretiens). Ces données pourraient être réutilisées par d’autres chercheurs s’intéressant aux mêmes thématiques de recherche, malgré le fait que les données qualitatives recueillies soient souvent personnelles, très spécifiques et peu réutilisables. Pour rester dans un cadre légal, il apparaît également essentiel que les données accessibles dans le service d'archivage soient anonymisées2.
2
2..44..PP
OOIINNTTSSDDEECCOONNSSEENNSSUUSSLes positions des personnes rencontrées sur le type de données à mettre dans un service d'archivage pour les sciences sociales en Belgique sont assez unanimes. Le service devrait se développer de manière réaliste en deux temps.
Dans un premier temps, d'une manière limitative, c'est-à-dire en se concentrant sur les données et les ressources quantitatives des sciences sociales et leur documentation sous forme de fiches méthodologiques incorporant les méta-données.
Dans un deuxième temps, en élargissant la cible à d'autres types de données plus qualitatives.
Les données seraient anonymisées et la présentation et l’encodage des ressources devront être effectués d’une manière standard.
1 Nous reviendrons sur les méta-données dans le chapitre V. : Méta-données et aspects techniques du système.
Prospectstudie SODA
Haalbaarheid van een data-archief voor de sociale wetenschappen
Troisième partie 49