Sans vouloir rentrer dans une discussion philosophique sur la nature des données, il faut
malgré tout admettre que la question n’est pas simple. Chaque domaine qui travaille avec
des « données » a une représentation spécifique, propre à lui, de ce qu’il comprend sous
la notion de donnée. La plupart du temps, une donnée se présente comme « une
description élémentaire, typiquement numérique pour nous, d’une réalité. C’est par
exemple une observation ou une mesure »
109. Par ailleurs, la plupart des définitions qu’on
trouve à ce sujet vont à peu près dans cette direction. Dans Wikipédia, on peut même
trouver qu’« elles sont dépourvues de tous raisonnements, suppositions, constatations,
probabilités, qui, étant indiscutables ou indiscutées, servent de base à une recherche, à
un examen quelconque »
110ce qui, par ailleurs, va dans le sens que lui donne, par
exemple, le Larousse où on peut lire qu’une donnée, c’est « ce qui est connu ou admis
107 Chignard, « Monétiser les données du transport public... chiche ? ».
108
Sylvie Fayet, « “Données” de la recherche, les mal-nommées », Billet, UrfistInfo, (15 novembre 2013), http://urfistinfo.hypotheses.org/2581.
109 Serge Abiteboul, « Sciences des données : de la logique du premier ordre à la Toile : Leçon inaugurale prononcée le jeudi 8 mars 2012 », in Sciences des données : de la logique du premier ordre à la Toile : Leçon inaugurale prononcée le jeudi 8 mars 2012, Leçons inaugurales (Paris: Collège de France, Fayard, 2012), http://books.openedition.org/cdf/529.
110 « Donnée », Wikipédia, 16 février 2015,
comme tel, sur lequel on peut fonder un raisonnement, qui sert de point de départ pour
une recherche »
111.
Globalement, une donnée, si on applique une réduction définitoire, peut être représentée
comme un « fait ». Par un procédé de contextualisation, ce « fait » devient une
information. Ainsi, par exemple, un tableau statistique est rempli de « faits » et le tableau
en lui-même représente la contextualisation, ce qui permet d’en extraire des informations.
C’est simplifié, on l’avoue, mais c’est, à peu près, de cette manière que les choses se
présentent dans le cadre du sens commun par rapport à la notion de donnée. Et c’est très
important d’en être conscient car cette manière de penser et de faire peut avoir un impact
même sur la manière de voir et d’appréhender les données ouvertes elles-mêmes.
Regardons maintenant, afin d’être plus concrets, cette liste qui est issue de la Charte du
G8 pour l'Ouverture des Données Publiques
112:
Exemples des catégories d'ensembles de données (par ordre alphabétique) :
Criminalité et justice
Statistiques sur la criminalité Sécurité Développement mondial Aide au développement Sécurité alimentaire Industries extractives Terres Données géospatiales Topographie Codes postaux
Cartes nationales ou locales
Éducation
Liste des écoles Valeur ajoutée
Compétences numériques Entreprises Registre des entreprises
Environnement
Niveaux de pollution Consommation énergétique
111 « donnée », Dictionnaire de français Larousse, consulté le 5 mai 2015, http://www.larousse.fr/dictionnaires/francais/donn%C3%A9e/26436.
Finances et marchés
Valeur des transactions
Marchés publics attribués ou à venir Budget local ou national (prévu et exécuté)
Mobilité et protection sociales
Logement Prestations sociales Assurance-maladie et assurance-chômage Observation de la Terre Conditions météorologiques Agriculture, foresterie Pêche et chasse Responsabilisation des gouvernements et démocratie
Guichets et points de contact des administrations Résultats des élections
Lois et règlements, salaires (échelles salariales) Dons
Santé
Données issues de prescriptions Données de performance
Science et recherche
Données relatives au génome humain Recherche et activités pédagogiques Résultats d’expérience
Statistiques
Statistiques nationales Recensements Infrastructure
Statistiques économiques et éducatives
Transport et infrastructure
Horaires des transports publics Services à large bande