• Aucun résultat trouvé

IV. Les machines :

N/A
N/A
Protected

Academic year: 2022

Partager "IV. Les machines : "

Copied!
7
0
0

Texte intégral

(1)

Les données structurées et leur traitement

I. L’histoire des données structurés et mémoires.

II. Les données et l’information :

A. Qu’est-ce qu’une donnée, un descripteur, une collection…

Une …………. est une ……… un objet, une personne ou un événement. Par exemple, le numéro de téléphone d’un contact est une donnée.

Plusieurs ……… peuvent être utiles pour décrire un même objet (par exemple des descripteurs permettant de caractériser un contact : nom, prénom, adresse et numéro de téléphone).

Nom Prénom Adresse N° de téléphone

Une ………. partageant les mêmes ……… (par exemple, la collection des contacts d’un carnet d’adresses).

Nom Prénom Adresse N° de téléphone

Dupond Laurent 36 rue … 06 44 15 67 98

Bern Stéphane … …

Déproge Pierre … …

Spinoza Baruch … ….

La ……….. permet de présenter une collection : les objets en …………, les descripteurs en

…………. et les données à l’……….. Les données sont alors dites ……….

Un autre exemple : dans un dressing, vous avez le tiroir des sous-vêtements, l’étagère des pantalons, l’étagère des t- shirts et la penderie des robes. Vous avez ainsi structuré vos habits. Cela facilite la recherche, la quantification, le tri, etc.

(2)

B. Les différents formats des fichiers de stockage.

Pour assurer la persistance des données, ces dernières sont stockées dans des fichiers. Le format CSV

………. ou le …… sont des formats de fichier simples permettant d’enregistrer une table (activité n°3-I).

Certaines collections typiques sont utilisées dans des applications et des formats standardisés leur sont associés : par exemple le format ouvert vCard (extension .vfc) pour une collection de contacts.

Une base de données regroupe plusieurs collections de données reliées entre elles. Par exemple, la base de données d’une bibliothèque conserve les données sur les livres, les abonnés et les emprunts effectués. On parle alors de bases de données relationnelles (activité 4).

C. Les métadonnées

À tout fichier sont associées des ……….. qui permettent d’en décrire le contenu. Ces métadonnées varient selon le type de fichier (…….. et ……… de géolocalisation d’une photographie (voir thèmes 5 et 7), ………….. et titre d’un fichier texte, etc.).

Les données comme les métadonnées peuvent être capturées et enregistrées par un dispositif matériel (votre smartphone ………. des métadonnées aux photos que vous prenez) ou bien renseignées par un humain. Elles sont de différents types (numériques, textes, dates) et peuvent être traitées différemment (calcul, tri, affichage, etc.).

III. Les algorithmes et les programmes :

La recherche dans des ………. a d’abord été effectuée selon une ………

préalable faite par l’homme. Des algorithmes ont ensuite permis d’automatiser l’indexation à partir de textes, d’images ou de sons.

Une table de données peut faire l’objet de différentes opérations :

• ……… une information précise dans la collection,

• ………… la collection sur une ou plusieurs propriétés,

• …………. la collection selon un ou plusieurs tests sur les valeurs des descripteurs,

• Effectuer des …………..,

• ………. les informations produites pour une visualisation par les utilisateurs.

Exemple :

Le logiciel Pronote utilise plusieurs bases de données : la plus évidente est celle des notes d’une matière. Il calcule ensuite les moyennes des élèves dans chaque matière pour générer la base de données des moyennes de la classe. Mais le logiciel gère aussi une base de données pour les absences ou les retards. Par tradition, on affiche les tableaux par ordre alphabétique, mais on peut aussi les afficher par moyenne croissante, ou par âge croissant. On peut ne faire apparaître que les élèves ayant certaines options, ou ceux qui n’ont pas la moyenne. Etc.

Des algorithmes, plus précisément ici, des requêtes, sont générés lorsque les professeurs cochent certaines options d’affichage ou de recherche. C’est transparent pour l’utilisateur, mais ce sont bel et bien les machines qui traduisent nos volontés.

La recherche dans une base comportant plusieurs collections peut aussi ……… des collections différentes sur un descripteur commun ou comparable.

Exemple :

Comme dit précédemment, la base de données des moyennes générales est générée à partir des bases de données des notes

(3)

IV. Les machines :

Des recherches dans les fichiers se font à l’intérieur même des ordinateurs, soit sur la base de leurs métadonnées, soit sur la base d’une indexation (à la manière des moteurs de recherche sur le Web).

Les grandes bases de données sont souvent ………. (machines puissantes avec une importante capacité de stockage sur disques). Ces centres de données doivent être alimentés en électricité et maintenus à des ……… pour fonctionner correctement.

V. Impacts sur les pratiques humaines :

L’évolution des capacités de stockage, de traitement et de diffusion des données fait qu’on assiste aujourd’hui à un phénomène de surabondance des données et au développement de nouveaux algorithmes capables de les exploiter.

L’exploitation de données massives (………..) est en plein essor dans des domaines aussi variés que les sciences, la santé ou encore l’économie. Les conséquences sociétales sont nombreuses tant en termes :

• De démocratie,

• De surveillance de masse

• D’exploitation des données personnelles.

Certaines de ces données sont dites ouvertes (OpenData), leurs producteurs considérant qu’il s’agit d’un bien commun (activité 5). Mais on assiste aussi au développement d’un ………. où des entreprises collectent et revendent des données sans transparence pour les usagers. D’où l’importance d’un cadre juridique permettant de protéger les usagers, préoccupation à laquelle répond le règlement général sur la protection des données (RGPD) (activité 6).

(4)

Les données structurées et leur traitement

I. Fan de cinéma :

Vous avez beaucoup aimé un film et vous voulez vous rappeler des acteurs qui vous ont marqué... votre mémoire peut suffire, mais elle est limitée. En outre, vous ne savez pas vraiment comment c’est rangé dans votre tête !

Prenons un exemple : Avengers – Endgame

Ah, dommage, les noms sont trop petits, peu lisibles et surtout, à quels rôles sont-ils associés ?

Heureusement, il existe des sites web pour les fans. Par exemple : allocine.fr et plus particulièrement : http://www.allocine.fr/film/fichefilm-232669/casting/

(5)

I. A l'aide d'un site de référence en cinéma, complétez le casting de ce film :

C'est un peu long et c’est difficile de tous les énumérer. Pourtant, parmi les acteurs méconnus de troisième ou quatrième rôle, il y a peut-être déjà̀ les stars de demain ! Déjà̀ apparait une première question sur le traitement des données : comment sélectionner une donnée ?

Ce n’est pas toujours facile de retrouver qui est qui, car l'ordre dans lequel apparaît les acteurs est ici un ordre de prestige propre au site web Allo-ciné́. Le site : www.IMDb.com utilise l’ordre du générique : https://www.imdb.com/title/tt4154796/fullcredits?ref_=tt_ql_1

(6)

II. Une deuxième question apparait : comment trier une donnée ?

Mais un film c'est aussi, un réalisateur. Ici, ce sont deux frères Anthony et Joe Russo. Mais aussi des scénaristes : Christopher Markus et Stephen McFeely ; une musique : Alan Silvestri ; etc. A cela s’ajoute une année de sortie, une durée, un box-office, etc. Finalement, les informations qui décrivent un film sont variées et complexes, et pourraient se ranger autrement.

Dans une fiche cartonnée par exemple :

C'est d'ailleurs ce qu'on faisait avant que l'informatique se démocratise. Il y avait des collections de fiches cartonnées qu'on rassemblait dans des tiroirs appelés classeurs ou tout simplement fichiers (folder en anglais), nom qui est passé dans le jargon informatique.

(7)

Ci-dessous, exemples d’un fichier et d’un tiroir à fiches. Les fiches entaient attachées dans le tiroir par une barre métallique à la manière de vos classeurs.

Ces fichiers entaient par exemple à disposition des lecteurs dans une bibliothèque pour faciliter la recherche d'un ouvrage. D’où la troisième question : comment structurer les données ?

Un répertoire bibliographique universel utilisé dans les bibliothèques.

A retenir :

ü Les données peuvent être de nature variée (des noms ou plus généralement des mots, des nombres ou plus généralement des valeurs, des images ou plus généralement des objets, etc.).

üPour traiter une donnée (recherche, modification, etc.), il faut qu’elle appartienne à un ensemble structuré.

Références

Documents relatifs

 La recherche dans une base comportant plusieurs collections peut aussi. croiser des collections différentes sur un descripteur commun

- Cela existe également pour d’autres collections qui emploient la méthode remove qui supprime un objet d’une valeur donnée..  cette valeur nécessite d’être testée

Henri IV, dont on connaît l’admiration pour François I er1 – un sentiment qu’il avait en commun avec Catherine de Médicis –, nourrit la même ambition de créer un

Les collections de spécimens à sec, ou montés entre lames et lamelles, sont associées à des collections d’ADN, de séquences nucléotidiques, indispensables pour le typage ou

pour connaître la position d’un élément dans une liste, on peut utiliser deux méthodes. pour avoir la première occurrence, il faut utiliser int

à la fin d'un ArrayList avec la méthode boolean add(Object newElement) à une position donnée. void add(int index, Object newElement)

[r]

Le contenu de cet ouvrage est susceptible de choquer la sensibilité des mineurs; tout possesseur de cet ouvrage s’engage à ne pas le laisser à leur disposition.. Der Inhalt