Les données structurées
Repères historiques
Données personnelles, RGPD
www.lespritsorcier.org/dossier-semaine/objets-connectes/
www.cnil.fr/fr/rgpd-de-quoi-parle-t-on
Le but du travail est de comprendre ce qu’est une donnée personnelle et comment elles sont récupérées. À partir de la vidéo et du site de la CNL donné en ressource, répondre aux questions.
1 – Donner la définition d’une donnée personnelle : ____________________
______________________________________________________________
______________________________________________________________
Exemples de données : _____________________________________________________________________________
2 – Peut-on effacer ses données recueillies sur le Net ? ____________________________________________________
________________________________________________________________________________________________
3 – Où sont-elles stockées toutes ces données ? _______________________________________
_____________________________________________________________________________
4 – Combien de temps sont-elles stockées ? _________________________________________
_____________________________________________________________________________
5 – Comment les données sont-elles collectées ? _________________________________________________________
________________________________________________________________________________________________
Nicolas TOURREAU @IANum_Techno – Cité Scolaire de Lannemezan
Nom Prénom : Classe :
6 – Qu’est-ce qu’un cookie ? _________________________________________________________________________
________________________________________________________________________________________________
7 – A quoi ça sert de récupérer nos données ? ___________________________________________________________
________________________________________________________________________________________________
8 – Comment nos données sont-elles partagées ? ________________________________________________________
________________________________________________________________________________________________
9 – Qu’est-ce que le RGPD ? _________________________________________________________________________
________________________________________________________________________________________________
10 – Trouver dans votre navigateur comment gérer les cookies et autres paramètres de sécurité.
11 – En groupe, réaliser une affiche pour encourager vos camarades à protéger leurs données personnelles.
Données ouvertes, Formats et Traitement des données
1 – Donner la définition d’une donnée ouverte : __________________________________________________________
________________________________________________________________________________________________
2 – Dans l’onglet « informations » et « tableau », trouver les données concernant les résultats nationaux du DNB.
a) Quelle période couvre les données ? ____________________________________________________________
b) Combien y a-t-il de descripteurs ? ______________________________________________________________
c) Combien de type de données différents ? ________________________________________________________
3 – Dans l’onglet « analyse », afficher un histogramme de la somme des admis en fonction des années.
4 – Dans l’onglet « export », télécharger les fichiers de type CSV, JSON et EXCEL.
a) Ouvrir les 3 fichiers avec le BlocNote puis avec LibreOffice Calc. Qu’observez-vous ?
Fichier CSV Fichier JSON Fichier EXCEL
Taille du fichier en ko
b) Quel est l’intérêt du format CSV ? ______________________________________________________________
__________________________________________________________________________________________
c) A partir du fichier CSV, filtrer uniquement les données de l’académie de « Toulouse », et trier les données par
« série » et par « année ».
Données Objet Connecté, Formats, Traitement des données
Lorsque je pratique du sport, comme une course à pied, ma montre connectée peut récupérer des données. Comment traiter ensuite ces données ? Merci à l’auteur l’activité : Didier LOMMELE
1 – Quelles données sont enregistrées par la montre connectée ?
____________________________________________
____________________________________________
____________________________________________
____________________________________________
____________________________________________
Il est possible de récupérer ou exporter les données sous différents formats. Le format original est le format propriétaire Garmin® : .fit (Flexible and Interoperable Data Transfert) 3 – Quel est l’intérêt pour une entreprise de ne pas rendre publique la façon dont elle met en forme ses données ?
________________________________________________________________________________________________
________________________________________________________________________________________________
4 – Les autres formats d’exports sont-ils ouverts ou propriétaires ?
Le format GPX
La racine d’un fichier .gpx peut contenir :
• Des métadonnées (<metadata>), décrivant le contenu du fichier GPX
• Une liste de points de cheminement ou waypoint (<wpt>)
• Une liste d' itinéraires (<rte>)
• Une liste de traces ou track (<trk>)
5 – Ouvrir le fichier .gpx du parcours dans le navigateur Chrome® et décrire les différents types de données observées :
Type d’information : Balises et données observées :
Type d’information : Balises et données observées :
6 – Exploiter ce fichier .gpx pour créer le parcours sur une carte à l’aide de l’application en ligne Ouvrir le tableau de données et observer tout ce que contient le fichier.
https://connect.garmin.com/modern/activity/3805001532
ouvert
propriétaire
ouvert
propriétaire
ouvert
propriétaire
ouvert
propriétaire
a – Enregistrées par la montre pendant la course
b – Calculées à partir des données enregistrées
c – Collectées « ailleurs » lors de la synchronisation
2 – Quand ces données sont-elles collectées ?
Coche la bonne case
a b c
a b c
a b c
a b c
a b c
Le format CSV
7 – Ouvrir le fichier .csv avec LibreOffice Calc en utilisant le bon séparateur de données. Séparateur :
a) Supprimer toutes les colonnes n’ayant pas de données ou = 0. Combien reste-t-il de descripteurs ? __________
b) Que représentent les symboles X : et Y :
c) Que représente le descripteur « track_seg_point_id » ? _____________________________________________
d) Que représente le descripteur « ele » ? __________________________________________________________
e) Quelle durée s’écoule entre deux enregistrements de points successifs ? _______________________________
f) Trier les données par altitude de la plus élevée à la plus basse. Combien de point sont supérieurs à 470m ? ___
8 – Exploiter les données sous forme de graphique…
a) Créer un graphique de l’élévation en fonction du numéro de point enregistré (Choisir le type de Diagramme « XY » puis « Lignes seules ».
b) Pourquoi la courbe n’est elle pas identique proposées par le site Garmin Connect ? _______________________
_____________________________________________________________________________________________
9 – Exploiter les données sous forme de carte…
a) Comme pour le fichier .gpx, utiliser le fichier .csv pour créer le parcours sur une carte à l’aide de l’application en ligne My Maps.
Attention de bien sélectionner les bons descripteurs !
b) Comparer la carte et les données à celles obtenues précédemment. Expliquer les différences :
__________________________________________________________________________________________
__________________________________________________________________________________________
Traitement des données par programmation
Vous allez maintenant créer un graphique en utilisant le langage de programmation Python.
Pour cela vous programmerez dans un éditeur en ligne repl.it
Compléter et Saisir le code suivant. Commenter-le dans le tableau et lancer son exécution.
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv("________________.csv")
x = data.track_seg_point_id y = data._________
plt.plot(___,___) plt.show()
plt.savefig('result.png')
Dans la console d’exécution, saisir « y » puis taper sur « Entrer ». Qu’observez-vous ? ___________________________
A l’aide du document ressource ajouter des lignes au programme pour : - tracer la courbe en rouge
- mettre un titre et des légendes pour x et y - insérer une grille de lecture
- définir les valeurs de l’axe y de 0 à 600 m - annoter le point le plus haut « Maximum » - sauvegarder le fichier au format pdf