• Aucun résultat trouvé

C ONSTRUCTION D ’ UN JEU DE DONNÉES

4.2.1 Plateformes robotiques et les capteurs utilités

Les voitures instrumentées

La première famille de jeux de données couvre les séquences acquises par les capteurs embarqués par des véhicules. Les plus notables sont notamment les jeux de données MA-LAGA (Blanco-Claraco et al. 2014), Oxford RobotCar (Maddern et al. 2017), ou encore le celèbre KITTI (Geiger et al. 2013) (c.f. Figure 4.1a). Ce dernier s’est imposé comme un étalon algorithmique dans plusieurs domaines allant de l’odométrie à la seg-mentation sémantique. Les véhicules disposent de l’envergure suffisante pour embarquer de nombreux capteurs, dont en particulier des capteurs volumineux tels que des systèmes multi-caméras, des capteurs LiDARs ou des système de navigation inertiels aidés par GPS (GNSS), plus précis que leurs analogues compacts utilisés en robotique mobile. Par exemple, le véhicule de MALAGA embarque 5 capteurs LiDAR, et celui de MIT DARPA (Huang et al. 2010a) en comporte 13. Généralement, on profite de cette latitude pour combiner au moins un capteur LiDAR, un banc de caméras stéreo et un module GNSS. Le récent jeu de données MVSEC (Zhu et al. 2018) y ajoute des caméras évenementielles pour gérer des séquences rapides acquises depuis un motocycle. Enfin, la disponibilité

des signaux GPS facilite le calcul des vérités terrain. Elle est déterminée à une précision centimétrique dans la première version de MALAGA (Blanco et al. 2009) en fusionnant les signaux GPS acquis par plusieurs récepteurs répartis sur le véhicule.

Les plateformes robotiques autonomes

Une seconde famille englobe les jeux de données acquis à l’aide de plateformes robo-tiques classiques, autonomes en ce sens qu’elles n’embarquent aucun opérateur humain, et telles que des drones ou des robots terrestres. Si ces derniers sont plus contraints que les véhicules en termes de charges utiles, ils peuvent néanmoins évoluer dans des environne-ments plus variés et suivre des trajectoires plus malléables. Historiquement, les premiers jeux de données publiés s’appliquent à l’estimation 2D par LiDAR embarqué par une pla-teforme terrestre. C’est le cas de Victoria Park (Guivant et al. 2002) et de Intel Research Lab (Carlone et al. 2014). Rawseeds (Ceriani et al. 2009) ouvre la voie à l’estimation 3D et complète les capteurs LiDAR par des caméras. Cette tendance se confirme avec les jeux de données New College (Smith et al. 2009) et Ford Campus (Pandey et al. 2011). L’émergence des jeux de données aériens est plus tardive, car concomittante à l’essor des capteurs et des algorithmes basés vision pour ces plateformes. Les jeux de données EuRoC (Burri et al. 2016) (c.f. Figure 4.1b) et Zurich Urban Micro Aerial Dataset ( Ma-jdik et al. 2017) en sont deux exemples récents. EuRoC est d’ailleurs devenu un étalon de référence pour évaluer les algorithmes de SLAM visuels et visio-inertiels.

Les capteurs portatifs

On parle de SLAM portatif lorsque le banc de capteurs est directement manipulé par un opérateur humain. Bien que les trajectoires qui en résultent restituent les mouvements induits par la marche, ce SLAM s’adapte particulièrement aux environnements d’intérieur, et notamment à l’ascension d’escaliers. Quelques exemples de jeux de données de SLAM portatifs sont TUM-MonoVO (Engel et al. 2016) dans le cas monoculaire, TUM-RGB-D (Sturm et al. 2012) dans le cas RGB-D pour d’odométrie directe, ainsi que les récents PennCosyvio (Pfrommer et al. 2017) et TUM-VI (Schubert et al. 2018) pour le SLAM stéréo-inertiel (c.f. Figure 4.1c).

Les plateformes synthétiques

Très récemment, des jeux de données entièrement synthétiques ont été publiés. En effet, les simulateurs dédiés à l’expérimentation robotique tels que Gazebo (Koenig et al. 2004) ont accompli d’énormes progrès en termes de réalisme, que ce soit pour gé-nérer des trajectoires (à l’instar de Rotors (Furrer et al. 2016) dans Gazebo) simuler les acquisitions des capteurs visuels. Portés par les moteurs graphiques tels que Unreal-Engine 4 (UE4) et Unity3D, développés par l’industrie du jeu vidéo, les environnements de simulation produisent aujourd’hui des visuels de haute qualité, exploitables pour des algorithmes basés vision. À titre d’exemples, les simulateurs CARLA (Dosovitskiy et al. 2017), Virtual KITTI (Gaidon et al. 2016), AirSim (Shah et al. 2018) et Tarta-nAir (Wang et al. 2020) exploitent tous trois UE4 pour simuler les déplacements et les acquisitions de véhicules autonomes dans une grande variété d’environnements et de conditions météorologiques. La virtualisation permet de simuler un grand nombre de cap-teurs. TartanAir simule non seulement les images acquises par les caméras monoculaires, stéréos et RGB-D, mais également les scans LiDAR. AirSim simule également les baro-mètres, les centrales inertielles, les magnétobaro-mètres, les signaux GPS. Tout ceci repose sur une modélisation fine de la physique, de la dynamique des robots et de leurs capteurs. Par exemple, dans le jeu de données BlackBird (Antonini et al. 2018), les auteurs si-mulent jusqu’à la dérive temporelle des horloges des centrales inertielles. Ce dernier utilise d’ailleurs le module FlightGoggles (Sayre-McCord et al. 2018), développé pour la navi-gation visio-inertielle. La synthèse des jeux de données permet de plus de s’abstraire des diverses contraintes qui ponctuent généralement les campagnes d’acquisition. Ainsi, les calibrations des capteurs virtuels sont parfaitement connues là où leur estimation restent entâchée d’incertitudes dans le cas réel. Les acquisitions ne souffrent d’aucune avarie tech-nique telle que des erreurs de trajectoires, des décalibrations fortuites et autres problèmes matériels. Au contraire, les acquisitions deviennent précises, optimales et automatisées. Dans TartanAir (Wang et al. 2020), les trajectoires des caméras virtuelles sont générées dans les environnements simulés selon les contraintes dynamiques des robots, mais égale-ment de façon à leur conférer des propriétés globales (couverture de l’espace, mouveégale-ments aggressifs etc.). Ces avantages se concrétisent également dans le post-traitement, et en particulier la détermination des vérités terrain, étape pourtant délicate dans le cas réel. Les trajectoires simulées sont parfaitement connues, de même que les cartes de disparités ou les flots optiques observés. L’inconvénient principal des jeux de données synthétiques pour l’évaluation d’algorithmes est l’incertitude qui persiste quant au passage au réel.

(a) Visuel extrait de la sé-quence Machine Hall 1 d’Eu-RoC (Burri et al. 2016)

(b) Visuel extrait de Robex

(Vayugundla et al. 2018)

(c) Mosaïque de scènes

simu-lées par TartanAir (Wang et al.

2020)

Figure 4.2 – Exemples de visuels des environnements explorés ou simulés par des jeux de données

En effet, les distributions des bruits de mesures peuvent différer, certaines perturbations peuvent ne pas avoir été prises en compte, etc.