• Aucun résultat trouvé

Multi-corrélations ponctuelle sur Le Mans

Dans le document La recherche à l'IGN : activité 1999 (Page 69-72)

Analyse des classifications

C. Bilan des actions de recherche

C.1.7 Multi-corrélations ponctuelle sur Le Mans

Philippe Hottier

Le but général est l’étude de l’apport de la multi-corrélations (quatre clichés) dans un processus d’extraction de bâti ; dans la première phase, dont nous rendons compte sommairement ici, nous avons construit un corrélateur ponctuel et estimé sa précision. Les essais ont concerné une zone commune à quatre clichés de la couverture du Mans, (deux couples situés dans deux bandes parallèles).

La caméra est numérique : • focale 2644,63 pixels,

• format 2048 x 3071 pixels ; 1 pixel = 9µm, • altitude de vol = 950 m environ,

• pixel terrain = environ 40 cm,

• rapport b/h = 0,30 dans une bande, 0,43 de bande à bande ; 0,49 et 0,59 pour les couples diagonaux.

Le principe du corrélateur multi-épipolaire qui a été mis au point est le suivant : pour un point-image maître du cliché 1, on sélectionne sur chacune des trois épipolaires 2, 3 et 4, les dix meilleurs candidats image homologues d’où dix candidats 3-D.

On recherche ensuite pour les six combinaisons épipolaires (23, 32, 24, 42, 34, 43), en commençant par le meilleur candidat de la premiére épipolaire de chaque couple, le candidat le plus proche sur la seconde. On définit ainsi, en tout et au plus quatre points-image homologues sur chaque épipolaire, dont on prend la moyenne qui définit le point- image homologue du point-image maître sur cette épipolaire. On calcule ensuite la détermination 3-D finale, en compensant les quatre points-image, ou, autre option, en fixant le point-image maître.

Dans cette première phase, la recherche se fait, soit, sur une épipolaire, soit, sur l’épipolaire et deux droites parallèles distantes de l’épipolaire de 1 pixel. On poursuit ensuite, sur option, en procédant à un affinement subpixellaire 1-D ou 2-D, au pas de 1/3 ou 1/5 de pixel.

Les paramètres essentiels sont : la taille de la fenêtre (on s’est borné à étudier 7 x 7 ou 9 x 9), la tolérance inférieure sur le coefficient de corrélation de deux fenêtres (choisi par défaut, conformément aux règles statistiques classiques), la valeur maximale de l’écart acceptable entre deux déterminations 3-D correspondant à deux déterminations épipolaires différentes, et les choix recherchés sur une seule droite épipolaire ou trois, corrélation simple seulement ou corrélation simple suivie d’affinement subpixellaire (pas 1/3 ou 1/5), 1-D ou 2-D.

Deux méthodes d’estimation de la précision ont été proposées et utilisées sur une quinzaine de fichiers de points- image pointés à l’écran sous grossissement 5, (ces fichiers sont de deux types : points situés sur des éléments linéaires de contraste : points-sol sur bords de bandes blanches, points sur arêtes faîtières horizontales ; points sur bords de toits ; points à définition ponctuelle : points-sol extrémité de bandes blanches ; pignons).

La méthode des triplets permettant d’estimer la précision d’alignement des déterminations 3-D relatives à des triplets de points-image maître alignés, proches (distance inférieure, entre deux points, à trois-quatre pixels), situés sur des éléments linéaires de contraste et pointés à l’écran sous grossissement 5 ; les trois points-image maîtres fournissent alors par corrélation trois déterminations 3-D et donc une estimation de l’emq planimétrique et une estimation de l’emq altimétrique. Pour des triplets au sol (bandes blanches) et avec quatre clichés on obtient une précision planimétrique de 4-5 cm (emq planimétrique).

Pour l’emq en x ou en y divisé par 2 ) et de 7-8 cm en altimétrie ; pour des triplets choisis sur des arêtes faîtières horizontales dont la direction coupe franchement les épipolaires, la précision planimétrique est identique et la précision altimétrique légérement inférieure ; pour des triplets de points choisis sur des bords de toits coupant franchement les épipolaires la précision est évidemment moins bonne : la perte est en gros de 50%.

Fenêtre sub-pix emq’plani emq’alti acceptés emqplani emqalti σ0 7 x 7 1 / 1 3,9 6,1 105 / 107 4,1 / 4,3 12,8 / 13,8 0,14 - 1 / 3 3,2 6,7 - 3,7 / 3,8 10,1 / 11,3 0,10 - 1 / 5 3,0 6,4 - 3,7 / 3,9 9,0 / 9,8 0,10 9 x 9 1 / 1 3,8 6,1 - 4,7 / 5,0 13,2 / 16,8 0,19 1 / 3 3,5 7,9 - 3,8 / 3,9 11,4 / 13,0 0,14 - 1 / 5 3,2 7,5 - 3,9 / 4,2 10,7 / 13,1 0,17

Cent dix arêtes faîtières attaquant franchement les épipolaires ; emq’alti et emq’plani sont des estimations obtenues par la technique de la médiane, emqalti et emqplani les moyennes quadratiques des emq.

On a d’autre part calculé les écarts moyens quadratiques planimétrique et altimétrique entre déterminations 3-D relatives à deux configurations distinctes (après superposition par similtude des deux ensembles de points) : ce sont les suivants (329 points retenus sur 330) :

7 x 7 : (1/1 - 1/3) : ecmqplani = 4,7 cm ; ecmqalti = 15,0 cm, 7 x 7 : (1/3 - 1/5) : ecmqplan i= 1,6 cm ; ecmqalti = 5,7 cm, 9 x 9 : (1/3 - 1/5) : ecmqplani = 1,9 cm ; ecmqalti = 6,4 cm, 7 x 7 (1/1) - 9 x 9 (1/1) : ecmqplani = 2.4cm ; ecmqalti = 8,6 cm, 7 x 7 (1/3) - 9 x 9 (1/3) : ecmqplani = 2,7 cm ; ecmqalti = 8,5 cm, 7 x 7 (1/5) - 9 x 9 (1/5) : ecmqplani = 2,2 cm ; ecmqalti = 7,6 cm.

La méthode des quatre points-image permet d’apprécier la cohérence de quatre points-image homologues ; elle consiste à estimer les emq planimétrique et altimétrique des quatre déterminations 3-D obtenues en choisissant tour à tour chaque point-image comme point-image maître.

Sur un fichier de points-image corrélés visuellement sous grossissement 5 (moitié pignons de maisons, moitié extrémités de bandes blanches) on a trouvé ainsi 10 cm en altimétrie et 15 cm en planimétrie ; sur un fichier de points- image dont un seul pointé visuellement (les trois autres étant déterminés par corrélation automatique) on a trouvé 10 cm en altimétrie et 5 cm en planimétrie.

Médiocrité de la corrélation quand le point image maître (à gauche) est situé sur un élément linéaire de contraste quasi parallèle à l’épipolaire, grossissement 5.

Aucun problème quand l’ataque de l’épipolaire est franche.

Les résultats essentiels de l’étude sont les suivants :

• avec quatre clichés, l’exactitude locale maximale pour des points sur éléments linéaires de contraste au sol ou sur arêtes faîtières horizontales avec attaque franche de toutes les épipolaires est chiffrée par une emq planimétrique de 2,5 cm et une emq altimétrique de 6 cm ; ceci suppose l’emploi d’une fenêtre de taille supérieure ou égale à 5 et une corrélation subpixellaire. Pour des points sur bords de toit (toujours avec attaque franche des épipolaires), les estimations sont 4 cm pour la planimétrie et 12 cm pour l’altimétrie. Pour des points situés sur éléments linéaires de contraste coupant une épipolaire sous un angle faible, les emq sont de l’ordre de 6 cm en planimétrie et de 25 cm en altimétrie.

Pour des points à définition ponctuelle et dont les quatre points-image ont été pointés visuellement à l’écran sous grossissement 5, l’emq planimétrique peut être estimée à 12-14cm et l’emq altimétrique à 6-8 cm.

L’exactitude locale minimale (fenêtre 3 x 3 et corrélation simple) est caractérisée par une emq planimétrique de 9 cm et une emq altimétrique de 25 cm, ceci pour points sur éléments linéaires de contraste au sol ou sur arêtes faîtières horizontales avec attaque franche des épipolaires (§8g, 2 et 3). Pour points sur bords de toits, les emq sont un peu supérieures : 9,5 cm et 30 cm.

• Avec deux clichés :

• La perte de précision altimétrique peut être très sensible ; par exemple, pour points sur arêtes faîtières (fenêtre de taille supérieure à 3 et corrélation subpixellaire), de 7 cm on passe à 15-20 cm en couple horizontal ou vertical. On peut escompter au mieux 5 cm en planimétrie et 14 cm en altimétrie pour le rapport b/h = 0,59 (6cm, 19 cm pour b/h = 0,49).

Il est possible que la perte constatée soit due en partie à un systématisme résiduel d’étalonnage de la caméra. Par ailleurs, le taux d’échec même en fenêtre de taille supérieure à 5, s’accroît notablement : quand, pour des triplets, le taux d’acceptation avec quatre clichés est supérieur à 95% il baisse à 85-90% avec un couple. Bien entendu, pour des points situés sur des éléments linéaires de contraste faisant un angle faible avec l’épipolaire, la précision est particulièrement médiocre : on descend au mieux à 10 cm en planimétrie et 45-50 cm en altimétrie.

• L’emploi de la fenêtre 3 x 3 est calamiteux, non pas tant par la perte de précision pourtant très importante même en corrélation subpixellaire, que par le taux d’échec, qui cette fois, à la différence de la multi- corrélation avec quatre clichés, est considérable ; par exemple, pour un fichier de points-sol, soixante-dix triplets seulement sur cent dix ont été acceptés. Une autre manière de considérer la question est de superposer par similitude les déterminations 3-D issues de la configuration (quatre clichés + fenêtre 7 x 7 + corrélation subpixellaire) à celles issues d’une configuration (couple diagonal + fenêtre 3 x 3 + corrélation simple ou subpixellaire) : on trouve alors, pour le même fichier, cent soixante deux points sur trois cent trente dont l’écart est supérieur à un mètre. D’une manière générale, le taux d’échec estimé par la méthode précédente oscille entre 55% et 25%. Dans le cas de points situés sur bords de toits, beaucoup de ces échecs sont dus à de fausses corrélations : l’environnement radiométrique en fenêtre 3 x 3 est trop pauvre pour résoudre les ambiguïtés.

• La comparaison des résultats obtenus avec mise en place des clichés sur les éléments ORRI avec ceux mis en place sur les éléments de la compensation I (éléments fournis par la compensation de trois cents points pointés visuellement sous grossissement 5 sur les quatre clichés), semble montrer que la première est insuffisante : la perte d’exactitude (due au positionnement incorrect des épipolaires) peut être chiffrée en moyenne quadratique à 8 cm en planimétrie et 17 cm en altimétrie pour des fenêtres de taille supérieure à 3 et en corrélation subpixellaire.

• Pour les points situés sur des éléments linéaires de contraste, la recherche des points homologues doit se pratiquer uniquement (sauf s’il y a échec) sur l’épipolaire et non sur plusieurs droites situées de part et d’autre. En particulier, l’affinement (corrélation subpixellaire) doit être 1D et non 2D. À défaut, on observe pour les points sur arêtes faîtières ou sur bords de toit, une perte de précision très sensible (50 % en altimétrie), que ce soit avec quatre ou deux clichés, car avec un couple un point-image homologue choisi en dehors de l’épipolaire induit une variation de la parallaxe longitudinale (sauf si l’élément linéaire de contraste est perpendiculaire à l’épipolaire), et, avec quatre clichés une variation de la parallaxe longitudinale sur deux couples au moins. Cette perte de précision en affinement 2-D n’a pas été observée sur les points au sol, sans doute parce que leur environnement est beaucoup plus riche que celui de points sur arêtes faîtières.

Par contre pour des points à définition ponctuelle l’affinement 2-D est de loin préférable. • La qualité de la radiométrie a peu d’influence sur la précision des résultats.

• Le taux de réussite du corrélateur avec quatre clichés (il y a réussite si au moins un point-image homologue a été trouvé) est voisin de 100% en fenêtre 7 x 7 ou 5 x 5, mais tombe à 92% en fenêtre 3 x 3. Le taux de tri- déterminations est de 90% et le taux de mono-déterminations de 6 % (63% et 20% en fenêtre 3 x 3).

Avec deux clichés, le taux de réussite reste toujours voisin de 100%, en fenêtre 7 x 7, mais tombe à 82% en fenêtre 3 x 3.

Avec quatre clichés, le taux de validité (pour des triplets de points-image maître situés sur des éléments linéaires de contraste), c’est-à-dire le pourcentage de triplets acceptés, est voisin de 100% pour des points sur arêtes faîtières horizontales et quelque soit la taille de la fenêtre ; mais pour des points sur bords il chute à 88%.

Avec deux clichés, le taux de validité chute : pour le couple diagonal (b/h = 0,59), et pour des points sur arêtes faîtières il est de 85/90% en fenêtre de taille supérieure à 3, de 60% en fenêtre 3 x 3.

Pour des points sur bords, il est de 70% en 7 x 7, de 55% en 5 x 5 et 40% en 3 x 3. Avec le couple horizontal (b/h = 0,43), on observe un taux de validité de l’ordre de 90%, quelle que soit la fenêtre pour des points sur arêtes faîtières et de 70% pour les points sur bords.

Il semble y avoir un systématisme résiduel d’étalonnage de la caméra très régionalisé pouvant atteindre 0,3 pixel en amplitude ; nous n’avons pas pu prouver son existence. Il se trouve qu’il reste transparent dans presque tous les essais. De même que la question des déformations du modèle perspectif induites par une orientation relative insuffisante, il conviendrait de l’étudier soigneusement, en tout cas si on désire obtenir sur l’ensemble d’un couple une exactitude homogène. Les 2,5 cm en planimétrie et les 6 cm en altimétrie que nous avons obtenus, ne reflètent en effet qu’une exactitude locale (sans doute valable sur toute l’étendue d’un bâtiment moyen d’emprise 25 x 25 m).

Si on ne maîtrise pas dans l’avenir ces deux causes de systématisme, on risque de constater, en superposant des bâtiments issus, par exemple, de couples différents, une translation aléatoire propre à chaque bâtiment pouvant dépasser la vingtaine de centimètres.

Référence

[HOTTIER 99] Ph. Hottier : Multi-corrélation ponctuelle et précision sur Le Mans (caméra numérique, résolution m, focale 2700 pixels), rapport, laboratoire MATIS, IGN-SR 990029/C-RAP, novembre 1999.

C.1.8 Reconstruction du bâti pour la cartographie à grande échelle

Patrick Julien

Travaux effectués

Restitution de bâtiments sous forme de modèles 3-D ajustés par corrélation d'ortho-imagettes.

On rappelle que le principe de la restitution d'un bâtiment (dans un couple stéréoscopique de photographies) consiste à ajuster un modèle 3-D du bâtiment, en cherchant à maximiser la ressemblance entre deux imagettes redressées à l'aide de ce modèle, ou ortho-imagettes.

L'ajustement suppose de connaître un modèle approché, qu'on améliore par petites retouches des différents paramètres du modèle, jusqu'à ce que la ressemblance ne puisse plus être accrue.

Les essais des années précédentes ont déjà montré que la méthode fonctionne raisonnablement lorsque le modèle approché est obtenu à l'aide d'un pointé à l'écran, en circonscrivant le bâtiment par un rectangle dans chaque photographie.

Dans le but de supprimer le pointé à l'écran, on a d'abord tenté en 1999 d'utiliser les bâtiments figurant sur la carte à 1 : 25 000, numérisée et vectorisée, l'altitude étant donnée par la base de données altimétriques IGN.

Cette approche ne semble pas viable pour les raisons suivantes : sur la zone-test d'Altkirch, une majorité de bâtiments visibles sur les photographies (1 : 30 000, numérisées à la résolution-sol 0,50 m) ne figurent pas sur la carte ; ensuite, parmi ceux, figurant sur la carte, seulement une minorité sont de forme rectangulaire, conformes à notre modèle 3-D ; pour ceux-ci, leur emprise est souvent trop grande à cause de la généralisation, et décalée, donnant un modèle 3-D approché trop imprécis.

On a ensuite tenté d'extraire sur la même zone-test les modèles 3-D approchés d'un MNE fabriqué au laboratoire MATIS. Ce MNE donne des modèles 3-D encore trop imprécis pour l'état actuel de notre méthode ; mais on ne peut pas pour l'instant conclure à une impossibilité par cette approche.

On a optimisé le calcul des ortho-imagettes, en ne calculant, lorsqu'on fait varier un peu un paramètre, que les parties modifiées des deux ortho-imagettes : division du temps de calcul par un facteur 2,5 - 3. On a aussi introduit une maximisation par groupes de paramètres, ce qui permet d'explorer un espace de possibilités plus grand, et donc d'autoriser des modèles 3-D moins précis.

Toujours sur la zone-test d'Altkirch, on a restitué, via un pointé à l'écran, un total de cent quarante deux bâtiments, dont quatre-vingt deux conformes à notre modèle 3-D (modèle à neuf paramètres : x,y du centre maison, z du pied maison, longueur l, largeur k, hauteur gouttière h, angle d'orientation a, hauteur de la toiture t, forme du toit f).

Une analyse visuelle des bâtiments superposés aux photographies montre que soixante-seize sur les quatre-vingt deux ont une orientation et une forme satisfaisante.

Dans le document La recherche à l'IGN : activité 1999 (Page 69-72)