• Aucun résultat trouvé

9.2 Analyse des coûts de production

9.2.1 La composition de l’historique

Un premier critère que nous mettons en avant concerne les données disponibles dans l’historique. Au cours des travaux, nous avançons la possibilité d’exploiter des données hétérogènes pour contourner la dépendance aux données de référence. Dans cette catégorie nous considérons huit points d’intérêt :

1. Nombre de domaines Source disponibles (NbDom).

2. Séries temporelles (ST) : exprime la nécessité de disposer de l’information spatiale des images de la série temporelle d’un domaine de l’historique.

3. Données de référence (DRef) : uniquement pour les domaines de l’historique. On accède ici aux étiquettes avec leurs positions géographiques.

4. Échantillons d’apprentissage(EApp) : sous la forme d’une base de données, permettant d’entraîner un nouveau classifieur. On accède ici à des points pour lesquels ont dispose des étiquettes et des primitives, donc nous n’avons pas besoin des images.

5. Classifieurs : ceux utilisés pour produire des cartes supervisées (déjà entraînés). 6. Cartes d’OCS : produites par classifications supervisées.

7. Une ou plusieurs matrices de transition : pouvant provenir d’une source quelconque

8. Autres informations susceptibles d’améliorer la méthode concernée (Autres) : intervention de l’utilisa- teur, connaissances a priori, etc.

Nous utilisons la table9.1 pour synthétiser les différentes méthodes et leurs liens avec ces critères. Nous utilisons une note fixée entre 0 et 5 pour représenter la dépendance de la méthode (en ligne) vis-à-vis d’un critère (en colonne). Une valeur nulle implique qu’il n’y a aucune dépendance entre ces éléments, à l’inverse la note maximale implique une forte contrainte sur la composition de l’historique. Par conséquent, un score faible est préférable à un score élevé. Pour compléter cette table nous considérons uniquement la nécessité de disposer dans l’historique des données en question, cela ne concerne pas les données de la période courante (domaine Cible). Ainsi, la classification supervisée, qui n’exploite aucune donnée de l’historique, possède une valeur totale de dépendance nulle.

La classification naïve représente la méthode la moins dépendante de l’historique. En effet, le nombre de domaines de l’historique n’a pas d’impact puisque nous n’avons besoin que d’un domaine Source. Par contre,

Table 9.1 : Évaluation des méthodes selon le critère de composition de l’historique.

Méthode Nb dom ST D Ref Ech Classifieur Carte OCS MT Autres Score

Supervisé 0 0 0 0 0 0 0 0 0 Naïf 1 0 0 0 5 0 0 0 6 TO 1 2 5 5 0 3 0 3 19 ACC 1 5 0 0 0 0 0 3 9 MAJ 5 0 3 0 0 4 5 3 20 VM, VC, VP 5 0 0 0 5 0 0 0 10

Correction non décision 5 0 3 0 0 4 5 3 20

Dempster-Shafer 3 5 0 0 5 0 0 0 13

Classifieur Unique 3 0 0 5 0 0 0 0 8

Classifieur Bayésien 3 0 2 0 5 4 5 3 22

la disponibilité du classifieur constitue une forte contrainte. En effet, si le classifieur n’est pas disponible, cela implique de réaliser de nouveau toute la phase d’apprentissage pour le domaine Source.

Le TO et la projectionACCpossèdent la même contrainte de dépendance vis-à-vis du nombre de domaines Source disponibles. Cependant, l’ACC requiert obligatoirement la disponibilité de l’intégralité de la série temporelle du domaine Source afin d’estimer les matrices de projection. Nous attribuons la note médiane pour la catégorie “Autres” car des techniques non-utilisées ici pourraient améliorer l’estimation de l’ACC, par exemple une mise en correspondance des pixels de mêmes classes, sans tenir compte de leur position dans l’image. À l’inverse, le TO dépend moins de l’accessibilité à la série temporelle, car nous pouvons imaginer une technique de sélection d’échantillons exploitant les séries temporelles, comme une détection de changements par exemple. L’accès aux échantillons d’apprentissage du domaine Source demeure obligatoire, car nous les utilisons pour entraîner le classifieur après TO. Il en est de même pour la disponibilité des données de référence utilisées pour sélectionner les échantillons des classes pérennes dans le domaine Cible. Nous laissons l’opportunité à des facteurs extérieurs qui permettrais d’améliorer les performances, par exemple étiqueter une partie des échantillons du domaine Cible via une technique d’apprentissage actif.

Les classifications naïves et après TO constituent les données d’entrée des fusions présentées dans la deuxième partie des travaux de thèse. La conception des systèmes de fusion utilisée amène à additionner les dépendances de chaque système avec le score des entrées utilisées. Par exemple, utiliser l’ACC impose une contrainte maximale vis-à-vis de la disponibilité de toutes les séries temporelles des domaines exploités.

Pour les systèmes de fusion nous évaluons la dépendance vis-à-vis du nombre de domaines Source dis- ponibles en fonction des performances observées. Ainsi, une forte contrainte associe le VM et le nombre de votants, car pour le cas 2 la quantité de non-décisions représente un problème majeur pour l’exploitation. Globalement, le nombre de votants impacte toutes les performances des votes majoritaires pondérés (VC et VP). Cependant, ces trois votes ne requièrent que l’accès aux classifieurs pour générer les votants (dans le cas de la classification naïve) ce qui le place en première position des systèmes de fusion.

En effet, la fusion par Dempster-Shaffer requiert la disponibilité des séries temporelles des domaines Source afin d’estimer les performances moyennes obtenues par le classifieur sur le reste de l’historique, et par conséquent de réaliser la classification de ceux-ci. Cette contrainte augmente donc son score de dépendance. L’exploitation de la MT contraint l’accès aux cartes d’OCS de l’historique afin de générer la clef de transi- tion. Cependant le score n’est pas maximal, car le nombre de cartes exploitées dépend de la taille de la clef de transition, et non pas de celle de l’historique. Cette dépendance augmente fortement le score de dépendances

des méthodes exploitant la MT : classifieur bayésien, méthode de correction des non-décisions, mise à jour de la carte (MAJ). De plus nous avons ajouté un score “Autres” pour ces méthodes, car l’amélioration de la MT que ce soit pour son estimation ou son exploitation permet d’améliorer les performances. Certaines méthodes, notamment la fusion bayésienne, peuvent être exploitées sans toutes les données. Ici, nous présen- tons le coût dans le cas où toutes les données d’entrée possibles sont utilisées. Ainsi, nous considérons que la fusion bayésienne exploite les cartes supervisées, la matrice de transition et les probabilités a priori. Selon ces critères, le classifieur bayésien représente la méthode la plus dépendante et la classification naïve la plus libre.