• Aucun résultat trouvé

8 .2 Perspectives ouvertes à la suite des travaux menés

À la suite de cette brève synthèse des travaux présentés, il semble raisonnable de se questionner sur les problèmes laissés ouverts et qu’il serait souhaitable d’aborder dans un avenir plus ou moins proche. D’autres perspectives n’ayant pas été abordées dans ce manuscrit sont également présentées. Les pistes de travail ouvertes ont été schématiquement classées suivant les trois domaines de recherche abordés dans le présent mémoire :

– la falsification des images et la criminalistique numérique ; – la modélisation des images naturelles ;

– la théorie de la décision et de l’estimation statistique.

Perspectives ouvertes dans le domaine de la criminalistique des images

L’approche statistique proposée pour la détection d’informations cachées ouvre plu-sieurs perspectives, aussi bien dans le domaine restreint de la stéganalyse que dans le domaine plus vaste de la criminalistique des images.

– Tout d’abord, dans le prolongement direct des travaux proposés, il est envisa-geable d’exploiter l’aspect tri-chromatique des images naturelles usuelles pour la détection d’informations cachées. Dans le cadre des présents travaux, les images couleurs sont analysées comme autant d’images en niveaux de gris et la corréla-tion forte existante entre les différents canaux n’a pas été utilisée.

– Dans le même esprit, l’application de la théorie de l’estimation statistique pour la stéganalyse quantitative (en vue de l’estimation du taux d’insertion) est une piste envisageable. Ces travaux ne sont toutefois pas dans un prolongement directe car les critères de performance d’un estimateur sont différents (biais et variance notamment) et la comparaison avec un estimateur optimal atteignable n’est pas simple ; borner le plus précisément possible la variance ou l’EQM d’un estimateur demeure un problème ouvert.

– Toujours dans la suite des travaux de détection d’informations cachées, il pourrait être envisagé d’étendre l’approche proposée aux images naturelles compressées, au format JPEG notamment. Il est par exemple imaginable de proposer le détec-teur optimal au sens de Neyman-Pearson lorsque les paramètres de distribution statistique des coefficients DCT sont connus, et, lorsque ces paramètres ne sont pas connus, de proposer un détecteur dont la perte de puissance est bornée. – Dans le domaine plus vaste de la criminalistique des images, il est envisageable à

court terme d’appliquer la méthodologie proposée (pour la détection d’informa-tions cachées dans les LSB) à la détection de différentes manipulad’informa-tions des images.

La détection de photomontage [187], par exemple, n’a pas encore été abordée

dans la littérature sous la forme d’un test entre deux hypothèses statistiques ou en considérant le respect d’une contrainte sur le taux de fausse alarme.

– Enfin, dans le domaine de la criminalistique des images, des travaux de recherche ont été proposés [188], visant à identifier l’appareil utilisé pour capturer une photo donnée ou à déceler si deux images proviennent d’un même appareil. Là encore, une approche statistique permettant d’établir le caractère optimal d’un test ou le respect d’une contrainte sur la probabilité de fausse alarme serait très originale.

Perspectives ouvertes dans le domaine de la modélisation des images

L’exploitation d’un modèle des images naturelles reposant sur la physique de la scène imagée et du système d’acquisition est une approche originale dans le domaine du traitement des images. Dans ce domaine, il serait intéressant de justifier physiquement certaines propriétés des images empiriquement observées.

– Le modèle statistique proposé pourrait par exemple permettre de justifier formel-lement la distribution des coefficients DCT (usuelformel-lement modélisée par une loi Laplacienne [20]) et la distribution des coefficients de transformée en ondelettes

discrètes (usuellement modélisée par une loi Normale généralisée [189]).

– Le modèle déterministe des images proposé pourrait être étendu pour permettre de prendre en compte l’aspect bi-dimensionnel des images. Quelques

difficul-tés fondamentales, esquissées dans la section5.1, demeurent à surmonter.

Néan-moins, la parcimonie du modèle serait accrue en conséquence. On peut en outre imaginer, par exemple, un grand pratique pour la description de contenu des images.

Perspectives ouvertes dans la théorie de l’estimation et de la décision statis-tiques

Le problème de détection d’informations cachées à partir d’observations quantifiées est abordé d’un point de vue purement statistique dans le chapitre3et dans [23]. Cette approche a permis de mettre en évidence plusieurs difficultés fondamentales, liées à la quantification des données, dans l’application de la théorie de la décision statistique. Ces problèmes soulevés sont autant de perspectives de futurs travaux potentiels.

– Fondamentalement, l’impact de la quantification des observations sur les perfor-mances d’un test statistique entre hypothèses simples n’a pas été formellement

établi. Or, comme le montrent les résultats présentés dans le chapitre3, les

pro-babilités d’erreurs d’un test peuvent être impactées de manière importante par la quantification.

– De manière analogue, l’impact de la quantification sur les performances d’un estimateur statistique n’a pas été formellement établi.

– Le théorème de Gauss-Markov n’est par exemple pas applicable à des observa-tions quantifiées. Il serait intéressant de “mesurer“ l’impact de la quantification sur l’estimation de paramètres intervenant de façon linéaire. Cela aurait notam-ment une application dans le cadre d’un test statistique en présence d’un para-mètre de nuisance à partir d’observations quantifiées ; dans la continuité de [190], par exemple.

Enfin, suite aux travaux présentés, mon Saint-Graal serait d’exploiter la modélisa-tion proposée des images naturelles dans le but de détecter toute image qui aurait su-bie une manipulation quelconque (ou, en étant plus réaliste, une manipulation d’une classe donnée). L’idée serait alors de concevoir un test visant à décider entre les deux

hypothèses suivantes H0 = {Zest une image naturelle non-modifiée} vs H1 =

{Zest une image naturelle modifiée}. Le formalisme statistique de ces hypothèses

n’a pas encore été clarifié et, d’un point de vue statistique, ce test s’apparenterait da-vantage à la détection d’une anomalie quelconque abordée dans le cadre du traitement

8.3 Conclusion

Les travaux menés durant ses trois années de doctorat ont permis de faire un pre-mier pas vers l’application de la théorie de la décision statistique pour la détection d’informations cachées, et plus largement pour la criminalistique numérique. Les diffi-cultés soulevées sont nombreuses : d’une part, le problème statistique est complexe (en raison de la quantification, d’hypothèses composites et de la présence de paramètres de nuisance, etc. . . .) et, d’autre part, la modélisation des images est complexe compte-tenu de la structure particulière des ces objets (présences de courbes de discontinuités, système optique non-stationnaire, etc. . . .).

La pertinence de méthodologie proposée, consistant à étudier le problème sous un angle purement statistique et à développer un modèle des images naturelles adapté à une exploitation dans ce cadre, est confirmée par des résultats numériques encoura-geants. Ces résultats confirment en outre que la méthodologie proposée permet fina-lement de répondre de manière satisfaisante aux contraintes exigée par le projet ANR RIC dans lequel s’inscrivent ces travaux.

Il nous faut enfin souligner que les travaux présentés ouvrent également de nom-breuses perspectives aussi bien dans le domaine de la théorie de la décision statistique, dans le domaine de la modélisation des images et, entre les deux, dans le domaine de la criminalistique numérique :

A

Éléments de la théorie de la décision et de