• Aucun résultat trouvé

St´eganalyse par deep learning Pr´esentation d’´equipe

N/A
N/A
Protected

Academic year: 2022

Partager "St´eganalyse par deep learning Pr´esentation d’´equipe"

Copied!
37
0
0

Texte intégral

(1)

St´ eganalyse par deep learning

Pr´esentation d’´equipe

Doctorant: Mehdi Yedroudj Encadrants: Marc Chaumont

Frederic Comby

13/07/2018

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 1 / 37

(2)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

(3)

Introduction

St´eganographie Vs. St´eganalyse

St´eganographie: est l’art de dissimuler des messages secrets. Cela consiste

`

a cacher un message au sein d’un support num´erique.

St´eganalyse: a pour objectif de d´etecter la pr´esence de donn´ees dissimul´ees `a l’aide d’un algorithme st´eganographique.

Concept g´eneral de la st´eganographie et de la st´eganalyse

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 3 / 37

(4)

Exemple de st´ eganographie

Les images, cover/stego devraient ˆetre similaires (stego'cover).

Seul le r´ecepteur peut extraire le message grˆace `a la cl´e secr`ete partag´ee (´emetteur - r´ecepteur).

Exemple d’insertion avec S-UNIWARD `a 0.4 bpp

Doctorant: Mehdi Yedroudj

(5)

Les approches de st´ eganalyse

Approches bas´ees apprentissage automatique [1,2] vs Approches bas´ees apprentissage profond[3].

[1]:J. Kodovsk’y, J. Fridrich, and V. Holub, “Ensemble Classifiers for Steganalysis of Digital Media”,2012 [2]:J. Fridrich and J. Kodovsk’y, “Rich Models for Steganalysis of Digital Images,”2012

[3]:G. Xu, H. Z. Wu, and Y. Q. Shi, “Structural Design of Convolutional Neural Networks for Steganalysis”,2016 Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 5 / 37

(6)

Deep Learning(L’apprentissage profond)

L’apprentissage profond: Ensemble de m´ethodes d’apprentissage automatique qui utilise des r´eseaux de neurones artificiels..

Ces repr´esentations sont compos´ees de trois parties que l’on appelle des couches qui sont elles mˆeme compos´ees de neurones.

Doctorant: Mehdi Yedroudj

(7)

CNN ´ evolution pour la st´ eganalyse

jan juin jan

EI EI

juin jan juin dec

2015 2016 2017

Qian et al. [Tan]

EI’2015 1st description CNN

Pibre et al.

[Chaumont]

EI’2016 Same key

Xu et al. [Shi]

IEEE Sig. Proc. Letters The first reference network (near AlexNet)

Xu et al. [Shi]

IH&MMSec’2016 Ensemble version

Qian et al. [Tan]

ICIP’2016 Transfer learning IH&MMSec ICIP

Ye et al. [Yi]

TIFS’2017 A new reference network

S. Tan and B. Li Asia-Pacific’2014 Stacked auto-encoder

Tang et al. [Li]

IEEE Sig. Proc. Letters Embedding with GAN Zeng et al. [Huang]

EI’2017 JPEG: Large Scale

Chen et al. [Fridrich]

IH&MMSec’2017 JPEG: ad hoc topology

IH&MMSec EI

Xu IH&MMSec’2017 JPEG: Res-Net

Zeng et al. [Huang]

TIFS’2018 JPEG: Large Scale

SPATIAL

JPEG

GAN

Marc Chaumont, " The emergence of Deep Learning in steganography and steganalysis (in the period 2015 - 2017) “, Tutorial given at a research day in France, the 16th of January 2018, Poitiers, France, 2018 DOI 10.13140/RG.2.2.35080.32005.

http://www.lirmm.fr/~chaumont/publications/Emergence_of_Deep_Learning-Tutorial_Meeting-France-CHAUMONT_16_01_2018.pdf Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 7 / 37

(8)

Architecture de notre r´ eseau

Yedroudj-Net

Nouveau CNN qui rassemble les parties les plus efficaces des CNN r´ecents.

Objectif: Am´eliorer les performances par rapport `a l’´etat.

Les parties importantes de cette architecture propos´ee sont:

Une banque de filtres passe-haut pour le pr´e-traitement ”SRM [1]”.

Une fonction d’activation troncature (HardTanh) [4].

Une normalisation par lots coupl´ee avec une couche de mise `a ´echelle [5][9].

[1]:J. Kodovsk’y, J. Fridrich, and V. Holub, “Ensemble Classifiers for Steganalysis of Digital Media”,2012 [4]:J. Ye, J. Ni, and Y. Yi, “Deep Learning Hierarchical Representations for Image Steganalysis,” 2017.

[5] S. Ioffe and C. Szegedy, “Batch normalization: Accelerating deep network training by reducing internal covariate shift,” 2015.

[9] K. He, X. Zhang, S. Ren, and J. Sun, “Deep residual learning for image recognition,” 2016.

Doctorant: Mehdi Yedroudj

(9)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 9 / 37

(10)

Filters

High-pass filters

- M´ethodes de st´eganalyse classiques: Pr´etraiter les images avec un seul filtre passe-haut pour extraire les r´esidus de composante de bruit [1].

- Dans notre m´ethode: Utiliser une banque de filtres passe-haut compos´ee de 30 noyaux. Dans notre CNN, nous l’appelons le bloc de pr´e-traitement.

[1]:J. Kodovsk’y, J. Fridrich, and V. Holub, “Ensemble Classifiers for Steganalysis of Digital Media”

[4]:J. Ye, J. Ni, and Y. Yi, “Deep Learning Hierarchical Representations for Image Steganalysis,” 2017.

Doctorant: Mehdi Yedroudj

(11)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 11 / 37

(12)

Batch Normalization & Scale

Batch Normalization

BN(X, γ, β) =β+γ√X−E[X]

Var[X]+,[3][5]

Doctorant: Mehdi Yedroudj

(13)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 13 / 37

(14)

Activation function: Truncation

Yedroudj-Net:

On adopte la fonction d’activation non-lin´eaire Troncature (HardTanh) sur la premi`ere et la seconde couche. Cette fonction est utilis´ee pour limiter la plage de valeurs de donn´ees et empˆecher les couches plus profondes de mod´eliser de grandes valeurs [4].

Trunc(x) =





-T, x <−T, x, −T ≤x ≤T, T, x >T.

Doctorant: Mehdi Yedroudj

(15)

Architecture de notre r´ eseau

L’architecture de notre CNN propos´ee ”Yedroudj-Net”

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 15 / 37

(16)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

(17)

Protocole et configuration

Clairvoyant protocole

On garde le sc´enario classique:

Redimensionner les 10000 images de BOSSBase de 512 * 512 `a 256 * 256,

Utiliser les deux algorithmes WOW [5] et S-UNIWARD [6] pour g´en´erer des stegos(Matlab Version),

S´electionner 5000 paires pour l’apprentissage dont 1000 paires pour la validation,

Utiliser les 5000 paires qui restent comme un ensemble de test pour

´

evaluer le mod`ele obtenu.

[5] V. Holub and J. Fridrich, “Designing Steganographic Distortion Using Directional Filters,” 2012.

[6] V. Holub, J. Fridrich, and T. Denemark, “Universal Distortion Function for Steganography in an Arbitrary Domain,”, 2014.

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 17 / 37

(18)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

(19)

Discussion sur les r´ esultats

Probabilit´e d’erreur de Yedroudj-Net, Xu-Net, Ye-Net et SRM + EC contre deux algorithmes d’insertion WOW et S-UNIWARD `a 0,2 bpp et 0,4 bpp.

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 19 / 37

(20)

Discussion sur les r´ esultats

Influence de l’augmentation de base: (Probabilit´e d’erreur)

BOSS+BOWS2: 14 000 pairs.

BOSS+VA: 32 000 pairs.

WOW 0.2 bpp S-UNI 0.2 bpp

BOSS 27.8% 36.7 %

BOSS+VA 24.2 % 34.8 %

BOSS+BOWS2 23.7 % 34.4%

Probabilit´e d’erreur de Yedroudj-Net, sur WOW/S-UNIWARD ´a 0,2 bpp avec et sans augmentation des donn´ees.

Doctorant: Mehdi Yedroudj

(21)

Conculsion

On a propos´e une approche efficace bas´ee sur l’apprentissage profond (CNN) pour la st´eganalyse qui surpasse l’´etat de l’art.

Notre r´eseau permets d’obtenir de meilleurs r´esultats par rapport aux autres mod`eles de CNN avec et sans mesures suppl´ementaires (augmentation de la base d’entraˆınement).

Notre CNN a moins de variables `a apprendre et donc moins de temps pour converger

Pour une augmentation efficace pouvons-nous am´eliorer encore plus la pr´ecision de la d´etection?

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 21 / 37

(22)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

(23)

Quelques observations:

Les CNN actuels (st´eganalyse spatiale ou JPEG) donnent des r´esultats similaires ou mˆeme meilleurs que les EC + RM,

Les CNN ont besoin de beaucoup d’´echantillons lorsqu’ils sont utilis´es

`

a des fins de st´eganalyse (au moins 5 000 paires, peuvent atteindre des millions),

Chaque fois que la distribution cible est modifi´ee, le processus d’apprentissage doit ˆetre refait.

Probl`eme:

En ”monde r´eel sc´enario” l’ensemble d’apprentissage peut ˆetre tr`es petit (0, 10, 100, ..).

Question: Comment faire face `a un apprentissage de bas r´egime?

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 23 / 37

(24)

Solutions actuelles pour am´ eliorer l’efficacit´ e de CNN pour la st´ eganalyse

Virtual Augmentation [Krizhevsky 2012]

Transfer Learning [Qian et al. 2016], Ensemble of CNN [Xu et al. 2016],

Apprendre sur des millions d’images? [Zeng et al. 2018],

Utiliser de nouveaux r´eseaux (Res-Net, dense-net..) [Yedroudj et al.

2018], ...

...

Augmenter la base de donn´ees ...

”ImageNet Classification with Deep Convolutional Neural Networks”, A. Krizhevsky, I. Sutskever, G. E. Hinton, NIPS’2012,

”Learning and transferring representations for image steganalysis using convolutional neural network”, Y. Qian, J. Dong, W.

Wang, T. Tan, ICIP’2016,

”Ensemble of CNNs for Steganalysis: An Empirical Study”, G. Xu, H.-Z. Wu, Y. Q. Shi, IH&MMSec’16,

”Large-scale jpeg image steganalysis using hybrid deep-learning framework”, J. Zeng, S. Tan, B. Li, J. Huang, TIFS’2018,

”Deep Learning Hierarchical Representations for Image Steganalysis,” J. Ye, J. Ni, and Y. Yi, TIFS’2017,

”Yedroudj-Net: An Efficient CNN for Spatial Steganalysis”, M. Yedroudj, F. Comby, M. Chaumont, Under submission, 2018.

Doctorant: Mehdi Yedroudj

(25)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 25 / 37

(26)

R´ esultats exp´ erimentaux

”Data augmentation” protocole En partant du protocole classique:

Ajouter des paires (cover/stego) des autres bases

(BOWS2,LIRMM2,BOSS2.0) `a l’ensemble d’entraˆınement (protocole Clairvoyant).

Utiliser les 5000 paires du test pour ´evaluer le mod`ele obtenu.

PS: Diff´erentes m´ehodes ont ´et´e test´es pour augmenter la base la rotation, retournement, mise `a l’´echelle et mˆeme des diff´erentes interpolations pour le redimensionnement.

Doctorant: Mehdi Yedroudj

(27)

Analyse des r´ esultats (Enrichissement contre-productif)

Configuration: Enrichissement avec d’autres cam´eras (Probabilit´e d’erreur):

Training set BOSS+LIRMM = 14 000 pairs.

WOW 0.2 bpp S-UNIWARD 0.2 bpp

BOSS 27.8% 36.7%

BOSS+LIRMM 29.9 % 38.6 %

Configuration: Enrichissement avec des sources fortement dissemblables avec des proportions d´es´equilibre (Probabilit´e d’erreur):

BOSS + PLACES2 1% = 14 000 pairs; BOSS + PLACES2 10% = 104 000 pairs; BOSS + PLACES2 100% = 1 004 000 pairs.

WOW 0.2 bpp S-UNIWARD 0.2 bpp

BOSS 27.8% 36.7%

BOSS+PLACES2 1% 34.2 % 41.6 % BOSS+PLACES2 10% 40.0 % 43.9 % BOSS+PLACES2 100% 44.6 % 45.3 % Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 27 / 37

(28)

Analyse des r´ esultats (Enrichissement productif)

Configuration: Enrichissement avec des cam´eras ”similaires”

(Probabilit´e d’erreur): BOSS+BOWS2: 14 000 pairs.

WOW 0.2 bpp S-UNIWARD 0.2 bpp

BOSS 27.8% 36.7%

BOSS+BOWS2 23.7 % 34.4%

Configuration: Les mˆemes images RAW mais des d´eveloppements diff´erents (Probabilit´e d’erreur): BOSS+all-DEV: 44 000 pairs.

WOW 0.2 bpp S-UNIWARD 0.2 bpp BOSS+all-DEV 23.0 % 33.2 %

Doctorant: Mehdi Yedroudj

(29)

Analyse des r´ esultats (Enrichissement productif)

Configuration: Les mˆemes images RAW mais des d´eveloppements diff´erents (Probabilit´e d’erreur):

WOW 0.2 bpp S-UNI 0.2 bpp

BOSS 27.8% 36.7%

BOSS+DEV:Res-Bicub 25.7 % 37.5 % BOSS+DEV:Res-Spline 26 % 35.8 % BOSS+DEV:Res-NoInt 25.6 % 36.2 % BOSS+DEV:Crop 34.8 % 44.2 % BOSS+DEV:Res-Crop 28.1 % 37.9 % BOSS+BOSS-ALP 26.0 % 35.5%

Augmentation virtuelle ...: BOSS+BOWS2+VA: 112 000 pairs.

WOW 0.2 bpp S-UNIWARD 0.2 bpp

BOSS+VA 24.2 % 34.8 %

BOSS+BOWS2+VA 20.8 % 31.1 %

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 29 / 37

(30)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

(31)

Conculsion

Pour une augmentation efficace de la base de donn´ees deux options sont propos´ees:

Produire de nouvelles images en utilisant les mˆemes cam´eras et le mˆeme d´eveloppement que la base d’origine,

Avoir un acc`es aux images RAW originales et les utiliser pour produire de nouvelles images avec des d´eveloppements similaires,

XAugmentation automatique de la base en utilisant un GAN (Cela ne marche pas encore).

Travail futur:

Essayer un ensemble de Yedroudj-Nets,

Utiliser un GAN pour faire de la st´eganographie.

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 31 / 37

(32)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

(33)

C’est quoi les GANs ?

L’architecture g´en´erale du GAN

[8] Goodfellow, Ian, et al. ”Generative adversarial nets.” Advances in neural information processing systems. 2014.

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 33 / 37

(34)

Plan

1 Introduction / ´Etat de l’art

2 M´ethode propos´ee Filters

Batch Normalization & Scale Activation function: Truncation

3 R´esultats exp´erimentaux Protocole et configuration Discussion sur les r´esultats

4 Data augmentation

St´eganalyse dans le monde r´eel R´esultats exp´erimentaux Conclusion

5 GAN (generative adversarial networks) Generative Adversarial Networks GANs pour la st´eganalyse

Doctorant: Mehdi Yedroudj

(35)

DAGAN pour la st´ eganalyse ?

Illustration de la premi`ere ´etape : l’apprentissage et la validation du mod`ele

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 35 / 37

(36)

DAGAN pour la st´ eganalyse

Illustration de la deuxi`eme ´etape : la g´en´eration de nouvelles images

Doctorant: Mehdi Yedroudj

(37)

Thank you! Q&R

Doctorant: Mehdi Yedroudj

Encadrants: Marc Chaumont Frederic Comby

St´eganalyse par deep learning 13/07/2018 37 / 37

Références

Documents relatifs

Second, a novel convolutional sketching filter that produces sketches similar to those drawn by designers during rapid prototyping and third, a comprehensive paired

As a remedy to such problem, we propose to use the generative models which were proposed by Ian Goodfellow and al in [1] providing the AI world with a new class of Deep Learning

We then present its fully- convolutional variation, Spatial Generative Adversarial Networks, which is more adapted to the task of ergodic image generation.. 2.1 Generative

However, in the domain of materials science, there is a need to synthesize data with higher order complexity compared to observed samples, and the state-of-the-art cross-domain GANs

Our work falls into the category of text to image CGANs [13, 16], where we explore the possibility of obtaining good multimodal representations from the discriminator, while using

Our goal is similar (reproducing pedestrian motion at the full trajectory level), but our approach is different: we learn the spatial and temporal properties of complete

2 In that regard, MD-GAN do not fully comply with the parameter server model, as the workers do not compute and synchronize to the same model architecture hosted at the server. Yet,

We presented the VS task for refining the final grasping pose prior to grasp to address the challenges linked to final gripper pose, reported in literature related to transfer