• Aucun résultat trouvé

Agrégation incomplète des estimateurs à seuillage dur

N/A
N/A
Protected

Academic year: 2021

Partager "Agrégation incomplète des estimateurs à seuillage dur"

Copied!
4
0
0

Texte intégral

(1)

HAL Id: inria-00386563

https://hal.inria.fr/inria-00386563

Submitted on 22 May 2009

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Agrégation incomplète des estimateurs à seuillage dur

Yuri Golubev

To cite this version:

Yuri Golubev. Agrégation incomplète des estimateurs à seuillage dur. 41èmes Journées de Statistique,

SFdS, Bordeaux, 2009, Bordeaux, France, France. �inria-00386563�

(2)

Agr´ egation incompl` ete des estimateurs ` a seuillage dur

Yuri Golubev

Universit´ e de Provence, CMI, 22 rue F. Joliot-Curie, 13453 Marseille

R´ esum´ e. Cet expos´e traite du probl`eme de la reconstruction des vecteurs creux inconnus `a partir des donn´ees bruit´es. Plus pr´ecis´ement, il se focalise sur la m´ethode du seuillage dur et le choix optimal de la p´enalit´e dans la m´ethode de minimisation du risque empirique. Dans le cas o` u les seuils utilis´es appartiennent `a une grille fine, nous d´emontrons que la p´enalit´e optimale se trouve dans le voisinage de la p´enalit´e minimale admissible.

This talk deals with the reconstruction of sparse vectors from noisy data. More precisely, it focuses on the hard thresholding technique and the optimal choice of the penalty in the method of the empirical risk minimization. In the case where the thresholds in use belong to a fine grid, we show that the optimal penalty is in the vicinity of the minimal admissible penalty.

Mots-cl´es: seuillage dur, vecteur creux, minimisation du risque empirique, p´ enalit´ e.

Cet expos´e traite de l’estimation d’un vecteur inconnu θ ∈ R n `a partir des donn´ees bruit´ees Y i = θ i + σξ i , i = 1, . . . , n,

o` u ξ i sont i.i.d. N (0, 1). Afin d’estimer θ, on utilise les estimateurs `a seuillage dur θ ˆ i (t) = Y i 1 ©

| Y i | ≥ t ª

et le but est de choisir le seuil t en se basant sur les observations. L’id´ee du seuillage dur est li´ee `a l’hypoth`ese que le vecteur `a estimer est creux. De tels vecteurs apparaissent typiquement dans les m´ethodes statistiques se basant sur les ondelettes, voir, par exemple, Donoho, D., Johnstone, I., Kerkyacharian, G. et Picard, D. (1995).

Ensuite, les seuils sont choisis `a l’aide du principe de minimisation du risque empirique ˆ t = arg min

t ∈T

n k Y − θ(t) ˆ k 2 + P en £

k θ(t) ˆ k 0 , t ¤ o , o` u T est un sous-ensemble dans R + , k · k est la norme eucl´edienne,

k x k 0 =

n

X

i=1

1 {| x i | > 0 } ,

1

(3)

et P en £

· , · ¤

est une p´enalit´e. En g´en´eral, le but principal du concept de choix adaptatif de t est de trouver la p´enalit´e qui minimise le risque de l’estimateur ˆ θ ¡ t ˆ ¢

R(θ, P en) = E

n

X

i=1

£ θ i − θ ˆ i ¡ ˆ t ¢¤ 2

,

uniform´ement θ ∈ R n . Pour illustrer cette id´ee, nous commen¸cons par le cas, o` u T = R + . Dans la litt´erature statistique, ce cas est connu sous le nom ”s´ election de mod´ ele”s (voir, par exemple, Birg´e, L. et Massart, P. (2007) pour une br`eve histoire de cette m´ethode).

Pour borner le risque de ˆ θ(ˆ t), on introduit quelques notations suppl´ementaires. Pour un vecteur x ∈ R n on va noter par x ( · ) la permutation d´ecroissante de ces composantes x (1) ≥ x (2) ≥ . . . ≥ x (n) . Soit

pen α (x) def = (2x + 1) log 2Q α n

2x + 1 , avec Q α = µ

1 + 1 α

exp(2 + ǫ).

On commence par un r´esultat dans l’esprit de Birg´e, L. et Massart, P. (2007).

Th´ eor` eme 1. Soit T = R + et P en α (x) = (1 + α)σ 2 pen α (x), alors pour tout ǫ > 0, uniform´ ement en θ ∈ R n

R(θ, P en α ) ≤ µ

1 + 1 α

R (θ, P en α ) + Cσ 2 (1 + α) 2 α √

ǫ ,

o` u

R (θ, P en α ) = min

k

n X k

i=1

θ 2 (n − k) + P en α (k) o

et C > 0 est une constante g´ en´ erique.

Ce th´eor`eme pr´edit que: la m´ethode de minimisation du risque empirique s’explose lorsque α → 0, la p´enalit´e presque optimale correspond `a α ≈ 1, le risque de cette m´ethode (avec la p´enalit´e optimale) sur l’ensemble de vecteurs creux S γ

n

= { θ : k θ k 0 ≤ γ n n } est asymptotiquement quatre fois sup´erieure au risque minimax (voir Abramovich, F., Benjamini, Y., Donoho, D. et Johstone, I. (2006)). Malheureusement, ces conclusions ne s’accordent pas bien avec la pratique statistique car elles se basent sur la borne sup´erieure qui est grossi`ere.

Le r´esultat suivant montre que la borne sup´erieure du th´eor`eme 1 peut ˆetre am´elior´ee.

D´efinissons l’ensemble des vecteurs creux Q n = n

θ ∈ R n : # ©

i : | θ i | ≤ σ n

ª ≥ qn o , o` u q > 0 et σ n = σ/ p

2 log(n). On va supposer que

2

(4)

• T = { t 1 , t 2 , . . . , t M } , o` u M = n/ £

exp(1) p

log(n) ¤

et t k sont d´efinis par n exp £

− t 2 k /(2σ 2 ) ¤

= 1 + (k − 1) p

log(n).

• P en α (x, t) = (1 + α)σ 2 pen α/2

¡ k ¢

+ αn ¡

t 2 /2 + σ 2 ¢

exp[ − t 2 /(2σ 2 )] avec α > 0.

Th´ eor` eme 2. Uniform´ ement en θ ∈ Q n et t ∈ T R(θ, P en α ) ≤R 0 (θ, t) + σ 2 # ©

i : | θ i | ≥ σ n

ª

+ C R 1 (θ, t) α 3/2 ǫ 1/4

·

1 + log + C √

ǫα 32 R 1 (θ, t)

¸ 1/4

,

o` u

R 0 (θ, t) =

n

X

i=1

θ i 2 P ©

| Y i | ≤ t ª

+ P en α

h X n

i=1

P ©

| Y i | > t ª , t i

et

R 1 (θ, t) = R 0 (θ, t) + t 2 q

# ©

i : | θ i | ≥ σ n ª .

Le sens statistique de ce th´eor`eme est assez transparent. Si le vecteur `a estimer est creux, alors R 1 (θ, t) ≍ R 0 (θ, t) et R 0 (θ, t) ≪ nσ 2 pour tout t r´esonnable. Cela signifie que R 0 (θ, t) est le terme principal dans la borne du th´eor`eme 2 et son minimum par rapport

`a α est atteint pour α ≈ 0. Notons ´egalement que cette borne sup´erieure s’explose, mais contrairement au th´eor`eme 1, c’est le terme de deuxi`eme ordre qui s’explose. Cette ob- servation permet de d´emontrer en particulier que l’estimateur ˆ θ(ˆ t) est asymptotiquement minimax sur S γ

n

.

Bibliographie

[1] Abramovich, F., Benjamini, Y., Donoho, D. et Johstone, I. (2006) Adapting to un- known sparsity by controlling false discovery rate. Ann. Statist., 34, 584–653.

[2] Birg´e, L. et Massart, P. (2007) Minimal penalties for Gaussian model selection. Probab.

Theory Relat. Fields 138, 33–73.

[3] Donoho, D., Johnstone, I., Kerkyacharian, G. et Picard, D. (1995) Wavelet shrinkage:

Asymtopia? Journal of the Royal Statistical Society, Series B, 57, 301–369.

3

Références

Documents relatifs

Si certains travaux ont abordé le sujet des dermatoses à l’officine sur un plan théorique, aucun n’a concerné, à notre connaissance, les demandes d’avis

Using the Fo¨rster formulation of FRET and combining the PM3 calculations of the dipole moments of the aromatic portions of the chromophores, docking process via BiGGER software,

Later in the clinical course, measurement of newly established indicators of erythropoiesis disclosed in 2 patients with persistent anemia inappropriately low

Households’ livelihood and adaptive capacity in peri- urban interfaces : A case study on the city of Khon Kaen, Thailand.. Architecture,

3 Assez logiquement, cette double caractéristique se retrouve également chez la plupart des hommes peuplant la maison d’arrêt étudiée. 111-113) qu’est la surreprésentation

Et si, d’un côté, nous avons chez Carrier des contes plus construits, plus « littéraires », tendant vers la nouvelle (le titre le dit : jolis deuils. L’auteur fait d’une

la RCP n’est pas forcément utilisée comme elle devrait l’être, c'est-à-dire un lieu de coordination et de concertation mais elle peut être utilisée par certains comme un lieu

The change of sound attenuation at the separation line between the two zones, to- gether with the sound attenuation slopes, are equally well predicted by the room-acoustic diffusion