• Aucun résultat trouvé

4.1

Introdução

Neste capítulo serão apresentados mecanismos de estimação intervalar para os parâmetros que indexam a distribuição Lomax. Tipicamente investigadores desejam associar um grau de con- fiabilidade a suas estimativas e, assim, recorrem a estimação intervalar. Um intervalo de con- fiança é um intervalo do tipo

[l1(x), l2(x)],

tal que, a probabilidade deste intervalo conter o parâmetro de interesseθ seja igual a um valor pré-fixado 1− 2γ, com 0<γ < 0.5, ou seja

IP[l1(X) 6θ 6l2(X)] = 1 − 2γ, (4.1)

em que 1−2γé o nível de confiança do intervalo, ou seja, 1−2γ é a probabilidade de cobertura. Adicionalmente, l1(X) < l2(X), ambos sendo estatísticas (i.e., não dependem de quantidades

desconhecidas). Intervalos de confiança que satisfazem a condição acima, ou seja, com pro- babilidade de cobertura igual ao nível de confiança, são ditos exatos. Contudo, nem sempre é possível construir intervalos exatos e por isto intervalos aproximados são utilizados na prática, isto é,

IP[l1(X) <θ < l2(X)] ≈ 1 − 2γ.

Neste caso, além do intervalo, os limites l1(x) e l2(x) também são ditos aproximados. Por

este motivo, é de fundamental importância buscar estimativas intervalares precisas, ou seja, intervalos de confiança aproximados com pequenos erros de cobertura.

O objetivo nas próximas seções será, especificamente, descrever como estimativas inter- valares podem ser obtidas para os parâmetros que indexam a distribuição Lomax. Para tanto intervalos de confiança baseados em estimativas de máxima verossimilhança, e no método bootstrap serão utilizados. Enfoque usual, baseado na distribuição assintótica do estimador de máxima verossimilhança, produz intervalos de confiança forçosamente simétricos e podem produzir intervalos com valores impróprios para os parâmetros. Intervalos baseados no mé- todo bootstrap nem sempre são simétricos e geralmente cobrem apenas valores próprios para os parâmetros. Para uma descrição completa e detalhada sobre a construção de intervalos de confiança bootstrap, ver Davison & Hinkley (1997) e Efron & Tibshirani (1993).

4.2 INTERVALO BOOTSTRAP PERCENTIL 22

4.2

Intervalo Bootstrap Percentil

Através do método bootstrap, paramétrico ou não-paramétrico, são geradas amostras bootstrap (y∗1, . . . , y∗R) e a partir delas obtem-se as réplicas bootstrap de ˆθ: ˆθ∗1, . . . , ˆθ∗R. Seja ˆG a função de distribuição empírica de ˆθ obtida através das R réplicas bootstrap. A partir dos percentisγ/2 e 1−γ/2 de ˆG é possível construir o intervalo de confiança percentil com nível aproximado de cobertura 1−γ, da forma

ˆ

G−1(γ/2), ˆG−1(1 −γ/2) . (4.2) Por definição ˆG−1(γ/2) = ˆθ∗(γ/2)e ˆG−1(1−γ/2) = ˆθ∗(1−γ/2). Logo, o intervalo percentil pode ser escrito como

 ˆ

θ∗(γ), ˆθ∗(1−γ). (4.3)

O intervalo em (4.2) e (4.3) pode ser obtido como descrito a seguir. Gera-se R amostras boots- trap y∗1, . . . , y∗Re cálcula-se as respectivas estimativas ˆθ∗r= s(y∗r), r = 1, . . . , R. Em seguida, ordenamos as R réplicas de ˆθ e, a partir delas, obtêm-se os limites inferior e superior do in- tervalo percentil, que são as réplicas R× (γ/2) e R × (1 −γ/2), respectivamente, contanto que R× (γ/2) e R × (1 −γ/2) sejam inteiros. Se R × (γ/2) e R × (1 −γ/2) não forem inteiros o seguinte procedimento pode ser utilizado: assumindo que 0<γ< 0.5, seja k = ⌊(R + 1) ×γ/2⌋ o maior inteiro menor ou igual a(R + 1) ×γ/2; então, os limites inferior e superior do intervalo percentil serão o k-ésimo e o(R + 1 − k)-ésimo elementos ordenados das R réplicas bootstrap, respectivamente.

O intervalo percentil dado em (4.2) garante a não inclusão de valores impróprios para o parâmetro de interesse no intervalo de confiança. Note também que este intervalo não é neces- sariamente simétrico em relação a ˆθ.

Como destacado por Efron & Tibshirani (1993), o método percentil incorpora a transfor- mação que normaliza perfeitamente a distribuição de ˆθ. Suponha que ˆθ não tenha distribuição normal em amostras finitas e seja ˆφ = h( ˆθ) a transformação que normaliza a distribuição de ˆθ, isto é,

ˆ

φ ∼ N(φ, c2),

em que c é algum desvio-padrão constante. Desta maneira, é possível construir um intervalo de confiança exato com probabilidade de cobertura 1−γ paraφ da forma

h ˆ φ− z(1−γ 2)c, ˆφ+ z(1− γ 2)c i , em que z(1−γ

2) é o percentil(1 −γ/2) da distribuição normal padrão. Assim, o intervalo per-

centil de ˆθ pode ser escrito da seguinte maneira h h−1φˆ− z(1−γ 2)c  , h−1φˆ+ z(1−γ 2)c i ,

sem necessariamente que se conheça a função normalizadora h(·). O método percentil possui uma desvantagem qual seja: o intervalo percentil resultante pode subestimar as caudas da dis- tribuição bootstrap, pois este método utiliza a distribuição bootstrap e desconhece a distribuição normal de ˆφ para obter os limites de confiança.

4.3 INTERVALO BOOTSTRAP BC 23

4.3

Intervalo Bootstrap BC

O método anterior pode ser generalizado, com o objetivo de englobar uma classe maior de problemas, permitindo-se que a função normalizadora e estabilizadora da variância de ˆθ, ˆφ = h( ˆθ), apresente viés constanteυ0, isto é,

ˆ

φ−φ

c ∼ N(−υ0, 1).

Assim, o intervalo de confiança exato com probabilidade de cobertura 1−γ para o parâmetro

φ é dado por h ˆ φ+ cυ0− z(1−γ 2)c, ˆφ+ cυ0+ z(1− γ 2)c i ,

o qual pode ser transformado em um intervalo de confiança paraθ aplicando-se a tranformação inversa, h−1(φ), aos limites inferior e superior.

O intervalo BC paraθ, com nível de cobertura aproximado de 1−γ, é dado por ˆ

G−1 Φ(z[γ/2]) , ˆG−1 Φ(z[1−γ/2]) , (4.4)

em que Φ(·) é a função de distribuição acumulada normal padrão e as quantidades z[γ/2] e

z[1−γ/2]são iguais a

z[γ/2]= 2υ0+ z(γ/2) e z[1−γ/2]= 2υ0+ z(1−γ/2).

Como o valor deυ0é desconhecido, é possível estimá-lo como

ˆ υ0=Φ−1 #( ˆθ∗r< ˆθ) R ! ,

em que Φ−1 é a inversa da função de distribuição normal padrão, ou seja, é a função quantil normal padrão. A expressão de ˆυ0é uma medida do viés da mediana da distribuição bootstrap

com relação a ˆθ.

Da mesma maneira que o método percentil, o método BC possui a vantagem de que a construção do intervalo é feita automaticamente, sem ser necessário o conhecimento da função h(·).

O intervalo em (4.4) foi denominado por Efron(1981) de BC (“Bias-Corrected”). Por ser um método intermediário entre o bootstrap percentil e o bootstrap BCa ele não foi considerado nas simulações de Monte Carlo realizadas neste trabalho.

4.4

Intervalo Bootstrap BCa

O intervalo de confiança BCa é uma extensão do intervalo BC, na medida em que permite que o erro padrão varie comθ. O intervalo BCa (“Bias-Corrected and Accelerated”) é baseado numa suposição mais geral, qual seja:

ˆ

4.4 INTERVALO BOOTSTRAP BCA 24

em queφ = h(θ) é uma transformação monótona. Desta maneira, em uma escala transformada, a estatística padronizada segue lei normal, podendo apresentar algum viés e, possivelmente, erro padrão variando linearmente com o parâmetroφ. Note que é possível obter a forma dis- tribucional apresentada pelo método BC, a menos da constante c, ao se fazer a= 0 no método BCa.

Os métodos BC e BCa podem parecer semelhantes, contudo a diferença entre eles é grande. A transformação φ = h(θ) do método BC deve produzir normalização e estabilização da va- riância de ˆθ, enquanto que h(θ) no método BCa precisa apenas normalizar a distribuição de

ˆ

θ.

O intervalo de confiança bootstrap BCa com probabilidade de cobertura de aproximada- mente 1−γ paraθ é dado por

 ˆ G−1(Φ(z[γ/2]), ˆG−1(Φ(z[1−γ/2]), (4.5) em que z[γ/2]=υ0+ υ0+ z(γ/2) 1− a(υ0+ z(γ/2)) e z[1−γ/2]=υ0+ υ0+ z(1−γ/2) 1− a(υ0+ z(1−γ/2)) .

A constante a mede a razão de mudança do erro padrão de ˆθ com respeito ao verdadeiro valor do parâmetro. Chamamos de constantes de correção de viés e constante de aceleração as quan- tidades υ0 e a, respectivamente. A constante a tipicamente não é conhecida e, via bootstrap

paramétrico, pode ser estimada como ˆ a=1

6Skew(ℓ

( ˆθ)) |

θ= ˆθ,

em que Skew(·) denota o coeficiente de assimetria e ℓ′( ˆθ) é a derivada da função log-verossimi- lhança avaliada em ˆθ. Na forma não-paramétrica do bootstrap a constante a é estimada como

ˆ a= ∑ n i=1( ˆθ(·)− ˆθ(i))3 6[∑ni=1( ˆθ(·)− ˆθ(i))2]3/2 .

Aqui, ˆθ(i) são réplicas jackknife do estimador ˆθ e são calculadas retirando o i-ésimo elemento da amostra observada y1, . . . , ynpor vez e ˆθ(·) é a média das n réplicas jackknife. Embora esta

expressão seja utilizada na forma não-paramétrica de bootstrap ela foi utilizada neste trabalho de mestrado também como uma aproximação do caso paramétrico.

Os limites do intervalo bootstrap BCa com probabilidade de cobertura de aproximadamente 1−γ são os percentisδ1eδ2da distribuição bootstrap para ˆθ dados por

δ1=Φ " ˆ υ0+ ˆ υ0+ zγ/2 1− ˆa( ˆυ0+ zγ/2) # e δ2=Φ " ˆ υ0+ ˆ υ0+ z1−γ/2 1− ˆa( ˆυ0+ z1−γ/2) # .

Usualmente os intervalos de confiança BCa são mais precisos do que os intervalos do tipo per- centil, pois a probabilidade do valor verdadeiro deθ estar acima ou abaixo dos limites superior

4.4 INTERVALO BOOTSTRAP BCA 25

e inferior, respectivamente, dos intervalos BCa encontram-se tipicamente mais próximas do valor nominalγ/2.

Quando υ0 e a são iguais a zero, os limites de confiança dos intervalos BCa e percentil

são iguais. Quando apenas a é igual a zero os limites de confiança dos intervalos BCa e BC coincidem.

A grande quantidade de réplicas bootstrap requerida é a maior desvantagem do método BCa. Usualmente, são empregadas entre 1000 e 2000 réplicas bootstrap, aumentando assim o custo computacional relativamente a outros métodos bootstrap.

C

APÍTULO

5