• Aucun résultat trouvé

Estimation de la matrice de variance-covariance

5 Mise en pratique

5.1 Estimation de la matrice de variance-covariance

Dans le modèle de Malatesta (1986) présenté lors du chapitre 2, la matrice de variance- covariance des erreurs contemporaines est supposée connue. Or en réalité, il n’en est rien. Par conséquent, il est nécessaire de l’estimer afin de pouvoir obtenir les rentabilités anormales associées au modèle. Cette section présente les méthodes d’estimation de cette matrice. Etant donné le nombre important de termes à estimer (

(

1

)

2

N N+

termes), des méthodes alternatives destinées à réduire le nombre de paramètres à estimer sont exposées par la suite.

5.1.1 Méthodes d’estimation

Plusieurs méthodes existent pour déterminer Σ, la matrice de variance-covariance des erreurs contemporaines du modèle de Malatesta (1986). La première consiste à estimer le modèle à l’aide des MCO. Ses résidus ε$′ =i

[

ε ε$ $i1 i2Lε$iT

]

permettent de calculer

$ $ $

σij ε εi j

T

= 1 ′ . La matrice $Σ, ainsi obtenue, permet de calculer les valeurs des différents estimateurs. Malatesta (1986) ne corrige pas l’estimateur de la variance-covariance par

le nombre de degré de liberté. Cependant, comme le remarque Greene (1993, p. 489), si la période d’étude est suffisamment grande, la correction par le nombre de degrés de liberté est inutile.

Une alternative à l’estimation de la matrice de variance-covariance à l’aide des MCO est fournie par une estimation par maximum de vraisemblance. Le logarithme de la fonction de vraisemblance est donnée par :

( )

1 1

(

(

1

)

1

)

2 2 2 2 NT LnL= −Ln πLnΣ ⊗ −I ε′ Σ ⊗− Iε  

L’estimateur par maximum de vraisemblance de chaque terme de la matrice de variance-covariance est de la forme :

1 ˆ ˆ ˆij i j

T σ = ε ε

ε est le vecteur des résidus associés à la firme i et obtenus par maximum ˆi de vraisemblance.

Comme le montre McDonald (1987), la fonction de vraisemblance peut alors s’écrire :

( )

2 ˆ 2 1 2 2 T I Ln Ln NT LnL  − Σ⊗ −      − = π

Ainsi, si l’on supprime les constantes,

Σ − = ˆ 2 Ln T LnL puisque Σˆ⊗I = ΣˆT I N.

Remarquons que, si la matrice de variance-covariance est contrainte à être diagonale, alors l’estimation par maximum de vraisemblance est identique à l’estimation par MCO. En revanche, dans le cas où aucune restriction n’est faite, l’estimation à l’aide des MCG tend asymptotiquement vers l’estimation par maximum de vraisemblance. Etant donné que l’estimation par maximum de vraisemblance est particulièrement coûteuse en temps de calcul, McDonald (1987) propose une procédure appelée moindres carrés généralisés itérés (MCGI) qui généralise la précédente. Elle consiste à itérer l’estimation du modèle

1. Estimation du modèle par MCO, en particulier des résidus.

2. Estimation de la matrice de variance-covariance à partir des résidus.

3. Estimation du modèle par MCG à l’aide de la matrice de variance-covariance définie en 2.

4. Retour à l’étape 2. jusqu’à stabilité des coefficients de la matrice de variance- covariance.

McDonald (1987) montre qu’en dix itérations les estimateurs obtenus par MCGI sont identiques à ceux obtenus par maximum de vraisemblance. Le gain est particulièrement significatif lors des trois premières itérations.

5.1.2 Régression en portefeuilles

Sefcik et Thompson (1986) puis Chandra et Balachandran (1992) proposent une approche destinée à éviter l’usage des MCG et, par conséquent, l’estimation de la matrice de variance et covariance. En effet, l’estimation de la matrice de variance et covariance nécessite, pour des raisons de stabilité de l’estimation, un nombre de données temporelles largement supérieur au nombre d’événements de l’échantillon. De plus, les distributions des tests, sauf dans le cas décrit par Schipper et Thompson (1985), ne sont pas exactes lorsque la matrice de variance et covariance est à estimer. D’un autre côté, l’utilisation des MCO fournit une estimation biaisée de la variance des sensibilités aux facteurs. C’est pourquoi Chandra et Balachandran (1992) suggèrent d’employer des régressions en portefeuilles.

Cette nouvelle approche consiste à agréger les titres en K portefeuilles et à effectuer la régression en coupe à l’aide de ces mêmes portefeuilles. Chaque portefeuille réplique un unique facteur contenu dans la matrice X, qui contient les K caractéristiques (x ) de ik

chacune des firmes. C’est pourquoi, si la matrice des poids dans tous les portefeuilles est notée w, w X′ =I . Par conséquent, lors de l’événement, la sensibilité à chaque facteur est obtenue par $B= ′Γw , où Γ est le vecteur des rentabilités anormales des firmes de l’échantillon au moment de l’événement. L’estimateur de la matrice de variance et covariance de $B est $V = ′Σw w$ . Comme le remarquent Sefcik et Thompson (1986), même si $V et $Σ sont très fortement liées, il n’est pas nécessaire de calculer $Σ pour déterminer $V . L’estimation directe $V est préférable puisque $V est

donc pour but d’agréger les différents titres en portefeuilles afin de réduire la taille de la matrice de variance-covariance des résidus .

Il reste à déterminer les poids des différents titres dans les portefeuilles. La matrice w des poids qui maximise le pouvoir des tests est obtenue à l’aide des MCG :

(

1

)

1 1

MCG

w′ = X′Σ− XX′Σ− (5.1)

Si les poids sont calculées de la manière précédente avec une matrice Σ à estimer, alors le gain issu du groupement en portefeuilles des différents titres est nul. Sefcik et Thompson (1986) ont donc proposé d’utiliser les poids issus d’une estimation par MCO44 :

(

)

1

MCO

w′ = X X′ − X′ (5.2)

Sefcik et Thompson (1986) montrent que cette procédure, contrairement aux MCO, fournit un estimateur non biaisé de la variance, mais l’estimateur de B n’est pas de variance minimum. Chandra et Balachandran (1992) proposent deux méthodes intermédiaires. La première utilise les poids issus de la régression par moindres carrés pondérés (MCP) :

(

1

)

1 1

MCP

w′ = X D X′ − − X D′ − (5.3)

avec D une matrice diagonale comportant les variances des erreurs.

Cette méthode permet de réduire le nombre de paramètres à estimer de N N( +1) /2 termes dans le cas des MCG à N variances dans le cas des MCP. Par ailleurs, la variance de l’estimateur de B obtenue par cette méthode est inférieure à celle obtenue par des régressions en portefeuilles avec des poids issus des MCO.

La méthode précédente a toutefois un inconvénient majeur : elle néglige les corrélations entre les résidus de la régression. Chandra et Balachandran (1992) introduisent donc une seconde méthode, le modèle de corrélation constante. Ce modèle suppose que les titres appartenant à un même secteur industriel sont identiquement corrélés. De même, la corrélation entre les titres de deux secteurs est identique pour tous les couples issus de

M M( −1) /2 corrélations moyennes différentes, M étant le nombre de secteurs. Les poids dans chacun des portefeuilles sont donc obtenus par :

(

)

(

)

1

(

)

1 1

MCC

w′ = Xσ σCXXσ σC − (5.4)

avec σ matrice diagonale contenant les écart-types des résidus.

Il est possible de constituer la matrice C sur une autre base que celle du regroupement sectoriel. Cette classification est toutefois bien adaptée, car comme le montre Bernard (1987), les corrélations entre les rentabilités des titres à l’intérieur d’un même secteur industriel sont particulièrement importantes.

Cette méthodologie présente donc l’avantage de considérer des corrélations entre les résidus. Elle est toutefois sensible au nombre de secteurs différents recensés dans l’échantillon. Dans le cas extrême où toutes les firmes appartiennent à des secteurs différents, le gain issu de l’estimation de la matrice C par rapport à l’estimation de Σ est nul.