• Aucun résultat trouvé

CHAPITRE I FONDEMENTS THEORIQUES

1.2 La démarche empirique

Compte tenu de l’objectif principal de notre travail qui consiste à tester l’impact du conseil d’administration sur la création de valeurs, la structure du modèle théorique sous-jacent se présente de manière à viser à expliquer la réaction d’une seule grandeur économique – la performance de l’entreprise – par la combinaison de plusieurs variables d’influence. Selon leur nature, ces dernières peuvent être classées comme suit :

 les variables synthétiques et ;  les variables médiatrices.

Dans la mesure où nous disposons d’observations individuelles espacées régulièrement dans le temps, nous proposons de mener des tests empiriques à l’aide de méthodes de régression multivariées de données de panel1 (pooled time series data) du type suivant :

Avec : n=1,…,N et t=1,…,T ynt=variable expliquée b0nt = constante générale bknt = constante individuelle xknt = variables explicatives ωnt = perturbations aléatoires

Selon cette modélisation « standard » des données de panel, la variable expliquée (ynt)

est supposée être fonction d’une constante (b0nt) à laquelle s’ajoutent plusieurs

variables explicatives (bknt٠xknt), ainsi qu’un terme représentant des perturbations

aléatoires (ωnt) non observables (Sevestre, 2002, pp. 9-10). Comme on peut le voir,

les différents coefficients varient aussi bien au niveau individuel que temporel. Autrement dit, on admet, ici, une hétérogénéité dynamique des variables explicatives, ces dernières étant censées évoluer au cours du temps2.

Contrairement aux séries temporelles, les données de panel sont rarement utilisées pour la prévision ou la simulation mais pour révéler les variables significatives dans l’explication d’un comportement (production, consommation etc.) (Duguet, 2010).

Pour Sevestre (2002, pp. 3-10) et Baltagi (2008, pp. 6-11), l’analyse des données de

panel présente un avantage de la disponibilité d’information couvrant tant les

1 Si en marketing ou en statistique, le mot panel désigne généralement un échantillon fixe de

consommateurs interrogés à différentes périodes, en économétrie, le terme de données de panel est simplement synonyme de données croisées ayant généralement une dimension temporelle.

2 Enrico PRINZ (2010) ; « Les effets des liens personnels interconseils sur la performance de

l’entreprise : une analyse comparée entre France et Allemagne » ; thèse de doctorat, Sciences de Gestion, Université de Bourgogne.

dimensions individuelles que temporelles. La nature « dynamique » de la méthode permet de considérer simultanément les spécificités individuelles des observations et leur évolution dans le temps. Par ailleurs, la double dimension des données conduit, très souvent, à un grand nombre d’observations, ce qui rend possible la considération d’échantillons dont l’analyse sur une seule période n’aurait pu être réalisée. Néanmoins, l’économétrie des données de panel présente également quelques inconvénients. D’une part, la fréquence des observations aberrantes augmente avec la taille de l’échantillon, entraînant un risque croissant de perturbations de la qualité des estimations. Par conséquent, il convient de mener une analyse des points aberrants qui devraient faire l’objet de corrections ou d’éliminations. D’autre part, la fréquence des observations non renseignées peut également poser problème. Pour y remédier, une étude visant à maintenir les données manquantes ou à les interpoler devrait être effectuée (Prinz, 2010).

La réalisation d’une analyse économétrique des données de panel à partir du modèle standard présenté ci-dessus rencontre, de plus, un autre problème majeur : l’hétérogénéité des variables explicatives. En raison du fait que le nombre des coefficients (N٠T٠(K+1)) dépasse celui des observations (N٠T), le modèle ne peut a

priori être résolu (Ibid., pp. 9-10). Dès lors, l’économétrie propose quatre modèles

canoniques permettant de mettre en place des contraintes susceptibles de modéliser l’hétérogénéité des variables explicatives observées (Prinz, 2010) :

 le modèle à effets fixes ;

 le modèle à erreurs composées ;  le modèle à coefficients composés, et ;  le modèle à coefficients aléatoires.

Deux modèles principaux sont utilisés pour traiter les variables individuelles inobservables : le modèle à effet individuel aléatoire et le modèle à effet fixe. Dans leur version de base, le premier modèle postule une absence de corrélation entre les variables individuelles inobservables et les variables explicatives du modèle1 alors que le second modèle autorise cette corrélation (Duguet, 2010), en d’autres termes, on considère que l’impact des variables explicatives est identique pour toute observation et ne varie pas au cours du temps. Les spécificités individuelles et temporelles ne sont exprimées qu’à travers un groupe de constantes générales, les constantes individuelles étant considérées comme identiques pour chaque observation.

Le choix entre ces deux modèles se fait à l’aide des tests de spécification. Le modèle à coefficients aléatoires peut être écrit de la façon suivante :

Avec : n=1,…,N et t=1,…,T ynt =variable expliquée b0 = constante générale bknt = constante individuelle xknt = variables explicatives 1

Réalisant ainsi une décomposition individuelle-temporelle de tous les coefficients. Aussi, tous les effets spécifiques sont supposés être de nature aléatoire, d’espérance nulle, de variance finie, ainsi que ni corrélés entre eux-mêmes, ni avec les régresseurs. Quant aux variables explicatives, elles sont considérées comme exogènes (Prinz, 2010).

un = effet spécifique

vt = effet temprel

ωnt = perturbations aléatoires

Dans le modèle à coefficients aléatoires, la variable expliquée (ynt) est supposée être

fonction, comme on peut le voir ci-dessus, d’une constante générale (b0), d’un certain

nombre de variables explicatives se distinguant tant au niveau individuel que temporel (bknt٠xknt), ainsi que d’un groupe d’éléments d’erreurs, qui reflète à nouveau l’aspect

spécifique (un), l’aspect temporel (vt), ainsi que des perturbations aléatoires (ωnt) que

l’on ne peut expliquer1

. (Prinz, 2010)

D’après le modèle, la performance financière d’une firme est supposée dépendre, entre autres, de variable que nous détaillerons par la suite. Ici, les effets spécifiques individuels refléteraient alors la façon spécifique, non observable, de chaque entreprise d’exploiter ces variables. L’hypothèse de l’absence de corrélations entre les variables explicatives et les effets spécifiques ne nous semble pas pertinente et risque de conduire à des résultats biaisés. Vu que « […] dans de nombreuses situations, l’hypothèse cruciale d’absence de corrélation entre les perturbations du modèle et les variables explicatives n’est pas vérifiée, du fait de la présence dans la perturbation d’effets spécifiques corrélés avec les régresseurs » (Sevestre, 2002), il sera donc nécessaire d’examiner, avant l’estimation même des coefficients de régression, les données collectées, la finalité étant d’identifier le modèle qui se prête le mieux pour effectuer nos analyses empiriques.

Ainsi, plusieurs procédures de tests d’homogénéité sont nécessaires. Il sera donc question, dans un premier temps de procéder à des tests, qui indiqueront lequel des modèles de panel précités doit être appliqué dans notre cas.

Nous présenterons les détails des tests d’hétérogénéité précités et leurs conclusions relatives aux procédures de spécification des coefficients de régression à appliquer, dans le dernier chapitre de cette thèse.

1 Notre argumentation reprend celle de Enrico PRINZ (2010) ; « Les effets des liens personnels

interconseils sur la performance de l’entreprise : une analyse comparée entre France et Allemagne » ; thèse de doctorat, Sciences de Gestion, Université de Bourgogne.