• Aucun résultat trouvé

Analyse des conditions de validité des estimations

Dans le document Thèse de Doctorat en Sciences de Gestion (Page 185-195)

CHAPITRE IV : Méthodologie de recherche et spécification du modèle

Section 3. Analyse des conditions de validité des estimations

Nous avons présenté tout au long des premières parties de ce chapitre notre échantillon et les mesures des variables à intégrer dans nos modèles, et présenté les illustrations schématiques ainsi que les spécifications de ces modèles que nous allons estimer pour tester empiriquement la validité de nos hypothèses. Dans ce qui suit, nous allons essayer de présenter les conditions de validité des modèles développés dans la section précédente et les principaux arguments pouvant justifier le choix de la méthode d’estimation adoptée.

3.1. Construction des modèles à estimer

En présence d’un modèle à équations simultanées, il est possible qu’une variable endogène d’une équation apparaisse en tant que variable exogène dans une autre équation.

C’est le cas des variables « DEC » et « CENT » figurant dans nos modèles. Le double statut de ces variables entraîne un biais dans les estimations lors de l’emploi de la méthode des Moindres Carrées Ordinaires (MCO) équation par équation23. Afin d’éviter ce biais d’estimation, nous devons transformer nos modèles initiaux de telle sorte que nous obtenons des modèles où les variables endogènes ne sont exprimées qu’en fonction des variables exogènes.

Ces transformations peuvent s’effectuer de la façon suivante :

23 Voir Koutsouyiannis (1986), pages 332-335 ou aussi le manuel d’économétrie de BOURBONNAIS, 6ème édition, Chapitre 8, « Introduction aux modèles à équations simultanées », pages 203-236

Pour le premier modèle (Modèle [1]) :

Ce résultat s’écrit également de la forme suivante :

[ ] [ ] [ ]

Il en résulte : respectées et l’application des MCO sur le modèle (1) conduit à des estimations qui ne sont pas biaisées et qui sont convergentes.

savoir : « DIit », « TAILLEit », « MICit », « CFit » « INSTITUTit », « STKOPTIONit » et

« DETTEit ». Les variables « DECit » et « CENTit » apparaissent comme variables explicatives dans l’équation (E4), ce qui est contraire à leurs statuts de variables endogènes.

Pour lever ce problème, nous devons exprimer les trois variables endogènes

Ce résultat s’écrit également de la forme suivante :

[ ] [ ] [ ]

Nous posons : respectées et l’application des MCO sur le modèle (2) conduit à des estimations qui ne sont pas biaisées et qui sont convergentes.

Les présentations en forme réduite des deux modèles de base sont les suivantes : Modèle (1) :

3.2. Le problème d’identification des équations des modèles

Les conditions d’identification d’un modèle se déterminent équation par équation. Trois cas de figure peuvent se présenter.

• Le modèle est sous-identifié si une équation du modèle est sous-identifiable (c'est-à-dire qu’il y a moins d’équations que de paramètres à identifier dans la forme structurelle). Dans une telle situation, le système est impossible à résoudre.

• Lorsque toutes les équations sont « justes » identifiables, le modèle serait « juste » identifié.

• Le modèle est sur-identifié si les équations du modèle sont soit « justes » identifiables soit sur-identifiables.

Lorsque le modèle est sous-identifié, il est impossible d’estimer ses paramètres et la modélisation doit être re-spécifiée. Les conditions d’identification d’un modèle font l’objet d’un développement parfois complexe. Dans ce qui suit, nous allons limiter notre analyse à l’étude des règles simples qui sont, dans la pratique, appliquées en premier lieu. Les conditions d’identification les plus appliquées sont les conditions d’ordre et les conditions de rang. Cependant, pour effectuer ces identifications, il est indispensable de vérifier s’il existe des restrictions à prendre en compte dans notre étude ou non. Il y a une restriction sur un coefficient de la forme structurelle, chaque fois qu’un paramètre est contraint26 à être égal à une valeur déterminée. Il existe deux types de restriction qui peuvent être identifiés, à savoir les restrictions d’exclusion et les restrictions linéaires.

Restrictions d’exclusion : cette restriction consiste à affecter un coefficient nul pour chaque variable endogène ou exogène qui n’apparaît pas dans une équation structurelle. Dans nos deux modèles, les variables « DECit » et « CENTit » figurent au niveau de la première équation et, respectivement, au niveau de la deuxième et la troisième équation de chaque modèle. Cependant, la première ne figure pas dans la troisième équation et la deuxième variable ne figure pas dans la deuxième équation. Ceci revient à les affecter de coefficients nuls. De même, les variables

« TAILLEit » et « DIit » figurent au niveau de la première équation et n’apparaissent pas au niveau de la deuxième ou la troisième équation. Les variables

« MICit », « CFit », « INSTITUTit », « STKOPTIONit » et « DETTEit » apparaissent

au niveau de la deuxième et la troisième équation et ne figurent pas au niveau de la première. Ceci revient à affecter l’ensemble de ces variables de coefficients nuls au niveau des équations dans lesquelles elles ne figurent pas.

Restrictions linéaires : certaines spécifications de modèle imposent que des variables soient affectées d’un coefficient identique. Ce type de restriction n’est pas présent dans les deux modèles.

Une fois les restrictions sur les coefficients effectuées, il est indispensable de procéder à l’identification des systèmes d’équations. Il existe deux conditions d’identifications : les conditions d’ordre (conditions nécessaires) et les conditions de rang (conditions suffisantes).

Les conditions nécessaires : conditions d’ordre Soient :

W = le nombre de variables endogènes du modèle ; K = le nombre de variables exogènes du modèle ;

W’ = le nombre de variables endogènes figurant dans une équation ; K’ = le nombre de variables exogènes figurant dans une équation.

Lorsque les restrictions ne sont que des restrictions d’exclusion (qui est le cas dans notre étude), les conditions nécessaires d’identification sont les suivants :

o Si W – 1 > W – W’ + K – K’ ou autrement dit si le nombre des variables exogènes du modèle moins « un » est supérieur au nombre de variables exogènes et endogènes figurant dans un modèle mais exclues de l’équation, l’équation est dite sous-identifiée.

o Si W – 1 = W – W’ + K – K’ ou autrement dit si le nombre des variables exogènes du modèle moins « un » est égal au nombre de variables exogènes et endogènes figurant dans un modèle mais exclues de l’équation, l’équation est dite juste-identifiée.

o Si W – 1 < W – W’ + K – K’ ou autrement dit si le nombre des variables exogènes du modèle moins « un » est inférieur au nombre

de variables exogènes et endogènes figurant dans un modèle mais exclues de l’équation, l’équation est dite sur-identifiée.27

Dans notre cas, nous constatons pour les deux modèles étudiés que toutes les équations sont sur-identifiées. En effet, pour chaque modèle nous avons W = 3 variables endogènes « PERFit », « DECit » et « CENTit » pour le premier modèle et

« ACCRUALSit », « DECit » et « CENTit » pour le deuxième modèle, et sept variables exogènes : « DIit », « TAILLEit », « MICit », « CFit » « INSTITUTit », « STKOPTIONit » et

« DETTEit » soit K = 7. La première équation pour chaque modèle comporte 5 restrictions d’exclusion et aucune restriction de contrainte. Soit en appliquant les conditions d’identifiabilité, les variables figurant dans ces équations donnent : W’ = 1, K’ = 4 et r = 0 Soit donc : W – W’ + K – K’ = 3 – 1 + 7 – 4 = 5 > W – 1 = 3 - 1, les équations E1 et E4

sont donc sur-identifiées.

La deuxième et la troisième équation pour chaque modèle présente 4 restrictions d’exclusion mais aucune restriction de contrainte. Nous avons pour conséquence : W = 3, K = 7, W’ = 1, K’ = 5 et r = 0, ce qui nous donne : W – W’ + K – K’ = 3 – 1 + 7 – 5 = 4 >

2 = W – 1, les équations E2 et E3 pour le premier modèle et les équations E5 et E6 pour le deuxième modèle sont donc sur-identifiées.

Puisque pour chaque modèle toutes les équations sont sur-identifiées, les deux modèles seront sur-identifiés.

Les conditions suffisantes : conditions de rang28

Si les conditions de d’ordre sont vérifiées, il convient aussi de vérifier les conditions de rang (conditions suffisantes). Cependant, dans la pratique, elles se révèlent difficiles, voire parfois impossible, à mettre en œuvre. C’est ce qui nous pousse à limiter notre analyse au niveau de la vérification des conditions d’ordre qualifiées de conditions nécessaires.

27 Lorsque le modèle comporte des restrictions linéaires, nous devons ajouter leur nombre dans la deuxième partie de l’égalité c'est-à-dire nous devons comparer W - 1 et W - W’ + K - K’ + r.

28 La condition de rang consiste à ce que le déterminant, qui peut être trouvé à partir des coefficients des variables exogènes et endogènes exclus de l’équation mais existant dans le modèle, soit non nul. Autrement

3.3. Les méthodes d’estimation

Les méthodes d’estimation qui peuvent être utilisées dans le cadre des équations simultanées sont fonctions des critères d’identifiabilité du modèle à estimer. Dans notre cas, les modèles présentés sont sur-identifiés, raison pour laquelle la méthode des doubles moindres carrés devra être employée29. Cette méthode d’estimation est plus utilisée en pratique pour tous les modèles juste ou sur-identifiés. Elle est fondée sur l’application de la méthode des moindres carrée ordinaire en deux étapes. La première étape consiste à effectuer une régression de chacune des variables endogènes sur toutes les variables exogènes. Il convient, dans la seconde étape, de remplacer les variables endogènes figurant à droite des équations structurelles par leur valeur ajustées à l’aide des modèles estimés.

Cette procédure s’avère lourde à mettre en œuvre, de plus, les logiciels permettent en une seule instruction de donner les résultats de cette estimation.

L’application de la méthode « SUR » sur les modèles à équations multiples semble être plus appropriées lorsque les équations du système à estimer sont non reliées en apparence, mais en réalité corrélées par leurs termes d’erreurs. C’est le cas des variables relatives à la décentralisation et à la centralisation de la R&D dans nos modèles. En effet, les équations relatives à ces deux variables (« DEC » et CENT ») semblent, apparemment, être indépendantes, c'est-à-dire que chaque variable endogène dans une équation ne peut être exogène dans l’autre équation. Cependant, en réalité, ces deux variables sont corrélées via leurs termes d’erreurs puisque la détermination de l’une d’entre elles est indexée sur l’autre (puisque on a : CENT = 1 - DEC ).

La méthode d’estimation « SUR » est similaire à celle des moindres carrées ordinaires (MCO). Cependant, elle présente l’avantage de permettre de comparer les relations des mêmes variables exogènes sur des variables exogènes différentes et de tenir compte des influences croisées dans les termes d’erreurs pour aboutir à des estimateurs plus efficaces que ceux donnés par la méthode des moindres carrées ordinaires appliquée équation par équation. Pour effectuer les estimations de nos modèles, nous avons eu recours au logiciel « STAT 9.0 ».

29 Pour plus de détails sur les méthodes d’estimation possibles, il est recommandé de se référer aux développements effectués par Bourbonnais (2002).

Conclusion

Nous avons essayé tout au long de ce chapitre de présenter les conditions dans lesquelles notre étude est effectuée : l’échantillon, les sources et les modes de collecte de données. Nous avons également essayé de construire les modèles à estimer et expliquer la méthodologie statistique employée, ainsi que la démarche permettant de construire les composantes et les indices de fiabilité des systèmes d’équations que nous adoptons pour tester les différentes influences des stratégies d’innovation et de diversification sur la performance de la FMN et sur la gestion des résultats. En particulier, nous avons construit deux modèles à équations simultanées afin d’étudier l’effet joint de la décentralisation des investissements en R&D et de la performance de la FMN, dans une première étape, et l’effet joint de la décentralisation et de la gestion des résultats dans une seconde étape. Les données qui vont faire objet de l’estimation sont des données de panel qui vont être adoptées afin de tirer parti de la double dimension, individuelle et temporelle, de l'information disponible.

CHAPITRE V : Présentation et interprétation

Dans le document Thèse de Doctorat en Sciences de Gestion (Page 185-195)