• Aucun résultat trouvé

Chapitre III : Méthodologie de recherche

3.1. Le modèle de la régression linéaire multiple :

Le modèle de la régression linéaire est l’un des modèles les plus connus et les plus utilisés en statistiques pour l’analyse des données quantitatives. L’objectif de ce modèle est d’expliquer les variations de la variable dépendante par les variables observées (Fauveau, 1993, p. 42). Autrement dit, il permet d’établir une liaison entre une variable quantitative et une ou plusieurs autres variables quantitatives.

3.1.1. Qu’est-ce qu’un modèle ? :

La méthode économétrique, pour prévoir et expliquer un phénomène, fait appel à des modèles économétriques. Le modèle peut être défini comme « une tentative de

représentation de la réalité, par abstraction, ou par imitation dans le but d’ordonner et de simplifier cette réalité, tout en représentant ses principales caractéristiques » (Yao, 2012,

p. 86). Il consiste en « une présentation formalisée d’un phénomène sous forme

171

Ainsi, le modèle met en lumière les mécanismes constitutifs de ce phénomène qui sont considérés comme fondamentaux pour l’analyse (Erkel-Rousse, 1994, p. 33).

Un modèle comprend en général des définitions, des relations et des variables. Les relations (en équations) d’un modèle peuvent décrire un comportement, traduire des fonctions techniques ou institutionnelles, des identités ou une situation d’équilibre (Yao, 2012, p. 86).

Néanmoins, dans une recherche économétrique, il est indispensable de bien formuler le modèle à tester, qui nécessite une bonne définition des variables (explicatives et expliquées) à tester. Pour Martin (2012), la mise en œuvre d’une méthode de régression nécessite ces précisions, qui sont également indispensables d’un point de vue logique ou épistémologique. Selon l’auteur, « l’effet pur d’une variable ne peut pas être estimé dans

l’absolu mais par rapport à un ensemble explicite de variables » (pp. 113-114).

L’objectif du modèle est de représenter les traits les plus marquants d’une réalité qu’il cherche à styliser. C’est donc l’outil que le modélisateur utilise lorsqu’il cherche à comprendre et à expliquer des phénomènes. Pour ce faire, il émet des hypothèses et explicite des relations (Doukouré, 2000, p. 1).

En revanche, et comme l’écrit (Malinvaud, 1991, cité par Erkel-Rousse, 1994), « un

modèle n’a pas à être rigoureusement vrai ; il doit seulement offrir une approximation suffisante, compte tenu des conventions de travail dans la profession » (p. 33). Dans le

même ordre d’idées, (Erkel-Rousse, 1994) avance qu’un modèle conforme à ces ‘’conventions’’ peut être considéré comme ‘’juste’’ tant qu’il n'est pas démenti par les données. Il peut être considéré comme le modèle ‘’vrai’’ tant qu’un modèle concurrent ne conduit pas à un meilleur ajustement aux données. Ainsi, un modèle bien spécifié veut dire qu’il s’agit d’un modèle correctement adapté à l’étude menée (p. 33).

La construction d’un modèle comporte un certain nombre d’étapes qui sont toutes importantes, et qui sont présentées par Doukouré (2000) comme suit :

- référence à une théorie : une théorie s’exprime au travers d’hypothèses auxquelles le modèle fait référence.

- formalisation des relations et choix de la forme des fonctions : à partir des propositions établies au préalable, le modélisateur peut construire des relations en fonction du sujet à étudier.

- sélection et mesure des variables : le modèle étant spécificité, il convient de collecter les variables représentatives des phénomènes économiques. Ce choix n’est pas neutre et peut conduire à des résultats différents.

172

- décalage temporels et modèle récursif : dans le cadre d’un modèle spécifié en séries temporelles, les relations entre les variables ne sont pas toujours synchrones mais peuvent être décalées dans le temps. Pour enlever cette ambigüité, il est d’usage d’écrire le modèle en le spécifiant à l’aide d’un indice de temps. Pour ce qui est des modèles récursifs, ils constituent une catégorie particulière de modèle dynamique dans le cas où une variable est expliquée par des variables de rang inférieur. Cette variable n’explique pas directement ses propres valeurs passées mais s’explique au travers d’autres variables.

- validation du modèle : la dernière étape est celle de la validation du modèle. Au cours de cette étape, le chercheur doit répondre aux interrogations suivantes : les relations spécifiées sont-elles valides ? Peut-on estimer avec suffisamment de précision les coefficients ? Les coefficients sont-ils stables ?, etc. A toutes ces questions, les techniques économétriques s’efforcent d’apporter des réponses. Or, en cas de faiblesse d’un des ‘’maillons’’, le modèle peut se trouver invalidé pour cause d’hypothèses manquantes, de données non représentatives ou observées avec des erreurs, etc. (Doukouré, 2000, pp. 4-5)

Après avoir établi le modèle, le chercheur procède à l’évaluation de sa pertinence, et ce, en mesurant l’effet d’une variable ou plutôt de chacune de ses modalités qui suppose la définition d’une situation de référence. Pour Martin (2012), cette situation de référence est « la situation à partir de laquelle on juge de l’effet de chacune des modalités. Son choix est

relativement arbitraire et sans conséquence : il consiste à désigner une modalité pour chaque variable explicative » (pp. 114-115).

Dans une étude économétrique, il existe différents types de modèles utilisés pour analyser, décrire, prévoir ou évaluer un phénomène économique. Dans le cadre de notre étude, nous avons utilisé le modèle de la régression linéaire multiple.

3.1.2. Définition du modèle de la régression linéaire multiple :

Considérons un couple de variables quantitatives (X, Y). S’il existe une liaison de cause à effet entre X et Y, le phénomène aléatoire représenté par X peut donc servir à prédire celui représenté par Y et la liaison s’écrit sous la forme :

 

Yf X

On dit que l’on fait de la régression de Y sur X.

Dans le cas d’une régression multiple de Y sur X1, X2, ..., Xp, la liaison s’écrit :

1, 2,..., p

173

Cependant, le modèle de la régression linéaire permet d’établir une liaison entre Y et les

X, comme elle permet également de quantifier, à travers les coefficients, l'importance des

associations, c’est-à-dire dans quelle mesure les variables exogènes influent sur les valeurs (ou les variations de valeurs) de la variable endogène. L'interprétation des coefficients cherche donc à mettre à jour les causalités entre ces variables (Rakotomalala, 2018, p. 129).

La régression linéaire multiple est la généralisation multi-variée de la régression simple. Elle consiste à expliquer linéairement les valeurs prises par la variable endogène Y à l'aide de p variables exogènes Xj, (j = 1,…, p). Le modèle théorique, formulé en termes de variables aléatoires, prend la forme :

0 1 ,1 ... ,

i i p i p i

Y a a X  a X

Le principe est d’estimer les valeurs des

p1

paramètres

a a0, 1,...,ap

à partir d’un échantillon de n observations, où :

i : correspond au numéro des observations

i1,...,n

; i

Y: la i-ème observation de la variable Y ;

,

i j

X : la i-ème observation de la j-ème variable ;

: l'erreur du modèle, il résume les informations manquantes qui permettrait d'expliquer les valeurs de Y à l'aide des p variablesXj.

a a0, 1,...,ap

(les coefficients) : sont les paramètres à estimer.

Rakotomalala (2018) résume le processus de modélisation dans les étapes suivantes : - l’estimation des valeurs des coefficients

a a0, 1,...,ap

à partir d'un échantillon de données (estimateur des moindres carrés ordinaires).

- l’évaluation de la précision de ces estimations (biais, variance des estimateurs).

- la mesure du pouvoir explicatif du modèle dans sa globalité (tableau d'analyse de variance, coefficient de détermination).

- le teste de la réalité de la relation entre Y et les exogènesXj (test de significativité globale de la régression).

- le teste de l'apport marginal de chaque variable explicative dans l'explication de Y (test de significativité de chaque coefficient).

- le teste de l'apport d'un groupe de variables explicatives dans l'explication de Y (test de significativité simultanée d'un groupe de coefficient).

174

- le calcul de la valeur prédite ˆ

i

Y et la fourchette de prédiction pour un nouvel individu i pour lequel il est fourni la description

Xi,1,...,Xi,p

.

- l’interprétation des résultats en mettant en avant notamment l'impact des variables exogènes sur la variable endogène (interprétation des coefficients, analyse structurelle) (pp. 85-86).