• Aucun résultat trouvé

L'offre de travail des chauffeurs de taxi : un duel de modèles

N/A
N/A
Protected

Academic year: 2021

Partager "L'offre de travail des chauffeurs de taxi : un duel de modèles"

Copied!
71
0
0

Texte intégral

(1)

L’offre de travail des chauffeurs de taxi

Un duel de modèles

Mémoire

Hugo Leblond

Maîtrise en économie

Maître ès arts (M.A.)

Québec, Canada

(2)

L’offre de travail des chauffeurs de taxi

Un duel de modèles

Mémoire

Hugo Leblond

Sous la direction de:

Vincent Boucher, directeur de recherche Bernard Fortin, codirecteur de recherche

(3)

Résumé

L'objectif de ce mémoire est d'identier le modèle de comportement qui illustre le mieux le processus décisionnel du travailleur. Plus particulièrement, j'y oppose le modèle intertemporel au modèle d'atteinte d'objectif (ou modèle reference-dependent). Pour ce faire, j'utilise des données portant sur l'ensemble des courses eectuées par les chaueurs de taxi new-yorkais pour l'année 2013. An de simuler des variations de salaire, j'utilise les conditions météorolo-giques.

J'observe d'abord, à l'aide de plusieurs régressions par Moindres Carrés Ordinaires, les réac-tions du marché lors d'une période de mauvais temps. À la fois l'ore et la demande semblent augmenter. Je tente ensuite, à l'aide d'un modèle de mélange gaussien, de déterminer s'il y a de l'hétérogénéité dans le comportement des chaueurs. Je trouve un possible eet de spécia-lisation. Je continue mon analyse par l'estimation d'élasticités en régressant le log du nombre d'heures travaillées sur le log du salaire. Je me prémunis du problème d'endogénéité du sa-laire en utilisant l'estimateur par Moindre Carrés en Deux Étapes, avec comme instruments le niveau de précipitation moyen et la vitesse moyenne du vent lors du quart de travail. Les élas-ticités obtenues se situent entre 0,43 et 0,57. Je termine avec l'estimation d'un modèle probit sur la probabilité d'arrêter de travailler, avec comme facteurs principaux le nombre d'heures eectuées et le montant d'argent accumulé. L'eet rapporté pour le montant accumulé est négatif.

(4)

Table des matières

Résumé iii

Table des matières iv

Liste des tableaux v

Liste des gures vii

Remerciements ix

Introduction 1

1 Revue de littérature 3

1.1 Mise en contexte . . . 3

1.2 Les tenants du modèle reference-dependent . . . 4

1.3 Les partisans du modèle intertemporel . . . 6

2 Les modèles en opposition 8 2.1 Le modèle intertemporel . . . 8

2.2 Le modèle reference-dependent . . . 12

2.3 Distinction des modèles . . . 15

3 Les données 16 3.1 Source et manipulations . . . 16

3.2 Pourquoi l'industrie du taxi ? . . . 19

3.3 Sur l'utilisation de grandes bases de données . . . 20

4 Méthodologie et résultats 21 4.1 Vérication d'hypothèses . . . 21

4.2 Les réactions du marché face à la pluie . . . 23

4.3 Estimation d'élasticités . . . 33

4.4 Modèle de choix discret . . . 38

Conclusion 44

(5)

Liste des tableaux

3.1 Description des données sous forme par course . . . 18 3.2 Distribution des courses selon le temps . . . 18 3.3 Description des données sous forme par quart . . . 19 4.1 Réactions du marché des taxis au mauvais temps. Régressions par MCO (sans

contrôles) . . . 26 4.2 Réactions du marché des taxis au mauvais temps. Régressions par MCO (avec

contrôles) . . . 27 4.3 Résultats d'un FMM à deux composantes d'une régression du nombre de courses/heure

sur le mauvais temps. . . 30 4.4 Résultats d'un FMM à deux composantes d'une régression du nombre d'heures

travaillées sur le mauvais temps . . . 31 4.5 Résultats d'un FMM à deux composantes d'une régression de la distance/heure

sur le mauvais temps . . . 32 4.6 Résultats de la première étape des régressions par MC2E . . . 36 4.7 Élasticitées estimées par MC2E . . . 37 4.8 Eets marginaux moyen d'une estimation probit, par mois, de la probabilité

d'arrêter de travailler à la n d'une course . . . 43 .9 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de janvier . . . 51 .10 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de février . . . 52 .11 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de mars . . . 53 .12 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois d'avril . . . 54 .13 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de mai . . . 55 .14 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de juin . . . 56 .15 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de juillet . . . 57 .16 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois d'août . . . 58 .17 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

(6)

.18 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de octobre . . . 60 .19 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

travailler à la n d'une course pour le mois de novembre . . . 61 .20 Eets marginaux moyen d'une estimation probit de la probabilité d'arrêter de

(7)

Liste des gures

(8)

À ma petite soeur Audrey qui, comme un taxi, ne reste jamais longtemps en place.

(9)

Remerciements

En premier lieu, je tiens à remercier chaleureusement mes directeurs, MM. Vincent Boucher et Bernard Fortin, sans qui ce mémoire ne serait qu'une pâle copie de lui-même. Vincent, par sa grande générosité, sa disponibilité, son enthousiasme (et bien d'autres raisons), a fortement contribué à faire de ma maitrise une expérience heureuse.

Je désire également souligner mon immense gratitude pour le Centre de recherche sur les risques, les enjeux économiques et les politiques publiques (CRREP), qui par son nancement aura permis bien plus que la simple complétion d'un travail universitaire.

Le corps professoral du département, pour la qualité d'enseignement, la passion et le dé-vouement dont j'ai été témoin depuis le tout début de ma formation au baccalauréat, mérite également le témoignage de ma reconnaissance.

Je ne peux oublier mes parents, Mario et Francine, à qui je dois tout. Merci ! Je ne le démontre pas souvent, mais sachez que je vous aime. Avec votre soutien, j'ai encore une fois  battu Bowser .

Enn, impossible d'oublier ma copine Marie-Êve, qui mérite bien plus que des remerciements pour ses sacrices et sa patience lors des deux dernières années. À toi, je dirai simplement ceci ...  Ta*****k ! Merci hein ! .

Je m'arrête ici, bien que je pourrais continuer ainsi et faire de ces remerciements un chapitre complet, tant il y a de personnes envers lesquelles je suis reconnaissant . . .

(10)

Introduction

Parmi les modèles les plus étudiés en économie du travail se trouve le modèle néoclassique intertemporel (ou modèle du cycle de vie). Au nombre des prédictions de ce modèle, on re-trouve que le travailleur cherche à augmenter le nombre d'heures oertes lorsqu'il observe une augmentation temporaire de son salaire (en absence d'eet de richesse).

Bien que cette prédiction semble évidente, Camerer, Babcock, Lowenstein et Thaler (1997), en analysant le comportement des chaueurs de taxi new-yorkais, identient plutôt une relation négative entre variation temporaire du salaire et heures de travail. Ceux-ci travailleraient donc longtemps lorsque les salaires sont faibles et peu lorsqu'ils sont élevés.

Dans le but de trouver une explication à cette curiosité, les auteurs suggèrent l'utilisation d'un modèle qui tire son origine de la théorie d'aversion à la perte, développée entre autres dans les articles de Kahneman et Tversky (1979) et Tversky et Kahneman (1991). Dans ce modèle, on suppose que l'individu a des préférences qui dépendent d'un point de référence (ici en termes de revenu). On suppose de plus que l'agent est plus sensible aux variations de revenu qui le mènent en desous de ce point de référence qu'aux variations le menant au-dessus. La conséquence directe de ces deux hypothèses est qu'il se crée une cassure autour du point de référence, qui mène à cette relation négative.

Plusieurs études ont depuis tenté d'opposer ces deux modèles et ce dans divers contextes. Certains donnent raison au modèle intertemporel. C'est le cas, entre autres, de Oettinger (1999) pour des données portant sur les vendeurs de hot-dog dans les stades de baseball américains. Fehr et Gotte (2007), qui utilisent des données sur les courriers à vélo allemands, estiment eux aussi des élasticités positives. Ces derniers observent cependant une diminution de l'eort fourni chez certains travailleurs, ce qui les incitent à croire en la pertinence du modèle alternatif. En utilisant des données fournies par une rme d'empaquetage de poires, Chang et Grass (2013) argumentent en faveur du modèle avec point de référence.

L'objectif de mon mémoire sera donc d'identier lequel de ces deux modèles est le plus adé-quat pour expliquer mes données. Celles-ci portent sur l'industrie du taxi new-yorkais et com-prennent la totalité des courses eectuées au courant de l'année 2013. À l'instar des études qui m'ont précédé, la méthode utilisée pour départager le modèle vainqueur de ce duel se résume

(11)

principalement à l'estimation de quelques élasticités par moindres carrés ordinaires et par va-riables instrumentales, ainsi que d'un modèle probit sur la décision d'arrêter de travailler suite à l'accomplissement d'une course.

La pertinence de cet exercice s'inscrit d'abord dans un contexte académique. De plus, dans la mesure où le processus de mise en place et d'évaluation des politiques scales est basé sur l'idée de posséder des prédictions solides, on peut trouver un intérêt provenant des instances gouvernementales. Si, comme le prétendent Camerer, Babcock, Lowenstein et Thaler (1997), l'ore de travail d'un individu est déterminée selon un modèle diérent du modèle intertem-porel, l'utilisation des estimés habituels pourrait poser problème. Il peut également y avoir un intérêt provenant du côté entrepreneurial. Une bonne compréhension de la façon dont ré-agissent les travailleurs suite à une variation de leur salaire peut avoir un impact important quant à la structure d'incitatifs qu'une entreprise doit mettre en place.

L'apport principal de ce travail à la littérature se fait avant tout par de nouvelles estima-tions d'élasticités. De plus, l'utilisation de données d'une aussi grande ampleur est peu com-mune. Enn, l'utilisation d'un modèle de mélange gaussien (Finite Mixture Model) dans le but d'explorer l'hétérogénéité du comportement chez les chaueurs est, à ma connaissance, une première.

Le reste de mon mémoire est présenté comme suit. Dans le premier chapitre, j'expose une revue de littérature, composée des principaux articles qui analysent le contexte des chaueurs de taxi. Dans le second chapitre, j'explique de façon plus exhaustive les deux modèles qui sont mis en opposition. À travers le troisième chapitre, je discute des données utilisées, de leur pertinence et souligne quelques dicultés associées à leur utilisation. Tout au long du quatrième chapitre, je fais l'exposé des méthodes retenues pour mener à bien mon analyse et je rapporte les résultats obtenus.

(12)

Chapitre 1

Revue de littérature

Dans ce chapitre, je présente le contexte duquel est née la littérature sur mon sujet. Je résume ensuite les principales études qui font l'analyse du comportement d'ore de travail et qui utilisent des données sur les chaueurs de taxi. Je distingue celles-ci selon le modèle que favorisent leurs conclusions, tout en essayant de conserver un ordre chronologique.

1.1 Mise en contexte

Dans Tversky et Kahneman (1991), les auteurs font suite à leurs travaux sur les choix en situation d'incertitude et développent le type de modèle reference-dependent1. À travers cet

article, ils argumentent que le modèle classique de prise de décision par maximisation d'uti-lité ne reète pas correctement la réad'uti-lité. Plus précisément, le modèle généralement présenté fait l'hypothèse que l'utilité est continûment diérentiable. Cette hypothèse est démentie par les auteurs, qui suggèrent au contraire la présence possible d'une discontinuité dans l'utilité marginale. Ainsi selon eux, le taux auquel l'individu est prêt à échanger un bien est diérent selon qu'il s'agisse pour lui de faire l'acquisition ou de subir une perte dudit bien. Les auteurs démontrent le bien-fondé de leur hypothèse en relatant une variété de constats expérimentaux. Entre autres exemples, les auteurs rapportent une expérience menée à plusieurs reprises par Kahneman, Knetsch et Thaler (1990).

Dans cette expérience, une tasse est distribuée aléatoirement au tiers des étudiants d'une classe. Chaque participant reçoit ensuite un questionnaire. Au tiers possédant une tasse (les  vendeurs ), il est demandé d'indiquer, pour plusieurs prix allant de 0,50$ à 9,50$, s'ils sont prêts à vendre la tasse ou non. De façon similaire, certains autres étudiants (les  choisisseurs ) devaient indiquer, pour les mêmes prix, leurs préférences entre une tasse et la somme d'argent. À travers cette expérience, les deux groupes sont placés dans la même situation, à la diérence près de leur dotation initiale. Tous doivent choisir entre une tasse ou une somme d'argent. Du

(13)

point de vue des choisisseurs, puisqu'ils ne possèdent rien, les deux options sont perçues comme des gains. Les vendeurs quant à eux perçoivent l'échange (en partie) comme la perte de leur dotation. Comme les deux situations reètent un choix identique, on s'attendrait à voir des réponses similaires pour les deux groupes. Toutefois, les réponses aux questionnaires indiquent que la valeur médiane attribuée à la tasse était de près de 7,00$ pour les vendeurs et près de 3,50$ pour les choisisseurs. Les auteurs expliquent cette diérence par ce qu'ils appellent un eet de dotation (endowment eect). Cet eet peut se résumer ainsi : le fait de posséder un objet (qui possède une valeur d'usage autre que l'échange) entraine une sorte d'attachement émotionnel, qui contribuerait à la douleur associée à l'action de s'en départir.

An d'apporter une explication à l'ensemble des constats qu'ils présentent, Tversky et Kah-neman proposent une alternative au modèle classique de prise de décision. Dans ce nouveau modèle, qualié de reference-dependent, le preneur de décision est considéré comme étant averse à la perte.

1.2 Les tenants du modèle reference-dependent

1.2.1 Camerer, Babcock, Loewenstein et Thaler (1997)

Dans le contexte du travailleur qui doit déterminer ses heures de travail et de loisir, le modèle intertemporel ne semble pas avoir toujours vu ses prédictions être confortées. L'une de ces prédictions est que suite à une variation de salaire temporaire n'aectant pas l'utilité marginale de la richesse du travailleur, celui-ci travaillera davantage.

Dans certaines études cependant, qu'elles aient été menées sur une base de données agrégée, de cohorte ou en panel, les estimations d'élasticités salaire de l'ore de travail étaient faibles et non signicatives ou encore négatives. C'est du moins ce que rapportent Camerer, Babcock, Loewenstein et Thaler (1997). Les études susmentionnées analysent cependant des contextes où les variations de salaire sont rarement réellement temporaires, ce qui nécessite des hypothèses supplémentaires. Au nal, comme le soulignent les auteurs, les résultats déconcertants obtenus par celles-ci peuvent être attribuables à des erreurs de spécication.

Dans le but de tester le comportement d'ore de travail suite à une variation transitoire du salaire, les auteurs proposent l'utilisation d'un contexte où les salaires sont relativement constants à travers une journée et non corrélés d'un jour à l'autre. Il leur sera ainsi possible d'éviter les pièges rencontrés par leurs prédécesseurs. Dans un tel contexte, une augmenta-tion de salaire, puisqu'elle est temporaire, n'a qu'un impact négligeable sur la richesse du travailleur. Suivant cette proposition, les auteurs retiennent des données sur les chaueurs de taxi new-yorkais pour leur analyse. Pour ces travailleurs, les salaires dépendent en partie de chocs temporaires sur la demande, causés par exemple par la température, les conventions, un dysfonctionnement des autres types de transports en commun... Pour trois bases de données

(14)

diérentes, les élasticités salaire de l'ore estimées sont pratiquement toutes négatives, à la fois par la méthode des moindres carrés ordinaires (-0.186 à -0.618) et par celle de variable instru-mentale (0.005 à -1.313). Ainsi, les auteurs obtiennent peu de conrmation que les chaueurs suivent le modèle de comportement néoclassique. Entre autres explications, ils soulignent la possibilité d'un modèle de comportement avec des préférences de type reference-dependent, où le travailleur se xe un objectif de revenu à atteindre.

1.2.2 Chou (2002)

Chou (2002) reprend la conclusion de Camerer et coll. (1997) et tente d'opposer directement les deux types de modèle en utilisant des données portant sur les chaueurs de taxi singapouriens. Les données ont été récoltées par un sondage que l'auteur à lui-même créé. En procédant ainsi, il évite les problèmes généralement rencontrés dans la littérature. De plus, il lui est ainsi possible d'obtenir de l'information qui n'est pas directement disponible pour les autres auteurs, tel que l'expérience du travailleur, l'âge, l'éducation, la taille de la famille... Son sondage lui permet également d'aborder la question de manière directe auprès des chaueurs, en leur posant des questions sur leur comportement de travail lors d'une journée payante. Comme dans le cas de Camerer et coll. (1997), les résultats obtenus par Chou (2002) pointent vers le modèle reference-dependent. Que ce soit par MCO (-0.0997 à -0.5850) ou en utilisant des méthodes de variable instrumentale (-0.1644 à -0.8939), les élasticités estimées sont toutes négatives. Il démontre également que les chaueurs ayant déclaré travailler davantage lors de journées à salaire élevé achent des élasticités encore plus négatives que ceux ayant armé travailler le nombre d'heures habituel.

1.2.3 Crawford et Meng (2011)

L'analyse menée par Crawford et Meng (2011), au contraire des auteurs précédents, ne pré-sente aucune estimation d'élasticité. Elle suit plutôt l'analyse empirique faite par Farber (2005 ; 2008), qui utilise des modèles probit an de déterminer la probabilité d'arrêter de travailler suite à l'atteinte du point de référence2. Les auteurs se basent également sur un modèle

théo-rique de préférence reference-dependent proposé par K®szegi et Rabin (2006), où le travailleur se xe deux cibles simultanément, l'une en terme de revenu et l'autre en terme d'heures de tra-vail. Ainsi, travailler davantage que prévu est considéré comme une perte, tout comme le fait de ne pas atteindre le montant désiré. Dans ce modèle, les points de référence sont déterminés en tant qu'anticipations rationnelles, sur la base d'une moyenne des jours précédents.

En prenant soin de séparer leurs observations selon que le chaueur fait face à un salaire plus ou moins élevé que leur moyenne au début de son quart de travail, les auteurs estiment la probabilité d'arrêter de travailler selon le nombre d'heures et le montant obtenu. Ils trouvent

(15)

que, pour les chaueurs faisant face à un salaire élevé, seul le nombre d'heures travaillées a un impact signicatif. À l'inverse, pour ceux qui observent un salaire plus faible, le seul impact signicatif sur la décision d'arrêter vient du revenu. Dans les deux cas, la décision est davantage inuencée par le second objectif atteint. Comme Crawford et Meng (2011) le soulignent, cette inversion dans le comportement s'explique mieux par un modèle de préférence reference-dependent. La conclusion de leur article est en faveur de ce modèle.

1.3 Les partisans du modèle intertemporel

1.3.1 Farber

Dans son premier papier sur le sujet, Farber (2005) fait le point sur la tension naturelle qui existe entre les deux modèles. Avec des données de l'an 2000 portant sur les chaueurs new-yorkais, il fait ressortir des arguments en faveur du modèle néoclassique. Entre autres, en utilisant un modèle probit, il démontre que la probabilité qu'un chaueur décide d'arrêter de travailler dépend davantage du nombre d'heures travaillées que du montant récolté dans la journée. En reprenant l'analyse faite par Camerer et coll. (1997), il obtient lui aussi des élasticités négatives (-0.637), mais souligne, comme l'ont fait les auteurs, que cette estimation est sujette à un biais négatif3. Farber argumente également que les salaires à travers une

même journée sont variables, mais qu'ils ne sont pas fortement corrélés d'une heure à l'autre, ce qui le pousse à croire que ceux-ci ne peuvent être considérés comme un paramètre valide dans la décision d'ore de travail d'un chaueur. Ses résultats contradictoires le poussent à arguer que cette diérence de conclusion entre les auteurs dépend des méthodes économétriques utilisées. Il explore également la question d'hétérogénéité de comportement chez les travailleurs en répétant son analyse pour chacun des chaueurs présents dans son échantillon. Enn, il mentionne avoir eectué un sondage informel auprès de plusieurs chaueurs lors de ses déplacements dans la ville. Ce sondage, quelque peu analogue à celui mené par Chou (2000), lui permet d'illustrer le quotidien des chaueurs.

En utilisant les mêmes données, Farber (2008) propose un autre modèle probit qui admet l'existence d'un point de référence. Il obtient cette fois que la probabilité d'arrêt, une fois la cible atteinte, est substantielle. Il trouve cependant, d'un jour à l'autre, une forte variation dans la cible établie. Il en conclu que le pouvoir prédictif d'un point de référence sur l'ore de travail est  vraisemblablement très limitée et que d'avantages de recherches sont nécessaires. Farber (2015) réplique et allonge à nouveau l'analyse de Camerer et coll. (1997). Il se base cette fois lui aussi sur un modèle de préférences reference-dependent avec anticipations ra-tionnelles inspiré par celui de K®szegi et Rabin (2006). Il utilise un sous-échantillon d'une

3. Dans ces deux articles, la variable utilisée en guise de salaire horaire est calculée en prenant le revenu d'un quart de travail et en le divisant par le nombre d'heures travaillées. Cette problématique sera abordée dans la section méthodologie et résultat.

(16)

base de données portant sur les chaueurs new-yorkais, couvrant l'entièreté des années 2009 à 2013. Au contraire des autres études, il évite ainsi une faiblesse récurrente relativement aux petits échantillons. Les résultats de son étude donnent à nouveau raison au modèle néoclas-sique intertemporel. Farber distingue les variations de salaire selon qu'elles sont prévisibles ou non et argumente qu'un modèle reference-dependent ne peut qu'expliquer une petite partie du comportement d'ore chez les travailleurs4. En utilisant encore une fois un modèle de choix

discret pour estimer la probabilité d'arrêter de travailler, il rapporte que celle-ci est forte-ment inuencée par le nombre d'heures travaillées et, au mieux, faibleforte-ment par le revenu. Les élasticités salaire estimées par Farber sont comprises entre 0.3672 et 0.87515.

Il tente à nouveau de déterminer si les deux types de comportement sont présents dans ses données, mais n'en trouve que des preuves faibles. Il démontre enn que les chaueurs tendent à devenir de meilleurs optimisateurs, c'est-à-dire à se comporter davantage selon le modèle intertemporel, à mesure qu'ils gagnent en expérience. Aussi, les chaueurs inexpérimentés qui achent de faibles élasticités ont plus tendance à quitter l'industrie.

4. Comme je le mentionne dans la section suivante, une variation de salaire qui est prévisible pourra inciter le travailleur à revoir à la hausse son objectif de revenu. Farber trouve que seulement 1/8 des variations de salaire sont imprévisibles.

(17)

Chapitre 2

Les modèles en opposition

J'ai fait mention, à travers le chapitre précédent, des modèles de comportement d'ore de travail intertemporel et reference-dependent. Dans ce chapitre, je les explique plus en détail et tente ainsi de démontrer le conit naturel qui existe entre eux.

2.1 Le modèle intertemporel

Ce premier modèle est un cas rané du modèle de base en économie, où l'on permet la projection dans le temps. Suivant celui-ci, on suppose que l'individu cherche à maximiser sa fonction d'utilité sous une contrainte de richesse, le tout sur son horizon de vie. Ce faisant, il planie donc sa consommation et ses heures de loisir (déni comme le temps qui n'est pas passé à travailler) pour chaque période de sa vie. An d'obtenir des résultats analytiques simples et aisément interprétables, la forme fonctionnelle de l'utilité est souvent spécier comme étant intertemporellement séparable, telle que1 2 :

U = T X t=0  G(Ct) + J (Lt)  1 (1 + ρ)t

1. Cette hypothèse est toutefois restrictive dans la mesure où elle ne permet pas de prendre en considération les habitudes de consommations de l'agent. Autrement dit, la consommation à une période donnée n'aecte pas l'utilité d'une autre période.

2. De plus, la forme proposée ici est également séparable d'une manière intratemporelle, c'est-à-dire qu'on ne permet pas la présence d'une complémentarité entre la consommation et le loisir pour une période donnée.

(18)

Où : U représente l'utilité totale ; t représente l'indice de temps ;

G(Ct) est l'utilité instantanée de la consommation ;

Ct est le niveau de consommation au temps t;

J (Lt) représente l'utilité instantanée du loisir au temps t;

Lt est le nombre d'heure de loisir au temps t;

ρ représente le taux de préférence pour le présent.

Et où : G0

(Ct) > 0 ; G00(Ct) < 0

J0(Lt) > 0 ; J00(Lt) < 0.

La contrainte de richesse quant à elle est représentée par l'expression suivante3 :

A0− T X t=0 1 (1 + r)t  Ct− st(1 − Lt)  ≥ 0

Où : A0 représente la valeur des actifs de l'agent à la période initiale ;

r représente le taux d'intérêt réel du marché (constant par hypothèse) ; st représente le salaire horaire de l'agent à la période t.

Cette dernière stipule simplement que la valeur de la consommation faite par l'individu au courant de sa vie doit être au plus égale à sa richesse initiale plus son revenu de travail. Pour simplier, on considère que l'agent ne touche aucun revenu hors travail. Enn, pour chaque période, l'agent doit faire face à une contrainte de temps : 1 − Lt ≥ 0 (le temps total étant

normalisé à 1). Le Lagrangien du programme de maximisation de l'agent est donc représenté par l'équation suivante :

L = T X t=0  G(Ct) + J (Lt)  1 (1 + ρ)t+ λ0  A0− T X t=0 1 (1 + r)tCt− st(1 − Lt)   + T X t=0 µt1 − Lt 

où λ0et µtsont des multiplicateurs de Lagrange et s'interprètent respectivement comme étant

l'utilité marginale de la richesse et l'utilité marginale du travail au temps t. De celle-ci, on

3. An de simplier l'exposé, je présente ici une version du modèle où l'agent est en situation de certitude quant au futur. L'interprétation reste toutefois la même.

(19)

obtient les conditions de premier ordre (C.P.O.) suivantes pour t= 0, . . . , T : δL δCt = G 0(C t) (1 − ρ)t − λ0 (1 + r)t = 0 δL δLt = J 0(L t) (1 − ρ)t − stλ0 (1 + r)t = 0 δL δλ0 = A0− T X t=0 [Ct− st(1 − Lt)] (1 + r)t = 0 δL δµt = T − Lt≥ 0 µt≥ 0 ; µt1 − Lt = 0

Selon ce modèle, une augmentation de salaire entraine deux eets distincts sur la décision d'ore de travail, soit un eet de substitution et un eet de richesse. L'eet de substitution reète l'eet d'un changement dans le rapport des prix sur la demande d'un bien, tel que le niveau d'utilité reste constant. Dans le modèle néoclassique dynamique tel que celui-ci, il existe deux types d'eets de substitution, soit celui à l'intérieur d'une période (intratemporel) et celui entre les périodes (intertemporel). L'eet intratemporel s'observe directement en prenant le rapport entre les deux premières C.P.O sur une même période t. Celui-ci nous indique le taux auquel l'agent acceptera d'échanger du loisir contre de la consommation à cette période (pour une solution intérieure où µt= 0). On le dénote :

T M Sintra = st=

J0(Lt)

G0(C t)

.

Le salaire étant le prix d'une heure de loisir, une augmentation de celui-ci incite le travailleur à diminuer sa demande d'heure de loisir. De façon équivalente, l'augmentation de salaire rend le travail plus attrayant et incite à augmenter l'ore de travail4.

2.1.1 Variations transitoires et permanentes des salaires

An de rendre lisse son niveau de consommation entre les diérentes périodes de sa vie, le travailleur a la possibilité de substituer le nombre d'heures travaillées entre celles-ci. Par exemple, sachant qu'il sera un jour à la retraite, l'agent pourra prendre la décision de travailler davantage et de consommer moins lors de sa vie active pour en tirer prot lors de ses vieux jours, tout en conservant un niveau de consommation relativement constant. À travers les lignes suivantes, je tente d'illustrer par quel mécanisme le modèle intertemporel tient compte des changements dans l'ore de travail lors d'une variation de salaire entre les périodes.

4. Il est toutefois important de noter que ce résultat est une conséquence directe de l'hypothèse de sépara-bilité intertemporelle l'utilité.

(20)

Toujours avec les deux premières C.P.O., il est possible de tirer directement les fonctions de demande de consommation et de loisir, respectivement formulées :

Ct= G0−1  (1 − ρ) (1 + r) t λ0  ; Lt= J0−1  (1 − ρ) (1 + r) t λ0st  .

La dénition d'une heure de loisir implique que l'ore de travail dépend des mêmes paramètres et est formulée telle que :

Ht= 1 − Lt= 1 − J0−1  (1 − ρ) (1 + r) t λ0st  .

On constate aisément que ces fonctions dépendent de l'utilité marginale de la richesse λ05.

Ce paramètre peut être perçu comme étant une statistique exhaustive résumant l'eet des variables monétaires des autres périodes6. Pour s'en convaincre, il sut de remplacer les

fonctions de demande de consommation et de loisir dans la troisième C.P.O. pour obtenir l'expression (implicite) de λ0 suivante :

A0− T X t=0 1 (1 + r)t " G0−1 1 − ρ 1 + r t λ0  − st  1 − J0−1 1 − ρ 1 + r t λ0st  # = 0.

Ainsi, les demandes de consommations et de loisir, de même que l'ore de travail, sont aec-tées par les salaires passés et futurs seulement à travers λ0. C'est l'eet richesse mentionné

plus tôt. On peut voir que, pour un horizon T susamment large, une augmentation de salaire n'aectant qu'une seule période (variation transitoire) n'aura pratiquement pas d'inuence sur λ0 puisque son importance sera négligeable. Par contre, cette augmentation aectera

directe-ment et positivedirecte-ment l'ore de travail pour la période en question. Inversedirecte-ment, dans le cas d'une augmentation permanente du prol des salaires, l'utilité marginale de la richesse sera plus fortement aectée. Si tous les salaires augmentent d'une même proportion, λ0sera divisée

d'autant. Au niveau de l'ore de travail au temps t, l'eet de la variation de λ0 annulera celui

du salaire st.

En résumé, dans la mesure où le loisir est considéré comme un bien normal, l'eet richesse incite l'agent à revoir son ore de travail à la baisse suite à une augmentation de salaire. Des eets richesse et substitution, l'un sera dominant et inuencera le nombre d'heures de travail oertes. Selon que l'augmentation est permanente ou temporaire, l'eet dominant sur la décision des heures travaillées peut être diérent. Dans le cas d'une augmentation permanente et égale pour toutes les périodes, les deux eets sont présents et s'annulent. S'il s'agit au contraire d'une

5. Par conséquent, il ne s'agit pas ici de fonctions de demande classiques.

6. Par variables monétaires, j'entends surtout les salaires, mais également les taux d'intérêts et de préférence pour le présent.

(21)

augmentation transitoire, l'eet richesse sera généralement négligeable et l'eet substitution dominera, entrainant une augmentation de l'ore de travail.

Lors de l'estimation d'une fonction d'ore de travail, considérer λ0 comme une constante

revient à se poser dans une perspective de variation de salaire transitoire, tel que précédemment décrit. Ce type d'ore porte le nom d'ore de travail frischienne7.

2.2 Le modèle reference-dependent

Ce modèle alternatif souvent proposé dans la littérature prend son origine dans la théorie de l'individu averse à la perte8. Il s'agit également d'un modèle de maximisation d'utilité, mais

pour lequel la fonction qui est maximisée contient au moins une composante qui est évaluée relativement à un point de référence subjectif à l'individu.

L'aversion à la perte se traduit, au niveau de la fonction d'utilité, par une valeur associée aux pertes plus élevée (en absolu) par rapport aux gains. Dit autrement, |f(−x)| > |f(x)|. Ainsi, la désutilité ressentie par l'individu qui se trouve sous son point de référence d'un montant x sera supérieure à l'utilité de dépasser ce même point par un montant x. On considère également que la sensibilité de l'individu face aux gains et aux pertes est généralement décroissante. Contrairement à l'hypothèse très semblable d'utilité marginale décroissante, celle-ci n'implique notamment pas que la fonction d'utilité soit concave sous le point de référence.

Cependant, le contexte auquel je désir appliquer ce modèle nécessite un ajustement de la fonc-tion d'utilité. Soit un travailleur qui se xe une cible en terme de revenu. Même si celle-ci n'est pas atteinte, le travailleur retirera tout de même une certaine dose d'utilité de sa rému-nération. C'est pourquoi il est nécessaire d'ajouter à cette fonction une composante  utilité de consommation qui attribue une valeur à ce montant. La représentation graphique devient maintenant plus familière, semblable à la gure 2.1, où I, T , L et w sont respectivement le revenu, le point de référence, les heures de loisir et le salaire9.

Formellement, tel que le fait Farber (2015), il est possible de représenter l'utilité d'un tel travailleur par la fonction suivante :

U(h) =    a(wh − T ) − h1+σ si wh − T < 0 b(wh − T ) − h1+σ si wh − T ≥ 0

7. Dans la mesure où λ0 est constant, mais dière d'un travailleur à l'autre, l'estimation adéquate des

paramètres d'une fonction frischienne nécessite de prendre en compte la présence d'eets xes (MaCurdy, 1981).

8. Voir Kahneman and Tversky (1979) et Tversky et Kahneman (1991)

9. La gure représente le cas linéarisé an de facilité la distinction par rapport à la fonction d'utilité usuelle. Cela est équivalent à relâcher l'hypothèse de sensibilité décroissante.

(22)

U (I) I T I L U1 T w

Figure 2.1  Fonction d'utilité et courbre d'indiférence reference-dependent linéarisé.

où I = wh est le revenu, T est l'objectif de l'individu en terme de revenu, w est le salaire horaire, h est le nombre d'heures travaillées, a > b > 0 sont des coecients qui servent à contrôler l'utilité marginale avant et après l'atteinte de l'objectif et σ > 0 est un paramètre aectant l'élasticité salaire de l'ore. Les prédictions du modèle reference-dependent sont les suivantes10:

 Si I − T < 0 l'équation d'ore de travail est donnée par

h∗ =  aw

1 + σ 1

σ

et l'élasticité salaire de l'ore est

1 σ > 0.

Cela implique qu'à de faibles niveaux de salaire, c'est-à-dire des salaires qui ne per-mettent pas au travailleur d'atteindre son objectif à l'intérieur d'une période de travail donnée, ce dernier se comporte de manière similaire au modèle intertemporel. Ainsi, une augmentation de salaire temporaire dans cet intervalle se traduit par une augmen-tation de l'ore de travail. Si l'on se pose dans le contexte d'un chaueur de taxi, ce modèle prédit que le chaueur sillonnera les rues de la ville, peinant à trouver des clients, jusqu'à ce qu'il décide que le salaire n'en vaille plus l'eort.

(23)

 Si I − T = 0 l'ore de travail est donnée par

h∗ = T w et l'élasticité salaire de l'ore est égale à -1.

Aussitôt que le salaire est assez élevé pour atteindre sa cible, le chaueur travaillera jusqu'à l'atteinte de celle-ci mais pas davantage. Ce dernier se comporte ainsi sur un certain intervalle de salaire. Dans cet intervalle, il considère le salaire plus élevé que la valeur qu'il accorde à une heure de loisir, mais considère également qu'il ne vaut pas la peine de travailler davantage. Cela implique qu'une augmentation de salaire contenue dans cet intervalle entrainera une diminution de l'ore de travail, puisque l'objectif est atteint de plus en plus rapidement.

 Si I − T > 0 l'ore de travail est donnée par

h∗ = bw 1 + σ

σ1 et l'élasticité salaire est à nouveau égale à

1 σ > 0.

Ici la seule diérence avec le cas Y − T < 0 est la substitution des paramètres a et b. Comme ce sont deux paramètres positifs, les prédictions sont essentiellement les mêmes. Ainsi, lorsque le salaire se trouve à des niveaux supérieurs, le travailleur recommence à avoir un comportement similaire au modèle intertemporel. À ces niveaux, le chaueur atteindra sa cible rapidement et à ce point réalisera que son salaire est au moins égal au montant pour lequel il serait prêt à continuer de travailler. Ainsi la relation entre heures travaillées et salaire redevient positive.

Économiquement, cette structure à trois intervalles peut sembler curieuse. Il s'agit ici des prédictions mathématiques du modèle. Pour que celles-ci tienne la route, il serait nécessaire de poser des hypothèses supplémentaires, à savoir, que le chaueur xe son objectif avant de commencer à travailler et que celui-ci ne puisse être modié une fois qu'il a commencé à travailler. Supposons un chaueur en présence d'un salaire en dessous de ses attentes, qui ne lui permet pas d'atteindre sa cible. Ce dernier cherchera à minimiser la désutilité associée au fait de manquer sa cible et travaillera jusqu'à ce que cela lui soit trop pénible. Si au contraire on permet au travailleur de réviser sa cible, alors celui-ci devrait logiquement la déterminer de façon à ce qu'elle soit atteignable avec le taux horaire qu'il observe. En procédant ainsi, il se trouvera à l'endroit où l'élasticité salaire de l'ore est négative.

(24)

Comme je l'ai mentionné plus tôt dans la revue de littérature, les points de référence des chaueurs sont déterminés selon le principe des anticipations rationnelles. Plus précisément, cette cible serait basée sur le revenu espéré, lui-même fonction de l'espérance des salaires précédents et du nombre d'heures que le chaueur désire travailler à ce niveau de salaire. Il est donc important de mentionner que cette structure de comportement n'est valide que pour les variations de salaires qui sont imprévisibles et temporaires. En eet, si le travailleur est au fait d'un évènement futur quelconque qui aura un impact sur son salaire, celui-ci sera en mesure de xer une cible en conséquence, ce qui aura potentiellement sur son ore de travail un eet similaire au modèle intertemporel. Enn, pour que la relation négative puisse être observée, les variations de salaire doivent se trouver relativement près du point de référence, au risque d'amener le travailleur dans l'une des  zones intertemporelles . Ainsi, ces nombreuses conditions font en sorte que l'intervalle de salaire dans lequel le modèle reference-dependent est pertinent devient relativement court (Farber 2015).

2.3 Distinction des modèles

En résumé, le modèle intertemporel prédit une augmentation de l'ore de travail suite à une variation temporaire du salaire. À l'opposé, le modèle reference-dependent prédit qu'une diminution de l'ore sera causée par une augmentation temporaire et imprévue du salaire, dans la mesure où celle-ci se situe dans un certain intervalle autour du point de référence de l'individu. Puisque, comme les études présentées plus tôt, je cherche à déterminer lequel de ces deux modèles explique le mieux le comportement des chaueurs de taxi, il me faut trouver une source de variation de leur salaire qui soit temporaire et imprévisible. Par conséquent, je retiens les conditions météorologiques comme causes de telles variations. Celles-ci sont évidemment temporaires et, comme je le vérie dans la section des résultats, l'ampleur de leur impact sur le niveau de salaire est relativement imprévisible. Je fais l'hypothèse que le mauvais temps entraine une hausse dans la demande de services de taxi. Cette hausse de demande se traduit pour les chaueurs par une plus grande aisance à trouver des opportunités de courses. Comme un chaueur tire son revenu du nombre de courses qu'il eectue, il s'ensuit pour lui une augmentation de revenu. Ce montant divisé par le nombre d'heures travaillées sera ma mesure pour le salaire.

Au nal, si les chaueurs se comportent conformément au modèle intertemporel, ils répondront aux mauvaises conditions météorologiques en travaillant plus longtemps. Si au contraire le mo-dèle reference-dependent est celui qui est suivi, les chaueurs diminueront la quantité d'heures travaillées lors de journées pluvieuses (à condition de se trouver dans l'intervalle pertinent).

(25)

Chapitre 3

Les données

Dans ce chapitre, je discute des données utilisées an de départager les deux modèles. J'y décris les manipulations eectuées pour en faire le nettoyage. Je décris ensuite les données de façon sommaire. Je termine en expliquant les raisons derrière l'utilisation de ces données.

3.1 Source et manipulations

An de réponde à ma question de recherche, j'utilise une base de données portant sur l'industrie du taxi new-yorkais. Ces données sont disponibles directement sur le site internet de la Taxi and Limousine Commission (TLC) de la ville de New York, qui est l'agence gouvernementale municipale en charge de réguler l'industrie1. Créée en 1971, la commission a comme rôles

principaux de délivrer les permis nécessaires, xer les tarifs et procéder à l'inspection des véhicules.

Au moment d'écrire ces lignes, les données disponibles couvrent la totalité des courses eec-tuées pour les années 2009 à 2015. Elles contiennent de l'information sur l'endroit ainsi que la date exacte de départ et d'arrivée, la distance parcourue, le tarif en vigueur ainsi que le nombre de passagers (rapporté par le chaueur). Pour chaque course, le numéro de licence du chaueur est disponible. Vu l'importante taille de ces données, je restreins mon analyse sur les 168 793 839 courses eectuées au cours de l'année 2013.

Ces données sont récoltées et colligées de manière électronique à travers les compteurs présents à l'intérieur de chaque taxi, pour le compte de la TLC. Comme c'est souvent le cas, et bien que le processus de récolte d'information soit automatisé, mes données sous leur forme brute ren-ferment certaines incongruités. Par exemple, certaines observations montrent des courses dont les points de départ ou d'arrivée se retrouvent en pleine mer. D'autres encore se feraient à des vitesses largement supérieures aux limites légales. Quelques chaueurs, à l'image d'un numéro

1. Nous sommes redevables de l'accessibilité publique de ces données à M. Christopher M. Whong, qui en 2014 en a fait la demande auprès de la commission sous le couvert de la Freedom of Information Law

(26)

de cirque, auraient réussi à entasser au-delà de 200 passagers dans leur véhicule. Quoique dans plusieurs cas le reste des informations soient raisonnables, ces incongruités démontrent que les procédés technologiques ne sont pas infaillibles. Pour cette raison, je procède au nettoyage des données en leur imposant certaines conditions logiques.

En utilisant l'information sur les points de départ et d'arrivée, qui suivent le système GPS, je restreins la localisation d'une course à l'intérieur du territoire américain, à l'exception de l'État d'Alaska. Toutes courses lors desquelles le rapport de distance/temps dépasse la limite de 85miles (136,8 km) par heure est écartée2. Toute observation pour laquelle le nombre de

passagers est supérieur à 30 est retirée, ce qui permet de conserver les cas particuliers où le véhicule est une limousine3. Enn, est supprimée toute course qui ache un tarif négatif ou

qui se termine plus tôt qu'elle ne débute.

Une fois le nettoyage eectué, ma base de données, sous sa forme où chaque observation repré-sente une course, contient 167 951 567 observations. Ce sont donc 0,5% des données qui ont été supprimées. J'ajoute ensuite à ma base de données de l'information sur la température, colli-gée par le Network for Environment and Weather Applications (NEWA)4. Le NEWA est un

réseau de stations météorologiques réparties dans le nord-est des États-Unis, qui enregistrent des données à toutes les heures. La station consultée est NYC-Central Park. À chacune des courses donc, sur la base de son heure de départ, est associées la température (°F), le taux de précipitation de pluie (mm/h) ainsi que la vitesse du vent (km/h) correspondante.

Dans le tableau 3.1, je présente un sommaire des variables continues de ma base de données. En utilisant l'information relative aux dates précises lors desquelles les courses sont eectuées, je suis en mesure de connaître le mois, le jour et le moment de la journée pour chacune de ces observations. Cela me permet également d'identier les jours de fête les plus susceptibles d'avoir un impact sur les déterminants du marché. La distribution des courses dans le temps, selon chacune de ces catégories, est présentée dans le tableau 3.2. Par exemple, 13.23% des courses eectuées en 2013 ont débuté un lundi ; 9.09% lors du mois de mars, 0.27% lors de la journée du Super Bowl et 12,87% ont commencé la nuit5.

Puisque mon intérêt porte sur l'ore de travail chez les chaueurs, j'aurai également besoin d'une base de données contenant de l'information sur la durée des périodes travaillées. Je dénis donc, pour chaque chaueur, un quart de travail comme étant une période de travail

2. Il s'agit ici de la limite légale la plus élevée, tous États confondus. Elle correspond à celle du Texas sur la grande route interÉtats en milieu rural.

3. Comme en témoigne le site internet de la TLC, il existe une ore de service relative aux limousines. Le client doit en faire le préarrangement auprès d'une compagnie spécialisée. La limite de 30 a été retenue sur la base des produits oerts par ces diérentes compagnies. Toutefois, il semblerait que le groupe de client le plus nombreux pour l'année étudiée ait été composé de 9 personnes.

4. Le NEWA a été fondé en 1995 par le New York State Integrated Pest Management (IPM) et est nancé, à travers celui-ci, par l'État de New York et la Cornell University (entre autres).

5. Je sépare une journée en quatre périodes de 6 heures, avec la nuit commençant à 00h00 et terminant à 6h00

(27)

Table 3.1  Description des données sous forme par course Variables Moyenne Écart-Type Min. Max. Nombre de passagers 1.711 1.3759 1 9 Temps (min) 12.64 9.35 0.02 332 Distance (km) 4.673 5.415 0 365.882 Prix total ($) 14.75 11.84 0 600 Température (°F) 55.37 17.79 11 97 Pluie (mm/h) 0.144 0.9874 0 26.924 Vitesse du vent (km/h) 9.361 6.077 0 44.418

Table 3.2  Distribution des courses selon le temps Jour Période Lundi 13.23 % Mardi 14.26 % Mercredi 14.42% Jeudi 14.74% Vendredi 15.22% Samedi 15.15% Dimanche 12.97% Matin 24.06 % Après-midi 28.42 % Soir 34.66 % Nuit 12.87 % Fêtes Mois Nouvel An 0.24% Super Bowl 0.27% Saint-Valentin 0.3% Pâque 0.26% Jour du souvenir 0.19% 4 juillet 0.19% Fête du travail 0.19% Action de Grâce 0.19% Noël 0.14% Veille du jour de l'an 0.27%

Janvier 8.51 % Février 8.06 % Mars 9.09 % Avril 8.73 % Mai 8.51 % Juin 8.32 % Juillet 8.03 % Août 7.34 % Septembre 8.23 % Octobre 8.75 % Novembre 8.33 % Décembre 8.1 %

d'une durée d'au moins 30 minutes, séparée d'une autre par au moins 6 heures sans qu'aucune course ne soit eectuée. À partir de cette dénition (empruntée à Farber(2015)), il m'est possible de transformer les données sous leur forme par course pour les avoir par quart de travail. Sous cette forme, je possède de l'information sur le nombre de courses eectuées, le temps total passé avec un client, la distance totale parcourue avec un client, le revenu total des courses eectuées ainsi que la moyenne de la température, de la vitesse du vent et des précipitations. La durée du quart est quant à elle calculée comme étant la diérence entre la date de n de la dernière course et la date de début de la première6. Le tableau 3.3 présente

(28)

de l'information sur la distribution de ces variables.

Table 3.3  Description des données sous forme par quart

Variables Moyenne Écart-Type Min. Max. Durée du quart (h) 8.51 3.34 0.5 199.99 Nombre de courses 21.59 9.464 1 476 Nombre de passagers 36.955 34.396 1 2061 Temps total avec client (min) 272.31 108.1 0.05 8 438 Distance totale avec client (km) 100.95 43.185 0 3168.21 Revenu total des courses ($) 318.21 122.46 0.01 8757.04 Précipitation moyenne (mm/h) 0.1379 0.5637 0 26.92 Vitesse du vent moyenne (km/h) 9.1539 4.3651 0 44.4178 Température (°F) 56.5638 17.7413 11 97

3.2 Pourquoi l'industrie du taxi ?

L'utilisation de données portant sur le marché du taxi new-yorkais s'explique par la composi-tion de l'industrie. Les taxis jaunes iconiques de la ville, seuls autorisés à prendre des clients les ayant hélés dans les rues de Manhattan, se divisent selon deux types de médaillons7. Les

 médaillons de otte identient les taxis appartenant à une sorte de garage et qui sont loués à des chaueurs possédant eux-mêmes une licence. Pour ce type de médaillon, le propriétaire doit en posséder au minimum deux et chacun de ceux-ci doit être en activité pendant au moins neuf heures, deux fois par jour. L'autre type, les médaillons indépendants, sont quant à eux attribués individuellement. Le propriétaire de ce type de médaillon a lui aussi la possibilité d'en faire la location auprès d'un chaueur.

L'entente généralement établie entre le propriétaire et le locataire est que les frais de la période de location sont avancés par ce dernier. Une fois ces frais et le coût de l'essence encourus, le locataire peut conserver la totalité du revenu des courses eectuées. Ainsi, qu'ils soient propriétaires ou non, les chaueurs internalisent les coûts de production et sont libres de décider du nombre d'heures qu'ils travaillent8. Il s'agit donc d'un cadre idéal an de tester

des modèles de comportement d'ore de travail qui se base sur une maximisation d'utilité (Chou 2002, Farber 2015).

Le point de référence étant le 1er janvier 1960, la valeur de 0 lui est attribuée. Ainsi, une diérence de date

est équivalente au temps écouler depuis le temps 0.

7. Un médaillon étant une sorte de licence attachée au taxi

8. On ne les voit pas contraints de respecter un certain nombre d'heures par semaine. Les primes associées aux heures supplémentaires, souvent source de réticence chez les employeurs, ne sont pas présentent dans cette industrie.

(29)

3.3 Sur l'utilisation de grandes bases de données

Bien que l'utilisation d'un échantillon d'aussi grande taille apporte une meilleure précision aux estimations, celle-ci entraine également quelques complications. En plus de l'intensité des calculs, l'une des principales complications vient des méthodes d'inférences statistiques, généralement utilisées sur des échantillons de petite taille, qui peuvent mener à des conclusions trompeuses ou inexactes (Lin, Lucas et Shmueli 2013). Entre autres, un problème connu sous le nom de  problème de la p-value , où on attribue une signicativité à des eets inmes, est souvent rencontré. An de se garantir des pièges causés par ce phénomène, Lin, Lucas et Shmueli (2013) proposent plusieurs solutions simples.

Parmi celles-ci, les auteurs recommandent aux chercheurs d'être textuellement clairs quant à l'interprétation des paramètres et des eets estimés. Autrement dit, les chercheurs ne devraient pas simplement s'attarder au signe et au niveau de signicativité du paramètre, mais également à l'ampleur de celui-ci. De plus, ils recommandent de rapporter ces eets en spéciant un intervalle de conance. Ceci a deux avantages. Le premier est que contrairement à la p-value qui indique seulement la probabilité de rejeter l'hypothèse nulle sans se tromper, l'intervalle de conance donne une meilleure idée de l'ampleur de l'eet estimé. Le second avantage est qu'il devient bien plus facile de comparer les résultats entre les diérentes études, faire la synthèse de celles-ci et ainsi contribuer à l'avancement des connaissances. Le reste des suggestions des auteurs impliquent principalement des représentations graphiques servant à illustrer l'évolution des estimations à mesure que la taille de l'échantillon augmente.

Ainsi, je devrai rester prudent lors de l'interprétation de mes résultats. Pour me prémunir le plus possible des problèmes associés à la grande taille de ma base de données, j'essaierai d'appliquer au mieux possible les principales recommandations de cette étude.

Une autre alternative simple, proposée entre autres par Greene(2003), serait de simplement diminuer, à mesure que la taille de l'échantillon augmente, le seuil auquel on admet la si-gnicativité. Par contre, cette méthode reste très subjective et il n'existe aucune règle pour déterminer ce seuil (Lin, Lucas et Shmueli 2013).

(30)

Chapitre 4

Méthodologie et résultats

Dans ce chapitre, je présente les résultats de mes estimations, en expliquant au passage la méthodologie utilisée. Je débute par la vérication des hypothèses relativement au contexte proposé par Camerer et coll. (1997). J'estime ensuite l'importance que peut prendre le modèle reference-dependent dans l'explication du comportement d'ore de travail chez les chaueurs de taxi. J'enchaîne en observant comment se comporte le marché lors d'un épisode de mauvaise température. Vient ensuite l'estimation d'élasticités salaire de l'ore, en tenant compte d'un problème d'endogénéité.

4.1 Vérication d'hypothèses

4.1.1 Autocorrélations des salaires

Comme je le mentionne dans ma revue de littérature, Camerer et coll. (1997) suggèrent l'uti-lisation d'un contexte où le salaire horaire est relativement constant à travers les heures d'une même journée et n'est pas corrélé d'une journée à l'autre. Je m'assure donc ici que c'est bel et bien le cas.

Dans un premier temps, je vérie l'autocorrélation des salaires à travers les heures d'une même journée. Pour ce faire, je calcule d'abord le salaire horaire médian à chacune des heures de l'année. J'observe ensuite le coecient de corrélation linéaire entre les salaires médians des heures i et i−1, dont la valeur est de 0,86. Cette valeur, positive et proche de 1, indique que la relation du salaire médian avec lui-même à l'heure précédente s'approche d'une droite de pente unitaire positive. Par conséquent, cela nous indique que si le salaire médian à l'heure i − 1 est par exemple de 15$, une heure plus tard celui-ci sera toujours autour de 15$. Autrement dit, le salaire horaire est en eet relativement constant d'une heure à l'autre (ou à travers la journée). L'importance de vérier cette autocorrélation vient du fait que, si celle-ci est négative, un chaueur suivant le modèle néoclassique se comportera de telle manière qu'il dérogera des prédictions du modèle. En eet, si celui-ci observe un salaire élevé au début de

(31)

son quart de travail, il arrêtera tôt, sachant que les salaires à venir seront vraisemblablement faibles. Inversement, constatant un faible salaire en début de journée, il travaillera longtemps, s'attendant à des salaires élevés éventuels. Puisque la corrélation que j'observe est forte et positive, je peux écarter cette possibilité.

An de vérier le niveau d'autocorrélation des salaires d'une journée à l'autre, je procède de manière similaire. Je calcule d'abord la médiane des salaires médians pour chaque jour de mon échantillon, pour ensuite vérier le coecient de corrélation entre les jours j et j −1. La valeur obtenue de 0,57 m'indique que, bien qu'elle ne soit pas particulièrement forte, il existe tout de même une corrélation linéaire entre les salaires d'un jour à l'autre. Ainsi, il semble que les variations de salaires dont sont témoins les chaueurs ne soient pas totalement transitoires. Toutefois, cette faible corrélation s'explique certainement en partie par une sorte d'eet de cycle dans les jours de la semaine et en admettant ceci, il ne me semble pas totalement absurde de croire que le contexte d'un chaueur de taxi puisse être utilisé an de tester le comportement d'un travailleur suite à une variation temporaire de son salaire.

4.1.2 Mesure de l'importance du modèle Reference-Dependent

Comme je le mentionne dans ma présentation des modèles, le comportement associé au modèle reference-dependent, soit la diminution de l'ore de travail suite à une augmentation du salaire, n'est valide que pour les variations imprévisibles. Si par exemple le chaueur est en mesure de prévoir l'amplitude d'une augmentation, il lui sera possible de se xer une cible plus élevée. Il y a donc une possibilité de confusion entre les deux modèles. An de constater dans quelle proportion le modèle alternatif peut expliquer le comportement des chaueurs, je tente de mesurer la capacité de prédiction des variations de salaire de ces derniers.

Pour ce faire, j'utilise mes données sous une forme où chaque observation représente une heure de l'année. Je procède avec une simple régression par moindres carrés ordinaires (MCO) du revenu moyen des chaueurs dans l'heure sur des variables de température et des indicatrices de temps. Les variables de température incluent les précipitations de pluie, la vitesse du vent, l'interaction de celles-ci ainsi que la température. Les variables de temps quant à elles indiquent la période du jour, le jour de la semaine, le mois et les jours de fête.

De cette régression, on peut tirer le coecient de détermination ajusté (ou ¯R2), valeur située en 0 et 1 qui donne la mesure du pouvoir explicatif du modèle. Dans cette application, cette valeur s'interprète donc comme la capacité du chaueur à prédire les salaires horaires à venir. Comme 0 < ¯R2 < 1, il s'en suit que 1 − ¯R2 donne la mesure d'imprévisibilité. La régression me donne un ¯R2 = 0, 028, ce qui implique donc que 1 − ¯R2 = 0, 972. Ainsi, près de 97% de la variation des salaires est imprévue par les chaueurs. Conséquemment, le comportement d'ore de travail chez les chaueurs de taxi new-yorkais peut s'expliquer dans une même

(32)

proportion par le modèle reference-dependent.1

4.2 Les réactions du marché face à la pluie

Avant d'enchaîner avec l'estimation d'élasticités salaire de l'ore de travail, j'analyse le com-portement des diérentes caractéristiques du marché lorsque celui-ci vit un épisode de mauvais temps. En prenant comme point de départ mes données sous leur forme où chaque observation représente une course, je transforme celles-ci pour les avoir sous une forme où chaque observa-tion représente une heure de l'année. Il m'est ainsi possible d'observer pour chaque heure : le salaire horaire ; le temps moyen (en minutes) passé avec un client à bord par les chaueurs ; la distance moyenne parcourue (en km) avec un client ; le nombre de courses eectué ainsi que le nombre de taxis sur les routes.

An de mesurer la variation de chacune de ces caractéristiques, j'ai encore une fois recours à la méthode de régression par MCO. Dans tous les cas, les variables explicatives sont mes données de température. Je regarde également, en utilisant mes données sous leur forme où chaque observation représente un quart de travail, l'eet de ces variables sur la durée moyenne de celui-ci. Enn, les variables expliquées sont toutes en logarithmique, ce qui me donne des semi-élasticités. Les résultats de ces diérentes régressions, avec et sans contrôle pour le temps, sont respectivement rapportés dans les tableaux 4.2 et 4.12. Entre parenthèses sont indiqués

les écarts-types, alors que les intervalles de conance à 95% sont rapportés entre crochets. Les résultats dont je fais mention dans le texte sont ceux des régressions avec contrôles.

Dans chacun des tableaux, la première rangée indique les coecients pour la régression sur le salaire horaire. Pour chaque millimètre de pluie supplémentaire par heure, le salaire ho-raire augmente en moyenne de 0,51%, dans l'intervalle [0,48% ; 0,54%]. La vitesse du vent a également un impact positif, avec une augmentation de 0,07% [0,068% ; 0,074%] par kilo-mètre/heure supplémentaire. L'eet d'interaction donne un coecient négatif, mais très faible et seulement signicatif à 5%, situé dans l'intervalle [-0,0049% ; -0,0002%]3 4. Pour chaque °F

supplémentaire, le salaire diminue de 0,02% [-0,0235% ; -0,0199%]. Ainsi dans l'ensemble, le mauvais temps semble augmenter les opportunités de revenu pour les chaueurs. L'impact le

1. Il serait certainement possible d'améliorer le modèle en ajoutant des variables explicatives pertinentes supplémentaires. Cependant, cette information ne m'est pas disponible. Il y a fort à parier qu'un chaueur moindrement expérimenté ait une meilleure capacité de prédiction. Toutefois, il semble plausible de croire que le niveau d'imprévisibilité reste grand.

2. Les contrôles de temps sont les mêmes indicatrices pour les fêtes, mois, jour de la semaine et période de la journée.

3. L'interaction entre la pluie et le vent permet de déterminer si le mauvais temps a un eet sous-additif (ou super-additif) sur les variables expliquées. Une fonction est dite sous-additive si f(x1+ x2) ≤ f (x1) + f (x2).

Ici par exemple, avec les eets de la pluie et du vent positifs, l'eet d'interaction négatif indique une sous-additivité. Ainsi, lors d'une journée pluvieuse, l'eet marginal du vent sur le salaire horaire sera moins élevé que lors d'une journée sans pluie. Le même raisonement s'applique pour l'eet marginal de la pluie.

4. La majorité des coecients sont signicatifs à des seuils inférieurs à 0,1%. En prenant en considération le problème de la p-value, cet eet est sans doute négligable.

(33)

plus important provient du niveau de précipitations.

La seconde ligne rapporte les coecients de la régression sur le temps passé avec un client. En moyenne, un millimètre de précipitation supplémentaire entraine une augmentation du nombre de minutes par heure passée avec un client de 1,59% [1,56% ; 1,62%]. Le vent aug-mente la durée de 0,21% [0,205% ; 0,211%] par kilomètre/heure et la température de 0,07% [0,076% ; 0,08%] par °F. L'eet d'interaction est toujours faible et négatif avec un coecient de -0,009% [-0,0117% ; -0,0064%]. Ces résultats indiquent qu'un épisode de mauvais temps augmente probablement la demande pour les courses de taxi.

La troisième rangée des tableaux 4.1 et 4.2 rapporte les résultats de la régression sur la distance parcourue par heure avec un client. L'eet d'un millimètre de pluie est d'une diminution de 0,23% [-0,273% ; -0,20%] de la distance moyenne par heure. Pour ce qui est de l'intensité du vent, il s'en suit une diminution de 0,05% [-0,056% ; -0,049%] par km/h supplémentaire. De même, chaque °F de plus diminue de 0,1% [-0,0998% ; -0,0951%] cette distance. L'interaction de la pluie et du vent ache un coecient positif de 0,01% [0,008% ;0,014%]. Ainsi, le mauvais temps diminue la distance moyenne parcourue avec un client par les chaueurs de taxi. Les résultats présentés dans la quatrième rangée sont ceux de la régression sur le nombre de courses eectuées par heure. Le millimètre de pluie additionnel augmente en moyenne le nombre de courses de 0,13% [0,061% ; 0,20%]. Pour le vent, le kilomètre/heure additionnel en-traine une augmentation de 0,23% [0,221% ; 0,23%]. L'eet d'interaction est également positif à 0,09% [0,083% ; 0,093%]. Quant à l'eet de la température, l'augmentation d'un °F fait dimi-nuer en moyenne le nombre de courses par heure de 0,1% [-0,1076% ; -0,0997%]. Ces résultats indiquent qu'une mauvaise température semble augmenter les opportunités de courses. Les coecients obtenus par la régression sur le nombre de taxis avec un client sur les routes sont indiqués à la cinquième rangée des tableaux 4.1 et 4.2. La pluie fait augmenter le nombre de taxis qui sont en fonction de 1,74% [0,075% ; 3,4%] par millimètre supplémentaire. Cet eet n'est toutefois signicatif qu'à partir du seuil de 5%. Le vent a lui aussi un eet positif de 0,33% [0,19% ; 0,47%] par km/h. L'eet d'interaction est négatif à -0.11% [-0,25% ; -0,022%] mais non signicatif. Pour la température, chaque degré de plus augmente de 0,38% [0,2884% ; 0,4799%] le nombre de taxis. Ainsi, encore une fois, le mauvais temps semble avoir un impact positif sur les opportunités de courses.

À la lumière des résultats obtenus jusqu'à présent, il semble que le modèle de comportement dominant soit le modèle néoclassique. En eet, la mauvaise température semble engendrer une augmentation de la demande, comme en témoigne l'augmentation du temps passé avec un client et la diminution dans la distance parcourue (régressions 2 et 3). Celle-ci, tel qu'indiqué par la première régression, crée à son tour une opportunité pour les chaueurs d'augmenter leur revenu. Ces derniers répondraient positivement, en augmentant le nombre de courses eectuées et par une présence accrue sur les routes (régressions 4 et 5).

(34)

Enn, la dernière rangée rapporte les coecients de la régression sur la durée du quart de travail. Chaque millimètre de plus dans l'intensité des précipitations fait en moyenne augmen-ter la durée par 0,55% [0,3807% ; 0,7229%]. L'intensité du vent a un eet contraire, avec une diminution de 0,12% [-0,1301% ; -0,112%] par km/h de plus. L'eet d'interaction est lui aussi négatif à -0,04% [-0,047% ; -0,0235%]. Pour la température, l'eet est similaire à celui du vent, soit une diminution de 0,15% [-0,1549% ; -0,1475%] par degré additionnel. Donc la pluie, qui est sans doute le facteur prépondérant dans la dénition d'une mauvaise température, semble entrainer une augmentation de l'ore de travail. Ceci est conforme avec les résultats des ré-gressions précédentes. Les chaueurs répondent positivement aux opportunités engendrées par un temps pluvieux.

Dans ce qui précède, j'ai fait l'hypothèse que le mauvais temps avait un impact à la hausse sur le salaire à travers une augmentation de la demande. Comment être certain cependant que cette hausse n'est pas plutôt due à une diminution de l'ore par les chaueurs ? Il est possible en eet d'argumenter que les intempéries puissent diminuer le plaisir de la conduite et inciter les chaueurs à diminuer leur activité. Il est vrai que je viens de démontrer une relation positive entre mauvais temps et nombre de taxis sur les routes. Par contre, cette régression ache les coecients qui sont les moins signicatifs. Dans les paragraphes qui suivent, je tente d'explorer cette hypothèse plus en détail. Je conrme d'abord l'eet sur la demande, pour ensuite me tourner vers l'ore.

Eet sur la demande

Pour conrmer l'impact des conditions météorologiques sur la demande du service de taxi new-yorkais, j'utilise mes données sous la forme d'une observation par course et procède avec une régression de la distance parcourue par course sur mes variables météorologiques. Je contrôle également pour le temps.

L'idée justiant cette régression s'illustre de la manière suivante. On imagine un individu qui doit se déplacer sur une distance relativement courte, peut-être quelques pâtés de maisons. An de se rendre à sa destination, cet individu a un choix à faire entre les diérents modes de transport qui s'orent à lui. Lors d'une journée ensoleillée, il choisira vraisemblablement l'option la moins coûteuse, soit la marche. Lors d'une journée pluvieuse cependant, cette option lui semblera moins attrayante. Il est ainsi plus probable qu'il opte pour un autre mode de déplacement, par exemple les services d'un taxi. Du point de vue du chaueur, toutes choses étant égales par ailleurs, cela équivaut à eectuer une course supplémentaire pour laquelle la distance est vraisemblablement inférieure à la moyenne. Ainsi, lors d'une journée pluvieuse, la distance moyenne eectuée lors d'une course devrait diminuer. Si le mauvais temps a l'eet que je lui suppose, je devrais donc observer une relation négative dans cette régression. Sans trop de surprises, tous les coecients d'intérêt sont négatifs. Pour chaque millimètre

(35)

T able 4.1  Réactions du marc hé des taxis au mauv ais temps. Régressions par MCO (sans con trôles) Régression Sans con trôles Pluie en mm V en t (k/h) Temp. (° F) In teraction (1) Ln Salaire horaire 0.0073 *** 0.0021 *** 0.0005 ** * -0.0002 *** (0.0001) (0.00001 ) (0.000004) (0.00001) [.007043 ;.007625] [.002073 ;.002124] [.000484 ;.000501] [-.000242 ;-.000 195] (2) Ln Temps passé av ec un clien t par heure (min.) 0.0233 *** 0.0058 *** 0.0018 ** * -0.0007 *** (0.00017) (0.00001) (0.000005) (0 .0 0001) [.022973 ;.023622] [.005732 ;.005787] [.001829 ;.001847] [-.000744 ;-.000 692] (3) Ln Distance av ec un clien t par heure (km) -0.0049 *** -0.0008 *** -0.0003 *** 0.0003 *** (0.0002) (0.00002 ) (0.000006) (0.00002) [-.005278 ;-.004502] [-.000803 ;-.000737] [-.000279 ;-.000257] [-.002728 ;-.001959] (4) Ln Nom bre de courses eectuées par heure 0.0043 *** 0.0057 *** -0.0017 *** 0. 0002 *** (0.0003) (0.00003 ) (0.000009) (0.00003) [.003601 ;.004963] [.005657 ;.005769] [-.001678 ;-.001642] [.000106 ;.000219] (5) Ln Nom bre de taxis av ec un clien t sur les routes par he ure 0.0426 *** 0.0134 *** 0.0038 ** * -0.0036 *** (0.0122) (0.001) (0.0003) (0.001) [.023708 ;.061567] [.011558 ;.015234] [.003219 ;.004436] [-.005404 ;-.001 837] (6) Ln Durée du quart de tra vail 0.0079 *** -0.0001 ** -0.00004 *** 0.00009 (0.0008) (0.00004 ) (0.00001) (0.00005) [.005939 ;.009902] [-.00024 8 ;-.000043] [-.000065 ;-.0000 21] [-.000045 ;.000229] *** signicatif à 0,1% ;** 1% ;* 5% ;' 10%.

(36)

T able 4.2  Réactions du marc hé des taxis au mauv ais temps. Régressions par MCO (a vec con trôles) Régression A vec con trôles Pluie (mm) V en t (k/h) Tem p. (° F) In teraction (1) Ln Salaire horaire 0.0051 *** 0.0007 *** -0.0002 *** -0.00003 * (0.00015) (0.00001 ) (0.000009 ) (0.00001) [.004826 ;.005407] [.000684 ;.000736] [-.000235 ;-.000199] [-.000049 ;-.000002] (2) Ln Temps passé av ec un clien t par heure (min.) 0.0159 *** 0.0021 *** 0. 0007 *** -0.00009 *** (0.0002) (0.00001) (0.00001) (0.00001) [.015569 ;.016227] [.002054 ;.00 211] [.000761 ;.0008] [-.000 117 ;-.000064] (3) Ln Distance av ec un clien t par heure (km) -0.0023 *** -0.0005 *** -0.001 *** 0.0001 *** (0.0002) (0.00002) (0.00001) 0.00002 [-.002728 ;-.001959] [-.0005561 ;-.000488] [-.000998 ;-.000951] [.00008 ;.000143] (4) Ln Nom bre de courses eectuées par heure 0.0013 *** 0.0023 *** -0.001 *** 0.0009 *** (0.0003) (0.00003) (0.00002) (0.00003) [.000605 ;.001959] [.002207 ;.002322] [-.001076 ;-.000997] [.000825 ;.0009 37] (5) Ln Nom bre de taxis av ec un clien t sur les routes par he ure 0.0174 * 0.0033 *** 0.0038 *** -0.0011 (0.0087) (0.0007) (0.0005) (0.0007) [.000754 ;.034001] [.001853 ;.004655] [.002884 ;.0047 99] [-.002453 ;-.000224] (6) Ln Durée du quart de tra vail 0.0055 *** -0.0012 *** -0.0015 *** -0.0004 *** (0.0006) (0.00004) (0.00002) (0.00005) [.003807 ;.007229] [-.001301 ;-.00112] [-.001549 ;-.001475] [-.000 47 ;-.000235] *** signicatif à 0,1% ;** 1% ;* 5% ;' 10% .

Figure

Figure 2.1  Fonction d'utilité et courbre d'indiférence reference-dependent linéarisé.
Table 3.2  Distribution des courses selon le temps
Table 3.3  Description des données sous forme par quart
Table 4.3  Résultats d'un FMM à deux composantes d'une régression du nombre de courses/heure sur le mauvais temps.
+7

Références

Documents relatifs

Inscriptions au cours de la première semaine du mois dans les maisons d’animations séniors de Dunkerque-Centre et de Malo-les-Bains.. Mardi 22 de 14 h à 16

[r]

10 Devenue « poupée russe », quand elle dansait, elle ne pouvait que partir de ce centre, de ce petit point dans l’espace logé dans son antre.. En tournant, elle se déployait le

a. Le Canada publiera des documents de référence avant le lancement de la DP définitive.. façons pour inclure l’innovation dans l’Énoncé des travaux ou les

Elle a pour objectif de remercier les donneurs et bénévoles qui se mobilisent tout au long de l’année et d’inciter de nouvelles personnes à venir donner pour la première fois..

[r]

[r]

Donne le prénom de chaque adulte et explique quel est son travail au sein de l'école.. Coller la bonne photo Coller la bonne photo Coller la