• Aucun résultat trouvé

CHAPITRE VI. A LA DECOUVERTE DE L’INFLUENCE DU CONTEXTE

Section 1. Les données et la configuration des variables

Pour tester les hypothèses H1, H2 et H3, il est nécessaire d’avoir des données sur des clients de la bancassurance ainsi que des données sur le contexte économique perçu. Nous choisissons d’utiliser la base de données d’un leader de la bancassurance française ainsi que les données de l’indice de confiance des ménages de l’INSEE.

La description des données

Nous disposons de la base de données d’un leader français des services financiers comportant 1 174 863 observations sur une période de 55 années (1954-2009). Nous disposons également des données de l’indice de confiance des ménages de l’INSEE avec une première mesure fiable en 198871.

71 L’enquête débute mensuellement en 1987 avec une première mesure fiable en 1988. SESSI. (1988). Courrier

Cette base de données a été utilisée dans la recherche de Ngobo et Devallet-Ezanno (2010), qui questionnait l’existence d’effets de génération dans le risque de défection des clients. Nous l’utilisons pour étudier un phénomène différent en mobilisant d’autres variables.

L’établissement financier dont provient la base de données a commercialisé 126 services financiers spécifiques regroupés en 10 catégories. La base de données est construite avec 3 variables clefs : l’identifiant du client, l’année d’acquisition du client ainsi que l’année en cours. Nous disposons de l’historique des relations commerciales de 14 414 clients qui ont détenu, en moyenne, 6 services financiers distincts72 (voir annexe 5 pour un récapitulatif des variables de la base de données). Ainsi, nous avons les données sur la taille du portefeuille de services financiers de chaque client, chaque année. La taille du portefeuille peut ainsi varier avec une augmentation (souscription à un nouveau service financier), ou une diminution (résiliation d’un service financier).

Nous connaissons, grâce aux variables sociodémographiques, le sexe, la situation matrimoniale ainsi que la profession et catégorie sociale des clients du prestataire, l’âge au début de la relation ainsi que l’âge tout au long de la relation.

Nous utilisons la série de l’indice de confiance des ménages de l’INSEE, à partir de laquelle nous définissons les variables du contexte économique perçu, à l’instar de la recherche de Kumar, Umashankar, Kim et Bhagwat (2014). Cet indice est un indicateur synthétique issu des réponses d’un panel représentatif de la population française sur 11 items mesurés mensuellement depuis 1987.

Comme préconisé par Katona (1975), les items représentent : le niveau de vie passé, le niveau de vie futur, le chômage, les prix passés, les prix futurs, l’opportunité d’achat, l’opportunité d’épargne, la capacité d’épargne actuelle, la situation financière personnelle passée et la situation financière personnelle future. L’indicateur est calculé selon la technique de l’analyse factorielle qui permet de résumer l’évolution concomitante de plusieurs variables dont les mouvements sont très corrélés. Le résultat est une moyenne pondérée des réponses aux items, normalisée à 100 avec un écart-type de 10.

La configuration des données

Nous commençons par créer les variables du contexte économique perçu. À partir de la série de l’indicateur synthétique annuel de l’indice de confiance des ménages « Consumer

Confidence Index CCI », nous créons le lag de cet indicateur « CCILAG ». Nous calculons la

différence entre l’indicateur initial « CCI » et son lag « CCILAG », et créons deux variables représentatives de l’expansion et de la contraction économique de la manière suivante :

𝐸𝑥𝑝𝑎𝑛𝑠𝑖𝑜𝑛𝑡 {= 𝐶𝐶𝐼𝑡

𝑐 − (𝐶𝐶𝐼𝐿𝐴𝐺

𝑡𝑐) 𝑆𝑖 Δ𝐶𝐶𝐼𝑡𝑐 > 0

= 0 𝑆𝑖 Δ𝐶𝐶𝐼𝑡𝑐 ≤ 0

Variable représentative de l’expansion économique

𝐶𝑜𝑛𝑡𝑟𝑎𝑐𝑡𝑖𝑜𝑛𝑡{= 0 𝑆𝑖 Δ𝐶𝐶𝐼𝑡

𝑐 > 0

= 𝐶𝐶𝐼𝑡𝑐 − (𝐶𝐶𝐼𝐿𝐴𝐺

𝑡𝑐) 𝑆𝑖 Δ𝐶𝐶𝐼𝑡𝑐 ≤ 0

Variable représentative de la contraction économique

Nous obtenons ainsi les variables présentées dans le tableau 6 ci-après. Par la suite, nous fusionnons les variables du contexte économique avec la base de données du prestataire, grâce à la fonction « merge » de STATA® (voir le code 1 en annexe 6).

Tableau 6. Les variables du contexte économique perçu Variable Description

EcoContext L’indice de confiance des ménages annuel

EcoContextLag L’indice de confiance des ménages annuel, retardé d’une année

Expansion Une variation positive de l’indice de confiance des ménages

Contraction Une variation négative de l’indice de confiance des ménages

La base de données est construite en panel, elle fait apparaître pour chaque année, les services financiers détenus par chaque client. D’une manière pratique, nous avons plusieurs lignes pour plusieurs services financiers, pour un même client, et une même année.

Par exemple, le client n°18 897 possédait en 1989 un total de 7 services financiers avec 3 contrats d’assurance-vie, 2 contrats d’épargne-générale, 1 contrat d’épargne-retraite et 1 contrat d’assistance à domicile. Dans la base de données, cela est représenté en 7 lignes distinctes. Cette structure ne permet pas de mesurer le multiéquipement effectif : la taille du portefeuille de services financiers de chaque client.

Nous souhaitons avoir une variable représentative de la taille ce portefeuille (multiéquipement effectif) qui fait la somme des services financiers détenus chaque année par le client. Dans un premier temps, nous agrégeons les données par rapport aux 10 catégories de services financiers définies par le prestataire, en utilisant la fonction de « collapse » de STATA® (voir annexe 5, code 2). Ensuite, nous créons la variable « Crossbuy » qui est la somme des services financiers détenus par chaque client (voir annexe 5, code 3). Nous ne supprimons aucune catégorie pour avoir une vision globale des portefeuilles des clients.

Par convention, nous retardons d’une période (« lag ») les variables de fidélité au prestataire (durée de la relation commerciale) et de l’âge des clients. Cela permet de mieux contrôler les biais de simultanéité et ainsi de limiter l’endogénéité (Reed, 2015) (voir annexe 5, code 4).

Comme la version moderne de l'indice de confiance des ménages de l’INSEE a été mise en place et ajustée en 1987, avec une première mesure fiable en 1988, nous ajoutons une condition pour conserver les observations enregistrées à partir de 1989. Dans cette configuration, nous retenons 221 971 observations de 1989 à 2009, soit une période de 21 années (voir annexe 5, code 5).

Comme cette première étude est longitudinale, nous retenons uniquement les variables indépendantes dynamiques : les variables du contexte économique, « Expansion » et

« Contraction », une variable commerciale : celle de la durée de la relation commerciale

« LoyaltyCompanyLag » ainsi qu’une variable sociodémographique, celle de l’âge du client « AgeLag ». Nous gardons également les variables de différentiation, des clients « CustomerId », des périodes du début de la relation commerciale des clients « StartYear », et des périodes en année « Year » (voir tableau 7 ci-après). Les statistiques descriptives et la matrice de corrélation des variables sont disponibles dans le tableau 8 ci-après.

Tableau 7. L’opérationnalisation des variables

Variables Opérationnalisation Variable dépendante

Crossbuy Le nombre total de services financiers détenus par le

client i l’année t, celui-ci peut varier à la hausse comme à la baisse

HOUSE Le nombre total d’assurances habitation détenues par

le client i l’année t

AUTOM Le nombre total d’assurances automobile détenues par

le client i l’année t

HEALT Le nombre total d’assurances santé détenues par le

client i l’année t

CHILD Le nombre total d’assurances enfant détenues par le

client i l’année t

LIFEI Le nombre total d’assurances-vie détenues par le

client i l’année t

DEATH Le nombre total d’assurances décès détenues par le

client i l’année t

RETIR Le nombre total d’épargnes-retraite détenues par le

client i l’année t

INVES Le nombre total de placements financiers détenus par

le client i l’année t

VARIO Le nombre total d’assurances diverses détenues par le

client i l’année t

PROFE74 Le nombre total d’assurances professionnelles

détenues par le client i l’année t

Variables indépendantes

Expansion Une variation positive de l’indice de confiance des

ménages par rapport à l’année t-1

Contraction Une variation négative de l’indice de confiance des

ménages par rapport à l’année t-1

Variables de contrôle

LoyaltyCompanyLag La durée de la relation commerciale entre le client i et

le prestataire l’année t-1

AgeLag L’âge du client i l’année t-1

Variables de groupement

CustomerId L’identifiant unique du client i

StartYear L’année j où le client i a débuté sa relation avec le

prestataire

Variable de temps

Year L’année t

74 Il s’agit d’assurances professionnelles à destination des artisans, ce n’est pas une assurance professionnelle B2B

classique. Nous gardons cette catégorie pour ne pas perdre d’informations concernant les portefeuilles de services financiers des clients.

Tableau 8. Les statistiques descriptives et la matrice de corrélation des variables

Statistiques descriptives Matrice de corrélation Moyenne Ecart-type Variance Plage Min Max 1 2 3 4 5

1.Crossbuy 3,15 2,462 6,063 14 1 15 1 -0,002 0,072 -0,099 0,175

2.Expansion 2,04 2,746 7,539 8 0 8 -0,002 1 0,531 0,002 0,009

3.Contraction -3,10 4,348 18,906 16 -16 0 0,072 0,531 1 -0,095 0,055

4.AgeLag 56,37 12,280 150,804 79 30 109 -0,099 0,002 -0,095 1 -0,054

5.LoyaltyCompanyLag 27,34 10,132 102,665 55 109 57 0,175 0,009 0,055 -0,054 1