• Aucun résultat trouvé

Souvenirs gardés des date d'événements

N/A
N/A
Protected

Academic year: 2021

Partager "Souvenirs gardés des date d'événements"

Copied!
5
0
0

Texte intégral

(1)

HAL Id: halshs-01010985

https://halshs.archives-ouvertes.fr/halshs-01010985

Preprint submitted on 21 Jun 2014

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Souvenirs gardés des date d’événements

Marc Barbut

To cite this version:

Marc Barbut. Souvenirs gardés des date d’événements. 2008. �halshs-01010985�

(2)

Souvenirs gardés des dates d'événements Marc Barbut

Avertissement : la question posée.

Ce texte inédit répond à une question pratique soumise à Marc Barbut en novembre 2008, sur la fiabilité des souvenirs dans les enquêtes rétrospectives. Le problème peut être résumé comme suit : on réalise une enquête sur une série d'événements qui se sont déroulés pendant un intervalle de temps donné t0 antérieur à l'enquête. Après avoir dénombré et daté ces événements, on cherche à les décrire en détail. Pour des raisons pratiques (longueur du questionnaire), on demande aux personnes interrogées de décrire seulement les n derniers événements relatés. Cette procédure entraîne donc une surreprésentation des faits les plus récents.

Déjà préoccupant dans toutes les enquêtes rétrospectives, ce biais est très important lorsque la nature des événements recensés dépend de la période de l'année : consommation de certains produits alimentaires, perpétration de certains crimes ou délits. Pour atténuer ce biais dans les études de marché portant sur la consommation courante des ménages, on réalise des enquêtes périodiques, par exemple trimestrielles. Pour les enquêtes de victimation, qui portent généralement sur de plus gros échantillons, la meilleure solution est probablement celle qu'a adoptée le Bureau of the Census des États Unis pour le National Crime Survey (NCS) : enquête sur panel dans laquelle chaque mois un sous-échantillon est interrogé sur les victimations subies au cours des six mois précédents 1. Dans la plupart des autres pays qui réalisent des enquêtes de victimation, l'échantillon n'est interrogé qu'au début de l'année civile, et l'inventaire porte sur la totalité des victimations subies au cours de l'année précédente ; les victimations liées à des périodes particulières risquent donc, si elles ont eu lieu plusieurs mois auparavant, d'être à la fois sous-représentées, et surtout mal rapportées en raison du peu de fiabilité des souvenirs anciens ("défaillances de la mémoire"

dans les enquêtes rétrospectives). C'est par exemple le cas pour les cambriolages de résidences principales, qui se produisent surtout pendant les vacances d'été, c'est-à-dire cinq à six mois avant l'enquête (réalisée dans le courant du mois de janvier).

La question posée à Marc Barbut était donc : peut-on estimer l'importance de ce biais en fonction du nombre d'événements rapportés par chaque personne interrogée ? Cette question était illustrée par les résultats de plusieurs séries de simulations 2, fournissant une évaluation du nombre d'événements décrits en détail en fonction de quatre paramètres : le nombre de mois dans la période de référence adoptée dans l'enquête (t0), le nombre d'événements réellement survenus pendant cette période pour chaque personne interrogée (n), la date de ces occurrences (θ), et le nombre d'événements dont on demandait qu'ils soient rapportés en détail. Dans une première série de simulations, on avait supposé que les événements se répartissaient aléatoirement pendant la période de référence (pas de variations saisonnières) ; les séries suivantes avaient pris en compte ce cinquième paramètre.

Nous donnons ci-après le premier des tableaux de la première série, tableau que Marc Barbut a utilisé pour illustrer sa démarche.

Jean-Paul Grémy (Centre Maurice Halbwachs)

1 Pour une description succincte de cette procédure, voir : Jean-Paul Grémy, "La première enquête nationale de victimation au monde : le National Crime Survey", in : Alain Bauer (sous la direction de), La criminalité en France, Rapport de l'Observatoire national de la délinquance 2007, CNRS Éditions, 2007, 103-110.

2 Ces simulations portaient sur 100 000 individus fictifs. La longueur de la période de référence variait de six mois à deux ans, et le nombre d'événements, de 1 à 10. Au vu des résultats, Marc Barbut a souligné à quel point, malgré la taille des échantillons simulés, les distributions pseudo-aléatoires générés par la fonction random de

(3)

Date Nombre d'événements survenus pendant la période de référence

1 2 3 4 5 6 8 10

Juillet 16,9 % 2,8 % 0,5 % 0,1 % ε % ε % 0,0 % 0,0 %

Août 16,6 % 8,2 % 3,3 % 1,1 % 0,4 % 0,1 % ε % 0,0 %

Septembre 16,6 % 14,0 % 8,6 % 5,0 % 2,8 % 1,4 % 0,4 % 0,1 % Octobre 16,5 % 19,7 % 17,0 % 13,5 % 10,1 % 7,2 % 3,5 % 1,6 % Novembre 16,7 % 24,9 % 28,4 % 28,5 % 26,8 % 24,8 % 19,4 % 14,2 % Décembre 16,7 % 30,4 % 42,2 % 51,8 % 59,9 % 66,5 % 76,7 % 84,1 % Total 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 %

Tableau A1. Distribution de la date du dernier événement de la période de référence, selon le nombre d'événements du même type déclarés pendant cette période.

Période de référence de six mois (exemple sur 100 000 répondants).

La réponse de Marc Barbut.

Soit un intervalle de temps (0, t0), t0 > 0.

On tire (tirages indépendants) un échantillon de n réalisations d'une variable aléatoire T définie sur cet intervalle et de fonction de répartition F(t) :

F(t) = Pr (T < t).

Rangeons les n valeurs tirées t1, t2, ..., tk, ..., tn par ordre décroissant ; on a : t0 ≥ t1 ≥ t2 ≥ ... ≥ tk ≥ ... ≥ tn ≥ 0

La probabilité pour que t1 (c'est à dire la plus proche de la borne supérieure t0 de l'intervalle) soit inférieure à t donné est évidemment que les n tirages aient donné un résultat inférieur à t. Comme les tirages sont indépendants, c'est donc [F(t)]n.

On pose :

Pr (t1 < t) = Gn,1 (t) = (F(t))n.

Quant à la probabilité pour que t1 soit compris entre deux instants θ1 et θ2, c'est : Pr [θ1 < t1 < θ2] = Gn,12) - Gn,11) = (F(θ2))n - (F(θ1))n

Si enfin on a réalisé un nombre N de séries de n tirages, la valeur espérée (ou

"théorique") du nombre d'observations comprises dans l'intervalle de temps (θ1, θ2), c'est : N [Gn,12) - Gn,11)] = N [(F(θ2))n - (F(θ1))n]

(4)

Cas particulier :

F est la distribution uniforme F(t) =

t0

t de densité F'(t) =  t =

0

1

t constante.

Alors, la probabilité pour que la plus grande observation t1 soit comprise dans un intervalle (θ1, θ2) est :

Gn,12) - Gn,11) = n

n n

t0

1

2

 

Et la valeur théorique pour N séries de tirages :

n n

tn

N

1 2 0

 

Exemples 3 :

t0 = 6 mois, n = 10, N = 100 000 (|| Tab. A1) t0 = 6 mois, n = 2, N = 100 000 (|| Tab. A1)

Mois θ Valeurs théoriques Mois θ Valeurs théoriques

juillet 0 0,05 juillet 0 2 778

août 1 1,70 août 1 8 333

septembre 2 96,00 septembre 2 13 889

octobre 3 1 636,50 octobre 3 19 445

novembre 4 14 421,00 novembre 4 25 000

décembre 5 83 843,00 décembre 5 30 555

Total 6 100 000,00 Total 6 100 000

Remarques :

1. D'une façon générale, on a pour la kième observation Tk (toujours rangées par valeurs décroissantes) :

Pr (t < tk < t + dt) = dGn,k (t) = F  t

F t dF t

k

n n n k 1 k 1

1

1





3 Ces deux exemples correspondent respectivement à la dernière et à la deuxième colonne du tableau de données simulées A1. Nous n'avons pas reproduit un troisième exemple basé sur un autre tableau (A3), dans lequel la

(5)





b

a est le nombre binomial

!

!

! b a b

a

D'où :

Pr (Tk < t) = Gn,k (t) =   x x dx k

n n k

t

F n k 1

0 1

1

1





Si F est la distribution uniforme, la borne supérieure de l'intégrale est

t0

t .

Le calcul de G est fastidieux, mais faisable (fonctions dites "bèta" de l'analyse). En particulier, l'étude de la plus petite observation Tn est aussi simple que celle de la plus grande.

Il y a là une piste pour le psychosociologue.

2. Ce qui serait vraiment intéressant, du point de vue de la modélisation en psychosociologie, ce serait, sur des données réelles (et d'un même domaine) de rechercher quelle est la fonction de répartition F(t) qui en rend le mieux compte (problèmes d'ajustement). Il n'est pas impossible que ce soit là que l'exponentielle (pour F) reprenne des couleurs.

_____________________________

Cette note était accompagnée de la lettre suivante :

25 novembre 2008 Cher ami,

Voici la question que vous me posiez entièrement résolue.

Les courbes que vous avez construites sont non des exponentielles, mais des polynômes de d° successifs 0, 1, 2, ,…, n-1, … pour un tirage de taille 1, 2, 3, …, n, … respectivement *.

Je suis à votre disposition pour aller plus avant, car je crois (cf. ma remarque finale) qu'il y a une piste intéressante pour la modélisation mathématique en psychologie-sociologie.

Bien à vous

Marc Barbut

* car (x+1)n - xn = nxn - 1 +

2 ) 1 (n

n xn - 2 + … + nx + 1 cf. ma note jointe.

Références

Documents relatifs

1) Dans le cas du lancer de dé, si le dé n’est pas truqué, chaque issue a pour probabilité 1 6. Toutes les boules sont indiscernables

On note X la variable aléatoire qui vaut 1 si l’on obtient un chiffre multiple de 3 et 0 sinon.. Théorème 5 (Loi de Bernoulli et indicatrice

Deux événements A et B sont indépendants s’il n’y aucun lien de causalité entre eux, c’est à dire si la réalisation de l’un n’a aucun impact sur la réalisation de

Présence de votre marque sur le plan média et la.. signalétique le

Plusieurs accompagnateurs à votre service pour des sorties raquette à neige mais aussi un programme complet de balades à pieds. Le bureau vous propose des sorties au départ

public function createNewButton(event:MouseEvent):void { //on crée un autre bouton, avec une variable Button à qui on associe un événement. var myButton:Button =

Ville de Nouméa Journée internationale pour l’élimination des violences à l’égard des femmes. Maison

LUNDI À 16H00 CURLING HUMAIN -POUR TOUS ACCES LIBRE DANS LA LIMITE DES PLACES DISPONIBLES.. MARDI À 16H00 - POUR TOUS ACCES LIBRE DANS LA LIMITE DES