• Aucun résultat trouvé

Structure de l'échantillon et pondération des données

Chapitre 1: Méthodologie et collecte des données

1.6. Structure de l'échantillon et pondération des données

Un ménage défaillant a été remplacé par celui qui le suit sur la feuille de dénombrement. Si ce dernier est aussi défaillant, alors c'est le ménage qui vient avant le premier ménage défaillant, dans la même liste, qui le remplace. On refait cette procédure

jusqu'à ce qu'on obtienne un ménage répondant. L'hypothèse par laquelle se base cette procédure est que les ménages voisins se ressemblent plus que les ménages distants en ce qui concerne les conditions économiques et sociales de vie.

Tableau 3: Type de ménage (urbain rural ensemble)

Type de ménage GCU CUS Rural Total Proportion

Ménage issu du tirage aléatoire 1 120 2 776 4 044 7 941 95,4

Ménage remplaçant suite à un refus 41 125 89 255 3,1

Ménage remplaçant suite à une absence 22 9 24 55 0,7

Ménage remplaçant suite à une autre raison 22 24 19 65 0,8

Total 1 206 2 934 4 176 8 316 100,0

Source: INSTAT/DSM/ENTE 2007

Pondération des données

Les inverses des probabilités de tirage respectives des unités d'enquête constituent le système de pondération ou facteur d'extrapolation utilisé lors des traitements et analyses des données de l'ENTE 2007. Le rapport de 27,6 entre le poids minimal et le poids maximal est dû au fait que la délimitation des zones de dénombrement (ZD) date de 1993 (le plus récent RGPH). Il est alors fort probable que les évolutions des effectifs des populations des différentes ZD présentent des divergences assez nettes.

Tableau 4: Distribution des pondérations

MILIEU Minimum Maximum Moyenne Médiane

Urbain 62,7 1 209,8 236,9 169,2

Rural 89,7 1 732,9 657,8 553,4

Total 62,7 1 732,9 448,3 343,4

Source: INSTAT/DSM/ENTE 2007

Les 18 ménages sélectionnés par segment représentent d'une façon équiprobable les N ménages du segment tiré. Ce segment représente tous les segments de la ZD avec une probabilité proportionnelle à l'estimation des tailles des segments. Au cas où il n'y a qu'un seul segment, cette dernière probabilité est 1.

La formulation mathématique de la pondération est:

s s = Strate où z est tiré (22 régions en croisement aux 2 milieux: urbain et rural) Tz,s = Nombre de toits de la ZD z de la strate s

T(g,z),s = Nombre de toits du segment g de la ZD z de la strate s

nz,s = Nombre de ZD à visiter de la strate s dans l'échantillon Pz,s = Taille en termes de ménage de la ZD z de la strate s

P.,s = Taille en termes de ménage de la strate s (c'est-à-dire la somme des Pz,s dans la strate s)  

Fiabilité des estimations

Une des manières de connaître les précisions respectives des résultats d'une enquête statistique est de calculer les coefficients de variation et les effets d'échantillonnage. Pour plus de clarté, il a été choisi de présenter quelques estimations par leurs intervalles de confiance.

Tableau 5: Population de 0 à 17 ans, par région et sexe

Garçons % Filles % Ensemble %

On ne peut pas démontrer d'une façon incontestable que les résultats d'une ou plusieurs enquêtes soient la situation exacte sur le terrain. Malgré cela, le fait d'obtenir des valeurs estimées, d'une grandeur structurelle, comparables à partir de plusieurs enquêtes indépendantes permet d'affirmer que ces chiffres reflètent la réalité. Ainsi, quelques résultats obtenus de l'ENTE 2007 ont été comparés avec ceux de l'EPM 2005.

 

Tableau 6: Comparaison des niveaux d’instruction entre ENTE 2007 et EPM 2005 selon le milieu de résidence

                      Unité: en %

Milieu Urbain Rural Ensemble

Niveau d'instruction ENTE 2007 EPM 2005 ENTE 2007 EPM 2005 ENTE 2007 EPM 2005

Sans instruction 20,8 23,8 31,6 36,7 28,8 33,8

Primaire 43,3 47,4 54,4 54,0 51,5 52,5

Secondaire 28,6 21,7 12,6 8,3 16,8 11,2

Supérieur 7,4 7,2 1,4 1,0 3,0 2,4

Total 100,0 100,0 100,0 100,0 100,0 100,0

Source: INSTAT/DSM/ENTE 2007

Tableau 7: Comparaison du taux d’alphabétisation des individus de 15 ans et plus selon le milieu de résidence entre ENTE 2007 et EPM 2005.

Unité: en %

Milieu Urbain Rural Ensemble

ENTE 2007 79,1 58,7 64,2

EPM 2005 75,9 58,9 62,9

Source: INSTAT/DSM/ENTE 2007

1.7. Enseignements tirés de l’ENTE 2007 et améliorations futures Périodicité des enquêtes sur le travail des enfants

Pour un meilleur suivi des évolutions du travail des enfants à Madagascar, nous proposons une mise à jour de la base de données ENTE tous les 2 ans. Il est envisageable de coupler l'ENTE à d'autres enquêtes auprès des ménages. Il est aussi possible d'introduire un questionnaire très allégé de l'ENTE auprès des ménages systématiquement sélectionnés au cours du dénombrement du prochain Recensement Général de la Population et de l'Habitat (RGPH).

Programmation des activités de l'enquête

L'accord entre l’IPEC et l'INSTAT a été conclu le 30 mai 2007. Afin de pouvoir mieux capter la fréquentation scolaire des enfants, la collecte des données n'a pu être entamée qu'une cinquantaine de jours après la rentrée scolaire de septembre 2007 (période après laquelle les effectifs dans les écoles sont plus ou moins stables). Pour les futures ENTE, la programmation du début de la collecte des données devrait se faire au mois d'avril. Cela permettra d'éviter la période de pluie pendant laquelle il est difficile d''accéder les localités rurales à Madagascar.

Amélioration de la saisie des données

On a constaté que le logiciel de saisie et de traitement des données Cs Pro est limité dans certaines options, par exemple la sauvegarde d’un enregistrement partiel. La perte des données en cas de coupure de courant au moment de la saisie était un problème majeur pour les opérateurs de saisie.

L’objectif pour le futur projet est d’étudier profondément et d'utiliser au maximum la performance du logiciel, sa force et sa faiblesse, pour avoir une manipulation simple, claire, et une automatisation de certaines fonctionnalités concernant les opérateurs de saisie.

Il faudrait envisager également:

- la possibilité de saisie contrôlée (suivant les fourchettes ou modalité de réponse, les sauts,..)

- la possibilité de test inter-champ (pour voir la cohérence entre deux ou plusieurs variables), etc.

Echantillon et supervision de l'enquête

Afin d'améliorer les précisions des indicateurs, notamment pour les statistiques détaillées au niveau des régions, il est préférable d'augmenter la taille de l'échantillon jusqu'à 12 000 ménages ou plus. En effet, cela permettra d'augmenter la probabilité d'obtenir un échantillon plus étendu d'enfants âgés de 5 à 17 ans. Il en est de même pour le sous échantillon d'enfants économiquement actifs, d'enfants déplacés et ceux victimes de pires formes de travail des enfants. Par ailleurs, pour rehausser la fiabilité des données, la fréquence des supervisions et les ressources humaines pour ces prévisions devrait être augmentée. Cet élargissement de l'échantillon et l'augmentation des supervisions dépendront des ressources financières et/ou temporelles disponibles.