• Aucun résultat trouvé

Chapitre 1 : Modélisation de la production nette agricole

1.2.2 Données utilisées

Les données statistiques renseignent sur les productions agricoles et les moyens de production. Nous présentons les sources utilisées pour les productions agricoles dans ce chapitre. La description des moyens de production est présentée dans le chapitre 2. L’identification des sources de données pertinentes, la collecte et l’homogénéisation des données sur la période de 1882 et 2013 représentent un travail conséquent engagé par l’équipe d’accueil et poursuivi dans le cadre de la thèse. La base de données constituée pour la modélisation de la production agricole regroupe par année, à l’échelle nationale, les surfaces et les productions végétales ainsi que les effectifs des animaux de ferme et les productions animales.

20

Pour les années de 1961 à 2013, les données statistiques sont directement extraites de la base de données internationales de FAOSTAT (FAOSTAT, 2018) pour des raisons de facilité de collecte. Les données de surface et de production des prairies et des fourrages annuels, étant absentes de la base de FAOSTAT, sont téléchargées de la base Agreste du ministère de l’Agriculture (Agreste, 2019) pour les années de 1988 à 2013. Pour la période de 1882 à 1988, les sources de données (incluant prairies et fourrages annuels) s’appuient sur les statistiques agricoles extraites de l’enquête décennale de 1892 (Ministère de l’Agriculture, 1898), l’enquête agricole de 1929 (Ministère de l’Agriculture, 1936), les statistiques agricoles annuelles pour chacune des années de 1947 à 1961 (Ministère de l’Agriculture, 1947 à 1970) et plusieurs rétrospectives incluses dans les statistiques agricoles annuelles (INSEE, 1990; Ministère de l’Agriculture, 1948) ou dans les annuaires statistiques de la France (INSEE, 1990, 1990, 1952; SGD, 1938).

Les données sur la période de 1882 à 1988 sont tirées de documents imprimés qui sont déjà numérisés et en accès libre sur les sites internet gallica.bnf.fr (la bibliothèque numérique de la Bibliothèque nationale de France) ou sur le site internet epsilon.insee.fr (Entrepôt des publications numériques de la statistique publique) (exemple de documents en annexe Figure A1.1). Nous avons en vain utilisé plusieurs outils d‘extraction automatique de données par reconnaissance optique de caractères (OCR). Les taux de succès de la reconnaissance automatique ont été faibles à cause des polices de caractère, de la qualité des chiffres publiés et surtout du nombre de colonnes par page numérisé.

La reconstitution de la série de données de production et des moyens de production (chapitre 2) est l’un des résultats quantitatifs majeurs des travaux de cette étude. La mise en cohérence et la compilation des données ont parfois nécessité de faire des choix et de pallier un manque de données pour certaines années ou certains produits. Ces choix sont explicités en particulier pour la production animale (section 1.3.4). À ce titre, la plupart des statistiques agricoles annuelles contiennent une section de commentaires précieux qui ont souvent permis de comprendre les manques ou discontinuités d’une année à l’autre. Par exemple, la surface récoltée de blé est divisée par 3 en 1956 par rapport à l’année 1955. Cette discontinuité peut apparaitre comme une erreur mais cette réduction de surface a bien eu lieu en raison de gelée record indiquée dans la statistique annuelle (Ministère de l’Agriculture, 1957).

L’une des originalités de notre étude est d’exclure toute donnée économique dans la reconstitution de la production agricole mais en intégrant toutes les données de production

21

disponibles (surface et production) au niveau national. Toutefois, en faisant le choix de modéliser la production agricole à une échelle nationale, nous prenons le risque d’occulter la disparité des productions dans les échelles inférieures. En effet, à une échelle sous-nationale, il y a une spécialisation des productions et donc une hétérogénéité par rapport à la moyenne nationale. Les régions agricoles de la France ont eu, au cours de la période, des trajectoires de spécialisation très différentes qui ont été caractérisées dans les travaux de thèse de Le Noé (2018). Notre choix d’échelle est différent puisque nous cherchons à modéliser les transformations de l’agriculture au niveau de l’unité du pays.

Par ailleurs, nous avons fait le choix de montrer tous les résultats des productions agricoles nationales annuelles sans calcul d’incertitudes. Comme nous l’avons évoqué dans la section précédente, les niveaux d’incertitude et la qualité des statistiques publiées ont changé de la même manière que les méthodes utilisées n’ont cessé de changer entre 1882 et aujourd’hui. Ce choix peut être sujet à critiques. Pour autant il est difficile, voire impossible d’évaluer les facteurs d’incertitude associés aux statistiques anciennes et quantifier de combien l’incertitude sur les mesures des objets statistiques diffère avec les statistiques modernes. Nous n’avons pas non plus moyenné ni lissé les données de production annuelles sur des fenêtres de 5 ou 10 années, dans le but précis de montrer les fluctuations en continu tout au long de la période. Ces fluctuations sont notamment dues à des conditions climatiques, souvent particulièrement défavorables, à des guerres ou à des crises économiques dans certains secteurs de l’agriculture. Les guerres sont des événements particuliers qui dégradent inévitablement la performance de l’appareil statistique mais aussi la capacité à produire de l’agriculture en raison du déplacement massif prioritaire des moyens dans le secteur militaire. Ainsi, les données sur ces périodes sont moins fiables comme l’attestent officiellement certains commentaires inclus dans les statistiques mais la signature de fonctionnement observée apporte une valeur témoin sur le comportement des systèmes agricoles extrêmement perturbés. Nous avons fait le choix d’inclure les deux guerres mondiales tout en marquant sur fond gris les périodes concernées qu’il faut traiter avec précaution. À titre d’exemple, en 1945, la récolte de céréales est de 40% plus faible qu’en 1938 avant la Seconde Guerre mondiale, mais il est impossible de faire la part des choses entre dysfonctionnement de l’agriculture ou de l’appareil statistique.

22

Cadre méthodologique du calcul de la production nette

agricole