• Aucun résultat trouvé

Au cours de ce travail, nous avons utilisé deux bases de données du ministère de l’Agriculture que sont SI2A et DIFFAGA. SI2A est une base de données recensant les résultats de l’inspection des animaux ou des carcasses pour lesquels il y a une anomalie rencontrée (anomalie sur l’animal, sur la carcasse (saisie en présence de lésions) ou anomalie documentaire). DIFFAGA est une base de données regroupant les tonnages et le nombre d’animaux abattus par chaque abattoir.

Les données brutes de 2016 à 2019 ont été extraites de ces bases.

Certains départements de France métropolitaine n’étaient pas renseignés car ils n’ont pas abattu de gros bovins sur leur territoire de 2016 à 2019 : Creuse (23), Eure-et-Loir (28), Loiret (45), Meurthe-et-Moselle (54), Paris (75), Yvelines (78), Var (83), Territoire-de-Belfort (90), Essonne (91), Hauts-de-Seine (92), Seine-Saint-Denis (93), Val-de-Marne (94) et Val-d’Oise (95).

a. Base de données SI2A

Extraction et construction d’une base de données à partir de données brutes

Les fichiers de données brutes ont été extraits à l’aide de l’application de valorisation des données, DEDAL, issue de la refonte du système d’information de l’alimentation (Resytal), sous forme de tableaux au format Excel. Chaque tableau contenait les données d’un mois.

Les 48 tableaux (pour couvrir les années d’étude de 2016 à 2019) ont été importés dans le logiciel R et compilés en un seul de 1 444 367 lignes et 46 colonnes. Chaque ligne correspondait à un animal. De nombreuses colonnes contenaient des informations qui n’étaient pas utiles pour la suite

(par exemple l’information sur l’IAM1 et l’IPM1 ou encore le numéro de tuerie de l’animal) et ont donc été enlevées pour ne conserver que 16 colonnes, dont le contenu est détaillé dans le Tableau 3.

Les lignes correspondant aux départements et territoires d’outre-mer, ou aux catégories d’animaux exclus de l’étude (veaux, bisons, buffles et apparentés) ont été supprimées. Concernant les décisions en IPM2, seules les décisions étant identifiées comme « saisie partielle » ou « saisie totale » ont été conservées. Les levées de consigne ou l’assainissement par le froid dans la décision d’IPM2 ont donc été retirés ainsi que les animaux n’ayant que des informations en IAM.

Le tableau de données ainsi créé a été analysé, colonne par colonne, afin d’identifier d’éventuelles erreurs comme des données manquantes ou aberrantes. Par exemple, concernant le poids des saisies, certaines valeurs semblaient aberrantes et ont donc été transformées en cases non renseignées afin de conserver la ligne d’information de l’animal mais sans le risque de surestimation ou sous-estimation du poids saisi. De plus, certains animaux étaient présents en double. Ces lignes dupliquées ont donc été supprimées en gardant les lignes informatives uniquement.

Présentation finale

Chaque ligne correspondait à un animal concerné par une décision de saisie (totale ou partielle). Le tableau nettoyé comportait 610 553 lignes.

Tableau 3 : Intitulés des colonnes de la base de données SI2A nettoyée ainsi que leur signification

region Nom de la région en toutes lettres (13 régions de France métropolitaine) dep_number Numéro du département (83 départements de France métropolitaine abattant

des gros bovins)

dep_name Nom du département en toutes lettres

ab_name Nom de l’abattoir en toutes lettres (198 établissements)

ab_siret Numéro du Système d'Identification du Répertoire des Etablissements (SIRET) de l’abattoir

farm_ede Numéro de l’Etablissement Départemental de l’Elevage (EDE) de l’élevage d’origine de l’animal

farm_dep Département de la dernière exploitation de vie de l’animal

animal_id Numéro d’identification national de l’animal (pour les animaux nés en France, il commence par FR puis est suivi par 10 chiffres, les deux premiers étant le numéro du département de naissance de l’animal)

ipm2_dec Décision de type de saisie (saisie totale ou saisie partielle) ipm2_reason Motif(s) de saisie (plusieurs motifs pouvant ici être indiqués) ipm2_piece Pièce saisie (carcasse, épaule, jarret…)

ipm2_weight Poids de la saisie (en kg)

iam2_dec Le cas échéant, informe sur la décision lors de l’inspection ante mortem iam2_reason Le cas échéant, informe sur le motif de la décision d’inspection ante mortem

month Mois (1 à 12) de l’abattage

year Année (2016 à 2019) de l’abattage

b. Base de données DIFFAGA

Les données DIFFAGA incluent l'ensemble des animaux abattus, qu’ils aient ou non subi des saisies à l’abattoir. Elles sont issues de la déclaration par l'abatteur de ses abattages. L'abattoir doit communiquer ses données chaque mois auprès du Service de la Statistique et de la Prospective (SSP) du Ministère chargé de l’Agriculture. Ces données peuvent subir quelques ajustements sur l'année, notamment lorsque les abattoirs renseignent dans un premier temps une estimation, puis apportent d’éventuelles corrections en cours d’année.

Extraction et construction d’une base de données à partir de données brutes

Les quatre tableaux de données brutes annuelles, de 2016 à 2019, ont été importés dans R et compilés en un seul tableau comprenant 13 colonnes. Chaque ligne correspondait au tonnage et au nombre d’animaux abattus par abattoir pour un mois donné, par catégorie d’animaux. Les gros bovins ont été les seuls à être conservés. Les colonnes inutiles ont été supprimées.

Présentation finale

La base de données nettoyée comportait 11 568 lignes. Chaque ligne correspondait à un mois d’abattage pour une catégorie d’animaux dans un abattoir donné. Il y avait au total 10 colonnes, comme détaillées dans le Tableau 4.

Les noms des abattoirs changent parfois ou bien n’ont pas exactement la même orthographe entre la base de données DIFFAGA et la base de données SI2A. Un travail de correspondance a donc été réalisé en créant la colonne « ab_name_2 » à partir de la colonne « ab_name ». Ainsi, tous les abattoirs possédaient une même dénomination, harmonisée entre les deux bases, permettant une analyse statistique adaptée par la suite.

Tableau 4 : Intitulés des colonnes de la base de données DIFFAGA nettoyée ainsi que leur signification

region Numéro de la région region_name Nom de la région

dep_number Numéro du département (83 départements différents, correspondant aux 83 départements de France métropolitaine abattant des gros bovins)

year Année (2016 à 2019)

month Numéro du mois d’abattage (1 à 12) ab_siret Numéro SIRET de l’abattoir

ab_name Nom de l’abattoir

ab_name_2 Nom de l’abattoir mis en forme de manière à correspondre aux noms de la base de données SI2A (202 abattoirs différents).

w_ab Tonnage total abattu n_ab Nombre d’animaux abattus

c. Données complémentaires

En complément, des données descriptives des abattoirs ont été transmises par la DGAl et utilisées dans notre étude. Ces données concernaient le type d’abattoirs (mono ou multi-espèces) et leur statut (privé ou public).

B. Analyses statistiques