• Aucun résultat trouvé

mique reliant des données d’entrée et de sortie et de réaliser ensuite des simulations et des prédictions. Les outils construits au cours de ces travaux de thèse peuvent donc être considérés comme étant des outils d’apprentissage statistique.

Le programme correspond ensuite au code permettant de gérer cette étape d’ap-prentissage des paramètres, grâce à un processus itératif basé sur la comparaison des données de sortie issues de la réalité et des sorties prédites. Au cours de ce pro-cessus itératif, un algorithme d’optimisation permet de faire converger les paramètres vers des valeurs minimisant la différence entre les données de sortie collectées et les sorties générées par le modèle. Enfin, l’outil de simulation et de prédiction se base sur le modèle mathématique paramétré avec les valeurs des paramètres obtenues à la fin de l’apprentissage.

1.7 Description des données disponibles et de la

mé-thode d’adimmentionnement appliquée

1.7.1 Les données disponibles

Dans le cadre de ce projet, des données ont été mises à notre disposition pour ajuster nos outils et tester ensuite la qualité de leurs prédictions. Ces données appar-tiennent à l’entreprise dans laquelle cette thèse CIFRE a été réalisée et sont donc confidentielles. Dans cette section, ainsi que dans la suite du manuscrit, seules les données adimensionnées seront présentées, sans préciser l’espèce animale sur la-quelle nous avons travaillé.

Les données utilisées ont été collectées dans deux élevages différents, au cours d’une période d’engraissement. Les individus, qui sont tous de la même espèce et de la même race, ont été monitorés pendant une certaine période afin de suivre leur croissance et leur consommation alimentaire.

Pour assurer la collecte des données, les animaux ont été équipés de colliers connectés contenant une puce électronique propre à chaque animal. Lorsqu’un animal mange, l’auge contenant l’aliment détecte la puce de ces colliers et collecte différentes informations associées à l’animal et à sa prise d’aliment. Ces auges connectées enre-gistrent le moment du repas, sa durée et la quantité d’aliment consommée. En parallèle

de cela, l’ensemble des individus ont été pesés grâce à des balances installées ponc-tuellement dans les élevages.

Dans le premier élevage, que l’on appellera l’élevage «A», 8 individus ont été moni-torés pendant une période de référence allant de t “ 0 jusqu’à t “ 1. Ces individus ont été alimentés avec une ration de base, sans ajout d’additif. Ils constitueront le groupe que l’on appellera "Témoin A". Dans cet élevage, les animaux ont été pesés à l’instant

t “ 0 et à t “ 1. Nous connaissons donc le poids de ces individus à t “ 0 (P0) et à t “ 1 (P1).

Dans le deuxième élevage, que l’on appellera l’élevage «B», 20 individus ont été monitorés pendant une période allant de t “ 0 jusqu’à t “ 2.5. Ces individus ont été alimentés avec une ration de base et avec une dose plus ou moins grande d’additif. Parmi ces 20 individus :

— 6 individus n’ont pas reçu d’additif en supplément de la ration de base. Ces animaux constitueront le groupe que l’on appellera «Témoin B»,

— 5 individus ont reçu une dose Dose1 d’additif en supplément de la ration de base. Ces animaux constitueront le groupe que l’on appellera «Dose1 B»,

— 5 individus ont reçu une dose Dose2 d’additif en supplément de la ration de base. Ces animaux constitueront le groupe que l’on appellera «Dose2 B»,

— et enfin, 4 individus ont reçu une dose Dose3 d’additif en supplément de la ration de base. Ces animaux constitueront le groupe que l’on appellera «Dose3 B».

Dans cet élevage les animaux ont été pesés à l’instant t “ 0, à t “ 0.6, à t “ 1.52 et à t “ 2.5. Nous connaissons donc le poids de ces animaux à ces différents instants (P0, P0.6, P1.52 et P2.5).

Lors de chaque étude les données ont été divisées en deux parties. La première partie, appelée "base d’apprentissage", correspond aux données sur lesquelles les outils ont été ajustés. La seconde, appelée "base de test", contient les données sur lesquelles nous avons vérifié la qualité des outils de prédiction obtenus.

Dans plusieurs études nous avons utilisé les données du groupe «A» comme base d’apprentissage et celles associées au groupe «B» comme base de test. Dans plu-sieurs de nos études nous avons eu besoin de comparer le poids prédit et le poids mesuré des individus à l’instant t “ 1. Dans ces cas là, pour avoir une information concernant le poids des individus à t “ 1 dans les deux bases de données et pour

pou-1.7. Description des données disponibles et de la méthode d’adimmentionnement appliquée

voir utiliser les individus du groupe «B» comme individus «Test» nous avons interpolé leur poids à t “ 1 à partir de leur poids mesuré à t “ 0.6 et à t “ 1.52.

Dans les deux élevages, la consommation alimentaire de chaque animal a été col-lectée périodiquement. Nous avons de ce fait la consommation moyenne de chaque individu, sur la période allant de t “ 0 jusqu’à t “ 0.67 (Cr0´0.67s), sur la période allant de t “ 0.67 jusqu’à t “ 1.5 (Cr0.67´1.5s) et sur la période allant de t “ 1.5 jusqu’à t “ 2.5 (Cr1.5´2.5s).

Pour résumer le contenu de ces données nous avons construit la table 1.1.

TABLE 1.1 – Description de la composition des données et des différents groupes étu-diés (NI : Nombre d’Individus,

ˆ

: Donnée disponible,

+

: Donnée estimée).

Témoin A Témoin B Dose1 B Dose2 B Dose3 B

NI 8 6 5 5 4 P0

ˆ ˆ ˆ ˆ ˆ

P0.6

ˆ ˆ ˆ ˆ

P1

ˆ + + + +

P1.52

ˆ ˆ ˆ ˆ

P2.5

ˆ ˆ ˆ ˆ

Cr0´0.67s

ˆ ˆ ˆ ˆ ˆ

Cr0.67´1.5s

ˆ ˆ ˆ ˆ ˆ

Cr1.5´2.5s

ˆ ˆ ˆ ˆ ˆ

1.7.2 Adimentionnement des données

Les individus de l’élevage "A", qui ont constitué notre base d’apprentissage dans la plupart de nos études, ont été utilisés comme groupe de référence pour adimensionner les données.

Adimentionnement du temps et de l’espace

Les modèles que nous avons construits sont des modèles spatiaux temporels. Il nous faut donc adimentionner les données en temps et en espace.

La période d’engraissement du groupe "A" correspond à la période de référence. Cette période, allant de t “ 0 jusqu’à t “ XA, a donc été ramené à une période allant de t “ 0 jusqu’à t “ 1. Pour cela nous avons divisé le temps par XA. Donc,

tAdimiti

XA, (1.7.1)

où ti et tAdimi correspondent respectivement à la iime valeur de la variable de temps, avec et sans dimension.

Les individus de l’élevage «B» ont été monitorés pendant une période 2.5 fois plus longue que la période de suivi des individus de l’élevage «A». En divisant cette période par XA, celle-ci a donc été ramenée à une période allant de t “ 0 jusqu’à t “ 2.5.

Dans notre étude l’espace peut être assimilé à la longueur du corps de l’animal ou à celle de la zone étudiée. Nous avons décidé de réduire cet espace à un intervalle allant de 0 jusqu’à 1.

Adimentionnement des données de croissance

Dans notre base de données nous avons également des poids mesurés à différents instants. Comme pour les autres variables, nous voulons que ces poids, qui dépendent du temps, varient entre 0 et 1.

Comme précédemment, le groupe «Témoin A» constitue notre groupe de référence. Pour adimentionner les données de croissance des individus des élevages «A» et «B», nous divisons donc toutes les mesures de poids, aux différents instants t par le poids le plus élevé atteint à t “ 1 dans le groupe «Témoin A» (max(P1)A). Nous avons donc,

PAdimt,iPt,i

max`pP1qA

˘ (1.7.2)

où Pti et PAdimti correspondent respectivement au poids du iime individu à l’instant t, avec et sans unité.

1.7. Description des données disponibles et de la méthode d’adimmentionnement appliquée

Adimentionnement des données de consommation

Dans la base de données utilisée, la consommation alimentaire a été collectée pé-riodiquement. Pour s’assurer que la sortie du modèle à t “ 1 soit comprise entre 0 et 1, il est nécessaire que la quantité totale d’information injectée dans le modèle soit inférieure ou égale à 1.

Les individus du groupe «Témoin A» constituent notre groupe de référence. Nous avons donc commencé par calculer la quantité totale d’aliment consommée par chaque individu des groupes «Témoin A» et «Témoin B». Nous avons ensuite divisé cette quantité par la plus grande quantité totale d’aliment consommée dans le groupe "A" (maxpSumConsumqA). Nous avons donc :

SumConsumAdimiSumConsumi

maxpSumConsumqA

(1.7.3) où SumConsumi et SumConsumAdimi correspondent respectivement à la quantité to-tale d’aliment consommée par le iime individu, avec et sans dimension.

Dans les données utilisées, nous connaissons pour chaque individu, sa consomma-tion moyenne sur 3 périodes consécutives. Pour adimensionner ces consommaconsomma-tions moyennes, nous avons appliqué les opérations suivantes :

Cr0´0.67sAdimi “ Cr0´0.67si 1 maxpSumConsumqA , (1.7.4) Cr0.67´1.5sAdimi “ Cr0.67´1.5si 1 maxpSumConsumqA , (1.7.5) et, Cr1.5´2.5sAdimi “ Cr1.5´2.5si 1 maxpSumConsumqA . (1.7.6)

où Crt1´t2siet Crt1´t2sAdimicorrespondent respectivement aux consommations moyennes sur la période allant de t “ t1 jusqu’à t “ t2, pour le iime individu, avec et sans

dimen-sion.