• Aucun résultat trouvé

1.2 Les différents types de modèles mathématiques et les différentes mé-

1.2.5 Des modèles «boîtes-noires» et des modèles "boîtes-blanches" 37

D’après VÁZQUEZ-CRUZ et al. (2014), parmi les différentes méthodes existantes

pour analyser des données biologiques, deux grandes approches peuvent être distin-guées : Les modèles dits «boîtes-noires» et les modèles dits «boîtes-blanches».

Les modèles «boîtes-noires»

Les modèles d’apprentissage automatique, aussi appelés modèles de «Machine Learning», comme les réseaux de neurones, sont souvent appelés «boîtes-noires». Mais d’après VÁZQUEZ-CRUZ et al. (2014), les modèles «boîtes-noires» regroupent

également les régressions linéaires simples et multiples, ainsi que les modèles logis-tiques tels que les modèles de GOMPERTZ(1825) et de VERHULST (1838).

Ces modèles sont plus ou moins complexes en termes d’architecture. Comme l’apprentissage automatique est considéré comme une technique d’Intelligence Arti-ficielle, l’apprentissage profond, aussi appelé "Deep Learning" est souvent considéré comme une sous partie de l’apprentissage automatique (LECUN et al. (2015), BEN

-GIO (2012) et AREL et al. (2010)). Globalement, lorsque la structure des algorithmes

se complexifie et que le nombre de niveau de représentation augmente, on parle d’ap-prentissage profond. En effet, les algorithmes d’apd’ap-prentissage profond se composent de plusieurs sous modules non-linéaires (BENGIO (2012), AREL et al. (2010) et CHO

et SAUL (2009)). L’objectif de ces outils est d’explorer de manière plus approfondie les informations contenues dans les données (LECUNet al. (2015), BENGIO(2012) et GLOROT et al. (2011)).

Les algorithmes d’apprentissage automatique correspondent à une description directe des données. L’objectif de ces modèles est de mettre en lien des données d’entrée et de sortie sans avoir besoin de connaissances concernant les phénomènes biologiques sous-jacents.

Comme cela est expliqué dans les travaux de DOMINGOS (2012), depuis une di-zaine d’années, l’utilisation d’algorithmes d’apprentissage automatique et plus parti-culièrement de réseaux de neurones a fortement augmenté. D’après GORCZYCA et al.(2018), VALLETTA et al. (2017), MA et al. (2014) et IP et al. (2018), la popularité de

ces modèles peut s’expliquer par leur facilité d’utilisation, ainsi que par la diversité des problèmes pouvant être résolus grâce à de tels algorithmes.

Néanmoins ces modèles d’apprentissage automatique contiennent peu de connais-sances a priori. Les outils basés sur ce genre de modèles sont donc peu informatifs d’un point de vue biologique (TANet GILBERT (2003), SHAVLIK et al. (1995), HUBBARD

et REINHARDT (1998)). De plus, DUMPALAet al. (2017) expliquent qu’il est nécessaire

d’apprendre les paramètres de ces modèles à partir de beaucoup de données afin de compenser cette absence d’expertise biologique a priori.

De plus, la structure de ces modèles, décorrélée de la nature des processus bio-logiques reliant les variables étudiées, est par conséquent très générique et peut être appliquée pour traiter des problèmes pouvant être de natures très différentes (HAS

-SOUN(1995)). Mais cette généricité limite l’adaptabilité de ces modèles à la dynamique de certains processus biologiques (LU et al. (1996)).

1.2. Les différents types de modèles mathématiques et les différentes méthodes d’apprentissage

Ces outils "boîtes-noires" sont donc des outils très utiles lorsque l’objectif est de construire des outils de prédiction ou de simulation mettant en lien de nombreuses variables, sans volonté d’expliquer des phénomènes régissant l’évolution de ces va-riables. Ils sont également utiles lorsque l’utilisateur dispose de peu de connaissances concernant les processus étudiés mais qu’il dispose en revanche de beaucoup de don-nées pour ajuster les paramètres de ces modèles (HASSOUN (1995)).

Les modèles "boîtes-blanches"

D’après VÁZQUEZ-CRUZet al.(2014), les modèles "boîtes-blanches" correspondent à des modèles mécanistes décrivant les processus physiques qui se déroulent au sein du système étudié avec une volonté de réalisme et souvent dans un objectif bien pré-cis. Dans le cadre de problèmes liés à la biologie animale, ils se placent de ce fait à un niveau de description plus fin et plus précis que l’animal complet.

Cette approche intègre beaucoup de connaissances et nécessite donc une bonne compréhension a priori des processus régissant la dynamique du système étudié.

Á l’image des travaux réalisés par BASTIANELLI et SAUVANT (1997) et MARTIN et SAUVANT(2010a), la construction de modèles mathématiques mécanistes réalistes est une tâche complexe menant généralement à un modèle contenant beaucoup d’équa-tions et de paramètres à déterminer.

Ces modèles complexes permettent de réaliser des expérimentations "In Sillico" à partir de données d’entrée bien précises. En effet, les modèles mécanistes réa-listes décrivent des processus biologiques précis et dont l’expression mathématique requiert la valeur de paramètres spécifiques (concentrations sanguine de certaines molécules, coefficients de transfert de molécules entre deux organes, etc.). Ces mo-dèles se basent donc sur de nombreuses variables d’entrée, spécifiques au problème étudié. Ce grand nombre d’informations à préciser en entrée rend l’implémentation de ces modèles compliquée, surtout lorsque ces informations sont difficiles à collecter (BASTIANELLI et SAUVANT(1997)).

L’architecture complexe des modèles «boîtes-blanches» les rend peu adaptés à l’optimisation des paramètres sur des données collectées et de ce fait à la réalisation de prédiction et d’Assimilation de Données d’élevage (BASTIANELLIet SAUVANT(1997)

et MARTIN et SAUVANT (2010a)). La valeur des paramètres est donc généralement obtenue grâce à la littérature et à des expérimentations précises (prises de sang, do-sages, etc.). Les valeurs manquantes sont alors souvent estimées ou extrapolées à partir d’autres valeurs connues.

Les modèles mécanistes réalistes sont donc des outils utiles lorsque l’utilisateur dispose déjà d’une bonne connaissance de la dynamique du système étudié mais qu’il souhaite visualiser les réactions du système lors de différentes simulations quan-titatives et valider certaines hypothèses (BASTIANELLI et SAUVANT (1997) et BALD

-WIN(1995)).

Pour résumer, la construction des modèles «boîtes-blanches» nécessite d’avoir beaucoup de connaissances concernant le système étudié et donne naissance à des modèles complexes contenant beaucoup de paramètres à déterminer. De l’autre coté, l’ajustement des modèles «boîtes-noires» nécessite d’avoir beaucoup de données. Or lors de l’étude de problématiques liées à de la biologie animale, il arrive encore au-jourd’hui que l’on ne dispose ni de beaucoup de données, ni de beaucoup de connais-sances a priori ou que l’on ait besoin d’un modèle plus léger qu’un modèle réaliste. Il est donc nécessaire d’explorer des approches intermédiaires pour construire des outils parcimonieux capables de s’ajuster à partir de peu de données.

1.3 Émergence d’approches intermédiaires