• Aucun résultat trouvé

3. Aspects techniques

3.1. Banque de données

Première constatation, la banque contient une quantité étonnante de données. Mais certaines variables manquent. Il faudra faire avec puisque ces données de contrôle laitier n’ont pas été collectées dans le but précis de servir à l’étude, ils manquent donc certaines variables importantes. Les 25 variables incluses dans le modèle sont présentées au tableau XIII.

En temps que variable dépendante du modèle, le comptage des cellules somatiques du réservoir constitue la variable non-mesurée la plus importante de l’étude. Le CCSR n’était pas disponible dans la banque données puisque non-récolté systématiquement aux contrôles laitiers mensuels. Cette information est disponible au niveau des banques de données des

Producteurs de lait Québécois auxquelles nous n’avions pas accès. De plus, il aurait été techniquement impossible de contacter individuellement chacun des 924 troupeaux de la banque pour connaitre toutes leurs données de CCSR de l’année 2008. L’utilisation du CCSER s’est avéré une solution de rechange à ce problème. Bien que valable, il existe quelques raisons pour laquelle le CCSER peut différer du CCSR réel.

Il est nécessaire de rappeler l’importance qu’ont les pratiques de gestion de troupeau par rapport à la variation du CCSR. Ces pratiques de gestion de troupeaux non-mesurées dans l’étude peuvent avoir conduit à une différence entre le CCSR et le CCSER de l’étude. Rappelons que Lievaart et coll. (2009) rapportaient une valeur de CCSR de 49 000 c/mL inférieur à la moyenne des CCS individuels corrigés pour le lait avec une étendue de 10 000 c/mL à 182 000 c/mL. Les auteurs proposaient que l’ampleur de cette différence pouvait être expliquée par l’administration de lait aux veaux provenant des vaches dont les tests individuels ont démontré un haut CCS. Ces vaches contribuant aux CCSER à un test ne contribuaient pas au CCSR dans les jours suivants. Ainsi, le CCSER serait surévalué par rapport au CCSR. Il faut aussi rappeler que le CCSR est mesuré quatre fois par mois à l’étable et que le CCSR moyen constitue une moyenne arithmétique de ces quatre mesures. D’un autre côté, le CCSER est estimé à partir des CCS individuel et n’est calculé qu’une fois mensuellement puisque les données proviennent du contrôle laitier mensuel. La comparaison des statistiques québécoises aux statistiques descriptives de la banque, présentée ci-dessus, permet de révéler que la moyenne des CCSER de la banque de données se rapproche de la moyenne québécoise des CCSR en 2008. Toutefois, le fait que ces deux moyennes se rapprochent ne permet pas de supposer que les CCSR et CCSER individuels de chacun des troupeaux se rapprochent l’un de l’autre. Il est possible qu’une partie des CCSER soit sous- estimée par rapport aux CCSR alors qu’une partie équivalente est surestimée, rendant ainsi les moyennes de CCSR et CCSER semblables. Une mauvaise estimation du CCSER résulterait en une mauvaise classification de l’issue du modèle, c’est-à-dire, que le modèle pourrait prédire une violation du seuil de CCSER, alors qu’en réalité, l’éleveur pourrait avoir mis en place des mesures pour éviter cette violation (par exemple, en rejetant le lait de certaines

vaches hautes en CCS), alors, le CCSR n’aurait pas excédé 400 000 c/mL. Cette situation a probablement plus de chance de survenir dans les troupeaux à haut CCSR, résultant en des erreurs de classification plus fréquentes dans cette catégorie de troupeaux que dans les troupeaux à CCSR plus faible. Cela conduirait malheureusement à la présence d’un biais de classification dans l’étude.

Pour revenir aux variables non-mesurées de la banque de données, il manque malheureusement, en plus de la variable dépendante du modèle, quelques variables prédictives. Ces variables constituent par exemple, la gestion de troupeau, la région d’origine des troupeaux ou la perception du producteur face aux possibles pénalités. Des informations sur les achats, les ventes ou la réforme, sur les décisions prises en fonctions de la production de quota, sur l’incidence des mammites cliniques, sur les vêlages ou le tarissement en sont également des exemples. Il aurait été utile d’avoir en main ces informations et d’avoir pu en tenir compte dans nos analyses. Wenz et coll. (2007) ont d’ailleurs montré une association entre la violation d’un seuil de CCSR et certaines pratiques de gestion de troupeaux alors que Lievaart et coll. (2010) avaient inclus certaines de ces pratiques dans un modèle de prédiction du CCS moyen du troupeau. Dans un monde idéal où une étude cohorte prospective serait effectuée, des méthodes de sondage et de prises de données à la ferme seraient utilisées afin de recueillir précisément ces informations et de rendre l’étude plus précise.

Dans le même ordre d’idée, il est à noter que les données de la banque de 2008 ont été récoltées alors que la limite de 500 000 c/mL au réservoir était toujours en place. Malheureusement, puisque la nouvelle norme a été mise en place en août 2012, que la banque devait s’échelonner sur plus d’un an et que les données ne sont disponibles chez DSA qu’environ 6 mois après la fin de l’année en cours, il aurait été impossible d’attendre ces données et de construire un modèle utilisable rapidement après la mise en place de la nouvelle norme. Au début du projet en 2010, il a été jugé acceptable d’utiliser la banque de 2008. Toutefois, il appert qu’une validation externe du modèle, sur une banque de données plus récente et avec des données postérieures au changement de norme, serait une suite

logique à cette étude. Celle-ci permettrait de déterminer si les résultats générés par les analyses sur la banque de 2008 peuvent être généralisés à la population cible, c'est-à-dire à la population de troupeau laitiers québécois, voire canadiens, en 2013, après la mise en place de la nouvelle norme.

Finalement, il faut noter que la banque de données de départ, ne comprenant que les données du 1er janvier au 31 décembre 2008, ne permettait pas l’inclusion de la saison comme variable prédictive au modèle. En fait, il était, à ce moment, impossible de modéliser et prédire les CCSR des mois de janvier et février puisque les données des mois précédant le mois de janvier n’étaient pas disponibles. Cela a finalement été possible après extraction d’une nouvelle banque de donnée comprenant les données de la fin 2007 suivie par de nouvelles analyses.