Construction et analyse d’outils d’apprentissage statistique biomimétiques

Dans leurs travaux WALTER et al. (2017) expliquent que l’agriculture a connu jusqu’à présent trois révolutions. La première correspond à la domestication des animaux et des plantes, il y a quelques milliers d’années. Plusieurs centaines d’années auparavant, il y eu la mise en place du système de rotation des cultures et l’amélioration des pratiques d’élevage. Enfin, il y a quelques dizaines d’années, une troisième révolution a eu lieu. Cette révolution, appelée « la révolution verte », correspond à l’augmentation significative de l’utilisation d’intrants et d’espèces animales et végétales à hauts potentiels. D’après WALTER et al. (2017), une quatrième révolution a démarré depuis quelques années.

L’agriculture doit aujourd’hui relever de nouveaux défis. Le premier est de nourrir une population dont le nombre d’individus ne cesse d’augmenter. D’après la FAO (Foundation and Agriculture Organisation), la production alimentaire doit augmenter de 70% d’ici 2050 pour espérer nourrir une population qui devrait alors atteindre les 9 milliard d’individus (FOOD et ORGANIZATION (2009)). Le deuxième défi est d’augmenter cette production agricole tout en préservant l’environnement.

La quatrième révolution agricole évoquée précédemment tente de faire face à ces nouvelles problématiques grâce au développement de l’agriculture de précision. Ce développement se fait via l’utilisation de plus en plus fréquente de technologies d’information et de communication (WALTER et al. (2017), JAYARAMAN et al. (2016) et WOLFERT et al. (2017)). La collecte d’informations diverses sur l’ensemble de l’exploitation agricole et ensuite leur mise en lien, semblent être aujourd’hui les leviers permettant de révolutionner l’agriculture (JAYARAMAN et al. (2016)). Ce que l’on appelle le « Smart Farming », et plus particulièrement l’agriculture de précision, consiste donc à utiliser de nouvelles technologies, telles que des capteurs et des machines connectées, dans le but de suivre, de contrôler et finalement de rendre plus efficients les processus de production agricoles. L’objectif est de maximiser les rendements et la production à partir d’une quantité d’intrants utilisée (alimentation, fertilisation, etc.) (WALTER et al. (2017), O’GRADY et O’HARE (2017) et ESMEIJER et al. (2015)). Pour une même quantité produite, l’augmentation de l’efficience des plantes et des animaux revient à réduire les pertes et à optimiser la valorisation des intrants utilisés. L’agriculture de précision permet donc de limiter l’impact de l’agriculture sur l’environnement (SCHULZE et al. (2009)). En réduisant la quantité d’intrant nécessaire et les pertes, l’agriculture de précision permet aussi de réduire les pertes économiques et d’augmenter les revenus des agriculteurs (RYU et al. (2015) et WALTER et al. (2017)).

Augmenter la productivité agricole passe par la prédiction et l’anticipation des performances des différentes espèces animales et végétales en fonction des conditions d’élevage et de culture (O’GRADY et O’HARE (2017) et JAYARAMAN et al. (2016)). Il est également important de pouvoir suivre en temps réel l’évolution de différents indicateurs et l’état des cultures ou des troupeaux (JAYARAMAN et al. (2016) et WALTER et al. (2017)). Cela nécessite d’être capable de collecter des données fréquemment et ensuite de les assimiler. L’état réel des cultures ou des animaux peut alors être estimé en réalisant de l’Assimilation de Données. Cette méthode consiste à combiner l’information fournie par un outil de prédiction et celle contenue dans les données collectées pour estimer l’état le plus vraisemblable d’un système à un instant t (Voir AUROUX et BLUM (2005), GREGG et al. (2009), LGUENSAT et al. (2017) and LGUENSAT et al. (2019)). Pour cela il faut donc tout d’abord collecter des données (FAULKNER et CEBUL (2014)).

De nombreuses technologies ont vu le jour ces dernières années afin de permettre la collecte de données dans l’ensemble de l’exploitation agricole ( JEMILA et PRIYADHARSINI (2018), MIEKLEY et al. (2012), TOL et KAMP (2010), BÜCHEL et SUNDRUM (2014) et HOLMAN et al. (2011)). Néanmoins, les données agricoles sont souvent très hétérogènes et d’assez mauvaise qualité (ISHII (2014), LI et al. (2014) et WOLFERT et al. (2014)). De plus laccès aux nouvelles technologies représente encore aujourd’hui un investissement important pour les agriculteurs qui ne sont de ce fait pas encore tous équipés de machines connectées (WALTER et al. (2017) et KUTTER et al. (2011)). Un des grands enjeux de cette quatrième révolution agricole est donc le développement de modèles mathématiques et d’outils de prédiction performants, capables de gérer conjointement un manque de données fréquent, la complexité de celles-ci, mais aussi la complexité des phénomènes étudiés.

Concrètement, l’agriculture de précision repose donc sur la collecte de données mais aussi sur la construction d’outils mathématiques et statistiques capables d’assimiler ces données d’élevage, de les synthétiser et de leur donner du sens.

Ces travaux ont été réalisés dans le cadre d’une thèse en Convention Industrielle de Formation par la REcherche (CIFRE), qui a été effectuée dans une entreprise d’agroalimentaire. Cette entreprise produit de l’alimentation pour les animaux d’élevage. L’objectif de cette entreprise est de proposer aux éleveurs une ration alimentaire qui garantisse l’optimisation des performances des animaux selon l’espèce, la race et les conditions d’élevage. Cette entreprise souhaite également apporter du conseil aux éleveurs et les aider à piloter leur élevage. Pour cela cette entreprise a besoin d’outils capables de mettre en lien la composition de la ration distribuée et les performances des animaux, en termes de croissance ou de production laitière. L’objectif final est de déterminer la ration optimisant les performances des animaux, ou simplement de pouvoir indiquer à l’éleveur le poids que feront ses animaux à une certaine date selon la ration alimentaire qu’il souhaite utiliser.

D’après VÁZQUEZ-CRUZ et al. (2014), il existe aujourd’hui deux principaux types d’approches permettant de construire des outils de prédiction capables de mettre en lien des données biologiques : Des approches de type mécanistes réalistes et des approches dites « boîtes-noires ».

La modélisation réaliste d’un phénomène biologique est un processus complexe qui nécessite beaucoup de connaissances a priori et qui mène généralement à la construction de modèles mathématiques contenant un grand nombre d’équations et de paramètres à déterminer. L’implémentation de ces outils est donc complexe et limite leur adaptabilité surtout lorsqu’il s’agit de traiter des données brutes, hétérogènes et d’ajuster des paramètres. Néanmoins, ces modèles qui valorisent les connaissances et l’expertise des biologistes, constituent des outils très informatifs et utiles pour pouvoir tester des hypothèses concernant le fonctionnement de systèmes biologiques (TOMLIN et AXELROD (2007)).

Á l’inverse, les outils de d’apprentissage automatique, appelé couramment outils de « Machine Learning », et outils « boites-noires », ne nécessitent aucune connaissance a priori en ce qui concerne la dynamique du système étudié. En revanche, ces outils, tels que les Réseaux de Neurones, nécessitent de disposer d’une grande quantité de données collectées pour pouvoir les ajuster, surtout lorsqu’il s’agit de prédire des phénomènes complexes. Étant donné que ces outils n’intègrent pas de connaissances biologiques, ils sont très génériques et peuvent être utilisés pour traiter des problématiques très variées. Seulement, cette généricité limite leur adaptabilité et la possibilité de prendre en compte de l’existence de phénomènes biologiques sous-jacents, comme des phénomènes de diffusion, de retard, de saturation ou encore d’accumulation.

Table des matières

Introduction générale
1 Utilisation d’outils mathématiques et statistiques dans le domaine de la production animale : Etat de l’art et approche explorée
1.1 Les intérêts et les difficultés de la modélisation mathématique dans le domaine de la production animale
1.2 Les différents types de modèles mathématiques et les différentes méthodes d’apprentissage
1.2.1 L’apprentissage supervisé et non-supervisé
1.2.2 Les modèles paramétriques et non-paramétriques
1.2.3 Des modèles statiques et des modèles dynamiques
1.2.4 Des modèles déterministes et des modèles stochastiques
1.2.5 Des modèles «boîtes-noires» et des modèles « boîtes-blanches »
1.3 Émergence d’approches intermédiaires
1.3.1 L’apprentissage statistique
1.3.2 Le Couplage Modèle-Données
1.4 Réapprentissage et Assimilation de Données
1.5 Résumé de l’état de l’art
1.6 L’approche explorée dans ces travaux de thèse
1.7 Description des données disponibles et de la méthode d’adimmentionnement appliquée
1.7.1 Les données disponibles
1.7.2 Adimentionnement des données
1.8 Présentation de l’algorithme DIRECT
2 Construction et analyse d’outils d’apprentissage statistique biomimétiques
2.1 Construction d’un premier modèle mathématique biomimétique
2.1.1 Élaboration des équations constituant le modèle mathématique
2.1.2 Contextes d’application du modèle mathématique et les différentes versions développées
2.1.3 Les conditions initiales et les conditions aux bords
2.1.4 Les paramètres du modèle
2.1.5 Discrétisation du modèle mathématique
2.2 Etude des gammes de valeurs des paramètres du modèle mathématique
2.2.1 Détermination des gammes de valeurs des vitesses de convection et de diffusion
2.2.2 Etude de l’effet de saturation de l’impact des paramètres sur le modèle
2.2.3 Détermination des gammes de valeurs de ud, fd et rd
2.3 Tests par simulation de la capacité d’apprentissage de l’outil d’apprentissage statistique modélisant un phénomène de croissance
2.3.1 Génération d’une base de données fictive
2.3.2 Les relations existantes entre les paramètres
2.3.3 Ajustement des paramètres et calcul de la précision du modèle
2.3.4 Étude de la robustesse du modèle et de l’impact de la présence de bruit dans les données d’apprentissage
2.4 Tests par simulation de la capacité d’apprentissage des autres versions du modèle « A » : Le modèle « A d’augmentation » et de « diminution »
2.4.1 Génération de bases de données
2.4.2 Ajustement des paramètres
2.4.3 Capacité d’extrapolation des différentes versions du modèle « A »
2.5 Application de l’approche développée sur des données réelles
2.5.1 Le modèle mathématique utilisé
2.5.2 Les données utilisées
2.5.3 Etude des relations existantes entre les paramètres du modèle
2.5.4 Ajustement des paramètres du modèle
2.5.5 Résultats
2.5.6 Discussion des résultats
Conclusion générale 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *