La distribution spatiale des paramètres du sol dans la parcelle est structurée

La distribution spatiale des paramètres du sol dans la parcelle est structurée

complexes avec un grand nombre de paramètres Les modèles de culture sont des outils particulièrement intéressants pour valoriser les informations recueillies sur les cultures, en estimant les paramètres d’entrée du modèle par inversion. Ces observations représentent en effet des observations de variables d’état simulées par ces modèles. Il est donc possible de Position du problème Position du problème 11 les inverser pour retrouver les valeurs de leurs paramètres d’entrée tels que les caractéristiques du sol. Par ailleurs, ces modèles simulent des variables de sortie pertinentes pour la prévision des consommations en eau et en azote de la plante, du rendement et de la qualité de la récolte, lesquelles variables peuvent être optimisées pour la mise au point d’itinéraires techniques. Ce sont des modèles complexes qui impliquent le sol, la plante et l’atmosphère. Ces trois compartiments sont reliés entre eux par des flux de matières qui sont pilotés par des bilans énergétiques. Par exemple, le flux de carbone dans le système de culture est piloté par un bilan d’énergie du rayonnement (Brisson et al., 2006). Ces modèles décrivent, sous forme d’équations mathématiques, les processus physiques et biologiques qui caractérisent le fonctionnement d’une culture, en interaction avec son environnement. Les simulations issues de ces modèles sont réalisées à un pas de temps journalier. Ces modèles comportent deux types de variables : des variables d’entrée et des variables de sortie. Les variables d’entrée sont représentées par les variables climatiques (pluies, températures, rayonnement global,…) qui sont généralement mesurées chaque jour et qui sont imposées au modèle (sous la forme d’un forçage climatique). Les variables de sortie sont calculées par le modèle et sont des variables agroenvironnementales qui décrivent l’état du système sol-plante. Leur nombre diffère selon les modèles, mais les principales variables généralement modélisées sont l’indice foliaire (LAI), la biomasse aérienne, la quantité d’azote contenu dans la plante, la quantité et la qualité de la récolte ainsi que le contenu en eau et en azote du sol. Ces modèles peuvent comporter un grand nombre de paramètres qui règlent les différentes lois d’action et équations du modèle. Ils concernent les paramètres généraux, les caractéristiques de la plante cultivée, les techniques agricoles employées et les propriétés du sol. Le modèle STICS (Brisson et al., 2008), avec lequel nous travaillons, considère 227 paramètres pour le cas du blé tendre qui sont répartis en trois groupes : 129 paramètres liés aux caractéristiques de la plante, 23 paramètres des techniques agricoles et 75 paramètres de propriétés des sols. Les valeurs des paramètres liés aux caractéristiques de la plante proviennent d’études antérieures décrites dans la littérature, issues de mesures expérimentales précises 12 ou bien d’une calibration préalable sur une base de données (Flenet et al., 2003; Hadria et al., 2007; Singh et al., 2008). L’incertitude liée à ce premier groupe de paramètres peut être importante car les valeurs issues des mesures ou de la calibration sont généralement entachées d’erreurs. Les paramètres des techniques agricoles appliquées au système cultural renseignent, entre autres, la date de semis, la nature des résidus de la culture précédente et le type de travail du sol, la date et la dose de fertilisant (ou d’eau) apportée au système. Les valeurs de ces paramètres sont généralement bien renseignées au niveau de la parcelle car elles correspondent aux décisions techniques prises par l’agriculteur. Dans le cas de l’agriculture de précision, la variabilité spatiale des modalités techniques est cependant difficile à appréhender et peut également être entachée d’erreurs. Les propriétés des sols, qui font l’objet central de ce travail, peuvent être déterminées à partir d’analyses ou de cartes de sols, mais cela n’est pas adapté, nous le rappelons, au contexte de l’agriculture de précision au niveau intra-parcellaire. Les paramètres du sol sont les plus difficiles à connaitre en chaque point de l’espace et nous proposons dans cette étude de les estimer par inversion du modèle STICS. 

Le problème posé par le grand nombre de paramètres à estimer 

Nous visons dans ce travail l’estimation des paramètres descriptifs du sol, en considérant que les autres paramètres sont connus. Même avec cette restriction, cela n’est pas chose aisée (Tremblay and Wallach, 2004; Launay and Guérif, 2005). La principale raison, indépendamment de la méthode d’estimation choisie, est qu’il est impossible d’estimer simultanément tous les paramètres du sol de STICS car une grande partie des paramètres n’est pas identifiable ; ceci est dû à la structure des équations du modèle (Niu and Fisher, 1997; Makowski et al., 2006a). Un manque d’identifiabilité apparaît lorsque plusieurs valeurs de paramètres aboutissent aux mêmes valeurs des variables observées : il est difficile d’estimer correctement ces paramètres à partir de ces observations. Par exemple, une des équations du modèle STICS (voir Brisson et al., 2008) permet de calculer la quantité d’azote organique actif dans le sol (NHUM, t ha-1), provenant de la minéralisation de la matière organique du sol, de la façon suivante : 13 NHUM = Norg × PROFHUM × DA )1( × (1− FINERT) (1-1) où Norg (%) est le contenu en azote organique du sol, profhum (cm) est la profondeur de minéralisation, DA(1) (en g cm-3) est la densité volumique de la première couche de sol et FINERT représente la proportion d’azote inactif (fixée à 0.65). Ainsi, lorsque des observations reliées à la quantité en azote organique actif dans le sol sont disponibles, l’équation ci-dessus ne permet pas d’estimer simultanément Norg, profhum et DA(1) : il y a donc un problème d’identifiabilité. Pour cette raison, il est conseillé de sélectionner un sous-groupe de paramètres à estimer et de fixer les autres à une valeur convenable (appelée valeur nominale). Quand bien même un sous-groupe de paramètres à estimer a été sélectionné, il subsiste un autre problème. Les trois groupes de paramètres (liés à la plante, aux techniques agricoles et aux propriétés des sols) dépendent les uns des autres à travers les équations de STICS. Cela a pour conséquence que les valeurs estimées des paramètres du sol dépendent des valeurs auxquelles les paramètres des deux autres groupes sont fixés. Une mauvaise valeur donnée à un paramètre technique ou plante entraîne donc un biais sur l’estimation des paramètres du sol. Ce biais est appelé biais d’omission (Miller, 2002). Voici un exemple d’équations de STICS où un paramètre plante (sensibilité de la plante à la sècheresse SENSRSEC) et des paramètres du sol (humidité à la capacité au champ HCC et au point de flétrissement HMIN) donnent ensemble la valeur de l’effet de la sècheresse du sol à la date t (HUMIRACt) sur la germination : ( ) HCC HMIN HUMSOL HMIN HUMIRAC SENSRSEC SENSRSEC t t − − = + 1− , HUMSOLt > HMIN (1-2) où HUMSOLt est le contenu en eau du sol à la date t. A partir d’observations (directes ou indirectes) des variables HUMIRACt et HUMSOLt, l’estimation de HCC et de HMIN peut être biaisée si SENSRSEC n’est pas fixé à une bonne valeur. Il est donc important dans ce cas de calibrer correctement les paramètres liés aux caractéristiques de la plante afin d’estimer les paramètres du sol en minimisant au plus le biais d’omission. 

Les observations dont on dispose sont généralement peu nombreuses et imprécises 

Nous avons vu que les observations sur les sols par des mesures indirectes n’étaient pas encore exploitables pour estimer les propriétés permanentes des sols ainsi que pour fournir des informations sur des variables d’état des sols (contenu en eau et en azote) qui pourraient elles-mêmes être utilisées en mode inverse pour accéder aux propriétés des sols. Seules sont facilement exploitables les observations sur les couverts végétaux obtenues par télédétection ou par les capteurs de rendement, que les agriculteurs capitalisent année après année dans les contextes d’agriculture de précision. Ces données ne sont toutefois pas exemptes de problèmes. Pour les images de télédétection à haute résolution il s’agit de : (i) la faible répétitivité temporelle, croisée avec une haute probabilité de nuages, qui, dans les régions septentrionales comme la Picardie ne permet souvent pas d’avoir plus de 5 images exploitables par année, (ii) la variabilité de la richesse spectrale, qui dépend du capteur disponible : celle des capteurs aéroportés de type CASI peut être grande (mais chère et donc rare) et donne accès au LAI et à la teneur en azote de la plante QN ; celle des capteurs satellites de type SPOT est faible et ne donne accès qu’au LAI, (iii) le problème de l’inversion des mesures de réflectance pour estimer le LAI et le QN et des erreurs associées, de l’ordre de 17% pour LAI et 30% pour QN (Moulin et al., 2007). A cette erreur, s’ajoute celle liée à la mauvaise connaissance du contenu en aérosols de l’atmosphère utilisé pour obtenir les réflectances de surface à partir des mesures au niveau du satellite (Launay et al., 2000). En ce qui concerne les cartes de rendement, établies à l’aide de capteurs embarqués sur la moissonneuse, le principal problème d’obtention réside dans la difficulté à étalonner ces capteurs de manière précise sur l’ensemble de la parcelle, ce qui engendre une erreur de l’ordre de 9% (Machet et al., 2007). Compte tenu de la complexité du problème posé, il est nécessaire de mettre en œuvre une méthodologie adaptée, qui consiste dans une première étape à cibler les paramètres qui sont les plus pertinents à estimer et dans une seconde étape à 15 appliquer la méthode d’estimation la mieux adaptée à notre contexte. Nous présenterons dans la suite une manière de répondre à ces objectifs. 

Les méthodes d’estimation et de sélection des paramètres à estimer 

Les méthodes d’estimation de paramètres 

Il existe un large panel de méthodes pour estimer les paramètres d’un modèle complexe. Ces méthodes peuvent être regroupées en deux principales familles : l’approche fréquentiste et l’approche Bayesienne (Makowski et al., 2006a). La mise en œuvre de l’approche fréquentiste ne nécessite qu’un jeu d’observations alors que l’approche Bayesienne utilise en plus, une information sur la distribution des paramètres à estimer. Les approches Bayesiennes sont devenues de plus en plus utilisées ces dernières années pour estimer les paramètres de modèles complexes car elles permettent de mieux prendre en compte les incertitudes, aussi bien sur les paramètres d’entrée que sur les simulations du modèle. Par ailleurs, leur utilisation a été largement facilitée par le décuplement des vitesses de calcul des ordinateurs et le développement de nouveaux algorithmes. Les méthodes fréquentistes ne considèrent pas les paramètres du modèle comme étant des variables aléatoires, comme le font les méthodes Bayesiennes, mais plutôt comme étant des variables fixées à une certaine valeur, à estimer. L’application d’une méthode fréquentiste permet alors de déterminer une valeur particulière de chaque paramètre à partir d’un jeu d’observations, et cette valeur est appelée estimateur du paramètre. Parmi ces méthodes fréquentistes, il existe celle du maximum de vraisemblance (Aldrich, 1997; Hald, 1999), des moindres carrés (Seber and Wild, 2003), les algorithmes génétiques (Mitchell, 1998) ou les méthodes variationnelles (Bouttier and Courtier, 1999) qui permettent, en plus d’estimer les paramètres, de contrôler les variables d’état du modèle (lissage, prédiction à court terme, …). 16 Les méthodes Bayesiennes, quant à elles, utilisent une information supplémentaire sur la distribution des paramètres, dite information a priori. Les paramètres étant ici considérés comme des variables aléatoires définies par une densité de probabilité a priori, le résultat de l’application d’une approche Bayesienne sur un jeu de données est une nouvelle densité de probabilité appelée densité a posteriori des paramètres. L’application d’une méthode Bayesienne peut être abordée en deux étapes. La première consiste à déterminer l’information a priori des paramètres à estimer, à partir de différentes sources qui peuvent être constituées par des mesures, la littérature ou bien des dires d’experts. Cette information a priori peut se limiter à de simples bornes sur les valeurs des paramètres sans être plus informative sur la distribution de ces valeurs (densité uniforme) ; elle peut aussi être plus précise quant à cette distribution (densité normale, de Poisson, Gamma, …). La seconde étape consiste à déterminer la densité a posteriori à partir de la densité a priori et du jeu d’observations, en utilisant le théorème de Bayes (Makowski et al., 2006a). Cette densité a posteriori peut alors être utilisée à diverses fins comme estimer la valeur la plus probable de chaque paramètre (en considérant le mode ou la moyenne), calculer l’incertitude sur l’estimation des paramètres ou encore calculer l’incertitude sur les variables simulées par le modèle à partir de l’incertitude sur l’estimation des paramètres. Parmi les méthodes Bayesiennes, on peut citer MCMC (Metropolis et al., 1953; Hastings, 1970), Importance Sampling (Beven and Binley, 1992; Beven and Freer, 2001) ou bien certaines méthodes de filtrage (Hilgert et al., 2005; Rossi and Vila, 2005) qui permettent en plus, comme les méthodes fréquentistes variationnelles, de contrôler les variables d’état du modèle. 

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *