Les progrès de l'informatique et du phénotypage à haut débit ont entraîné une augmentation massive de la disponibilité des données. Les scientifiques exploitent ces données pour prédire de nouveaux résultats, tels que la réponse d'une culture à être plantée dans un endroit différent, ou au même endroit avec un climat différent.

Selon un nouvel article de recherche du Dr Carlos Messina de Corteva Agriscience et ses collègues, de nouvelles approches de modélisation devraient être explorées pour exploiter cette mine de données. Cet article présente plusieurs approches de modélisation hybrides pour obtenir des prédictions précises et interprétables.

Les auteurs ont utilisé un modèle de système existant, CROPGRO, pour prédire les stades phénologiques dans de nouveaux environnements à l'aide d'un vaste ensemble de données intercontinentales enregistrant le moment des stades de développement du soja. Ils ont constaté que le modèle existant ne se généralisait pas bien à tous les environnements et à toutes les maturités, car il utilisait simplement une série chronologique de températures quotidiennes et de photopériode (par exemple, des degrés-jours) pour déterminer le jour calendaire d'un événement de développement. "Bien que les modèles de systèmes fonctionnent bien dans des conditions spécifiques, ils ne sont pas suffisamment généralisables pour soutenir les décisions agronomiques et de sélection dans une variété de conditions environnementales et de maturités relatives continues", explique le Dr Ryan McCormick, auteur principal de l'étude.

Les auteurs ont entrepris plusieurs approches pour améliorer CROPGRO.

Tout d'abord, ils ont utilisé une stratégie d'optimisation multimodèle hautement parallélisée pour réadapter CROPGRO. À l'aide d'un algorithme évolutif, 36 paramètres ont été explorés pour identifier l'équifinalité et les familles de paramètres au comportement similaire. Le vecteur de paramètres avec l'ajustement optimal trouvé à la fin de tout cycle d'évolution a été retenu et utilisé comme ensemble de paramètres optimisés pour les analyses ultérieures à l'aide de CROPGRO. Le modèle réaménagé ("CROPGRO optimisé") a obtenu de meilleurs résultats après le processus de réaménagement par rapport à la version précédente.

Ensuite, les auteurs ont développé des modèles d'apprentissage automatique à l'aide de réseaux de neurones. Formés avec des entrées de température quotidienne minimale, de température quotidienne maximale, de rayonnement solaire, de photopériode et de maturité relative, ces modèles ont prédit avec précision les stades de développement quotidiens. L'inclusion de prédictions "CROPGRO optimisées" en tant que fonctionnalités dans le modèle de réseau a amélioré la précision de leurs prédictions, indiquant que l'apprentissage automatique peut être amélioré en incluant des fonctionnalités conçues par des experts de modèles basés sur les connaissances.

La collection de 20 modèles basés sur les connaissances et basés sur les données a ensuite été combinée pour améliorer encore la prédiction. Les auteurs ont combiné les modèles avec la prédiction de chaque modèle individuel pondérée de manière égale dans la prédiction d'ensemble finale. Ils ont également utilisé le super apprentissage, qui a pondéré les modèles en fonction de leurs performances. Le super apprenant a surpassé l'ensemble simple de modèles, mais était similaire à "CROPGRO optimisé" (voir figure).

Messina et McCormick conviennent que « ce travail démontre que les modèles de machine ne remplacent pas les modèles développés sur la base des connaissances scientifiques, mais la fusion des deux approches, les modèles basés sur la science, peut résoudre au moins en partie le problème de la sous-détermination des modèles de machine, peut conduire à de meilleures prédictions et à découvrir de nouvelles connaissances.

La communauté DSSAT (Decision Support System for Agrotechnology Transfer) s'engage à promouvoir le développement de tous les modèles et outils logiciels DSSAT en tant que projets open source. Le code DSSAT Cropping System Model (CSM), y compris CROPGRO, est entièrement ouvert et accessible sur https://github.com/DSSAT/dssat-csm-os