Un nouveau projet tente d'apprivoiser la nature sauvage des modèles végétaux en créant une plate-forme de modélisation dédiée qui prend en charge la conception, la reproductibilité et la diffusion de modèles collaboratifs et distribués.
Au cours des dernières décennies, équipes cloisonnées ont développé des modèles utilisant différents langages de programmation, avec différents degrés de modularité et d'interopérabilité. Alors que les phytotechniciens se précipitent pour répondre aux demandes croissantes de rendement face au changement climatique, les technologies avancées de biologie moléculaire, de biochimie et de calcul haute performance offrent une opportunité sans précédent de créer des modèles qui guident les progrès rapides de la sélection végétale. Les progrès exigeront également que la recherche aille au-delà de la modélisation à échelle unique pour modélisation multi-échelle intégrative pour obtenir une modélisation multi-échelle intégrative qui tire pleinement parti de notre compréhension des mécanismes moléculaires et de la richesse des données à l'échelle du génome qui ont été générées au cours des trois dernières décennies. Cependant, la capacité à construire des modèles multi-échelles intégratifs est actuellement entravée par la difficulté d'échanger, de réutiliser et de combiner des modèles et des outils de simulation entre équipes (voire au sein d'une équipe) malgré l'existence de plateformes de modélisation dédiées créées à cet effet.
Des plateformes de modélisation dédiées existent depuis 25 ans, permettant aux utilisateurs de créer, d'exécuter et d'interagir avec des modèles et de visualiser leur sortie (par exemple, V-Laby, GroIMP, L-Py, AmapSim, AMAPmod, Capsis). Les plates-formes plus récentes facilitent également l'intégration et l'interopérabilité de modèles et de structures de données hétérogènes (par exemple, OpenAlea et Yggdrasil).
Dans un nouvel article publié par le Dr Frédéric Boudon, Chercheur en Modélisation Végétale et Informatique à l'UMR AGAP Institut de l'Université de Montpellier et ses collègues présents un nouvel environnement de modélisation virtuel convivial utilisant des blocs-notes Jupyter. Leur approche unique s'attaque à plusieurs problèmes couramment rencontrés par les modélisateurs de plantes, notamment la reproductibilité, la réutilisation, la modularité, la collaboration et la maintenance.
Selon Boudon, "l'utilisation de Jupyter notebook rend notre plateforme unique car sa capacité à créer des récits de modélisation permet de donner aux utilisateurs un accès aux différentes étapes du pipeline de modélisation de manière claire, documentée et partageable. Nous utilisons également une représentation standard de tableaux multidimensionnels pour représenter les propriétés des plantes, ce qui améliore l'efficacité de la modélisation et du processus de codage car il ne nécessite pas de codes personnalisés pour extraire, transformer et visualiser les données. Ces fonctionnalités sont fournies prêtes à l'emploi par la pile scientifique Python, ce qui minimise la charge de maintenance.
L'environnement de modélisation basé sur Jupyter rend possible la conception de modèles reproductibles, réutilisables, collaboratifs et distribués. Le format de bloc-notes prend en charge une spécification claire des processus et de la documentation pour créer le récit de simulation d'un scénario de modélisation. Ce format permet de spécifier clairement les hypothèses du modèle et les valeurs réelles des paramètres, rendant les informations accessibles aux futurs utilisateurs. Cela permet aux collaborateurs et aux utilisateurs de tester et de modifier un modèle. L'inclusion du système de gestion de paquets conda permet de spécifier clairement les dépendances logicielles. De plus, l'environnement permet le développement de modèles à distance, de sorte qu'il n'est pas nécessaire que les utilisateurs disposent de ressources de calcul étendues. Cela facilite davantage la conception et la mise en œuvre de modèles collaboratifs et distribués.
L'augmentation de la modularité du modèle est possible grâce à l'inclusion de xarray-simlab, une bibliothèque Python pour organiser et exécuter des simulations. La bibliothèque fournit un cadre pour composer des modèles de calcul complexes à partir d'ensembles de sous-modèles ou de modules réutilisables. Une collection de sous/modèles peut être combinée pour former un modèle, et leur ordre de calcul est entièrement déduit des dépendances de processus. Cette modularité permet aux utilisateurs d'exécuter des simulations pour un sous-ensemble de processus uniquement ou même de définir des processus alternatifs pour remplacer ceux prédéfinis.
Pour illustrer l'utilisation du nouvel environnement de modélisation, les auteurs ont repensé V-Mango, un modèle existant de développement du manguier et de production de fruits, et réorganisé son code.

« Nous avons choisi V-Mango car c'était un modèle complexe qui pouvait bénéficier d'une refonte et d'une réorganisation du code. Le modèle était composé de processus implémentés sous forme de fonctions simples ou de règles du système L sans aucun moyen de les distinguer les uns des autres. De plus, l'interaction entre les sous-modèles était restreinte par l'utilisation de différentes technologies linguistiques », explique Boudon.
La fonctionnalité de xarray-simlab dans l'environnement Jupyter a permis aux auteurs de reconcevoir facilement V-mango et de réorganiser son code. Cela consistait à définir les processus et leurs entrées/sorties et à attribuer la logique de modèle correspondante (voir ancien vs nouveau flux de travail).

Les problèmes de maintenance sont réduits avec la plate-forme Jupyter car les fonctionnalités sont fournies prêtes à l'emploi par la pile scientifique Python. Cela réduit le besoin de codes personnalisés difficiles à maintenir pour extraire, transformer et visualiser les données.
Les auteurs encouragent les autres à essayer la plate-forme open-source eux-mêmes.
LIRE L'ARTICLE:
Jan Vaillant, Isabelle Greci, Frédéric Normand, Frédéric Boudon, Vers des environnements virtuels de modélisation de modèles fonctionnels structuraux végétaux à partir de cahiers Jupyter : Application à la modélisation de la croissance et du développement du manguier, in silico Plants, 2021;, diab040, https://doi.org/10.1093/insilicoplants/diab040
Ce manuscrit fait partie de in silico Plant's Numéro spécial sur le modèle structurel fonctionnel de l'usine.
pgljupyter est disponible sur https://github.com/fredboudon/plantgl-jupyter/ et vmango-lab à https://github.com/fredboudon/vmango-lab avec des instructions pour le processus d'installation. Tous les exemples de la section 3 sont disponibles sous forme de blocs-notes dans un référentiel de démonstration à l'adresse https://github.com/fredboudon/plantgl-jupyter/blob/isp2022/examples et peuvent être inspectés avec nbviewer et reproduits localement ou sur une instance de classeur. Les cahiers décrits à la section 4 sont disponibles sur https://github.com/fredboudon/vmango-lab-demo/tree/isp2022.
