Les modèles de plantes ont besoin de données de haute qualité pour l'étalonnage et la validation. Les techniques d'apprentissage automatique devraient jouer un rôle de premier plan dans la fourniture de données de phénotypage basées sur des images de haute qualité à l'avenir. Pourtant, l'apprentissage automatique nécessite généralement des ensembles de données volumineux et diversifiés pour apprendre des modèles généralisables et les ensembles de données disponibles sont souvent petits et les coûts associés à la génération de nouvelles données sont élevés. Ubbens et coauteurs résoudre ce problème en utilisant des données provenant de plantes synthétiques.

Les auteurs démontrent que les modèles d'apprentissage automatique peuvent être augmentés à l'aide de données d'entraînement dérivées d'images rendues de plantes synthétiques. La combinaison d'images de plantes réelles et synthétiques en tant que données d'apprentissage a réduit l'erreur de comptage absolue moyenne par rapport à l'utilisation d'images de plantes réelles uniquement. De plus, des modèles complètement entraînés uniquement sur des rosettes synthétiques ont été appliqués avec succès pour compter les feuilles dans de vraies rosettes.
Les images rendues des rosettes d'Arabidopsis ont été générées par ordinateur à partir d'un modèle descriptif utilisant des systèmes en L qui reproduisaient les premiers stades de développement de la pousse de la plante sur la base d'observations et de mesures directes.
Le modèle d'apprentissage automatique utilisé dans cette étude était une plate-forme de phénotypage des plantes basée sur l'image appelée Deep Plant Phenomics, qui met en œuvre des réseaux de neurones à convolution profonde pour le phénotypage des plantes, pour compter les feuilles (Ubbens et Stavness, 2017).
Avec les progrès réalisés dans cette étude, la prochaine application pourrait être la modélisation de parcelles entières de cultures. "Une parcelle de plantes simulée pourrait potentiellement permettre de former des algorithmes pour détecter des traits biologiquement significatifs tels que le temps de floraison ou la réponse au stress avec un nombre réduit d'images de cultures réelles (annotées)."
