Il existe de nombreux restes fossiles de plantes qui pourraient aider à écrire de nouvelles histoires évolutives des familles botaniques. Les feuilles sont courantes parmi les restes, ce qui pourrait constituer un excellent moyen d'identifier les plantes. Mais les ressources pour l'identification des feuilles peuvent être difficiles d'accès. Peter Wilf et ses collègues ont comblé ce manque de connaissances en assemblage d'une base de données en libre accès de 30,252 XNUMX images de spécimens de feuilles vérifiées au niveau de la famille. En plus de fournir une excellente ressource pédagogique pour les étudiants humains, la base de données pourrait également fournir aux projets d'apprentissage automatique du matériel pour améliorer leurs systèmes.

"La complexité des feuilles est hors du commun, et la terminologie dont nous disposons pour les décrire n'est que le début le plus infime de ce qui est nécessaire", a déclaré Peter Wilf. a déclaré dans un communiqué de presse. «Les chercheurs ont besoin de références visuelles beaucoup plus accessibles pour étudier les différences entre les nombreux groupes de plantes, afin que nous puissions mettre davantage de mots sur cela. Il existe de nombreuses familles de plantes qui se ressemblent superficiellement, et cette collection offre l'occasion de voir de nouveaux modèles.
Ce n'est pas seulement la complexité qui est le problème. Dans leur article, Wilf et ses collègues mettent également en évidence l'enregistrement de l'architecture des feuilles, ou plutôt son absence. "Pour approfondir leurs connaissances sur l'architecture des feuilles, les chercheurs s'appuient toujours principalement sur la" tradition orale "d'un nombre décroissant de collègues compétents et sur une poignée d'articles d'enquête et de guides de terrain qui mettent l'accent sur les caractéristiques prétendument diagnostiques des feuilles... Il existe une littérature importante sur l'architecture des feuilles et enregistrements de fossiles de feuilles de divers taxons… Cependant, bon nombre des groupes d'angiospermes les plus divers et les plus importants sur le plan écologique n'ont pratiquement aucune documentation sur les caractéristiques diagnostiques du limbe des feuilles (par exemple, Asteraceae, Rubiaceae), et donc leurs fossiles de feuilles restent largement méconnus, bien que probablement bien caché dans les collections des musées…”
L'accès à ces collections peut être un défi. Physiquement, ils peuvent se trouver dans le monde entier, ce qui entraîne de nombreuses dépenses de voyage. Certains herbiers numérisent leurs collections, mais ce sont les herbiers les plus grands et les mieux financés qui peuvent se permettre de le faire. Dans l'article, Wilf et ses collègues ajoutent également que le simple fait d'être disponible en ligne n'est souvent pas suffisant pour un projet de recherche. "Dans la plupart des ensembles d'images en ligne, les téléchargements en masse ne sont pas faciles à effectuer, les images sont sous-échantillonnées en basse résolution et les noms de fichiers ne sont pas standardisés, ce qui nécessite un effort manuel important pour les réorganiser et les rassembler pour un projet particulier. Ajoutant des complications supplémentaires à la modularité des données, les données taxonomiques sont souvent devenues partiellement obsolètes.
"Ce que nous avons fait ici, c'est de mettre cette ressource éducative massive à la disposition de tous en vérifiant et en standardisant toutes ces images provenant de différentes sources héritées", a déclaré Wilf. "Il nous a fallu 15 ans pour faire cela et convertir tous les noms de fichiers, mais maintenant vous pouvez avoir l'ensemble du package sur votre bureau en un seul clic de navigateur. Chaque nom de fichier contient les informations clés intégrées, dans le même ordre pour un tri alpha rapide : famille, genre, espèce et numéro de spécimen. Les noms de fichiers peuvent être rapidement recherchés en quelques secondes pour l'élément qui vous intéresse et les images visualisées à l'aide d'outils standard, tels que la barre de recherche Windows. Toutes les images sont en résolution d'origine ; rien n'est sous-échantillonné.
Ce ne sont pas seulement les yeux humains qui peuvent bénéficier de la base de données. Les auteurs parlent également d'apprentissage automatique. Ils décrivent quelques applications comme "faisant des percées spectaculaires" dans l'identification des plantes. Mais ils soulignent également certains problèmes. Premièrement, les algorithmes sont opaques - on ne sait pas ce que les ordinateurs ont reconnu comme caractéristiques de diagnostic lors de l'identification des plantes.
Un autre problème est que peu d'algorithmes identifient au-delà du niveau de l'espèce. Le public aime connaître l'espèce d'une plante, mais il peut être utile de savoir ce qui relie une famille de plantes. Pour les fossiles de feuilles, il se peut qu'il n'y ait pas d'espèce ou de genre existant à connecter à une image, donc être capable d'identifier une famille grâce à l'apprentissage automatique serait extrêmement utile.
"Cette base de données rend les informations de ces collections accessibles aux personnes du monde entier sous une forme plus facile à rechercher que l'original et plus propice aux analyses numériques", a déclaré Scott Wing, co-auteur de l'article. "Nous pensons que la base de données encouragera de nouvelles recherches et ouvrira également les collections du musée aux gens."
LIRE L'ARTICLE
Wilf, P., Wing, SL, Meyer, HW, Rose, JA, Saha, R., Serre, T., Cúneo, NR, Donovan, MP, Erwin, DM, Gandolfo, MA, González-Akre, E., Herrera, F., Hu, S., Iglesias, A., Johnson, KR, Karim, TS et Zou, X. (2021) "Un ensemble de données d'images de feuilles nettoyées, radiographiées et fossiles approuvées pour la famille des plantes pour l'homme et l'apprentissage automatique », PhytoClés, https://doi.org/10.3897/phytokeys.187.72350
ACCÉDER À LA BASE DE DONNÉES
Wilf, P., Wing, SL, Meyer, HW, Rose, JA, Saha, R., Serre, T., Rubén Cúneo, N., Donovan, M., Erwin, DM, Gandolfo, MA, Gonzalez-Akre, EB, Herrera, F., Hu, S., Iglesias, A., Johnson, KR, Karim, TS et Zou, X. (2021) et des feuilles fossiles approuvées pour planter la famille pour l'apprentissage humain et automatique. Partage de figues+, https://doi.org/10.25452/figshare.plus.14980698
