Erik Amézquita, doctorant au département de mathématiques, sciences et ingénierie computationnelles de la Michigan State University, est l'auteur principal d'un article publié dans in silico Plantes qui présentent une nouvelle technique pour analyser les formes des plantes.

L'analyse topologique des données (ATD) est une discipline mathématique émergente qui repose sur le principe que toute donnée est une forme, et toute forme est une donnée. L'ATD permet de caractériser la forme d'objets divers à l'aide de représentations mathématiques abstraites basées sur la topologie algébrique. Cette approche ne dépend pas de l'existence de points de repère homologues (caractéristiques similaires dues à une ascendance commune) et ne se limite pas aux objets d'une orientation ou d'une dimension particulière. L'ATD offre ainsi un cadre robuste, complet, comparable et quantifiable pour mesurer la forme d'une grande variété de données. Parmi les nombreux outils ATD disponibles figure la transformation de caractéristique d'Euler (TCE), qui mesure comment la topologie intrinsèque (et plus précisément la caractéristique d'Euler) d'un objet évolue lorsqu'il est découpé selon différents seuils et directions.

Le choix d'utiliser l'ECT ​​découle de deux raisons importantes. La première est que le calcul ECT pour une petite graine ne prend que quelques secondes, ce qui est important lorsqu'il s'agit d'un grand volume de données. La deuxième raison est que trancher une graine à travers tout est possible directions garantit mathématiquement d'encoder tout ce qu'il y a à savoir sur la forme, assez pour même reconstruire la forme originale à partir de zéro.

« La mise en garde est qu'il existe en fait un nombre infini de directions à calculer. Néanmoins, même en prenant environ 150 directions, nous semblons coder suffisamment d'informations morphologiques pour produire ensuite des résultats passionnants », explique Erik Amézquita, mathématicien de formation devenu biologiste végétal.

Les auteurs ont comparé l'efficacité de l'utilisation de descripteurs de forme traditionnels, de descripteurs de forme topologiques ou d'une combinaison des deux pour caractériser et identifier les semences de différentes accessions d'orge.

Figure 1 : Panicule 3D après normalisation de la densité, élimination de l'air et des autres débris et taille des barbes.

Tout d'abord, ils ont collecté des panicules de 28 accessions avec diverses morphologies d'épis et origines géographiques. Ensuite, ils ont scanné ces panicules (grappes de graines), par lots de trois ou quatre panicules chacun, à l'aide d'une tomodensitométrie (TDM) à rayons X (Fig. 1). Ces scans ont ensuite été traités numériquement pour isoler plus de trois mille graines d'orge individuelles des panicules. Enfin, chaque graine a été alignée et orientée selon ses trois principales composantes principales.

Les auteurs ont alors procédé à la quantification de la forme des grains d'orge. Ils ont d'abord mesuré 11 descripteurs de forme traditionnels différents, comme la longueur, la largeur, la hauteur, la surface et le volume de chaque graine (Fig. 2).

Figure 2. Les graines ont été alignées selon leurs composants principaux et les descripteurs de forme traditionnels ont été mesurés.

Ensuite, les descripteurs de forme topologiques ont été mesurés avec l'ECT. Pour calculer l'ECT, les graines ont d'abord été coupées dans une direction fixe en 16 tranches d'épaisseur égale. Ensuite, les graines ont été reconstruites en ajoutant une tranche à la fois et les modifications de la caractéristique d'Euler ont été enregistrées (Fig. 3). Ce hachage, la reconstruction tranche par tranche et le suivi des caractéristiques d'Euler ont été effectués pour 158 directions différentes au total. La procédure ECT a produit plus de 2500 tranches différentes, correspondant à plus de 2500 descripteurs de forme topologique pour chaque graine. Pour éviter les distorsions causées par le travail avec des données dans des dimensions élevées - connues sous le nom de malédiction de la dimensionnalité - une réduction de la dimensionnalité était nécessaire.

Figure 3. Chaque graine a été « coupée » en 32 tranches de haut en bas. Au fur et à mesure que des tranches sont ajoutées, un nombre associé à la topologie est calculé.

Pour étudier la pertinence de tous les descripteurs de forme, un ordinateur a été chargé de caractériser et de prédire les 28 accessions de graines d'orge en utilisant uniquement les informations sur la morphologie des grains. L'ordinateur, une machine à vecteurs de support, utilisait trois types d'entraînement. Premièrement, la machine utilisait exclusivement des descripteurs de forme traditionnels. Ensuite, la machine a été entraînée uniquement avec des descripteurs de forme topologiques. Enfin, la machine a utilisé les deux sources d'information.

Les auteurs ont constaté que pour la plupart des accessions, les caractéristiques topologiques aident l'ordinateur à produire de meilleurs taux de prédiction que les caractéristiques de forme traditionnelles. Ces résultats de classification ont été encore renforcés lorsque les informations traditionnelles et topologiques ont été combinées, démontrant que la topologie mesure les caractéristiques manquées par le cadre traditionnel. De plus, alors que les descripteurs de forme traditionnels sont capables de regrouper les graines en fonction de leur accession, les descripteurs de forme topologiques ont pu les regrouper davantage en fonction de leur panicule.

Pour déterminer exactement ce qu'est ce « quelque chose » manqué par les caractéristiques traditionnelles, plusieurs évaluations d'analyses de variance ont été entreprises. Une exploration des directions et des tranches utilisées pour calculer l'ECT ​​révèle que la forme du pli et du bas des graines discrimine le plus les accessions (Fig. 4)

Figure 4. Les tranches les plus significatives correspondent au pli de la graine et à la morphologie du fond.

Selon Amézquita, « la caractéristique d'Euler est un moyen simple mais puissant de révéler des caractéristiques qui ne sont pas facilement visibles à l'œil nu. Il existe des informations morphologiques cachées qui manquent aux méthodes morphométriques traditionnelles et géométriques. La caractéristique d'Euler, et la TDA en général, peuvent être facilement calculées à partir de n'importe quelle donnée d'image. TDA suggère une nouvelle voie passionnante, guidée par les seules informations morphologiques, pour explorer davantage la relation phénotype-génotype.

LIRE L'ARTICLE:

Erik J Amézquita, Michelle Y Quigley, Tim Ophelders, Jacob B Landis, Daniel Koenig, Elizabeth Munch, Daniel H Chitwood, Mesure du phénotype caché : quantification de la forme des graines d'orge à l'aide de la transformation caractéristique d'Euler, in silico Plants, 2021;, diab033, https://doi.org/10.1093/insilicoplants/diab033


Ce manuscrit fait partie de in silico Plant's Numéro spécial sur le modèle structurel fonctionnel de l'usine.

Toutes les données et le code utilisés dans cet article sont librement et ouvertement disponibles sur https://doi.org/10.5061/dryad.rxwdbrv93 et https://github.com/amezqui3/demeter/.