Erik Amézquita, estudiante de doctorat en el departamento de Matemáticas, Ciencias e Ingeniería Computacionales de Michigan State University, es el autor principal de un artículo publicado en Plantes in silico présenter une nouvelle technique pour analyser la forme de las plantas.
L'Análisis Topológico de Datos (ATD, également connue comme TDA par son sigle en anglais) est une discipline mathématique émergente qui est basée sur la notion que toutes les données ont une forme, et toute la forme contient des données. Avec ATD, la forme de divers objets peut être caractérisée par l'utilisation de représentations mathématiques abstraites basées sur la topologie algébrique. Les stratégies d'ATD ne dépendent pas de l'existence de points de référence homologues – caractéristiques similaires dérivées d'un ancêtre commun –, ni ne sont restreintes à des objets d'une orientation ou d'une dimension particulière. ATD propose également un cadre robuste, étendu, comparable et quantifiable pour améliorer la morphologie d'une diversité de sources. L'un des nombreux outils disponibles d'ATD est la transformation des caractéristiques d'Euler (ECT pour nos noms en anglais), qui permet de modifier la topologie intrinsèque – en particulier la caractéristique d'Euler – d'un objet lorsqu'il est rebanado dans l'ensemble de toutes les directions possibles.
El uso de la ECT se basa en dos puntos clave . Primero, calcular la ECT de una semilla pequeña toma solo un par de segundos, lo cual es important cuando se trata de un gran volumen de datos. El segundo punto es que al rebanar una semilla a lo largo de todas les instructions possibles reprennent matemáticamente toutes les informations sur la morphologie, y compris des informations suffisantes pour reconstruire la forme originale à partir de zéro.
"El detalle es que en realidad hay un número infinito de direcciones para rebanar. Sin embargo, tomando unas 150 direcciones, parece que codificamos suficiente información morfológica para luego producir resultados emocionantes », explique Erik Amézquita, un matemático de formación ahora convertido en biologo.
Los autores compararon la efectividad del uso de descriptores tradicionales de forma, descriptores topológicos de forma, o una combinación de ambos para caracterizar e identificar semillas de diferentes diverseades de cebada.
Primero, se recolectaron espigas de 28 varieades de cebada de morfologías y orígenes geográficos diversos. Luego, en tandas de tres o cuatro muestras, estas espigas fueron escaneadas, utilizando tomografía computarizada (TC) de rayos X (Fig. 1). Estos escanes fueron posteriormente procesados digitalmente para aislar más de tres mil semillas individuales de las espigas.

Avec les semillas individualisées, les auteurs procèdent à leur façon. Premier midieron 11 descriptores tradicionales de forma, contes como longitud, anchura, altura, área de superficie and volumen de cada grano (Fig. 2).

Después, se midieron los descriptores topológicos de forma con la ECT. Para calcular la ECT, primero las semillas fueron rebanadas en 16 rodajas de igual grosor a largo de una dirección fija. Luego, las semillas se reconstruyen, agregando una rodaja a la vez, mientras se observan cambios en la característica de Euler (Fig. 3). Esta operación de rebanar, reconstruir rodaja a rodaja, y observar cambios en la característica de Euler se realizó para 158 directions diferentes en total. Avec ello, la ECT produjo más de 2500 rebanadas diferentes, correspondientes a más de 2500 descriptores topológicos para cada semilla. Para evitar distorsiones causadas por el trabajo con datos en dimensiones altas –la llamada maldición de la dimension,– fue necesaria una reducción de dimensionalidad.

Para evaluar cuánta forma describen realmente todos los descriptores, se dio a una computadora la tarea de caracterizar y predecir las 28 diverseades de cebada utilizando únicamente información morfológica de los granos. Esta máquina de vectores de soporte (SVM), utilizó tres tipos de entrenamiento. Primero, la máquina utilizó exclusivement descriptores tradicionales de forma. Después, la máquina fue entrenada únicamente con descriptores topológicos. Enfin, la machine a utilisé les sources d'information.
Los autores hallaron que para la mayoría de las diverseades, l'information topológica aide à la computadora a producir mejores predicciones comparado a cuando se usa únicamente características tradicionales de forma. La précision de la classification s'incrémente de plus en plus sur la combinaison de l'information traditionnelle et de la topolologie, lo que demuestra que la topología mide características omitidas por la configuration traditionnelle. Mejor aún, si bien los descriptores tradicionales pueden agrupar las semillas en función de su diversead, los descriptores topológicos pueden agruparlas aún más en función de su espiga.
Para determinar qué es exactamente ese "algo" ignorado por las características tradicionales, se realizaron varios análisis de análisis de varianza. Una exploración de las direcciones y rebanadas utilizados para calcular la ECT revela que la forma de la hendidura central y la parte baja de la semilla son lo que más discriminer varieades and espigas distintas (Fig. 4).

"La caractéristique d'Euler est une manière simple pero poderosa de revelar detalles qu'aucun fils n'obvios une simple vue. Hay información morfológica oculta que los métodos morfométricos tradicionales y geométricos ignoran. La caractéristique d'Euler, y ATD en général, puede calcularse fácilmente para cualquier imagen. ATD propone un camino nuevo y emocionante, dominado por información morfológica, para explorar más a fondo la relación fenotipo-genotipo”, concluye Amézquita.
LEA EL ARTICULO :
Elizabeth Munch, Daniel H Chitwood, Mesure du phénotype caché : quantification de la forme des graines d'orge à l'aide de la transformation caractéristique d'Euler, in silico Plants, 2021;, diab033, https://doi.org/10.1093/insilicoplants/diab033
Ce manuscrit forme une partie du numéro spécial de Plantes inSilico, Modèle structurel fonctionnel de l'usine.
Todos los datos y el código utilizados en este artículo están disponible de forma libre y abierta en https://doi.org/10.5061/dryad.rxwdbrv93 y https://github.com/amezqui3/demeter/.
