Relier mécaniquement la séquence du génome aux phénotypes végétaux complexes nécessite des détails biochimiques et biophysiques importants. Malheureusement, les modèles de réseaux de régulation des gènes végétaux représentent leurs composants d'ARN avec des unités de masse arbitraires. Cette pratique est hérité de la méthodologie expérimentale, où l'abondance d'ARN est généralement normalisée à une norme interne pour la quantification, produisant des données en unités arbitraires et relatives.

L'utilisation d'unités arbitraires empêche les chercheurs d'évaluer la validité des valeurs et ne fournit pas les détails biochimiques et biophysiques requis pour le génie biologique.

Uriel Urquiza García, chercheur postdoctoral à la Heinrich-Heine-Universität Düsseldorf, et Andrew Millar, professeur à l'Université d'Édimbourg, améliorer un modèle existant de réseau de régulation de gènes végétaux du circuit de gènes d'horloge en refactorisant le modèle pour utiliser des unités de masse absolues dans leur nouveau in silico Article sur les plantes.

Les auteurs ont concentré leurs efforts sur un modèle d'horloge mathématique. « Les horloges végétales coordonnent de nombreux processus de développement et physiologiques. Les agriculteurs et les sélectionneurs ont étendu la gamme de cultures céréalières vers le nord, sans savoir qu'ils sélectionnaient des mutations dans les gènes de l'horloge et liés à l'horloge. Comprendre le circuit des gènes de l'horloge promet de guider la sélection et/ou l'ingénierie des variétés de cultures, pour de nouvelles combinaisons de conditions climatiques », déclare Millar.

Les auteurs ont refactorisé un modèle d'horloge existant, P2011, pour utiliser des valeurs absolues des niveaux d'ARNm du gène de l'horloge en unités de transcrits d'ARN par cellule, qui étaient publié par leur projet précédent "TiMet" (voir figure). Le modèle alternatif résultant a été appelé U2019. Le modèle U2019 a été mis à jour en incluant des interactions réglementaires circadiennes supplémentaires pour produire le modèle U2020.

La reproductibilité et la large réutilisation des modèles nécessitent des outils d'analyse de données ouverts.
La reproductibilité et la large réutilisation des modèles nécessitent des outils d'analyse de données ouverts.

Selon Millar, « en recalibrant nos modèles en unités absolues de transcrits par cellule, il est devenu possible de comparer les taux de transcription modélisés à des données biochimiques mesurées. Malheureusement, nous ne disposions d'aucune donnée de référence pour les taux de transcription végétaux en général. Uriel a combiné deux jeux de données issus de la littérature pour créer le jeu de données de référence des taux de transcription végétaux mesurés dont nous avions besoin. » Les auteurs ont constaté une corrélation très significative entre les jeux de données publiés, ce qui a permis de les combiner à cette fin.

Tester les taux de transcription inférés des modèles par rapport à l'ensemble de données de référence représente une avancée dans le réalisme biochimique pour les modèles de régulation des gènes végétaux.

ARTICLE DE RECHERCHE

Uriel Urquiza-García, Andrew J Millar, Test des taux de transcription inférés d'un modèle de réseau de gènes dynamique en unités absolues, in silico Plants, Volume 3, Numéro 2, 2021, diab022, https://doi.org/10.1093/insilicoplants/diab022


Les auteurs ont adopté une approche Open Science, de sorte que leur distribution de taux de transcription de référence peut être référencée sans ambiguïté à l'aide de son identifiant dans la base de données BioNumbers, BNID117324. Les données, les modèles, l'environnement de calcul en tant que conteneur Docker et d'autres ressources sont accessibles au public à partir du référentiel FAIRDOMHub.org, sous forme d'instantané statique, structuré selon la hiérarchie ISA standard (doi : 10.15490/FAIRDOMHUB.1.ENQUÊTE.170.3). Voir l'article pour plus de détails.