L'avènement et l'étendue des ressources bioinformatiques ont simplifié le travail des scientifiques. Avant de se lancer dans des travaux pratiques, ils peuvent analyser les cibles génétiques et formuler de meilleures hypothèses. Plusieurs groupes et instituts de recherche ont pris l'initiative de fournir des ensembles de données, des outils, des algorithmes, du code source ouvert et des plateformes de visualisation.
L'étude approfondie d'un gène ou d'une protéine nécessite l'utilisation de multiples outils en ligne, bases de données et plateformes de visualisation. Par exemple : Aéroport or TAÏR pour récupérer des informations concernant l'annotation et la séquence, BioGRID pour les données d'interaction protéine-protéine, SUBA4 pour suivre la localisation subcellulaire, ÀPAN2.0 pour détecter les sites de liaison du facteur de transcription (TF), Phyre2 pour la modélisation 3D des protéines, et le Réactome pour les voies de signalisation, métaboliques et de régulation des gènes. De plus, de nombreux outils existent pour analyser les modifications post-traductionnelles (phosphorylation, acétylation, myristoylation, et ainsi de suite), séquences de ciblage sous-cellulaires, domaines fonctionnels et interactions petites molécules-protéines.

Ces outils et ressources se concentrent également sur une usine spécifique dans la majorité des cas. Par conséquent, vérifier la fonctionnalité d'une protéine ou d'un domaine particulier d'un point de vue inter-espèces nécessite plusieurs bases de données. À cette fin, extraire des données d'un outil et les exécuter sur une plate-forme différente nécessite de les retraiter ou de les formater avec précision pour l'outil suivant. L'intégration de plusieurs outils dans une seule plate-forme est une solution élégante pour éviter le travail et les tracas. L'intégration est un moyen pour ces outils de générer et de tester plus facilement les hypothèses qu'ils étaient censés faciliter en premier lieu.
Présentation de la plateforme intégrée ePlant
ePlante apporte plusieurs plates-formes de visualisation de données dans une seule interface basée sur une échelle hiérarchique. Il intègre plusieurs bases de données et dispose d'une interface utilisateur zoomable. ePlant a intégré un visualiseur d'informations sur les gènes, un visualiseur de publications, un visualiseur de cartes thermiques, le visualiseur mondial eFP (pictogramme fluorescent électronique), un eFP végétal, un visualiseur eFP de tissus et d'expériences, un eFP cellulaire, un visualiseur de chromosomes, un visualiseur d'interactions, un visualiseur de molécules, un visualiseur de séquences et a des options de liaison vers d'autres outils comme Aéroport, TAÏR, SUBA3, MACP, Biomarché etc. Plutôt que de servir uniquement d'outils de visualisation, ils aident à répondre à des questions scientifiques.

Pour un gène particulier, ABA INSENSIBLE 3 (ABI3), le visualiseur eFP mondial montre la variance de l'expression des gènes dans différents écotypes. La visionneuse eFP de tissus et d'expériences révèle l'expression spécifique de la racine, la visionneuse eFP cellulaire montre une localisation abondante spécifique au noyau, la visionneuse de chromosomes contient l'emplacement de la carte physique du locus, la visionneuse d'interactions affiche à la fois les interactions protéine-protéine et protéine-ADN prédites et confirmées , le visualiseur moléculaire identifie la séquence de liaison à l'ADN d'ABI3 à partir de la structure 3D partielle.
Emmener ePlant au-delà Arabidopsis
ePlant est basé sur Arabidopsis thaliana données. Il contient des informations pour plus de 35 millions de mesures d'expression génique et des localisations subcellulaires documentées expérimentalement pour 10,910 100,000 protéines. De plus, il conserve environ 2.7 2 données d'interaction protéine-protéine et 23,091 millions de données d'interaction protéine-ADN. Il fournit également des structures prédites par Phyre6.19 de 1001 XNUMX produits géniques et XNUMX millions de SNP non synonymes basés sur le site Web XNUMX Proteomes.

Bien qu'ePlant se consacre à Arabidopsis thaliana, l'intégralité du code source du projet est disponible dans GitHub. Des plates-formes similaires peuvent être construites pour n'importe quelle autre usine en incorporant des ensembles de données appropriés. Dans le même temps, des navigateurs eFP sont disponibles pour d'autres dicots (Peuplier, Medicago, soja, Patates, Tomate, E. salsugineum, C. sativa, Arachis, Grape), monocotylédones (Maïs, Riz, Orge, Triticale, Brachypode) et non végétaux (Souris, Humain) dans BAR (The Bio-Analytic Resource for Plant Biology) avec ePlant. En regardant l'expression des gènes dans Arabidopsis peut donner un aperçu de son fonctionnement dans d'autres plantes. De cette façon, il aide à élargir l'application d'un gène recherché ou d'un réseau de régulation de gènes dans plusieurs espèces végétales. L'intégration d'un large éventail d'espèces pour la visionneuse eFP permet aux chercheurs d'explorer des modèles intéressants dans différents systèmes expérimentaux.
