Il existe un outil qui peut guider la sélection végétale pour augmenter les rendements afin de répondre aux demandes d'une population croissante dans un climat changeant : les modèles de culture écophysiologiques. Ces modèles simulent le développement des plantes en fonction de diverses entrées environnementales et de gestion. Les traits que ces modèles simulent sont basés sur des algorithmes mathématiques qui représentent les processus physiologiques sous-jacents qui régissent la croissance et le développement des cultures, de la plantation à la maturité.

Les modèles écophysiologiques de culture fournissent des informations précieuses, mais certains traits ne peuvent pas être bien simulés car ils nécessitent des valeurs de paramètres difficiles à mesurer, inconnues ou variables selon le cultivar. Ces valeurs sont importantes : la performance des modèles de culture dépend en grande partie sur le niveau de détail des informations d'entrée disponibles pour le paramétrage du modèle.

Heureusement, les modèles de cultures écophysiologiques peuvent être intégrés et informés par des algorithmes de prédiction génomique, qui peuvent lier les gènes aux paramètres qui contrôlent les processus physiologiques. La meilleure classe de paramètres à cibler avec des algorithmes de prédiction génomique est appelée « paramètres spécifiques au génotype (GSP) ». Cette intégration génotype à phénotype permettrait aux sélectionneurs de sélectionner des gènes contrôlant des traits difficiles à sélectionner phénotypiquement.

Bien que l'intégration des modèles de cultures écophysiologiques et de la prédiction génomique soit très prometteuse, relativement peu de travaux ont été réalisés dans ce domaine. Pratishtha Poudel, ancien boursier postdoctoral à l'Université d'État du Kansas, maintenant professeur adjoint à l'Université Purdue, et ses collègues, pensent que cela pourrait être dû à un chevauchement limité entre la modélisation écophysiologique des cultures et les communautés de prédiction génomique.

Selon les auteurs, il existe de nombreux algorithmes différents et aucun algorithme de prédiction génomique n'est le mieux adapté aux différentes espèces et traits. Par conséquent, la sélection de l'algorithme de prédiction génomique approprié peut être intimidante. Leur article de synthèse, publié dans in silico Plants entend combler cette lacune en familiarisant les modélisateurs écophysiologiques des cultures avec les algorithmes de prédiction génomique.

Ils ont considéré les algorithmes de prédiction génomique suivants :

  • Bayes A et B
  • meilleur prédicteur linéaire sans biais (BLUP)
  • LASSO
  • sélection assistée par marqueurs (MAS)
  • reproduction de l'espace de Hilbert du noyau (RKHS)

L'article guide les lecteurs dans le choix de l'algorithme de prédiction génomique le plus approprié pour différents paramètres spécifiques au génotype en fonction des critères suivants :

1) Choisir l'algorithme de prédiction génomique en fonction de la complexité de l'architecture génétique du trait d'intérêt (dans ce cas, chaque GSP).

Figure 1. Les méthodes de sélection assistée par marqueurs (SAM) se situent à l'extrémité « plus simple » des algorithmes, étant adaptées à la prédiction de caractères fortement contrôlés par quelques gènes. D'autre part, les algorithmes de prédiction non paramétriques tels que RKHS sont flexibles et peuvent être plus adaptés pour prédire les traits lorsque de nombreux gènes contrôlent faiblement les traits avec de fortes interactions gène-environnement.

L'utilisateur doit demander combien de gènes contrôlent le trait et avec quelle force. De plus, ils doivent considérer dans quelle mesure l'expression des gènes est contrôlée par l'environnement. Les informations sur le nombre et la taille des QTL provenant des études QTL sont utilisées pour déduire l'architecture génétique d'un trait.

2) Déterminer comment estimer les paramètres spécifiques au génotype.

Une fois qu'un algorithme de prédiction génomique est sélectionné (ou quelques candidats), les paramètres spécifiques au génotype peuvent être estimés à l'aide de l'une des deux approches qui diffèrent par leur complexité de calcul et l'efficacité du processus d'estimation.

Les fonctions objectives sont utilisées pour mesurer les différences entre les valeurs des paramètres observés et prédits - chaque itération devrait les rapprocher de la convergence.

Approche en une étape
Figure 2 : Approche en une étape pour prédire les paramètres spécifiques au génotype. Formes bleues = données d'entrée, orange = partie algorithme de prédiction génomique, violet = partie modèle écophysiologique.

Approche en une étape: Les paramètres spécifiques au génotype et l'algorithme de prédiction génomique destiné à les prédire sont ajustés simultanément. Chaque itération de l'algorithme de prédiction génomique nécessite une réévaluation du phénotype prédit par le modèle écophysiologique de culture pour chaque génotype et environnement via des fonctions objectives.

  • Avantages : Les données génétiques et phénotypiques combinées entre les génotypes conduisent à de meilleures estimations des paramètres spécifiques au génotype
  • Inconvénients : Efficacité de calcul réduite
Approche en deux étapes
Figure 3 : Approche en deux étapes pour prédire les paramètres spécifiques au génotype. Formes bleues = données d'entrée, orange = partie algorithme de prédiction génomique, violet = partie modèle écophysiologique.

Approche en deux étapes: Les paramètres estimés spécifiques au génotype sont d'abord estimés pour le modèle de culture écophysiologique, puis l'algorithme de prédiction génomique est ajusté.

  • Avantages : Efficacité de calcul supérieure
  • Inconvénients : Peut créer des estimations biaisées de paramètres spécifiques au génotype sur lesquelles la deuxième étape de l'estimation serait basée si les données ont une variance élevée (par exemple, à partir de données incomplètes telles que lorsque tous les génotypes ne sont pas cultivés dans des essais menés dans différents environnements).

3) Examiner la capacité d'incorporer des informations génétiques antérieures.

Figure 4. La sélection des algorithmes doit être basée sur la quantité de connaissances préalables sur l'architecture génétique d'un trait.

Lorsque des informations supplémentaires sur l'architecture génétique d'un trait sont connues, les utilisateurs doivent choisir un algorithme pouvant incorporer ces informations. Ces informations peuvent inclure des marqueurs ou des gènes dont les effets sont connus à partir de traits couramment mesurés et de grandes quantités de données. Si peu d'informations sont disponibles, des algorithmes de prédiction simples seraient les plus appropriés car il est probable que seuls les effets génétiques majeurs importants pourront être récupérés à partir des données. Si beaucoup est connu, comme à partir du phénotypage à haut débit, une méthode plus complexe peut être utilisée.

Poudel conclut : « L'estimation des SPG dans les modèles de cultures écophysiologiques avec des modèles de prédiction génomique aidera à combiner les informations génotypiques et phénotypiques pour une image complète du génotype au phénotype. Dans cet article, nous franchissons une étape clé vers le rapprochement des communautés de prédiction génomique et de modélisation écophysiologique et explorons des pistes pour développer de tels algorithmes de prédiction combinés.

LIRE L'ARTICLE:

Pratishtha Poudel, Bryan Naidenov, Charles Chen, Phillip D Alderman et Stephen M Welch. Intégration de la prédiction génomique et de l'estimation des paramètres spécifiques au génotype dans les modèles écophysiologiques : aperçu et perspectives. in silico Plantes, 2023 ; diad007, https://doi.org/10.1093/insilicoplants/diad007