Le biais d'utilisation des codons (également appelé biais des codons) est l'utilisation sélective de triplets de nucléotides (codons) pour coder des séquences d'acides aminés spécifiques dans les gènes codant pour les protéines d'une espèce. Chaque acide aminé dans une séquence peut être codé par un (dans le cas de la méthionine et du tryptophane) à six codons différents. Les fréquences avec lesquelles les codons synonymes sont utilisés pour coder un acide aminé varient entre les organismes et parfois même au sein du même organisme.

Variation de la teneur en GC
Variation de la teneur en GC chez M. acuminata, M. balbisiana, Pho. dactylifera, S. polyrhiza et Phy. hétérocycla

Les modèles d'utilisation des codons reflètent la lignée et la composition du génome d'une espèce. Mazumdar et al. ont étudié les différences entre les monocotylédones herbacées et non herbacées.

Dans un premier temps, des études sur l'utilisation des codons chez les monocotylédones ont été passées en revue. Les informations actuelles concernant l'utilisation des codons, ainsi que le biais contextuel des paires de codons, ont ensuite été approfondies, à l'aide de quatre génomes de monocotylédones non graminées entièrement séquencés (Musa acuminé, muse balbisienne, Phoenix dactylifera et Spirodela polyrhize) pour lesquels des ensembles de données transcriptomiques comparables sont disponibles. Des mesures ont été prises concernant l'utilisation relative des codons synonymes, le nombre effectif de codons, le contenu optimal en codons et en GC dérivé, puis les relations ont été étudiées pour déduire les forces évolutives sous-jacentes.

Mazumdar et al. identifié les codons optimaux, les codons rares et le contexte de paire de codons préféré dans les espèces de monocotylédones non graminées étudiées. Contrairement à la distribution bimodale de GC3 (teneur en GC en troisième position de codon) chez les graminées, les monocotylédones non graminées ont montré une distribution unimodale. L'utilisation disproportionnée de G et C (et de A et T) dans les acides aminés à deux et quatre codons détectée dans l'analyse exclut l'hypothèse d'un biais mutationnel comme explication de la variation génomique de la teneur en GC.

Les codons optimaux chez ces monocotylédones non herbacées montrent une préférence pour G/C en troisième position. Ces résultats étayent l'hypothèse selon laquelle l'utilisation des codons et la composition nucléotidique chez les monocotylédones non herbacées sont principalement déterminées par une conversion génique biaisée par GC.