Sesgo en el uso de codones

El sesgo en el uso de codones se refiere a las diferencias en la frecuencia de ocurrencia de codones sinónimos en el ADN codificante. Un codón es una serie de tres nucleótidos (un triplete) que codifica para un residuo específico de aminoácido en una cadena polipeptídica o para la terminación de la traducción (codón de parada).

Hay en total 64 distintos codones (61 codones que codifican para aminoácidos y 3 codones de parada) pero hay solo 20 aminoácidos distintos. La sobreabundancia en el número de codones permite que varios aminoácidos sean codificados por más de un codón. Debido a esta redundancia, se dice que el código genético es degenerado. Los códigos genéticos de distintos organismos son normalmente sesgados hacia el uso de un particular codón sobre los demás codones que codifican para un mismo aminoácido, es decir, que un codón se encontrará con una frecuencia más elevada de la que esperaríamos por probabilidad. Cómo tales sesgos surgen es una área muy debatida en la evolución molecular. Tablas de uso de codones detallando el sesgo en el uso de codones para la mayoría de genomas de organismos depositados en GenBank y RefSeq se pueden encontrar en la base de datos HIVE-Codon Usage Tableo.[1]

Está generalmente reconocido que el sesgo de codones refleja un equilibrio entre los sesgos mutacionales y la selección natural en la optimización de la traducción. Los codones óptimos en organismos de crecimiento rápido, como Escherichia coli o Saccharomyces cerevisiae (la levadura del pan), reflejan respectivamente la composición genómica en el conjunto del ARNt.[2]​ Se cree que el uso de codones óptimos ayuda a conseguir una tasa de traducción más alta y con más exactitud. A raíz de estos factores, se espera que la selección en la traducción sea más fuerte en genes de expresión elevada, como es en el caso de los organismos antes mencionados.[3][4]​ En otros organismos que no presentan altas tasas de crecimiento o tienen genomas pequeños, la optimización en el uso de codones es normalmente ausente, y las preferencias en el uso del codón están determinadas por el característico sesgo mutacional observado en ese particular genoma. Ejemplos de este son Homo sapiens (humano) y Helicobacter pylori. Organismos que presentan un nivel de optimización en el uso de codones intermedio, incluye Drosophila melanogaster (mosca de la fruta), Caenorhabditis elegans (gusano nematodo), Strongylocentrotus purpuratus (erizo de mar) o Arabidopsis thaliana.[5]​ Se sabe que varias familias virales (herpesvirus, lentivirus, papillomavirus, polyomavirus, adenovirus, y parvovirus), codifican proteínas estructurales que presentan un uso del codón muy sesgado, en comparación con la célula huésped. Se ha sugerido que este sesgo de codones juega un papel en la regulación temporal de sus proteínas tardías.[6]

La naturaleza del uso del codón-optimización del ARNt ha sido ferozmente debatida. No está claro si la utilización del codón conduce a la evolución del ARNt o es al revés. Al menos un modelo matemático se ha desarrollado donde ambos, uso del codón y la expresión del ARNt, co-evolucionan en forma de retroalimentación (es decir, codones que ya están presentes en altas frecuencias aumentan la expresión de sus correspondientes ARNts, y ARNts que se expresan normalmente en niveles altos incrementan la frecuencia de sus correspondientes codones). Sin embargo, este modelo no parece ser que tenga aún confirmación experimental. Otro problema es que la evolución de los genes del ARNt ha sido un área de investigación muy inactiva.

Factores contribuyentes editar

Se han propuesto diferentes factores relacionados con el sesgo en el uso del codón, incluyendo el nivel de expresión génica (que refleja la selección para optimizar el proceso de traducción a través de abundancia de ARNt), la composición de % G+C (que refleja la transferencia génica horizontal o el sesgo mutacional), el sesgo GC (que refleja el sesgo mutacional específico de la hebra), la conservación aminoacídica, la hidropatía en proteínas, la selección transcripcional, la estabilidad del ARN, la temperatura óptima de crecimiento, la adaptación hipersalina y el nitrógeno dietético.[7][8][9][10][11][12]

Teorías evolutivas editar

Sesgo mutacional frente selección editar

A pesar de que el mecanismo de selección del sesgo de codones sigue siendo controvertido, posibles explicaciones para este sesgo se agrupan en dos categorías generales. Una explicación gira alrededor a la teoría selecionista, en el cual el sesgo de codones contribuye a la eficacia y/o exactitud de la expresión de la proteína y por tanto experimenta una selección positiva. El modelo selecionista también explica por qué los codones más frecuentes son reconocidos por las moléculas de ARNt más abundantes, así como la correlación entre codones preferidos, los niveles de ARNt y el número de copias de un gen. Aunque se ha demostrado que la tasa de incorporación aminoacídica en los codones más frecuentes ocurre en una tasa mucho más alta que en la de los codones raros, no se ha demostrado que la velocidad de la traducción se vea directamente afectada y por lo tanto el sesgo hacia los codones más frecuentes puede no ser directamente ventajoso. Sin embargo, el aumento de la velocidad de elongación durante la traducción, puede ser indirectamente ventajoso al aumentar la concentración celular de ribosomas libres y potencialmente la tasa de iniciación para el ARNs mensajeros.[13]

La segunda explicación para el uso del codón puede ser explicada mediante el sesgo mutacional, una teoría que postula que el sesgo del codón existe debido a la no aleatoriedad en los patrones mutacionales. En otras palabras, algunos codones pueden sufrir más cambios y por lo tanto resultan en frecuencias de equilibrio más bajas, también conocidas como codones "raros". Diferentes organismos también exhiben diferentes sesgos mutacionales, y existe evidencia creciente de que el nivel de contenido GC en todo el genoma es el parámetro más significativo para explicar las diferencias de sesgo de codones entre organismos. Estudios adicionales han demostrado que los sesgos de codones pueden predecirse estadísticamente en procariotas usando solo secuencias intergénicas, argumentando en contra de la idea de fuerzas selectivas en las regiones codificantes y apoyando aún más el modelo de sesgo mutacional. Sin embargo, este modelo por sí solo no puede explicar completamente por qué los codones preferidos son reconocidos por los ARNts más abundantes.

Modelo de equilibrio de mutación-selección-deriva editar

Para reconciliar la evidencia tanto de las presiones mutacionales como de la selección, la hipótesis predominante para el sesgo del codón puede ser explicada por el modelo de equilibrio de mutación-selección-deriva. Esta hipótesis establece que la selección favorece a los codones mayoritarios sobre los minoritarios, pero estos, pueden persistir debido a la presión mutacional y a la deriva genética. También sugiere que la selección es generalmente débil, pero que la intensidad de la selección se escala en una expresión más alta y en más restricciones funcionales de las secuencias codificantes.

Consecuencias de la composición de los codones editar

Efecto en la estructura secundaria del ARN editar

Debido a que la estructura secundaria del extremo 5' del ARNm influye en la eficiencia de la traducción, los cambios sinónimos en esta región del ARNm pueden resultar en cambios profundos en la expresión génica. El uso del codón en regiones de ADN no codificante puede, por lo tanto, desempeñar un papel importante en la estructura secundaria del ARN y en la posterior expresión de proteínas, que pueden sufrir presiones selectivas adicionales. En particular, una estructura secundaria fuerte en el sitio de unión del ribosoma o en el codón de inicio puede inhibir la traducción, y el plegamiento del ARNm en el extremo 5' genera una gran cantidad de variación en los niveles de proteína.[14]

Efecto en la expresión/transcripción génica editar

La expresión heteróloga de genes se utiliza en muchas aplicaciones biotecnológicas, incluyendo la producción de proteínas y la ingeniería metabólica. Debido a que el conjunto de ARNts varía entre diferentes organismos, la tasa de transcripción y traducción de una secuencia codificante en particular puede ser menos eficiente cuando se ubica en un contexto no nativo. Para un transgén sobreexpresado, el ARNm correspondiente constituye un gran porcentaje del ARN celular total, y la presencia de codones raros en el transcrito puede llevar al uso ineficiente y a una disminución en la actividad de los ribosomas y, en última instancia, reducir los niveles de producción heteróloga de proteínas. Sin embargo, el uso de codones optimizados para un determinado conjunto de ARNts, para sobreexpresar un gen heterólogo en un particular huésped, puede causar que se agoten los aminoácidos y alterar el equilibrio total de ARNts. Este método de ajustar los codones para que coincidan con el conjunto de ARNts abundantes del huésped, llamado optimización de codones, se ha usado tradicionalmente para la expresión heteróloga de genes. Sin embargo, nuevas estrategias para la optimización de la expresión heteróloga consideran además el contenido de nucleótidos globales, tal como el plegamiento local del ARNm, el sesgo de par de codones, la rampa de codones o las correlaciones de codones.[15]

El sesgo especializado del codón se observa también en algunos genes endógenos, como los implicados en el agotamiento de aminoácidos. Por ejemplo, las enzimas que sintetizan aminoácidos utilizan preferentemente codones que están poco adaptados a los ARNts que abundan normalmente, pero tienen codones que están adaptados a los ARNts que se encuentran en condiciones de agotamiento. Así, el uso del codón puede introducir un nivel adicional de regulación transcripcional para una determinada expresión génica bajo unas condiciones celulares específicas.

Efecto en la velocidad de la elongación durante la traducción editar

En términos generales, para los genes con una alta expresión, las tasas de elongación durante la traducción son más rápidas en los transcritos con codones más adaptados al conjunto de ARNts, y más lentas en los transcritos con codones raros. Esta correlación entre las tasas de traducción de codones y la relación con la concentración de ARNt, proporciona una modulación adicional de las tasas de elongación de la traducción, lo que puede proporcionar varias ventajas al organismo. Específicamente, el uso de codones puede permitir la regulación global de estas tasas, y los codones raros pueden contribuir a la precisión de la traducción a expensas de la velocidad.[16]

Efecto en el plegamento de proteínas editar

El plegamiento de proteínas en vivo es vectorial, de tal manera que el extremo N-terminal de una proteína sale del ribosoma y se expone al disolvente antes que sus regiones más C-terminales. Como resultado, el plegamiento co-traduccional de proteínas introduce varias restricciones espaciales y temporales en la cadena polipeptídica naciente durante su plegamiento. Debido a que las tasas de traducción del ARNm están acopladas al plegamiento de proteínas, y la adaptación del codón está ligada a la elongación de la traducción, se ha formulado la hipótesis de que la manipulación a nivel de secuencia puede ser una estrategia efectiva para regular o mejorar el plegamiento de proteínas. Varios estudios han demostrado que el pausado en la traducción como resultado de la estructura local del ARNm, ocurre para ciertas proteínas, lo cual puede ser necesario para un plegamiento correcto. Además, se ha demostrado que las mutaciones sinónimas tienen consecuencias significativas en el proceso de plegamiento de la proteína naciente e incluso pueden cambiar la especificidad de sustrato de las enzimas. Estos estudios sugieren que el uso de codones influye en la velocidad a la que los polipéptidos emergen vectorialmente del ribosoma, lo que puede afectar aún más a las vías de plegamiento de proteínas a través del espacio estructural disponible.

Métodos de análisis editar

En el campo de la bioinformática y la biología computacional, se han propuesto y utilizado muchos métodos estadísticos para analizar el sesgo en el uso de codones.[17]​ Métodos como el de "frecuencia de codones óptimos" (FOP),[18]​ la "adaptación relativa del codón" (RCA),[19]​ o el "índice de adaptación de codones" (IAC),[20]​ se utilizan para pronosticar los niveles de expresión génica; mientras que métodos como el "número eficaz de codones" (Nc) y la entropía de Shannon de la teoría de la información se utilizan para medir la uniformidad en el uso del codón.[21]​ Los métodos estadísticos multivariados, como el análisis de correspondencia y el análisis de componentes principales, se utilizan ampliamente para analizar las variaciones en el uso de codones entre genes.[22]​ Existen muchos programas informáticos para implementar los análisis estadísticos enumerados anteriormente, incluyendo CodonW, GCUA, INCA, etc. La optimización de codones tiene aplicaciones en el diseño de genes sintéticos y en las vacunas de ADN. Varios paquetes de software están disponibles en línea para este fin (consulte con los enlaces externos).

Referencias editar

  1. Athey, John; Alexaki, Aikaterini; Osipova, Ekaterina; Rostovtsev, Alexandre; Santana-Quintero, Luis V.; Katneni, Upendra; Simonyan, Vahan; Kimchi-Sarfaty, Chava (2 de septiembre de 2017). «A new and updated resource for codon usage tables». BMC Bioinformatics 18 (391). PMC 5581930. PMID 28865429. doi:10.1186/s12859-017-1793-7. 
  2. Dong, Hengjiang; Nilsson, Lars; Kurland, Charles G. (1996). «Co-variation of tRNA abundance and codon usage in Escherichia coli at different growth rates». Journal of Molecular Biology 260 (5): 649-663. ISSN 0022-2836. doi:10.1006/jmbi.1996.0428. 
  3. Sharp, Paul M.; Stenico, Michele; Peden, John F.; Lloyd, Andrew T. (1993). «Codon usage: mutational bias, translational selection, or both?». Biochem. Soc. Trans. 21: 835-841. Archivado desde el original el 20 de septiembre de 2018. Consultado el 5 de diciembre de 2018. 
  4. Kanaya, Shigehiko; Yamada, Yuko; Kudo, Yoshihiro; Ikemura, Toshimichi (1999). «Studies of codon usage and tRNA genes of 18 unicellular organisms and quantification of Bacillus subtilis tRNAs: gene expression level and species-specific diversity of codon usage based on multivariate analysis». Gene 238 (1): 143-155. ISSN 0378-1119. doi:10.1016/s0378-1119(99)00225-5. 
  5. Duret, Laurent (2000). «tRNA gene number and codon usage in the C. elegans genome are co-adapted for optimal translation of highly expressed genes». Trends in Genetics 16 (7): 287-289. ISSN 0168-9525. doi:10.1016/s0168-9525(00)02041-2. 
  6. Shin, Young C.; Bischof, Georg F.; Lauer, William A.; Desrosiers, Ronald C. (10 de septiembre de 2015). «Importance of codon usage for the temporal regulation of viral gene expression». Proceedings of the National Academy of Sciences 112 (45): 14030-14035. PMC 4653223. PMID 26504241. doi:10.1073/pnas.1515387112. 
  7. Ermolaeva MD (octubre de 2001). «Synonymous codon usage in bacteria». Curr Issues Mol Biol 3 (4): 91-7. PMID 11719972. 
  8. Lynn DJ, Singer GA, Hickey DA (octubre de 2002). «Synonymous codon usage is subject to selection in thermophilic bacteria». Nucleic Acids Res. 30 (19): 4272-7. PMC 140546. PMID 12364606. doi:10.1093/nar/gkf546. 
  9. Paul S, Bag SK, Das S, Harvill ET, Dutta C (2008). «Molecular signature of hypersaline adaptation: insights from genome and proteome composition of halophilic prokaryotes». Genome Biol. 9 (4): R70. PMC 2643941. PMID 18397532. doi:10.1186/gb-2008-9-4-r70. 
  10. Kober, K. M.; Pogson, G. H. (2013). «Genome-Wide Patterns of Codon Bias Are Shaped by Natural Selection in the Purple Sea Urchin, Strongylocentrotus purpuratus». G3 3 (7): 1069-1083. PMC 3704236. PMID 23637123. doi:10.1534/g3.113.005769. 
  11. McInerney, James O. (1 de septiembre de 1998). «Replicational and transcriptional selection on codon usage in Borrelia burgdorferi». Proceedings of the National Academy of Sciences 95 (18): 10698-10703. ISSN 0027-8424. PMC 27958. PMID 9724767. doi:10.1073/pnas.95.18.10698. 
  12. Seward, Emily; Kelly, Steve (2016). «Dietary nitrogen alters codon bias and genome composition in parasitic microorganisms». Genome Biology 17 (226): 3-15. PMC 5109750. PMID 27842572. doi:10.1186/s13059-016-1087-9. 
  13. Hershberg, R; Petrov, D. A. (2008). «Selection on codon bias». Annual Review of Genetics 42: 287-99. PMID 18983258. doi:10.1146/annurev.genet.42.110807.091442. 
  14. Novoa, E. M.; Ribas De Pouplana, L (2012). «Speeding with control: Codon usage, tRNAs, and ribosomes». Trends in Genetics 28 (11): 574-81. PMID 22921354. doi:10.1016/j.tig.2012.07.006. 
  15. Plotkin, J. B.; Kudla, G (2011). «Synonymous but not the same: The causes and consequences of codon bias». Nature Reviews Genetics 12 (1): 32-42. PMC 3074964. PMID 21102527. doi:10.1038/nrg2899. 
  16. Spencer, P. S.; Barral, J. M. (2012). «Genetic Code Redundancy and Its Influence on the Encoded Polypeptides». Computational and Structural Biotechnology Journal 1: 1-8. doi:10.5936/csbj.201204006. 
  17. «An evaluation of measures of synonymous codon usage bias». J. Mol. Evol. 47 (3): 268-74. September 1998. PMID 9732453. doi:10.1007/PL00006384. 
  18. Ikemura T (September 1981). «Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes: a proposal for a synonymous codon choice that is optimal for the E. coli translational system.». J. Mol. Biol. 151 (3): 389-409. PMID 6175758. doi:10.1016/0022-2836(81)90003-6. 
  19. «Relative codon adaptation: a generic codon bias index for prediction of gene expression». DNA Res. 17 (3): 185-96. June 2010. PMC 2885275. PMID 20453079. doi:10.1093/dnares/dsq012. 
  20. Sharp, Paul M.; Li, Wen-Hsiung (1987). «The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications». Nucleic Acids Research 15 (3): 1281-1295. PMC 340524. PMID 3547335. doi:10.1093/nar/15.3.1281. 
  21. Peden J (15 de abril de 2005). «Codon usage indices». Correspondence Analysis of Codon Usage. SourceForge. Consultado el 20 de octubre de 2010. 
  22. «Comparison of correspondence analysis methods for synonymous codon usage in bacteria». DNA Res. 15 (6): 357-65. diciembre de 2008. PMC 2608848. PMID 18940873. doi:10.1093/dnares/dsn028. 

Enlaces externos editar