Grupo de genes metabólicos

Los grupos de genes metabólicos o grupos de genes biosintéticos son grupos de genes mayoritariamente no homólogos y estrechamente relacionados, que participan en una vía metabólica común y específica. Los genes se encuentran físicamente cerca en el genoma y su expresión es generalmente corregulada.[1][2][3]​ Los grupos de genes metabólicos son características comunes de los genomas bacterianos[4]​ y la mayoría de los genomas fúngicos[5]​, y es menos frecuentemente hallado en otros organismos.[6]​ Estos grupos son más ampliamente conocidos por su papel en la producción de metabolitos secundarios, los cuales son la base de la mayoría de los compuestos farmacéuticos, toxinas naturales y sustancias usadas para comunicación y destrucción entre organismos. Los grupos de genes biosintéticos también pueden encontrarse implicados en la obtención de nutrientes, degradación de toxinas[7]​, la resistencia antimicrobiana y la biosíntesis de vitaminas.[5]​ Dado todas las propiedades de los grupos de genes, estos juegan una función clave en la formación de ecosistemas microbiales, incluyendo las interacciones microbioma-huésped. Así, se han desarrollado múltiples herramientas genómicas computacionales para predecir grupos de genes metabólicos.

Ruta biosintética de la penicilina.Enzimas involucradas y los grupos de genes que codifican cada enzima

Uno de lo ejemplos más conocido es el grupo de genes biosintético de penicilina en Penicillum chrysogenum. Este grupo de genes codifica la producción de penicilina[8]​, un atibiótico valioso[9]​. Este consta de tres genes principales: pcbAB, pcbC y penDE.[10]

  • pcbAB: Codifica la enzima ACV sintetasa, que es esencial para la formación del precursor de la penicilina, el ácido 6-aminopenicilánico(ACV).
  • pcbC: Participa en la conversión del ACV en penicilina G.
  • penDE: Codifica la enzima isopenicilina N-sintetasa, que canaliza la estapa final de la sintesis de la penicilina G.

Bases de datos editar

Existen diversas bases de datos en las que podemos encontrar grupos de genes metabólicos. Algunas de estas bases incluyen MIBiG, que contiene grupos de genes validados experimentalmente, y BiG-FAM, que clasifica y agrupa los grupos de genes biosintéticos en familias de genes relacionadas con la biosíntesis de compuestos naturales.

MIBiG editar

La base de datos Información mínima sobre un Grupo de Genes Biosintéticos (MIBiG) se definió en 2015[11]​. Su propósito es estandarizar la información mínima requerida para caracterizar de forma única un grupo de genes metabólico. La información mínima comprende la secuencia y el tipo de grupo de genes metabólicos, el experimento que valida la actividad de este grupo de genes y el organismo en el que se realizó este experimento. Además, esta base de datos incluye entradas, estructuras, bioactividades y especificidades de sustratos de dominio enzimático.

BiG-FAM editar

BiG-FAM (Biosynthetic Gene Families) es una base de datos que utiliza un enfoque basado en la secuencia de aminoácidos de los dominios proteicos para agrupar los BGC en familias. La base de datos contiene información sobre diversos tipos de BGC, como los que codifican para la síntesis de péptidos no ribosomales (NRPS), poliquétidos (PKS), terpenos, alcaloides, entre otros.La organización y agrupación de los BGC en categorías familiares proporciona a los científicos la capacidad de analizar las conexiones evolutivas entre los genes y los productos naturales que generan, además de simplificar la anticipación de nuevos compuestos basándose en la información genética disponible.[12]​.

Herramientas bioinformáticas editar

Herramientas basadas en reglas editar

Se han desarrollado herramientas bioinformáticas para predecir y determinar la abundancia y expresión de grupos de genes metabólicos en muestras de microbiomas, desde datos metagenómicos.[13]​ Debido a que el tamaño de las bases de datos metagenómicos es considerable, la capacidad de filtro y agrupación de estos son elementos importantes de estas herramientas. Estos procesos pueden consistir de técnicas de reducción de dimensionalidad, como Minhash,[14]​ y algoritmos de agrupación (clusterización) como k-medoids y propagación de afinidadTambién se han desarrollado varias métricas y similares para posibilitar la comparación.

La minería genómica para grupos de genes biosintéticos (Genome Mining for Byosynthetic Gene Clusters, o BCGs) se ha convertido en una parte íntegra del descubrimiento de productos naturales. Los más de 200 mil genomas microbianos disponibles públicamente en la actualidad poseen información nueva, abundante e importante para la química. Una manera de navegar esta vasta diversidad genómica es a través de análisis comparativos de BCGs homólogos, lo que permite la identificación de patrones a través de especies que pueden ser asociadas a la presencia de ciertos metabolitos o actividades biológicas. Sin embargo, estas herramientas se ven obstaculizadas por un cuello de botella causada por un costoso enfoque basado en redes que se usa para agrupar estos BCGs en familias de grupos genómicos (Gene Cluster Families, o GCFs): el Motor de Agrupamiento Biosintético Super-Lineal (Biosynthetic Super-Linear Clustering Engine, o BiG-SLiCE), una herramienta diseñada para agrupar números masivos de BCGs. Al representarlos en un espacio euclidiano, BiG-SLiCE puede agrupar BCGs en GCFs de una manera no emparejada y casi lineal.

Satria et. al, 2021, demostraron la utilidad de estos análisis mediante la reconstrucción de un mapa global de diversidad metabólica secundaria a través de los taxones para identificar potencial biosintético sin descubrir, abriendo nuevas posibilidades para acelerar el descubrimiento de productos naturales, ofreciendo así un primer avance hacia la construcción de una red global interconectada y navegable de BCGs.[15]​ Cuanto más genomas sean secuenciados desde taxones poco estudiados, más información se podrá minar para resaltar su potencial químico.[15]

Herramientas basadas en machine learning (aprendizaje automático) editar

La comprensión de los procesos biológicos subyacentes de una variedad de organismos depende del análisis de grupos de genes metabólicos. Estos grupos de genes regulan y ejecutan las vías metabólicas, que son esenciales para las funciones celulares importantes como el crecimiento, la reproducción y la respuesta a los estímulos ambientales.En este contexto, las herramientas basadas en machine learning han surgido como aliadas para identificar, clasificar y comprender la función de estos grupos de genes.[16]

La clasificación y agrupación de genes metabólicos en función de sus perfiles de expresión génica es una de las aplicaciones más destacadas del machine learning en este campo. Los algoritmos de clustering, como k-means, agrupamiento jerárquico o DBSCAN, se utilizan ampliamente para agrupar genes con perfiles de expresión similares, lo que permite identificar conjuntos de genes que podrían estar coordinados en la misma vía metabólica o proceso biológico[17]​.

Los modelos de aprendizaje profundo, como las redes neuronales y los árboles de decisión, se han utilizado también para predecir la función de genes metabólicos desconocidos o para clasificar genes en categorías específicas de acuerdo con características genómicas, epigenéticas o de expresión. Por ejemplo, las Redes Neuronales Convolucionales (CNN) se han utilizado para analizar secuencias de ADN y predecir el impacto funcional de las variantes no codificantes[18]​. Además, herramientas como GeneMANIA y STRING utilizan algoritmos de aprendizaje automático para predecir interacciones gén-gen y crear redes de genes metabólicos, proporcionando información importante sobre la organización y regulación de las vías metabólicas[19][20]​.

Evolución editar

El origen y la evolución de los grupos de genes metabólicos ha estado en debate desde la década de los 1990.[21][22]​ Desde entonces, se ha demostrado que estos grupos de genes pueden surgir en un genoma mediante el reordenamiento del mismo, duplicación de genes, o por transferencia genética horizontal, y algunos grupos metabólicos han evolucionado convergentemente en múltiples especies.[23][24]​ La transferencia horizontal de genes se ha relacionado con nichos ecológicos en donde se piensa que las vías metabólicas codificadas proporcionan un beneficio.[25]​ Se ha argumentado que el agrupamiento de genes para funciones ecológicas es resultado de tendencias reproductivas entre organismos, y contribuye a la adaptación acelerada mediante el refinamiento en incremento de funciones complejas en el pangenoma de una población.[26]

Existen diferentes modelos para explicar la evolución de los grupos de genes metabólicos.[27]​ Una de las hipótesis es el modelo del operón egoísta. Este modelo propone que, bajo condiciones adecuadas, los grupos de genes pueden evolucionar sin necesidad de selección natural directa. Aquí, los grupos de genes persisten debido a que la proximidad física de los genes dentro del operón "facilita" la transferencia horizontal de genes entre organismos.[28]​De igual manera, los genes dentro de un operón comparten una misma secuencia regulatoria, lo que les permite coordinar su expresión en respuesta a ciertos estímulos ambientales. Esta coordinación favorece la transmisión conjunta de los genes asociados, ya que su expresión conjunta confiere una ventaja adaptativa.[29]

Referencias editar

  1. «Genome-Wide Prediction of Metabolic Enzymes, Pathways, and Gene Clusters in Plants». Plant Physiology 173 (4): 2041-2059. April 2017. PMC 5373064. PMID 28228535. doi:10.1104/pp.16.01942. 
  2. «Position-dependent and -independent mechanisms regulate cell-specific expression of the SpoC1 gene cluster of Aspergillus nidulans». Molecular and Cellular Biology 7 (1): 427-34. January 1987. PMC 365085. PMID 3550422. doi:10.1128/MCB.7.1.427. 
  3. «METACLUSTER-an R package for context-specific expression analysis of metabolic gene clusters». Bioinformatics 35 (17): 3178-3180. September 2019. PMC 6735823. PMID 30657869. doi:10.1093/bioinformatics/btz021. 
  4. «Insights into secondary metabolism from a global analysis of prokaryotic biosynthetic gene clusters». Cell 158 (2): 412-421. July 2014. PMC 4123684. PMID 25036635. doi:10.1016/j.cell.2014.06.034. 
  5. a b «Fungal Gene Cluster Diversity and Evolution». Advances in Genetics 100: 141-178. 2017. ISBN 9780128132616. PMID 29153399. doi:10.1016/bs.adgen.2017.09.005. 
  6. «A Global Coexpression Network Approach for Connecting Genes to Specialized Metabolic Pathways in Plants». The Plant Cell 29 (5): 944-959. May 2017. PMC 5466033. PMID 28408660. doi:10.1105/tpc.17.00009. 
  7. «Specialized plant biochemistry drives gene clustering in fungi». The ISME Journal 12 (7): 1694-1705. June 2018. PMC 6018750. PMID 29463891. doi:10.1038/s41396-018-0075-3. 
  8. Guzmán-Chávez, Fernando; Zwahlen, Reto D.; Bovenberg, Roel A. L.; Driessen, Arnold J. M. (2018). «Engineering of the Filamentous Fungus Penicillium chrysogenum as Cell Factory for Natural Products». Frontiers in Microbiology 9. ISSN 1664-302X. doi:10.3389/fmicb.2018.02768/full. Consultado el 4 de abril de 2024. 
  9. «Descubrimiento y desarrollo de la penicilina». American Chemical Society (en inglés). Consultado el 12 de abril de 2024. 
  10. Fierro, Francisco; Vaca, Inmaculada; Castillo, Nancy I.; García-Rico, Ramón Ovidio; Chávez, Renato (2022-03). «Penicillium chrysogenum, a Vintage Model with a Cutting-Edge Profile in Biotechnology». Microorganisms (en inglés) 10 (3): 573. ISSN 2076-2607. PMC 8954384. PMID 35336148. doi:10.3390/microorganisms10030573. Consultado el 4 de abril de 2024. 
  11. Terlouw, Barbara R; Blin, Kai; Navarro-Muñoz, Jorge C; Avalon, Nicole E; Chevrette, Marc G; Egbert, Susan; Lee, Sanghoon; Meijer, David et al. (6 de enero de 2023). «MIBiG 3.0: a community-driven effort to annotate experimentally validated biosynthetic gene clusters». Nucleic Acids Research (en inglés) 51 (D1): D603-D610. ISSN 0305-1048. PMC 9825592. PMID 36399496. doi:10.1093/nar/gkac1049. Consultado el 2 de abril de 2024. 
  12. Kautsar, Satria A; Blin, Kai; Shaw, Simon; Weber, Tilmann; Medema, Marnix H (3 de octubre de 2020). «BiG-FAM: the biosynthetic gene cluster families database». Nucleic Acids Research 49 (D1): D490-D497. ISSN 0305-1048. PMC 7778980. PMID 33010170. doi:10.1093/nar/gkaa812. Consultado el 4 de abril de 2024. 
  13. «BiG-MAP: an automated pipeline to profile metabolic gene cluster abundance and expression in microbiomes». bioRxiv: 32. 2020. doi:10.1101/2020.12.14.422671. 
  14. «Mash: fast genome and metagenome distance estimation using MinHash». Genome Biology 17 (32): 14. 2016. PMC 4915045. PMID 27323842. doi:10.1186/s13059-016-0997-x. 
  15. a b Kautsar, Satria A; van der Hooft, Justin J J; de Ridder, Dick; Medema, Marnix H (13 de enero de 2021). «BiG-SLiCE: A highly scalable tool maps the diversity of 1.2 million biosynthetic gene clusters». GigaScience 10 (1): giaa154. PMC 7804863. PMID 33438731. doi:10.1093/gigascience/giaa154. 
  16. Li, Yixue; Chen, Luonan (2014-10). «Big Biological Data: Challenges and Opportunities». Genomics, Proteomics & Bioinformatics (en inglés) 12 (5): 187-189. PMC 4411415. PMID 25462151. doi:10.1016/j.gpb.2014.10.001. Consultado el 5 de mayo de 2024. 
  17. Wu, Junjie (2012). Wu, Junjie, ed. Cluster Analysis and K-means Clustering: An Introduction (en inglés). Springer. pp. 1-16. ISBN 978-3-642-29807-3. doi:10.1007/978-3-642-29807-3_1. Consultado el 5 de mayo de 2024. 
  18. Zhou, Jian; Troyanskaya, Olga G (2015-10). «Predicting effects of noncoding variants with deep learning–based sequence model». Nature Methods (en inglés) 12 (10): 931-934. ISSN 1548-7091. PMC 4768299. PMID 26301843. doi:10.1038/nmeth.3547. Consultado el 5 de mayo de 2024. 
  19. Warde-Farley, David; Donaldson, Sylva L.; Comes, Ovi; Zuberi, Khalid; Badrawi, Rashad; Chao, Pauline; Franz, Max; Grouios, Chris et al. (1 de julio de 2010). «The GeneMANIA prediction server: biological network integration for gene prioritization and predicting gene function». Nucleic Acids Research (en inglés) 38 (suppl_2): W214-W220. ISSN 1362-4962. PMC 2896186. PMID 20576703. doi:10.1093/nar/gkq537. Consultado el 5 de mayo de 2024. 
  20. academic.oup.com. doi:10.1093/nar/gkac1000 https://academic.oup.com/nar/article/51/D1/D638/6825349 |url= sin título (ayuda). Consultado el 5 de mayo de 2024. 
  21. Lawrence, Jeffrey G.; Roth, John R. (1 de agosto de 1996). «Selfish Operons: Horizontal Transfer May Drive the Evolution of Gene Clusters». Genetics (en inglés) 143 (4): 1843-1860. ISSN 0016-6731. PMC 1207444. PMID 8844169. 
  22. Pál, Csaba; Hurst, Laurence D (1 de junio de 2004). «Evidence against the selfish operon theory». Trends in Genetics (en inglés) 20 (6): 232-234. doi:10.1016/j.tig.2004.04.001. 
  23. Reynolds, Hannah T.; Vijayakumar, Vinod; Gluck-Thaler, Emile; Korotkin, Hailee Brynn; Matheny, Patrick Brandon; Slot, Jason C. (2018). «Horizontal gene cluster transfer increased hallucinogenic mushroom diversity». Evolution Letters (en inglés) 2 (2): 88-101. ISSN 2056-3744. PMC 6121855. PMID 30283667. doi:10.1002/evl3.42. 
  24. Slot, Jason C.; Rokas, Antonis (1 de junio de 2010). «Multiple GAL pathway gene clusters evolved independently and by different mechanisms in fungi». Proceedings of the National Academy of Sciences 107 (22): 10136-10141. PMC 2890473. 
  25. Greene, George H.; McGary, Kriston L.; Rokas, Antonis; Slot, Jason C. (January 2014). «Ecology drives the distribution of specialized tyrosine metabolism modules in fungi». Genome Biology and Evolution 6 (1): 121-132. ISSN 1759-6653. PMC 3914699. PMID 24391152. doi:10.1093/gbe/evt208. 
  26. «Metabolic gene clusters, fungal diversity, and the generation of accessory functions». Current Opinion in Genetics & Development (en inglés). 58-59: 17-24. 1 de octubre de 2019. ISSN 0959-437X. doi:10.1016/j.gde.2019.07.006. 
  27. Ballouz, Sara; Francis, Andrew R.; Lan, Ruiting; Tanaka, Mark M. (12 de febrero de 2010). «Conditions for the Evolution of Gene Clusters in Bacterial Genomes». PLOS Computational Biology (en inglés) 6 (2): e1000672. ISSN 1553-7358. PMC 2820515. PMID 20168992. doi:10.1371/journal.pcbi.1000672. Consultado el 18 de abril de 2024. 
  28. Lawrence, Jeffrey G; Roth, John R (1 de agosto de 1996). «Selfish Operons: Horizontal Transfer May Drive the Evolution of Gene Clusters». Genetics 143 (4): 1843-1860. ISSN 1943-2631. PMC 1207444. PMID 8844169. doi:10.1093/genetics/143.4.1843. Consultado el 18 de abril de 2024. 
  29. Lawrence, Jeffrey G. (2003-10). «Gene Organization: Selection, Selfishness, and Serendipity». Annual Review of Microbiology (en inglés) 57 (1): 419-440. ISSN 0066-4227. doi:10.1146/annurev.micro.57.030502.090816. Consultado el 18 de abril de 2024. 

Enlaces externos editar

  • MIBiG Base de datos de grupo de genes con bioactividad probados experimentalmente.
  • BiG FAM Base de datos que clasifica y agrupa los grupos de genes en familias de genes relacionadas con la biosíntesis de compuestos naturales.
  • STRING
  • GeneMANIA