Minería genómica

En bioinformática, la minería genómica se define como el análisis computacional de datos de secuencias nucleotídicas basado en la comparación y reconocimiento de patrones conservados[1]​. Bajo esta definición, cualquier método computacional que implique la búsqueda y predicción de propiedades fisiológicas o metabólicas se considera parte de la minería genómica. El enfoque específico de la minería genómica, aplicada a los productos naturales (NPs), se centra en la identificación de clústeres de genes biosintéticos (BGCs) de NPs.

Minería Genómica
Rama de la biología computacional
Disciplinas predecesoras

Bioinfomática / Biología computacional

Genómica comparativa
Aplicaciones Búsqueda de productos naturales
Algoritmos
Bases de datos

MIBIG

AntiSMASH DB

En otras palabras, la minería genómica es una estrategia in silico de búsqueda y predicción de caracteristicas metabólicas de los organismos basada en sus secuencias genómicas, sin necesariamente requerir conocimiento bioquimico previo[2]​. La minería genómica ha facilitado la identificación de nuevos candidatos de genes responsables de la síntesis de productos de interés en diversos genomas asi como del entendimiento de la lógica biosintética de innumerables BGCs y sus relaciones evolutivas[3]​.

Historia editar

El término “minería genómica” hace referencia a la fiebre del oro de California de 1849 (conocida como California gold rush)[4][5]​, un período histórico en el que un gran número de inmigrantes llegaron a los alrededores de San Francisco, California, en busca de oro en los sedimentos de los ríos[6]​. De manera análoga, en los miles de genomas secuenciados disponibles hoy en día, que podríamos comparar con los sedimentos de los ríos, existe una riqueza en forma de genes para la biosíntesis de NPs, que ofrece la posibilidad de obtener grandes beneficios.

Desde la antigüedad, los NPs han sido usados por el ser humano para su beneficio, principalmente en el tratamiento de enfermedades. Los primeros registros del uso de NPs datan del año 2600 a.C. en Mesopotamia, donde se usaban aceites vegetales para tratar la tos, el resfriado y la inflamación[7]​. De manera similar, egipcios, chinos, griegos, hindús, romanos y árabes obtenían extractos con propiedades medicinales derivadas de la herbolaria de su región mediante técnicas rudimentarias[8]​, sin conocimiento detallado de la química detrás de dichas infusiones. Sin embargo, el descubrimiento de la penicilina marcó una gran diferencia en la historia de los NPs, iniciando una revolución científica en la búsqueda de nuevas moléculas con actividad antimicrobiana y, consecuentemente, en la producción de fármacos. A esta época se le conoce como la era dorada de los antibióticos, comprendida entre 1930 y 1970, periodo durante el cual se descubrieron la mayoría de los NPs utilizados hoy en día con fines terapéuticos y agronómicos[9][10]​ .

 
Cronología del descubrimiento de las diversas clases de antibióticos de origen biológico y el tipo de bacteria al que hacen frente.

La cronología del descubrimiento de diversas clases de antibióticos de origen biológico, refleja este periodo de intensa actividad científica. Desde las últimas dos decadas del siglo XX, los estudios genéticos se centraron cada vez más en el uso de las tecnologías de secuenciación[11]​. La proliferación de proyectos de secuenciación, así como la distribución y almacenamiento de secuencias genómicas de microorganismos en bases de datos, pronto permitió el estudio de estas secuencias para la identificación de las rutas metabólicas del metabolismo especializado y, posteriormente, para la identificación de genes biosintéticos no caracterizados previamente[12]​.

Con las secuencias completas de varias bacterias y hongos principalmente, los científicos descubrieron el potencial inexplorado en estos genomas. Este hallazgo fue el punto de partida para la concepción de la minería genómica[13]​.

¿Qué son los productos naturales? editar

 
Los productos naturales pueden ser producidos por bacterias, hongos, plantas y animales. La cafeína es producida por Coffea arabica (planta). Las psitacofulvinas son pigmentos responsables de los colores rojo brillante, naranja y amarillo específicos de los loros (animal). La ergotamina es una molécula comparte similitud con algunos neurotransmisores, y es un producto químico que se obtiene a partir del cornezuelo (hongo). La kanamicina es un aminoglucósido producido por Streptomyces kanamyceticus (Bacteria), utilizado para tratar infecciones bacterianas.

Los NPs son moléculas orgánicas de bajo peso molecular que abarcan una amplia y diversa gama de entidades químicas con múltiples funciones biológicas. Estas moléculas pueden ser producidas por bacterias, hongos, plantas y animales. A diferencia de los compuestos esenciales para el metabolismo primario, los NPs son productos del metabolismo especializado, con alta especificidad en cuanto a los organismos y vías que los producen. Asi mismo, requieren condiciones fisiológicas muy específicas para su producción, lo que sugiere que, aunque no son indispensables para las funciones básicas del organismo, confieren ventajas adaptativas, aumentando las probabilidades de supervivencia del organismo productor. Los NPs pueden actuar como quelantes de metales, inhibidores de enzimas, antibióticos, moléculas de señalización, entre otros[14][15]​.

Los NPs también son conocidos como metabolitos secundarios, un término acuñado por fisiólogos vegetales[16]​ y popularizado por J. D. Bu’Lock en 1961, para referirse a los NPs microbianos[17]​. La diversidad y complejidad estructural de los NPs han despertado gran interés y en ocasiones, desconcertado a los científicos en sus esfuerzos por aislar y caracterizar estas moléculas. Su estudio ha revelado no solo su importancia ecológica y evolutiva, sino también su potencial biotecnológico. Es así que gracias al desarrollo de nuevas tecnologías, actualmente se conocen más de 126,000 NPs provenientes de diversas fuentes[18]​.

Los NPs por tanto, desempeñan roles variados, que pueden analizarse desde dos perspectivas principales:

  1. Función biológica: Se refiere al papel que juega la molécula en el organismo productor. Algunos metabolitos actúan por ejemplo como moléculas de señalización en la comunicación entre comunidades biológicas complejas [19]​ . En esencia, los NPs permiten a los organismos producir y detectar señales químicas que desencadenan respuestas fisiológicas según la naturaleza de la molécula, confiriendo ventajas adaptativas al organismo productor[20]​.
  2. Función antropocéntrica: Se centra en la utilidad de los NPs para los seres humanos, incluido su uso en medicina, agricultura y otras áreas, por ejemplo, antibióticos, anticancerígenos, inmunosupresores, insecticidas o herbicidas.

Históricamente, los NPs derivados de bacterias han desempeñado un papel crucial en el desarrollo de compuestos medicinales y agrícolas[21]​, convirtiendose el filo Actinomycetota en una fuente bastante versátil de antibióticos. Estas bacterias producen aproximadamente dos tercios de los antibióticos de origen natural, así como una amplia gama de fármacos con propiedades antineoplásicas, antihelmínticas, antifúngicas e inmunosupresoras[22][23]​.

A pesar de los éxitos iniciales en el descubrimiento de nuevos NPs, los científicos se han enfrentado a un estancamiento en la identificación de compuestos novedosos, con redescubrimientos frecuentes de moléculas conocidas. Sin embargo, la genómica y la bioinformática han revelado un potencial de NPs aún no descubiertos. Aunque la identificación de estos compuestos requiere esfuerzos intensificados[24][25]​, la minería genómica ha acelerado su exploración y explotación.

Clasificación de los productos naturales editar

En la actualidad, se conocen más de 126,000 NPs que provienen de diversas fuentes[18]​y clasificados en 6 grupos principales[26]​ (Tabla 1).

Estos grupos se definen según su estructura química, las enzimas involucradas en su síntesis, los precursores utilizados y las modificaciones finales que experimentan. La clasificación nos ayuda a comprender mejor la diversidad de los productos naturales.

Tabla 1
Clase Descripción Ejemplo
Policétidos

(PKs)

Los policétidos son moléculas orgánicas que presentan una cadena repetitiva de grupos cetona ( >C=O) y metil ( >CH2). Su biosíntesis se asemeja a la síntesis de ácidos grasos y es fundamental para su diversidad. Estas moléculas versátiles se encuentran en bacterias, hongos, plantas y organismos marinos. Ejemplos relevantes son la eritromicina, un antibiótico utilizado en infecciones respiratorias, y la lovastatina, un fármaco hipolipemiante que reduce el colesterol. En resumen, los policétidos tienen una estructura basada en la repetición de grupos cetona y metileno, con aplicaciones médicas y farmacológicas significativas.
 
Eritromicina


Eritromicina[27]

Péptidos no-ribosomales

(NRPs)

Los NRPs son una familia de productos naturales que se diferencian de los péptidos ribosomales debido a su síntesis no lineal. Su estructura principal se basa en módulos no-ribosomales, que incluyen tres dominios clave: Adenilacion, acarreador de acilos y dominio de condensación. Ejemplos relevantes incluyen a la Daptomicina, un antibiótico ampliamente utilizado en infecciones diversas. Su estructura NRP contribuye a su actividad antimicrobiana. La Ciclosporina es un inmunosupresor utilizado en trasplantes de órganos. Su estructura NRP es crucial para su función. En resumen, los NRPs presentan una estructura modular no lineal y desempeñan un papel importante en la medicina y la biología química .
 
Daptomicina


Daptomicina[28]

Péptidos sintetizados ribosomalmente y modificados post-traduccionalmente (RiPPs) Los péptidos sintetizados ribosomalmente y modificados post-traduccionalmente (RiPPs) son una clase diversa de productos naturales de origen ribosómico. Estos péptidos se producen en los ribosomas y luego experimentan modificaciones enzimáticas después de su síntesis. Históricamente, los RiPPs se estudiaban individualmente, pero en 2013 se establecieron pautas uniformes de nomenclatura para estos productos naturales. Los RiPPs incluyen ejemplos como Microcina J25, un RiPP antibacteriano producido por Escherichia coli, y Nisina, un RiPP con actividad antimicrobiana producido por Lactococcus lactis. Su diversidad y aplicaciones siguen siendo objeto de estudio continuo .
 
Nisina


Nisina Z[29]

Sacáridos Los sacáridos producidos en el metabolismo secundario bacteriano son moleculas que se sintetizan por diversos mecanismos y luego experimentan modificaciones enzimáticas posteriores basados en la adición de carbohidratos. Dos ejemplos notables son la kanamicina, un aminoglucósido producido por Streptomyces kanamyceticus, utilizado para tratar infecciones bacterianas, y la estreptomicina, otro aminoglucósido producido por Streptomyces griseus, que fue uno de los primeros antibióticos utilizados para tratar la tuberculosis. Aunque su uso ha disminuido debido a la resistencia bacteriana, sigue siendo importante en algunos casos.
 
Kanamicina


Kanamicina[30]

Terpenos Tradicionalmente se han considerado derivados del 2-metil-butadieno, más conocido como isopreno. Aunque se les ha relacionado con el isopreno, en realidad los terpenos no derivan directamente del isopreno, ya que este nunca se ha encontrado como producto natural. El verdadero precursor de los terpenos es el ácido mevalónico, que proviene del acetil coenzima A. Los terpenos se originan por polimerización enzimática de dos o más unidades de isopreno, ensambladas y modificadas de muchas maneras diferentes. La mayoría de los terpenos tienen estructuras multicíclicas, que difieren no solo en grupo funcional, sino también en su esqueleto básico de carbono. Estos compuestos son el principal constituyente de los aceites esenciales de algunas plantas y flores, como el limonero y el naranjo. Cumplen diversas funciones en las plantas, como formar parte de la clorofila, los pigmentos carotenoides, las hormonas giberelina y ácido abscísico, y aumentar la fijación de proteínas a las membranas celulares mediante la isoprenilación. Además, los terpenos se utilizan en medicina tradicional, aromaterapia y como posibles agentes farmacológicos. Dos ejemplos notables de terpenos son el limoneno, presente en la cáscara de los cítricos y utilizado en perfumería y productos de limpieza, y los hopanoides, compuestos pentacíclicos similares a los esteroles, cuya función principal es conferir rigidez a la membrana plasmática en procariontes.
 
Diplopterol


Diplopterol[31]

Alcaloides Los alcaloides son una clase de compuestos orgánicos básicos y naturales que contienen al menos un átomo de nitrógeno. Se derivan principalmente de aminoácidos y se caracterizan por su hidrosolubilidad a pH ácido y su solubilidad en solventes orgánicos a pH alcalino. Estos compuestos se encuentran en una variedad de organismos, como plantas, hongos y bacterias. Los alcaloides tienen una amplia gama de actividades farmacológicas, como la Quinina, utilizada contra la malaria, y la Efedrina, un broncodilatador. Además, algunos alcaloides, como el BE-54017 poseen una estructura inusual, ya que presenta un esqueleto indenotryptolina, raramente observado en otros bis-indoles, sin embargo, su aplicación específica no está bien documentada.
 
BE-54017


BE-54017[32]

Emergencia de Patógenos Multirresistentes editar

La resistencia a los antibióticos es un desafío urgente en la medicina moderna, con estimaciones de alrededor de 5 millones de muertes por infecciones debidas a bacterias resistentes a múltiples antibióticos cada año. Se proyecta que esta cifra aumentará a 10 millones por año para 2050 si la velocidad de propagación de la resistencia antimicrobiana continúa superando el desarrollo de nuevos antibióticos[33]​. Los antibióticos, de origen natural o sintético, son fundamentales para prevenir y tratar las infecciones bacterianas. Sin embargo, las bacterias pueden desarrollar resistencia a antibióticos mediante mutaciones, especialmente en respuesta al uso de estos fármacos[34][35]​. Cada día, nuevos mecanismos de resistencia aparecen y se propagan por todo el mundo[36]​, complicando el tratamiento de infecciones como la neumonía, la tuberculosis, la septicemia, la gonorrea y las enfermedades transmitidas por alimentos. La pérdida de eficacia de los antibióticos conlleva a aumentos en los costos médicos, prolongación de estancias hospitalarias y un incremento en la mortalidad[37]​.

En regiones donde los antibióticos se pueden adquirir sin receta médica, el uso excesivo por parte de la población contribuye al aumento de la resistencia[38]​. Si no tomamos medidas urgentes, pronto nos enfrentaremos a una era post-antibióticos, donde infecciones comunes y lesiones menores podrían volver a ser causas de mortalidad[39]​. Seis especies bacterianas, conocidas como patógenos ESKAPE, son particularmente peligrosas y resistentes a los medicamentos, lo que representa una amenaza crítica para la salud, la seguridad alimentaria y el desarrollo a nivel mundial [40][41]​.

En los últimos tiempos, la industria biotecnológica ha intensificado la búsqueda de compuestos capaces de combatir patógenos multiresistentes. Sin embargo, el descubrimiento de nuevos antibióticos con fines comerciales ha disminuido en las últimas tres décadas. Esto se debe a varias causas como los altos costos de desarrollo, limitaciones de patentes, la breve ventana de exclusividad antes de que los productos se vuelvan genéricos y la dificultad para encontrar antibióticos efectivos contra organismos resistentes[42]​. A pesar de ello, las investigaciónes han progresado. Innovaciones en química combinatoria, exploración de la biodiversidad, biología de sistemas, minería genómica e inteligencia artificial están abriendo caminos prometedores para el desarrollo de nuevos fármacos, brindando esperanza en la lucha contra las infecciones multiresistentes.

Grupos de genes biosintéticos del metabolismo secundario editar

 
Arreglo general de un grupo de genes biosintéticos en bacterias

Un grupo de genes biosintéticos (BGC por la siglas en inglés de biosynthetic gene clusters) se define como un conjunto de genes cuyas funciones están asociadas a la biosíntesis, regulación y transporte de un determinado metabolito[43]​. Además, los BGCs pueden incluir genes responsables de la modificación del producto y de la resistencia a las moléculas resultantes de la ruta biosintética. En bacterias, los genes que conforman un BGC generalmente están organizados de manera contigua en un mismo locus del cromosoma, facilitando su co-regulación[44]​.

En un BGC, los genes funcionan de manera coordinada, como una línea de ensamblaje, donde cada enzima codificada desempeña una función específica, tales como la biosíntesis, condensación, deshidrogenación, oxidorreducción, transferencia, epimerización o ciclación. Estas enzimas moldean la estructura final del metabolito particular.

Además, existen otros tipos de elementos que pueden estar presentes en los BGCs:

  1. Genes de regulación: Codifican proteínas que controlan la expresión del BGC, a menudo en respuesta a estímulos ambientales o cambios en el desarrollo celular[45]​.
  2. Genes de transporte: Codifican proteínas que llevan el metabolito dentro o fuera de la célula[46]​.
  3. Promotores: Regiones no codificantes que actúan como sitios de anclaje para la ARN polimerasa durante la transcripción, determinando la orientación y posición de la transcripción del ARN mensajero[47]​.

Los BGCs se clasifican de acuerdo a la función de sus genes y su especificidad por sustratos[48]​. Al comparar diversos clústeres, ciertos genes están siempre presentes en los BGCs de una misma clase, denominados genes específicos de clase, los cuales determinan la estructura base del NP final[49]​. Otros genes, conocidos como genes accesorios, se encuentran adyacentes y contribuyen a la modificación de esta estructura base al agregar grupos funcionales diferentes o cambiar su conformación.

Principales clases de BGCs editar

Cada clase de BGC se distingue por los tipos de genes esenciales y accesorios que la componen. Estos genes siguen una lógica específica durante su expresión. A continuación, se describe la lógica biosintética de las clases más comunes de BGCs de productos naturales conocidos: PKSs, NRPSs, RIPPs y terpenos.

 
Esquema de los tipos de PKSs existentes.

Policétido sintasas (PKSs) editar

Los policétidos son moléculas orgánicas complejas cuya estructura fundamental está formada por unidades de acetato y/o propionato. Las enzimas responsables de ensamblar estos componentes se denominan policétido sintasas (PKSs)[50]​.

Las policétido sintasas (PKSs) son grandes proteínas enzimáticas con una organización peculiar. Estas enzimas se estructuran en dos niveles; módulos y dominios. Cada enzima PKS puede tener 2 o 3 módulos, y cada módulo consta de al menos 3 dominios esenciales[51]​:

  • Acil-transferasa (AT): Atrae los sustratos (monómeros) correctos para incorporarlos a la cadena[52]​.
  • Proteína acarreadora de grupos acilo (ACP): Lugar donde ocurre el ensamblaje. Está unida a una molécula de 4-fosfopanteteína, que se enlaza covalentemente con los monómeros cargados en la cadena[53]​.
  • β-ceto-acil-sintasa (KS): Cataliza la reacción de condensación tipo thiol-Claisen descarboxilativa entre los sustratos del dominio AT y el precursor unido al dominio ACP[54]​.

Estos dominios son esenciales para construir la cadena base del policétido. Sin embargo, la diversidad de policétidos en la naturaleza depende de la presencia de dominios accesorios que modifican esta estructura básica[55]​. Estos dominios opcionales pueden ser de ceto-reducción (KR), deshidratación (DH) o enoil-reducción (ER). Además, al menos una PKS en el clúster debe contener un dominio de terminación (TE) o reducción (Red) que indica el final de la elongación del policétido correspondiente. El número de módulos y el tipo de dominios en las PKSs determinan la estructura final del metabolito.

La iteración, o repetición en la incidencia de veces que los dominios actuan para seguir elongando la cadena tambien tienen mucho que ver en el tipo y longitud de policetido que se produce[55]​. De hecho el que una PKS sea o no iterativa se toma como base fundamental para su clasificación (Tabla 2).

Tabla 2. Descripción general de los tipos de PKSs
Tipo de PKS Sustratos precursores Producto Organismos
Modular Tipo I

(no iterativa)

ACP, varias unidades de extensión Reducido Bacterias y protistas[56]
Iterativa Tipo I ACP, solo unidades de malonil-CoA Aromático y Reducido Principalmente hongos, algunas bacterias[57]
(Iterativa) Tipo II ACP, solo unidades de malonil-CoA Reducido Exclusivamente bacterias[58]
(Iterativa) Tipo III Acyl-CoA, solo unidades de malonil-CoA* Reducido Principalmente plantas, algunas bacterias y hongos[59]
PKS-NRPS híbrido ACP, malonil-CoA, aminoácidos Variable Bacterias (modular) y hongos (itetativa)[60]

Sintetasas de péptidos no-ribosomales (NRPSs) editar

Los péptidos no-ribosomales son una de las clases de metabolitos más comunes y relevantes en la naturaleza[61]​. Ejemplos notables incluyen la vancomicina (con propiedades bactericidas)[62]​, la enterobactina (un sideróforo)[63]​ y la ciclosporina (un inmunosupresor)[64]​. La característica compartida por estas moléculas es que están compuestas por la unión de residuos de aminoácidos o sus derivados. Sin embargo, a diferencia de los péptidos sintetizados por los ribosomas, estos péptidos no siguen esa ruta. En cambio, las sintetasas de péptidos no-ribosomales (NRPSs) son las enzimas responsables de ensamblar estas moléculas. Al igual que las PKSs, las NRPSs son grandes enzimas organizadas en módulos y dominios[65]​.

 
Biosíntesis de un NPs ficticio llamado "fakeomycin", que es de la clase NRPS con un dominio de ciclación (Cy). Los pasos para la produccion de NRPS estan codificados en grupos de genes biosintéticos

Los dominios de las NRPSs cumplen funciones similares a los de las PKSs.

Los dominios esenciales son:

  • Adenilación (A): Selecciona y activa los sustratos mediante una reacción ATP-dependiente para producir acil-adenilatos[66]​.
  • Proteína acarreadora de peptidilos (PCP): Permite la unión covalente de los residuos precursores que forman la cadena peptídica, similar al dominio ACP de las PKS[67]​.
  • Condensación: Cataliza la reacción de condensación entre los residuos mediante enlaces amida, o en ocasiones especiales, por enlaces éster[68]​.

Los dominios accesorios de las NRPSs pueden ser de varios tipos:

  • Epimerización (E): Invierten la configuración de los residuos[69]​.
  • Metil-transferasa dependiente de S-adenosil-metionina (MT): Responden a residuos N-metilados[70]​.
  • Ciclación (Cy) y/u oxidación (Ox): Se utilizan al unir residuos de cisteína, serina o treonina ciclados[71]​.
  • Dominio de terminación (TE): Marca el final de la elongación de la cadena[72]​.

Al igual que en las PKSs, la cantidad de módulos y el tipo y organización de los dominios determinan la estructura final del péptido[65]​.

Péptidos ribosomalmente sintetizados y modificados post-traduccionalmente (RIPPs) editar

 
Descripción general de la biosíntesis canónica de un RiPP

Se trata de moléculas naturales cuya estructura se caracteriza por una cadena peptídica policíclica. En esta estructura, los aminoácidos están unidos mediante enlaces tioéter, formando uniones tipo meso-lantionina (Lan) y (2S, 3S, 6R)-3-metil-lantionina (MeLan)[73]​. Los RIPPs más destacados son los lantipéptidos, que se encuentran en diversas formas de vida y son especialmente relevantes debido a su actividad antibiótica[74]​. Algunos ejemplos conocidos incluyen la nisina (utilizada en la preservación de alimentos)[75]​, la actagardina (empleada para tratar infecciones de Clostridium difficile)[76]​, la duramicina (usada en el tratamiento de la fibrosis quística)[77]​ y las bacteriocinas utilizadas en la agricultura[78]​.

La biosíntesis de los lantipéptidos comienza con la transcripción y traducción ribosomal de un gen estructural llamado LanA. A partir de este proceso, se obtiene un péptido precursor lineal. Este precursor se divide en dos partes: el péptido líder y el péptido central[74]​.

  • El péptido líder, que corresponde a la porción N-terminal del precursor, no sufre modificaciones post-traduccionales ni se une al producto final. Sin embargo, desempeña un papel crucial en la correcta ejecución de las modificaciones del péptido central y en su transporte dentro de la célula[79]​.
  • El péptido central, que es la porción C-terminal del precursor, se transforma en el lantipéptido final después de las modificaciones y la eliminación del péptido líder[79]​.

Los lantipéptidos, a pesar de estar compuestos por los 20 aminoácidos proteinogénicos, alcanzan gran diversidad gracias a las modificaciones post-traduccionales (PTMs)[80]​. Algunas de las PTMs más comunes incluyen la hetero- o macrociclación, deshidratación, acilación, glicosilación, halogenación, prenilación y epimerización[74]​. Estas modificaciones son esenciales para ampliar la variedad de estas moléculas, de hecho, según el tipo de enzimas de modificación pos-traduccional que contienen los BGCs de RIPPs, éstos se dividen en cuatro clases [81]​.

Terpenos editar

Los terpenos son compuestos orgánicos que se encuentran principalmente en plantas, hongos y algunas bacterias. Están formados por unidades de isopentenil-difosfato (IPP) y dimetilalil difosfato (DMAPP)[82]​. Algunos ejemplos importantes de terpenos incluyen el carotenoide Isorenierateno[83]​, el antibiotico Pentalenolactona[84]​ y el antitumoral Taxol[85]​.

En las bacterias, los precursores IPP y DMAPP se derivan de la ruta del metil-eritritol fosfato[86]​.

La síntesis de terpenos comienza con la formación de una cadena lineal a partir de IPP y DMAPP. Luego, muchos terpenos experimentan ciclaciones, que pueden reorganizar su estructura o incluso eliminar algunos carbonos[82][86]​. Adicionalmente, los BGCs de terpenos pueden incluir enzimas de metilación, hidroxilación o glicosilación, lo que modifica su estructura y amplía la diversidad de estas moléculas[87]​.

Estrategias para la predicción de grupos de genes biosintéticos editar

Existen herramientas que facilitan la predicción de las actividades biosintéticas en secuencias genómicas a través de diversos flujos de trabajo computacionales. Los principios generales de los algoritmos de búsqueda de BGC implican el desarrollo de algoritmos de búsquedas de BGC, como la búsqueda por similitud de secuencias mediante alineadores[88]​, redes de similitud[89]​, aprendizaje profundo[90]​ y análisis filogenómicos[91]​.

antiSMASH (antibiotics & Secondary Metabolite Analysis Shell) editar

antiSMASH es una herramienta para la extracción automatizada de datos genómicos capaz de identificar BGCs de muy diversas clases biosintéticas[92][93][94]​. Su versatilidad y su interfaz gráfica fácil de usar han convertido a antiSMASH en el software más preciso y utilizado para la minería genómica de NPs en bacterias.

Funcionamiento editar

antiSMASH encuentra BGCs en un genoma objetivo buscando genes y dominios que sean homólogos a los de modelos cuidadosamente entrenados. Todos los genes del genoma de referencia se evalúan en un proceso basado en modelos ocultos de Márkov, que identifica grupos de genes dentro de secuencias génicas que codifican metabolitos secundarios de todas las clases químicas conocidas[94]​. Después de identificar todos los genes homólogos en el genoma de referencia, se aplican reglas predefinidas para agruparlos en regiones genómicas individuales. Estos grupos se establecen según la familia de BGCs a la que son más similares. Estos grupos potenciales se amplían posteriormente agregando más genes rio arriba y rio abajo, siguiendo reglas de expansión específicas de cada familia. Esto se hace para garantizar que el BGC previsto sea lo más completo posible[95]​.

Dado que no existe un método automatizado para predecir con precisión los límites de los grupos de genes (con excepción del algoritmo CASSIS[96]​, exclusivo para genomas de hongos que pueden detectar genes corregulados), los BGC predichos por antiSMASH se muestran y etiquetan como regiones, para reflejar el hecho de que los límites de BGC son solo compensaciones definidas en las reglas de detección de clústeres, y es posible que se hayan omitido partes conservadas de ellos. Junto con el proceso de detección de BGCs, el proceso de antiSMASH integra varios módulos especializados, como los utilizados para predecir los dominios AT en PKS y los dominios A en NRPS, para proporcionar un análisis más profundo de cada BGC predicho[94][95]​. Una vez que se identifican las regiones del BGC, antiSMASH compara las regiones biosintéticas del genoma con el resto de BGCs en la base de datos de antiSMASH y te da un resultado de dichos análisis.

BioCat editar

BioCat[88]​, un método para encontrar grupos de genes biosintéticos que pueden producir un péptido no ribosómico específico cuando ya se conoce la estructura del péptido, en una base de datos de NRPs curada. Con ayuda un método bioinformático llamado PSSM (Matriz de Puntuación Post-Específica) que sirve para representar la conservación de aminoácidos en un alineamiento de secuencias de proteínas y se utiliza comúnmente para predecir la estructura de proteínas, función y alineamiento de secuencias, mejorando la calidad del alineamiento.

Comparación y agrupamiento de BGC por similitud editar

Existen herramientas bioinformaticas cuyo objetivo es comparar por similitud decenas, centenas o en algunos en el rango de millones[97]​ de BGCs con fines de predecir y caracterizar grupos o familias de BGCs y sus capacidad bioquímicas.

Programas como BiG-SLICE[97]​y DeepBGC[90]​ pueden agrupar BGCs en GCFs, que son secuencias de BGCs homólogas agrupadas en familias de clústeres de genes que utilizan diferentes formas de agrupamiento.

Las GCFs producen diferentes metabolitos. Estos conjuntos producen biomoléculas que ofrecen ventajas ecológicas y fisiológicas al linaje bacteriano que las produce. La presencia o ausencia de BGCs en un genoma puede asociarse con los nichos ecológicos y microambientes que enfrenta el linaje. Para comparar las capacidades metabólicas de un conjunto diverso de linajes bacterianos, se puede comparar la identidad de los BGCs homólogos, que comparten una arquitectura de dominio similar y producen un metabolito similar.

BiG-SCAPE[89]​, una herramienta que compara todos los BGC detectados por antiSMASH para determinar la relación que existe entre ellos y las agrupa mediante redes de similitud. Proporciona un enfoque para analizar y comprender la diversidad de los grupos de genes biosintéticos. BiG-SCAPE busca dominios Pfam en las secuencias de proteínas de cada BGC. Las redes de similitud de secuencias de BGCs pueden analizarse rápidamente e interactivamente con Big-Scape. Big-Scape se ha utilizado para analizar conjuntos de datos de BGC de gran tamaño[89]​.

BiG-SLiCE y BiG-FAM[97][98]​ son herramientas diseñadas para comparar la diversidad metabólica de linajes bacterianos codificados en BGCs incluso al tratar con conjuntos de datos grandes.

La evolución como generadora de inovación química editar

La evolución ha llevado a la generación de nuevas rutas metabólicas, y por tanto a NPs nuevos con diferentes estructuras químicas y actividades biológicas[99]​. Al estudiar las relaciones evolutivas entre los BGCs y analizar su diversidad genética y estructural, podemos explorar la posibilidad de orientarnos hacia el descubrimiento de NPs con nuevas propiedades. Adicionalmente, la comprensión de estas relaciones evolutivas nos permite identificar BGCs cripticos (no identificados) y silentes (identificados pero que no se expresan)[100]​. Esto, a su vez, contribuye al diseño y entrenamiento de mejores herramientas de bioinformática, ya que las herramientas clásicas utilizadas para predecir genes biosintéticos a menudo fallan al intentar descubrir química nueva en los sistemas biosintéticos[20]​.

Descifrando el rompecabezas evolutivo del metabolismo especializado editar

Para comprender la evolución del metabolismo de los NPs es importante reconocer que los términos "metabolismo primario" y "metabolismo secundario” pueden generar confusión. Esto se debe a la falta de bases teóricas sólidas y universales para dividir el metabolismo en tales categorías[20]​. Uno de las motivos, subyace en la naturaleza misma de la evolución, ya que los procesos evolutivos que actúan en todas las rutas metabólicas, tienen un efecto diferencial debido a la interacción entre las diversas fuerzas evolutivas en cada uno de los organismos.

Se han propuesto varios modelos para explicar la diversificación del metabolismo moderno. Por ejemplo, Horowitz propuso un escenario de retroevolución para el anabolismo en 1945[101]​. Cordon amplió estos conceptos para el catabolismo en 1990[102]​. Además, Ycas y Jensen sugirieron que las actividades catalíticas promiscuas proporcionaban una ventaja selectiva y eran reclutadas para realizar nuevas funciones[103][104]​. Esto condujo a un mosaico de enzimas homólogas dispersas en las diferentes vías del metabolismo, conocido como la hipótesis del mosaico[105][106]​.

Otra hipótesis interesante es la hipótesis de la concha de Morowitz[107]​. Según esta idea, la complejidad metabólica actual evolucionó a través del reclutamiento de elementos presentes en etapas anteriores del metabolismo. Se construyeron capas de complejidad metabólica, siendo las más recientes las que contienen funciones enzimáticas más diversas y de reciente evolución. Las capas internas, en cambio, albergan reacciones metabólicas ancestrales y universales. El metabolismo de los NPs representa la última capa de complejidad metabólica y ha surgido recientemente del repertorio de enzimas presentes en el metabolismo central[108]​.

A partir de ahí y con la debida experimentación de por medio, se consolidó la tesis de que los productos naturales provienen de un metabolismo secundario, y por tanto especializado. Es por eso que a los productos naturales también se les conoce como metabolitos secundarios o más apropiadamente, metabolitos especializados[109]​. En una ruta biosintética especializada, como la de los antibióticos por ejemplo, todas las enzimas que realizan conversiones químicas tienen un ancestro en el metabolismo central, que es la química fundamental compartida por todos los seres vivos. Estas rutas biosintéticas especializadas, evolutivamente más recientes que las rutas del metabolismo central, ilustran cómo los organismos han desarrollado mecanismos químicos adaptativos para interactuar y adaptarse a su entorno; los aromas y colores en las plantas o algunas adaptaciones bioquímicas en los microorganismos, son ejemplo de ello[110]​.

Aunque a menudo se asume que la duplicación de genes es el mecanismo principal para la expansión de la complejidad metabólica[111][112]​, la adquisición horizontal de genes que realizan la misma función enzimática (xenólogos) también puede lograr el mismo efecto. Estudios recientes han demostrado que en los procariotas, la transferencia horizontal de genes es el principal mecanismo de expansión de las familias de proteínas y de la innovación adaptativa[113][114]​.

Adicionalmente, existen otras formas de expandir y diversificar el metabolismo. La redundancia funcional en el metabolismo puede lograrse tambien mediante la adquisición de genes que codifican enzimas análogas (ortólogos funcionales), lo que se conoce como redundancia no homóloga[115]​. Por ejemplo, las deshidroquinato deshidratasas de tipo I y II catalizan la misma conversión de sustratos y productos, pero utilizan diferentes estrategias químicas y tienen estructuras proteicas distintas[116]​.

Por otro lado, no debemos pasar por alto la abundancia de atajos metabólicos y rutas alternativas en la evolución de nuevas funciones enzimáticas[117]​. La presencia de vías alternativas y redundantes también libera presiones de selección. Estas vías pueden producir productos metabólicos idénticos o equivalentes y amortiguar el impacto de mutaciones a manera de salvavidas evolutivo y al mismo tiempo generar variantes enzimaticas promiscuas que sirvan de trampolines de diversificación[109][118]​.

Mineria genómica con perspectiva evolutiva (Evolutionary genome mining) editar

Existen algoritmos[91][89]​para la busqueda de química nueva basados en las relaciones evolutivas entre las secuencias génicas que conforman un BGC, así como también la busqueda de variacion en vecindades genomicas de genes clave en la biosintesis, entre los más importantes y efectivos podemos mencional EvoMining y CORASON.

EvoMining editar

 
Flujo de trabajo de EvoMining para la identificación de nuevos BGCs.

EvoMining es una herramienta con un enfoque innovador que combina la búsqueda enzimática, con reconstrucciones filogenéticas y análisis de los contextos genómicos. Su objetivo es descubrir nuevas vías biosintéticas de NP con actividades biológicas interesantes[119]​. Esta herramienta se centra en bacterias, aprovechando el hecho de que sus BGCs tienden a agruparse en el cromosoma. La singularidad de EvoMining radica en su enfoque evolutivo. En lugar de basarse únicamente en similitudes de secuencias, EvoMining sigue principios evolutivos, lo que resulta en predicciones químicas imparciales y verdaderamente novedosas[91]​.

Funcionamiento editar

EvoMining busca expansiones en las familias génicas que pueden haber evolucionado desde el metabolismo conservado hacia un metabolismo especializado[119]​. Construye árboles filogenéticos basados en copias de proteínas en una base de datos genómica, diferenciando entre el metabolismo conservado, los conjuntos de genes biosintéticos de NP descubiertos y las copias de proteínas predichas por antiSMASH[95]​.

EvoMining utiliza tres bases de datos para su funcionamiento:

  • Base de datos de genomas (G-DB): Contiene secuencias genómicas de los organismos en los que se realizará la búsqueda. Es la base sobre la cual se ejecuta el análisis.
  • Base de datos de enzimas del metabolismo central (CE-DB): Contiene secuencias de enzimas centrales. Estas enzimas se comparan con las del G-DB para detectar expansiones enzimáticas (como parálogos o xenólogos). Es crucial integrar cuidadosamente el CE-DB solo con enzimas metabólicas centrales para evitar falsos positivos.
  • Base de datos de productos naturales (NP-DB): Contiene información sobre NPs. Se integra según las necesidades del estudio.

La diversidad del G-DB es fundamental. Cuanto más diverso sea, más fuentes de secuencias de organismos se deben utilizar para identificar expansiones enzimáticas reales. Además, el CE-DB puede estar compuesto por una o más familias de enzimas, dependiendo de los objetivos de la investigación. La consideración del tamaño de la base de datos es crucial para anticipar el número de familias de enzimas y el número de organismos fuente[91]​.

La NP-DB que utilizamos en nuestros análisis de minería del genoma es la base de datos MIBiG (Minimum Information about a Biosynthetic Gene cluster)[120]​. MIBiG es una base de datos de acceso abierto en línea que contiene anotaciones experimentales y metadatos sobre grupos de genes biosintéticos y sus productos moleculares. Esta base de datos nos ayuda a identificar las expansiones enzimáticas detectadas en etapas anteriores que fueron reclutadas por un metabolismo especializado y forman parte de un BGC conocido.

Además, es necesaria la utilización de antiSMASH para comparar los datos derivados de las identificaciones de expansión[91]​. La herramienta antiSMASH está diseñada para buscar y predecir posibles BGC basándose en el enfoque clásico de minería genómica[94]​.

Una vez que encontramos las expansiones genéticas en la CE-DB, identificamos las enzimas expandidas que han sido reclutadas. EvoMining construye un árbol filogenético con todas las secuencias ortólogas encontradas en la G-DB. Esto permite visualizar la historia evolutiva de una determinada familia de enzimas[91][95]​. EvoMining también utiliza un código de colores en el árbol para representar diferentes categorías de enzimas:

  • Enzimas centrales (Rojo)
  • Enzimas centrales de la semilla contenidas en nuestro CE-DB (Naranja)
  • Enzimas expandidas reclutadas para el metabolismo especializado según la base de datos MI-BiG (Azul)
  • Enzimas expandidas potencialmente reclutadas para el metabolismo especializado según la base de datos antiSMASH (Cian)
  • Enzimas expandidas filogenéticamente cerca de las ramas azules que no fueron reconocidas en la base de datos MI-BiG o antiSMASH (Verde).

CORASON (CORe Analysis of Synthetic Orthologs to prioritize Natural product-biosynthetic gene clusters) editar

CORASON es una herramienta bioinformatica visual escrita en Perl que compara e identifica grupos de genes bacterianos que comparten un núcleo genómico común en una base de datos de genomas de fácil manejo y reconstruye, a partir de ello, filogenias de estos grupos para explorar sus relaciones evolutivas[91]​. CORASON se desarrolló para encontrar y priorizar grupos de genes biosintéticos, sin embargo, su funcionamiento va más allá, ya que permite investigar sistemáticamente todos los genes de un cluster hasta identificar el núcleo génico conservado para generar inferencias e hipótesis evolutivas.

 
Funcionamiento de CORASON

Aunque habitualmente se utiliza en un contexto de metabolismo secundario (BGCs), este software se puede utilizar para cualquier tipo de clusters, y es esta misma característica la que lo hace especialmente útil para el descubrimiento de NPs novedosos, ya que no está restringido a firmas genéticas específicas de BGCs canónicos. En su lugar, el usuario tiene la libertad de elegir cualquier enzima dentro de un contexto genómico de referencia para buscar patrones de sintenia lo que permite desentrañar BGCs novedosos. Por lo tanto, es importante tener en cuenta que los genomas o secuencias que carezcan de un gen del núcleo de genes conservados definido por el usuario, se perderán. Dada esta lógica de procesamiento, es crucial elegir cuidadosamente el núcleo génico conservado, que viene determinado por la ventana de análisis filogenómico: lo que se conserva entre algunos organismos puede no conservarse para otros organismos estrechamente relacionados. Además, se recomienda evitar los genes PKS o NRPS aunque estén conservados, ya que sus familias de enzimas asociadas están sobrerrepresentadas en los genomas bacterianos, incluida su conocida multiplicidad modular, lo que lleva a resultados confusos (por ejemplo, una falsa duplicidad de BGCs dentro de un genoma). En su lugar, se recomienda utilizar genes que codifican enzimas de dominio único, de familias enzimáticas con miembros relativamente limitados[95]​.

Para utilizar CORASON, el usuario debe proporcionar el BGC a analizar, predefinir el núcleo de genes conservados y reunir una base de datos de genomas anotados. A continuación, CORASON busca los genes conservados en cada genoma y, una vez encontrado un homólogo, la búsqueda se amplía a su vecindad, para encontrar homólogos existentes del resto de los genes del BGC de la consulta. Si hay al menos un resultado adicional, el BGC putativo se considera un resultado (hit) y el programa lo guarda. En caso contrario, se descarta. Una vez encontrada cada coincidencia, se alinean todos los homólogos de los genes conservados y se construye un árbol filogenético del BGC completo. La salida de CORASON consiste en dicha filogenia, y en cada punta del árbol se dibuja la vecindad genómica. Los genes que son homólogos en todos los BGC identificados se colorean de forma similar, lo que facilita la inspección visual del resultado[91][95][121]​.

Bases de datos empleadas durante la minería genómica editar

Las bases de datos de minería de genoma son colecciones de información genética sobre diversos organismos, incluidos humanos y plantas, que almacenan metadatos sobre genes y secuencias genéticas. Entre las principales podemos mencionar: MIBiG, antiSMASH-DB y NP-Atlas.

MIBiG (Minimum Information about a Biosynthetic Gene cluster) editar

 
Integración de la base de datos de MIBiG con otros recursos bioinformaticos.

MIBiG[120]​ es una base de datos que facilita el depósito y la recuperación de datos consistentes y sistemáticos de grupos de genes biosintéticos. Proporciona un estándar comunitario para anotaciones y metadatos sobre grupos de genes biosintéticos y sus productos moleculares, permitiendo a las generaciones futuras investigar la biosíntesis, la química y la ecología de metabolitos bioactivos secundarios socialmente relevantes, guiados por evidencia experimental y componentes de metadatos.

Organización y funcionamiento[120][122] editar

  • Recopilación de datos: MIBiG recopila datos de literatura científica, bases de datos genómicas y otras fuentes para almacenar información útil sobre grupos de genes biosintéticos. Esto incluye detalles sobre los genes involucrados, las estructuras químicas de los productos y cualquier actividad biológica asociada.
  • Estandarización: MIBiG sigue un formato estandarizado, conocido como estándar MIBiG, para organizar y presentar los datos. Esto garantiza la coherencia y facilita las comparaciones entre diferentes grupos de genes.
  • Anotación: la base de datos anota los genes dentro de cada grupo de genes biosintéticos, identificando sus funciones y roles en la vía biosintética.
  • Accesibilidad: MIBiG es de libre acceso para los investigadores y la comunidad científica. Proporciona funciones de búsqueda y navegación, lo que permite a los usuarios explorar la base de datos y recuperar información sobre grupos de genes específicos o de NPs.
  • Integración: MIBiG puede integrarse con otros recursos y bases de datos bioinformáticos, lo que permite a los usuarios comparar información y recopilar información adicional.
  • Actualizaciones: la base de datos se actualiza periódicamente a medida que surgen nuevos hallazgos de investigación, lo que garantiza que siga siendo un recurso valioso y actualizado para los investigadores en el campo del descubrimiento de NPs y la biosíntesis.

MIBiG contiene miles de entradas que representan diferentes grupos de genes biosintéticos de una amplia gama de organismos, incluidas bacterias, hongos y plantas. Cada entrada corresponde a un grupo de genes único involucrado en la biosíntesis de un NP específico. La base de datos cubre una amplia gama de vías biosintéticas, incluidas las responsables de la producción de antibióticos, antifúngicos, agentes anticancerígenos, inmunosupresores y otros compuestos bioactivos. Cada entrada en MIBiG incluye anotaciones detalladas de los genes dentro del grupo de genes biosintéticos. Estas anotaciones proporcionan información sobre las funciones de genes individuales, sus productos proteicos previstos, sus funciones en la vía biosintética, asi como información sobre las estructuras químicas de los NPs producidos por cada BGC. Esto incluye detalles sobre las estructuras base de los compuestos, así como cualquier modificación o derivatización que pueda ocurrir durante la biosíntesis[120][122]​.

Muchas entradas en MIBiG incluyen información sobre las actividades biológicas de los NPs, como sus propiedades antimicrobianas, anticancerígenas o antivirales. Esta información es valiosa para comprender las posibles aplicaciones farmacológicas de estos compuestos[120][122]​.

Adicionalmente, cada entrada en MIBiG está vinculada a la literatura científica de la que se derivó la información. Esto permite a los usuarios acceder a los artículos de investigación originales para un análisis y verificación más profundos de los datos, teniendo la posibilidad de informar de posibles errores durante la actualización de la base de datos.

AntiSMASH DB editar

La base de datos de AntiSMASH[123]​ proporciona una colección actualizada de datos anotados de BGC, lo que permite un análisis sencillo entre genomas y proporciona consultas complejas sobre conjuntos de secuencias.

NP-Atlas (Natural Products Atlas) editar

La base de datos NP-Atlas (Natural Products Atlas) es un recurso que proporciona información completa sobre NPs de bacterias y hongos principalmente. Su objetivo es facilitar la investigación en el descubrimiento de NPs, su biosíntesis y posibles aplicaciones biotecnológicas[124]​.

 
Distribución del origen de los metabolitos contenidos en el NP-Atlas

Organización y funcionamiento editar

  • Recopilación de datos: NP-Atlas recopila datos relacionados a los metabolitos secundarios producidos por bacterias, hongos, y algunas arqueas, incluyendo literatura científica, bases de datos públicas y estudios experimentales. Recopila información sobre sus actividades biológicas y todo lo relacionado a sus estructuras químicas tal como fórmulas, peso molecular y cualquier información relacionada obtenida por métodos cromatográficos y de resonancia magnética nuclear.
  • Estandarización e integración de datos: NP-Atlas integra datos de múltiples fuentes para proporcionar una visión integral de los NPs y los organismos productores. Esto se lleva a cabo mediante el seguimiento de formatos y ontologías estandarizados para organizar y presentar los datos recopilados, lo que garantiza la coherencia y la interoperabilidad con otros recursos bioinformáticos como por ejemplo MIBiG[120][124]​.
  • Herramientas de visualización: la base de datos puede ofrecer herramientas de visualización para ayudar a los usuarios a explorar y analizar los datos. Incluye diagramas de las diversas estructuras moleculares de NPs y representaciones en red de las relaciones quimicas entre ellos.
  • Funcionalidad de búsqueda y navegación: NP-Atlas proporciona tres criterios de búsqueda y navegación, para explorar la base de datos: estructura química, actividad biológica y origen taxonómico.
  • Accesibilidad: Normalmente se puede acceder a NP-Atlas en línea a través de una interfaz web[125]​, lo que lo pone a disposición de los investigadores y la comunidad científica de todo el mundo. Los usuarios pueden acceder a la base de datos de forma gratuita y pueden descargar datos para su posterior análisis o integración en sus propios proyectos de investigación.
  • Actualizaciones: la base de datos se actualiza periódicamente para incorporar nuevos datos y resultados de investigaciones. Esto garantiza que la información proporcionada por NP-Atlas permanezca actualizada.

Herramientas adicionales editar

NP-Atlas ofrece otras herramientas relacionadas con la búsqueda de nuevos metabolitos secundarios mediante el uso de la metabolómica y podemos clasificarlos en dos tipos de herramientas:

  • Espectrometría de masas (SNAP-MS): En este rubro podemos mencionar herramientas para selección de picos cromatográficos, alineación espectral asi como para la detección de características variadas. Una de las herramientas más útiles durante análisis metabolómicos que ofrece el sitio, es SNAP-MS (Structural similarity Network Annotation Platform for Mass Spectrometry)[126]​. SNAP-MS es una herramienta computacional diseñada para ayudar en la desreplicación (proceso de identificar compuestos conocidos en una mezcla) y el esclarecimiento estructural (determinar la estructura química de compuestos desconocidos) de NPs utilizando datos experimentales de espectrometría de masas. La herramienta compara los datos de espectrometría de masas de compuestos desconocidos con una base de datos de NPs conocidos almacenados en NP-Atlas. Al hacer coincidir los espectros de masas y los patrones de fragmentación, SNAP-MS puede identificar rápidamente compuestos conocidos presentes en la muestra, lo que permite la desreplicación. Para compuestos que no se encuentran en la base de datos o que son estructuralmente desconocidos, SNAP-MS ayuda en el proceso de elucidación estructural. Utiliza algoritmos y métodos computacionales para analizar los patrones de fragmentación y proponer estructuras candidatas para los compuestos desconocidos basándose en los espectros de masas observados. Finalmente SNAP-MS incorpora técnicas de análisis de redes para evaluar la similitud estructural y las relaciones entre productos naturales. Al construir redes basadas en características estructurales y datos de espectrometría de masas, puede identificar grupos de compuestos estructuralmente relacionados e inferir relaciones biosintéticas.
  • Quimio-informáticas. Estas herramientas se utilizan para analizar estructuras químicas, predecir propiedades químicas y realizar búsquedas de similitudes. Entre estas se incluyen herramientas para dibujar estructuras químicas, buscar subestructuras y acoplar moléculas.

Actualmente, en la base de datos de NP-Atlas (v2024_03) hay un total de 36,395 compuestos; de los cuales 13,453 compuestos provienen de 392 géneros bacterianos y 22942 provienen de 854 generos fungicos. El análisis de redes de similitud estructural global de todas estas moléculas esta contenida en 10505 clústeres y 6990 nodos.

Uso de Inteligencia artificial en la Minería Genómica editar

En los últimos años, el uso de la inteligencia artificial (IA) en la minería genómica ha ganado terreno. Las técnicas de IA, como el aprendizaje automático y el aprendizaje profundo, se aplican cada vez más para analizar grandes cantidades de datos genómicos y predecir la presencia de moléculas pertenecientes a nuevas clases químicas.

Una ventaja clave de la IA en la minería del genoma es su capacidad para procesar y analizar eficientemente grandes conjuntos de datos, lo que permite a los investigadores descubrir patrones y relaciones ocultas dentro de las secuencias genómicas. Al aprovechar los algoritmos de IA, los científicos pueden identificar genes responsables de la síntesis de moléculas bioactivas, predecir sus estructuras químicas e incluso diseñar organismos para producir compuestos novedosos. La IA también ayuda a priorizar objetivos potenciales para su validación experimental, acelerando así el proceso de descubrimiento de fármacos. Al reducir el espacio de búsqueda y centrarse en los candidatos más prometedores, es posible agilizar la identificación de nuevos andamios químicos con potencial terapéutico.

DeepBGC editar

La herramienta computacional DeepBGC utiliza el principio del aprendizaje profundo para predecir y clasificar BGCs en genomas microbianos[90]​.

Funcionamiento de DeepBGC[127][128]​: editar

  • Recogida de datos: DeepBGC comienza reuniendo un gran conjunto de datos de genomas microbianos anotados. Estos genomas han sido previamente estudiados y anotados para identificar BGC conocidos y sus compuestos bioactivos asociados.
  • Extracción de características: DeepBGC extrae varias características de las secuencias genómicas, como secuencias de genes, posiciones de genes, motivos de secuencias y otra información genómica relevante. Estas características proporcionan datos de entrada para el modelo de aprendizaje profundo.
  • Modelo de aprendizaje profundo: DeepBGC utiliza una arquitectura de red neuronal profunda, como redes neuronales convolucionales (CNN) o redes neuronales recurrentes (RNN), para aprender los patrones y características de los BGCs a partir de las características de entrada. El modelo se entrena en el conjunto de datos anotados, donde aprende a diferenciar entre las regiones genómicas que contienen BGC y las que no.
  • Entrenamiento: Durante la fase de entrenamiento, el modelo de aprendizaje profundo se alimenta con datos etiquetados, en los que se conoce la presencia o ausencia de BGCs. El modelo ajusta sus parámetros internos mediante retropropagación y descenso de gradiente para minimizar el error de predicción.
  • Predicción: Una vez entrenado, DeepBGC puede utilizarse para predecir BGC en genomas microbianos nuevos y desconocidos. El modelo analiza las características de estos genomas y asigna probabilidades a cada región genómica, indicando la probabilidad de que contenga un BGC.
  • Evaluación: El rendimiento de DeepBGC se evalúa utilizando métricas como la precisión, la recuperación y la puntuación F1, que miden la exactitud de las predicciones de BGC en comparación con las anotaciones reales obtenidas durante la recogida de datos.

PRISM (PRediction Informatics for Secondary Metabolomes) editar

El algoritmo PRISM (PRediction Informatics for Secondary Metabolomes) es una aplicación web de código abierto para predecir las estructuras químicas de NPs codificados genéticamente a partir de secuencias de genomas microbianos. Combina técnicas bioinformáticas y quimioinformáticas para identificar y analizar BGCs responsables de la producción de NPs[129]​.

PRISM se introdujo en 2015 como una aplicación Java y un servidor web para predecir la estructura química de NRPs y PKs de tipo I y II[130]​.

Funcionamiento de PRISM[129][130][131]​: editar

  • Análisis del genoma: PRISM comienza analizando las secuencias del genoma microbiano para identificar posibles BGC.
  • Predicción y anotación de genes: El algoritmo predice y anota genes dentro de los potenciales BGCs identificados. Este paso implica la identificación de marcos de lectura abiertos (ORF) y la predicción de sus funciones basándose en la similitud de la secuencia con genes y dominios proteicos conocidos.
  • Clasificación de BGCs: PRISM clasifica los BGC identificados en diferentes tipos basándose en los tipos de NPs que se prevé que produzcan. Estos pueden incluir policétidos, péptidos no ribosomales, terpenos y otros. La clasificación ayuda a priorizar los BGC para su posterior análisis.
  • Predicción de estructuras químicas: Mediante una combinación de enfoques bioinformáticos y quimioinformáticos, PRISM predice las estructuras químicas de los NPs codificados por los BGC identificados. Esto implica predecir los andamiajes químicos, las enzimas modificadoras y otros pasos biosintéticos implicados en el ensamblaje del producto final.
  • Comparación con compuestos conocidos: PRISM compara las estructuras químicas predichas con NPs conocidos disponibles en bases de datos como PubChem, ChemSpider y otras. Esta comparación ayuda a identificar similitudes y diferencias entre los compuestos predichos y los conocidos, ayudando a priorizar nuevos compuestos para su validación experimental.
  • Visualización y análisis: Las estructuras químicas predichas y la información genómica asociada se visualizan y analizan utilizando diversas herramientas y técnicas. Esto permite a los investigadores explorar la diversidad de NPs predichos dentro de los genomas microbianos y priorizar los BGC para su validación experimental en función de su novedad, bioactividad potencial y otros criterios.

Enlaces externos editar

Referencias editar

  1. Nett, Markus (2014). Kinghorn, A. D., ed. Genome Mining: Concept and Strategies for Natural Product Discovery (en inglés). Springer International Publishing. pp. 199-245. ISBN 978-3-319-04900-7. doi:10.1007/978-3-319-04900-7_4. Consultado el 27 de marzo de 2024. 
  2. Ziemert, Nadine; Alanjary, Mohammad; Weber, Tilmann (27 de julio de 2016). «The evolution of genome mining in microbes – a review». Natural Product Reports (en inglés) 33 (8): 988-1005. ISSN 1460-4752. doi:10.1039/C6NP00025H. Consultado el 2 de abril de 2024. 
  3. Challis, Gregory L. (1 de junio de 2008). «Mining microbial genomes for new natural products and biosynthetic pathways». Microbiology (en inglés) 154 (6): 1555-1569. ISSN 1350-0872. doi:10.1099/mic.0.2008/018523-0. Consultado el 2 de abril de 2024. 
  4. «Microbial genome mining for accelerated natural products discovery: is a renaissance in the making?». Journal of Industrial Microbiology and Biotechnology. doi:10.1007/s10295-013-1389-9. 
  5. «The evolution of genome mining in microbes – a review». Natural Product Reports. doi:10.1039/C6NP00025H. 
  6. «Historical Impact of the California Gold Rush». 
  7. Newman, David J.; Cragg, Gordon M. (27 de marzo de 2020). «Natural Products as Sources of New Drugs over the Nearly Four Decades from 01/1981 to 09/2019». Journal of Natural Products (en inglés) 83 (3): 770-803. ISSN 0163-3864. doi:10.1021/acs.jnatprod.9b01285. Consultado el 2 de abril de 2024. 
  8. Dias, Daniel A.; Urban, Sylvia; Roessner, Ute (2012-06). «A Historical Overview of Natural Products in Drug Discovery». Metabolites (en inglés) 2 (2): 303-336. ISSN 2218-1989. PMC 3901206. PMID 24957513. doi:10.3390/metabo2020303. Consultado el 2 de abril de 2024. 
  9. «Descubrimiento y desarrollo de la penicilina». American Chemical Society (en inglés). Consultado el 5 de abril de 2024. 
  10. «La Penicilina: Cómo Una Bacteria Cambió La Historia De La Medicina | Conceptos De La Historia». conceptosdelahistoria.com. 28 de junio de 2023. Consultado el 5 de abril de 2024. 
  11. Bains, William; Smith, Geoff C. (7 de diciembre de 1988). «A novel method for nucleic acid sequence determination». Journal of Theoretical Biology 135 (3): 303-307. ISSN 0022-5193. doi:10.1016/S0022-5193(88)80246-7. Consultado el 2 de abril de 2024. 
  12. Tang, Xiaoyu; Li, Jie; Millán-Aguiñaga, Natalie; Zhang, Jia Jia; O’Neill, Ellis C.; Ugalde, Juan A.; Jensen, Paul R.; Mantovani, Simone M. et al. (18 de diciembre de 2015). «Identification of Thiotetronic Acid Antibiotic Biosynthetic Pathways by Target-directed Genome Mining». ACS Chemical Biology (en inglés) 10 (12): 2841-2849. ISSN 1554-8929. PMC 4758359. PMID 26458099. doi:10.1021/acschembio.5b00658. Consultado el 2 de abril de 2024. 
  13. Ziemert, Nadine; Alanjary, Mohammad; Weber, Tilmann (27 de julio de 2016). «The evolution of genome mining in microbes – a review». Natural Product Reports (en inglés) 33 (8): 988-1005. ISSN 1460-4752. doi:10.1039/C6NP00025H. Consultado el 2 de abril de 2024. 
  14. Katz, Leonard; Baltz, Richard H (1 de marzo de 2016). «Natural product discovery: past, present, and future». Journal of Industrial Microbiology and Biotechnology 43 (2-3): 155-176. ISSN 1476-5535. doi:10.1007/s10295-015-1723-5. Consultado el 2 de abril de 2024. 
  15. Jenke-Kodama, Holger; Müller, Rolf; Dittmann, Elke (2008). Petersen, Frank, ed. Evolutionary mechanisms underlying secondary metabolite diversity (en inglés). Birkhäuser. pp. 119-140. ISBN 978-3-7643-8117-2. doi:10.1007/978-3-7643-8117-2_3. Consultado el 2 de abril de 2024. 
  16. Barka, Essaid Ait; Vatsa, Parul; Sanchez, Lisa; Gaveau-Vaillant, Nathalie; Jacquard, Cedric; Klenk, Hans-Peter; Clément, Christophe; Ouhdouch, Yder et al. (2016-03). «Taxonomy, Physiology, and Natural Products of Actinobacteria». Microbiology and Molecular Biology Reviews (en inglés) 80 (1): 1-43. ISSN 1092-2172. PMC 4711186. PMID 26609051. doi:10.1128/MMBR.00019-15. Consultado el 2 de abril de 2024. 
  17. Bennett (26 de noviembre de 2020). Secondary Metabolism and Differentiation in Fungi. CRC Press. ISBN 978-1-003-06487-9. doi:10.1201/9781003064879. Consultado el 2 de abril de 2024. 
  18. a b Rosén, Josefin; Gottfries, Johan; Muresan, Sorel; Backlund, Anders; Oprea, Tudor I. (9 de abril de 2009). «Novel Chemical Space Exploration via Natural Products». Journal of Medicinal Chemistry (en inglés) 52 (7): 1953-1962. ISSN 0022-2623. PMC 2696019. PMID 19265440. doi:10.1021/jm801514w. Consultado el 2 de abril de 2024. 
  19. Yim, Grace; Huimi Wang, Helena; Davies FRS, Julian (29 de julio de 2007). «Antibiotics as signalling molecules». Philosophical Transactions of the Royal Society B: Biological Sciences (en inglés) 362 (1483): 1195-1200. ISSN 0962-8436. PMC 2435582. PMID 17360275. doi:10.1098/rstb.2007.2044. Consultado el 2 de abril de 2024. 
  20. a b c Chevrette, Marc G.; Gutiérrez-García, Karina; Selem-Mojica, Nelly; Aguilar-Martínez, César; Yañez-Olvera, Alan; Ramos-Aboites, Hilda E.; Hoskisson, Paul A.; Barona-Gómez, Francisco (29 de abril de 2020). «Evolutionary dynamics of natural product biosynthesis in bacteria». Natural Product Reports (en inglés) 37 (4): 566-599. ISSN 1460-4752. doi:10.1039/C9NP00048H. Consultado el 2 de abril de 2024. 
  21. Hutchings, Matthew I; Truman, Andrew W; Wilkinson, Barrie (1 de octubre de 2019). «Antibiotics: past, present and future». Current Opinion in Microbiology. Antimicrobials 51: 72-80. ISSN 1369-5274. doi:10.1016/j.mib.2019.10.008. Consultado el 2 de abril de 2024. 
  22. Demain, Arnold L (1 de febrero de 2014). «Importance of microbial natural products and the need to revitalize their discovery». Journal of Industrial Microbiology and Biotechnology 41 (2): 185-201. ISSN 1476-5535. doi:10.1007/s10295-013-1325-z. Consultado el 2 de abril de 2024. 
  23. Demain, Arnold L.; Sanchez, Sergio (2009-01). «Microbial drug discovery: 80 years of progress». The Journal of Antibiotics (en inglés) 62 (1): 5-16. ISSN 1881-1469. PMC 7094699. PMID 19132062. doi:10.1038/ja.2008.16. Consultado el 2 de abril de 2024. 
  24. Pye, Cameron R.; Bertin, Matthew J.; Lokey, R. Scott; Gerwick, William H.; Linington, Roger G. (30 de mayo de 2017). «Retrospective analysis of natural products provides insights for future discovery trends». Proceedings of the National Academy of Sciences (en inglés) 114 (22): 5601-5606. ISSN 0027-8424. PMC 5465889. PMID 28461474. doi:10.1073/pnas.1614680114. Consultado el 2 de abril de 2024. 
  25. Gavriilidou, Athina; Kautsar, Satria A.; Zaburannyi, Nestor; Krug, Daniel; Müller, Rolf; Medema, Marnix H.; Ziemert, Nadine (2022-05). «Compendium of specialized metabolite biosynthetic diversity encoded in bacterial genomes». Nature Microbiology (en inglés) 7 (5): 726-735. ISSN 2058-5276. doi:10.1038/s41564-022-01110-2. Consultado el 2 de abril de 2024. 
  26. Six Natural Product Classes (en inglés). 28 de abril de 2017. doi:10.1039/BK9781788010764-00057. Consultado el 8 de abril de 2024. 
  27. «Erythromycin». 
  28. «Daptomycin». 
  29. «Nisin Z». 
  30. «Kanamycin». 
  31. «Diplopterol». 
  32. «Pyrrolo(3',4':5,6)pyrido(1,2-a:3,4-b')diindole-6,8(5ah,7H)-dione, 10-chloro-8a,13-dihydro-5a,8a-dihydroxy-14-methoxy-7,13-dimethyl-, (5aR,8aS)-». 
  33. Murray, Christopher J L; Ikuta, Kevin Shunji; Sharara, Fablina; Swetschinski, Lucien; Robles Aguilar, Gisela; Gray, Authia; Han, Chieh; Bisignano, Catherine et al. (2022-02). «Global burden of bacterial antimicrobial resistance in 2019: a systematic analysis». The Lancet 399 (10325): 629-655. ISSN 0140-6736. PMC 8841637. PMID 35065702. doi:10.1016/s0140-6736(21)02724-0. Consultado el 2 de abril de 2024. 
  34. «¿Qué causa la resistencia a los antibióticos? - Kevin Wu». 
  35. Woodford, N.; Ellington, M.J. (2007-01). «The emergence of antibiotic resistance by mutation». Clinical Microbiology and Infection 13 (1): 5-18. ISSN 1198-743X. doi:10.1111/j.1469-0691.2006.01492.x. Consultado el 2 de abril de 2024. 
  36. Peterson, Elizabeth; Kaur, Parjit (2018). «Antibiotic Resistance Mechanisms in Bacteria: Relationships Between Resistance Determinants of Antibiotic Producers, Environmental Bacteria, and Clinical Pathogens». Frontiers in Microbiology 9. ISSN 1664-302X. PMC 6283892. PMID 30555448. doi:10.3389/fmicb.2018.02928. Consultado el 2 de abril de 2024. 
  37. Wilke, MH (30 de noviembre de 2010). «Multiresistant bacteria and current therapy - the economical side of the story». European Journal of Medical Research 15 (12): 571. ISSN 2047-783X. PMC 3352106. PMID 21163732. doi:10.1186/2047-783X-15-12-571. Consultado el 2 de abril de 2024. 
  38. Bungau, Simona; Tit, Delia Mirela; Behl, Tapan; Aleya, Lotfi; Zaha, Dana Carmen (1 de febrero de 2021). «Aspects of excessive antibiotic consumption and environmental influences correlated with the occurrence of resistance to antimicrobial agents». Current Opinion in Environmental Science & Health 19: 100224. ISSN 2468-5844. doi:10.1016/j.coesh.2020.10.012. Consultado el 2 de abril de 2024. 
  39. Kwon, Jennie H.; Powderly, William G. (30 de julio de 2021). «The post-antibiotic era is here». Science (en inglés) 373 (6554): 471-471. ISSN 0036-8075. doi:10.1126/science.abl5997. Consultado el 2 de abril de 2024. 
  40. Rice, Louis B. (15 de abril de 2008). «Federal Funding for the Study of Antimicrobial Resistance in Nosocomial Pathogens: No ESKAPE». The Journal of Infectious Diseases (en inglés) 197 (8): 1079-1081. ISSN 0022-1899. doi:10.1086/533452. Consultado el 2 de abril de 2024. 
  41. Ma, Yu‐Xuan; Wang, Chen‐Yu; Li, Yuan‐Yuan; Li, Jing; Wan, Qian‐Qian; Chen, Ji‐Hua; Tay, Franklin R.; Niu, Li‐Na (2020-01). «Considerations and Caveats in Combating ESKAPE Pathogens against Nosocomial Infections». Advanced Science (en inglés) 7 (1). ISSN 2198-3844. PMC 6947519. PMID 31921562. doi:10.1002/advs.201901872. Consultado el 2 de abril de 2024. 
  42. Cook, Michael A.; Wright, Gerard D. (10 de agosto de 2022). «The past, present, and future of antibiotics». Science Translational Medicine (en inglés) 14 (657). ISSN 1946-6234. doi:10.1126/scitranslmed.abo7793. Consultado el 2 de abril de 2024. 
  43. Medema, Marnix H.; Kottmann, Renzo; Yilmaz, Pelin; Cummings, Matthew; Biggins, John B.; Blin, Kai; de Bruijn, Irene; Chooi, Yit Heng et al. (2015-09). «Minimum Information about a Biosynthetic Gene cluster». Nature Chemical Biology (en inglés) 11 (9): 625-631. ISSN 1552-4469. doi:10.1038/nchembio.1890. Consultado el 1 de abril de 2024. 
  44. Cimermancic, Peter; Medema, Marnix H.; Claesen, Jan; Kurita, Kenji; Wieland Brown, Laura C.; Mavrommatis, Konstantinos; Pati, Amrita; Godfrey, Paul A. et al. (2014-07). «Insights into Secondary Metabolism from a Global Analysis of Prokaryotic Biosynthetic Gene Clusters». Cell 158 (2): 412-421. ISSN 0092-8674. doi:10.1016/j.cell.2014.06.034. Consultado el 1 de abril de 2024. 
  45. «Breaking the silence: new strategies for discovering novel natural products». Current Opinion in Biotechnology. doi:10.1016/j.copbio.2017.02.008. 
  46. «Transporter genes in biosynthetic gene clusters predict metabolite characteristics and siderophore activity». Genome Research. doi:10.1101/gr.268169.120. 
  47. «Unlocking the trove of metabolic treasures: activating silent biosynthetic gene clusters in bacteria and fungi». Current Opinion in Microbiology. doi:10.1016/j.mib.2019.03.003. 
  48. «An atlas of bacterial secondary metabolite biosynthesis gene clusters». Environmental Microbiology. doi:10.1111/1462-2920.15761. 
  49. «Natural Products and the Gene Cluster Revolution». Trends in Microbiology. doi:10.1016/j.tim.2016.07.006. 
  50. «Evolution of polyketide synthases in bacteria». PNAS. doi:10.1073/pnas.0710107105. 
  51. «Structure of a modular polyketide synthase». Nature. doi:10.1038/nature13423. 
  52. «Mechanistic Analysis of Acyl Transferase Domain Exchange in Polyketide Synthase Modules». Journal of the American Chemical Society. doi:10.1021/ja029539i. 
  53. «How Acyl Carrier Proteins (ACPs) Direct Fatty Acid and Polyketide Biosynthesis». Angewandte Chemie. doi:10.1002/anie.202312476. 
  54. «Substrate Specificity in Ketosynthase Domains from trans-AT Polyketide Synthases.». Angewandte Chemie. doi:10.1002/ange.201207690. 
  55. a b Grininger, Martin (21 de abril de 2020). «The role of the iterative modules in polyketide synthase evolution». Proceedings of the National Academy of Sciences (en inglés) 117 (16): 8680-8682. ISSN 0027-8424. PMC 7183167. PMID 32291336. doi:10.1073/pnas.2004190117. Consultado el 16 de abril de 2024. 
  56. «Novel Insights into Evolution of Protistan Polyketide Synthases through Phylogenomic Analysis». Protist. doi:10.1016/j.protis.2007.08.001. 
  57. Wang, Bin; Guo, Fang; Huang, Chunshuai; Zhao, Huimin (14 de abril de 2020). «Unraveling the iterative type I polyketide synthases hidden in Streptomyces». Proceedings of the National Academy of Sciences (en inglés) 117 (15): 8449-8454. ISSN 0027-8424. PMC 7165468. PMID 32217738. doi:10.1073/pnas.1917664117. Consultado el 14 de abril de 2024. 
  58. Meurer, Guido; Gerlitz, Martin; Wendt-Pienkowski, Evelyn; Vining, Leo C.; Rohr, Jürgen; Richard Hutchinson, C. (1997-06). «Iterative type II polyketide synthases, cyclases and ketoreductases exhibit context-dependent behavior in the biosynthesis of linear and angular decapolyketides». Chemistry & Biology 4 (6): 433-443. ISSN 1074-5521. doi:10.1016/s1074-5521(97)90195-2. Consultado el 14 de abril de 2024. 
  59. Katsuyama, Yohei; Ohnishi, Yasuo (2012). Type III Polyketide Synthases in Microorganisms (en inglés) 515. Elsevier. pp. 359-377. ISBN 978-0-12-394290-6. doi:10.1016/b978-0-12-394290-6.00017-3. Consultado el 14 de abril de 2024. 
  60. Fisch, Katja Maria (2013). «Biosynthesis of natural products by microbial iterative hybrid PKS–NRPS». RSC Advances (en inglés) 3 (40): 18228. ISSN 2046-2069. doi:10.1039/c3ra42661k. Consultado el 14 de abril de 2024. 
  61. «Nonribosomal Peptide Synthetases Involved in the Production of Medically Relevant Natural Products». Molecular Pharmaceutics. doi:10.1021/mp700137g. 
  62. Levine, Donald P. (1 de enero de 2006). «Vancomycin: A History». Clinical Infectious Diseases 42 (Supplement_1): S5-S12. ISSN 1537-6591. doi:10.1086/491709. Consultado el 14 de abril de 2024. 
  63. Raymond, Kenneth N.; Dertz, Emily A.; Kim, Sanggoo S. (2003-04). «Enterobactin: An archetype for microbial iron transport». Proceedings of the National Academy of Sciences (en inglés) 100 (7): 3584-3588. ISSN 0027-8424. PMC 152965. PMID 12655062. doi:10.1073/pnas.0630018100. Consultado el 14 de abril de 2024. 
  64. Laupacis, A.; Keown, P. A.; Ulan, R. A.; McKenzie, N.; Stiller, C. R. (1 de mayo de 1982). «Cyclosporin A: a powerful immunosuppressant.». Canadian Medical Association Journal 126 (9): 1041-1046. ISSN 0008-4409. PMC 1863293. PMID 7074504. Consultado el 14 de abril de 2024. 
  65. a b Walsh, Christopher T. (2016). «Insights into the chemical logic and enzymatic machinery of NRPS assembly lines». Natural Product Reports (en inglés) 33 (2): 127-135. ISSN 0265-0568. doi:10.1039/C5NP00035A. Consultado el 14 de abril de 2024. 
  66. Stanišić, Aleksa; Kries, Hajo (3 de junio de 2019). «Adenylation Domains in Nonribosomal Peptide Engineering». ChemBioChem (en inglés) 20 (11): 1347-1356. ISSN 1439-4227. doi:10.1002/cbic.201800750. Consultado el 14 de abril de 2024. 
  67. Sundlov, Jesse A.; Shi, Ce; Wilson, Daniel J.; Aldrich, Courtney C.; Gulick, Andrew M. (2012-02). «Structural and Functional Investigation of the Intermolecular Interaction between NRPS Adenylation and Carrier Protein Domains». Chemistry & Biology (en inglés) 19 (2): 188-198. PMC 3292774. PMID 22365602. doi:10.1016/j.chembiol.2011.11.013. Consultado el 14 de abril de 2024. 
  68. Rausch, Christian; Hoof, Ilka; Weber, Tilmann; Wohlleben, Wolfgang; Huson, Daniel H. (16 de mayo de 2007). «Phylogenetic analysis of condensation domains in NRPS sheds light on their functional evolution». BMC Evolutionary Biology 7 (1): 78. ISSN 1471-2148. PMC 1894796. PMID 17506888. doi:10.1186/1471-2148-7-78. Consultado el 14 de abril de 2024. 
  69. Kim, Woojoo E.; Patel, Ashay; Hur, Gene H.; Tufar, Peter; Wuo, Michael G.; McCammon, J. Andrew; Burkart, Michael D. (18 de enero de 2019). «Mechanistic Probes for the Epimerization Domain of Nonribosomal Peptide Synthetases». ChemBioChem (en inglés) 20 (2): 147-152. ISSN 1439-4227. PMC 6632073. PMID 30194895. doi:10.1002/cbic.201800439. Consultado el 14 de abril de 2024. 
  70. Huang, Tingting; Duan, Yingyi; Zou, Yi; Deng, Zixin; Lin, Shuangjun (21 de septiembre de 2018). «NRPS Protein MarQ Catalyzes Flexible Adenylation and Specific S -Methylation». ACS Chemical Biology (en inglés) 13 (9): 2387-2391. ISSN 1554-8929. doi:10.1021/acschembio.8b00364. Consultado el 14 de abril de 2024. 
  71. Dowling, Daniel P.; Kung, Yan; Croft, Anna K.; Taghizadeh, Koli; Kelly, Wendy L.; Walsh, Christopher T.; Drennan, Catherine L. (2016-11). «Structural elements of an NRPS cyclization domain and its intermodule docking domain». Proceedings of the National Academy of Sciences (en inglés) 113 (44): 12432-12437. ISSN 0027-8424. PMC 5098645. PMID 27791103. doi:10.1073/pnas.1608615113. Consultado el 14 de abril de 2024. 
  72. Schwarzer, Dirk; Mootz, Henning D; Marahiel, Mohamed A (2001-10). «Exploring the impact of different thioesterase domains for the design of hybrid peptide synthetases». Chemistry & Biology 8 (10): 997-1010. ISSN 1074-5521. doi:10.1016/s1074-5521(01)00068-0. Consultado el 14 de abril de 2024. 
  73. Le, Tung; van der Donk, Wilfred A. (2021-04). «Mechanisms and Evolution of Diversity-Generating RiPP Biosynthesis». Trends in Chemistry 3 (4): 266-278. ISSN 2589-5974. doi:10.1016/j.trechm.2021.01.003. Consultado el 14 de abril de 2024. 
  74. a b c Knerr, Patrick J.; van der Donk, Wilfred A. (7 de julio de 2012). «Discovery, Biosynthesis, and Engineering of Lantipeptides». Annual Review of Biochemistry (en inglés) 81 (1): 479-505. ISSN 0066-4154. doi:10.1146/annurev-biochem-060110-113521. Consultado el 14 de abril de 2024. 
  75. Shin, J.M.; Gwak, J.W.; Kamarajan, P.; Fenno, J.C.; Rickard, A.H.; Kapila, Y.L. (12 de febrero de 2016). «Biomedical applications of nisin». Journal of Applied Microbiology 120 (6): 1449-1465. ISSN 1364-5072. PMC 4866897. PMID 26678028. doi:10.1111/jam.13033. Consultado el 14 de abril de 2024. 
  76. Bryskier, A. (30 de abril de 2014). Bryskier, André, ed. Peptide Antibiotics (en inglés). ASM Press. pp. 826-879. ISBN 978-1-68367-191-6. doi:10.1128/9781555815929.ch30. Consultado el 14 de abril de 2024. 
  77. Märki, Fritz; Hänni, Elvira; Fredenhagen, Andreas; van Oostrum, Jan (24 de octubre de 1991). «Mode of action of the lanthionine-containing peptide antibiotics duramycin, duramycin B and C, and cinnamycin as indirect inhibitors of phospholipase A2». Biochemical Pharmacology 42 (10): 2027-2035. ISSN 0006-2952. doi:10.1016/0006-2952(91)90604-4. Consultado el 14 de abril de 2024. 
  78. Ahmad, Varish; Khan, Mohd Sajid; Jamal, Qazi Mohammad Sajid; Alzohairy, Mohammad A.; Al Karaawi, Mohammad A.; Siddiqui, Mughees Uddin (1 de enero de 2017). «Antimicrobial potential of bacteriocins: in therapy, agriculture and food preservation». International Journal of Antimicrobial Agents 49 (1): 1-11. ISSN 0924-8579. doi:10.1016/j.ijantimicag.2016.08.016. Consultado el 14 de abril de 2024. 
  79. a b Kuipers, Anneke; Rink, Rick; Moll, Gert N. (2011). Drider, Djamel, ed. Genetics, Biosynthesis, Structure, and Mode of Action of Lantibiotics (en inglés). Springer. pp. 147-169. ISBN 978-1-4419-7692-5. doi:10.1007/978-1-4419-7692-5_9. Consultado el 14 de abril de 2024. 
  80. Kupke, Thomas; Götz, Friedrich (1 de febrero de 1996). «Post-translational modifications of lantibiotics». Antonie van Leeuwenhoek (en inglés) 69 (2): 139-150. ISSN 1572-9699. doi:10.1007/BF00399419. Consultado el 14 de abril de 2024. 
  81. Fernandes, Abigail; Yadav, Pranay; Nalawade, Omkar; Joshi, Sanket; Jobby, Renitta (1 de enero de 2023). Joshi, Sanket, ed. Chapter 20 - Properties, classification and applications of lantibiotics from Gram-positive bacteria. Advances in Biotechnology and Bioengineering. Academic Press. pp. 411-425. ISBN 978-0-323-99141-4. doi:10.1016/b978-0-323-99141-4.00016-3. Consultado el 14 de abril de 2024. 
  82. a b Paduch, Roman; Kandefer-Szerszeń, Martyna; Trytek, Mariusz; Fiedurek, Jan (1 de octubre de 2007). «Terpenes: substances useful in human healthcare». Archivum Immunologiae et Therapiae Experimentalis (en inglés) 55 (5): 315-327. ISSN 1661-4917. doi:10.1007/s00005-007-0039-1. Consultado el 15 de abril de 2024. 
  83. Wagener, Sarah; Völker, Tanja; De Spirt, Silke; Ernst, Hansgeorg; Stahl, Wilhelm (1 de agosto de 2012). «3,3′-Dihydroxyisorenieratene and isorenieratene prevent UV-induced DNA damage in human skin fibroblasts». Free Radical Biology and Medicine 53 (3): 457-463. ISSN 0891-5849. doi:10.1016/j.freeradbiomed.2012.05.022. Consultado el 15 de abril de 2024. 
  84. Tetzlaff, Charles N.; You, Zheng; Cane, David E.; Takamatsu, Satoshi; Omura, Satoshi; Ikeda, Haruo (1 de mayo de 2006). «A Gene Cluster for Biosynthesis of the Sesquiterpenoid Antibiotic Pentalenolactone in Streptomyces avermitilis». Biochemistry (en inglés) 45 (19): 6179-6186. ISSN 0006-2960. PMC 2518623. PMID 16681390. doi:10.1021/bi060419n. Consultado el 15 de abril de 2024. 
  85. Gallego-Jara, Julia; Lozano-Terol, Gema; Sola-Martínez, Rosa Alba; Cánovas-Díaz, Manuel; de Diego Puente, Teresa (2020-01). «A Compressive Review about Taxol®: History and Future Challenges». Molecules (en inglés) 25 (24): 5986. ISSN 1420-3049. PMC 7767101. PMID 33348838. doi:10.3390/molecules25245986. Consultado el 15 de abril de 2024. 
  86. a b Frank, Annika; Groll, Michael (26 de abril de 2017). «The Methylerythritol Phosphate Pathway to Isoprenoids». Chemical Reviews (en inglés) 117 (8): 5675-5703. ISSN 0009-2665. doi:10.1021/acs.chemrev.6b00537. Consultado el 15 de abril de 2024. 
  87. Yu, Fengnian; Utsumi, Ryutaro (1 de septiembre de 2009). «Diversity, regulation, and genetic manipulation of plant mono- and sesquiterpenoid biosynthesis». Cellular and Molecular Life Sciences (en inglés) 66 (18): 3043-3052. ISSN 1420-9071. doi:10.1007/s00018-009-0066-7. Consultado el 15 de abril de 2024. 
  88. a b Konanov, Dmitry N.; Krivonos, Danil V.; Ilina, Elena N.; Babenko, Vladislav V. (2022). «BioCAT: Search for biosynthetic gene clusters producing nonribosomal peptides with known structure». Computational and Structural Biotechnology Journal 20: 1218-1226. ISSN 2001-0370. PMC 8914306. PMID 35317229. doi:10.1016/j.csbj.2022.02.013. Consultado el 2 de abril de 2024. 
  89. a b c d Navarro-Muñoz, Jorge C.; Selem-Mojica, Nelly; Mullowney, Michael W.; Kautsar, Satria A.; Tryon, James H.; Parkinson, Elizabeth I.; De Los Santos, Emmanuel L. C.; Yeong, Marley et al. (2020-01). «A computational framework to explore large-scale biosynthetic diversity». Nature Chemical Biology (en inglés) 16 (1): 60-68. ISSN 1552-4450. PMC 6917865. PMID 31768033. doi:10.1038/s41589-019-0400-9. Consultado el 12 de marzo de 2024. 
  90. a b c Hannigan, Geoffrey D; Prihoda, David; Palicka, Andrej; Soukup, Jindrich; Klempir, Ondrej; Rampula, Lena; Durcak, Jindrich; Wurst, Michael et al. (10 de octubre de 2019). «A deep learning genome-mining strategy for biosynthetic gene cluster prediction». Nucleic Acids Research (en inglés) 47 (18): e110-e110. ISSN 0305-1048. PMC 6765103. PMID 31400112. doi:10.1093/nar/gkz654. Consultado el 12 de marzo de 2024. 
  91. a b c d e f g h Sélem-Mojica, Nelly; Aguilar, César; Gutiérrez-García, Karina; Martínez-Guerrero, Christian E.; Barona-Gómez, Fancisco (2019). «EvoMining reveals the origin and fate of natural product biosynthetic enzymes». Microbial Genomics 5 (12): e000260. ISSN 2057-5858. PMC 6939163. PMID 30946645. doi:10.1099/mgen.0.000260. Consultado el 12 de marzo de 2024. 
  92. «antiSMASH web page». 
  93. «antiSMASH Cluster Types Glossary». 
  94. a b c d Blin, Kai; Shaw, Simon; Augustijn, Hannah E; Reitz, Zachary L; Biermann, Friederike; Alanjary, Mohammad; Fetter, Artem; Terlouw, Barbara R et al. (4 de mayo de 2023). «antiSMASH 7.0: new and improved predictions for detection, regulation, chemical structures and visualisation». Nucleic Acids Research 51 (W1): W46-W50. ISSN 0305-1048. PMC 10320115. PMID 37140036. doi:10.1093/nar/gkad344. Consultado el 15 de abril de 2024. 
  95. a b c d e f Chevrette, Marc G.; Selem-Mojica, Nelly; Aguilar, César; Labby, Kristin; Bustos-Diaz, Edder D.; Handelsman, Jo; Barona-Gómez, Francisco (2022). Skellam, Elizabeth, ed. Evolutionary Genome Mining for the Discovery and Engineering of Natural Product Biosynthesis (en inglés). Springer US. pp. 129-155. ISBN 978-1-0716-2273-5. doi:10.1007/978-1-0716-2273-5_8. Consultado el 15 de abril de 2024. 
  96. Wolf, Thomas; Shelest, Vladimir; Nath, Neetika; Shelest, Ekaterina (9 de diciembre de 2015). «CASSIS and SMIPS: promoter-based prediction of secondary metabolite gene clusters in eukaryotic genomes». Bioinformatics 32 (8): 1138-1143. ISSN 1367-4811. PMC 4824125. PMID 26656005. doi:10.1093/bioinformatics/btv713. Consultado el 15 de abril de 2024. 
  97. a b c Kautsar, Satria A.; Van Der Hooft, Justin J. J.; De Ridder, Dick; Medema, Marnix H. (18 de agosto de 2020). BiG-SLiCE: A Highly Scalable Tool Maps the Diversity of 1.2 Million Biosynthetic Gene Clusters (en inglés). Bioinformatics. doi:10.1093/gigascience/giaa154. Consultado el 12 de marzo de 2024. 
  98. Kautsar, Satria A; Blin, Kai; Shaw, Simon; Weber, Tilmann; Medema, Marnix H (8 de enero de 2021). «BiG-FAM: the biosynthetic gene cluster families database». Nucleic Acids Research (en inglés) 49 (D1): D490-D497. ISSN 0305-1048. doi:10.1093/nar/gkaa812. Consultado el 12 de marzo de 2024. 
  99. «Origin and evolution of metabolic pathways». Physics of Life Reviews. doi:10.1016/j.plrev.2008.12.003. 
  100. Hoskisson, Paul A.; Seipke, Ryan F. (27 de octubre de 2020). «Cryptic or Silent? The Known Unknowns, Unknown Knowns, and Unknown Unknowns of Secondary Metabolism». En Wright, Gerard D., ed. mBio (en inglés) 11 (5). ISSN 2161-2129. PMC 7587438. PMID 33082252. doi:10.1128/mBio.02642-20. Consultado el 16 de abril de 2024. 
  101. «On the Evolution of Biochemical Syntheses». PNAS. doi:10.1073/pnas.31.6.153. 
  102. «Tratado Evolucionista de Biología». 
  103. «Enzyme recruitment in evolution of new function». Annual Review of Microbiology. doi:10.1146/annurev.mi.30.100176.002205. 
  104. «On earlier states of the biochemical system». Journal of Theoretical Biology. doi:10.1016/S0022-5193(74)80035-4. 
  105. «The origin and evolution of modern metabolism». The International Journal of Biochemistry & Cell Biology. doi:10.1016/j.biocel.2008.08.022. 
  106. «The evolution of functionally novel proteins after gene duplication». Proceeding of the Royal Society. doi:10.1098/rspb.1994.0058. 
  107. «A theory of biochemical organization, metabolic pathways, and evolution». Complexity. doi:10.1002/(SICI)1099-0526(199907/08)4:6<39::AID-CPLX8>3.0.CO;2-2. 
  108. «Secondary metabolism, inventive evolution and biochemical diversity — a review». Gene. doi:10.1016/0378-1119(92)90551-Y. 
  109. a b Chevrette, Marc G.; Gutiérrez-García, Karina; Selem-Mojica, Nelly; Aguilar-Martínez, César; Yañez-Olvera, Alan; Ramos-Aboites, Hilda E.; Hoskisson, Paul A.; Barona-Gómez, Francisco (29 de abril de 2020). «Evolutionary dynamics of natural product biosynthesis in bacteria». Natural Product Reports (en inglés) 37 (4): 566-599. ISSN 1460-4752. doi:10.1039/C9NP00048H. Consultado el 14 de abril de 2024. 
  110. «Adaptaciones bioquímicas: Los metabolitos secundarios». 
  111. Díaz-Mejía, Juan Javier; Pérez-Rueda, Ernesto; Segovia, Lorenzo (27 de febrero de 2007). «A network perspective on the evolution of metabolism by gene duplication». Genome Biology (en inglés) 8 (2): R26. ISSN 1474-760X. PMC 1852415. PMID 17326820. doi:10.1186/gb-2007-8-2-r26. Consultado el 14 de abril de 2024. 
  112. Kliebenstein, Daniel J. (19 de marzo de 2008). «A Role for Gene Duplication and Natural Variation of Gene Expression in the Evolution of Metabolism». PLOS ONE (en inglés) 3 (3): e1838. ISSN 1932-6203. PMC 2263126. PMID 18350173. doi:10.1371/journal.pone.0001838. Consultado el 14 de abril de 2024. 
  113. Soucy, Shannon M.; Huang, Jinling; Gogarten, Johann Peter (2015-08). «Horizontal gene transfer: building the web of life». Nature Reviews Genetics (en inglés) 16 (8): 472-482. ISSN 1471-0064. doi:10.1038/nrg3962. Consultado el 14 de abril de 2024. 
  114. Pál, Csaba; Papp, Balázs; Lercher, Martin J. (2005-12). «Adaptive evolution of bacterial metabolic networks by horizontal gene transfer». Nature Genetics (en inglés) 37 (12): 1372-1375. ISSN 1546-1718. doi:10.1038/ng1686. Consultado el 14 de abril de 2024. 
  115. Láruson, Áki J.; Yeaman, Sam; Lotterhos, Katie E. (2020-09). «The Importance of Genetic Redundancy in Evolution». Trends in Ecology & Evolution (en inglés) 35 (9): 809-822. doi:10.1016/j.tree.2020.04.009. Consultado el 14 de abril de 2024. 
  116. Gourley, David G.; Shrive, Annette K.; Polikarpov, Igor; Krell, Tino; Coggins, John R.; Hawkins, Alastair R.; Isaacs, Neil W.; Sawyer, Lindsay (1999-06). «The two types of 3-dehydroquinase have distinct structures but catalyze the same overall reaction». Nature Structural Biology (en inglés) 6 (6): 521-525. ISSN 1545-9985. doi:10.1038/9287. Consultado el 14 de abril de 2024. 
  117. Sambamoorthy, Gayathri; Raman, Karthik (1 de septiembre de 2018). «Understanding the evolution of functional redundancy in metabolic networks». Bioinformatics (en inglés) 34 (17): i981-i987. ISSN 1367-4803. PMC 6129275. PMID 30423058. doi:10.1093/bioinformatics/bty604. Consultado el 14 de abril de 2024. 
  118. Mahadevan, R.; Lovley, D.R. (2008-02). «The Degree of Redundancy in Metabolic Genes Is Linked to Mode of Metabolism». Biophysical Journal (en inglés) 94 (4): 1216-1220. PMC 2212697. PMID 17981891. doi:10.1529/biophysj.107.118414. Consultado el 14 de abril de 2024. 
  119. a b Aguilar, César; Verdel-Aranda, Karina; Ramos-Aboites, Hilda E; Licona-Cassani, Cuauhtémoc; Barona-Gómez, Francisco (2023). «Streptomyces lividans 66 produces a protease inhibitor via a tRNA-utilizing enzyme interacting with a C-minus NRPS». Journal of Industrial Microbiology and Biotechnology 50 (1). ISSN 1367-5435. PMC 10548850. PMID 37669898. doi:10.1093/jimb/kuad021. Consultado el 16 de abril de 2024. 
  120. a b c d e f Terlouw, Barbara R; Blin, Kai; Navarro-Muñoz, Jorge C; Avalon, Nicole E; Chevrette, Marc G; Egbert, Susan; Lee, Sanghoon; Meijer, David et al. (18 de noviembre de 2022). «MIBiG 3.0: a community-driven effort to annotate experimentally validated biosynthetic gene clusters». Nucleic Acids Research 51 (D1): D603-D610. ISSN 0305-1048. PMC 9825592. PMID 36399496. doi:10.1093/nar/gkac1049. Consultado el 15 de abril de 2024. 
  121. «CORASON Github page». 
  122. a b c «The Minimum Information about a Biosynthetic Gene cluster (MIBiG) database». 
  123. Blin, Kai; Shaw, Simon; Medema, Marnix H; Weber, Tilmann (5 de enero de 2024). «The antiSMASH database version 4: additional genomes and BGCs, new sequence-based searches and more». Nucleic Acids Research (en inglés) 52 (D1): D586-D589. ISSN 0305-1048. doi:10.1093/nar/gkad984. Consultado el 12 de marzo de 2024. 
  124. a b van Santen, Jeffrey A; Poynton, Ella F; Iskakova, Dasha; McMann, Emily; Alsup, Tyler A; Clark, Trevor N; Fergusson, Claire H; Fewer, David P et al. (28 de octubre de 2021). «The Natural Products Atlas 2.0: a database of microbially-derived natural products». Nucleic Acids Research 50 (D1): D1317-D1323. ISSN 0305-1048. PMC 8728154. PMID 34718710. doi:10.1093/nar/gkab941. Consultado el 17 de abril de 2024. 
  125. «NP-Atlas database». 
  126. Morehouse, Nicholas J.; Clark, Trevor N.; McMann, Emily J.; van Santen, Jeffrey A.; Haeckl, F. P. Jake; Gray, Christopher A.; Linington, Roger G. (19 de enero de 2023). «Annotation of natural product compound families using molecular networking topology and structural similarity fingerprinting». Nature Communications (en inglés) 14 (1): 308. ISSN 2041-1723. PMC 9852437. PMID 36658161. doi:10.1038/s41467-022-35734-z. Consultado el 17 de abril de 2024. 
  127. Hannigan, Geoffrey D; Prihoda, David; Palicka, Andrej; Soukup, Jindrich; Klempir, Ondrej; Rampula, Lena; Durcak, Jindrich; Wurst, Michael et al. (10 de agosto de 2019). «A deep learning genome-mining strategy for biosynthetic gene cluster prediction». Nucleic Acids Research 47 (18): e110-e110. ISSN 0305-1048. PMC 6765103. PMID 31400112. doi:10.1093/nar/gkz654. Consultado el 30 de abril de 2024. 
  128. Liu, Mingyang; Li, Yun; Li, Hongzhe (15 de agosto de 2022). «Deep Learning to Predict the Biosynthetic Gene Clusters in Bacterial Genomes». Journal of Molecular Biology. Artificial Intelligence, Machine Learning and the Changing Landscape of Molecular Biology 434 (15): 167597. ISSN 0022-2836. doi:10.1016/j.jmb.2022.167597. Consultado el 30 de abril de 2024. 
  129. a b Skinnider, Michael A.; Johnston, Chad W.; Gunabalasingam, Mathusan; Merwin, Nishanth J.; Kieliszek, Agata M.; MacLellan, Robyn J.; Li, Haoxin; Ranieri, Michael R. M. et al. (27 de noviembre de 2020). «Comprehensive prediction of secondary metabolite structure and biological activity from microbial genome sequences». Nature Communications (en inglés) 11 (1): 6058. ISSN 2041-1723. PMC 7699628. PMID 33247171. doi:10.1038/s41467-020-19986-1. Consultado el 2 de abril de 2024. 
  130. a b Skinnider, Michael A.; Dejong, Chris A.; Rees, Philip N.; Johnston, Chad W.; Li, Haoxin; Webster, Andrew L. H.; Wyatt, Morgan A.; Magarvey, Nathan A. (5 de octubre de 2015). «Genomes to natural products PRediction Informatics for Secondary Metabolomes (PRISM)». Nucleic Acids Research (en inglés): gkv1012. ISSN 0305-1048. PMC 4787774. PMID 26442528. doi:10.1093/nar/gkv1012. Consultado el 30 de abril de 2024. 
  131. Skinnider, Michael A.; Merwin, Nishanth J.; Johnston, Chad W.; Magarvey, Nathan A. (3 de julio de 2017). «PRISM 3: expanded prediction of natural product chemical structures from microbial genomes». Nucleic Acids Research (en inglés) 45 (W1): W49-W54. ISSN 0305-1048. PMC 5570231. PMID 28460067. doi:10.1093/nar/gkx320. Consultado el 30 de abril de 2024.