UniProt

base de datos sobre proteínas

UniProt (de universal protein) es un repositorio central de datos gratuito sobre proteínas. Esto lo ha convertido en el recurso líder a nivel mundial en cuanto al almacenamiento de información sobre proteínas. La mayoría de entradas proviene de proyectos de secuenciación del genoma, y se encuentran publicadas en revistas científicas.

UniProt
Creador Instituto Europeo de Bioinformática, Instituto Suizo de Bioinformática y Protein Information Resource
Tipo base de datos biológica, base de datos en línea, repositorio de datos, base de datos orientada a grafos y ELIXIR Core Data Resource
Sitio web www.uniprot.org y www.uniprot.org

El consorcio UniProt editar

El consorcio UniProt comprende el Instituto Europeo de Bioinformática (EBI), el Instituto Suizo de Bioinformática (SIB), y Protein Information Resource (PIR). EBI se encuentra localizado en el Wellcome Trust Genome Campus en Hinxton (Reino Unido). Este cuenta con una gran fuente de bases de datos y de servicios bioinformáticos. SIB se encuentra en Ginebra (Suiza). Mantiene los servidores de ExPASy (Expert Protein Analysis System), los cuales son un recurso central para herramientas proteómicas, así como para bases de datos. PIR se encuentra en la National Biomedical Research Foundation (NBRF), localizada en el Hospital Universitario de Georgetown, en Washington D. C. (Estados Unidos). PIR es heredera de la base de datos más antigua de secuencia de proteínas, el Atlas de Secuencia y Estructura de Proteínas, publicada en 1965 por Margaret Dayhoff.[1]​ En 2002, EBI, SIB, y PIR unieron fuerzas en el consorcio UniProt.[2]

Las raíces de las bases de datos UniProt editar

Cada miembro del consorcio está muy involucrado en el mantenimiento y la anotación de la base de datos de proteínas. Hasta hace poco, EBI y SIB producían juntas las bases de datos Swiss-Prot y TrEMBL, mientras que PIR producía la base de datos de secuencias de proteínas (PIR-PSD).[3][4]​ Estas bases de datos coexistieron con diferentes prioridades de anotación y cobertura de secuencias de proteínas .

Swiss-Prot fue creado en 1986 por Amos Bairoch durante su doctorado y desarrollado por el Instituto Suizo de Bioinformática y posteriormente desarrollado por Rolf Apweiler en el Instituto Europeo de Bioinformática .[5]​ Swiss-Prot tenía como objetivo proporcionar secuencias de proteínas confiables asociadas con un alto nivel de anotación (como la descripción de la función de una proteína, su estructura de dominio , modificaciones postraduccionales , variantes, etc. ), un nivel mínimo de redundancia y alto nivel de integración con otras bases de datos. Reconociendo que los datos de secuencia se estaban generando a un ritmo que excedía la capacidad de Swiss-Prot para mantenerse al día, se creó TrEMBL (Translated EMBL Nucleotide Sequence Data Library) para proporcionar anotaciones automatizadas para aquellas proteínas que no están en Swiss-Prot. Mientras tanto, PIR mantuvo el PIR-PSD y las bases de datos relacionadas, incluida iProClass , una base de datos de secuencias de proteínas y familias seleccionadas.

Los miembros del consorcio combinaron sus recursos y experiencia superpuestos y lanzaron UniProt en diciembre de 2003.[6]

Referencias editar

  1. Dayhoff, Margaret O. (1965). National Biomedical Research Foundation, ed. Atlas of protein sequence and structure. Silver Spring, MD. 
  2. «2002 Release: NHGRI Funds Global Protein Database». National Human Genome Research Institute (NHGRI). Archivado desde el original el 24 de septiembre de 2015. Consultado el 14 de abril de 2018. 
  3. Nucclec Acids Research, ed. (1 de enero de 2003). «The Protein Information Resource» (en inglés). Consultado el 3 de mayo de 2021. 
  4. Boeckmann, Brigitte; Bairoch, Amos; Apweiler, Rolf; Blatter, Marie-Claude; Estreicher, Anne; Gasteiger, Elisabeth; Martin, Maria J.; Michoud, Karine et al. (1 de enero de 2003). «The SWISS-PROT protein knowledgebase and its supplement TrEMBL in 2003». Nucleic Acids Research 31 (1): 365-370. ISSN 0305-1048. PMID 12520024. Consultado el 3 de mayo de 2021. 
  5. Bairoch, A; Apweiler, R (1 de enero de 1996). «The SWISS-PROT protein sequence data bank and its new supplement TREMBL.». Nucleic Acids Research 24 (1): 21-25. ISSN 0305-1048. PMID 8594581. Consultado el 3 de mayo de 2021. 
  6. «Protein sequence databases». Current Opinion in Chemical Biology (en inglés) 8 (1): 76-80. 1 de febrero de 2004. ISSN 1367-5931. doi:10.1016/j.cbpa.2003.12.004. Consultado el 3 de mayo de 2021. 

Referencias externas editar