Diferencia entre revisiones de «Bioinformática»
Contenido eliminado Contenido añadido
Línea 42:
En [[1970]] se publica el [[algoritmo Needleman-Wunsch]] para [[alineamiento de secuencias]];<ref name="Needleman-Wunsch">{{cita publicación | autor = Needleman, S. y Wunsch, C.
| título = A general method applicable to the search for similarities in the amino acid sequence of two proteins | año = 1970 | publicación = Journal of Molecular Biology | volumen = 48 | número = 63}}</ref> se establece el Brookhaven [[Protein Data Bank]] ([[1971]]),<ref name="DataBank">{{cita publicación | autor = Bernstein, F. C., et al. | título = The Protein Data Bank. A Computer-Based Archival File for Macromolecular Structures | año = 1977 | publicación = European Journal of Biochemistry | volumen = 80 | número = 2 | url = http://www3.interscience.wiley.com/cgi-bin/fulltext/119625488/PDFSTART}}</ref> se crea la primera [[molécula]] de [[ADN recombinante]] ([[Paul Berg]], [[1972]]),<ref name="Berg">{{cita publicación | autor = Berg, P., et al. | título = Biochemical Method for Inserting New Genetic Information into DNA of Simian Virus 40: Circular SV40 DNA Molecules Containing Lambda Phage Genes and the Galactose Operon of Escherichia coli | año = 1972 | publicación = Proceedings of the National Academy of Sciences | volumen = 69 | número = 10 | url = http://profiles.nlm.nih.gov/CD/B/B/K/H/_/cdbbkh.pdf}}</ref> [[Edwin Southern|E. M. Southern]] desarrolla la técnica [[Southern Blot]] de localización de secuencias específicas de ADN ([[1976]]),<ref name="Southern">{{cita publicación | autor = Southern, E. M. | título = Detection of specific sequences among DNA fragments separated by gel electrophoresis | año = 1975 | publicación = Journal of Molecular Biology | volumen = 98 | número = 3 | url = http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed&uid=1195397&cmd=showdetailview&indexed=google}}</ref> comienza la [[secuenciación de ADN]] y el desarrollo de software para analizarlo (F. Sanger, software de R. Staden, [[1977]]),<ref name="Sanger 1977">{{cita publicación | autor = Sanger, F., et al. | título = DNA sequencing with chain-terminating inhibitors | año = 1977 | publicación = Proceedings of National Academy of Sciences | volumen = 74 | número = 12 | url = http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=431765&blobtype=pdf}}</ref><ref name="Staden 1977">{{cita publicación | autor = Staden, R. | título = Sequence data handling by computer | año = 1977 | publicación = Nucleic Acids Research | volumen = 4 | número = 11 | id = Págs. 4037-4051 | url = http://www.pubmedcentral.nih.gov/picrender.fcgi?artid=343220&blobtype=pdf }}</ref> y se publica en [[1978]] la primera secuencia de [[gen]]es completa de un [[
=== Años 80 ===
Línea 49 ⟶ 48:
[[Archivo:Estructura proteínas.png|thumb|300px|right|Niveles de estructura de las proteínas. En los primeros ochenta se publica cómo investigar la [[Estructura terciaria de las proteínas|estructura terciaria]] mediante [[RMN]]; en la siguiente década se desarrollarán métodos para predecir ''de novo'' algunas [[Estructura secundaria de las proteínas|estructuras secundarias]].]]
* Científicos: tras la secuenciación del fago [[Phi-X174|Φ-X174]] a finales de la década de los 70, en [[1982]] F. Sanger consigue la secuenciación del [[genoma]] del [[fago λ]] (fago ''lambda'') utilizando una nueva técnica, la secuenciación ''shotgun'' (secuenciación ''por perdigonada''), desarrollada por él mismo;<ref name="FagoLambda">{{cita publicación | autor = Sanger, F., et al. | título = Nucleotide sequence of bacteriophage λ DNA | año = 1982 | publicación = Journal of Molecular Biology | volumen = 162 | número = 4 | url = http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6WK7-4DMP5V3-2F&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_version=1&_urlVersion=0&_userid=10&md5=ea6417774604fbbbdabfd64882a1d52c}}</ref> también entre 1981 y 1982 [[Kurt Wüthrich|K. Wüthrich]] publica el método de utilización de la [[RMN]] (Resonancia Magnética Nuclear) para determinar [[Estructura de las proteínas|estructuras de proteínas]];<ref name="Wüthrich">{{cita publicación | autor = Wüthrich, K., et al. | título = Sequential Resonance Assignments as a Basis for Determination of Spatial Protein Structures by High Resolution Proton Nuclear Magnetic Resonance | año = 1982 | publicación = Journal of Molecular Biology | número = 155 | url = http://www.mol.biol.ethz.ch/groups/wider_group/publications/WIDERjmolbiol155.311.pdf}}</ref> [[Ford Doolittle]] trabaja con el concepto de [[motivo de secuencia]] (''similitudes supervivientes'', según las denomina en el resumen de su artículo) en [[1981]];<ref name="Doolittle 1981">{{cita publicación | autor = Doolittle, R. F. | título = Similar amino acid sequences: chance or common ancestry? | año = 1981 | publicación = Science | volumen = 214 | número = 4517 | url = http://www.ncbi.nlm.nih.gov/pubmed/7280687?dopt=Abstract&holding=npg}}</ref> el descubrimiento en [[1983]] de la [[
| publicación = Proceedings of the National Academy of Sciences | volumen = 84 | número = 23 | url = http://www.pnas.org/content/84/23/8453.full.pdf+html}}</ref>
Línea 64 ⟶ 63:
En los años 90 asistimos a los siguientes eventos:
* Científicos: en [[1991]] comienza la secuenciación con [[
* Bioinformáticos: búsqueda rápida de similitudes entre secuencias con [[BLAST]] ([[1990]]);<ref name="Altschul 1990">{{cita publicación | autor = Altschul, S. F. | título = Basic Local Alignment Search Tool | año = 1990 | publicación = Journal of Molecular Biology
Línea 97 ⟶ 96:
Desde que el [[Phi-X174|fago Φ-X174]] fue secuenciado en [[1977]] (secuencia provisional: un año más tarde se publicaría la secuencia completa definitiva),<ref name="x174" /> las secuencias de [[ADN]] de cientos de organismos han sido decodificadas y guardadas en [[Base de datos|bases de datos]]. Esos datos son analizados para determinar los genes que codifican para ciertas proteínas, así como también [[Secuencia reguladora|secuencias reguladoras]]. Una comparación de genes en una [[especie]] o entre especies puede mostrar similitudes entre funciones de proteínas, o relaciones entre especies (uso de [[filogenética molecular]] para construir árboles filogenéticos).<ref name="Li 2006">{{cita libro | apellidos = Li | nombre = Wen-Hsiung | editorial = Sinauer Associates Inc | título = Molecular Evolution | año = 2006 | isbn = 978-0878934805}}</ref>
Con la creciente cantidad de datos, desde hace mucho se ha vuelto poco práctico analizar secuencias de [[ADN]] manualmente. Hoy se usan programas de [[computadora]] para estudiar el [[genoma]] de miles de [[
La secuenciación conocida como "''shotgun''" (o ''por perdigonada'': fue usada, por ejemplo, por el Instituto de Investigación Genómica -''The Institute for Genomic Research'', TIGR, hoy ''J. Craig Venter Institute''- para secuenciar el primer genoma de bacteria, el [[Haemophilus influenzae]])<ref name="Fleischmann" /> no da una lista secuencial de nucleótidos, pero en cambio nos ofrece las secuencias de miles de pequeños fragmentos de ADN (cada uno de aproximadamente 600 a 800 nucleótidos de largo). [[Montaje de secuencias|Las terminaciones de estos fragmentos se superponen]] y, cuando son alineados de la manera correcta, constituyen el genoma completo del organismo en cuestión.<ref name="Pop 2004">{{cita publicación | autor = Pop, M. | título = Shotgun Sequence Assembly | año = 2004 | publicación = Advances in Computers | volumen = 60 | id = ISSN 0065-2458, Págs.193-248 | url = http://www.cbcb.umd.edu/papers/ADCOM6006.pdf}}</ref>
Línea 130 ⟶ 129:
=== Análisis de la expresión génica ===
La [[expresión génica]] de muchos genes puede determinarse por la medición de niveles de [[ARNm|mRNA]] mediante múltiples técnicas, incluyendo [[microarray]]s de ADN, secuenciación de [[Expressed sequence tag|EST]] ( [[Expressed sequence tag|Expressed Sequence Tag]]), [[Análisis en Serie de la Expresión Génica|análisis en serie de la expresión génica]] (''Serial Analysis of Gene Expression'' - SAGE), [[MPSS]] ([[Massively Parallel Signature Sequencing]]), o diversas aplicaciones de [[hibridación in situ]]. Todas estas técnicas son extremadamente propensas al [[Ruido (comunicación)|ruido]] y/o sujetas a sesgos en la medición biológica, y una de las principales áreas de investigación en la biología computacional trata del desarrollo de herramientas estadísticas para separar la [[Señal (comunicación)|señal]] del ruido en los estudios de expresión génica con alto volumen de procesamiento.<ref name="Wirta 2006">{{cita web | url = http://www.diva-portal.org/diva/getDocument?urn_nbn_se_kth_diva-4115-3__fulltext.pdf |título = Mining the transcriptome – methods and applications |fechaacceso = 18 septiembre |añoacceso = 2008 |autor = Wirta, V. |año = 2006 |formato = pdf |editorial = Royal Institute of Technology, School of Biotechnology (Estocolmo) |idioma = inglés}}</ref> Estos estudios se usan a menudo para determinar los genes implicados en un desorden: podrían, por ejemplo, compararse datos de [[microarray]]s de [[célula]]s [[epitelial]]es [[
=== Análisis de la regulación ===
Línea 154 ⟶ 153:
|fechaacceso = 25 septiembre |añoacceso = 2008 |autor = Nirenberg, M. |año = 2008 |formato = pdf |obra = Nobel Lecture |editorial = nobelprize.org |idioma = inglés}}</ref> En la inmensa mayoría de los casos, esta estructura primaria determina únicamente una estructura de la proteína en su ambiente nativo. (Hay, por supuesto, excepciones, como la [[encefalopatía espongiforme bovina]], o "mal de las vacas locas"; ver, también, [[prión]].) El conocimiento de esta estructura es vital para entender la función de la proteína.<ref name="Hegyi 1999">{{cita publicación | autor = Hegyi, H.; Gerstein, M. | título = The relationship between protein structure and function: a comprehensive survey with application to the yeast genome | año = 1999 | publicación = Journal of Molecular Biology | volumen = 228 | número = 1 | id = Págs. 147-164 | url = http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6WK7-45R880K-NG&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_version=1&_urlVersion=0&_userid=10&md5=4a44ff1e422309cab67c11fa80a8e6d5}}</ref> En ausencia de mejores términos, la información estructural de las proteínas se clasifica usualmente como estructura [[estructura secundaria|secundaria]], [[estructura terciaria|terciaria]] y [[estructura cuaternaria|cuaternaria]]. Una solución general viable para la predicción de tales estructuras permanece todavía como problema abierto. Por ahora, la mayoría de los esfuerzos han sido dirigidos hacia [[heurística]]s que funcionan la mayoría de las veces.<ref name="Moult 2005">{{cita publicación | autor = Moult, J. | título = A decade of CASP: progress, bottlenecks and prognosis in protein structure prediction | año = 2005 | publicación = Current Opinion in Structural Biology | volumen = 15 | número = 3 | id = Págs. 285-289 | url = http://www.sciencedirect.com/science?_ob=ArticleURL&_udi=B6VS6-4GBD6KT-1&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C000050221&_version=1&_urlVersion=0&_userid=10&md5=4b6b5d17a6175c5757ea240328e115ab}}</ref>
Una de las ideas clave en bioinformática es la noción de [[
Un ejemplo de lo anterior es la similar homología proteica entre la hemoglobina en humanos y la hemoglobina en las legumbres ([[leghemoglobina]]). Ambas sirven al mismo propósito de transportar oxígeno en el organismo. Aunque las dos tienen una secuencia de aminoácidos completamente diferente, sus estructuras son virtualmente idénticas, lo que refleja sus prácticamente idénticos propósitos.<ref name="Berg 2002">{{cita libro | apellidos = Berg, J. M., et al. | editorial = W. H. Freeman and Co. (edición papel); NCBI Bookshelf (edición electrónica) | título = Biochemistry | edición = 5ª | año = 2002 | isbn = 0716730510 | capítulo = 7 - Exploring Evolution | urlcapítulo = http://www.ncbi.nlm.nih.gov/books/bv.fcgi?highlight=leghemoglobin&rid=stryer.section.944#945 | cita = Because three-dimensional structure is much more closely associated with function than is sequence, tertiary structure is more evolutionarily conserved than is primary structure. This conservation is apparent in the tertiary structures of the globins (...), which are extremely similar even though the similarity between (...) human hemoglobin (α chain) and lupine leghemoglobin is not statistically significant (15.6% identity).}}</ref>
Línea 197 ⟶ 196:
Las herramientas [[software]] para bioinformática van desde simples herramientas de [[línea de comandos]] hasta mucho más complejos programas [[Interfaz gráfica de usuario|gráficos]] y [[Servicio web|servicios web]] autónomos situados en compañías de bioinformática o instituciones públicas. La más conocida herramienta de biología computacional entre los los biólogos es, probablemente, [[BLAST]], un algoritmo para determinar la similitud de secuencias arbitrarias con otras secuencias,<ref name="Altschul 1990" /> probablemente residentes en bases de datos de proteínas o de secuencias de ADN. El [[NCBI]] (''National Center for Biotechnology Information'', EE.UU.), por ejemplo, proporciona una implementación muy utilizada, basada en web, y que trabaja sobre sus [[Base de datos biológica|bases de datos]].<ref name="NCBI BLAST">{{cita web |url = http://blast.ncbi.nlm.nih.gov/Blast.cgi |título = NCBI/BLAST Home | fechaacceso = 14 septiembre |añoacceso = 2008 |autor = National Center for Biotechnology Information - NCBI |idioma = inglés}}</ref>
Para [[Alineamiento múltiple de secuencias|alineamientos múltiples de secuencias]], el clásico [[ClustalW]],<ref name="Thompson" /> actualmente en su versión 2, es el software de referencia. Puede trabajarse con una implementación del mismo en el [[
BLAST y ClustalW son sólo dos ejemplos de los muchos programas de [[alineamiento de secuencias]] disponibles. Existe, por otra parte, multitud de software bioinformático con otros objetivos: [[alineamiento estructural]] de proteínas, [[predicción de genes]] y otros motivos, [[predicción de estructura de proteínas]], [[predicción de acoplamiento proteína-proteína]], o modelado de sistemas biológicos, entre otros. En [[Anexo:Software para alineamiento de secuencias]] y [[Anexo:Software para alineamiento estructural]] pueden encontrarse sendas relaciones de programas o servicios web adecuados para cada uno de estos dos objetivos en particular.
Línea 252 ⟶ 251:
* [http://www.nap.edu/catalog/2121.html Calculating the Secrets of Life: Contributions of the Mathematical Sciences and computing to Molecular Biology (1995)]
== Mientras tanto, en otros lugares de la Wikipedia... ==
{{Portal|Biotecnología}}
{{Portal|Informática}}
{{Portal|Biología}}
{{Wikiversidad}}▼
<div style="-moz-column-count:3; column-count:3;">
* [[Algoritmo Needleman-Wunsch]]
Línea 294 ⟶ 295:
== Enlaces externos ==
=== Proyectos de Software ===
▲{{Wikiversidad}}
* Gilbert, D. [http://bib.oxfordjournals.org/cgi/content/abstract/5/3/300 ''Bioinformatics software resources'']. Briefings in Bioinformatics, 2004 5(3):300-304. Recursos software para bioinformática.
* [http://www.ebioinformatics.org/ Herramientas bioinformaticas para MacOSX]
* [http://www.dnalinux.com/ DNALinux: distribución linux con software bioinformático]
* [http://www.bioperl.org/ BioPerl]
* [http://www.bioPHP.org/ BioPHP]
* [http://www.bioruby.org/ BioRuby]
* [http://www.biopython.org/ BioPython]
* [http://www.biojava.org/ BioJava]
* [http://nostoc.stanford.edu/Docs/#intro BioLisp]
* [http://www.bioclipse.net/ BioClipse]
* [[Bioconductor]]
=== Organizaciones ===
* [http://www.a2b2c.org.ar/ Asociación Argentina de Bioinformática y Biología Computacional]
* [http://www.embnet.org/ EMBnet: European Molecular Biology Network]
<!--*[http://acidobase.com.ar/component/option,com_smf/Itemid,44/board,58.0 Foro de Investigadores Argentinos n Biología e Informática] Fuera de línea: lo ponemos en cuarentena-->
* [http://www.inab.org/ Instituto Nacional de Bioinformática]
* [http://www.ebi.ac.uk/ Instituto Europeo de Bioinformática]
* [http://www.ncbi.nlm.nih.gov/ National Center for Biotechnology Information]
* [http://www.open-bio.org/ Fundación Bioinformática Abierta: organización "non-profit" para Bio* projects, Bioperl etc.]
* [http://folding.stanford.edu/ ''Folding at home'': Proyecto de computación distribuida para la comprensión del plegado de las proteínas]
* [http://bioinformatics.org/ ''Bioinformatics.org'']
=== Empresas ===
* [http://www.bioalma.com/ Bioalma], del grupo [http://www.genetrix.es Genetrix]
* [http://www.genomica.es/ GENOMICA, S.A.U. (grupo Zeltia)]
* [http://www.biotechvana.com/ Biotechvana]
=== Directorios ===
* [http://www.bioinformatics.fr/ Bioinformatics.fr]
* [http://rib.cecalc.ula.ve/ Red Iberoamericana de Bioinformática]
* [http://www.bioinformaticos.com.ar/ Bioinformáticos] - Sitio web en español sobre bioinformática
* [http://biosites.org/index.php/Bioinformatics_Company Bioinformatics Companies of biosites.org]
=== Publicaciones especializadas ===
* [http://bioinformatics.oxfordjournals.org/ Bioinformatics]
* [http://www.almob.org/ Algorithms in Molecular Biology]
* [http://www.biomedcentral.com/bmcbioinformatics BMC Bioinformatics]
* [http://bib.oxfordjournals.org/ Briefings in Bioinformatics]
* [http://www.la-press.com/evolutionary-bioinformatics-journal-j17 Evolutionary Bioinformatics]
* [http://www.genome.org Genome Research]
* [http://www.bepress.com/ijb/ The International Journal of Biostatistics]
* [http://www.liebertpub.com/publication.aspx?pub_id=31 Journal of Computational Biology]
* [http://la-press.com/journal.php?pa=description&journal_id=10 Cancer Informatics]
* [http://publishing.royalsociety.org/index.cfm?page=1058 Journal of the Royal Society Interface]
* [http://www.nature.com/msb/index.html Molecular Systems Biology]
* [http://compbiol.plosjournals.org PLoS Computational Biology]
* [http://www.bepress.com/sagmb/ Statistical Applications in Genetic and Molecular Biology]
* [http://www.computer.org/tcbb/ Transactions on Computational Biology and Bioinformatics - IEEE/ACM]
* [http://www.inderscience.com/browse/index.php?journalcode=ijbra International Journal of Bioinformatics Research and Applications]
* [http://www.bioinformatics.fr/journals.php List of Bioinformatics journals] en Bioinformatics.fr
* [http://www.embnet.org/view/news EMBnet.News] en EMBnet.org
=== Otros recursos en español ===
* [http://bioinf3.uab.cat/scasillas/images/Resources/CursoPerl/CursoPerl.asp Curso de programación en Perl para bioinformáticos en castellano y on line creado por la plataforma de Bioinformática de la UAB]
* [http://books.google.com/books?id=1Lxt1Eviy8cC&pg=PA516&dq=bioinformatica&ei=-u_pSJTbGILeyASUvPXLAQ&sig=ACfU3U1XdD9HOmxi8uqp1IpSJi6bRBWhPg#PPP1,M1 Lahoz-Beltrá, R, ''Bioinformática: simulación, vida artificial e inteligencia artificial''. Ed. Díaz de Santos, 2004.] ISBN 84-7978-645-0
=== Otros ===
* [http://www.ornl.gov/TechResources/Human_Genome/research/informatics.html Proyecto Genoma Humano y Bioinformática]
[[Categoría:Bioinformática|Bioinformática]]
|