Diferencia entre revisiones de «Lucene»

1 byte eliminado ,  hace 6 años
Eliminación de la "s" en "PDFs". En castellano, las siglas no llevan plural.
(Nueva version http://www.whoishostingthis.com/mirrors/apache/lucene/java/4.10.2/)
(Eliminación de la "s" en "PDFs". En castellano, las siglas no llevan plural.)
Es útil para cualquier aplicación que requiera indexado y búsqueda a texto completo. Lucene ha sido ampliamente usado por su utilidad en la implementación de [[motores de búsquedas]]. Por ello, a veces se confunde Lucene con un motor de búsquedas con funciones de "[[Araña web|crawling]]" y análisis de documentos en [[HTML]] incorporadas.
 
El centro de la arquitectura lógica de Lucene se encuentra el concepto de Documento (Document) que contiene Campos (Fields) de texto. Esta flexibilidad permite a Lucene ser independiente del formato del fichero. Textos que se encuentran en [[PDF]]s, páginas [[HTML]], documentos de [[Microsoft Word]], así como muchos otros pueden ser indexados mientras que se pueda extraer información de ellos.
 
[[Nutch]] es un software que, sobre la base aportada por Lucene, integra todo lo que hace falta para completar un [[buscador|motor de búsqueda]] de páginas web.
Usuario anónimo