Diferencia entre revisiones de «Apache Spark»

Contenido eliminado Contenido añadido
ASTOROT (discusión · contribs.)
m →‎Introducción: corrección
Rodrigouf (discusión · contribs.)
m ortografía
Línea 21:
| idiomas = inglés
| español = No}}
'''Apache Spark''' es una framework de computación en cluster [[Open-source software|open-source]]. FuéFue desarrollada originariamente en la Universidad de California, en el AMPLab de Berkeley. El código base del proyecto Spark fue donado más tarde a la Apache Software Foundation que se encarga de su mantenimiento desde entonces. Spark proporciona una interfaz para la programación de clusters completos con [[Paralelismo de Datos]] implícito y tolerancia a fallos.
 
Apache Spark se puede considerar un sistema de computación en cluster de propósito general y orientado a la velocidad. Porpociona APIs en Java, Scala, Python y R. También proporciona un motor optimizado que soporta la ejecución de grafos en general. También soporta un conjunto extenso y rico de herramientas de alto nivel entre las que se incluyen Spark SQL (para el procesamiento de datos estructurados basada en SQL), MLlib para implementar machine learning, GraphX para el procesamirnto de grafos y Spark Streaming.
Línea 27:
==Historia==
 
Spark fue desarrollado en sus inicios por [[Matei Zaharia]] en el AMPLab de la UC Berkeley en 2009. FuéFue liberado como código abierto en 2010 bajo licencia [[BSD licenses|licencia BSD]].
 
En 2013, el proyecto fuéfue donado a la Apache Software Foundation y se modificó su licencia a [[Apache License|Apache 2.0]]. En febrero de 2014, Spark se convirtió en un [[Apache Software Foundation#Projects|Top-Level Apache Project]].<ref>{{cite web |url=https://blogs.apache.org/foundation/entry/the_apache_software_foundation_announces50 |title=The Apache Software Foundation Announces Apache&#8482 Spark&#8482 as a Top-Level Project |author=<!--Staff writer(s); no by-line.--> |date=27 February 2014 |website=apache.org |publisher=Apache Software Foundation |accessdate=4 March 2014}}</ref>
 
En Noviembre de 2014, el la empresa de su fundador, M. Zaharia [[Databricks]] obtuvo un nuevo record mundial en la ordenación a gran escala usando Spark.<ref>[http://databricks.com/blog/2014/11/05/spark-officially-sets-a-new-record-in-large-scale-sorting.html Spark officially sets a new record in large-scale sorting]</ref>