Diferencia entre revisiones de «Apache Spark»
Contenido eliminado Contenido añadido
m →Introducción: corrección |
m ortografía |
||
Línea 21:
| idiomas = inglés
| español = No}}
'''Apache Spark''' es una framework de computación en cluster [[Open-source software|open-source]].
Apache Spark se puede considerar un sistema de computación en cluster de propósito general y orientado a la velocidad. Porpociona APIs en Java, Scala, Python y R. También proporciona un motor optimizado que soporta la ejecución de grafos en general. También soporta un conjunto extenso y rico de herramientas de alto nivel entre las que se incluyen Spark SQL (para el procesamiento de datos estructurados basada en SQL), MLlib para implementar machine learning, GraphX para el procesamirnto de grafos y Spark Streaming.
Línea 27:
==Historia==
Spark fue desarrollado en sus inicios por [[Matei Zaharia]] en el AMPLab de la UC Berkeley en 2009.
En 2013, el proyecto
En Noviembre de 2014, el la empresa de su fundador, M. Zaharia [[Databricks]] obtuvo un nuevo record mundial en la ordenación a gran escala usando Spark.<ref>[http://databricks.com/blog/2014/11/05/spark-officially-sets-a-new-record-in-large-scale-sorting.html Spark officially sets a new record in large-scale sorting]</ref>
|