Revisión del 20:36 19 feb 2018 editar ASTOROT (discusión · contribs.) 23 973 ediciones m →‎Introducción: corrección ← Ir a diferencia anterior		Revisión del 06:05 25 feb 2018 editar deshacer Rodrigouf (discusión · contribs.) 7922 ediciones m ortografía Ir a siguiente diferencia →
Línea 21: \| idiomas = inglés \| español = No}} '''Apache Spark''' es una framework de computación en cluster [[Open-source software\|open-source]]. ~~Fué~~Fue desarrollada originariamente en la Universidad de California, en el AMPLab de Berkeley. El código base del proyecto Spark fue donado más tarde a la Apache Software Foundation que se encarga de su mantenimiento desde entonces. Spark proporciona una interfaz para la programación de clusters completos con [[Paralelismo de Datos]] implícito y tolerancia a fallos. Apache Spark se puede considerar un sistema de computación en cluster de propósito general y orientado a la velocidad. Porpociona APIs en Java, Scala, Python y R. También proporciona un motor optimizado que soporta la ejecución de grafos en general. También soporta un conjunto extenso y rico de herramientas de alto nivel entre las que se incluyen Spark SQL (para el procesamiento de datos estructurados basada en SQL), MLlib para implementar machine learning, GraphX para el procesamirnto de grafos y Spark Streaming. Línea 27: ==Historia== Spark fue desarrollado en sus inicios por [[Matei Zaharia]] en el AMPLab de la UC Berkeley en 2009. ~~Fué~~Fue liberado como código abierto en 2010 bajo licencia [[BSD licenses\|licencia BSD]]. En 2013, el proyecto ~~fué~~fue donado a la Apache Software Foundation y se modificó su licencia a [[Apache License\|Apache 2.0]]. En febrero de 2014, Spark se convirtió en un [[Apache Software Foundation#Projects\|Top-Level Apache Project]].<ref>{{cite web \|url=https://blogs.apache.org/foundation/entry/the_apache_software_foundation_announces50 \|title=The Apache Software Foundation Announces Apache&#8482 Spark&#8482 as a Top-Level Project \|author=<!--Staff writer(s); no by-line.--> \|date=27 February 2014 \|website=apache.org \|publisher=Apache Software Foundation \|accessdate=4 March 2014}}</ref> En Noviembre de 2014, el la empresa de su fundador, M. Zaharia [[Databricks]] obtuvo un nuevo record mundial en la ordenación a gran escala usando Spark.<ref>[http://databricks.com/blog/2014/11/05/spark-officially-sets-a-new-record-in-large-scale-sorting.html Spark officially sets a new record in large-scale sorting]</ref>

Diferencia entre revisiones de «Apache Spark»