Este documento habla sobre Spark, un framework para procesar grandes cantidades de datos. Spark permite procesar datos en tiempo real de manera más rápida que Hadoop. Se recomienda usar Spark para explorar grandes conjuntos de datos, crear modelos y sistemas de producción que procesen grandes cantidades de eventos en tiempo real. Empresas como Netflix y IBM usan Spark para procesar billones de eventos diarios.