Este documento proporciona información sobre herramientas de Big Data como Apache Hadoop, MapReduce y HDF. También describe Apache Spark, un motor rápido para procesar datos a gran escala. Explica conceptos clave de Spark como RDD, programación funcional en Scala y ejemplos de capacidades como procesar flujos de datos en tiempo real de servidores web o sensores IoT.