Este documento describe los principales componentes de Hadoop y conceptos relacionados con Big Data. Explica brevemente HDFS para almacenamiento de datos, YARN para administración de recursos, y MapReduce y TEZ para procesamiento por lotes y en tiempo real. También cubre herramientas como Pig, Hive, HBase, Sqoop y Flume para ETL, almacenamiento y carga de datos.