Este documento presenta un curso sobre sistemas distribuidos que cubre Hadoop, Hive, Cassandra y MongoDB. Introduce Hadoop, explicando que surgió para resolver el problema de gestionar grandes cantidades de datos de manera escalable y tolerante a fallos. Describe que Hadoop consta de MapReduce y HDFS, y que divide y distribuye los datos entre máquinas Linux para procesarlos de forma paralela.