MapReduce es un modelo de programación para procesar grandes conjuntos de datos en paralelo en clusters de computadoras. Permite particionar los datos y distribuir el trabajo entre los nodos del cluster. Los programadores definen funciones map() y reduce() para procesar los datos de forma paralela y combinar los resultados. Se usa principalmente para tareas como indexación, filtrado y análisis de grandes cantidades de datos.