Este documento proporciona una guía para instalar las herramientas necesarias para implementar una arquitectura de procesamiento de datos distribuida con Apache Hadoop. Explica cómo descargar e instalar Oracle VM VirtualBox, CentOS, Hadoop y JDK. Luego detalla los pasos para configurar el sistema operativo CentOS y crear una máquina virtual. El objetivo final es tener una plataforma configurada con las herramientas necesarias para ejecutar Hadoop y procesar datos de forma distribuida.