Este documento presenta una introducción a los Procesos de Decisión de Markov (MDP) y el Aprendizaje por Refuerzo (RL). Explica que los MDP modelan problemas de toma de decisiones secuenciales bajo incertidumbre, donde un agente debe tomar acciones para maximizar una recompensa a largo plazo. Describe métodos básicos como la Programación Dinámica y el aprendizaje por refuerzo para resolver MDP, así como técnicas avanzadas para problemas más complejos. Finalmente, menciona algunas aplicaciones como control de