Se desarrollará y entrenará un robot bípedo utilizando técnicas de Aprendizaje por Refuerzo (RL). El proyecto tendrá dos fases principales: la primera consistirá en la creación de un modelo del robot en un entorno de simulación, donde se aplicarán algoritmos de RL para optimizar su locomoción y equilibrio. La segunda fase buscará transferir el conocimiento adquirido en la simulación al robot físico.