Este documento descreve uma simulação de um robô autônomo que aprende a navegar em um labirinto usando reforço de aprendizagem. O robô usa sensores para detectar obstáculos, define estados com base nas informações sensoriais, e recebe recompensas para aprender a se mover em direção ao farol.