Aplicaciones de Aprendizaje por Refuerzo en Video Juegos

Reinforcement Learning es una metodología que forma parte del campo de Machine Learning y de las Ciencias Cognitivas. Los algoritmos de Reinforcement Learning permiten a uno o varios agentes tomar decisiones optimas de acuerdo a su conocimiento del ambiente. En Reinforcement Learning, el agente aprende gracias a técnicas de ganancia y castigo. El agente aprende a realizar tareas a través de la repetición de acciones correctas e incorrectas. Es así que cada acción que realiza el agente tiene asociada una ganancia.

La precisión del aprendizaje está en función del tiempo que tiene para aprender. En general, un aprendizaje rápido le dará una mala representación de la tarea que realizará, mientras que un aprendizaje a largo plazo le dará una mejor representación y por lo tanto un mejor resultado en la tarea que realizará. Todas las metodologías de RL requieren un balance entre la búsqueda de nuevas estrategias y el uso del conocimiento ya adquirido.

Cuando un agente usa el conjunto de acciones que ya realizó y su ganancia como premisas para escoger una nueva acción a realizar, entonces estamos hablando de “Explotación”. Cuando un agente está buscando nuevos caminos, estamos hablando de “Exploración”. Un buen aprendizaje requiere la combinación de estrategias de Explotación tanto como de Exploración.

Reinforcement Learning es usado frecuentemente para el aprendizaje de políticas de control y para tomar decisiones en casos específicos donde se aplican esas políticas. En realidad virtual se esta utilizando Reinforcement Learning como modelo para generar automáticamente controladores para tareas típicas en 2D y 3D. Se investiga la animación del comportamiento de agentes autónomos que se desenvuelven como humanos virtuales y son capaces de tomar decisiones. La industria de los video juegos es un campo de prueba de muchos algoritmos de control, (por ejemplo control de la navegación de vehículos) y de aprendizaje de estrategias. El objetivo de este post es hacer una revisión del estado del arte de los algoritmos de control y aprendizaje de estrategias desarrollados bajo el paradigma de Reinforcement Learning usados en Video Juegos.

El post completo es de 36 páginas, por lo que preferí editarlo en PDF, descárgalo aquí.