Antonio Manjavacas

Doctorando por la Universidad de Granada, desarrolla su investigación en el marco del proyecto IFMIF-DONES (International Fusion Materials Irradiation Facility DEMO Oriented Neutron Source), en colaboración con el CIEMAT. Su línea de investigación está centrada en la aplicación de aprendizaje por refuerzo en control energético de edificios, así como en su aplicación en diseño generativo para mejorar la seguridad en instalaciones de calidad nuclear.


Twitter

@manjavacas_

LinkedIn

https://www.linkedin.com/in/antonio-manjavacas/


Sessions

10-01
17:40
35min
Introducción al aprendizaje por refuerzo en Python
Antonio Manjavacas, Alejandro Campoy Nieves

El aprendizaje por refuerzo es un método de aprendizaje computacional centrado en la interacción de un agente con su entorno. Se trata de un proceso de aprendizaje iterativo, basado en prueba y error, donde el agente recibe recompensas positivas si sus acciones le conducen a estados deseables.

Esta rama de la inteligencia artificial, ampliamente ligada a la psicología conductista, ha permitido alcanzar hitos hasta hace poco impensables, como vencer al campeón mundial de Go o StarCraft, dirigir vehículos autónomos, reducir el consumo energético de edificios, o resolver el problema del plegamiento de proteínas: un reto de la biología desde hace más de 50 años.

El objetivo de esta charla será ofrecer una introducción práctica al aprendizaje por refuerzo en Python, presentando dos de las librerías más utilizadas en este campo: OpenAI Gym, destinado a la simulación en entornos de aprendizaje, y Stable Baselines, que incluye implementaciones de los algoritmos de aprendizaje por refuerzo que constituyen el estado del arte.

Finalmente, estudiaremos una aplicación real del aprendizaje por refuerzo en control energético de edificios, ámbito en el que se enmarca nuestra investigación y últimos trabajos.

Data Science, Machine Learning and AI
Grace Hopper (Teoría 6)