Reinforcement Learning | Rodrigo Lira

Material sobre Reinforcement Learning

Thu, 22 Jun 2023 10:18:25 -0300

Eu estou usando Aprendizam Por Reforço (do inglês, Reinforcement Learning) na minha tese de doutorado e no processo de aprendizado eu acabei encontrando muitos materias interessantes na internet. Resolvi fazer uma listagem deles para deixar público e também me ajudar em consultas futuras.

Para quem estiver procurando conhecimento teórico, eu sugiro os livros:

de Sutton e Barto
de Szepesvari

Para quem quiser conhecer um pouco da teoria ao mesmo tempo que desenvolve projetos práticos com Python:

do Hugginfaces
com RLLib
do Dibya.

* Há também o curso que eu não realizei.

Disciplinas em instituições:

Inteligência de enxames com aprendizado de máquina por reforço para resolução de problemas de otimização

Sun, 01 Mar 2020 00:00:00 +0000

Inteligência de enxames é uma subárea de computação inteligente que compreende abordagens que se inspiram no comportamento inteligente emergente da interação entre seres vivos para resolução de problemas complexos. Ao longo das últimas três décadas, muitas foram as propostas que surgiram na área, as quais são baseadas nas mais diversas metáforas. Uma característica em comum a essas propostas é que os agentes costumam seguir em todo o processo de resolução do problema a inspiração utilizada na sua concepção. Sabendo-se que existem diversos problemas de otimização e que mesmo em um único problema existem fases que precisam de diferentes comportamentos, seguir um conjunto de operadores bem definido por um algoritmo é um fator limitante. Por esse motivo, este projeto visa desenvolver uma meta-heurística adaptativa para resolução de problemas de otimização que consiga se auto-organizar no exame (ou sub-enxames) mais promissor de acordo com informações obtidas on-line na execução.

Applying Reinforcement Learning for Multiple Functions in Swarm Intelligence

Mon, 01 Jan 0001 00:00:00 +0000

Applying Reinforcement Learning to Combine Multiple Swarm-based Algorithms

Mon, 01 Jan 0001 00:00:00 +0000

Exploring Social Dynamics in a Reinforcement Learning-based Metaheuristic - A study using Improvement Frequency and Population Turnover

Mon, 01 Jan 0001 00:00:00 +0000

Integrating Reinforcement Learning and Optimization Task - Evaluating an Agent to Dynamically Select PSO Communication Topology

Mon, 01 Jan 0001 00:00:00 +0000