PCC183 - Aprendizagem por Reforço - 2024-2

Carga horária da disciplina: 60 horas/aula


Professor(es) em 2024-2

Turma 11 Professor:
André Luiz Carvalho Ottoni - e-mail

Horários:
Quinta-feira (19h00 - 20h40)
Sexta-feira (19h00 - 20h40)

Objetivos


Ementa

Introdução ao aprendizado por reforço; processos de decisão de markov; modelagem de sistemas de aprendizado por reforço; algoritmos de aprendizado por reforço; aprendizado por reforço profundo; aprendizado por reforço automatizado; aplicações e estudos de casos.

Conteúdo Programático

- - Introdução ao aprendizado por reforço.
- - Processos de decisão de markov.
- - Modelagem de sistemas de aprendizado por reforço: estados, ações, recompensas e hiperparâmetros.
- - Algoritmos de aprendizado por reforço: métodos baseados em diferença temporal, Q-learning, SARSA e simulação de algoritmos.
- - Aprendizado por reforço profundo: algoritmos e simulação.
- - Aprendizado por reforço automatizado: introdução ao AutoML, otimização de hiperparâmetros, metalearning, transferência de aprendizado e sistemas de AutoRL.
- - Aplicações e estudos de casos: aprendizado por reforço em jogos, robótica, otimização combinatória e outras aplicações.

Bibliografia

- SUTTON, Richard S.; BARTO, Andrew G. Reinforcement learning: An introduction. Cambridge, MA: MIT Press, 2nd ed, 2018.
- RUSSELL, Stuart J.; NORVIG, Peter. Inteligência Artificial – Uma Abordagem Moderna. 4. ed. Rio de Janeiro: LTC, 2022.
- HUTTER, Frank; KOTTHOFF, Lars; VANSCHOREN, Joaquin. Automated machine learning: methods, systems, challenges. Springer Nature, 2019.

Bibliografia complementar

- BRAZDIL, Pavel et al. Metalearning: applications to automated machine learning and data mining. 2nd ed. Springer Nature, 2022.
- MITCHELL, Tom M. Machine learning. New York: McGraw-Hill, 1997.
- RIS-ALA, Rafael. Fundamentals of Reinforcement Learning. Springer, 2023.

Departamento de Computação  |  ICEB  |  Universidade Federal de Ouro Preto
Campus Universitário Morro do Cruzeiro  |  CEP 35400-000  |  Ouro Preto - MG, Brasil
Telefone: +55 31 3559-1692  |  decom@ufop.edu.br


escort bahçelievler