PCC183 - Aprendizagem por Reforço - 2024-2Carga horária da disciplina: 60 horas/aula Professor(es) em 2024-2
ObjetivosEmentaIntrodução ao aprendizado por reforço; processos de decisão de markov; modelagem de sistemas de aprendizado por reforço; algoritmos de aprendizado por reforço; aprendizado por reforço profundo; aprendizado por reforço automatizado; aplicações e estudos de casos.Conteúdo Programático- - Introdução ao aprendizado por reforço.- - Processos de decisão de markov. - - Modelagem de sistemas de aprendizado por reforço: estados, ações, recompensas e hiperparâmetros. - - Algoritmos de aprendizado por reforço: métodos baseados em diferença temporal, Q-learning, SARSA e simulação de algoritmos. - - Aprendizado por reforço profundo: algoritmos e simulação. - - Aprendizado por reforço automatizado: introdução ao AutoML, otimização de hiperparâmetros, metalearning, transferência de aprendizado e sistemas de AutoRL. - - Aplicações e estudos de casos: aprendizado por reforço em jogos, robótica, otimização combinatória e outras aplicações. Bibliografia- SUTTON, Richard S.; BARTO, Andrew G. Reinforcement learning: An introduction. Cambridge, MA: MIT Press, 2nd ed, 2018.- RUSSELL, Stuart J.; NORVIG, Peter. Inteligência Artificial – Uma Abordagem Moderna. 4. ed. Rio de Janeiro: LTC, 2022. - HUTTER, Frank; KOTTHOFF, Lars; VANSCHOREN, Joaquin. Automated machine learning: methods, systems, challenges. Springer Nature, 2019. Bibliografia complementar- BRAZDIL, Pavel et al. Metalearning: applications to automated machine learning and data mining. 2nd ed. Springer Nature, 2022.- MITCHELL, Tom M. Machine learning. New York: McGraw-Hill, 1997. - RIS-ALA, Rafael. Fundamentals of Reinforcement Learning. Springer, 2023. |
Departamento de Computação | ICEB | Universidade Federal de Ouro Preto
Campus Universitário Morro do Cruzeiro | CEP 35400-000 | Ouro Preto - MG, Brasil
Telefone: +55 31 3559-1692 | decom@ufop.edu.br