Skip to content

turing-usp/Trainee-RL-Geral

 
 

Repository files navigation

Boas vindas ao Projeto Trainee da área de Aprendizado por Reforço!

Antes de mais nada, recomendamos ler a seção de 👩‍🏫 Introdução do nosso Repositório de Aprendizado por Reforço para se familiarizar com os conceitos principais da área!

O projeto será dividido em duas partes:

Nessa primeira etapa do projeto, você construirá um agente simples de Aprendizado por Reforço para entender um pouco melhor os principais conceitos da área aplicados em algum tipo de código. Aqui, você aprenderá sobre o clássico problema dos k-Armed Bandits, como conseguir estimar valores para determinada ações com base na recompensa, como selecionar ações com esse maior valor estimado e como conseguir explorar o ambiente para que o agente descubra novas ações. Você também aprenderá como treinar esse agentes criados.

Para isso, recomendamos nosso 📰 Turing Talks sobre o assunto e também a nossa implementação dele no nosso 🎰 Repositório.

Comece agora mesmo acessando o notebook da Tarefa 1 - Bandits!

Na segunda parte do projeto, você deverá implementar e comparar diferentes algoritmos de Aprendizado por Reforço Profundo utilizando a biblioteca Stable Baselines 3.

Este repositório já contém um tutorial simples de como utilizar a biblioteca, que você pode conferir aqui!

Para começar a tarefa, basta acessar e alterar este notebook!

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%