GitHub - turing-usp/Trainee-RL-Geral: Entrada RL

Boas vindas ao Projeto Trainee da área de Aprendizado por Reforço!

Antes de mais nada, recomendamos ler a seção de 👩‍🏫 Introdução do nosso Repositório de Aprendizado por Reforço para se familiarizar com os conceitos principais da área!

O projeto será dividido em duas partes:

Nessa primeira etapa do projeto, você construirá um agente simples de Aprendizado por Reforço para entender um pouco melhor os principais conceitos da área aplicados em algum tipo de código. Aqui, você aprenderá sobre o clássico problema dos k-Armed Bandits, como conseguir estimar valores para determinada ações com base na recompensa, como selecionar ações com esse maior valor estimado e como conseguir explorar o ambiente para que o agente descubra novas ações. Você também aprenderá como treinar esse agentes criados.

Para isso, recomendamos nosso 📰 Turing Talks sobre o assunto e também a nossa implementação dele no nosso 🎰 Repositório.

Comece agora mesmo acessando o notebook da Tarefa 1 - Bandits!

Na segunda parte do projeto, você deverá implementar e comparar diferentes algoritmos de Aprendizado por Reforço Profundo utilizando a biblioteca Stable Baselines 3.

Este repositório já contém um tutorial simples de como utilizar a biblioteca, que você pode conferir aqui!

Para começar a tarefa, basta acessar e alterar este notebook!

Name		Name	Last commit message	Last commit date
Latest commit History 56 Commits
img		img
.gitignore		.gitignore
README.md		README.md
Tarefa 1 - Bandits.ipynb		Tarefa 1 - Bandits.ipynb
Tarefa 2 - Stable Baselines.ipynb		Tarefa 2 - Stable Baselines.ipynb
Tutorial - Stable Baselines.ipynb		Tutorial - Stable Baselines.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

turing-usp/Trainee-RL-Geral

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages