Nie jesteś zalogowany | zaloguj się

Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego

  • Skala szarości
  • Wysoki kontrast
  • Negatyw
  • Podkreślenie linków
  • Reset

Aktualności — Wydarzenia

Sem. "Uczenie maszynowe"

 

Entropy-Regularized Planning


Prelegent: Piotr Kozakowski

2022-04-07 12:15

Recent works have shown the effectiveness of entropy regularization in Monte Carlo Tree Search (MCTS). In this presentation I will first introduce the framework of Maximum Entropy Reinforcement Learning and show how it can be applied to MCTS. Then I will present various variants of entropy regularization. Next I will explain how the relative entropy regularization can be applied to a planning-learning system akin to MuZero and what particular benefits it can bring to planning with a learned model. Finally I will show our preliminary results on the Atari 100K benchmark.