オフライン強化学習のためのデータセットとベンチマーク

D4RL: Datasets for Deep Data-Driven Reinforcement Learning

オフラインRL向けの新しいベンチマークを提案

2020-04-15 被引用 331 中級
強化学習ベンチマーク
  • オフライン強化学習は静的データセットから学習する手法です。
  • 本研究では、実世界の応用に基づいた新しいベンチマークを提案します。
  • 従来の手法の欠点を明らかにし、研究の出発点を提供します。
強化学習ベンチマークデータセット

オフライン強化学習は、静的なデータセットからポリシーを学ぶ新しいアプローチです。しかし、既存のベンチマークはこの設定に適していません。本研究では、手作りのコントローラーや人間のデモンストレーターによって生成されたデータセットを用いた新しいベンチマークを提案し、既存アルゴリズムの欠点を明らかにします。オフライン強化学習に興味がある研究者にとって、貴重なリソースとなるでしょう。

オフライン強化学習に興味がある研究者や実務者に向いています。

D4RL: Datasets for Deep Data-Driven Reinforcement Learning
Justin Fu, Aviral Kumar, Ofir Nachum, George Tucker, Sergey Levine