オフライン強化学習のためのデータセットとベンチマーク
D4RL: Datasets for Deep Data-Driven Reinforcement Learning
オフラインRL向けの新しいベンチマークを提案
この論文を3行でいうと
- オフライン強化学習は静的データセットから学習する手法です。
- 本研究では、実世界の応用に基づいた新しいベンチマークを提案します。
- 従来の手法の欠点を明らかにし、研究の出発点を提供します。
キーワード
強化学習ベンチマークデータセット
もう少しだけ中身を見る
オフライン強化学習は、静的なデータセットからポリシーを学ぶ新しいアプローチです。しかし、既存のベンチマークはこの設定に適していません。本研究では、手作りのコントローラーや人間のデモンストレーターによって生成されたデータセットを用いた新しいベンチマークを提案し、既存アルゴリズムの欠点を明らかにします。オフライン強化学習に興味がある研究者にとって、貴重なリソースとなるでしょう。
こんな人に向いていそう
オフライン強化学習に興味がある研究者や実務者に向いています。
元論文はこちら
関連論文