計画と制御のための拡張型世界モデル

Lifting Embodied World Models for Planning and Control

高次元アクションを効率的に扱う手法

2026-04-28 中級 arXiv
強化学習Agent軽量化
  • 複雑なエージェントの動作は高次元で制御が難しい。
  • 高レベルのアクションを低レベルの動作にマッピングするポリシーを提案。
  • この手法は計算効率が高く、未知の環境にも適応可能。
強化学習エージェント軽量化

エージェントの世界モデルは、行動に基づいて未来の観察を予測しますが、高次元のアクション空間は制御が難しいです。本論文では、高レベルのアクションを低レベルの関節動作に変換する軽量ポリシーを提案し、これを用いて未来の観察を予測する新しい世界モデルを構築しました。このアプローチは、計算効率が高く、未知の環境にも適応できる点が魅力です。特に、強化学習やロボティクスに興味がある研究者にとって有用な内容です。

強化学習やロボティクスに興味がある研究者や実務者に向いています。

Lifting Embodied World Models for Planning and Control
Alex N. Wang, Trevor Darrell, Pavel Izmailov, Yutong Bai, Amir Bar