視覚と言語の因果推論における抽象ギャップ

The Abstraction Gap in Vision-Language Causal Reasoning

因果推論の評価方法を提案

2026-05-27 中級 arXiv
LLMマルチモーダルベンチマーク
  • 視覚と言語モデルは流暢な因果説明を生成するが、評価が難しい。
  • 本研究では、因果推論の質を測る新しい手法を提案する。
  • 特定のモデルが優れた性能を示す一方で、他のモデルはギャップを埋められない。
因果推論視覚と言語モデル評価手法

視覚と言語モデル(VLM)は因果関係を説明する能力が注目されていますが、現在の評価方法では言語の妥当性と因果推論の信頼性を区別できません。本論文では、これらの特性を分離する新しい評価手法を提案し、さまざまなVLMの性能を比較しました。興味深いことに、一部のモデルは優れた因果推論能力を示す一方で、他のモデルはそのギャップを埋めることができません。この研究は、因果推論に関心のある研究者や開発者にとって有用です。

因果推論やマルチモーダルAIに興味がある研究者に向いています。

The Abstraction Gap in Vision-Language Causal Reasoning
Chinh Hoang, Mohammad Rashedul Hasan