自然言語理解のためのGLUEベンチマーク

GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding

自然言語理解モデルの評価基準を提案

2018-04-20 被引用 555 中級
ベンチマーク
  • 自然言語理解技術は多様なタスクに対応する必要がある。
  • GLUEは、様々なNLUタスクの性能を評価するためのベンチマークを提供する。
  • モデル間の知識共有を促進し、詳細な言語分析が可能になる。
自然言語処理ベンチマークモデル評価

自然言語理解(NLU)技術は、特定のタスクに依存せずに言語を処理する能力が求められます。そこで本論文では、GLUEという多様なNLUタスクの性能を評価するためのベンチマークを提案します。GLUEはモデルに依存せず、タスク間の知識共有を促進し、詳細な言語分析を可能にします。NLU技術に興味がある研究者や開発者にとって、非常に有用なリソースとなるでしょう。

自然言語処理に関心がある研究者や開発者に向いています。

GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding
Alex Wang, Amanpreet Singh, Julian Michael, Felix Hill, Omer Levy, Samuel R. Bowman