臨床大規模言語モデルにおける安全性と精度のスケーリング法則

Safety and accuracy follow different scaling laws in clinical large language models

臨床LLMの安全性と精度の関係を探る

2026-05-05 中級 arXiv
LLMRAGベンチマーク
  • 臨床分野では、モデルのスケーリングが安全性に与える影響が重要です。
  • SaFE-Scaleというフレームワークを提案し、LLMの安全性を評価しました。
  • 特に、クリーンな証拠が安全性と精度を大幅に向上させることを示しました。
臨床大規模言語モデル安全性

臨床における大規模言語モデル(LLM)は、モデルのサイズや文脈の長さを増やすことでスケーリングされますが、安全性と精度の関係は単純ではありません。本研究では、SaFE-Scaleというフレームワークを導入し、LLMの安全性がどのように変化するかを評価しました。特に、クリーンな証拠を使用することで、精度が大幅に向上し、高リスクのエラーが減少することが明らかになりました。臨床LLMの安全性に興味がある研究者や実務者にとって、貴重な知見を提供します。

臨床AIや医療技術に関心のある研究者や実務者に向いています。

Safety and accuracy follow different scaling laws in clinical large language models
Sebastian Wind, Tri-Thien Nguyen, Jeta Sopa, Mahshad Lotfinia, Sebastian Bickelhaup, Michael Uder ほか