大規模言語モデルの安全性確保に関する調査

Safeguarding large language models: a survey

大規模言語モデルの安全メカニズムを探る

2025-10-17 被引用 32 中級
LLM
  • 大規模言語モデル(LLM)の利用が増加する中、安全性の確保が重要になっています。
  • 本論文は、LLMのための安全メカニズムの現状と課題を体系的にレビューします。
  • 特に、倫理的問題に対処するための多様なアプローチを提案しており、研究者にとって興味深い内容です。
大規模言語モデル安全性倫理

大規模言語モデル(LLM)の急成長に伴い、その倫理的な利用を保証するための安全メカニズムが求められています。本論文では、現在の安全メカニズムの状況をレビューし、評価や強化の手法を探ります。また、これらのメカニズムに対する攻撃や防御の技術についても議論し、包括的なアプローチの必要性を強調しています。LLMの安全性に興味がある研究者や開発者にとって、貴重な情報が得られるでしょう。

大規模言語モデルの研究者や開発者、倫理的なAI利用に関心のある人に向いています。

Safeguarding large language models: a survey
Yi Dong, Ronghui Mu, Yanghao Zhang, Siqi Sun, Tianle Zhang, Changshun Wu ほか