大規模事前学習言語モデルのファインチューニングにおける効果的な正則化手法

Mixout: Effective Regularization to Finetune Large-scale Pretrained Language Models

新しい正則化手法「mixout」を提案

2019-09-25 被引用 100 中級
LLMファインチューニング
  • 大規模な言語モデルのファインチューニングは、少数のデータで性能が低下しやすい。
  • 本論文では、ドロップアウトに着想を得た新しい正則化手法「mixout」を提案する。
  • mixoutは、モデルのパラメータを確率的に混合し、ファインチューニングの安定性と精度を向上させる。
ファインチューニング正則化言語モデル

自然言語処理において、大規模な事前学習モデルのファインチューニングは、データが少ないと性能が低下することが知られています。本論文では、ドロップアウトに基づく新しい正則化手法「mixout」を提案し、これによりファインチューニングの安定性と精度を向上させることを実証します。この手法は、特にBERTのファインチューニングにおいて効果を発揮します。機械学習や自然言語処理に興味がある研究者にとって、注目すべき内容です。

機械学習や自然言語処理に興味がある研究者や実務者に向いています。

Mixout: Effective Regularization to Finetune Large-scale Pretrained Language Models
Cheolhyoung Lee, Kyunghyun Cho, Wanmo Kang