OrpQuant: 乗算なしの量子化手法による効率化

OrpQuant: Geometric Orthogonal Residual Projection for Multiplier-Free Power-of-Two Transformer Quantization

量子化を用いた新しいTransformer手法

2026-05-25 中級 arXiv
Transformer軽量化量子化
  • 大規模言語モデルのエッジデバイスへの展開は、メモリ制約と計算ボトルネックに悩まされています。
  • 本論文では、Orthogonal Residual Projection (ORP)を提案し、量子化を幾何学的投影として再定義します。
  • ORPは、従来の手法に比べて計算時間を大幅に短縮し、高精度を維持します。
量子化Transformer効率化

大規模言語モデルやVision Transformerのエッジデバイスへの適用は、メモリや計算速度の制約が課題です。本論文では、Orthogonal Residual Projection (ORP)という新しい量子化手法を提案し、従来の乗算を排除して効率的な計算を実現します。特に、ORPは計算時間を短縮しつつ高い精度を保つことができる点が注目されます。機械学習やハードウェア設計に興味がある研究者にとって、非常に興味深い内容です。

機械学習やハードウェア設計に興味がある研究者やエンジニアに向いています。

OrpQuant: Geometric Orthogonal Residual Projection for Multiplier-Free Power-of-Two Transformer Quantization
Maoyang Xiang, Bo Wang, Tao Luo