MRT: レイヤー画像生成と編集のためのマスク領域トランスフォーマー

MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale

レイヤー画像生成と編集の新手法

2026-05-26 中級 arXiv
画像生成DiffusionTransformer
  • レイヤー画像生成と編集は重要な技術です。
  • MRTは、20Bパラメータのマスク領域拡散モデルを提案します。
  • 従来の手法を大幅に上回る性能を示しています。
画像生成マルチモーダル拡散

レイヤー画像生成と編集は、視覚コンテンツの再利用や編集を可能にする重要な技術です。本論文では、20Bパラメータのマスク領域拡散モデルMRTを提案し、10M以上の多言語デザインサンプルで訓練しました。特に、従来の手法に比べて大幅に高速で高品質なレイヤー生成を実現しています。画像生成や編集に興味がある研究者や開発者に最適です。

画像生成や編集に興味がある研究者や開発者に向いています。

MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale
Zhicong Tang, Zhao Zhang, Jingye Chen, Mohan Zhou, Yifan Pu, Yuchi Liu ほか