2020年代のためのConvNetの再考

A ConvNet for the 2020s

純粋なConvNetの可能性を探る研究

2022-01-10 被引用 170 中級 arXiv
画像認識CNNTransformer
  • Vision Transformersが登場し、画像認識の最前線が変わりました。
  • 本研究では、標準的なResNetを現代的なデザインに進化させ、ConvNeXtを提案します。
  • ConvNeXtは、従来のConvNetのシンプルさを保ちながら、Transformersに匹敵する性能を示します。
ConvNetVision Transformers画像認識

画像認識の分野では、Vision Transformersが主流となりましたが、一般的なタスクには課題が残ります。本研究では、従来のConvNetを現代的なデザインに進化させたConvNeXtを提案し、Transformersと競う性能を実現しました。特に、シンプルさと効率性を維持しつつ、優れた精度を達成しています。画像認識に興味がある研究者やエンジニアにとって、興味深い内容となっています。

画像認識技術に関心のある研究者やエンジニアに向いています。

A ConvNet for the 2020s
Zhuang Liu, Hanzi Mao, Chao-Yuan Wu, Christoph Feichtenhofer, Trevor Darrell, Saining Xie