深層残差学習による画像認識

Deep Residual Learning for Image Recognition

残差接続で超深層ネットワークの学習を可能にした手法

2015-12-10 被引用 4667 中級 arXiv
画像認識CNNベンチマーク
  • 深いネットワークは勾配消失などで学習が困難になる問題があった
  • 層の出力ではなく入力との差分(残差)を学習するResidual Networkを提案した
  • 152層のネットワークでImageNet Top-5 errorを3.57%に達成しILSVRC 2015で優勝
ResNet残差接続Skip Connection画像認識CNN深層学習

深いニューラルネットワークは勾配消失問題などにより学習が難しくなる。この論文ではShortcut Connection(スキップ接続)を導入したResidual Network(ResNet)を提案し、学習目標を「正解への変換」から「入力との差分(残差)」へと変えることで、152層という超深層ネットワークの安定学習を実現した。ImageNetではTop-5 error 3.57%を達成してILSVRC 2015を制覇し、物体検出・領域分割でも大幅な改善を記録した。現在も多くの画像認識モデルの基盤として広く参照されている論文。

CNNや画像認識の基礎を学んでいる人、残差接続がどのような問題意識から生まれたかを理解したい人に向いている。深層学習の実装経験が少しある方でも読みやすい。

Deep Residual Learning for Image Recognition
Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun