クラス分類
主要なモデル一覧
LeNet 1989 / 論文
GoogLeNet(Inception-v1) 2014.09.17 CVPR'2015 / 論文
Inception-v4 2016.02.23 / 論文
SqueezeNet 2016.02.24 / 論文
DenseNet 2016.08.25 CVPR'2017 / 論文
ResNetを進化させ、より効率的に深くまで情報を伝搬させるdense blockを構成。
dense blockはそのレイヤまでのblock内すべての出力を入力として用いる。
また連結方法は加算ではなく、concatenateすることにより情報が消えることを防ぐ。
ResNetよりモデル規模を縮小し、性能も改善。
Xception 2016.01.07 CVPR'2017 / 論文
ShuffleNet 2017.07.04 CVPR'2018 / 論文
SENet 2017.09.05 CVPR'2018 / 論文
ShuffleNetV2 2018.07.30 ECCV'2018 / 論文
Mnasnet 2018.07.31 CVPR'2019 / 論文
MobileNetV3 2019.05.06 ICCV'2019 / 論文
Noisy Student 2019.11.11 CVPR'2020 / 論文
DenseNetの更なる高速化。安価なGPUで動作することを念頭に改良。
ベースレイヤを2つに分割し、2つのパスで伝搬する情報を効率化している。
これは他のネットワークにも容易に適用可能で、計算量を10~20%削減し、さらに精度を向上。
RegNet 2020.03.30 CVPR'2020 / 論文
Vision Transformer 2020.09.29 ICLR'2021 / 論文
DeiT 2020.12.23 / 論文
EfficientNetV2 2021.04.01 ICML'2021 / 論文
ConvNeXt 2022.01.10 CVPR'2022 / 論文
[2301.00808] ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders
ConvNeXt V2が発表。ひさしくクラス分類用のモデルは追えてないが、一応今のSOTAっぽいと言えそう?
参考
[2019.10.30] 2019年最強の画像認識モデルEfficientNet解説
https://qiita.com/omiita/items/83643f78baabfa210ab1
[2020.09.09] MobileNet(v1,v2,v3)を簡単に解説してみた
https://qiita.com/omiita/items/77dadd5a7b16a104df83
[2021.04.17] EfficientNet B0〜B7で画像分類器を転移学習してみる
https://zenn.dev/kleamp1e/articles/202104-efficientnet
[2021.07.30] EfficientNet: 複合スケールによる効率的な画像分類器
https://kikaben.com/efficientnet/
Neural Network Console
https://www.youtube.com/channel/UCRTV5p4JsXV3YTdYpTJECRA
6つのモデルでのSwish関数の実験
https://ichi.pro/6-tsu-no-moderu-de-no-swish-kansu-no-jikken-265570078399001
[2019.10.14] 【深層学習】CNNを用いた画像分類手法まとめ(VGG, ResNet, Inceptionなど)
https://ys0510.hatenablog.com/entry/cnn_backbone
ResNetおよびDenseNetの解説
https://deepsquare.jp/2020/04/resnet-densenet/
ResNetからResNextまで
https://cvml-expertguide.net/terms/dl/cnn-backbone/resnet/
古めな記事だが、ResNetの詳細が記載
https://deepage.net/deep_learning/2016/11/30/resnet.html
各種モデルサイズの比較表がある。
https://keras.io/ja/applications/
[2021.05.03] 画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説!
https://qiita.com/omiita/items/0049ade809c4817670d7
[2020.03.07] 画像認識の最新SoTAモデル「Noisy Student」を徹底解説!
https://ai-scholar.tech/articles/treatise/noisy-student-ai-379
[2021.04.13] 2021年最強になるか!?最新の画像認識モデルEfficientNetV2を解説
https://qiita.com/omiita/items/1d96eae2b15e49235110
[2022.01.13] Transformer(ViT)系より良いConvだけのネットワーク出たよ(画像認識向け)
https://qiita.com/TeamN/items/edee1b3803a1d77fc252
B0~B7の構造
https://towardsdatascience.com/complete-architectural-details-of-all-efficientnet-models-5fd5b736142
Last updated