shimopino / papers-challenge

Paper Reading List I have already read
30 stars 2 forks source link

Designing Network Design Spaces #59

Open shimopino opened 4 years ago

shimopino commented 4 years ago

論文へのリンク

[arXiv:2003.13678] Designing Network Design Spaces

著者・所属機関

Ilija Radosavovic, Raj Prateek Kosaraju, Ross Girshick, Kaiming He, Piotr Dollár

投稿日時(YYYY-MM-DD)

2020-03-30

1. どんなもの?

ネットワークの設計空間を変更。GPU上でEfficientNetよりも5倍速いネットワークを構築した。

2. 先行研究と比べてどこがすごいの?

ネットワークの設計を手動ではなく自動で行う手法として、探索空間を固定して計算を進めるNASが存在する。しかしNASで設計を行う場合、ハードウェア制約などの特定条件を満たすような設定で計算が行われ、理解しずらく一般化できないモデルが出力される。

本研究では、解釈のしやすい手動での設計空間の設定とNASでの自動探索を組み合わせた。(ここでは探索空間そのものを設計する行為をさす。)

image

3. 技術や手法の"キモ"はどこにある?

4. どうやって有効だと検証した?

4.1 RegNetXの分析

RegNetXで探索した設計空間を分析していく。

まずはFLOPsに対してモデルの構造を分析した。興味深い点として、従来は深いモデルがより高いFLOPsを達成できると考えられていたが、計算されたモデル(d)の深さはどのFLOPsでも一定であった。

またボトルネック構造が存在しないモデルが選択されている。

チャンネル数の増大率としては2.5が選択されている。

image

次に活性化された値を見ていった。この活性化関数はFLOPsには影響しないが、ハードウェア上でのruntimeには大きく影響することがわかっている。

image

上記2つの結果を合わせて再度設計空間を設定しなおし探索を行った。

image

4.2 既存モデルとの比較

RegNetXで探索したモデル同士の比較を行った。上記は100エポック学習させたモデルを使用して、64枚の画像を推論させた時間を表している。

image

image

近年のネットワークの設計はモバイル端末の基準である600MFLOPsを設定している。そこで同じFLOPsで探索したRegNetモデルと既存モデルとの比較を行った。

特徴としては、RegNetは学習時に正則化やデータ増強などを行わずに100エポックのみ学習させているのみである。

image

次にResNetとResNextに対して比較を行った。

image

image

5. 議論はあるか?

6. 次に読むべき論文はあるか?

論文情報・リンク

shimopino commented 4 years ago

https://github.com/facebookresearch/pycls