概要

Python DeepLearningに再挑戦 26 ディープラーニング

参考書籍

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

作者: 斎藤康毅
出版社/メーカー: オライリージャパン
発売日: 2016/09/24
メディア: 単行本（ソフトカバー）
この商品を含むブログ (6件) を見る

よりディープなネットワークへ

CNN を実装する。VGGというネットワークを参照にしている。

f:id:riikku:20161227073804p:plain

ここで使用する畳み込み層は全て3x3の小さなフィルターで、層が深くなるにつれてチャンネル数が大きくなる。
チャンネル数は、１６、１６、３２、３２、６４、６４　と増えていく。
また、プーリング層を挿入して中間データの空間サイズを徐々に小さくしていく。
全結合層ではDropoutレイヤを利用する。
まとめると以下のような特徴を持つ

・3*3の小さなフィルターによる畳み込み層
・フィルターの数は、16,16,32,32,64,64と増えていく。
・活性化関数は、ReLU
・全結合層の後にDropoutレイヤを使用
・Adamによる重みパラメータの更新
・重みの初期値には、Heの初期値　を使用

これを実行すると、99.38%とかになるらしい。すごい！
その他の実装などは以下のサイトを参照にすると掲載されているらしい。便利！

Classification datasets results

さらに認識精度を高めるには

アンサンブル学習、学習係数の減衰(learning rate decay)、Data Augmentation（データ拡張）などのテクニックを使っている。
DataAugmentationは簡単で、認識精度を向上させる上で特に有効らしい。

# DataAugmentationの特徴
・入力画像をアルゴリズムによって人工的に拡張する。
・具体的には、回転や横方向などの微小な変化を与えて、画像の枚数を増やす。
・他にも、部分的な切り抜きや、移動による変形、左右対称、輝度などを変更するなど画像の枚数を増やす。
・これは訓練データが少ない場合に特に有効らしい。

層を深くすることについて

層を深くするにつれて認識性能も向上している場合ような多いかもしれない。
層を深くすることで、フィルターを小さく設定することができるため、結果的にパラメータの設定が少なくて済む。かもしれない。

色々なネットワーク

VGG - 特徴は、層が深いところ。フィルターは3x3を使っている。
GoogLeNet - 基本的には、CNNだが、ネットワークが縦に深いだけではなく、横にも広がりがある。1x1フィルターを多用するとこも特徴的。
ResNet - Microsoftのチームによって開発されたネットワーク。層を深くできる仕掛けが重要。スキップ構造という仕組みで、畳み込み層をスキップして、層を深くしている。

ディープラーニングの高速化

畳み込み層にめっちゃ時間かかってるので、この辺りの処理を高速化することが課題。
GPUだと早い。
さらに分散学習で、複数のGPUを使うとより高速化が捗る。
演算精度のビット数の削減 - 浮動小数点の細かい数値を表現するのに、結構メモリに負荷がかかる。ニューラルネットワークでは、あまり数値精度のビット数をそこまで必要としていなくて、１６ビットとかでもいける。多少ノイズがあっても、ロバスト性のおかげで、精度の高い数値の出力が可能。